资讯
首页  >  专题  >  环球科学  >  环球科学<前沿资讯>

能够预测未来五分钟的计算程序

来源:环球科学

波恩大学(University of Bonn)的计算机科学家研发的软件可以预测几分钟之后的未来:这个程序从视频中学习典型的动作顺序,比如烹饪。基于这些知识,它可以接下来预测在新的情况下,厨师将在哪个时间点做什么。研究人员将在世界上最大的计算机视觉和模式识别会议(Conference on Computer Vision and Pattern Recognition)展示他们的成果,该会议将于6月19日至21日在美国盐湖城(Salt Lake City)举办。

正如英国社交剧的每位粉丝都知道的那样,完美的管家有着特殊的能力:可以在雇主说出要求之前就预测出雇主的指示。工作组的Jürgen Gall教授也想教会计算机类似的能力:“我们想要预测活动的时间和期限——在行为发生的几分钟甚至几小时之前,就预测出其发生时机与时长,”他解释到。

例如一个厨房机器人可以一有需要就把调料包递过去,及时预先加热烤箱,并且当厨师忘了准备步骤时提前提醒厨师。同时,自动真空吸尘器也可以知道在做饭时它在厨房没有用武之地,转而去收拾客厅。

我们人类非常擅长于预测他人的行为。然而对于计算机来讲,预测技术仍处于开发初期。波恩大学的计算机协会的研究人员现在宣布了成功的第一步。他们研发了自主学习(self-learning)的软件,它可以以惊人的精确度预估未来几分钟内行为所发生的时机与时长。

训练数据:四小时沙拉视频

科学家使用的训练数据包括40个视频,视频里表演者准备不同的沙拉。每一个记录都在6分钟左右,并且平均包含了20个不同的动作。这些视频还包含关于何时动作开始并且它们持续多久的准确的细节。

计算机总共花了将近4小时“观看”这些沙拉视频。通过这种方式,算法学习了哪些行动通常跟随在某个行动后面,以及持续时长。这绝非易事:毕竟,每一个厨师有他自己的方式。另外,制作顺序可能因为不同的食谱而改变。

“然后,我们测试了学习过程的成功率,”Gall说道。“我们将没有看过的视频放入程序。”当然这些新的短片都和原来的内容相似——也都是沙拉制作视频。关于这项测试中,计算机首先观看新视频的前20%到30%的内容。随后在此基础上,预测在剩余的影片中会发生什么事情。

这效果非常的好。Gall说;“短期预测期间准确度超过40%,但在预测未来越远的事情时准确率下降的越多。”对于预测未来超过三分钟的行为活动,电脑还保持15%的正确率。然而,只有行为的类型及其发生时间都预测准确的情况下,预测才被认为是正确的。

Gall和他的同事认为这项研究仅仅是进入行为预测(activity prediction)新领域的第一步。特别是当该算法不依靠人为输入,而是自行识别视频前半段行为时,表现明显变差。因为分析永远都不是百分之百正确的——这是Gall对“嘈杂(noisy)”信息的看法。“我们的工作确实是有效果的,”他说,“但不幸的是,这一切都不尽人意。”

翻译:温尔雅

审稿:林然

本文来自:环球科学
特别声明:本文转载仅仅是出于科普传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或其它相关事宜,请与我们接洽。
[责任编辑:环球科学]
分享到:
文章排行榜
©2011-2025 版权所有:中国数字科技馆
未经书面许可任何人不得复制或镜像
京ICP备11000850号-1 京公网安备11010502039775号
信息网络传播视听节目许可证0111611号
国家科技基础条件平台
./t20180909_863708_taonews.html