人类有能力在采取行动之前首先进行思考。例如,如果有人想踢球,可能就会考虑球会跑到那里去,以及把球踢到新位置的概率。机器人往往不具备这种能力,因为它们内部的程序通常只能执行简单的任务,没有配备人工智能程序的机器人尤其如此。
但加州大学伯克利分校的研究人员却发现,机器人也可以具备这种直觉。为了证明这一点,他们开发了新的机器人学习技术,使得机器人可以提前思考,以便“搞清楚如何操纵他们之前从未碰到过的物体。”
该团队将这项技术称作“视觉远见”,但这并不表示机器人具备预测未来的能力——至少目前没有。
伯克利的研究人员将这项技术应用到一台名为Vestri的机器人身上,使之可以预测机器人的摄像头几秒种后能够看到的内容。具备了新的“远见”后,Vestri便可在不触碰附近其他物体的情况下,在桌子上移动各种小物体。最令人惊讶的是,这项技术还能让机器人在没有人类指导和监督,也没有物理知识的情况下,完成这些小任务。
“跟我们在环境中采取行动的方式一样,这种方法也能让机器人对不同行为如何影响周围的世界进行视觉化。”伯克利电机工程和计算机科学系助理教授赛季·莱文(Sergey Levine)说,“这就能在复杂的现实环境中对高度灵活的技能展开智能规划。”
“视觉远见”的基础是“卷积循环视频预测”,或称动态神经平流(DNA)。该团队表示,基于DNA的模型可以根据机器人的行为,预测图像中的像素如何从一帧跳入另外一帧。作为莱文实验室的博士生兼最初的DNA模型的发明人,切尔西·菲恩(Chelsea Finn)解释道,像Vestri这样的机器人现在可以“完全靠自己来掌握一系列视觉对象操控能力”。
莱文实验室的费德里科·艾伯特(Frederik Ebert)则将这种机器人的运作方式与人类在其所处环境中与物体的互动方式进行对比:
“通过一生当中与各种物体的数百万次互动,人类便可在没有老师的情况下学会操控物体的技巧。”艾伯特说,“我们已经证明,完全有可能开发一套机器人系统,利用大量自动收集的数据来学习可以广泛使用的操控能力,尤其是推动物体的能力。”
莱文指出,Vestri的能力仍然存在一些局限,但他们将会采取更多措施来改进这项技术。有朝一日,这种技术或许可以对无人驾驶汽车起到帮助,使之更好地应对新的环境和不熟悉的物体。
但这项技术还需要很多改进才能实现这一目标,例如吸收更多经过提炼的视频预测和方法。
今后的机器人或许可以借助类似的技术完成更加复杂的任务,例如拿起和放置物体,或者处理衣服或绳子等柔软且容易变形的物体。照此推测,洗衣机有朝一日或许还能额外配备叠衣服功能。