“这就是我们都期待的机器人——就像C3PO一样”:为什么类人机器人还没有出现在我们的家中?

2024-09-24 13:11来源:本站编辑

2013年,美国机器人公司波士顿动力公司发布了其新机器人Atlas。这个身高6英尺2英寸的人形机器人在Darpa机器人挑战赛上亮相,它可以在不平坦的地面上行走,从箱子上跳下来,甚至爬楼梯。这就像小说中经常描绘的景象:一个被设计成像我们一样操作的机器人,能够承担各种各样的日常任务。这似乎是什么曙光。机器人将会做我们所有无聊和繁重的家务,并作为老年人的护工。

从那时起,我们看到了人工智能(AI)的飞跃,从计算机视觉到机器学习。最近的一波大型语言模型和生成式人工智能系统为人机交互开辟了新的机会。但在研究实验室之外,实体机器人在很大程度上仍然局限于工厂和仓库,执行非常具体的任务,通常躲在安全笼子后面。家用机器人仅限于吸尘器和割草机——不完全是罗西机器人。

英国高级研究与发明局(Aria)机器人项目主管珍妮•里德(Jenny Read)表示:“自上世纪50年代以来,机器人身体一直没有实质性发展。”高级研究与发明局是英国政府去年成立的研发机构。“我并不是说没有进步,但当你看看计算机和软件领域发生的变化时,你会惊讶地发现,进步是如此之少。”

布里斯托尔大学(Bristol University)机器人和人工智能教授内森·勒波拉(Nathan Lepora)表示,开发机器人只需要更多的资源。有电脑的天才可以编写算法,但制造机器人需要使用物理设备。“这要慢得多,难度也大得多,”他说。“这就是机器人落后于人工智能的根本原因。”

Tesla’s Optimus folding a shirt.

研究实验室和公司希望弥合这一差距,一系列新的人形机器人正在开发中,其中一些已经开始投放市场。今年4月,波士顿动力公司(Boston Dynamics)淘汰了原来的液压Atlas车型,并推出了一款新的电动版本。该公司打算在未来几年内将其商业化,并将于明年在现代汽车(Hyundai)的工厂开始测试。总部位于俄勒冈州的Agility Robotics公司声称,他们的Digit机器人是第一个真正有报酬的人形机器人,在物流设施中搬运箱子。埃隆·马斯克(Elon Musk)坚称,特斯拉的人形机器人Optimus或Tesla Bot将于明年开始在其汽车工厂投入使用。

但是,在我们看到机器人在严格控制的环境之外工作之前,还有很长的路要走。里德说,人工智能的进步只能让我们在现有的硬件条件下走得这么远,而且对于许多任务来说,机器人的物理能力至关重要。生成式人工智能系统可以写诗或制作图片,但它们不能做我们最想自动化的肮脏和危险的工作。对于这些,你需要的不仅仅是一个盒子里的大脑。


一个有用的机器人设计通常是从手开始的。里德说:“机器人的许多用例实际上依赖于能够精确、熟练地处理事物,而不会损坏物体。”人类非常擅长于此。我们可以本能地在举哑铃和拿鸡蛋壳之间切换,或者从切胡萝卜到搅拌酱汁之间切换。我们也有出色的触觉,这可以从我们阅读盲文的能力中得到证明。相比之下,机器人则举步维艰。里德的咏叹调项目(Aria)得到了5700万英镑的资金支持,该项目专注于这个问题。

伦敦Shadow robot公司的主管里奇·沃克(Rich Walker)说,机器人灵巧性面临的挑战之一是规模。在公司位于卡姆登的办公室里,他展示了“影子灵巧之手”。它有男人的手那么大,有四个手指和一个拇指,还有模仿指关节的关节。虽然手指看起来很精致,但这只手被连接在一个比人类前臂宽得多的机器人手臂上,上面塞满了电子设备、电缆、执行器和操作这只手所需的其他一切东西。“这是包装问题,”沃克说。

人类规模的手的一个优势是它的大小和形状适合处理人类的工具。沃克举了一个实验室移液管的例子,他用Sugru(一种可成型的粘合剂)进行了改造,使其更符合人体工程学。你可以把移液器直接连接到机器人手上,但这样它就只能使用移液器,而不能使用剪刀或螺丝刀。

但完全像人一样的手并不适合所有任务。影子机器人最近的手,DEX-EE,看起来相当陌生。它有三个手指,更像拇指而不是手指,明显比人类的大,上面覆盖着触觉传感器。该公司与Alphabet的人工智能研究实验室谷歌深度思维(Google DeepMind)合作设计了这款机器人手,后者希望通过反复尝试来学习如何捡起东西——一种被称为强化学习的试错方法。但这也带来了挑战:机器人的手通常被明确设计成不会撞到东西,如果撞到东西就很容易断裂。DeepMind的研究工程师穆里洛•马丁斯(Murilo Martins)表示,当他用最初的灵巧手进行实验时,“每半小时我就会折断一根肌腱”。

DEX-EE优先考虑坚固性:一段视频显示,这三个数字在被木槌击打时愉快地开合。它的尺寸更大,可以容纳更大的滑轮,这对钢丝肌腱的压力更小,这意味着它可以可靠地运行至少300小时。

Boston Dynamics’s hydraulic humanoid Atlas.

尽管如此,DeepMind研究科学家Maria Bauza说,与机器人相处的时间是宝贵的。上周,DeepMind发表了一项研究,概述了一种名为DemoStart的新训练方法。这采用了同样的试错方法,但从使用模拟的机器人手开始,而不是真正的人手。在训练模拟手完成诸如拧紧螺母和螺栓之类的任务后,研究人员将这种习得的行为转移到真正的DEX-EE手上。“这些手仍然经历了成千上万的实验,”Bauza说。“只是我们没有让他们从零开始。”

这减少了运行实验的时间和成本,使训练能够适应不同任务的机器人变得更容易。然而,这些技能并不总是完美地转移;DeepMind的模拟机器人手将插头插入插座的成功率为99.6%,而真手的成功率仅为64%。

这项工作是人工智能和机器人身体发展如何携手并进的一个例子。只有通过物理互动,机器人才能真正理解他们的环境。毕竟,Read指出,ChatGPT等文本生成器背后的大型语言模型是在互联网上共享的大量人类语言语料库上进行训练的,“但是我从哪里获得关于采摘草莓或制作三明治的感觉的数据?”

正如DeepMind机器人团队所写的那样:“一个大型语言模型可以告诉你如何拧紧螺栓或系鞋带,但即使它被植入机器人体内,它也无法自己执行这些任务。”

马丁斯更进一步。他认为,机器人技术对于实现人工通用智能(AGI)至关重要,这是许多人工智能研究人员梦寐以求的广泛的、与人类相当的智能。他的理由是,人工智能只有拥有物理形态才能真正理解我们的世界。他说:“在我看来,没有化身,AGI就不存在,就像没有我们自己的身体,人类智能就不存在一样。”


手虽然重要,但只是身体的一部分。当Shadow Robot和其他机器人专注于手指时,越来越多的公司和实验室正在开发完全的类人机器人。

类人机器人的吸引力可能部分是心理上的。沃克说:“这是我们都期待的机器人,就像C3PO一样。”但用人类的形体作为缪斯也是有道理的。Agility Robotics的联合创始人兼首席机器人官乔纳森•赫斯特(Jonathan Hurst)表示:“我们所有的环境都是围绕人设计的。”“因此,拥有一个大致人性化的外形因素是一种非常好的方式,能够移动、操纵和与人共存。”

但类人机器人可能不是适合所有工作的最佳设计。轮式机器人可以去轮椅使用者能去的任何地方,当遇到复杂的地形时,四条腿可能比两条腿更好。波士顿动力公司的狗一样的Spot可以在崎岖的地面或楼梯上蹦蹦跳跳,如果摔倒了还能自我恢复——这是两条腿的机器人很难做到的。波士顿动力公司的一位发言人在电子邮件中补充说:“仅仅因为人形机器人的外形与人类相似,并不意味着它需要那样移动,也不意味着它需要受到我们关节的限制。”

Agility Robotics’s Digit.

目前,类人机器人还在摸索中。布里斯托尔大学的Lepora说,华丽的视频和时尚的设计可能会给人们一种不切实际的感觉,让他们觉得自己有多能干或多可靠。波士顿动力公司的视频片段令人印象深刻,但该公司也以展示其机器人失败的错误视频而闻名。今年1月,马斯克分享了一段擎天柱叠衬衫的视频,但眼尖的观众发现了机器人正在被远程操作的迹象。

将机器人从实验室和工业环境带到家庭或公共场所的一个主要挑战是安全。今年6月,电气和电子工程师协会(IEEE)成立了一个研究小组,专门研究人形机器人的标准。该组织主席亚伦·普拉瑟(Aaron Prather)解释说,共享空间中的人形机器人与被保护笼子包围的工业机器人是不同的命题。他说:“对他们来说,与亚马逊工厂或福特工厂的同事互动是一回事,因为这是一名训练有素的工人与机器人一起工作。”“(但如果)我把机器人放在公园里,它将如何与孩子们互动?它将如何与那些不了解发生了什么的人互动?”

赫斯特设想,下一步机器人将进入零售业,在货架上摆放物品或在密室里工作。普拉瑟认为,我们很快就会看到机器人为我们服务。然而,对于许多应用来说,使用机器人可能没有经济意义。沃克举了一个送货机器人的例子。他表示:“与那些拿着最低工资、零时工合同、骑电动滑板车的人相比,这必须具有成本效益。”

与我交谈过的大多数机器人专家都表示,多功能家用机器人——那种能洗碗、洗衣服和遛狗的机器人——还很遥远。波士顿动力公司表示:“有用的类人机器人时代已经到来,但通往真正通用的类人机器人的道路将是漫长而艰难的,而且还需要很多年的时间。”里德说,经常被吹捧为人口老龄化解决方案的护理机器人将是一个特别艰难的前景。她说:“让我们达到机器人可以可靠地拆卸笔记本电脑或为你做三明治的地步,然后我们会考虑它如何照顾老年人。”前提是我们想让机器人承担护理工作。就像艺术和诗歌一样,也许有些角色最好还是要有人情味。

善信网声明:未经许可,不得转载。