新兴技术

当AI拥有身体:具身人工智能如何融入人类社会?

我们如何确保使用具身人工智能的机器人能够以安全、道德和包容的方式融入人类社会? Image: Getty Images/iStockphoto

Vanessa Evers
Director, Centrum WiskundeCentrum Wiskunde & Informatica (CWI)
  • 以ChatGPT为代表的大语言模型引起了全球的关注,它们可以撰写论文、总结研究,甚至编写代码。
  • 但是,如果人工智能驱动的机器人不仅仅是回复信息,而是以你认为自然和可接受的方式与你互动时,会发生什么呢?
  • 未来以机器人等物理形式出现的具身人工智能,使我们需要重新思考机器如何学习——或许它们不仅要从互联网学习,还要从人类身上学习。

ChatGPTClaudeDeepSeek为代表的大语言模型已经引起了全世界的关注。它们通过预测最有可能出现的下一个词,可以撰写文章、总结研究成果,甚至编写代码。

这些系统展示了人工智能在文本处理和生成方面取得的巨大进展。但如果人工智能拥有一个“身体”,会发生什么呢?

想象一下,一个人工智能机器人不仅能预测下一个词,还能预测下一个合适的动作。它不再只是用文字回复,而是可以像你一样自然得体地向你打招呼,递给你一个物品,或是带你去会议室。

“具身人工智能”的愿景使新的问题开始涌现:机器人如何才能在一个远比文本丰富、更难以预测的世界中学习行为?我们又该如何确保它们以安全、合乎伦理和包容的方式融入人类社会?

训练机器人比训练大语言模型更难

如今的大语言模型是利用从互联网、书籍和对话中抓取的数万亿个单词训练出来的。

它们学习语言中的统计模式,然后通过人类反馈进行微调,以提高安全性和相关性。据报道,训练ChatGPT-4大约需要1PB的数据——这相当于连续观看13年高清视频所需要的量。

然而,即便这个数量级也远不及机器人训练所需的数据规模。物理世界远比文本复杂得多。为了在物理世界中穿梭,机器人不仅需要预测下一个词,还需要预测下一个可能发生的事件或感官输入。

举个简单的例子:一个机器人面对着大门。它必须知道门靠铰链转动,门铃是固定的,墙壁不会凭空消失。这就需要一个基于物理学、物体和社会规范的世界模型。

虽然这类模型可以在仓库或装配线等受控环境中构建,但在日常生活中,它会因为潜在的无穷无尽的变化和不确定性而崩溃失效

从这个角度来看,一个四岁的孩子已经处理了约10TB的视觉感官输入,这几乎与训练ChatGPT-4时使用的数据规模相当。

而这仅仅是视觉输入,还没有计算听觉、触觉、味觉、本体感受和嗅觉等其他输入。正是这种具身学习,使得人类能够理解世界的运作方式,而当前的人工智能系统远不能企及。

人类能为机器人学习带来哪些启示

人类之所以能高效学习,不仅是因为我们的大脑和通过身体进行学习的能力,还因为我们会学习自己的文化。

哲学家Daniel Dennett认为,文化适应——即通过观察、经验和指导来学习一个人所在文化的规范、价值观和行为——解释了为什么人类能够如此有效地使用大脑中的“思维工具”,并且这一能力远远超越其他灵长类动物

黑猩猩也会进行社会性学习,但并非通过主动教导。例如,一只黑猩猩幼崽需要数年时间才能通过被动观察和模仿学会用石头敲开坚果,因为成年黑猩猩不会主动教幼崽如何打开坚果。

相比之下,人类儿童则受益于他人的有意识教导。经过几代人的传承,这些文化适应不断创新和积累,最终成就了人类的成功。

如果我们想让机器人有效地学习,我们可以利用我们在社会学习和主动教学方面的能力,并考虑一种将具身学习与社会互动和文化传播相结合的模式,通过主动教学来实现文化传递。

从社交信号到主动教学

关于如何进行这种学习,有两种突出的方法,而最佳途径是将两者结合起来:

社会强化学习:与黑猩猩不同,人类能够跨代进行积极的社会教学和学习。机器人可以通过解读微笑、皱眉、惊讶的表情、提高音量或人们的退缩等社会信号,实时学习这种人类文化反馈。这些线索可以引导机器人养成更符合规范的行为,就像孩子从社会的认同和反对中学习一样。主动教学:除了被动观察之外,人类还可以在机器人教学中发挥主动作用。这可以包括传统的教学方法,例如通过示范学习,也可以探索更多基于社会互动的方法,例如对人们潜意识中更容易察觉的错误给予微妙的负面反馈,或者在机器人针对特定情境生成的一系列选项中,主动选择最合适的行动。训练可以在医院或学校等真实环境中进行,也可以在模拟环境中进行。

随着时间的推移,这些方法将帮助机器人发展出适合其特定部署环境的行为模式。例如,医院机器人可以逐步学习床边礼仪,而物流机器人可以改进其与仓库工作人员的互动方式。

计划和复杂性的挑战

即使有了社会学习能力,机器人仍然面临着另一个挑战:层次化计划。

考虑一个看似简单的目标——带某人去火车站。实际上,这需要处理好多层次的子目标:离开公寓、锁门、赶公交车、到达正确的站台。每一步都可能遇到无法预料的障碍,从交通状况到人际交往,不一而足。

机器人不可能预先精确地编写每一个微小的动作,甚至细化到后续的肌肉控制。因此,它必须将预训练与适应子目标的能力相结合,以应对不同情境中的不断变化。

人类的积极教学——无论是通过示范、在线还是离线反馈——对于帮助机器人应对这种复杂性可能至关重要。

发展具身人工智能重要

机器人不再仅仅存在于科幻小说中。它们在城市里送餐,在仓库里帮忙,甚至在养老院里陪伴老人。随着生成式人工智能开始应用于实体机器,其影响也将成倍增长:

机遇:机器人可以承担建筑或采矿中的危险任务,协助老年人护理,或应对气候灾害。风险:若设计不当,它们可能会取代人们现有的工作岗位、加剧不平等,甚至作为武器使用。隐私、安全和信任都面临风险。选择:领袖们必须决定机器人应该如何部署,谁能从它们的部署中受益,以及如何构建能够赢得公众信任的系统。

呼吁发展文化机器人

人工智能在实体领域未来的发展,不能仅仅依靠扩大数据规模来解决。

这需要我们重新思考机器的学习方式——不仅是从互联网学习,还要从我们身上学习。如果机器人要与我们共享家园、工作场所和街道,它们就需要融入文化:通过具身互动、社交信号和积极的教学方式进行学习,实现与人类发展相辅相成。

这既是一项严峻的挑战,也是一个机遇。通过将文化学习融入机器人训练,我们可以塑造出不仅能执行任务,还能负责任地融入人类社会生活的自主系统。

问题不在于人工智能是否会拥有一副“身体”,而在于我们如何教会它融入我们的世界。

本文作者:

Vanessa Evers,荷兰国家数学和计算机科学研究中心主任

本文原载于世界经济论坛Agenda博客,转载请注明来源并附上本文链接。

编辑:王灿

不要错过关于此主题的更新

创建一个免费账户,在您的个性化内容合集中查看我们的最新出版物和分析。

免费注册

许可和重新发布

世界经济论坛的文章可依照知识共享 署名-非商业性-非衍生品 4.0 国际公共许可协议 , 并根据我们的使用条款重新发布。

世界经济论坛是一个独立且中立的平台,以上内容仅代表作者个人观点。

实时追踪:

人工智能与机器人

分享:
全局信息
探索和追踪解决之道 人工智能与机器人 正在影响经济、产业和全球问题
World Economic Forum logo

每周 议程

每周为您呈现推动全球议程的紧要问题(英文)

立即订阅

更多关于 新兴技术
查看全部

Shaping the Deep-Tech Revolution in Agriculture

为数字公共资源建设融资的四种方法

关于我们

  • 我们的任务
  • 我们的历史
  • 领导团队
  • 影响力
  • 北京代表处

加入我们

  • 登录
  • 成为我们的合作伙伴
  • 成为我们的会员
  • 订阅我们的新闻稿
  • 联系我们

快捷链接

语言版本

隐私政策和服务条款

站点地图

© 2025 世界经济论坛