常识一直以来都是人工智能发展的一个难题。尽管AI在围棋等领域战胜人类,但像GPT-3这样的智能系统却无法理解“太阳有几只眼睛”这样的反常识问题。最近,谷歌DeepMind、帝国理工学院和剑桥大学的研究人员提出了一个新思路,他们认为AI可以通过观察动物来学习常识,这意味着未来的智能体可以像训练小狗一样进行训练。
GeoFFeRy Hinton曾预言,未来十年内,我们将开发出具有常识的计算机。
这些计算机并不具备灵魂,而是拥有对人类世界运作的理解,熟悉我们的生活习惯。例如,它们知道炉子是热的,通常人们不会购买12台烤箱等。
常识的最简单定义是指人们与生俱来的判断能力或众所周知的知识,通常无需特别学习。
在探索如何赋予AI常识的过程中,研究人员经常从婴幼儿的学习中寻找灵感,借助神经科学和行为科学的研究成果。
最近,谷歌 DeepMind、伦敦帝国理工学院和剑桥大学的研究者们再次提出了AI可以从动物中学习常识的观点。
这并不是首次提出AI应向动物学习的想法,AI专家Yann LeCun曾指出,“家猫的常识远超最先进的机器。”
人类的常识建立在许多动物所具备的基本能力之上,通过深度强化学习,智能体有可能从动物的学习过程中获得重要启示。
该研究小组在《CellPReSS Reviews》杂志上发表的论文《人工智能与动物常识》指出:“动物认知为理解智能行为提供了一个清晰、非语言的框架,并提出了实验方法作为评估基准,指导环境和任务的设计。”
借鉴动物的训练方式,智能体可以通过目标和奖励来进行学习。例如,在训练小狗时,正确的行为会得到食物奖励,这与深度强化学习的原理非常相似。
与此相比,其他形式的人工智能,如Alexa或Siri,缺乏在复杂环境中探索和寻求奖励的能力。
认知行为科学表明,动物的智力水平远高于以往的认知,包括海鸥的复仇心理和海豚的自我意识。
动物有时会采取欺骗或诡计来实现目标,例如,黑猩猩会转移视线以迷惑竞争对手,而松鸦则会假装将食物储存于虚假地点以保护其秘密储藏。
在实验中,研究人员将动物与强化学习智能体进行类比,采用新方法测试人工智能的认知能力。论文详细描述了对鸟类和灵长类动物的认知实验。
实验的初衷是确定鸟类是否能区分任务相关的功能性物体和非功能性物体,并探讨它们对因果关系的理解。
例如,松鼠会想方设法撬开坚果以获取果实,而某些鹦鹉擅长从不同容器中提取食物。当遇到裂缝或孔洞时,一些动物会表现出“我要打开它”的反应。
这是因为它们的意识中形成了“因果”的概念。
即,“只要我打开它,就会有食物。”这也是AI需要训练的关键部分。
研究团队发现,“试错”是一种有效的训练方法。
如上图,
(A)使用四种不同形式的管道来测试物理认知能力。如果棍子从错误的一端拔出,食物就会丢失。通过试错应对不同情况的动物,如果只学会表面联想,往往在迁移任务中表现不佳,而那些获得因果理解的动物在首次实验中表现良好。
(B)进行一项看不见的位移任务以测试对物体永久性的理解。在用食物诱饵后,杯子被移至右边的最终位置,动物需选择盛有食物的杯子。尽管杯子不透明,但食物的位置清晰可见。能够理解这种看不见位移的动物在所有四种情况中表现优异,即使之前从未见过相关物体。
足够逼真的3D世界模拟是训练的必要条件,包括可能会破裂或被撬开的贝壳、无法打开的瓶盖、可撕开的包装盒等物体。
(A) DeepMind游戏室环境
(B) 与前者相同,但为智能体的视角
智能体可以在场景中移动并推动物体。在游戏室环境中,智能体还可以拿起物品并放下,通过成功执行自然语言指令(如“把一个泰迪熊放在一个蓝色的方块上”)获得奖励,而在动物AI环境中,智能体通过移动绿色球体获得奖励。
更有趣的是,研究人员将绿色物体视为“食物”,当被触摸时会产生积极奖励,然后像被食用一样消失。
总的来说,常识是人类独有的吗?研究人员的看法是,并非如此,常识基于一系列基本概念,例如眼前物体的性质、空间占据的大小以及因果关系等。
这些理解深植于动物的意识中,随着时间不会改变。
然而,动物所展现的常识可能包含对奖励的认知。
因此,通过合适的任务训练智能体,或许能够为AI赋予常识。
物理实验的重点在于固体,但还应包括液体(如水坑、溪流、瓶中的酒)、气态物质(如烟、雾、火焰)和颗粒物(如土壤、沙子)、可变形物体(如海绵、纸张、绳子、衣物、树叶、树枝、动物身体)及空间(如洞、门道、入口)等。
因此,常识可以视为一组相互关联的基本原则和抽象概念,更高层次上还包括类比和隐喻的使用。
“理想情况下,我们希望建立一种AI技术,能够理解这些相互关联的认知原则和概念,并具备人类水平的概括和创新能力。”论文结尾如此指出。
显然,让AI拥有常识之路仍然漫长。
