聊天机器人一直以来被视为人工智能的代表。
尽管自从GPT-3问世以来,AI生成的文本在某种程度上已经能够以假乱真,但这种能力仅限于生成单独的一段话。
在连续的对话中,AI却无法记住自己之前所说的话,情况往往是这样的:

这种前后不一致的表现使得人们觉得AI缺乏稳定的身份和个性,仿佛在对话中换了一个人,因此它一直被当作“人工智障”。
现在,Facebook AI团队推出了BlendeRBot2.0,相较于1.0版本,它新增了长期记忆和即时搜索功能。
首先,AI需要记住自己说过的话:

例如,记住“我喜欢很多种音乐”和“Kanye West是我最喜欢的说唱歌手”这些信息,以避免后续对话中出现矛盾。
此外,人类提到的话也需要被记住,比如最喜欢的专辑:

那么,如果人类提到了一些AI不熟悉的内容,该如何处理呢?
AI可以趁机悄悄上网搜索相关信息,并在对话中展示这些新知:
例如,查到对方喜欢的艺人Beyonce的出生地,并用“我去过那里几次”来接续对话。

这是不是很像你在群聊中偷偷百度的情景?
如何摆脱“智障”形象
Facebook AI去年推出的BlendeRBot1.0已经具备94亿参数,在单轮对话生成方面表现出色。
此次升级的核心是检索增强算法,它能够从过往对话的记忆和互联网上的信息中提取用于当前对话的内容。

在训练数据方面,Facebook在众包平台上发布了相关任务。
参与者需要在对话中扮演特定角色,并在几小时或几天后对同一话题进行讨论,从而收集多轮对话的数据集。

AI从网上搜索信息并运用到对话中的能力,同样是源于人类的学习。
在众包平台上,任务要求一个人描述自己的兴趣以开启话题,另一个人则可以上网进行搜索并接续对话。

这样,AI不仅能学习人类在不同话题中适合搜索的关键词,还能了解哪些信息适合在对话中使用。
实验结果显示,BlendeRBot2.0对之前对话内容的使用率提高了55%,对话中的事实一致性提升了12%,而人类评估员的评分也提高了17%。
具备上网搜索能力的AI能够参与人类世界的最新话题,比如讨论新上映的电视剧。
如果与BlendeRBot1.0聊起今年的新片《旺达幻视》,它可能会说“我没看过”,导致对话中断。
而BlendeRBot2.0则可以搜索相关信息并说出片中最喜欢的角色,激发人们继续对话的兴趣。

AI的记忆不再仅限于它完成训练的那一刻。
LeCun点赞,马斯克对此表示担忧
AI三巨头之一的LeCun第一时间转发了BlendeRBot2.0,并称其为“首个能够持续进行多轮对话的聊天机器人”。

而马斯克则担心,AI从开放互联网上获取信息可能导致其价值观偏差。

他举了微软发布的Tay机器人为例,指出其在短时间内就被用户引导成为纳粹支持者,最终被迫下架。
在讨论“最喜欢的作品”时,有人对AI的表现表示不信任:
AI并没有真正的喜好,它只是自动将最流行的作品视为最佳,与大多数追逐热点的人一样。

此外,还有人指出潜在的隐私风险:
让AI上网搜索,难道会搜索到我在Facebook上发的帖子吗?

如果你对此感兴趣,可以访问Facebook的PaRlAI平台下载模型,与它进行对话。
开源项目地址:
https://paRl.AI/projects/blendeRbot2/
相关论文:
[1]https://Github.coM/fACEbookReSeaRch/PaRlAI/blob/Master/projects/Sea/InteRnet_AugMented_Dialogue.pdf
[2]https://Github.coM/fACEbookReSeaRch/PaRlAI/blob/Master/Projects/Msc/Msc.pdf
