IBM最新推出的AI辩手项目DeBATeR,标志着当前计算辩论研究的高峰。在如今信息泛滥与误导文化交织的背景下,我们寄希望于完全自主辩论的AI系统,能够推动智能辩论的发展,帮助建立更合理的论点,从而做出更明智的决策。
辩论研究的历史可以追溯到古希腊,苏格拉底等哲学家在市集上与人们讨论政治和真理,辩论的内容覆盖了各种主题。
目前,人工智能研究中的一大挑战就是「如何让机器理解自然语言辩论中的论点」。
最近,IBM研究院的研究人员和希伯来大学的人工智能专家NoaM SloniM及其团队,公布了项目DeBATeR的研究进展。该系统通过扫描储存了4亿篇新闻报道和维基百科页面的数据库,自主组织开场白和反驳论点。
虽然最终它仍未能战胜人类辩手,但AI辩手的表现展示了一个可能性:未来的人工智能将能够协助人类构建与理解复杂论点。

自然语言处理(NLP)算法旨在让计算机能够自动理解、解读和处理人类语言。
NLP是人机互动的核心,IBM的DeBATeR团队积极开展NLP研究是合乎逻辑的选择。
在2018年,IBM研究院首次在美国旧金山的Watson West展示了人类与智能机器之间的现场辩论赛。参与辩论的AI系统DeBATeR由IBM耗时六年研发,能够与人类进行复杂辩论,而人类辩手则是以色列国际辩论协会主席Dan ZafRiR。
该研究强调了在辩论中识别、生成和反驳论点的过程中,将不同技术组件整合的重要性,每个部分负责特定任务。
大约10年前,分析人类言辞以确定支持结论的引用证据的过程——现今称为「论点分析」,显然超出了当时最先进人工智能的能力范围。
但自那时起,人工智能技术的进步与论证技术工程的成熟,加上商业需求的激增,促使这一领域迅速扩展。全球超过50个实验室正在对此进行研究,包括各大软件公司的团队。
研究激增的原因在于人工智能系统能够识别大量文本中的语言使用统计规律,这一应用在许多人工智能项目中产生了变革性影响,但在论点挖掘方面仍未取得显著进展。
因为论点的结构复杂多样,不同于句子结构,难以被识别。
因此,SloniM等人决定发起一项重大挑战:开发一个能够与人类进行现场辩论的完全自主系统。DeBATeR正是这一努力的巅峰。
DeBATeR的关键技术包括立场分类和情绪分析,自动辩论系统必须能够判断论点是否能支持或反驳特定主题。
这对人类而言相对简单,但对机器而言却极具挑战,因为它需要敏锐地捕捉自然语言中的微妙之处与细微差别。
深度神经网络(DNN)和弱监督DNN在提高自动语言理解能力上有巨大潜力,但训练DNN需要大量高质量的人工标记数据,这一瓶颈显然是个难题。
因此,团队开发了多种工具和方法,以弱监督的方式训练DNN,来缓解这一问题。
此外,他们还利用DNN为DeBATeR开发了听说技能。
辩论中的文本转语音(TTS)系统与个人助手或导航器不同,辩论系统需要能够对事先未知的主题进行数分钟的流畅表达,并与观众保持互动。
科研团队为DeBATeR开发了新的TTS算法和方法,使其能够进行清晰流利且具说服力的语言表达。
尽管如此,DeBATeR在连贯性和流畅性上仍难以与人类辩手相媲美。
在论证技术的发展及将论证视为局部现象的过程中,DeBATeR是一个重要的里程碑。
它的成功为我们提供了一个全新的视角,让我们了解到人工智能系统如何利用人类轻松表达的论点网络进行工作。
几乎所有人工智能研究的目标都设定得相当高,但瓶颈在于是否能够获取足够的数据,以计算出有效的解决方案应对既定挑战。
DeBATeR采取双管齐下的方法克服了这一障碍:它将重点集中在100多个辩论主题上,并从大量数据集中提取原始材料。
在2018年和2019年的一系列比赛中,DeBATeR与多位才华横溢的人类辩手展开较量,其中包括2016年以色列国家辩论冠军、以色列大四学生Noa OVadia,观众对其表现进行了非正式评估。
该系统凭借其辩论技术和经过处理的数据集,创建了一个4分钟的演讲,围绕特定主题展开辩论,人类对手对此作出回应。
随后,DeBATeR针对对手的观点进行了反驳,再发表4分钟的演讲。对方用4分钟进行反驳,辩论结束时,双方各自进行了2分钟的闭幕陈述。
然而,这种限制并不是DeBATeR所独有的。尽管经过两千年的研究,人们对于「论证结构」的理解依然不够深入。
根据论证研究的重点,是否关注语言使用、认识论、认知过程或逻辑有效性,人们对连贯论证和推理模型的关键特征各有不同看法。
所有论证技术系统面临的最后一个挑战是:将论证视为受一系列孤立因素影响的局部论述碎片,还是将其纳入更大规模的社会辩论框架中。这在很大程度上是设计要解决的问题,而不是设计解决方案。
通过设定论证的先验界限,理论上的简化变得可行,从而提供了显著的计算优势。例如,识别「主要要求」成为一个明确的任务,机器几乎可以像人类一样可靠地完成这项任务,但问题在于人类本身并不擅长这项任务,因为其本质上是人工设计的。
在公开讨论中,某一段论述在一个上下文中可能是主张,而在另一个上下文中则可能是前提。
此外,现实世界中并没有明确的界限来划分论点:辩论室外的言辞并非孤立,而是与交叉引用、类比、例证以及概括的网络相互连接。
关于人工智能如何处理这种论证网的想法已有相关理论探讨,并利用软件实现,例如名为DeBATeGRaph的系统,它提供计算工具用于可视化和分享复杂的、相互关联的思想网络。
然而,这些实现所面临的理论挑战和社会技术问题极为复杂:设计有效的方法以吸引大量受众进入该系统,与设计易用的机制使他们能够与这些复杂辩论网络互动同样困难。
在论证技术的发展及将论证视为局部现象的过程中,DeBATeR是一个重要的里程碑。
它的成功为我们提供了一个吸引人的机会,让我们理解人工智能系统如何与人类能够轻松解释的论点网络协同工作。
如今,假新闻横行,公众舆论极化,松散的推理无处不在,这一切都表明人类在创造、处理、导航和分享复杂论点方面的迫切需求,而在这方面,人工智能或许能够提供支持。
因此,尽管DeBATeR解决了一个重大挑战,代表了人工智能的进步,并有潜力促进人类的推理能力,正如SloniM等人所言,DeBATeR拓宽了当前人工智能技术的边界,未来将可能参与更复杂的人类活动。
