互联网资讯 / 人工智能 · 2023年11月5日 0

在AI领域六大权威榜单上获得冠军:超越人类学习方式

AI模仿人类学习方式的结果会如何?

在8月26日,阿里达摩院语言技术实验室取得了显著成就,赢得了自然语言处理(NLP)领域六大权威技术榜单的冠军。相关信息显示,参与竞争的六项自研AI技术均基于模仿人类学习模式,从而全面提升了机器的语言理解能力,其中一些能力甚至超越了人类。目前,这些技术已广泛应用于阅读理解、机器翻译和人机交互等多个场景。

近年来,AI在图像识别和语音识别等领域逐步超越了人类水平,但在复杂文本语义理解方面,AI与人类之间仍存在差距,主要原因在于传统AI在学习文本知识时效率较低。

为了解决这一问题,业界提出了一种模仿人类学习的思路,即首先让AI在大量的网页和书籍中进行训练,以获取基本的词法、语法和语义知识,然后再在特定领域的文本上进行深入训练,以掌握领域专有的知识。

这一理念构成了预训练语言模型的核心创新。自Google推出模仿人类注意力机制的BERT模型以来,预训练语言模型已成为NLP领域的重要研究方向。

早在2018年,达摩院就开始布局通用的预训练语言模型,并逐步将这一思路扩展至多语言、多模态、结构化及篇章文本理解和生成等领域。目前,达摩院已建立了一套系统的深度语言模型体系,包括其自研的通用语言模型StRUCtBERT、多语言模型VECO、多模态语言模型StRUCtVBERT及生成式语言模型PALM等六大模型,均刷新了多个世界纪录。

阿里达摩院包揽AI领域六大权威榜单冠军:用人类的学习方式超越人类

其中,StRUCtBERT模型帮助机器更好地理解人类的语法,使其在面对语序混乱或不符合语法的句子时,依然能够准确理解并做出正确回应,显著提升了机器对词语、句子及语言整体的理解力。该模型在自然语言处理领域权威数据集GLUE BencHMaRk中以平均分90.6分位居第一,远超人类水平(87.1分)。

达摩院语言技术实验室的团队表示:“我们的目标是让AI掌握人类知识的基础技术,预训练语言模型的诞生使得AI像人类一样学习新知识成为可能。未来,达摩院将全面开放这些技术,助力特定领域的AI更智能化。”

在过去两年中,阿里已经赢得了30多项NLP领域的顶级赛事世界冠军,并发表了100多篇相关顶会论文;阿里的自然语言技术已在金融、新零售、通信、互联网、医疗、电力和客服等多个领域服务了超过十亿用户和数万家企业客户。

阿里达摩院包揽AI领域六大权威榜单冠军:用人类的学习方式超越人类