在今日举行的百度大脑语言与知识技术峰会上,百度CTO王海峰发表了题为“掌握知识、理解语言、拥有智能”的主旨演讲,回顾了百度在语言与知识技术领域十年的发展历程及其最新进展。

王海峰指出,语言与知识技术是人工智能认知能力的核心。在百度的这些技术发展过程中,公司始终关注技术与产业的双重趋势,力求在各个层面引领这些趋势,从研究方法、研究对象到产业应用进行全面布局,持续打磨与应用需求紧密相连的解决方案。

王海峰还展示了百度在语言与知识技术方面的完整布局,包括知识图谱、语言理解与生成技术,以及支撑智能搜索、机器翻译、对话系统、智能写作和深度问答等应用系统的技术,并对这些技术进行了详细的解读。

作为机器认知世界的基础,知识图谱的构建取得了显著成就。王海峰透露,目前百度已成功打造全球最大的多元异构知识图谱,涵盖超过50亿实体和5500亿事实,并且这一系统还在不断演进与更新,现每日调用量已突破400亿次,广泛应用于各行各业。
此外,王海峰还提到,凭借丰富的知识基础,语言理解技术的能力不断提升,机器的学习和进步能力逐渐接近人类。百度提出的知识增强语义理解框架文心(ERNIE)在深度学习的基础上融入了知识,展现出类似人类的学习能力,曾在全球权威数据集GLUE榜单中一举突破90分,刷新历史记录,并超越人类得分。

同时,百度还研发了知识增强的跨模态深度语义理解方法,利用知识关联不同模态信息,通过语言描述实现对图像与语言、语音与语言的深度理解,让机器在感知上更为智能。
