语言和知识技术是推动人工智能进步的重要因素,百度在这方面积累了丰富的经验。8月25日,百度大脑语言与知识技术峰会以“掌握知识、理解语言、拥有智能”为主题在线上举行。百度CTO王海峰详细阐述了百度在语言与知识技术的发展历程和最新成果,同时分享了相关技术及产业的发展趋势与前景。百度集团副总裁吴甜则重磅推出了5款新产品,百度技术委员会主席吴华也发布了数据共建和算力共享计划,以进一步加速人工智能的大规模应用。
在峰会上,王海峰首次展示了百度大脑语言与知识产品的全景图,随即吴甜介绍了5款新产品的发布:
推出语义理解技术与平台文心(ERNIE):提供一站式NLP开发能力,大幅降低NLP定制开发的成本,并具备出色的工业级应用能力。
全新发布TextMind智能文档分析平台:为企业提供一站式的文档规范化解析方案,助力办公智能化升级。
全新发布AI同传会议解决方案:覆盖会议的各个场景,支持会议前、中、后全流程。
升级发布智能创作平台:推出三大媒体场景方案,包括智能策划、智能采编和智能审校。
升级发布UNIT智能对话定制与服务平台:包含三大核心升级点,提升任务式对话理解的智能性、便捷性和通用对话的融合。

百度始终致力于将语言与知识技术凝聚成一系列技术平台和产品,以支持用户的需求,降低NLP应用的成本,提高效率。吴甜指出,百度多年来在语言与知识技术方面的持续投入和发展,为开发者和业务应用者提供了基于这些技术的系列产品,充分发挥其应用价值。
基于语言与知识核心技术,百度大脑语言与知识产品包括语义理解技术与平台文心、多个能力引擎、智能文档分析平台、智能对话定制与服务平台、智能创作平台以及知识中台,这些产品支撑着智能搜索、智能翻译、智慧金融、智慧媒体和智慧城市等多个领域的应用。
三款新品的重磅发布,满足产业智能化转型的需求。
在语言理解方面,百度推出了语义理解技术与平台文心ERNIE。吴甜表示,文心基于深度学习平台飞桨构建,提供一站式能力,预计将使开发者的90%数据标注、90%算力投入和85%模型开发时间大幅减少,从而显著降低NLP定制开发的成本。去年推出的知识增强语义理解框架ERNIE,已在各类NLP任务中取得突破,文心正是在此基础上进行的扩展。
随着企业智能化转型的深入,通用算法已无法满足日益增长的场景需求,而传统NLP定制方案的高成本和耗时也成为障碍。此次推出文心,旨在为企业开发者提供更低门槛和更便捷的语义理解技术应用。
文心已在多种实际场景中得到应用,展现出领先的工业级实力。目前,文心在百度的多款产品中得到广泛应用,已支持超过2万名开发者,覆盖金融、通信、教育和电商等多个行业,显著提升了企业在NLP应用方面的效果和效率。

此外,吴甜全新推出了TextMind智能文档分析平台,提供一站式企业文档规范化解析方案,助力办公智能化升级。TextMind基于OCR和NLP技术,以文档解析为核心能力,支持文档对比与审核。其特点可概括为多快好省——支持多种格式(目前可解析6种格式、20类文档);处理效率显著提升,例如,将企业报销时间从3-5个工作日缩短至1分钟;效果良好,基于TextMind的文档解析能力,企业可实现零门槛的定制;而文档规范化解析则帮助企业降低80%以上的人力成本。
在机器翻译方面,吴甜推出了AI同传会议解决方案,覆盖会议全场景和全流程,旨在为用户提供随身的会议同传专家。吴甜现场演示了如何通过一台电脑和一部手机快速搭建同传服务,只需简单操作即可迅速获取专业同传服务。吴甜提到,在测试期间,百度AI同传会议解决方案已经支持了上百场会议,覆盖多个领域,包括线上远程会议和线下会议,经过实践检验,方案已成熟可靠。
两大平台的新升级,为开发者提供了更高的使用体验。
去年,百度推出的智能创作平台广泛服务于内容创作的单位与个人。今年4月推出的图文转视频能力,已有7000多用户,生产短视频达到15万个,相当于一个人至少100年的工作量。智能创作平台已在人民日报、央视网等20多家媒体机构落地。基于此,百度全新推出智能策划、智能采编和智能审校三大媒体场景方案,进一步帮助媒体人更快、更好地创作。
吴甜表示,智能策划能够高效汇聚全网主流媒体资讯,通过海量数据分析和实时监测,帮助媒体人丰富选题思路,提升创作效率;智能采编基于百度的AI技术,助力多元媒体内容素材的理解、检索及推荐,并整合了视频生产的多项能力,让媒体创作更加高效;智能审校则结合纠错、一致性检查和格式校对等实用功能,提供API云端服务接口和轻量级插件,借助机器辅助完成相对机械或数据明确的审校工作。
在对话方面,智能对话定制与服务平台UNIT进行了三大升级,进一步降低了任务式对话和智能问答的定制成本,并融合了通用对话能力,提升了交互体验。通过小样本的意图理解能力升级,新增口语化同义词推荐和自动识别词槽修饰关系,UNIT平台的任务式对话理解能力的数据标注成本降低了30%以上。其表格问答能力允许开发者上传业务数据表格,经过约1小时的人工调优后,生成的问答机器人能够很好地回答基于这些表格的问题。UNIT不仅集成了业界领先的通用对话技术PLATO,还推出新一代融合任务式对话和通用对话的引擎,使对话系统更高效且流畅。
语言与知识技术的融合发展为人工智能带来了巨大价值,也是产业智能化转型的重要推动力。如今,百度的语言与知识技术已经在不同的行业和场景中得到广泛应用,如同空气般无形却至关重要。吴甜表示,新技术不断为我们带来惊喜,百度希望为开发者和企业提供更多实用的语言与知识产品,以提升生产效率,改善生活质量。
