互联网资讯 / 人工智能 · 2024年1月22日

李彦宏展示大语言模型五大应用能力

3月16日,百度在北京总部举行发布会,围绕新一代大语言模型及生成式AI产品文心一言进行了现场展示。会上,李彦宏重点介绍了该模型在文学创作、商业文案、数理推理、中文理解和多模态生成五个场景中的表现。

李彦宏展示百度 “文心一言”文学创作、数理推算等五大场景能力

文学创作

在文学创作环节,文心一言根据提问对科幻作品《三体》的核心内容进行了梳理,并给出了五个可用于续写的思路,体现出其在问答、总结和内容生成方面的综合能力。

除了创作任务,它还能够回答与《三体》相关的事实性问题,例如作者信息、电视剧角色扮演者等。针对生成式AI常见的事实偏差问题,这一模型在知识增强能力的支持下,展现出更高的回答准确性。

面对“于和伟和张鲁一有哪些共同点”“于和伟和张鲁一谁更高”这类需要比较和推理的问题,系统也能够基于已有信息给出合理答案。

李彦宏展示百度 “文心一言”文学创作、数理推算等五大场景能力

商业文案创作

在商业应用场景中,文心一言完成了公司命名、Slogan撰写以及新闻稿生成等任务,展示了较强的文案创作能力。

从连续多轮创作结果来看,它不仅能较准确地理解用户需求,也能以清晰、有条理的方式输出内容。这种表现建立在大规模训练数据基础之上,包括海量网页数据、搜索与图片数据、语音调用数据以及庞大的知识图谱信息,使其在中文处理方面具备明显优势。

李彦宏展示百度 “文心一言”文学创作、数理推算等五大场景能力

数理推算

在数理能力展示中,文心一言表现出一定的逻辑推演和数学解题能力。以“鸡兔同笼”这类经典题目为例,它能够理解题意,给出正确思路,并按照步骤逐步完成计算,最终得到正确结果。

李彦宏展示百度 “文心一言”文学创作、数理推算等五大场景能力

文学创作、商业文案和数理推算通常被视为大语言模型较为典型的能力方向。在这些基础能力之外,现场展示还进一步体现了其在中文理解和多模态生成上的特点。

中文理解

在中文语境下的理解能力方面,李彦宏表示,这一模型在自然语言处理、中文表达和中国文化相关内容上具备较强表现。演示过程中,文心一言不仅解释了成语“洛阳纸贵”的含义,还进一步给出了其可对应的经济学概念,并以“洛阳纸贵”四个字创作了一首藏头诗。

李彦宏展示百度 “文心一言”文学创作、数理推算等五大场景能力

多模态生成

在多模态生成部分,现场展示了文心一言生成文本、图片、音频和视频的能力。值得注意的是,它还可以生成包括四川话在内的方言语音。至于视频生成,由于当前成本较高,相关功能暂未向全部用户开放,后续将逐步接入。

李彦宏表示,多模态已经成为生成式AI明确的发展方向。随着统一多模态大模型能力持续提升,相关生成效果和应用范围也将进一步扩展。

李彦宏展示百度 “文心一言”文学创作、数理推算等五大场景能力

从整体展示来看,这一大语言模型已经在一定程度上具备了对人类意图的理解能力,其回答的准确性、逻辑性与流畅性正不断提升,并逐渐接近更自然的人机交互水平。

不过,李彦宏也提到,这类模型目前仍处于持续发展阶段,距离成熟还有较长路径,后续仍需依靠真实用户反馈不断迭代优化。