李彦宏展示大语言模型五大应用能力

3月16日，百度在北京总部举行发布会，围绕新一代大语言模型及生成式AI产品文心一言进行了现场展示。会上，李彦宏重点介绍了该模型在文学创作、商业文案、数理推理、中文理解和多模态生成五个场景中的表现。

文学创作

在文学创作环节，文心一言根据提问对科幻作品《三体》的核心内容进行了梳理，并给出了五个可用于续写的思路，体现出其在问答、总结和内容生成方面的综合能力。

除了创作任务，它还能够回答与《三体》相关的事实性问题，例如作者信息、电视剧角色扮演者等。针对生成式AI常见的事实偏差问题，这一模型在知识增强能力的支持下，展现出更高的回答准确性。

面对“于和伟和张鲁一有哪些共同点”“于和伟和张鲁一谁更高”这类需要比较和推理的问题，系统也能够基于已有信息给出合理答案。

在商业应用场景中，文心一言完成了公司命名、Slogan撰写以及新闻稿生成等任务，展示了较强的文案创作能力。

从连续多轮创作结果来看，它不仅能较准确地理解用户需求，也能以清晰、有条理的方式输出内容。这种表现建立在大规模训练数据基础之上，包括海量网页数据、搜索与图片数据、语音调用数据以及庞大的知识图谱信息，使其在中文处理方面具备明显优势。

在数理能力展示中，文心一言表现出一定的逻辑推演和数学解题能力。以“鸡兔同笼”这类经典题目为例，它能够理解题意，给出正确思路，并按照步骤逐步完成计算，最终得到正确结果。

文学创作、商业文案和数理推算通常被视为大语言模型较为典型的能力方向。在这些基础能力之外，现场展示还进一步体现了其在中文理解和多模态生成上的特点。

在中文语境下的理解能力方面，李彦宏表示，这一模型在自然语言处理、中文表达和中国文化相关内容上具备较强表现。演示过程中，文心一言不仅解释了成语“洛阳纸贵”的含义，还进一步给出了其可对应的经济学概念，并以“洛阳纸贵”四个字创作了一首藏头诗。

在多模态生成部分，现场展示了文心一言生成文本、图片、音频和视频的能力。值得注意的是，它还可以生成包括四川话在内的方言语音。至于视频生成，由于当前成本较高，相关功能暂未向全部用户开放，后续将逐步接入。

李彦宏表示，多模态已经成为生成式AI明确的发展方向。随着统一多模态大模型能力持续提升，相关生成效果和应用范围也将进一步扩展。

从整体展示来看，这一大语言模型已经在一定程度上具备了对人类意图的理解能力，其回答的准确性、逻辑性与流畅性正不断提升，并逐渐接近更自然的人机交互水平。

不过，李彦宏也提到，这类模型目前仍处于持续发展阶段，距离成熟还有较长路径，后续仍需依靠真实用户反馈不断迭代优化。