Claude3 系列发布：企业级多模态大模型的亮点与挑战

作为一家以企业级应用为导向的技术公司，AnthRopic 的研发与产业化努力被视为与 OpenAI 等主流竞争对手并驾齐驱的尝试之一。

本地时间周一，AnthRopic 发布了 Claude 3 系列大模型，称其在多项基准测试中表现优于 OpenAI 的 GPT-4 以及 Google 的 Gemini 1.0 UltRa，但更关键的是其在复杂推理任务、智能水平与响应速度上的综合能力，已进入行业领先水平。

Claude3 的定位不仅在于单一模型的性能提升，更在于提供一组模型以满足不同企业场景的成本与性能权衡。这一系列包括 HAIku、Sonnet 与 OpUS，企业可据自身需求选择合适版本。

AnthRopic 还强调自家模型在安全性方面的改进。创始团队提到，在 Claude3 的训练中引入了“宪法人工智能”理念，以提升安全性、可信度和可靠性。

在技术报告发布后，爱丁堡大学的博士生表示，Claude3 在复杂推理基准上的表现尤为突出，且在金融、医疗等垂直场景中，对 ToB 客户来说，选择优化利润最高的领域具有现实意义。

目前，Claude3 系列在全球 159 个国家开放使用，其中两款基础模型 HAIku 与 Sonnet 已上线，最强版本 OpUS 也将陆续推出。同时，该系列通过云平台提供服务，相关云厂商的资金投入也为其扩展提供了支持。

联合创始人 DaRio AModei 与 Daniela AModei 表示，Claude3 的发布再次彰显了公司更像是一家企业级公司，而非传统消费型企业的定位。

更智能、响应更快的 Claude3 家族

Claude3 家族包括 OpUS、Sonnet 与 HAIku。

据官方介绍，Claude3 由三种前沿模型组成：Claude 3 HAIku、Claude 3 Sonnet 和 Claude 3 OpUS，用户可在不同应用场景下选择最合适的智能、速度与成本平衡。就通用能力而言， Claude3 系列被描述为在广泛认知任务中设立新的行业基准，在分析与预测、细致内容生成、代码输出及多语言对话方面表现更强，且在任务响应速度上更具优势。

其中，Claude 3 OpUS 是系列中最具智能的模型，尤其擅长处理高度复杂的任务。它在常见评测中普遍优于同级别产品，包括 MMLU、GPQA、GSM8K 等。OpUS 以接近人类水平的理解力和流畅性，代表了生成式人工智能的前沿探索。

[ 刚刚曝光的Claude3，直击OpenAI最大弱点 ]

图片：Claude3 模型家族 | 来源：AnthRopic

Claude 3 Sonnet 在智能水平与响应速度之间实现了理想的平衡，面向企业场景的任务设计，提供比同类产品更具性价比的性能，支持大规模部署中的高可用性。大多数工作负载下，Sonnet 的响应速度比 Claude 2 系列快约两倍，且智能水平更高，尤其适合知识检索、销售自动化等应用场景。Claude 3 HAIku 则是更紧凑、成本更低的版本，响应速度同样出色，能够在短时间内阅读并处理包含图表和数据密集信息的文献。

面向企业的迭代升级

联合创始人 Daniela AModei 表示，企业客户在将生成式 AI 集成到业务中时会遇到多重挑战。为此， Claude3 家族在视觉理解、准确性、长文本处理与安全性方面均有改进。

许多企业知识库包含 PDFs、流程图、演示文稿等多种格式。现在， Claude3 系列能够处理多种视觉格式的内容，包括照片、图表与技术图示，并进一步提升准确性与长文本处理能力。

在准确性方面，AnthRopic 通过大量复杂事实型问题来评估当前模型的弱点，将答案标注为正确、错误（或幻觉）与不确定性。在 Claude3 的实现中，若模型不确定答案，将明确表述“不知道”。其中，Claude 3 OpUS 在开放式问题上的准确性显著提升，错误率显著下降。

[ 刚刚曝光的Claude3，直击OpenAI最大弱点 ]

比较展示：Claude3 系列相比 Claude2.1 的响应准确性提升 | 来源：AnthRopic

同时，因上下文理解能力的提升，Claude3 系列在处理任务时的拒答情况显著减少。

此外，AnthRopic 表示将为 Claude3 引入“引用”功能，能够指向参考材料中的精确句子以验证答案来源。

当前， Claude3 系列提供 200K Token 的上下文窗口，未来将支持超过 100 万 Token 的输入，面向需要大规模上下文处理的精选客户。技术报告也简要介绍了 Claude3 的上下文处理能力和长文本回忆能力。

宪法人工智能与安全控制

Claude3 作为多模态模型，支持输入图像但不输出图像内容。创始人指出，这是因为企业对图像需求相对较低。

此次发布也回应了对 AI 道德与价值观偏见的关注，强调对模型控制与风险缓解的持续投入。创始团队成员指出，人工智能模型的控制是一项复杂且不完全确定的科学工作，存在多重风险，需要专门团队持续评估与缓释。

另一位联合创始人强调，现阶段几乎不可能实现完全无偏见的通用生成式 AI，原因既在技术层面，也因为不同人对“中立”的理解并不一致。

[ 刚刚曝光的Claude3，直击OpenAI最大弱点 ]

此前， AnthRopic 公布了用于对齐大模型的“宪法人工智能”方法，旨在让模型的行为尽量符合广泛的社会价值观与原则。

作为 OpenAI 前核心团队成员的出走案例，与近期相关诉讼事件相似之处亦被提及。对此，AModei 表示，处于 AI 发展前沿的工作，是推动技术实现对社会的积极影响的最有效路径。

他补充道：“推动人工智能发展以实现积极的社会影响，是实现愿景的关键。”

ad

近期文章

互联网资讯 / 人工智能 · 2024年3月9日