作为一家以企业级应用为导向的技术公司,AnthRopic 的研发与产业化努力被视为与 OpenAI 等主流竞争对手并驾齐驱的尝试之一。
本地时间周一,AnthRopic 发布了 Claude 3 系列大模型,称其在多项基准测试中表现优于 OpenAI 的 GPT-4 以及 Google 的 Gemini 1.0 UltRa,但更关键的是其在复杂推理任务、智能水平与响应速度上的综合能力,已进入行业领先水平。
Claude3 的定位不仅在于单一模型的性能提升,更在于提供一组模型以满足不同企业场景的成本与性能权衡。这一系列包括 HAIku、Sonnet 与 OpUS,企业可据自身需求选择合适版本。
AnthRopic 还强调自家模型在安全性方面的改进。创始团队提到,在 Claude3 的训练中引入了“宪法人工智能”理念,以提升安全性、可信度和可靠性。
在技术报告发布后,爱丁堡大学的博士生表示,Claude3 在复杂推理基准上的表现尤为突出,且在金融、医疗等垂直场景中,对 ToB 客户来说,选择优化利润最高的领域具有现实意义。
目前,Claude3 系列在全球 159 个国家开放使用,其中两款基础模型 HAIku 与 Sonnet 已上线,最强版本 OpUS 也将陆续推出。同时,该系列通过云平台提供服务,相关云厂商的资金投入也为其扩展提供了支持。
联合创始人 DaRio AModei 与 Daniela AModei 表示,Claude3 的发布再次彰显了公司更像是一家企业级公司,而非传统消费型企业的定位。
更智能、响应更快 的 Claude3 家族
Claude3 家族包括 OpUS、Sonnet 与 HAIku。
据官方介绍,Claude3 由三种前沿模型组成:Claude 3 HAIku、Claude 3 Sonnet 和 Claude 3 OpUS,用户可在不同应用场景下选择最合适的智能、速度与成本平衡。就通用能力而言, Claude3 系列被描述为在广泛认知任务中设立新的行业基准,在分析与预测、细致内容生成、代码输出及多语言对话方面表现更强,且在任务响应速度上更具优势。
其中,Claude 3 OpUS 是系列中最具智能的模型,尤其擅长处理高度复杂的任务。它在常见评测中普遍优于同级别产品,包括 MMLU、GPQA、GSM8K 等。OpUS 以接近人类水平的理解力和流畅性,代表了生成式人工智能的前沿探索。
[
]
图片:Claude3 模型家族 | 来源:AnthRopic
Claude 3 Sonnet 在智能水平与响应速度之间实现了理想的平衡,面向企业场景的任务设计,提供比同类产品更具性价比的性能,支持大规模部署中的高可用性。大多数工作负载下,Sonnet 的响应速度比 Claude 2 系列快约两倍,且智能水平更高,尤其适合知识检索、销售自动化等应用场景。Claude 3 HAIku 则是更紧凑、成本更低的版本,响应速度同样出色,能够在短时间内阅读并处理包含图表和数据密集信息的文献。
面向企业的迭代升级
联合创始人 Daniela AModei 表示,企业客户在将生成式 AI 集成到业务中时会遇到多重挑战。为此, Claude3 家族在视觉理解、准确性、长文本处理与安全性方面均有改进。
许多企业知识库包含 PDFs、流程图、演示文稿等多种格式。现在, Claude3 系列能够处理多种视觉格式的内容,包括照片、图表与技术图示,并进一步提升准确性与长文本处理能力。
在准确性方面,AnthRopic 通过大量复杂事实型问题来评估当前模型的弱点,将答案标注为正确、错误(或幻觉)与不确定性。在 Claude3 的实现中,若模型不确定答案,将明确表述“不知道”。其中,Claude 3 OpUS 在开放式问题上的准确性显著提升,错误率显著下降。
[
]
比较展示:Claude3 系列相比 Claude2.1 的响应准确性提升 | 来源:AnthRopic
同时,因上下文理解能力的提升,Claude3 系列在处理任务时的拒答情况显著减少。
此外,AnthRopic 表示将为 Claude3 引入“引用”功能,能够指向参考材料中的精确句子以验证答案来源。
当前, Claude3 系列提供 200K Token 的上下文窗口,未来将支持超过 100 万 Token 的输入,面向需要大规模上下文处理的精选客户。技术报告也简要介绍了 Claude3 的上下文处理能力和长文本回忆能力。
宪法人工智能与安全控制
Claude3 作为多模态模型,支持输入图像但不输出图像内容。创始人指出,这是因为企业对图像需求相对较低。
此次发布也回应了对 AI 道德与价值观偏见的关注,强调对模型控制与风险缓解的持续投入。创始团队成员指出,人工智能模型的控制是一项复杂且不完全确定的科学工作,存在多重风险,需要专门团队持续评估与缓释。
另一位联合创始人强调,现阶段几乎不可能实现完全无偏见的通用生成式 AI,原因既在技术层面,也因为不同人对“中立”的理解并不一致。
[
]
此前, AnthRopic 公布了用于对齐大模型的“宪法人工智能”方法,旨在让模型的行为尽量符合广泛的社会价值观与原则。
作为 OpenAI 前核心团队成员的出走案例,与近期相关诉讼事件相似之处亦被提及。对此,AModei 表示,处于 AI 发展前沿的工作,是推动技术实现对社会的积极影响的最有效路径。
他补充道:“推动人工智能发展以实现积极的社会影响,是实现愿景的关键。”
