互联网资讯 / 人工智能 · 2024年3月9日

Claude 3 系列顶级型号测试结果超越 GPT-4

3月5日消息,关于生成式人工智能和大模型的热潮自去年初以来一直在延续,各大厂商持续升级自家模型。作为强力竞争对手的一方,相关公司已推出新一代 Claude 3 系列大模型。

Anthropic推出Claude 3系列大模型 最强版测试表现强于GPT-4

新推出的 Claude 3 系列包含三个版本,分别是 Claude 3 HAIku、Claude 3 Sonnet 和 Claude 3 OpUS,按能力从低到高排序,旨在为用户提供在智能水平、速度与成本之间的不同权衡与选择。

与此前的大模型相比,Claude 3 系列在速度和智能水平上都实现提升。官方表示,对于绝大多数工作负载,Claude 3 Sonnet 的处理速度是 Claude 2 与 Claude 2.1 的两倍,并具备更高的知识检索与快速响应能力,适合销售自动化等需求。Claude 3 OpUS 的速度与 Claude 2、Claude 2.1 相当,但在智能水平上显著超越前代产品。

在官方介绍中, Claude 3 系列在分析预测、精细内容创建、代码生成以及非英语对话等方面均有明显增强。

官方还披露了 Claude 3 系列与其他模型在对比测试中的数据:Claude 3 OpUS 在常识、推理和编码等方面表现优于 GPT-4 与 Gemini 1.0 Ultra;Claude 3 HAIku 与 Claude 3 Sonnet 也都优于 GPT-3.5 与 Gemini 1.0 Pro。

Anthropic推出Claude 3系列大模型 最强版测试表现强于GPT-4

在视觉处理能力方面,Claude 3 系列能够处理图片、图表及技术图表等多种视觉格式,测试结果也超过了 GPT-4V。

Anthropic推出Claude 3系列大模型 最强版测试表现强于GPT-4

此外,官方还指出针对前代模型中存在的较高拒绝率问题,已进行了有效改进,整体准确性相较 Claude 2.1 小米显著提升。

如同测试所显示的,Claude 3 OpUS 拥有更强的能力,官方也表示 OpUS 是当前系列中最智能的模型,在处理复杂任务时具备市场领先的性能。