2023年3月3日,腾讯发布了混元Hy3预览并宣布其开源。这是一个融合了多项技术的混合模型,拥有295亿参数,其中激活参数为21亿,并支持256K上下文长度。作为混元的首个重建模型,Hy3在推理能力、指令执行、上下文理解、代码解析和智能体表现等方面都有显著提升。
在2026年,腾讯建立了预训练与强化学习的基础架构,并确立了三个原则,以提高模型的实用性:
1. 能力体系化:反对单一专长,因为即便是针对特定应用,也需要推理、长文本、指令执行、对话、代码和工具等多种能力的协同。
2. 评测真实性:主动避开容易被“刷榜”的公共榜单,采用自建题目、最新考试和人工评测等多种方式,评估和改进模型的实际能力。
3. 性价比追求:实用性与商业合理性密切相关,通过深度协同的模型架构和推理框架设计,大幅降低任务成本,使智能体的使用更加经济。
Hy3预览标志着混元快速探索实用性大模型的开始。
腾讯首席AI科学家姚顺表示,Hy3预览是混元大模型发展的起点。他们希望通过开源和发布,获取来自社区和用户的真实反馈,以提升Hy3正式版的实用性。同时,他们也在继续扩大预训练和强化学习的规模,提高模型的智能水平,并通过与腾讯多款产品的合作,持续提升模型在实际场景中的表现,探索独特的模型能力。
目前,Hy3预览已在腾讯云、元宝、iMa、codeBuddy、WorkBuddy、QQ、浏览器、腾讯文档和腾讯乐享等多个主流产品中上线,同时支持接入流行的开源智能体产品,如OpenClaw、OpenCode和KiloCode,并已在腾讯云大模型服务平台TokenHub上架。
Hy3预览强调实用性,Agent能力显著增强。
多个评测结果显示,Hy3预览模型能力全面提升。
1. 优秀的上下文学习和指令遵循能力。
在实际的生产和生活环境中,理解复杂的上下文并遵循多变的规则是模型的主要挑战。基于腾讯的业务场景,推出了CL-bench和CL-bench-life来评估模型的上下文学习能力,Hy3预览在这方面有了显著提升。

2. 复杂推理能力突出,清华大学博士资格考试分数最高。
复杂推理是模型解决问题的基础。Hy3预览在Frontier Science-Olympiad、IMOAnswerBench等高难度推理任务中表现优异,并在清华大学博士资格考试和全国中学生生物学联赛中取得了优异成绩,展现了强大的推理能力。

3. 代码与智能体的提升最为显著,展现出高性价比。
代码和智能体是Hy3预览提升最显著的领域。得益于预训练和强化学习框架的重建,Hy3在主流代码智能体基准中取得了竞争力的结果。

在数字环境中,代码关注模型的执行能力,而搜索则集中了信息检索和整合能力,两者共同影响模型在复杂智能体场景中的适用性。Hy3在多项评测中表现出色,表明智能体在全面和实用性方面稳步前进。

腾讯混元还构建了多个内部评测集,对模型在真实开发场景中的表现进行了评估。结果显示,在多个开发任务中,Hy3预览均展现出强大的竞争力。

比较各个开源模型的大小与智能体综合表现,Hy3预览展现出高性价比。

腾讯的核心业务已全面接入,多个AI产品验证收益显著。
在正式上线前,Hy3预览在腾讯主要AI业务中进行了测试,取得了明显的正收益。
在元宝端,混元与元宝进行深入合作,提升了模型在意图理解、文本创作和深度搜索等方面的表现,并优化了文风、情商和内容组织,使用户交互体验更智能。
在iMa知识库问答和通用问答场景中,Hy3预览在处理长文本时表现突出,特别是在信息准确性和覆盖度上表现良好。
在codeBuddy、WorkBuddy等产品上,Hy3预览的首延迟降低了54%,端到端时长减少47%,成功率达99.99%+。在实际使用中,Hy3预览成功驱动了复杂Agent工作,涵盖文档处理、数据分析、知识检索等多种办公场景。
在公众号AI分身和AI客服的专项评测中,Hy3预览相比于上一版本能力显著升级。新模型在用户意图理解和知识信息组织等方面表现更成熟,能够更准确地把握用户需求,并提供更清晰稳定的回复。
在和平精英AI NPC场景中,Hy3预览被迅速接入并评测,整体表现令人满意。在游戏场景中,Hy3预览能够准确理解角色设定,并针对开放性问题提供高质量的内容,提升了对话的真实感和自然度。
在腾讯文档AI PPT场景中,生成成功率提升20%,评测得分提升10%,生成耗时缩短20%。新模型在模型选择、色彩匹配、生成大纲等方面表现优秀,契合主题,视觉效果佳。
在QQ AI助手小Q的评测中,Hy3预览在长文本首字节时延、响应速度和流式输出效率上都有明显优化,核心能力上数学推理表现特别突出。
推理效率提高了40%,同时智能密度在同等成本下最优。
得益于模型和推理框架的协同,Hy3预览的整体推理效率提高了40%。其成本相比于上一代模型大幅下降。
在腾讯云大模型服务平台TokenHub上,Hy3预览的输入价格最低为1.2元每百万Tokens,输出价格最低为4元每百万Tokens。同时,腾讯云推出定制的Hy3预览Token计划,个人版定价最低28元每月,以提供更具性价比的选择。


