阿里云正式发布了开源的通义千问140亿参数模型Qwen-14B及其对话模型Qwen-14B-Chat,均可免费商用。Qwen-14B在多个权威评测中表现优异,超越了同规模的其他模型,其中一些指标甚至接近于LlaMa2-70B。此前,阿里云还开源了70亿参数的Qwen-7B模型,下载量在一个多月内突破了100万,赢得了开源社区的良好口碑。
Qwen-14B是一款支持多语言的高性能开源模型,相比于同类产品,它使用了更多高质量的数据,整体训练数据量超过了3万亿Token,使得该模型在推理、认知、规划和记忆能力上表现更为出色。Qwen-14B最大支持8k的上下文窗口长度。

在十二个权威测评中,Qwen-14B全面超越了同规模的SOTA大模型。
Qwen-14B-Chat是基于基座模型经过精细化SFT训练而成的对话模型。得益于基座模型的强大性能,Qwen-14B-Chat在内容生成的准确性上有了显著提升,更符合用户的偏好,同时在创意和内容丰富性上也有了显著扩展。
Qwen展现出卓越的工具调用能力,帮助开发者更快速地构建基于Qwen的智能体(Agent)。开发者可以通过简单的指令教会Qwen使用复杂的工具,例如利用code InteRpReteR工具执行Python代码以进行复杂的数学计算、数据分析和图表绘制等。同时,还可以开发具备多文档问答和长文写作能力的“高级数字助理”。
在百亿参数以内的大语言模型中,Qwen-14B成为开发者进行应用开发和迭代的主流选择,其性能大幅提升,使其从众多同类模型中脱颖而出。在MMLU、C-Eval、GSM8K、MATH、GaoKao-Bench等12个权威测评中,Qwen-14B取得了最优成绩,全面超越了所有测评中的SOTA大模型,甚至在与LlaMa-2-13B相比时也毫不逊色。而Qwen-7B也进行了全新升级,其核心指标提升幅度达到22.5%。

Qwen-14B表现优于同尺寸模型。
用户可以直接从魔搭社区下载模型,或者通过阿里云灵积平台访问和调用Qwen-14B及Qwen-14B-Chat。阿里云为用户提供了涵盖模型训练、推理、部署和精调等全方位的服务。
在8月,阿里云推出了通义千问70亿参数基座模型Qwen-7B,并在HuggingFACE和GitHub的趋势榜单上名列前茅。短短一个多月,累计下载量已突破100万。在开源社区中,已经出现了超过50个基于Qwen的模型,多个知名工具和框架也已集成Qwen。

通义千问是中国大模型中落地最深、应用最广的项目,国内已有多个活跃应用接入通义千问,许多中小企业、科研机构和个人开发者都在基于通义千问开发专属大模型或应用产品,如阿里系的淘宝、钉钉、未来精灵,以及外部的科研机构和创业企业。
浙江大学联合高等教育出版社基于Qwen-7B开发了智海-三乐教育垂直大模型,目前已在全国12所高校应用,能够提供智能问答、试题生成、学习导航和教学评估等功能,该模型已在阿里云灵积平台对外提供服务,用户只需一行代码即可调用;浙江有鹿机器人科技有限公司则在路面清洁机器人中集成了Qwen-7B,使机器人能够通过自然语言与用户实时交互,理解用户需求,并进行高层次的逻辑分析和任务规划,以完成清洁任务。
阿里云CTO周靖人表示,阿里云将持续拥抱开源和开放,致力于推动中国大模型生态的建设。阿里云相信开源开放的力量,并率先开源自研大模型,旨在让大模型技术更快地惠及中小企业和个人开发者。
此外,阿里云还牵头建立了中国最大的AI模型开源社区魔搭ModelScope,凝聚全行业的力量,共同推动大模型技术的普及和实际应用。在过去两个月中,魔搭社区的模型下载量从4500万激增至8500万,增幅接近100%。
