发布新一代ChatGLM3，支持更多国产芯片适配

在2023中国计算机大会（CNCC）上，智谱AI正式发布了其自主研发的第三代基座大模型ChatGLM3及相关系列产品。这一发布标志着智谱AI在推出千亿基座对话模型ChatGLM和ChatGLM2之后，又迈出了重要的一步。

ChatGLM3引入了独特的多阶段增强预训练方法，从而使得模型训练更加充分。根据评测结果，在44个中英文公开数据集的测试中，ChatGLM3在国内同类模型中表现最佳。智谱AI的CEO张鹏在发布会上展示了这一新产品的功能，并进行了实时演示。

借助丰富的训练数据和优化的训练方案，ChatGLM3的性能显著增强。与前一代ChatGLM2相比，MMLU指标提升了36%、CEval提升了33%、GSM8K提升了179%、BBH提升了126%。

ChatGLM3朝着GPT-4V的方向进行了多项全新功能的迭代升级，其中包括多模态理解能力的CogVLM，能够识别图像中的语义，并在十多个国际标准图文评测数据集上取得了SOTA成绩。此外，代码增强模块code InteRpReteR可以根据用户需求生成并执行代码，自动完成数据分析和文件处理等复杂任务；网络搜索增强WebGLM则能够根据用户提问在互联网上查找相关资料，并在回答中提供相关文献或文章链接。这使得ChatGLM3在语义和逻辑能力上得到了大幅提升。

ChatGLM3还整合了自研的AgentTuning技术，激活了模型的智能体能力，尤其是在智能规划和执行方面，相较于ChatGLM2提升了1000%。此外，它还支持国产大模型原生工具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理等复杂场景。

此次发布的ChatGLM3还包括可在手机上部署的端测模型ChatGLM3-1.5B和ChatGLM3-3B，支持多个手机品牌，如vivo、小米、三星等，同时兼容车载平台，并能够在移动平台的CPU芯片上进行推理，速度可达到20 Tokens/s。1.5B和3B模型在公开基准测试中表现接近ChatGLM2-6B模型。

基于最新的高效动态推理和显存优化技术，ChatGLM3的推理框架在相同硬件和模型条件下，相较于当前最佳的开源实现，如伯克利大学的vLLM和Hugging FACE TGI的最新版本，推理速度提升了2-3倍，推理成本降低了一半，每千Tokens仅需0.5分，成本极具竞争力。

在全新升级的ChatGLM3的支持下，智谱清言已成为国内首个具备代码交互能力的大模型产品（code InteRpReteR）。

“代码”功能目前支持图像处理、数学计算和数据分析等多个场景，具体包括：

处理数据生成图表

代码绘制图形

上传SQL代码进行分析

随着WebGLM大模型能力的加入，智谱清言具备了搜索增强的能力，可以帮助用户整理出相关问题的网上文献或文章链接，并直接给出答案。

此前发布的CogVLM模型提升了智谱清言的中文图文理解能力，接近GPT-4V的图片理解水平，能够回答各种视觉问题，并执行复杂的目标检测与标签标注，实现自动数据标注。

自2022年初，智谱AI推出的GLM系列模型已在昇腾、神威超算、海光DCU架构上进行大规模预训练和推理。至今，智谱AI的产品已支持10余种国产硬件生态，包括昇腾、神威超算、海光DCU等。通过与国产芯片企业的联合创新，性能不断优化，将助力国产原生大模型与国产芯片更快进入国际市场。

智谱AI此次发布的ChatGLM3及相关系列产品，显著提升了模型性能，为业界创造了更开放的开源生态，同时进一步降低了普通用户使用AIGC产品的门槛。AI正引领我们迈入一个新的时代，大模型的进步必将加速这一进程。

[[[IMG_1]]]
[[[IMG_2]]]
[[[IMG_3]]]
[[[IMG_4]]]
[[[IMG_5]]]
[[[IMG_6]]]
[[[IMG_7]]]

ad

近期文章

互联网资讯 · 2023年12月31日

发布新一代ChatGLM3，支持更多国产芯片适配

You may also like...

互联网资讯 · 2023年12月31日

You may also like...

以蜜雪冰城为标杆，果呀呀子品牌能否击败对手？

钟薛高创始人计划通过直播带货来还债

人工智能与物联网的五个新兴应用场景