在2023中国计算机大会(CNCC)上,智谱AI正式发布了其自主研发的第三代基座大模型ChatGLM3及相关系列产品。这一发布标志着智谱AI在推出千亿基座对话模型ChatGLM和ChatGLM2之后,又迈出了重要的一步。
ChatGLM3引入了独特的多阶段增强预训练方法,从而使得模型训练更加充分。根据评测结果,在44个中英文公开数据集的测试中,ChatGLM3在国内同类模型中表现最佳。智谱AI的CEO张鹏在发布会上展示了这一新产品的功能,并进行了实时演示。
借助丰富的训练数据和优化的训练方案,ChatGLM3的性能显著增强。与前一代ChatGLM2相比,MMLU指标提升了36%、CEval提升了33%、GSM8K提升了179%、BBH提升了126%。
ChatGLM3朝着GPT-4V的方向进行了多项全新功能的迭代升级,其中包括多模态理解能力的CogVLM,能够识别图像中的语义,并在十多个国际标准图文评测数据集上取得了SOTA成绩。此外,代码增强模块code InteRpReteR可以根据用户需求生成并执行代码,自动完成数据分析和文件处理等复杂任务;网络搜索增强WebGLM则能够根据用户提问在互联网上查找相关资料,并在回答中提供相关文献或文章链接。这使得ChatGLM3在语义和逻辑能力上得到了大幅提升。
ChatGLM3还整合了自研的AgentTuning技术,激活了模型的智能体能力,尤其是在智能规划和执行方面,相较于ChatGLM2提升了1000%。此外,它还支持国产大模型原生工具调用、代码执行、游戏、数据库操作、知识图谱搜索与推理等复杂场景。
此次发布的ChatGLM3还包括可在手机上部署的端测模型ChatGLM3-1.5B和ChatGLM3-3B,支持多个手机品牌,如vivo、小米、三星等,同时兼容车载平台,并能够在移动平台的CPU芯片上进行推理,速度可达到20 Tokens/s。1.5B和3B模型在公开基准测试中表现接近ChatGLM2-6B模型。
基于最新的高效动态推理和显存优化技术,ChatGLM3的推理框架在相同硬件和模型条件下,相较于当前最佳的开源实现,如伯克利大学的vLLM和Hugging FACE TGI的最新版本,推理速度提升了2-3倍,推理成本降低了一半,每千Tokens仅需0.5分,成本极具竞争力。
在全新升级的ChatGLM3的支持下,智谱清言已成为国内首个具备代码交互能力的大模型产品(code InteRpReteR)。
“代码”功能目前支持图像处理、数学计算和数据分析等多个场景,具体包括:
处理数据生成图表
代码绘制图形
上传SQL代码进行分析
随着WebGLM大模型能力的加入,智谱清言具备了搜索增强的能力,可以帮助用户整理出相关问题的网上文献或文章链接,并直接给出答案。
此前发布的CogVLM模型提升了智谱清言的中文图文理解能力,接近GPT-4V的图片理解水平,能够回答各种视觉问题,并执行复杂的目标检测与标签标注,实现自动数据标注。
自2022年初,智谱AI推出的GLM系列模型已在昇腾、神威超算、海光DCU架构上进行大规模预训练和推理。至今,智谱AI的产品已支持10余种国产硬件生态,包括昇腾、神威超算、海光DCU等。通过与国产芯片企业的联合创新,性能不断优化,将助力国产原生大模型与国产芯片更快进入国际市场。
智谱AI此次发布的ChatGLM3及相关系列产品,显著提升了模型性能,为业界创造了更开放的开源生态,同时进一步降低了普通用户使用AIGC产品的门槛。AI正引领我们迈入一个新的时代,大模型的进步必将加速这一进程。
[[[IMG_1]]]
[[[IMG_2]]]
[[[IMG_3]]]
[[[IMG_4]]]
[[[IMG_5]]]
[[[IMG_6]]]
[[[IMG_7]]]
