百川智能近日推出了BAIchuan2-53B闭源大模型,显著提升了BAIchuan1-53B的多项能力。BAIchuan2-53B在数学和逻辑推理方面表现出色,同时通过高质量的数据体系与搜索增强,大幅降低了模型的幻觉现象。
作为首批获得备案的大模型企业,百川智能此次还开放了BAIchuan2-53B的API接口,正式进军To B领域,开启了商业化的新篇章。通过开放API,百川智能将把行业领先的大模型能力赋能给各行各业的合作伙伴,助力无数企业实现智能化转型。
BAIchuan2-53B是百川智能发布的第六款大模型,自4月10日成立以来,该公司以平均每28天推出一个新模型的速度持续创新。最近发布的BAIchuan 2开源大模型在多项评估任务中远超LLaMA2。
数学与逻辑推理能力的显著提高
2023年8月8日,百川智能发布了BAIchuan-53B搜索增强大模型,该模型在知识问答和文学创作等领域表现出色,展现了强大的商业文案创作、文学创作及中文理解能力。
数学和逻辑推理能力是业界关注的重点,也是评判一款大模型是否领先的重要标准。在BAIchuan-53B的基础上,BAIchuan2-53B不仅强化了这两个维度的能力,还对整体性能进行了全面升级。其中,逻辑推理能力提升100%,数学能力提升31%,语言理解能力提升29%,文本创作能力提升18%,知识问答能力提升9%。



客观问答准确率处于行业前沿
幻觉问题是大模型应用落地必须克服的障碍。通常来说,解决这一问题可以通过增加模型的数据规模与提升数据质量,或者利用搜索等外部工具来获取实时信息。
BAIchuan2-53B在这两个方面进行了大量优化。在高质量数据构建方面,该模型独创了数据质量体系,根据数据的优劣进行分类,确保在预训练阶段始终使用高质量数据。

在信息获取方面,BAIchuan2-53B对多个模块进行了升级,包括指令意图理解、智能搜索和结果增强等关键组件。这个综合体系通过深入理解用户指令,精确驱动查询词的搜索,结合大语言模型技术,优化了模型结果生成的可靠性,达成更精确与智能的模型回答,减少了幻觉现象。

借助高质量数据体系与搜索增强技术,BAIchuan2-53B有效降低了模型幻觉。根据百川智能使用FAcTool评测的结果显示,BAIchuan2-53B的综合得分为140.5,在主流基础大模型中仅次于GPT-4,达到了国内领先水平。
FAcTool是由上海交通大学、卡内基梅隆大学、香港城市大学和Meta等机构的学者共同提出的一款通用框架,旨在验证大模型生成内容的事实准确性。

开放API,全面进军To B市场
除了全面提升能力,BAIchuan2-53B还开放了API接口,企业和开发者可以通过该接口将其集成到自己的应用程序和服务中。BAIchuan2-53B结合了前沿的大模型技术,能够适应不同企业的多种业务需求,无论是智能客服、智能写作还是智能推荐,都能提供行业领先的用户体验。
据了解,BAIchuan2-53B的API接口使用便捷,客户只需简单配置和集成即可接入,并且与OpenAI的接口高度兼容,客户可以快速迁移,显著降低模型的部署与转换成本。
百川智能强调,针对企业用户最为关注的安全合规问题,作为首批通过《生成式人工智能服务管理暂行办法》备案的大模型企业,百川智能为BAIchuan2-53B构建了覆盖大模型预训练、精调和推理全周期的安全增强系统,能够为客户和合作伙伴提供全面的安全保障。
