互联网资讯

推出超长上下文窗口的Baichuan2-192K大模型,可一次输入35万字

2024年1月1日 · admin
openmagic ad

百川智能推出了BAIchuan2-192K大模型,其上下文窗口长度达192K,成为全球最长的模型。

该模型能够处理约35万个汉字,其能力是目前领先的长上下文窗口模型Claude2的4.4倍,GPT-4的14倍。

百川智能已经开放了BAIchuan2的API接口,正式进军企业级市场,并启动了BAIchuan2-192K的API内测。

在10项长文本评测中,BAIchuan2-192K在7项中获得了最先进的技术(SOTA),全面超越Claude2。

该模型在中英文长文本的问答和摘要评测上表现优异。

百川智能推出全球最长上下文窗口大模型Baichuan2-192K

LongEval的评测结果表明,BAIchuan2-192K在长窗口内容的记忆和理解能力上领先于其他模型。

百川智能推出全球最长上下文窗口大模型Baichuan2-192K

(LongEval是专门针对长窗口模型的评测榜单)

通过动态采样的位置编码优化和4D并行的分布式方案,BAIchuan2-192K实现了窗口长度与模型性能的同步提升。

该大模型通过算法与工程的优化,实现了窗口长度与性能之间的良好平衡。

百川智能推出全球最长上下文窗口大模型Baichuan2-192K

(PG-19是DeepMind发布的语言建模基准数据集)

百川智能在算法和工程方面的创新,对学术界具有重要意义。

BAIchuan2-192K的内测已经正式开启,并与多个行业机构展开合作,未来将全面开放。

百川智能推出全球最长上下文窗口大模型Baichuan2-192K

该模型能够高效处理和分析数百页的材料,为多个行业带来显著的助力。

例如,它可以帮助基金经理总结和分析财务报表,帮助律师识别潜在风险,帮助技术人员查阅开发文档,以及帮助研究人员浏览相关论文。

更长的上下文窗口为处理和理解多模态输入及迁移学习提供了强有力的支持。