8月29日消息,SupeRCLUE发布了中文大模型的8月榜单。该榜单分为五个部分:总排行榜、OPEN多轮开放问题排行榜、OPT三大能力客观题排行榜、十大基础能力排行榜和开源排行榜。
此次评测选取了16个在国内外具有代表性的通用大语言模型,并使用了包含3337道测试题的新评测数据集。
在8月榜单中,BAIchuan-13B凭借其STF迭代优化,第二版的表现非常出色,成功夺得国内大模型评测的第一名。

此外,各个榜单显示,BAIchuan-13B在知识问答和生成创作领域的表现也相当优异。同时,在开源榜单中,中文领域的BAIchuan-13B大幅领先于LlaMa2。