ClawBench大模型榜单揭晓:智谱字节小米四款模型强势闯入全球前十

   时间:2026-04-01 03:52 来源:快讯作者:苏婉清

全球知名评测机构ClawBench最新发布的大型模型榜单引发行业关注,北京三家人工智能企业的四款模型成功跻身全球前十,展现了中国AI技术的强劲实力。其中智谱科技研发的GLM-5-Turbo以93.9分的绝对优势登顶榜首,字节跳动旗下的豆包模型Doubao-Seed-2.0-lite紧随其后位列第二,同时凭借最低的使用成本成为最具性价比的模型。

小米科技成为本次榜单的最大黑马,其自主研发的MiMo-V2系列两款模型同时入围前十。MiMo-V2-Omni凭借卓越的运行速度斩获第九名,而功能更强大的MiMo-V2-Pro在复杂逻辑推理、长指令遵循等核心维度表现突出,在Model Rank专业排名中位居全球第五。该机构数据显示,小米在实验室综合研发能力评估中同样表现亮眼,在Text Arena(ArenaExpert)和Code Arena两大权威榜单中分别位列全球第四和第五,综合研发实力仅次于Anthropic、OpenAI和谷歌三家国际顶尖机构。

ClawBench采用的评测机制具有显著创新性,其关联的Text Arena榜单通过双盲测试模式,在完全隐藏模型身份的前提下,由全球真实用户根据实际使用体验进行投票评选。这种评测方式有效规避了传统榜单中针对特定数据集进行优化的"刷榜"行为,确保评测结果能够真实反映模型在真实场景中的表现,为行业提供了更具参考价值的评估标准。

 
 
更多>同类内容
全站最新
热门内容