评测机构ClawBench近日公布了最新一期全球大型模型排行榜,北京三家人工智能企业的四款模型成功跻身全球前十,展现出中国AI领域的技术实力。其中,智谱科技研发的GLM-5-Turbo以93.9分的成绩登顶榜首,字节跳动旗下的豆包模型Doubao-Seed-2.0-lite紧随其后位列第二,同时凭借最低的使用成本成为全榜单中最具性价比的选择。
小米公司在此次榜单中表现尤为亮眼,其MiMo-V2系列两款模型同时上榜。MiMo-V2-Omni以第九名的成绩入选,在运行速度测试中展现出显著优势;另一款升级版MiMo-V2-Pro虽未进入前十,但在复杂逻辑推理、长指令执行和多轮对话稳定性等专项测试中表现突出,在Model Rank专业排名中位居全球第五。据小米技术团队透露,该模型通过优化注意力机制和知识蒸馏技术,显著提升了长文本处理能力。
在反映企业综合研发实力的LabRank实验室评价体系中,小米同样取得突破性进展。其Text Arena(ArenaExpert)项目位列全球第四,代码生成专项Code Arena排名第五,综合技术实力已跻身国际第一梯队,与Anthropic、OpenAI、谷歌等头部企业形成直接竞争。该评价体系通过模拟真实开发环境,对模型在代码生成、数学推理、多语言处理等20余个维度进行综合评估。
ClawBench榜单的权威性源于其独特的评测机制。关联的Text Arena榜单采用双盲测试模式,所有参与评测的模型均隐藏身份信息,由全球超过5万名真实用户根据回答质量直接投票。这种设计有效避免了针对特定数据集的优化行为,确保评测结果更贴近实际应用场景。据机构负责人介绍,本轮评测共收集有效投票样本超200万份,覆盖金融、医疗、教育等12个专业领域。











