在AI编程能力的全球竞技场上,中国科技企业再次取得突破性进展。阿里巴巴最新发布的大语言模型Qwen 3.6-Plus在权威评测平台LMArena旗下Code Arena榜单中斩获全球第二,成为首个在该榜单登顶的中国大模型。这一成绩不仅超越了OpenAI、Google等国际科技巨头,更标志着中国在AI工程化领域的技术实力迈入世界第一梯队。
作为AI领域最具公信力的盲测平台,LMArena通过真实用户参与、实时对抗的评测机制,构建起全球大模型性能的"试金石"。其子榜单React专项评测聚焦AI在复杂Web开发场景中的自主编码能力,要求模型独立完成从项目初始化到调试运行的全流程,堪称当前AI Coding领域最具挑战性的技术赛道。Qwen 3.6-Plus以1452分的成绩紧追Anthropic的Claude-Opus-4.6-Thinking(1540分),同时以4分优势力压OpenAI最新发布的GPT-5.0-High,展现出与全球顶尖模型同台竞技的硬实力。
这款于4月2日正式发布的新模型,凭借原生多模态理解与推理能力,在代码生成和Agent技术领域形成独特优势。评测数据显示,Qwen 3.6-Plus在参数规模仅为GLM-5、Kimi-K2.5等竞品三分之一的情况下,通过算法优化实现了性能反超。其端到端开发能力尤其突出,能够自主完成需求分析、架构设计、代码实现和错误修复等完整开发周期,这种工程化思维正是当前AI应用落地的关键瓶颈。
在Code Arena综合榜单中,Qwen 3.6-Plus同样领跑国产模型阵营。凭借此次突破,阿里巴巴在全球AI实验室排名中跃升至第四位,形成与Anthropic、OpenAI、Google三强鼎立的新格局。值得关注的是,该模型发布首日即在开发者社区引发强烈反响,次日即登顶React榜单,这种技术转化效率印证了中国AI研发从实验室到产业应用的高效路径。
据研发团队透露,Qwen 3.6-Plus作为千问3.6系列的首发模型,后续将开源不同参数规模的版本以满足多样化需求。性能更强的旗舰模型Qwen3.6-Max也已进入最终测试阶段,预计将在近期发布。这一系列布局显示,中国科技企业正在通过持续的技术迭代,构建覆盖基础研究到场景落地的完整AI生态体系。











