在AI编程能力的全球竞技场上,中国科技企业正以惊人速度崛起。阿里巴巴最新发布的大语言模型Qwen 3.6-Plus,在国际权威评测平台Code Arena的React专项榜单中以1452分位列全球第二,仅落后于Anthropic的Claude-Opus-4.6-Thinking(1540分),却以4分优势超越OpenAI最新模型GPT-5.0-High(1448分),更以12分差距领先Google的Gemini 3.1 Pro Preview(1440分)。这一成绩标志着中国大模型在AI Coding领域首次实现与全球顶尖模型的正面交锋并占据优势。
Code Arena作为LMArena旗下专注AI编程能力的子榜单,采用真实用户盲测与实时对抗机制,被业界视为衡量模型工程化能力的"试金石"。其React专项榜单聚焦Web开发场景,要求模型独立完成从项目初始化到调试运行的全流程,考验的是完整的工程思维而非单一代码补全能力。这种严苛的评测标准,使得该榜单成为Agent时代衡量模型综合实力的关键指标。
Qwen 3.6-Plus于4月2日正式发布,凭借原生多模态理解与推理能力,在代码生成与Agent任务中展现出独特优势。测试数据显示,该模型在多项权威编程评测中,以远低于竞争对手的参数量(千问3.6系列参数规模显著小于GLM-5、Kimi-K2.5等模型),实现了更高效的性能表现。特别是在处理复杂Web开发任务时,其端到端开发能力得到充分验证,能够自主完成需求分析、架构设计、代码实现与错误修复等全链条工作。
这一突破性成果直接推动阿里巴巴在全球AI实验室排名中升至第四位,紧随Anthropic、OpenAI和Google之后。值得关注的是,Qwen 3.6-Plus在Code Arena总榜单中同样位居国产模型首位,其代码生成质量与工程化水平获得国际认可。开发者社区反馈显示,该模型在处理动态界面渲染、状态管理等React核心特性时,展现出接近人类工程师的编码逻辑与问题解决能力。
据阿里巴巴技术团队透露,Qwen 3.6-Plus作为千问3.6系列的首发模型,后续将开源不同参数规模的版本以满足多样化需求。更值得期待的是,性能更强的旗舰模型Qwen 3.6-Max已完成研发,预计将于近期正式发布。这一系列动作表明,中国科技企业正在通过持续创新,重塑全球AI竞争格局。















