英伟达开源框架Polar：助力代码智能体训练，SWE-Bench分数显著提升-AI前沿-数据世界

英伟达研究团队近日推出开源框架Polar，为代码智能体训练开辟新路径。该框架允许Codex、Claude Code、Qwen Code等现有智能体框架在不改变原有工具调用方式的前提下，接入GRPO（广义相对策略优化）训练体系，有效解决了传统强化学习环境适配难题。

GRPO作为面向强化学习的优化方法，通过奖励信号动态调整模型策略，使智能体在多步决策任务中逐步优化行为模式。在代码生成领域，该技术可帮助模型在真实工具调用和代码补丁提交过程中持续改进，特别适用于代码仓库修改、浏览器自动化操作等复杂长流程任务。这类任务通常依赖现成执行框架，涉及多轮工具调用、上下文管理和子智能体协作，传统方法难以直接适配强化学习环境接口。

Polar框架的创新之处在于其非侵入式设计。研究团队选择在模型API边界部署智能体，而非重构现有执行框架。这种设计避免了将智能体运行外壳（如Codex CLI、Claude Code等）改写为标准环境接口（env.init/env.step/env.reset）的高成本操作，同时完整保留了原生执行细节。实验数据显示，基于Qwen3.5-4B模型的测试中，四种代码执行框架在接入Polar后，SWE-Bench Verified的pass@1指标均获得显著提升：Codex从3.8%跃升至26.4%，Claude Code从29.8%增至34.6%，Qwen Code从34.6%提升至35.2%，Pi框架则从34.2%增长到40.4%。

系统架构方面，Polar采用双组件设计：rollout server负责任务调度、状态管理和回调处理，gateway node则管理执行全生命周期，包括运行时初始化、框架准备、轨迹构建和资源回收。通过将初始化、运行和后处理流程拆分为独立工作池，并引入READY缓冲区机制，系统实现了运行时预热与评测预热的并行执行，有效减少了长尾任务对GPU训练的阻塞。在效率优化实验中，prefix_merging技术使三个训练步骤的更新次数从1185次降至218次，墙钟时间缩短至35.2分钟（原189.5分钟），rollout GPU利用率从20.4%提升至87.7%。

该框架兼容Anthropic、OpenAI和Google风格的API请求，在请求转发过程中自动记录提示词、采样Token、对数概率和响应内容，并将这些数据重构为训练器可用的轨迹格式。这种设计既保持了与现有智能体框架的兼容性，又为强化学习训练提供了完整的数据流支持，为代码生成领域的大规模模型优化提供了新的技术范式。

奔赴热爱，2026华为云创想者大会，微赞直播将重点参与主题演讲、AI直播创新展区的大会环节，与行业共同探讨企业私域直播AI营销成果。微赞直播期待在本次华为云INSPIRE创想者大会上，与更多伙伴一起携手，共…

5月29日，，现场画面：此前报道：雷军称小米YU7GT定位是适合长途旅行的高性能SUV，参数：1003PS最大马力，300km/h最高时速，705km CLTC续航。 5月18日，小米汽车发文官宣：小米…

我们拿到的版本是初夏绿，但也十分惊艳。vivoS60元气版采用旗舰同款的一体浮光冷雕玻璃工艺，经过33道工序切割打磨，将一整块玻璃进行物理雕刻，塑造出一体无缝的立体玻璃造型。阳光穿过林间，清风带来初夏的…

IT之家 5 月 29 日消息，科技媒体 Appleinsider 昨日（5 月 28 日）发布博文，报道称下周在丹佛举行的 2026 IEEE/ CVF 计算机视觉与模式识别会议（CVPR）上，苹果公司计…

月 29 日消息，AI 编程智能体 IDE 工具 Kilo Code 今天在 X 平台发布系列图文，分享了 Grok Build 0.1实战开发报告，称构建交付服务过程零工具调用失败，且成本低于 GPT-5…

作为银行系险企中体量最大的“千亿保费俱乐部”成员，中邮人寿正站在一个微妙的十字路口：保费规模断层式领跑，却陷入“增收不增利”的困局；渠道优势不可撼动，却面临偿付能力持续承压、投资回报远逊同业的多重挑战。其前…

针对当下行业内多模态 AI 视频理解的共性技术难题，这款模型在长视频时序分析、内容逻辑推理等维度完成多项升级优化，改善了传统 AI 模型解析视频内容的各类短板，也为国内多媒体人工智能的产业落地，提供了全新的技…

派克SCPSDI-250-04-27压力传感器是集成监测、反馈与控制于一体的智能化工业传感元件，凭借优异的环境适配性与信号稳定性，可适配各类复杂工业工况，为流体控制系统提供精准、实时的压力数据支撑，助力设备实…

小米 V8s EVO 超级电机还搭载自研碳化硅功率模块，全电压范围都可以输出 800A 有效电流，电控峰值功率密度达到120kW/L，功率提升了 5.9%。 IT之家注意到，小米 YU7 GT 还采用双电…