英伟达推出开源 AI 框架 Polar，Codex 性能提升近 600%

上周四

英伟达发布开源 AI 框架 Polar，帮助 Codex 等智能体框架接入广义相对策略优化（GRPO）训练方法，不影响原有工具调用、上下文组织和补丁提交方式。GRPO 通过奖励信号调整模型策略，提升代码智能体在多步决策任务中的表现。Polar 在模型 API 边界放置智能体，保持原有运行逻辑，具备任务提交、会话调度和状态持久化等功能，优化训练流程。实验显示，使用 Polar 与 GRPO 训练的智能体在 SWE-Bench Verified 测试中性能大幅提升，Codex 的 pass@1 分数从 3.8% 提升至 26.4%，训练时间减少约 5.39 倍，GPU 平均利用率显著提升。

英伟达开源 Polar 框架：让 AI 编码智能体实现强化学习「零门槛」进化

aibase

aibase

英伟达推出 AI 框架 Polar，让 Codex 跑分暴涨 594.74%

IT 之家

专业版功能

体验专业版特色功能，拓展更丰富、更全面的相关内容。