英伟达推出开源 AI 框架 Polar,Codex 性能提升近 600%
上周四
英伟达发布开源 AI 框架 Polar,帮助 Codex 等智能体框架接入广义相对策略优化(GRPO)训练方法,不影响原有工具调用、上下文组织和补丁提交方式。GRPO 通过奖励信号调整模型策略,提升代码智能体在多步决策任务中的表现。Polar 在模型 API 边界放置智能体,保持原有运行逻辑,具备任务提交、会话调度和状态持久化等功能,优化训练流程。实验显示,使用 Polar 与 GRPO 训练的智能体在 SWE-Bench Verified 测试中性能大幅提升,Codex 的 pass@1 分数从 3.8% 提升至 26.4%,训练时间减少约 5.39 倍,GPU 平均利用率显著提升。
体验专业版特色功能,拓展更丰富、更全面的相关内容。