热门话题
每日早报
排行榜
AI
科技动态
财经快讯
医疗产业
汽车
专业版

© 2026 NoCode 无码科技（杭州）有限公司浙ICP备17005035号-6 联系我们加入我们产品介绍 MCP 接入

浙公网安备 33010902002965 号浙 B2-20181004

科技新闻，每天 3 分钟

OpenAI 推出代码生成评估基准

OpenAI 推出代码生成评估基准

2024 年 8 月 14 日

OpenAI 推出了一个用于评估 AI 模型解决现实世界软件问题的基准 ——SWE-bench Verified，这是对原有 SWE-bench 的改进版本。这个基准旨在更可靠地评估 AI 模型解决真实软件问题的能力，随着 AI 系统越来越接近通用人工智能（AGI），对于评估它们的能力的要求也越来越高。

OpenAI 推出 SWE-bench Verified：现有框架低估模型软件工程能力

华尔街见闻

OpenAI 推出代码生成评估基准

第一财经

OpenAI 推出 SWE-bench Verified

36Kr

话题追踪

2026-07-09

奥尔特曼：OpenAI 全新大模型智能自主编码的 Token 效率提升 54%

2026-06-30

OpenAI 研发出新方案，可将推理成本减半

2026-06-24

OpenAI 和博通发布 AI 芯片，旨在更快、更经济地运行模型

2026-05-21

OpenAI 宣布攻克 80 年数学难题 AI 首次自主证明 Erdős 开放问题

2026-05-12

OpenAI 推出 Daybreak 项目：重塑软件安全开发流程

2026-03-25

OpenAI 完成新款 AI 模型的初步开发

2026-03-04

OpenAI 据悉正在开发 GitHub 的替代产品，或与微软展开正面竞争

2026-01-20

OpenAI 与 ServiceNow 达成协议，将 AI 模型集成进业务软件

2026-01-04

OpenAI 加速音频模型升级，为首款硬件设备铺路

2026-01-01

OpenAI 加码音频人工智能研发，备战首款硬件设备

查看更多

专业版功能

登录

体验专业版特色功能，拓展更丰富、更全面的相关内容。

行业标签

订阅

订阅

订阅

二维码

24 小时

资讯推送

进群体验