OpenAI 员工公开指责 xAI：Grok 3 基准测试结果具有误导性

OpenAI 员工公开指责 xAI：Grok 3 基准测试结果具有误导性

2025 年 2 月 23 日

本周，OpenAI 员工指责 xAI 公司发布的 AI 模型 Grok 3 的基准测试结果具有误导性，因为 xAI 的图表未包含 OpenAI 模型 o3-mini-high 在「cons@64」条件下的得分，这可能导致误解。xAI 联合创始人伊戈尔・巴布什金反驳称 OpenAI 过去也有类似行为。AI 研究员内森・兰伯特指出，AI 基准测试在传达模型的局限性和优势方面存在不足，关键指标如计算成本仍未知。

马斯克 Grok 3 模型基准测试遭质疑，xAI 回应并无不当

ITBear 科技资讯

AI 基准战再起波澜：OpenAI 质疑 xAI Grok 3 测试结果真实性

ITBear 科技资讯

OpenAI 员工公开指责 Grok3 的基准测试结果具有误导性

格隆汇

展开全部报道

2026-03-21

xAI 派工程师上门服务，争夺 OpenAI 企业客户

2026-02-03

OpenAI 反击 xAI 诉讼：指其使用阅后即焚通讯工具，蓄意销毁案件证据

2025-11-30

马斯克旗下 xAI 起诉苹果与 OpenAI 寻求韩国方面证据

2025-10-04

OpenAI 强硬回击马斯克窃密诉讼，xAI 被指恶意「人肉」离职员工

2025-09-29

马斯克第六次起诉 OpenAI，指控窃取商业机密

2025-09-01

马斯克旗下 xAI 代码库遭窃，前核心员工跳槽 OpenAI 引诉讼

2025-08-28

OpenAI 与 Anthropic 进行首次合作测试，推动 AI 安全标准

2025-07-09

OpenAI 从特斯拉、xAI 和 Meta 挖走 4 名知名工程师

2025-02-23

OpenAI 员工公开指责 xAI：Grok 3 基准测试结果具有误导性

2025-02-19

OpenAI 推出 SWE-Lancer 基准测试

查看更多

专业版功能

登录

体验专业版特色功能，拓展更丰富、更全面的相关内容。