OpenAI 员工公开指责 xAI:Grok 3 基准测试结果具有误导性
2 月 23 日

本周,OpenAI 员工指责 xAI 公司发布的 AI 模型 Grok 3 的基准测试结果具有误导性,因为 xAI 的图表未包含 OpenAI 模型 o3-mini-high 在「cons@64」条件下的得分,这可能导致误解。xAI 联合创始人伊戈尔・巴布什金反驳称 OpenAI 过去也有类似行为。AI 研究员内森・兰伯特指出,AI 基准测试在传达模型的局限性和优势方面存在不足,关键指标如计算成本仍未知。

专业版功能专业版功能
登录
体验专业版特色功能,拓展更丰富、更全面的相关内容。
二维码

更多体验

前往小程序

二维码

24 小时

资讯推送

进群体验

logo
科技新闻,每天 3 分钟