本周,OpenAI 员工指责 xAI 公司发布的 AI 模型 Grok 3 的基准测试结果具有误导性,因为 xAI 的图表未包含 OpenAI 模型 o3-mini-high 在「cons@64」条件下的得分,这可能导致误解。xAI 联合创始人伊戈尔・巴布什金反驳称 OpenAI 过去也有类似行为。AI 研究员内森・兰伯特指出,AI 基准测试在传达模型的局限性和优势方面存在不足,关键指标如计算成本仍未知。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验