豆包大模型团队开源基准测试集 SuperGPQA
3 月 4 日

豆包大模型团队发布了 SuperGPQA,这是一个覆盖 285 个研究生级学科、包含 26529 道专业问题的全面知识推理基准测试集。它不仅包括主流学科,还涵盖了轻工业、农业、服务科学等长尾学科,填补了长尾知识评估领域的空白。

专业版功能专业版功能
登录
体验专业版特色功能,拓展更丰富、更全面的相关内容。

行业标签

二维码

更多体验

前往小程序

二维码

24 小时

资讯推送

进群体验

logo
科技新闻,每天 3 分钟