豆包大模型团队发布了 SuperGPQA,这是一个覆盖 285 个研究生级学科、包含 26529 道专业问题的全面知识推理基准测试集。它不仅包括主流学科,还涵盖了轻工业、农业、服务科学等长尾学科,填补了长尾知识评估领域的空白。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验