OpenAI 发布 MMMLU 数据集:更广、更深评估 AI 模型,支持简体中文
2024 年 9 月 24 日

OpenAI 在 Hugging Face 上发布了多语言大规模多任务语言理解(MMMLU)数据集,旨在评估大型语言模型(LLMs)在各种任务中的性能,包括不同研究领域中的常识、推理、解决问题和理解能力。MMMLU 数据集是涵盖范围广、考验深层认知的多语言数据集,支持简体中文等多样语言,可以进行跨语言的综合评估,弥补了 NLP 研究中代表性不足的语言模型的评估问题。

专业版功能专业版功能
登录
体验专业版特色功能,拓展更丰富、更全面的相关内容。

行业标签

二维码

更多体验

前往小程序

二维码

24 小时

资讯推送

进群体验

logo
科技新闻,每天 3 分钟