OpenAI 在 Hugging Face 上发布了多语言大规模多任务语言理解(MMMLU)数据集,旨在评估大型语言模型(LLMs)在各种任务中的性能,包括不同研究领域中的常识、推理、解决问题和理解能力。MMMLU 数据集是涵盖范围广、考验深层认知的多语言数据集,支持简体中文等多样语言,可以进行跨语言的综合评估,弥补了 NLP 研究中代表性不足的语言模型的评估问题。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验