OpenAI 发布 MMMLU 数据集：更广、更深评估 AI 模型，支持简体中文

OpenAI 发布 MMMLU 数据集：更广、更深评估 AI 模型，支持简体中文

2024 年 9 月 24 日

OpenAI 在 Hugging Face 上发布了多语言大规模多任务语言理解（MMMLU）数据集，旨在评估大型语言模型（LLMs）在各种任务中的性能，包括不同研究领域中的常识、推理、解决问题和理解能力。MMMLU 数据集是涵盖范围广、考验深层认知的多语言数据集，支持简体中文等多样语言，可以进行跨语言的综合评估，弥补了 NLP 研究中代表性不足的语言模型的评估问题。

OpenAI 发布 MMMLU 数据集：更广、更深评估 AI 模型，支持简体中文

IT 之家

OpenAI 新数据集 MMMLU 发布：覆盖更广更深，AI 模型怎么测？

ITBear 科技资讯

OpenAI 发布 MMMLU 数据集：更广、更深评估 AI 模型，支持简体中文

C114 通信网

2025-12-02

OpenAI 正开发大语言模型 Garlic

2025-11-21

OpenAI 正式全球上线 ChatGPT 群聊功能

2025-11-10

OpenAI 发布 GPT‑5 Codex Mini 模型：更高效、更低成本

2025-08-08

OpenAI 发布 GPT-5

2025-07-10

OpenAI 开放语言模型即将问世，或将加剧与微软裂痕

2025-04-15

OpenAI 发布 GPT-4.1 系列模型：超越 4o，支持百万 token 上下文，且价格更低

2025-02-28

OpenAI 正式发布 GPT-4.5 模型：情商更高，比 DeepSeek 贵 1000 倍

2025-02-03

OpenAI 发布 Deep Research，称可以输出分析师级别研报

2024-10-31

OpenAI 宣布开源 SimpleQA 新基准，专治大模型「胡言乱语」

2024-10-12

OpenAI 推出 meta-prompt 功能，改进用户提示词

查看更多

专业版功能

登录

体验专业版特色功能，拓展更丰富、更全面的相关内容。