上海人工智能实验室发布了首个大模型高考全卷评测结果,其中 Qwen2-72B、GPT-4o 和书生・浦语 2.0 文曲星(InternLM2-20B-WQX)得分率超过 70%,成为前三甲。评测显示,这些模型在语文和英语科目上表现良好,但在数学方面还有提升空间。InternLM2-20B-WQX 在数学单科上取得了最高分。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验