中文大模型基准测评 SuperCLUE 发布 2026 年 3 月最新结果,22 款国内外主流模型参与。海外闭源模型总分排名靠前,Anthropic、Google、OpenAI 的模型分列前三。字节跳动豆包以 71.53 分获国内第一,跻身全球第一梯队,总分仅与 GPT-5.4 相差 0.95 分,在智能体任务规划维度跻身全球前五。小米两款模型上榜,MiMo-V2-Pro 位列闭源模型前列,MiMo-V2-Flash 在代码生成等场景有潜力。国产模型整体表现亮眼,开源赛道突出,国产开源模型包揽开源榜前三。