富岳超级计算机助力，日本团队推出 Fugaku-LLM 大模型

2024 年 5 月 11 日

日本一家产学研联合研究团队近日发布了一款名为 Fugaku-LLM 的大型语言模型。该模型全球最快 Arm 架构超级计算机「富岳」上训练而成，展现了日本在科技领域的创新实力。Fugaku-LLM 模型是日本国内最大的语言模型，拥有 130 亿参数，使用了富岳超算的 13824 个计算节点，在 3800 亿个 Token 上进行了深入训练。该模型尤其在日语表达方面表现出色，已在日语 MT-Bench 模型基准测试中取得优异成绩。目前，该模型已在 GitHub 和 Hugging Face 平台上公开发布，可供外部研究人员和工程师在遵守相关许可协议的前提下广泛应用。