日本一家产学研联合研究团队近日发布了一款名为 Fugaku-LLM 的大型语言模型。该模型全球最快 Arm 架构超级计算机「富岳」上训练而成,展现了日本在科技领域的创新实力。Fugaku-LLM 模型是日本国内最大的语言模型,拥有 130 亿参数,使用了富岳超算的 13824 个计算节点,在 3800 亿个 Token 上进行了深入训练。该模型尤其在日语表达方面表现出色,已在日语 MT-Bench 模型基准测试中取得优异成绩。目前,该模型已在 GitHub 和 Hugging Face 平台上公开发布,可供外部研究人员和工程师在遵守相关许可协议的前提下广泛应用。