美团发布原生多模态大模型 LongCat-Next

美团发布原生多模态大模型 LongCat-Next

上周五

美团发布并全面开源原生多模态大模型 LongCat-Next 及其核心组件离散原生分辨率视觉分词器（dNaViT）。该模型打破「语言为中心」的传统拼凑式架构，将图像、语音与文本统一映射为同源离散 Token，以「下一个 Token 预测」范式让视觉与语音成为 AI「原生母语」，还实现三项关键技术突破，包括离散原生自回归架构打破模态隔阂、离散原生分辨率视觉分词器构造视觉「词典」、语义对齐完备编码器破解信息损失难题。

美团发布开源原生多模态大模型 LongCat-Next，让视觉和语音成为 AI 的母语

IT 之家

美团发布原生多模态大模型 LongCat-Next

新浪科技

美团发布原生多模态模型 LongCat-Next，统一物理世界信息表达

品玩

展开全部报道

2026-03-27

美团发布原生多模态大模型 LongCat-Next

2025-12-18

美团 LongCat-Video-Avatar 发布，实现开源 SOTA 级拟真表现

2025-12-08

美团宣布开源 LongCat-Image 图像生成模型

2025-11-04

美团发布 LongCat-Flash-Omni：总参数达 5600 亿开源最先进水平

2025-11-03

美团正式发布并开源 LongCat-Flash-Omni

2025-09-22

美团发布高效推理模型

2025-09-01

美团推出开源大模型 LongCat: 旨在赋能开发者，加速 AI 应用落地

专业版功能

登录

体验专业版特色功能，拓展更丰富、更全面的相关内容。