英伟达与 MIT 合作推出 Fast-dLLM 框架，AI 推理速度提升 27.6 倍

英伟达与 MIT 合作推出 Fast-dLLM 框架，AI 推理速度提升 27.6 倍

上周二

英伟达联合 MIT 与香港大学发布 Fast-dLLM 框架，大幅提升扩散模型推理速度最高至 27.6 倍。该框架通过块状近似 KV 缓存机制和置信度感知并行解码策略，解决计算冗余和依赖冲突问题，在多个基准测试中实现显著加速，同时保持生成质量接近基线水平，为扩散模型的实际应用提供了强大支持。

英伟达联合 MIT 与港大发布 Fast-dLLM 框架，扩散模型推理速度最高提升 27.6 倍

牛透社

英伟达与 MIT 合作推出 Fast-dLLM 框架，AI 推理速度提升 27.6 倍

aibase

英伟达与 MIT、香港大学联手推出 Fast-dLLM 框架，推理速度提升惊人

aibase

展开全部报道

话题追踪

2025-06-03

英伟达与 MIT 合作推出 Fast-dLLM 框架，AI 推理速度提升 27.6 倍

2025-05-20

戴尔与英伟达合作，发布全新企业 AI 解决方案，推出新一代 PowerEdge 服务器

2025-05-19

黄仁勋：英伟达正在将其 AI 模型应用于自动驾驶汽车

2025-04-27

Meta、英伟达和惠普合作推出 Space Llama 人工智能项目

2025-03-19

英伟达、谷歌与迪士尼合作研发的机器人 Blue 亮相

2025-03-19

英伟达与谷歌、迪士尼合作开发 Newton 物理引擎

2024-08-23

英伟达发布 80 亿参数新 AI 模型，可在 RTX 工作站上部署

2024-07-19

Mistral 发布全新小模型 MIstral NeMo，与英伟达合作研发

2024-07-19

英伟达与 Mistral AI 联合发布企业级 AI 模型 Mistral-NeMo AI

2024-06-02

英伟达推出 AI 模型推理微服务 NVIDIA NIM

查看更多

专业版功能

登录

体验专业版特色功能，拓展更丰富、更全面的相关内容。

行业标签

订阅

订阅

订阅

订阅

订阅

二维码

更多体验

前往小程序

二维码

24 小时

资讯推送

进群体验

© 2025 NoCode 无码科技（杭州）有限公司浙ICP备17005035号-6 联系我们加入我们产品介绍

浙公网安备 33010902002965 号浙 B2-20181004

科技新闻，每天 3 分钟