Meta 开源「记忆层」,重塑 Transformer 架构大模型
1 月 3 日

Meta 推出「记忆层」研究,提出高效查询机制 Product-Key Lookup,通过分解键集合提高大模型参数查询效率,减少算力和时间消耗。此外,并行记忆层和共享记忆参数优化了硬件使用和参数效率,动态调整策略增强了系统灵活性。

专业版功能专业版功能
登录
体验专业版特色功能,拓展更丰富、更全面的相关内容。

行业标签

二维码

更多体验

前往小程序

二维码

24 小时

资讯推送

进群体验

logo
科技新闻,每天 3 分钟