谷歌研究院推出了名为 Lumiere 的「文生视频」扩散模型,使用了自家的「Space-Time U-Net」基础架构,能够一次性生成「完整、真实、动作连贯」的视频。相对于业界模型,Lumiere 在生成持续时间更长、动作更连贯的视频方面有优势。该 AI 模型基于预训练的「文生图」模型,通过空间超分辨率模型和「Multidiffusion」通用生成框架提升分帧分辨率和模型稳定性,保证了视频的一致性和连续性。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验