谷歌 DeepMind 推出千亿级视觉语言数据集 WebLI-100B
2 月 14 日

谷歌 DeepMind 团队发布了 WebLI-100B 数据集,包含 1000 亿个图像-文本对,旨在提升 AI 视觉语言模型的文化多样性和多语言性。该数据集通过扩大数据范围,尤其是在低资源语言和多样文化表达方面,以改善模型在不同文化和语言环境下的表现,并减少子组间性能差异。研究表明,使用 WebLI-100B 数据集训练的模型在文化和多语言任务上的表现优于以往数据集,且在文化多样性任务和低资源语言检索方面显著改善。

专业版功能专业版功能
登录
体验专业版特色功能,拓展更丰富、更全面的相关内容。

行业标签

二维码

更多体验

前往小程序

二维码

24 小时

资讯推送

进群体验

logo
科技新闻,每天 3 分钟