谷歌 DeepMind 团队发布了 WebLI-100B 数据集,包含 1000 亿个图像-文本对,旨在提升 AI 视觉语言模型的文化多样性和多语言性。该数据集通过扩大数据范围,尤其是在低资源语言和多样文化表达方面,以改善模型在不同文化和语言环境下的表现,并减少子组间性能差异。研究表明,使用 WebLI-100B 数据集训练的模型在文化和多语言任务上的表现优于以往数据集,且在文化多样性任务和低资源语言检索方面显著改善。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验