字节跳动豆包大模型团队开源了首个多语言类 SWE 数据集 Multi-SWE-bench,可评估和提升大模型的「自动修 Bug」能力,覆盖 8 种主流编程语言,数据源自 GitHub issue,历时近一年构建,旨在提高大模型的高阶编程智能水平。
行业标签
更多体验
前往小程序
24 小时
资讯推送
进群体验