字节跳动豆包大模型团队正式开源首个多语言类SWE数据集

AI快讯网4月10日消息，字节跳动豆包大模型团队正式开源首个多语言类SWE数据集——Multi-SWE-bench，可用于评估和提升大模型“自动修 Bug”能力。在SWE-bench基础上，Multi-SWE-bench首次覆盖Python之外的7种主流编程语言，是真正面向“全栈工程”的评测基准。其数据均来自GitHub issue，历时近一年构建，以尽可能准确测评和提高大模型高阶编程智能水平。