字节跳动豆包大模型团队正式开源首个多语言类SWE数据集

AI快讯网4月10日消息,字节跳动豆包大模型团队正式开源首个多语言类SWE数据集——Multi-SWE-bench,可用于评估和提升大模型“自动修 Bug”能力。在SWE-bench基础上,Multi-SWE-bench首次覆盖Python之外的7种主流编程语言,是真正面向“全栈工程”的评测基准。其数据均来自GitHub issue,历时近一年构建,以尽可能准确测评和提高大模型高阶编程智能水平。

上一篇:

下一篇:

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

欢迎来到AI快讯网,开启AI资讯新时代!