节目

豆包大模型团队正式开源首个多语言类SWE数据集

所属专辑: 网事头条｜听见新鲜事

主播:

DJ阿楠

最近更新: 12小时前时长: 00:24

扫码下载蜻蜓app

听书/听小说/听故事

4.5亿用户的选择

# 豆包大模型团队开源

# 多语言类SWE数据集发布

# MELT SWE Bench评测基准

# 大模型自动修复能力评测

# 主流编程语言bug修复

# 全站工程评测基准覆盖

豆包大模型团队于4月10日正式宣布开源首个多语言类SWE数据集MELT SWE Bench。该数据集基于SWE Bench开发，旨在为大模型自动修复bug的能力提供评估与优化支持，填补了多语言场景下的技术空白。
MELT SWE Bench的创新之处在于覆盖了Python之外的七种主流编程语言，突破了传统单语言评测的局限性。这一扩展使其成为首个真正适配全站工程实践的评测基准，可更全面地验证大模型在不同编程环境下的bug修复效能。
通过开源这一数据集，研究者和开发者能够更精准地评估大模型在自动修复bug任务中的表现，同时为跨语言场景下的工程实践提供标准化参考。此次发布进一步推动了AI技术在软件工程领域的应用深度与广度。

还没有评论哦

蜻蜓FM 倾听海量音频内容

蜻蜓FM网络收音机，囊括了国内外数千家网络广播，并与全国各大地方电台合作，将传统电台整合到网络电台中，为用户呈现前沿丰富的广播节目和电台内容，涵盖了有声小说、相声小品、新闻、音乐、脱口秀、历史、情感、财经、儿童、评书、健康、教育、文化、科技、电台等三十余个大分类。蜻蜓FM是多年来用户喜爱的音频应用，手机必装的应用！

快捷入口

郭德纲相声单田芳评书袁阔成评书刘兰芳评书白眉大侠评书河南戏豫剧选段

热门内容

苏北大鼓河北梆子甘薇周笔畅迪丽热巴杨紫宋茜 angelababy

关于蜻蜓联系我们公众平台开放平台加入我们隐私政策用户服务协议侵权投诉指引涉互联网算法推荐反馈算法备案信息公示

沪ICP备06026464号-4 沪ICP备06026464号-6 信息网络传播视听节目许可证: 0922681 icp经营许可证编号: 沪B2-20040650

网络出版服务许可证: （总）网出证（京）字第128号

出版物经营许可证: 新出发沪批字第U6911号公安备案号: 31011502009349

跟帖评论自律管理承诺书举报受理和处置管理办法

上海互联网举报中心

儿童色情信息举报专区

反电信网络诈骗防范劝阻电话：962110（如网民接到该电话，请立即接听)