解决真实GitHub Issue能力登顶,字节豆包MarsCode团队分享背后工程实践,踩过的坑也分享了

AIGC动态2个月前发布 量子位
4 0 0

解决真实GitHub Issue能力登顶,字节豆包MarsCode团队分享背后工程实践,踩过的坑也分享了

AIGC动态欢迎阅读

原标题:解决真实GitHub Issue能力登顶,字节豆包MarsCode团队分享背后工程实践,踩过的坑也分享了
关键字:代码,豆包,行号,问题,图谱
文章来源:量子位
内容字数:0字

内容摘要:


豆包MarsCode团队 投稿量子位 | 公众号 QbitAI解决真实GitHub Issue的基准测试,字节家的豆包MarsCode Agent悄悄登顶了。
SWE-Bench,一个由普林斯顿大学提出的极具挑战性的Benchmark,近期受到工业界、学术界和创业团队的广泛关注。
在其子集SWE-Bench Lite排行榜上,豆包MarsCode Agent近期冲上第一。
虽然这是面向所有大模型解决方案的评测,但现在排名靠前的部分已基本被AI Agent。
AI Agent即能够感知外部环境、操作工具并具有一定自主决策能力的智能体,受到了越来越多的研究关注。
现在,豆包MarsCode Agent团队分享了在软件工程领域进行了一系列关于AI Agent应用的探索和尝试:
通过构建Agent框架并为其提供代码检索、调试和编辑的交互接口和工具,使得Agent有可能接管部分软件工程开发任务。
在Agent框架方面,豆包MarsCode开发了多Agent协作框架,根据所要解决软工问题类型,分配静态或动态求解管道,从而灵活适配多样的软件工程问题;
在代码检索能力方面,豆包MarsCode结合


原文链接:解决真实GitHub Issue能力登顶,字节豆包MarsCode团队分享背后工程实践,踩过的坑也分享了

联系作者

文章来源:量子位
作者微信:
作者简介:

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...