最强AI程序员砸饭碗:84秒跑通代码,像人一样思考!团队仅5人

AIGC动态3个月前发布 量子位
4 0 0

最强AI程序员砸饭碗:84秒跑通代码,像人一样思考!团队仅5人

AIGC动态欢迎阅读

原标题:最强AI程序员砸饭碗:84秒跑通代码,像人一样思考!团队仅5人
关键字:数据,模型,团队,过程,人类
文章来源:量子位
内容字数:0字

内容摘要:


金磊 西风 发自 凹非寺量子位 | 公众号 QbitAI继Devin之后,又一个AI软件工程师被刷屏了——
它叫Genie,号称目前地表最强,已经可以像人一样思考和行动了!
那么这个“地表最强”,到底强到什么程度?
先来看下评测分数。
在权威榜单SWE-Bench中,Genie以解决了30.07%问题的成绩夺得榜首。
(SWE-Bench是一个用来评估大模型解决现实中软件问题的基准。)
而这个成绩可谓是遥遥领先第二名19.27%,解锁了提升SOTA的最大增幅——57%!
至于Genie的实际效果,用团队的话来说就是:
它可以做到像人类工程师一样解决现实生活中的软件问题。
首先,你可以用4种方式让Genie开始工作,分别是提示词、GitHub Issue、Linear Ticket或者API。
以解决GitHub Issue为例,先喂给Genie一个repo的链接,它就开始自动解析问题了:
Genie会自动迭代思考如果想要解决这个问题它都需要哪些文件,直到它觉得找到了自己满意的为止:
紧接着,它将对问题做一个自动迭代分析的过程:
然后Genie就开始“唰唰唰”地自动写+跑代码了:


原文链接:最强AI程序员砸饭碗:84秒跑通代码,像人一样思考!团队仅5人

联系作者

文章来源:量子位
作者微信:
作者简介:

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...