编码碾压ChatGPT!UIUC清华联手发布7B参数Magicoder,代码数据权重全开源

AIGC动态1年前 (2023)发布 新智元
9 0 0

编码碾压ChatGPT!UIUC清华联手发布7B参数Magicoder,代码数据权重全开源

AIGC动态欢迎阅读

原标题:编码碾压ChatGPT!UIUC清华联手发布7B参数Magicoder,代码数据权重全开源
关键字:代码,数据,模型,片段,指令
文章来源:新智元
内容字数:5322字

内容摘要:


新智元报道编辑:Mindy
【新智元导读】全新代码大模型Magicoder,不到7B参数,就能在代码生成领域与顶级代码模型不相上下。开源「代码大模型」来了!
UIUC清华团队的研究人员发布了Magicoder,不到7B参数,就能在代码生成领域与顶级代码模型不相上下。
值得一提的是,Magicoder的代码、权重和数据,毫无保留完全开源。
论文地址:https://arxiv.org/abs/2312.02120
Magicoder依靠的OSS-INSTRUCT的方法,是通过对现有顶级代码模型(例如ChatGPT)的提示,加上网络上的种子代码片段,来生成的代码。
这可真是取之于大模型,用之于大模型;就有网友转发说道:通过这些结果,看到了提高用于LLMs的合成数据的潜力也是一个非常有趣的领域。
话不多说,那就让我们来具体了解一下Magicoder的来历吧!
代码生成的发展史代码生成(Code Generation),也叫程序合成(Program Synthesis),近几十年来,一直都是学术界的一块「硬骨头」,在此领域进行过的许多尝试,例如基于抽象的合成和基于示例的编程,都没有取得很好的


原文链接:编码碾压ChatGPT!UIUC清华联手发布7B参数Magicoder,代码数据权重全开源

联系作者

文章来源:新智元
作者微信:AI_era
作者简介:智能+中国主平台,致力于推动中国从互联网+迈向智能+新纪元。重点关注人工智能、机器人等前沿领域发展,关注人机融合、人工智能和机器人对人类社会与文明进化的影响,领航中国新智能时代。

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...