字节扣子搭建大模型擂台:匿名PK效果,用户当裁判,跑分时代要结束了

AIGC动态3个月前发布 量子位
5 0 0

字节扣子搭建大模型擂台:匿名PK效果,用户当裁判,跑分时代要结束了

AIGC动态欢迎阅读

原标题:字节扣子搭建大模型擂台:匿名PK效果,用户当裁判,跑分时代要结束了
关键字:字节跳动,模型,扣子,两个,模式
文章来源:量子位
内容字数:0字

内容摘要:


金磊 发自 凹非寺量子位 | 公众号 QbitAI字节跳动的扣子(coze.cn),给国产大模型们组了个大局——
在同一个“擂台”上,两个大模型为一组,直接以匿名的方式PK效果!
例如我们对两位参赛“选手”同时提问今年高考的题目:
阅读下面的材料,根据要求写作。(60分)
随着互联网的普及、人工智能的应用,越来越多的问题能很快得到答案。那么,我们的问题是否会越来越少?
以上材料引发了你怎样的联想和思考?请写一篇文章。
要求:选准角度,确定立意,明确文体,自拟标题;不要套作,不得抄袭;不得泄露个人信息;不少于800字。
点击问题的一瞬间,两位“选手”便立刻开始作答:
不难看出,两个大模型不论是在生成答案的速度,或是内容的侧重上均有所不同。
直到有一方作答完毕,这时候我们就可以开始投票了,一共有四个选项可选:
A表现更好
两个都好
两个都差
B表现更好
在这个case中,因为生成速度相似,我们姑且以个人文字审美为标准,先将票投给大模型A。
投票结束后,两位“选手”的庐山真面目也就揭晓了,分别是通义千问(A)和智谱(B)。
这便是字节跳动的AI应用开发平台扣子上新的玩法——模型广场。
这种打


原文链接:字节扣子搭建大模型擂台:匿名PK效果,用户当裁判,跑分时代要结束了

联系作者

文章来源:量子位
作者微信:QbitAI
作者简介:追踪人工智能新趋势,关注科技行业新突破

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...