新王Claude 3.5实测:阿里数学竞赛题不给选项直接做对

AIGC动态6个月前发布 量子位
8 0 0

新王Claude 3.5实测:阿里数学竞赛题不给选项直接做对

AIGC动态欢迎阅读

原标题:新王Claude 3.5实测:阿里数学竞赛题不给选项直接做对
关键字:网友,模型,大杯,系列,量子
文章来源:量子位
内容字数:0字

内容摘要:


衡宇 一水 发自 凹非寺量子位 | 公众号 QbitAI新鲜出炉的Claude 3.5 Sonnet,更快、更便宜,还是全球最强。
在多个关键指标中,GPT-4o几乎被吊打!
网友对Claude 3.5 Sonnet和GPT-4o的横向实测似乎也印证了官方出炉的数据。
任务是同一个:一句话,让它们帮忙复制网站的UI。
测试者本人表示,GPT-4o这边,给了代码,但没有附加任何细节。
但Claude 3.5 Sonnet刷刷刷就出色完成了任务,甚至给了与这个网站设计相匹配的细节。
训练数据知识截止日期也更新到了2024年4月,网友实测知道今年2月的橄榄球超级碗比赛结果。
不过,这样的大模型新王,谁能忍住不第一时间试玩一波?反正好多网友坐不住了。不到12小时过去,全网对Claude 3.5 Sonnet的测评铺天盖地。
玩法也越来越刁钻,甚至有人用它重现1995年《黑客》中3D数据流的模型。
玩儿得太上头,又怕很快达到Claude的消息容量,只能紧张地继续玩。
Okk,好吧,所以网友的“百般刁难”下,Claude 3.5 Sonnet真的如Anthropic官方说得那么强吗?
目前最受认可


原文链接:新王Claude 3.5实测:阿里数学竞赛题不给选项直接做对

联系作者

文章来源:量子位
作者微信:QbitAI
作者简介:追踪人工智能新趋势,关注科技行业新突破

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...