国产大模型之光!伯克利最新基准发布,智谱AI打赢GPT-4和Llama 3

AIGC动态7个月前发布 智东西
7 0 0

国产大模型之光!伯克利最新基准发布,智谱AI打赢GPT-4和Llama 3

AIGC动态欢迎阅读

原标题:国产大模型之光!伯克利最新基准发布,智谱AI打赢GPT-4和Llama 3
关键字:模型,报告,腾讯,小米,解读
文章来源:智东西
内容字数:8764字

内容摘要:


让Llama 3祛魅的新基准,“中国OpenAI”交卷了。
作者|香草
编辑|漠影
近日,Meta开源Llama 3系列模型,引发开源社区沸腾。
同时也有唱衰国产大模型的声音出现,认为Llama 3的开源“又”将为国产大模型带来“新突破”。但事实果真如此吗?
智东西4月30日报道,上周,来自UC伯克利等机构的团队LMSYS开源了大模型基准测试Arena-Hard,以高度的人类偏好一致性、可分性为优势,同时测试数据集更新频率高,具备优秀的开放性、动态性、科学性和权威性。
根据该基准测试,国产大模型ChatGLM3、GLM-4排名仅次于GPT-4 Turbo和Claude 3 Opus,在国内外模型中均处于领先地位。
同样在上周发布的还有《SuperBench大模型综合能力评测报告》,由清华大学基础模型研究中心联合中关村实验室研制。在语义、代码、对齐、智能体和安全五个榜单中,GLM-4有3项排名国内第一,其中语义理解能力更是仅次于Claude 3位列全球第二。
GLM系列模型是智谱AI自研的基座大模型,其中GLM-4是其在今年1月推出的最新一代,具备多模态、长文本、智能体等能力。
这表明,


原文链接:国产大模型之光!伯克利最新基准发布,智谱AI打赢GPT-4和Llama 3

联系作者

文章来源:智东西
作者微信:zhidxcom
作者简介:智能产业新媒体!智东西专注报道人工智能主导的前沿技术发展,和技术应用带来的千行百业产业升级。聚焦智能变革,服务产业升级。

阅读原文
© 版权声明

相关文章

暂无评论

暂无评论...