标签:评分

顶会审稿人紧缺,我审我自己!ICML 2023排序实验结果出炉:作者自评能提升评审质量吗?

新智元报道编辑:LRST 【新智元导读】宾夕法尼亚大学苏炜杰教授团队在ICML 2023会议中进行实验显示,经过作者自评校准后,审稿分数的误差降低超过20%。近年来...
阅读原文

现在看个球都要懂数据分析了吗?

大数据文摘授权转载自果壳 作者:Timo 当下欧洲杯,除了夜半爬起看比赛之外,虎扑或者懂球帝的老哥们最喜欢做的事情之一,就是拿着每场比赛赛后球员评分,去“...
阅读原文

首次引入GPT-4o!图像自动评估新基准来啦

DreamBench++团队 投稿量子位 | 公众号 QbitAI面对层出不穷的个性化图像生成技术,一个新问题摆在眼前: 缺乏统一标准来衡量这些生成的图片是否符合人们的喜...
阅读原文

「AI+物理先验知识」,浙大、中国科学院通用蛋白质-配体相互作用评分方法登Nature子刊

将 ScienceAI设为星标 第一时间掌握 新鲜的 AI for Science 资讯编辑 | X 蛋白质就像是身体中的精密锁具,而药物分子则是钥匙,只有完美契合的钥匙才能解锁治...
阅读原文

大模型盲测竞技场放榜!国产黑马冲进世界七强,中文并列第一

把大模型差距从7-10年降低到6个月,成立一年的国内AI独角兽是怎么做到的? 作者|ZeR0 编辑|漠影 智东西5月22日报道,周二,知名大模型竞技场LMSYS Chatboat A...
阅读原文

国产黑马大模型盲测竞技场挺进全球前十!中文榜和GPT-4o并列第一

夕小瑶科技说 分享美国时间2024年5月20日刚刷新的 LMSYS Chatboat Arena 盲测结果,来自至今积累超过 1170万的全球用户真实投票数,有一个国产大模型玩家Yi-L...
阅读原文

国产黑马与GPT-4o称霸中文榜首!Yi-Large勇夺国内LLM盲测桂冠,冲进世界第七

新智元报道编辑:桃子 好困 【新智元导读】真正与GPT-4o齐头并进的国产大模型来了!刚刚,LMSYS揭开最新榜单,黑马Yi-Large在中文分榜上与GPT-4o并列第一,而...
阅读原文

中国大模型头名易主:全球盲测榜单上,Yi-Large与GPT-4o中文并列第一

机器之心发布 机器之心编辑部上周,一个名为 “im-also-a-good-gpt2-chatbot” 的神秘模型突然现身大模型竞技场 Chatbot Arena,排名直接超过 GPT-4-Turbo、Gem...
阅读原文

千亿模型 Yi-Large 杠上万亿 GPT-4 Turbo,多项能力不输 OpenAI

新生代中国大模型后来居上,表现亮点。上周,一个名为“im-also-a-good-gpt2-chatbot”的神秘模型突然现身大模型竞技场Chatbot Arena,排名直接超过GPT-4-Turbo...
阅读原文

ICLR被曝巨大黑幕,评审和作者竟私下勾结?49.9%论文疑有AI审稿

新智元报道编辑:好困 乔杨 【新智元导读】正在召开的ICLR 2024会议上,成为关注热点的不仅有耀眼的成果和学术明星,关于论文的审稿程序也掀起了一波讨论。大...
阅读原文

【数据集汇总】大众点评/携程/百度地图/米其林餐厅……内含餐厅/酒店的真实评价

作者:李宝珠 编辑:三羊 HyperAI超神经整理了 5 个优质数据集,覆盖国内外出行的「食住行」刚需。又到「小长假」,HyperAI超神经在这里祝各位打工人假期愉快...
阅读原文

谷歌再雪前耻,新Bard逆袭GPT-4冲上LLM排行榜第二!Jeff Dean高呼我们回来了

新智元报道编辑:润 好困 【新智元导读】谷歌Bard又行了?在第三方LLM「排位赛」排行榜上,Bard击败GPT-4成为第二名。Jeff Dean兴奋宣布:谷歌回来了!一夜之...
阅读原文