标签:正确率

大模型边推理边纠错,有可能做到吗?这是ICML爆火的演讲

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

大模型“脑回路”统一了?LLMs竟然能正确回答其他模型虚构的题目

来源:夕小瑶科技说 原创 作者:谢年年 最近开源模型Llama3.1上线,其405B模型竟超越闭源GPT-4o,一夜之间成最强大模型! 然而榜首的位置还没坐热,仅隔一天...
阅读原文

4人团队斩获首届AI奥数竞赛百万大奖!AI破解29题陶哲轩惊呆,CMU华人博士荣登第二

新智元报道编辑:桃子乔杨 【新智元导读】历经3个月,首届AI奥数竞赛终于公布最终结果了!Gemma 7B只能达到3/50正确率的题目中,第一名的Numina模型居然刷出...
阅读原文

OpenAI图像检测工具曝光,CTO:AI生成的99%都能认出

丰色 发自 凹非寺量子位 | 公众号 QbitAIOpenAI要出手AI图像识别了。最新消息,他们公司正在开发一种检测工具。根据首席技术官Mira Murat透露:该工具精度非...
阅读原文

语言模型有重大缺陷,知识推演竟然是老大难

来源:机器之心惊人发现:大模型在知识推演上存在严重缺陷。灵活运用知识是智慧的关键。人脑可以快速处理知识,如快速回答 “《静夜思》中有几个月字”。那么,...
阅读原文