标签:问题

Llama3-8B秒杀700亿巨兽?北大博士生等全新「BoT」框架推理暴涨70倍,24点图形推理一步成神

新智元报道编辑:Aeneas 好困 【新智元导读】24点游戏、几何图形、一步将死问题,这些推理密集型任务,难倒了一片大模型,怎么破?北大、UC伯克利、斯坦福研...
阅读原文

纽约大学研究表明:大模型并没有利用思维链的推理能力,它只是加了计算!

思维链技术,可能要被推翻了!来自纽约大学的最新研究表明:大模型并没有利用思维链的推理能力,它只是偷偷加了计算!来源:悦智网 红极一时的思维链技术,可...
阅读原文

阿里开源Qwen2系列模型,72B有望成为开源第一!

01写在前面书接上回,开源时代,沸腾期待。 期待已久的Qwen2,他如约而至,他来了,他带着5个尺寸的大模型迎面走来了。 Blog:https://qwenlm.github.io/blog/...
阅读原文

黎曼猜想突破作者首次公开讲解,陶哲轩送上总结

机器之心报道 机器之心编辑部满满一黑板的「天书」,会是「猜想界皇冠」破解的开始吗?昨天,有关试证黎曼猜想的新研究又一次引爆了数学圈。 MIT 数学教授 La...
阅读原文

GPT、Claude、Perplexity等AI集体宕机罢工,全球打工人崩溃了

夕小瑶科技说 原创作者 | 付奶茶就在昨天!一个看似平常的周三上午,三大顶尖AI居然集体罢工了! 首先,网友们发现OpenAI的ChatGPT崩了,接着Claude和Perplex...
阅读原文

AI「末日」突然来临,公司同事集体变蠢!只因四大聊天机器人同时宕机

新智元报道编辑:好困 庸庸 【新智元导读】昨日,ChatGPT、Claude、Gemini和Perplexity四大聊天机器人同时宕机,引发网友竞相猜测。那么,在AI崩溃的几个小时...
阅读原文

今日arXiv最热大模型论文:人民大学:下一轮先裁HR!基于大模型的面试官与人岗匹配

夕小瑶科技说 原创作者 | Axe_越 今年年初一部“年会不能停”演出了无数打工人的心声,不知大家可还记得一个场景,当电影中众人听到“大鹏”扮演的HR角色叫到自己...
阅读原文

硅谷创业教父 Paul Graham 两万字长文:普通人如何成就一番大事?

Paul Graham,YC 创始人、硅谷创业教父、《黑客与画家》作者。经常在博客上分享自己对于创业的思考。 今天这篇文章《如何取得杰出成就》,是 PG 准备了半年之...
阅读原文

浅谈RAG的十大挑战

直播预告 | 6月6日晚7点,「智猩猩AI新青年讲座」第238讲正式开讲,香港大学CVMI Lab在读博士杨霁晗将直播讲解《V-IRL:根植于真实世界的AI Agents》,欢迎扫...
阅读原文

告别人工!智谱AI新神器将数据标注成本卷到接近0

夕小瑶科技说 原创作者 | 夕小瑶编辑部“有多少人工就有多少智能!” 这是2018年~2022年在人工智能圈子里(尤其是工业界)大家高度认同的一句话。 倒不是人工智...
阅读原文

斯坦福新研究:RAG能帮助LLM更靠谱吗?

新智元报道编辑:Mindy 【新智元导读】斯坦福大学的研究人员研究了RAG系统与无RAG的LLM (如GPT-4)相比在回答问题方面的可靠性。研究表明,RAG系统的事实准...
阅读原文

让用户吃石头,给披萨涂胶水,Google AI 搜索疯了吗

让Google 为你 进行搜索福无双至,祸不单行,Google 又又又「翻车」了。 2023 年 2 月,追赶 ChatGPT 的 Bard,公开犯了事实错误;2023 年 12 月,Gemini 侃...
阅读原文

今日arXiv最热大模型论文:上海AI lab发布MathBench,GPT-4o的数学能力有多强?

夕小瑶科技说 原创作者 | 谢年年大模型数学能力哪家强? 最近,上海AI lab构建了一个全面的多语言数学基准——MathBench。与现有的基准不同的是,MathBench涵盖...
阅读原文

Scaling Law的尽头是什么?|甲子引力X

大模型的“摩尔定律”。2024年5月15日,由中国科技产业智库「甲子光年」主办、中关村东升科学城协办的「AI创生时代——2024甲子引力X科技产业新风向」大会在北京...
阅读原文

万字实录:投钱、烧钱与赚钱,五位AI大咖的不同AI观|甲子光年

五个鲜明而极致角色之间的排列组合,映射了今天AI行业最受关注的话题。今天谈到AI,大共识已经形成:AI是未来。 但也有很多认知没有收敛:AI基础模型技术是否...
阅读原文
1141516171835