标签:问题

浅谈RAG的十大挑战

直播预告 | 6月6日晚7点,「智猩猩AI新青年讲座」第238讲正式开讲,香港大学CVMI Lab在读博士杨霁晗将直播讲解《V-IRL:根植于真实世界的AI Agents》,欢迎扫...
阅读原文

告别人工!智谱AI新神器将数据标注成本卷到接近0

夕小瑶科技说 原创作者 | 夕小瑶编辑部“有多少人工就有多少智能!” 这是2018年~2022年在人工智能圈子里(尤其是工业界)大家高度认同的一句话。 倒不是人工智...
阅读原文

斯坦福新研究:RAG能帮助LLM更靠谱吗?

新智元报道编辑:Mindy 【新智元导读】斯坦福大学的研究人员研究了RAG系统与无RAG的LLM (如GPT-4)相比在回答问题方面的可靠性。研究表明,RAG系统的事实准...
阅读原文

让用户吃石头,给披萨涂胶水,Google AI 搜索疯了吗

让Google 为你 进行搜索福无双至,祸不单行,Google 又又又「翻车」了。 2023 年 2 月,追赶 ChatGPT 的 Bard,公开犯了事实错误;2023 年 12 月,Gemini 侃...
阅读原文

今日arXiv最热大模型论文:上海AI lab发布MathBench,GPT-4o的数学能力有多强?

夕小瑶科技说 原创作者 | 谢年年大模型数学能力哪家强? 最近,上海AI lab构建了一个全面的多语言数学基准——MathBench。与现有的基准不同的是,MathBench涵盖...
阅读原文

Scaling Law的尽头是什么?|甲子引力X

大模型的“摩尔定律”。2024年5月15日,由中国科技产业智库「甲子光年」主办、中关村东升科学城协办的「AI创生时代——2024甲子引力X科技产业新风向」大会在北京...
阅读原文

万字实录:投钱、烧钱与赚钱,五位AI大咖的不同AI观|甲子光年

五个鲜明而极致角色之间的排列组合,映射了今天AI行业最受关注的话题。今天谈到AI,大共识已经形成:AI是未来。 但也有很多认知没有收敛:AI基础模型技术是否...
阅读原文

Llama 3加持,用户实测Meta AI还是弱爆了!小扎弯道超车的策略竟是「免费+不限量」?

新智元报道编辑:LRS 【新智元导读】小扎目标让Meta AI成全世界最好用的AI助手,但实测来看,还有很长的路要走,至少现在还是远远不如Bing Copilot,除了免费...
阅读原文

4人团队,如何用大模型创造近千万业务价值?

采访嘉宾|张源源百姓车联数据科学与数据平台高级总监 编辑 |李忠良 大模型已经融入千行百业,在这个背景下,LLMOps 作为一种新概念,其定义、实践以及应对挑...
阅读原文

思维链不存在了?纽约大学最新研究:推理步骤可「省略」

新智元报道编辑:alan 【新智元导读】思维链技术,可能要被推翻了!来自纽约大学的最新研究表明:大模型并没有利用思维链的推理能力,它只是偷偷加了计算!红...
阅读原文

微信一个逆天功能已悄悄上线!99%的人还不知道…

点击上方蓝字关注我们“微信读书新推出的“AI问书”功能,允许用户在阅读时直接查询疑惑内容,答案来自微信读书内书籍,可即时跳转阅读。该功能极大提升了阅读效...
阅读原文

马斯克首例脑机接口人体试验曝故障!Neuralink:接线脱落,不影响安全

首例人体植入“接触不良”?马斯克的脑机接口公司发博回应。 作者|李水青 编辑|心缘 智东西5月10日消息,根据马斯克的脑机接口公司Neuralink于5月8日发布的博客...
阅读原文

AI学会隐藏思维暗中推理!不依赖人类经验解决复杂任务,更黑箱了

梦晨 发自 凹非寺量子位 | 公众号 QbitAIAI做数学题,真正的思考居然是暗中“心算”的? 纽约大学团队新研究发现,即使不让AI写步骤,全用无意义的“……”代替,在...
阅读原文

图灵奖得主Yoshua Bengio:我不想把大模型未来押注在Scaling Law上,AGI路上要“注意安全”

来源:智源社区 作者:智源社区 导读漫长的30年间,数度从主流方向的超然出走,是Bengio的制胜秘诀。这种不盲从主流的风格体现在他研究生涯的方方面面。 90年...
阅读原文

终于有人调查了小模型过拟合:三分之二都有数据污染,微软Phi-3、Mixtral 8x22B被点名

机器之心报道 编辑:佳琪、蛋酱当前最火的大模型,竟然三分之二都存在过拟合问题? 刚刚出炉的一项研究,让领域内的许多研究者有点意外。提高大型语言模型的...
阅读原文
1151617181936