标签:问题
都说 RAG “烂大街”了,但为何深度应用寥寥无几?| 直播预告
大语言模型技术迅猛发展的脚步,正引领着信息检索技术进入一个新的纪元。在这一领域中,RAG 技术将传统信息检索技术与大语言模型技术相结合,为知识理解、知...
思路打开!腾讯造了10亿个角色,驱动数据合成!7B模型效果打爆了
夕小瑶科技说 原创作者 | 谢年年世界由形形色色的角色构成,每个角色都拥有独特的知识、经验、兴趣、个性和职业,他们共同制造了丰富多元的知识与文化。 所谓...
ChatGPT无法取代人类程序员! IEEE 35页论文测出困难编码正确率仅为0.66%
新智元报道编辑:编辑部 【新智元导读】6月,IEEE刊登了一篇对ChatGPT代码生成任务进行系统评估的论文,数据集就是程序员们最爱的LeetCode题库。研究揭示了LL...
聊聊大模型推理中的分离式推理
原文:https://zhuanlan.zhihu.com/p/706469785 一开始本文叫做“聊聊大模型推理中的存储优化”的,但是发布之后感觉还是要叫分离式推理更好,虽然我本来是想写...
谷歌DeepMind全新ToT基准:全面评估LLM时间推理能力
新智元报道编辑:alan 【新智元导读】近日,来自谷歌DeepMind的研究人员,推出了专门用于评估大语言模型时间推理能力的基准测试——Test of Time(ToT),从两...
腾讯 AI 助手元宝大升级!除了能搜公众号,跟其他国产 AI 搜索有什么不同?
少数问题 需要 额外思考5 月 30 日,腾讯的 AI 助手应用「腾讯元宝」上线。因为可以引用公众号文章,内容生态质量较高,AI 搜索赛道虽然卷生卷死,姗姗来迟的...
AI助攻「菜鸟数学家」解决忙碌海狸问题,陶哲轩转发分享
机器之心报道 编辑:大盘鸡、佳琪在 AI 的帮助下,越来越多的数学问题得到了解决。AI在数学领域的应用对大家来说并不陌生了。数学家陶哲轩作为倡导者,一...
复旦大学:一个小技巧探测大模型的知识边界,有效消除幻觉
夕小瑶科技说 原创作者 | Zicy 孔子说“知之为知之,不知为不知,是知也”,目前的大模型非常缺乏这个能力。虽然大模型拥有丰富的知识,但它仍然缺乏对自己知识...
上交举办“大模型奥林匹克竞赛”,GPT-4o仅得39分
夕小瑶科技说 原创作者 | 谢年年大模型的奥林匹克竞赛来了! 最近,上交构建了一个全面、极具挑战性的奥赛级别的基准——OlympicArena,从来自62个不同奥林匹克...
迄今最快的网络流算法,网友:几乎与数学理论一样快
金磊 发自 凹非寺量子位 | 公众号 QbitAI迄今为止最快、近乎完美的网络流(Network Flow)算法,来了! 有多快? 对于任何类型的网络,计算速度几乎与数学理...
菲尔兹奖得主亲测GPT-4o,经典过河难题失败!最强Claude 3.5回答离谱,LeCun嘲讽LLM
新智元报道编辑:桃子 乔杨 【新智元导读】LLM能否解决「狼-山羊-卷心菜」经典过河难题?最近,菲尔兹奖得主Timothy Gowers分享了实测GPT-4o的过程,模型在最...
ACL2024主会:无需训练的大模型推荐系统!
夕小瑶科技说 原创作者 | Axe_越如今,各种推荐系统无时无刻不在包围着我们的生活,自大模型(Large Language Model, LLM)时代以来,得益于LLM的高自由度,...
陈丹琦团队图表解读新基准:新王Claude3.5刚及格,但已是模型最强推理表现
克雷西 发自 凹非寺量子位 | 公众号 QbitAIClaude 3.5 Sonnet的图表推理能力,比GPT-4o高出了27.8%。 针对多模态大模型在图表任务上的表现,陈丹琦团队提出了...
首个多模态视频竞技场Video-MME来了!Gemini全面超越GPT-4o,Jeff Dean连转三次
新智元报道编辑:alan 好困 【新智元导读】近日,首个多模态LLM视频分析综合评估基准Video-MME诞生!在这场全新的考试中,Gemini 1.5 Pro一路遥遥领先,谷歌...
OpenAI CTO深度访谈:剧透GPT-5发布时间
OpenAI CTO 穆拉提分享OpenAI近况与AI行业动向。 编译|陈骏达 编辑|Panken 智东西6月25日消息,近日,OpenAI首席技术官米拉·穆拉提(Mira Murati)在达特茅斯...