标签:记忆

鄂维南院士领衔新作:大模型不止有RAG、参数存储,还有第3种记忆

机器之心报道 编辑:陈陈2.4B 的 Memory3比更大的 LLM 和 RAG 模型获得了更好的性能。近年来,大型语言模型 (LLM) 因其非凡的性能而获得了前所未有的关注。然...
阅读原文

院士领衔推出大模型的第3种记忆:比参数存储和RAG都便宜,2.4B模型越级打13B

梦晨 发自 凹非寺量子位 | 公众号 QbitAI给大模型加上第三种记忆格式,把宝贵的参数从死记硬背知识中解放出来! 中科院院士鄂维南领衔,上海算法创新研究院等...
阅读原文

开源视频版GPT-4o?快速记忆,实时问答,拿下CVPR'24长视频问答竞赛冠军

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

Nature最新:刘智慧/孙文斐/Thomas C. Südhof等合作揭示社交学习长期记忆的巩固机制

来源:小柯生命 2024年7月3日23时,美国斯坦福大学Thomas C. Südhof及Stephen R. Quake教授团队(刘智慧和孙文斐为共同第一作者,刘智慧为共同通讯作者),合...
阅读原文

ᯅ 这才是 Vision Pro 的锏

Vision Pro 的所有功能里,「空间照片」和「空间视频」是我们感受最深的功能。 它们就像容器,把记忆储存起来;而 Vision Pro 就像「哈利波特」世界里的「冥...
阅读原文

CAAI名誉理事长李德毅院士:认知的形式化

来源:脑机接口社区 近日,中国人工智能学会名誉理事长李德毅院士牵头3位学者共同完成《认知的形式化》一文,并在《中国基础科学》(双月刊)上发表。认知的...
阅读原文

麻省理工开发一款AI「时光机器」,穿越未来和60岁自己对话,可显著减轻焦虑

夕小瑶科技说 原创作者 | 付奶茶你有没有想象过这样一个场景,穿越到未来,与未来的自己进行一场对话。 现在借助AI,幻想可以照进现实了。 麻省理工学院(MITI...
阅读原文

Agent技术洞察01:增强大语言模型 Agents 的工作记忆能力

直播预告 | 6月14日上午10点,「智猩猩AI新青年讲座」第239讲正式开讲,莫纳什大学在读博士马鑫将直播讲解《DiT架构在视频生成模型中的应用与扩展》,欢迎扫...
阅读原文

候选CVPR 2024最佳论文!深圳大手香港理工发布MemSAM:将 「分割一切」模型用于医学视频分割

作者:梅菜 编辑:李宝珠,三羊 深圳大学计算机与软件学院和香港理工大学智能健康研究中心联合提出了一种新颖的超声心动图视频分割模型 MemSAM,与现有模型相...
阅读原文

ChatGPT真能记住你的话吗?DeepMind与开源大佬揭示LLM记忆之谜

新智元报道编辑:乔杨 【新智元导读】LLM有记忆能力吗?有,也没有。虽然ChatGPT聊天时好像可以记住你之前说的话,但实际上,模型在推理时记不住任何内容,而...
阅读原文

长短时记忆RAG来啦,仿照人脑结构,成本降低20倍,表现提高20%!

夕小瑶科技说 原创作者 | Richard自从GPT-4问世之后,大模型似乎变得愈发聪明,拥有了'百科全书'般的知识储备。但它们真的已经接近人类智慧了吗? 事实并非如...
阅读原文

基础架构竞争激烈,LSTM原作者提出指数门控xLSTM,性能直逼Transformer和Mamba

大数据文摘授权转载自将门创投 作者:seven_ 经典长短时记忆网络(LSTM)架构最早可以追溯到20世纪90年代,因其独特的常量误差传递(constant error carousel...
阅读原文

Nature | 从波动到稳定:小鼠研究揭示工作记忆稳定化的神经机制

来源:生物探索 引言工作记忆(Working Memory, WM)是指在短暂时间内存储和操作信息的能力,它对大多数认知功能至关重要。然而,长期以来,关于工作记忆在群...
阅读原文

华为最新研究挑战Scaling Law

克雷西 发自 凹非寺量子位 | 公众号 QbitAI“Scaling Law不是万金油”——关于大模型表现,华为又提出了新理论。 他们发现,一些现象无法用Scaling Law来解释,进...
阅读原文

神秘模型"gpt2-chatbot"现身,引发GPT-4.5/GPT-5疯狂猜想

大数据文摘受权转载自头部科技 文丨Congerry OpenAI放出了一个迷雾弹。 当Google、Meta、Anthropic等公司都在猛推大模型的时候,OpenAI除了对GPT-4修修补补,...
阅读原文
1234