标签:内存
Agent技术洞察01:增强大语言模型 Agents 的工作记忆能力
直播预告 | 6月14日上午10点,「智猩猩AI新青年讲座」第239讲正式开讲,莫纳什大学在读博士马鑫将直播讲解《DiT架构在视频生成模型中的应用与扩展》,欢迎扫...
手机流畅运行470亿大模型:上交大发布LLM手机推理框架PowerInfer-2,提速29倍
梦晨 发自 凹非寺量子位 | 公众号 QbitAI苹果一出手,在手机等移动设备上部署大模型不可避免地成为行业关注焦点。 然而,目前在移动设备上运行的模型相对较小...
这个团队做了OpenAI没Open的技术,开源OpenRLHF让对齐大模型超简单
机器之心报道 编辑:Panda随着大型语言模型(LLM)规模不断增大,其性能也在不断提升。尽管如此,LLM 依然面临着一个关键难题:与人类的价值和意图对齐。在解...
斯坦福让“GPU高速运转”的新工具火了,比FlashAttention2更快
西风 发自 凹非寺量子位 | 公众号 QbitAIAI算力资源越发紧张的当下,斯坦福新研究将GPU运行效率再提升一波—— 内核只有100行代码,让H100比使用FlashAttention...
4倍内存效率,生成和超分双SOTA!清华&智谱AI发布最新Inf-DiT模型
直播预告 | 5月28日10点,「智猩猩AI新青年讲座」第236讲正式开讲,密歇根大学安娜堡分校在读博士生张挥杰将直播讲解《利用多级框架和多解码器架构提高扩散模...
开创性CVM算法破解40多年计数难题!计算机科学家掷硬币算出「哈姆雷特」独特单词
新智元报道编辑:桃子 【新智元导读】预估一个数组中不重复数字的个数,最简便的方法是什么?计算机科学家们提出了一种全新CVM算法,通过利用随机性,预估出...
告别3D高斯Splatting算法,带神经补偿的频谱剪枝高斯场SUNDAE开源了
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
只需百行代码,让H100提速30%,斯坦福开源全新AI加速框架
机器之心报道 机器之心编辑部提高 GPU 利用率,就是这么简单。AI 的快速发展,伴随而来的是大计算量。这就自然而然的引出了一个问题:如何减少 AI 对计算的需...
从零开始手搓GPU,照着英伟达CUDA来,只用两个星期
机器之心报道 编辑:泽南、小舟从学习芯片的基础知识开始。「我花两周时间零经验从头开始构建 GPU,这可比想象的要难多了。」总有人说老黄的芯片供不应求,大...
坏了,我的RTX 3090 GPU在对我唱歌!
机器之心报道 机器之心编辑部这你敢信?! 在一个昏暗的机箱里,一台 RTX 3090 GPU「唱」着经典英语儿歌《一闪一闪亮晶晶》(Twinkle,Twinkle,Little Star)...
原作者带队,LSTM真杀回来了!
机器之心报道 编辑:蛋酱LSTM:这次重生,我要夺回 Transformer 拿走的一切。20 世纪 90 年代,长短时记忆(LSTM)方法引入了恒定误差选择轮盘和门控的核心思...
仅用250美元,Hugging Face技术主管手把手教你微调Llama 3
机器之心报道 编辑:赵阳大语言模型的微调一直是说起来容易做起来难的事儿。近日 Hugging Face 技术主管 Philipp Schmid 发表了一篇博客,详细讲解了如何利用...
老黄亲自上门送超算!OpenAI奥特曼签收后到斯坦福演讲GPT-5
梦晨 发自 凹非寺量子位 | 公众号 QbitAI皮衣老黄亲自上门送货!OpenAI收到世界上第一台DGX H200超算。 致推进人工智能、计算和人类发展。 这下呼吁...
索尼 PS5 Pro 或年底发布,开发者已收到适配通知
PS5 PRO 即将发布 距离索尼发布 PS5 已经过去三年多了,其全球销量也已经达到了惊人的四千多万台。 现在,它的升级款有新消息了。有爆料称今年 11 月份,会...
直接扩展到无限长,谷歌Infini-Transformer终结上下文长度之争
机器之心报道 编辑:小舟、陈萍不知 Gemini 1.5 Pro 是否用到了这项技术。 谷歌又放大招了,发布下一代 Transformer 模型 Infini-Transformer。 Infini-Trans...