标签：内存

Agent技术洞察01：增强大语言模型 Agents 的工作记忆能力

直播预告 | 6月14日上午10点，「智猩猩AI新青年讲座」第239讲正式开讲，莫纳什大学在读博士马鑫将直播讲解《DiT架构在视频生成模型中的应用与扩展》，欢迎扫...

阅读原文

AIGC动态

2年前 (2024)

手机流畅运行470亿大模型：上交大发布LLM手机推理框架PowerInfer-2，提速29倍

梦晨发自凹非寺量子位 | 公众号 QbitAI苹果一出手，在手机等移动设备上部署大模型不可避免地成为行业关注焦点。然而，目前在移动设备上运行的模型相对较小...

阅读原文

AIGC动态

2年前 (2024)

这个团队做了OpenAI没Open的技术，开源OpenRLHF让对齐大模型超简单

机器之心报道编辑：Panda随着大型语言模型（LLM）规模不断增大，其性能也在不断提升。尽管如此，LLM 依然面临着一个关键难题：与人类的价值和意图对齐。在解...

阅读原文

AIGC动态

2年前 (2024)

斯坦福让“GPU高速运转”的新工具火了，比FlashAttention2更快

西风发自凹非寺量子位 | 公众号 QbitAIAI算力资源越发紧张的当下，斯坦福新研究将GPU运行效率再提升一波—— 内核只有100行代码，让H100比使用FlashAttention...

阅读原文

AIGC动态

2年前 (2024)

4倍内存效率，生成和超分双SOTA！清华&智谱AI发布最新Inf-DiT模型

直播预告 | 5月28日10点，「智猩猩AI新青年讲座」第236讲正式开讲，密歇根大学安娜堡分校在读博士生张挥杰将直播讲解《利用多级框架和多解码器架构提高扩散模...

阅读原文

AIGC动态

2年前 (2024)

开创性CVM算法40多年计数难题！计算机科学家掷硬币算出「哈姆雷特」独特单词

新智元报道编辑：桃子【新智元导读】预估一个数组中不重复数字的个数，最简便的方法是什么？计算机科学家们提出了一种全新CVM算法，通过利用随机性，预估出...

阅读原文

AIGC动态

2年前 (2024)

告别3D高斯Splatting算法，带神经补偿的频谱剪枝高斯场SUNDAE开源了

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术...

阅读原文

AIGC动态

2年前 (2024)

只需百行代码，让H100提速30%，斯坦福开源全新AI加速框架

机器之心报道机器之心编辑部提高 GPU 利用率，就是这么简单。AI 的快速发展，伴随而来的是大计算量。这就自然而然的引出了一个问题：如何减少 AI 对计算的需...

阅读原文

AIGC动态

2年前 (2024)

从零开始手搓GPU，照着英伟达CUDA来，只用两个星期

机器之心报道编辑：泽南、小舟从学习芯片的基础知识开始。「我花两周时间零经验从头开始构建 GPU，这可比想象的要难多了。」总有人说老黄的芯片供不应求，大...

阅读原文

AIGC动态

2年前 (2024)

坏了，我的RTX 3090 GPU在对我唱歌！

机器之心报道机器之心编辑部这你敢信？！在一个昏暗的机箱里，一台 RTX 3090 GPU「唱」着经典英语儿歌《一闪一闪亮晶晶》（Twinkle,Twinkle,Little Star）...

阅读原文

AIGC动态

2年前 (2024)

原作者带队，LSTM真杀回来了！

机器之心报道编辑：蛋酱LSTM：这次重生，我要夺回 Transformer 拿走的一切。20 世纪 90 年代，长短时记忆（LSTM）方法引入了恒定误差选择轮盘和门控的核心思...

阅读原文

AIGC动态

2年前 (2024)

仅用250美元，Hugging Face技术主管手把手教你微调Llama 3

机器之心报道编辑：赵阳大语言模型的微调一直是说起来容易做起来难的事儿。近日 Hugging Face 技术主管 Philipp Schmid 发表了一篇博客，详细讲解了如何利用...

阅读原文

AIGC动态

2年前 (2024)

老黄亲自上门送超算！OpenAI奥特曼签收后到斯坦福演讲GPT-5

梦晨发自凹非寺量子位 | 公众号 QbitAI皮衣老黄亲自上门送货！OpenAI收到世界上第一台DGX H200超算。‍‍‍‍‍‍‍‍ 致推进人工智能、计算和人类发展。这下呼吁...

阅读原文

AIGC动态

2年前 (2024)

索尼 PS5 Pro 或年底发布，开发者已收到适配通知

PS5 PRO 即将发布‍ 距离索尼发布 PS5 已经过去三年多了，其全球销量也已经达到了惊人的四千多万台。现在，它的升级款有新消息了。有爆料称今年 11 月份，会...

阅读原文

AIGC动态

2年前 (2024)

直接扩展到无限长，谷歌Infini-Transformer终结上下文长度之争

机器之心报道编辑：小舟、陈萍不知 Gemini 1.5 Pro 是否用到了这项技术。谷歌又放大招了，发布下一代 Transformer 模型 Infini-Transformer。 Infini-Trans...

阅读原文

AIGC动态

2年前 (2024)

1 234 5 6