标签:模型

构建大模型一年多,我们总结了关于 LLM 应用的运营经验

作者丨 Eugene Yan et al. 译者丨明知山 策划丨褚杏娟 常有人错误地将这样一句话归因于一些领导者,尽管它可能完全是虚构的:“外行谈论战略和战术,内行关注...
阅读原文

四分钟四十亿年!国外小哥在GPU上模拟世界

新智元报道编辑:Aeneas 【新智元导读】一位国外小哥,在GPU上模拟出了四十亿年里地球是如何变换的。看到最后一幕,让人不禁沉默了……四十亿年里的地球,是什...
阅读原文

Machine Unlearning 会是未来 LLM 的必需品吗?

机器之心PRO · 会员通讯 Week 31---- 本周为您解读 ③个值得细品的AI & Robotics业内要事 ---- 1.Machine Unlearning 会是未来 LLM 的必需品吗? 为什么需...
阅读原文

小技巧大功效,「仅阅读两次提示」让循环语言模型超越Transformer++

机器之心报道 编辑:杜伟在当前 AI 领域,大语言模型采用的主流架构是 Transformer。不过,随着 RWKV、Mamba 等架构的陆续问世,出现了一个很明显的趋势:在...
阅读原文

AI顶会ICML收了一篇论文:没算法没实验

蔡永强 投稿量子位 | 公众号 QbitAI没有算法没有实验,从2610篇收录论文中脱颖而出,成为唯一一篇纯理论入选2024 ICML Spotlight的论文。 “Vocabulary for Un...
阅读原文

大型AI行为艺术:「人类止步」贴吧,17个大模型疯狂灌水|开源

叨乐 发自 凹非寺量子位 | 公众号 QbitAI这个贴吧里的网友,都不是人! 但是它们却能从诗词歌赋,聊到人生哲学。 甚至还会叠楼讨论:俺们AI做的梦是不是模拟...
阅读原文

领英 AI 落地复盘:多 Agent 配合、端到端输出

在过去的六个月,LinkedIn 开发了基于自身业务的生成式AI应用。领英团队希望能重新设计求职流程,改变专业内容的浏览方式。 现在,用户可以不用再刷新招聘软...
阅读原文

最可能做出 AI 超级应用的,不是 OpenAI

换了发型的扎克伯格越来越不像机器人了。 这是网友们对扎克伯格最近形象转变的普遍评价,但看顺眼的网友更多是对他旗下 Meta 公司的认可。 时间往回倒退 3 年...
阅读原文

AI独角兽抢着上岸大厂了?Transfomer作者创办的Character.AI 正式被谷歌收编!

夕小瑶科技说 原创作者 | 付奶茶今天凌晨,一直被传闻入不敷出,四处“卖身”的 Character.AI 终于确定了归宿! Character.AI 在官方博客 C.AI 上宣布了与 Goog...
阅读原文

深度解码:AI 大模型的繁荣与困境 | Q福利

文末有惊喜福利哦~当前,人们正身处于一个日新月异的数字化时代,其中,人工智能技术的发展速度和规模令人惊叹,已然成为驱动技术进步的一股不可忽视的力量。...
阅读原文

405B为何不用MOE结构?LLaMA 3.1结构及影响解析

直播预告 |「智猩猩大模型技术公开课」正式开讲啦~8月5日晚7点开讲,合合信息智能创新事业部研发总监 常扬将直播讲解《大模型RAG技术架构与应用实践》,内容...
阅读原文

25亿独角兽CEO带头跑路,携30员工卖身谷歌!AI大佬:AGI泡沫几周就要破

新智元报道编辑:Aeneas 好困 【新智元导读】不好了,CEO和总裁刚刚跑路了?Character.AI的CEO,带着30名员工出走谷歌,这已经是短短5个月内的第三起「CEO」...
阅读原文

DeepMind研究成本大起底,一篇ICML论文烧掉1290万美元

新智元报道编辑:乔杨 【新智元导读】DeepMind最近被ICML 2024接收的一篇论文,完完全全暴露了他们背靠谷歌的「豪横」。一篇文章预估了这项研究所需的算力和...
阅读原文

ICML 2024演讲爆火!Meta朱泽园揭秘大模型内心世界:不同于人类的2级推理

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

从现在起,GitHub上超1亿开发者可直接访问全球顶级大模型,构建AI应用

机器之心报道 编辑:杜伟、佳琪GitHub推出的全新功能「GitHub Models」将有望加快 AI 工程师时代的到来。什么?大家熟悉的代码托管平台 GitHub 又进化了!该...
阅读原文