标签:模型

五年后的今天,训练GPT-2只需不到700刀、24小时,Karpathy又整新活

机器之心报道 编辑:杜伟、泽南论老黄卖铲子的技术含量。2019 年 2 月,OpenAI 发布了 GPT-2,因为在文本生成上的优异表现,以及对于预训练 Transformer 架构...
阅读原文

ICML 2024 | 梯度检查点太慢?不降速、省显存,LowMemoryBP大幅提升反向传播显存效率

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

首个视频思维链推理框架Video-of-Thought来了:像人一样从感知到认知全面推理视频

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

AI慢思考蒸馏进快思考,Llama2跃升至GPT-4水平,不写过程也能做对题

克雷西 发自 凹非寺量子位 | 公众号 QbitAI《思考快与慢》中人类的两种思考方式,属实是被Meta给玩明白了。 研究人员通过把AI的“慢思考”结果蒸馏进“快思考”,...
阅读原文

一分钟原画变3D角色,清华VAST成果入选图形学顶会SIGGRAPH

CharacterGen团队 投稿量子位 | 公众号 QbitAI随便一张立绘都能生成游戏角色,任意IP快速三维化有新招了! 来自清华大学和VAST的研究人员联合推出了Character...
阅读原文

程序员如何用好“AI搭子”?实操演示来了,揭秘多元业务场景如何用AI工具提效降本

允中 发自 凹非寺量子位 | 公众号 QbitAI随着人工智能与大模型的蓬勃发展,我们正步入一个由技术驱动的创新时代。AI不仅是技术革新的先锋,更是每位程序员不...
阅读原文

苏妈掷48亿现金吞下AI模型公司,英伟达有的AMD也要有

西风 发自 凹非寺量子位 | 公众号 QbitAI芯片巨头AMD刚刚官宣要再做大做强: 将以6.65亿美元(约合RMB48亿)收购大模型公司Silo AI,而且是全 现 金的那种。 ...
阅读原文

一键运行 ComfyUI SD3!大规模医学 VQA 评测数据集上线,涉及超 20 个人体器官和部位

为了进一步推进 AI4S 的普适化,HyperAI超神经策划了「Meet AI4S」系列直播栏目。第一期直播将于 7 月 17 日 19:00 准时上线!我们邀请到了浙江大学遥感与地...
阅读原文

三万字深度对谈:为何 OpenAI 做不出互的产品?AI 是新的科技泡沫吗?

这期 Ben Thompson 与 Daniel Gross 、Nat Friedman 的深度对谈,发生在 6 月 11 日的苹果发布会之后,聚焦于 AI 产品的用户交互和产品,以及我们是否在新的...
阅读原文

被一支笔硬控不止30秒!大模型时代的学生辅导“全能选手”

从查词翻译到全科家教,有道词典笔X7治好了家长的辅导焦虑。 作者|程茜 编辑|漠影 从风靡90年代的逐个字母输入学习单词的文曲星,到把书本电子化哪里不会点哪...
阅读原文

Meet AI4S直播倒计时!浙大GIS实验室成果分享:神经网络为房价的空间异质性提供新解释

作者:李姝 编辑:李宝珠 Meet AI4S 系列直播第一期将于 7 月 17 日 19:00 准时上线!我们邀请到了浙江大学遥感与地理信息系统博士生丁佳乐,他的分享主题为...
阅读原文

18个月326项能力,这家大厂猛猛上新生成式AI,如今纯靠Prompt就搞定企业级应用了

机器之心报道 机器之心编辑部构建生成式 AI 应用,现在只需要几分钟。 「生成式 AI 的半衰期只有六个月,」亚马逊云科技全球 AI 产品副总裁 Matt Wood 说道。...
阅读原文

GitHub 8k Star,一作实习生,字节这个大模型成果被苹果选中了

机器之心发布 机器之心编辑部字节跳动大模型团队成果 Depth Anything V2 现已被苹果官方收入 Core ML 模型库。本文介绍了 Depth Anything 系列成果的研发历程...
阅读原文

这些VLM竟都是盲人?GPT-4o、Sonnet-3.5相继败于「视力」测试

机器之心报道 机器之心编辑部四大 VLM,竟都在盲人摸象? 让现在最火的 SOTA 模型们(GPT-4o,Gemini-1.5,Sonnet-3,Sonnet-3.5)数一数两条线有几个交点,...
阅读原文

ControlNet作者又出爆款!一张图生成绘画全过程,两天狂揽1.4k Star

机器之心报道 编辑:陈陈、小舟同样是图生视频,PaintsUndo 走出了不一样的路线。ControlNet 作者 Lvmin Zhang 又开始整活了!这次瞄准绘画领域。 新项目 Pai...
阅读原文