标签:模型

五年后的今天,训练GPT-2只需不到700刀、24小时,Karpathy又整新活

机器之心报道 编辑:杜伟、泽南论老黄卖铲子的技术含量。2019 年 2 月,OpenAI 发布了 GPT-2,因为在文本生成上的优异表现,以及对于预训练 Transformer 架构...
阅读原文

ICML 2024 | 梯度检查点太慢?不降速、省显存,LowMemoryBP大幅提升反向传播显存效率

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

首个视频思维链推理框架Video-of-Thought来了:像人一样从感知到认知全面推理视频

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

程序员如何用好“AI搭子”?实操演示来了,揭秘多元业务场景如何用AI工具提效降本

允中 发自 凹非寺量子位 | 公众号 QbitAI随着人工智能与大模型的蓬勃发展,我们正步入一个由技术驱动的创新时代。AI不仅是技术革新的先锋,更是每位程序员不...
阅读原文

苏妈掷48亿现金吞下AI模型公司,英伟达有的AMD也要有

西风 发自 凹非寺量子位 | 公众号 QbitAI芯片巨头AMD刚刚官宣要再做大做强: 将以6.65亿美元(约合RMB48亿)收购大模型公司Silo AI,而且是全 现 金的那种。 ...
阅读原文

AI慢思考蒸馏进快思考,Llama2跃升至GPT-4水平,不写过程也能做对题

克雷西 发自 凹非寺量子位 | 公众号 QbitAI《思考快与慢》中人类的两种思考方式,属实是被Meta给玩明白了。 研究人员通过把AI的“慢思考”结果蒸馏进“快思考”,...
阅读原文

一分钟原画变3D角色,清华VAST成果入选图形学顶会SIGGRAPH

CharacterGen团队 投稿量子位 | 公众号 QbitAI随便一张立绘都能生成游戏角色,任意IP快速三维化有新招了! 来自清华大学和VAST的研究人员联合推出了Character...
阅读原文

一键运行 ComfyUI SD3!大规模医学 VQA 评测数据集上线,涉及超 20 个人体器官和部位

为了进一步推进 AI4S 的普适化,HyperAI超神经策划了「Meet AI4S」系列直播栏目。第一期直播将于 7 月 17 日 19:00 准时上线!我们邀请到了浙江大学遥感与地...
阅读原文

三万字深度对谈:为何 OpenAI 做不出互的产品?AI 是新的科技泡沫吗?

这期 Ben Thompson 与 Daniel Gross 、Nat Friedman 的深度对谈,发生在 6 月 11 日的苹果发布会之后,聚焦于 AI 产品的用户交互和产品,以及我们是否在新的...
阅读原文

被一支笔硬控不止30秒!大模型时代的学生辅导“全能选手”

从查词翻译到全科家教,有道词典笔X7治好了家长的辅导焦虑。 作者|程茜 编辑|漠影 从风靡90年代的逐个字母输入学习单词的文曲星,到把书本电子化哪里不会点哪...
阅读原文

Meet AI4S直播倒计时!浙大GIS实验室成果分享:神经网络为房价的空间异质性提供新解释

作者:李姝 编辑:李宝珠 Meet AI4S 系列直播第一期将于 7 月 17 日 19:00 准时上线!我们邀请到了浙江大学遥感与地理信息系统博士生丁佳乐,他的分享主题为...
阅读原文

GitHub 8k Star,一作实习生,字节这个大模型成果被苹果选中了

机器之心发布 机器之心编辑部字节跳动大模型团队成果 Depth Anything V2 现已被苹果官方收入 Core ML 模型库。本文介绍了 Depth Anything 系列成果的研发历程...
阅读原文

这些VLM竟都是盲人?GPT-4o、Sonnet-3.5相继败于「视力」测试

机器之心报道 机器之心编辑部四大 VLM,竟都在盲人摸象? 让现在最火的 SOTA 模型们(GPT-4o,Gemini-1.5,Sonnet-3,Sonnet-3.5)数一数两条线有几个交点,...
阅读原文

ControlNet作者又出爆款!一张图生成绘画全过程,两天狂揽1.4k Star

机器之心报道 编辑:陈陈、小舟同样是图生视频,PaintsUndo 走出了不一样的路线。ControlNet 作者 Lvmin Zhang 又开始整活了!这次瞄准绘画领域。 新项目 Pai...
阅读原文

18个月326项能力,这家大厂猛猛上新生成式AI,如今纯靠Prompt就搞定企业级应用了

机器之心报道 机器之心编辑部构建生成式 AI 应用,现在只需要几分钟。 「生成式 AI 的半衰期只有六个月,」亚马逊云科技全球 AI 产品副总裁 Matt Wood 说道。...
阅读原文