VLM集体「失明」?视力测试惨败,GPT-4o、Claude 3.5全都不及格
新智元报道编辑:编辑部 【新智元导读】视觉大语言模型在最基础的视觉任务上集体「翻车」,即便是简单的图形识别都能难倒一片,或许这些最先进的VLM还没有发...
AI争霸战开启!OpenAI急建10万块GB200超算,马斯克10万块H100月末开训
新智元报道编辑:桃子 【新智元导读】马斯克官宣xAI建造的世界最大超算集群,由10万块H100搭建,预计本月末开始投入训练。另一边,OpenAI再次加码,将打造由1...
神经网络架构「殊途同归」?ICML 2024论文:模型不同,但学习内容相同
新智元报道编辑:乔杨 【新智元导读】深度神经网络有多种规模和架构,大家普遍认为这会影响到模型学习到的抽象表示。然而,UCL两位学者发表在ICML 2024上第一...
全程免费!「真格星球AI+创业营」与十数位大咖导师一道,碰撞AI灵感、寻找落地商机
「真格星球 ZhenPlanet」是真格主办的前沿科技人才孵化项目,自 2019 年起已成功举办四期。 我们已陪伴多家优秀的前沿科技创业公司走过从 0 到 1 的旅程,因...
太酷了!iPhone、iPad、MacBook老旧设备组成异构集群,能跑Llama 3
机器之心报道 机器之心编辑部假如你有闲置的设备,或许可以试一试。这次,你手里的硬件设备也能在 AI 领域大展拳脚了。 将 iPhone、iPad、Macbook 进行组合,...
公理训练让LLM学会因果推理:6700万参数模型比肩万亿参数级GPT-4
机器之心报道 编辑:Panda把因果链展示给 LLM,它就能学会公理。AI 已经在帮助数学家和科学家做研究了,比如著名数学家陶哲轩就曾多次分享自己借助 GPT 等 AI...
谷歌机器人专家:机器人在现实中碰过的壁,AI也会碰
机器之心报道 编辑:张倩「机器学习一直生活在一个令机器人专家、化学家、生物学家和神经科学家羡慕不已的泡沫中,随着它真正开始发挥作用,我们所有人都将遇...
抛弃视觉编码器,这个「原生版」多模态大模型也能媲美主流方法
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
大模型集体失智!9.11和9.9哪个大,几乎全翻车了
梦晨 一水 发自 凹非寺量子位 | 公众号 QbitAI没眼看……“9.11和9.9哪个大”这样简单的问题,居然把主流大模型都难倒了?? 强如GPT-4o,都坚定地认为9.11更大。...
初创公司硬刚英伟达:在AMD卡上模拟CUDA,原版程序直接编译运行
克雷西 发自 凹非寺量子位 | 公众号 QbitAI无需任何修改转换,AMD显卡也跑起原版CUDA程序了! 英国一家初创公司,推出了针对AMD的CUDA程序编译工具,而且免费...
大模型“玩”Excel更6了,微软搞的
金磊 发自 凹非寺量子位 | 公众号 QbitAI大模型理解、推理Excel,现在变得更加精准了。 这就是来自微软的一项最新研究——SPREADSHEETLLM,主打的就是让大模型...
从草稿到样品图,只需要一步AI|AI产品测评
做设计,光靠创意还不够。 画好了草图,还要勾线稿、上色才能看到完整效果;拿到了产品,还得有环境、模特才能拍摄效果诱人的样品图…就不能坐在家里动动手,...
万字长文:意识的大一统理论要来了吗?
大数据文摘授权转载自追问nextquestion 追问快读:意识体验与物质大脑过程如何相互关联?近年来,随意识研究的激增,多种理论兴起,试图回答这一古老问题,其...
还不如人类五岁小孩,难度为零的视觉测试,GPT-4o、Claude 3.5 Sonnet却挑战失败了
大数据文摘授权转载自学术头条 撰文:马雪薇 GPT-4o、Claude 3.5 Sonnet 等具有视觉能力的大语言模型(LLM),是否能像人类一样感知图像?最新研究表明,在一...
不是取代,而是共生!气象科学的未来需要AI与数值预报的有机结合
作者:十九 编辑:李宝珠,三羊 数值天气预报和 AI 气象预报存在天然的耦合关系,数值预报可以通过物理数学理论提供可解释的预报结果,AI 气象大模型则能够利...