今日arXiv最热大模型论文:北京大学最新综述:视觉大模型中的漏洞与攻防对抗

夕小瑶科技说 原创作者 | 谢年年近年来,视觉语言大模型(LVLM)在文本转图像、视觉问答等任务中大放异彩,背后离不开海量数据、强大算力和复杂参数的支撑。 ...
阅读原文

小扎老黄亲密换衣炉边对谈!小扎竟破防爆粗,老黄自曝第一批Blackwell已出炉

新智元报道编辑:编辑部 【新智元导读】就在刚刚,老黄在SIGGRAPH大会上透露:Blackwell的工程样片,已在本周正式向全世界发送!随后,老黄和小扎展开了炉边...
阅读原文

苹果AI震撼上线iPhone,进化版Siri却没有ChatGPT!47页技术报告揭秘自研模型

新智元报道编辑:编辑部 【新智元导读】今早,所有开发者们被突如其来iOS 18.1测试版砸晕了!没想到,苹果AI这就可以上手尝鲜了,一大波测评刷屏全网。更惊喜...
阅读原文

CV又不存在了?Meta「分割一切」2.0正式开源,视频也能分割了

新智元报道编辑:编辑部 【新智元导读】Meta又双叒开源了!继去年初代SAM掀翻CV圈之后,SAM 2也完成了终极进化,不仅能分割图像,最惊艳的是还能分割视频。这...
阅读原文

AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024

新智元报道编辑:LRST 好困 【新智元导读】音视频大语言模型在处理视频内容时,往往未能充分发挥语音的作用。video-SALMONN模型通过三部分创新:音视频编码和...
阅读原文

专攻低维结构!第二届「简约与学习会议」即将在斯坦福开启,马毅出任主席

新智元报道编辑:LRST 【新智元导读】简约才是科研的王道,第二届简约学习大会CPAL 2025将在斯坦福大学举办,主要关注理解深度网络与非线性、多模式数据结构...
阅读原文

HPN 7.0:阿里云新一代万卡集群网络架构

9月6-7日,2024全球AI芯片峰会将在北京召开。目前,AMD人工智能事业部高级总监王宏强,清华大学交叉信息研究院助理教授、北极雄芯创始人马恺声,珠海芯动力创...
阅读原文

杀疯了!Meta开源SAM-2:可商用,随意分割视频、图像

9月6-7日,2024全球AI芯片峰会将在北京召开。目前,AMD人工智能事业部高级总监王宏强,清华大学交叉信息研究院助理教授、北极雄芯创始人马恺声,珠海芯动力创...
阅读原文

3分钟搞定、比iPhone还轻,为什么奥运会的最大黑马是这双鞋

奥运 跑鞋 轻北京时间 7 月 27 日凌晨 1:30,随着巴黎奥运会开幕式在塞纳河边的余晖之下拉开帷幕,标志着第 33 届夏季奥林匹克运动会的正式开始。 时隔正好 1...
阅读原文

始祖鸟推出全球首款腿上「赛博外挂」,4500 美元的徒步神器

Skip 始祖鸟 联手外骨骼你有想象过,将机械安装在身体外,帮你突破人类极限吗? 七月底,Skip 公司与始祖鸟宣布了一款新的动力外骨骼设备。 这款名为「MO/GO...
阅读原文

刚刚,Meta开源「分割一切」2.0模型,视频也能分割了

机器之心报道 机器之心编辑部还记得 Meta 的「分割一切模型」吗?这个模型在去年 4 月发布,被很多人认为是颠覆传统 CV 任务的研究。 时隔一年多,刚刚,Meta...
阅读原文

又一「国产版Sora」全球上线!清华朱军创业团队,视频生成仅需30秒

机器之心报道 作者:Sia 杨文AI 视频圈正「互扯头花」。 国外的 Luma、Runway,国内的快手可灵、字节即梦、智谱清影…… 你方唱罢我登场。无一例外,它们对标的...
阅读原文

Runway深夜炸场,Gen-3 Alpha图生视频上线,11秒让你脑洞乱飞

机器之心报道 编辑:杜伟网友不吝赞叹:AI 视觉生成又迈出了一大步。今天凌晨,Runway Gen 3 Alpha 模型的图生视频功能正式上线! 用户可以使用任何图片作为...
阅读原文

只要一张图就能「还原」绘画过程,这篇论文比爆火的Paints-UNDO实现得更早

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

「越狱」频发,如何教会大模型「迷途知返」而不是「将错就错」?

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文