标签:模型

苹果AI版iOS首日火爆:秒变高情商,大模型成最强嘴替,Siri华丽变身

克雷西 发自 凹非寺量子位 | 公众号 QbitAI它来了它来了,苹果的Apple Intelligence终于与果粉见面了! 随着iOS 18.1 Beta版的上线,注册开发者从即日起就能...
阅读原文

Meta「分割一切」进化2.0!一键跟踪物体,代码权重数据集全开源,网友:真正的OpenAI

明敏 发自 凹非寺量子位 | 公众号 QbitAI又是发布即开源! Meta“分割一切AI”二代SAM2在SIGGRAPH上刚刚亮相。 相较于上一代,它的能力从图像分割拓展到视频分...
阅读原文

寡姐带货国风Polo衫,马斯克穿牛仔走红毯!虚拟试衣新框架火了,只需两张图30秒即生成

种政 投稿自 凹非寺量子位 | 公众号 QbitAI只需两张图像,不到30秒,就能让马斯克穿牛仔走红毯~ 或者让寡姐带货国风Polo衫~ 就是二次元换装也不在话下。 来自...
阅读原文

防不胜防!AI几米外隔空窥屏,HDMI线把信号泄露到空气里了

一水 发自 凹非寺量子位 | 公众号 QbitAI防不胜防!黑客通过显示器数据线泄露的信号,就能偷窥你的屏幕内容。 具体来说,是HDMI数据线的电磁辐射,会把一些显...
阅读原文

一万亿token!34亿张图像,扩大10倍!史上最大开源多模态数据集MINT-1T发布!

夕小瑶科技说 原创作者 | 谷雨龙泽众所周知,现在训练AI最需要的是什么? 数据,数据,还是数据。——毕竟只有让AI学好了,AI才能好好地回答你的问题,否则就会...
阅读原文

今日arXiv最热大模型论文:北京大学最新综述:视觉大模型中的漏洞与攻防对抗

夕小瑶科技说 原创作者 | 谢年年近年来,视觉语言大模型(LVLM)在文本转图像、视觉问答等任务中大放异彩,背后离不开海量数据、强大算力和复杂参数的支撑。 ...
阅读原文

小扎老黄亲密换衣炉边对谈!小扎竟破防爆粗,老黄自曝第一批Blackwell已出炉

新智元报道编辑:编辑部 【新智元导读】就在刚刚,老黄在SIGGRAPH大会上透露:Blackwell的工程样片,已在本周正式向全世界发送!随后,老黄和小扎展开了炉边...
阅读原文

苹果AI震撼上线iPhone,进化版Siri却没有ChatGPT!47页技术报告揭秘自研模型

新智元报道编辑:编辑部 【新智元导读】今早,所有开发者们被突如其来iOS 18.1测试版砸晕了!没想到,苹果AI这就可以上手尝鲜了,一大波测评刷屏全网。更惊喜...
阅读原文

CV又不存在了?Meta「分割一切」2.0正式开源,视频也能分割了

新智元报道编辑:编辑部 【新智元导读】Meta又双叒开源了!继去年初代SAM掀翻CV圈之后,SAM 2也完成了终极进化,不仅能分割图像,最惊艳的是还能分割视频。这...
阅读原文

AI也会「刷抖音」!清华领衔发布短视频全模态理解新模型 | ICML 2024

新智元报道编辑:LRST 好困 【新智元导读】音视频大语言模型在处理视频内容时,往往未能充分发挥语音的作用。video-SALMONN模型通过三部分创新:音视频编码和...
阅读原文

杀疯了!Meta开源SAM-2:可商用,随意分割视频、图像

9月6-7日,2024全球AI芯片峰会将在北京召开。目前,AMD人工智能事业部高级总监王宏强,清华大学交叉信息研究院助理教授、北极雄芯创始人马恺声,珠海芯动力创...
阅读原文

刚刚,Meta开源「分割一切」2.0模型,视频也能分割了

机器之心报道 机器之心编辑部还记得 Meta 的「分割一切模型」吗?这个模型在去年 4 月发布,被很多人认为是颠覆传统 CV 任务的研究。 时隔一年多,刚刚,Meta...
阅读原文

又一「国产版Sora」全球上线!清华朱军创业团队,视频生成仅需30秒

机器之心报道 作者:Sia 杨文AI 视频圈正「互扯头花」。 国外的 Luma、Runway,国内的快手可灵、字节即梦、智谱清影…… 你方唱罢我登场。无一例外,它们对标的...
阅读原文

「越狱」频发,如何教会大模型「迷途知返」而不是「将错就错」?

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

黄仁勋对谈扎克伯格:Llama 4或将摆脱机器人形态|甲子光年

黄仁勋认为,Llama 2的发布是2023年最重要的AI事件。作者|田思奇 北京时间7月30日清晨,英伟达创始人兼CEO黄仁勋与Meta创始人兼CEO马克·扎克伯格,在美国丹...
阅读原文