标签:关键
AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!
这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...
李飞飞团队再造黑科技!机器人自学家务样样精通,开源代码了解一下?
机器人比你还懂家务!这就是未来的生活方式。作者丨刘洁 编辑丨岑峰 倒茶、叠衣服、整理书籍、丢垃圾,现在的家务机器人干活真是越来越熟练了。 不过,也不是...
GPT-4结合SAM2:免训练多模态分割的全新解决方案!| 已开源
北京航空航天大学 李红羽 投稿 凹非寺量子位 | 公众号 QbitAI免训练多模态分割领域有了新突破! 中科院信工所、北航、合工大、美团等单位联合提出了一种名为A...
李飞飞团队提出ReKep,让机器人具备空间智能,还能整合GPT-4o
机器之心报道 编辑:Panda视觉与机器人学习的深度融合。当两只机器手丝滑地互相合作叠衣服、倒茶、将鞋子打包时,加上最近老上头条的 1X 人形机器人 NEO,你...
首个WebAgent在线评测框架和流程数据管理平台来了,GPT-4、Qwen登顶闭源和开源榜首!
夕小瑶科技说 原创作者 | 潘奕琛、孔德涵、周思达、崔成 在当今科技迅速发展的时代,大型语言模型(Large Language Model,LLM)正以前所未有的速度改变着我...
快手开源LivePortrait,GitHub 6.6K Star,实现表情姿态极速迁移
机器之心发布 机器之心编辑部近日,快手可灵大模型团队开源了名为LivePortrait的可控人像视频生成框架,该框架能够准确、实时地将驱动视频的表情、姿态迁移...
年度高端手机决战打响:折叠屏打先锋,AI和轻薄成对抗焦点
AI手机激战正酣,荣耀折叠屏Magic V3再添杀招。 作者|程茜 编辑|漠影 年度折叠屏旗舰大战打响,各家新机涌现…… 折叠屏经过近六年发展,如今产品的对决已经进...
破解智能与意识本质需解决的五个关键问题
前言:本文是根据论文“飞行模型:智能与意识基本原理的新探索”的部分内容进行扩展形成,主要对构建智能和意识的基本原理需要面对的关键问题进行探讨。论文地...
美国AI禁令再升级:在美从事AI职业中国人或需要特殊许可
新智元报道编辑:Aeneas 好困 【新智元导读】最近美国众议院通过的这项议案,对在美从事AI工作的个人施加了更加严格的限制。如果法案通过,在美从事AI工作的...
用基础模型指导特征传播,首个泛化型图像匹配器OmniGlue搞定未见过域
机器之心报道 编辑:杜伟第一个以「泛化」能力为核心设计原则的可学习图像匹配器来了!对于想要获取两张图像之间的细粒度视觉对应关系而言,局部图像特征匹配...
ICLR 2024 | 联邦学习后门攻击的模型关键层
机器之心专栏 机器之心编辑部联邦学习使多个参与方可以在数据隐私得到保护的情况下训练机器学习模型。但是由于服务器无法监控参与者在本地进行的训练过程,参...
复旦发布MovieLLM,让大模型看懂电影
夕小瑶科技说 原创作者 | 谢年年前两天我们介绍了大模型写歌神器点击即可播放!港中文发布大模型写歌神器! 最近,复旦又发布了合成高质量长视频数据的新框架...
清华叉院、理想提出DriveVLM,视觉大语言模型提升自动驾驶能力
机器之心报道 编辑:泽南在自动驾驶领域,研究人员也在朝着 GPT/Sora 等大模型方向进行探索。 与生成式 AI 相比,自动驾驶也是近期 AI 最活跃的研究和开发领...
谷歌DeepMind&CMU利用大模型让机器狗像人一样高效使用工具!搭建桥梁、利用杠杆原理搬起重物都不在话下
夕小瑶科技说 原创作者 | 谢年年工具的使用一直以来被认为是高级智能的重要特征。人类与一些动物会借助工具,实现仅靠自身无法达到的任务,比如大猩猩🦍会利用...
多模态LLM幻觉问题降低30%!业内首个“啄木鸟”免重训方法诞生|中科大
丰色 发自 凹非寺量子位 | 公众号 QbitAI还在用指令微调解决多模态大模型的“幻觉”问题吗?比如下图中模型将橙色柯基错认为“红狗”,还指出周围还有几条。现在...