标签:语义

阿里文生视频挑战Gen-2、Pika,1280×720分辨率无压力,3500万文本-视频对显奇效

机器之心报道编辑:张倩、陈萍文生视频领域又卷起来了!文生视频可以精细到什么程度?最近,阿里巴巴的一项研究给出了答案:1280×720 分辨率没有压力,而且生...
阅读原文

后期狂喜!一张照片丝滑替换视频主角,动作幅度再大也OK|Meta&新加坡国立大学

丰色 发自 凹非寺量子位 | 公众号 QbitAI后期狂喜了家人们~现在,只需一张图片就能替换视频主角,效果还是如此的丝滑!且看这个叫做“VideoSwap”的新视频编辑...
阅读原文

让3D编辑像PS一样简单,新算法GaussianEditor在几分钟内完成3D场景增删改

机器之心专栏机器之心编辑部3D 编辑在游戏和虚拟现实等领域中发挥着至关重要的作用,然而之前的 3D 编辑苦于耗时间长以及可控性差等问题,很难应用到实际场景...
阅读原文

「无需配对数据」就能学习!浙大等提出连接多模态对比表征C-MCR|NeurIPS 2023

新智元报道编辑:LRS 好困【新智元导读】C-MCR利用现有多模态对比表征间可能存在的重叠模态,来连接不同的对比表征,从而学到更多模态间的对齐关系,实现了在...
阅读原文

用AI大模型「改造」QQ浏览器搜索,腾讯独家揭秘

机器之心专栏作者:周天华、马晋、刘杰腾讯QQ浏览器搜索应用部1:引言自从搜索引擎问世以来,信息检索算法历经多次技术更迭,其演进的历程可大致归纳为四个技...
阅读原文

港大开源推荐系统新范式RLMRec!大模型加持,准确提炼用户/商品文本画像

新智元报道编辑:LRS【新智元导读】本文提出了一种简易且高效的基于大语言模型的表征学习(Representation Learning)范式。基于该范式模型无关的特性,将其...
阅读原文

浙大拿下唯一最佳论文奖,中国团队喜获三项大奖!ACM MultiMedia 2023奖项揭幕

新智元报道编辑:LRS【新智元导读】ACM MM 2023上中国团队获三项大奖,多媒体领域再获新突破。近日,2023 ACM MultiMedia会议落下帷幕,中国大陆团队在这次国...
阅读原文

用语言对齐多模态信息,北大腾讯等提出LanguageBind,刷新多个榜单

机器之心专栏机器之心编辑部北京大学与腾讯等机构的研究者们提出了多模态对齐框架 ——LanguageBind。该框架在视频、音频、文本、深度图和热图像等五种不同模态...
阅读原文

视觉霸主SAM和文图霸主CLIP强强联合!苹果联合UIUC,发布统一视觉模型SAM-CLIP,或掀起多模态新浪潮

夕小瑶科技说 原创作者 | ZenMoore相信大家对 SAM[1] 并不陌生,它是 Meta 此前发布的 Segment Anything Model (分割一切模型)。一经发布便火遍全网震惊世界...
阅读原文

北大团队:诱导大模型“幻觉”只需一串乱码!大小羊驼全中招

kid 投稿自 凹非寺量子位 | 公众号 QbitAI北大团队最新研究发现:随机token都能诱发大模型出现幻觉!比如喂给大模型(Vicuna-7B)一段“乱码”,它就莫名其妙弄...
阅读原文

“大大震惊”一位CTO:GPT-4V自动驾驶五连测

编者按:GPT-4V的到来,给AI又带来了无限可能。近日,图森中国CTO王乃岩在知乎发表的《GPT-4V在自动驾驶中初探》引发了不少关注。在多项测试之后,他本人表示...
阅读原文

CityDreamer:一键生成无边界的3D城市

机器之心专栏机器之心编辑部近些年,3D 自然场景的生成出现了大量的研究工作,但是 3D 城市生成的研究工作还寥寥无几。这主要是因为 3D 城市生成更难,人类对...
阅读原文

他们是精神分裂吗?最新研究:AI 语言模型能更好地告诉你

良好的精神健康对我们的整体健康和幸福至关重要。在昨天(10 月 10 日)的世界精神卫生日相关博客中,世界卫生组织(WHO)提到:“全球每八个人中就有一人患有...
阅读原文

西交、清华等发布多模态大模型,有望成为「DALL·E 4」技术路线?和AI一起「白日作梦」

新智元报道编辑:LRS【新智元导读】DALL·E 3让我们看到了生成+理解的大语言模型的魔力。就在其发布的同一天,国内的一个新工作引起了社区的关注:DreamLLM。D...
阅读原文

智源开放3亿条语义向量模型训练数据, BGE模型持续迭代更新

机器之心专栏机器之心编辑部伴随着大模型开发和应用的火热发展,作为大模型核心基础组件的 Embedding 重要性愈发凸显。智源于一月前发布的开源可商用中英文语...
阅读原文
13456