标签:图像
今日arXiv最热大模型论文:复旦提出基于diffusion的虚拟试衣模型,模特一键换装
夕小瑶科技说 原创作者 | 谢年年仅需上传模特图像,便可一键换装,极大提高了用户网购衣服的效率。 虚拟试衣(Virtual Try-On)作为图像生成中一个商业价值高...
国产多模态大模型开源!无条件免费商用,性能超Claude 3 Sonnet
简曈发自 凹非寺量子位 | 公众号 QbitAI又一个国产多模态大模型开源! XVERSE-V,来自元象,还是同样的无条件免费商用。 此前元象曾率先发布国内规模最大的开...
元象首个多模态大模型 XVERSE-V 开源,刷新权威大模型榜单,支持任意宽高比输入
人类获取的信息83%来自视觉,图文多模态大模型能感知更丰富和精确的真实世界信息,构建更全面的认知智能,从而向AGI(通用人工智能)迈出更大步伐。 元象今日...
一键换装,让奥特曼、黄仁勋穿上机器之心的文化衫
机器之心报道 编辑:陈萍、杜伟赶紧来试试吧。AI 帮你来试衣,想穿什么款式一键搞定。 精准捕捉服装细节,衣服纹理、图案、缝线等属性高度还原:即使是在户外...
ICLR 2024 | 跨领域准确进行零样本异常检测,浙大等提出AnomalyCLIP
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
一键换装神器爆火,老黄换上抱抱脸T恤,CEO本人:我被替代了,和他争CEO职位争不过
西风 发自 凹非寺量子位 | 公众号 QbitAI笑不活,最新虚拟试穿神器被网友们玩坏了。 黄院士、马斯克、奥特曼、史密斯等一众大佬衣服集体被扒。 前有老黄卸下...
端侧模型 OctopusV3 来了:手机上的超级助理,性能媲美 GPT-4V 和 GPT-4 的组合?
文章转载自公众号:AI前线,本文只做学术/技术分享,如有侵权,联系删文。整理 | 傅宇琪 根据一张图片,能完成什么任务? 想吃菠萝了?迅速跳转 Instacart 商...
CVPR 2024 | 擅长处理复杂场景和语言表达,清华&博世提出全新实例分割网络架构MagNet
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
国产多模态大模型狂飙!颜水成挂帅开源Vitron,破解图像/视频模型割裂问题
未来可探索三大方向:系统架构、用户交互性、模态能力。 编辑|ZeR0 奔向通用人工智能,大模型又迈出一大步。 智东西4月25日报道,近日,由颜水成教授带队,昆...
颜水成挂帅,奠定「通用视觉多模态大模型」终极形态!一统理解/生成/分割/编辑
新智元报道编辑:LRS 【新智元导读】颜水成团队联合新加坡国立、南洋理工大学共同开源了Vitron模型,持从视觉理解到视觉生成、从低层次到高层次的一系列视觉...
加速扩散模型,最快1步生成SOTA级图片,字节Hyper-SD开源了
机器之心发布 机器之心编辑部最近,扩散模型(Diffusion Model)在图像生成领域取得了显著的进展,为图像生成和视频生成任务带来了前所未有的发展机遇。尽管...
硬控设计人一分钟,加持大模型的Adobe,PS起来更香了
机器之心报道 机器之心编辑部图像编辑这一块,还得看 Adobe。刚刚,Adobe 正式宣布推出新的图像生成模型 Firefly Image 3,即日起在 Firefly Web 应用程序、A...
又一个GPT-4 级LLM!前谷歌大脑成员初创公司官宣 Reka Core,多模态交互超越 Claude3 Opus
直播预告 | 4月25日早10点,「智猩猩机器人新青年讲座」第5讲正式开讲,谷歌DeepMind实习研究员、上海科技大学助理教授顾家远将主讲《可泛化的具身智能操作技...
CVPR 2024 | 基于MoE的通用图像融合模型,添加2.8%参数完成多项任务
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
小洞不补,大洞吃苦:西交、麦马开源全新「拖动式编辑」框架&数据集
新智元报道编辑:LRS 【新智元导读】最新拖拽式编辑框架GoodDrag主要创新点包括Alternating Drag and Denoising和information-preserving motion supervision...