图像 - 第 20 页

今日arXiv最热大模型论文：复旦提出基于diffusion的虚拟试衣模型，模特一键换装

夕小瑶科技说原创作者 | 谢年年仅需上传模特图像，便可一键换装，极大提高了用户网购衣服的效率。虚拟试衣（Virtual Try-On）作为图像生成中一个商业价值高...

阅读原文

AIGC动态

2年前 (2024)

国产多模态大模型开源！无条件免费商用，性能超Claude 3 Sonnet

简曈发自凹非寺量子位 | 公众号 QbitAI又一个国产多模态大模型开源！ XVERSE-V，来自元象，还是同样的无条件免费商用。此前元象曾率先发布国内规模最大的开...

阅读原文

AIGC动态

2年前 (2024)

元象首个多模态大模型 XVERSE-V 开源，刷新权威大模型榜单，支持任意宽高比输入

人类获取的信息83%来自视觉，图文多模态大模型能感知更丰富和精确的真实世界信息，构建更全面的认知智能，从而向AGI（通用人工智能）迈出更大步伐。元象今日...

阅读原文

AIGC动态

2年前 (2024)

一键换装，让奥特曼、黄仁勋穿上机器之心的文化衫

机器之心报道编辑：陈萍、杜伟赶紧来试试吧。AI 帮你来试衣，想穿什么款式一键搞定。精准捕捉服装细节，衣服纹理、图案、缝线等属性高度还原：即使是在户外...

阅读原文

AIGC动态

2年前 (2024)

ICLR 2024 | 跨领域准确进行零样本异常检测，浙大等提出AnomalyCLIP

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术...

阅读原文

AIGC动态

2年前 (2024)

一键换装神器爆火，老黄换上抱抱脸T恤，CEO本人：我被替代了，和他争CEO职位争不过

西风发自凹非寺量子位 | 公众号 QbitAI笑不活，最新虚拟试穿神器被网友们玩坏了。黄院士、马斯克、奥特曼、史密斯等一众大佬衣服集体被扒。前有老黄卸下...

阅读原文

AIGC动态

2年前 (2024)

端侧模型 OctopusV3 来了：手机上的超级助理，性能媲美 GPT-4V 和 GPT-4 的组合？

文章转载自公众号：AI前线，本文只做学术/技术分享，如有侵权，联系删文。整理 | 傅宇琪根据一张图片，能完成什么任务？想吃菠萝了？迅速跳转 Instacart 商...

阅读原文

AIGC动态

2年前 (2024)

CVPR 2024 | 擅长处理复杂场景和语言表达，清华&博世提出全新实例分割网络架构MagNet

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术...

阅读原文

AIGC动态

2年前 (2024)

国产多模态大模型狂飙！颜水成挂帅开源Vitron，图像/视频模型割裂问题

未来可探索三大方向：系统架构、用户交互性、模态能力。编辑|ZeR0 奔向通用人工智能，大模型又迈出一大步。智东西4月25日报道，近日，由颜水成教授带队，昆...

阅读原文

AIGC动态

2年前 (2024)

颜水成挂帅，奠定「通用视觉多模态大模型」终极形态！一统理解/生成/分割/编辑

新智元报道编辑：LRS 【新智元导读】颜水成团队联合新加坡国立、南洋理工大学共同开源了Vitron模型，持从视觉理解到视觉生成、从低层次到高层次的一系列视觉...

阅读原文

AIGC动态

2年前 (2024)

加速扩散模型，最快1步生成SOT图片，字节Hyper-SD开源了

机器之心发布机器之心编辑部最近，扩散模型（Diffusion Model）在图像生成领域取得了显著的进展，为图像生成和视频生成任务带来了前所未有的发展机遇。尽管...

阅读原文

AIGC动态

2年前 (2024)

硬控设计人一分钟，加持大模型的Adobe，PS起来更香了

机器之心报道机器之心编辑部图像编辑这一块，还得看 Adobe。刚刚，Adobe 正式宣布推出新的图像生成模型 Firefly Image 3，即日起在 Firefly Web 应用程序、A...

阅读原文

AIGC动态

2年前 (2024)

又一个GPT-4 级LLM！前谷歌大脑成员初创公司官宣 Reka Core，多模态交互超越 Claude3 Opus

直播预告 | 4月25日早10点，「智猩猩机器人新青年讲座」第5讲正式开讲，谷歌DeepMind实习研究员、上海科技大学助理教授顾家远将主讲《可泛化的具身智能操作技...

阅读原文

AIGC动态

2年前 (2024)

CVPR 2024 | 基于MoE的通用图像融合模型，添加2.8%参数完成多项任务

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术...

阅读原文

AIGC动态

2年前 (2024)

小洞不补，大洞吃苦：西交、麦马开源全新「拖动式编辑」框架&数据集

新智元报道编辑：LRS 【新智元导读】最新拖拽式编辑框架GoodDrag主要创新点包括Alternating Drag and Denoising和information-preserving motion supervision...

阅读原文

AIGC动态

2年前 (2024)

标签：图像