标签:图像

再见,平面设计师?COLE 结合多个人工智能,按需生成可编辑设计

点击上方蓝字关注我们​“ COLE是一款潜力巨大的平面设计工具,能够通过输入文本提示生成高质量设计,具有可编辑文本和图像对象。虽然目前还不是成熟产品,但已...
阅读原文

AI视觉字谜爆火!梦露转180°秒变爱因斯坦,英伟达高级AI科学家:近期最酷的扩散模型

克雷西 萧箫 发自 凹非寺量子位 | 公众号 QbitAIAI画的玛丽莲·梦露,倒转180°后,竟然变成了爱因斯坦?!这是最近在社交媒体上爆火的扩散模型视错觉画,随便...
阅读原文

《古墓丽影》初代劳拉,“真人”原来长这样

克雷西 萧箫 发自 凹非寺量子位 | 公众号 QbitAI用AI把经典老游戏“重画一遍”,这个愿望如今可能真的要实现了。PS 1《古墓丽影》中的像素风劳拉,让AI上手改画...
阅读原文

任意文本、视觉、音频混合生成,多模态有了强大的基础引擎CoDi-2

机器之心报道编辑:杜伟、大盘鸡研究者表示,CoDi-2 标志着在开发全面的多模态基础模型领域取得了重大突破。今年 5 月,北卡罗来纳大学教堂山分校、微软提出...
阅读原文

全网都在模仿的「科目三」,梅西、钢铁侠、二次元小姐姐马上拿下

机器之心报道机器之心编辑部来自阿里的研究团队提出了一种名为 Animate Anyone 的方法,只需一张人物照片,再配合骨骼动画引导,就能生成动画视频。最近一段...
阅读原文

SDXL Turbo、LCM相继发布,AI画图进入实时生成时代:字打多快,出图就有多快

机器之心报道机器之心编辑部使用一块 A100,出图的延迟只有 200 毫秒。本周二,Stability AI 推出了新一代图像合成模型 Stable Diffusion XL Turbo,引发了一...
阅读原文

太可怕了!AI虚假图片已经达到了新闻摄影获奖的程度…

夕小瑶科技说 原创作者 | 杨灿首先请大家看一副入围新闻摄影获奖的作品:战争期间,一名受伤的以色列年轻女子正痛苦地抓着士兵的手臂。这抓拍的角度,这女子...
阅读原文

超越同级7B模型! 中国团队开源大规模高质量图文数据集ShareGPT4V,大幅提升多模态性能

新智元报道编辑:LRS【新智元导读】研究人员利用GPT4-Vision构建了一个大规模高质量图文数据集ShareGPT4V,并在此基础上训练了一个7B模型,在多项多模态榜单...
阅读原文

ChatGPT提示词新玩法「make it more」,文生图效果翻倍

机器之心报道编辑:杜伟一个非常好用的 ChatGPT 提示词技巧。ChatGPT 想来大家都不陌生了,但如何用好它却没有想象中的那么容易。尤其是在文生图任务中,提示...
阅读原文

我的眼睛就是尺!80亿参数OtterHD带你「清明上河图」数骆驼!南洋理工华人团队打造

新智元报道编辑:好困【新智元导读】最近,由南洋理工华人团队新提出的80亿参数多模态大模型OtterHD,不仅可以搞定让GPT-4V都发愁的难题,甚至还可以数出来《...
阅读原文

单个A100生成3D图像只需30秒,这是Adobe让文本、图像都动起来的新方法

机器之心报道编辑:杜伟、佳琪3D 生成是 AI 视觉领域的研究热点之一。本文中,来自 Adobe 研究院和斯坦福大学等机构的研究者利用基于 transformer 的 3D 大型...
阅读原文

文生图10倍速,视频实时渲染!清华发布LCM:兼容全部SD大模型、LoRA、插件等

新智元报道作者:谭炜达编辑:LRS 好困【新智元导读】全面兼容Stable Diffusion生态,LCM模型成功实现5-10倍生成速度的提升,实时AI艺术时代即将到来,所想即...
阅读原文

Stable Video Diffusion来了,代码权重已上线

机器之心报道机器之心编辑部Stability AI 的视频生成模型看来效果不错。AI 画图的著名公司 Stability AI,终于入局 AI 生成视频了。本周二,基于 Stable Diff...
阅读原文

文生图大型实践:揭秘百度搜索 AIGC 绘画工具的背后故事!

嘉宾 | 鱼哲、TianBao编辑 | Tina自从进入 2023 年以来,AIGC 技术已催生了新一轮人工智能浪潮。AI 绘画作为大模型最引人瞩目的应用领域之一,近年来也取得了...
阅读原文

GPT-4V医学执照考试成绩超过大部分医学生,AI加入临床还有多远?

机器之心专栏机器之心编辑部人工智能(AI)在医学影像诊断方面的应用已经有了长足的进步。然而,在未经严格测试的情况下,医生往往难以采信人工智能的诊断结...
阅读原文
1363738394048