标签:图像

GPT-4V在自动驾驶上应用前景如何?面向真实场景的全面测评来了

机器之心报道机器之心编辑部GPT-4V 的发布让许多计算机视觉(CV)应用看到了新的可能。一些研究人员开始探索 GPT-4V 的实际应用潜力。最近,一篇题为《On the...
阅读原文

效果超越SDXL!港中大博士生推出超真实人像合成工具,训练用了3.4亿张图

克雷西 发自 凹非寺量子位 | 公众号 QbitAI为了让AI画出的人更加逼真,港中大博士生用了3.4亿张图像专门训练画人。人物的表情、姿态,环境的空间关系、光线都...
阅读原文

现在ChatGPT能将草图变成可操作的软件

点击上方蓝字关注我们“ 最新发布的“Make it Real”功能原型让用户将他们绘制的软件图像轻松变成可操作的现实,借助OpenAI的GPT-4V API,它将矢量绘图转化为易...
阅读原文

Meta生成式AI连放大招:视频生成超越Gen-2,动图表情包随心定制

机器之心报道编辑:张倩、陈萍生成式 AI 进入视频时代了。提到视频生成,很多人首先想到的可能是 Gen-2、Pika Labs。但刚刚,Meta 宣布,他们的视频生成效果...
阅读原文

媲美Gen-2,Meta多模态创AI生图新里程碑!破文生视频历史难题,静图秒变视频逼真到炸裂

新智元报道编辑:编辑部【新智元导读】文生视频,直接被革命了!Meta连发两个重磅研究,多模态模型Emu的变体 Emu Video和Emu Edit联动解锁生成式AI未来。就在...
阅读原文

让Stable Diffusion一秒出图!清华硕士加速神器爆火,已有公司接入

克雷西 发自 凹非寺量子位 | 公众号 QbitAIAI图像生成,已经进入了秒速级别,只要4步推理就能完成绘制,最快更是能在1秒之内完成。现在,清华大学联合Hugging...
阅读原文

Meta发布Emu AI工具:革新图像和视频创作

点击上方蓝字关注我们“ Meta公司宣布Emu Edit和Emu Video两项AI内容创作工具,革新图像和视频创作,提供更直观、创意的编辑功能,将改变社交媒体平台上的创作...
阅读原文

终结扩散模型,IGN单步生成逼真图像!UC伯克利谷歌革新LLM,美剧成灵感来源

新智元报道编辑:桃子【新智元导读】生成式AI模型的新范式要来了。UC伯克利谷歌提出幂等生成网络(IGN),只需单步即可生图。已经红遍半边天的扩散模型,将被...
阅读原文

GPT-4作弊被抓!吉娃娃or松饼打乱顺序就出错,LeCun:警惕在训练集上测试

梦晨 发自 凹非寺量子位 | 公众号 QbitAIGPT-4解决网络名梗“吉娃娃or蓝莓松饼”,一度惊艳无数人。然鹅,现在它被指出“作弊”了!全用原题中出现的图,只是打乱...
阅读原文

UNC斯坦福等曝光GPT-4V意外漏洞,被人类哄骗数出8个葫芦娃!LeCun和Jim Fan震惊了

新智元报道编辑:编辑部【新智元导读】最近,GPT-4V接连被曝重大缺陷,会把吉娃娃认成松饼,只要一被忽悠就会同意图中的葫芦娃中有8个!不过,最近大家发现,...
阅读原文

ICLR 2024论文审稿结果出炉!7000+高产论文创新纪录,扩散模型占比最高

新智元报道编辑:桃子 好困【新智元导读】ICLR 2024论文审稿终于出结果了,今年7000多片论文提交,创下有史以来最新记录。ICLR 2024审稿结果公布了!ICLR是机...
阅读原文

连葫芦娃都数不明白,解说英雄联盟的GPT-4V面临幻觉挑战

‍‍机器之心报道编辑:张倩、小舟让大模型同时理解图像和文字可能比想象中要难。在被称为「AI 春晚」的 OpenAI 首届开发者大会拉开帷幕后,很多人的朋友圈都被...
阅读原文

视觉分词器统一图文信息,快手提出基座模型 LaVIT 刷榜多模态任务

夕小瑶科技说 原创作者 | 智商掉了一地、Python你是否想过,有朝一日能够仅输入寥寥数语或图片,就可以一键检索最为匹配的短视频内容。不是凭借视频标签、也...
阅读原文

通用异常检测新曙光:华科大等揭秘GPT-4V的全方位异常检测表现

机器之心专栏机器之心编辑部异常检测任务旨在识别明显偏离正常数据分布的异常值,在工业检验、医学诊断、视频监控和欺诈检测等多个领域都发挥了重要作用。传...
阅读原文

DALL·E 3遭起诉!OpenAI的版权策略被吐槽像是一场闹剧!

夕小瑶科技说 原创作者 | 芒果、王二狗OpenAI 9月发布的 DALL·E 3可谓是惊艳众人,广大普通用户用了都说好!但是艺术家群体却例外,他们觉得自己的艺术遭到了...
阅读原文
1373839404148