标签:图片
融合ChatGPT+DALL·E 3,贾佳亚团队新作开源畅玩:识图推理生图一站解决
允中 发自 凹非寺量子位 | 公众号 QbitAI在开源社区中把GPT-4+Dall·E 3能⼒整合起来的模型该有多强? 香港中文大学终身教授贾佳亚团队提出多模态模型Mini-Gem...
贾佳亚团队新模型对标ChatGPT+DALL-E 3王炸组合!读懂梗图刷爆榜单,代码复现数学函数
新智元报道编辑:编辑部 【新智元导读】贾佳亚团队提出VLM模型Mini-Gemini,堪比GPT-4+DALL-E 3王炸组合,一上线就刷爆了多模态任务榜单!读得懂梗图,做得了...
生图超级外挂!贾佳亚团队提出 VLM 模型 Mini-Gemini,堪比 GPT4+DALLE3 王炸组合
更高清图像的精确理解、更高质量的训练数据、更强的图像解析推理能力,还能结合图像推理和生成,香港中文大学终身教授贾佳亚团队提出的这款多模态模型Mini-Ge...
刷爆多模态任务榜单!贾佳亚团队Mini-Gemini登热榜,代码、模型、数据全部开源
机器之心发布 机器之心编辑部Mini-Gemini 堪比 GPT4+DALLE3 王炸组合。更高清图像的精确理解、更高质量的训练数据、更强的图像解析推理能力,还能结合图像推...
Agent > GPT5?吴恩达最新演讲:四种 Agent 设计范式(通俗易懂版)
吴恩达教授最近在红杉 AI 峰会上讲述了他对 Agent 的一些看法,尽管一些媒体已经进行了相关报道,但为了分发的及时性,而采用了机翻的方式,牺牲了表述的准确...
内含教程丨最高可降低 16 倍成本,ComfyUI Stable Cascade 教程已上线,一键部署!
作者:十九 编辑:李宝珠 今年 2 月,Stability AI 开源了文生图模型 Stable Cascade。相比于 Stable Diffusion 1.5,Stable Cascade 可以降低 16 倍成本。20...
ChatGPT现在能帮你P图了,只需简单说几个字
机器之心报道 作者:泽南、陈萍游戏规则已经改变。现在,不论是网页、iOS 还是安卓版的 ChatGPT,都可以用上 DALL-E 3 强大的编辑图像功能了。OpenAI 的 DALL...
阿里7B多模态文档理解大模型拿下新SOTA|开源
mPLUG团队 投稿量子位 | 公众号 QbitAI多模态文档理解能力新SOTA! 阿里mPLUG团队发布最新开源工作mPLUG-DocOwl 1.5,针对高分辨率图片文字识别、通用文档结...
“计算机视觉女神”被IEEE期刊封杀
西风 发自 凹非寺量子位 | 公众号 QbitAI计算机学术界的女神“Lenna”被IEEE“封杀”了—— IEEE计算机协会宣布,4月1日起不再接收包含该图像的论文。 △Lenna图IEEE...
打败 Midjourney,这个 Google 大牛推出的 AI 产品凭什么弯道超车
这可能是 最懂文字 的AI模型没有谁能一直称王,但加上前缀谁都有称王的机会。 AI 文生图,还能玩出什么新花样? 在这片群雄割据的红海,头部被 Midjourney、D...
技术神秘化的去魅:Sora关键技术逆向工程图解
智猩猩与智东西将于4月18-19日在北京共同举办2024中国生成式AI大会,阿里巴巴通义千问大模型技术负责人周畅,Open-Sora开发团队潞晨科技创始人尤洋,「清华系...
全新「多模态」生图AI文字渲染暴打Midjourney+DALL·E 3!5亿融资Karpathy都投了
新智元报道编辑:润 好困 【新智元导读】Ideogram凭借不输Midjourney的生图能力和遥遥领先的图片中文字渲染能力,获得了包括Jeff Dean和Karpathy在内一众大佬...
Sora外部测试翻车了!3个视频都有Bug
衡宇 发自 凹非寺量子位 | 公众号 QbitAI终于有OpenAI之外的人,放出自己亲测的Sora视频了! 请看第一个视频,来自油管科技up主: 它的prompt是,“光线昏暗的...
2023年,被用户放弃了的 Top AI 产品有哪些?
2023 年,a16z 曾推出 2023 年上半年 AI 产品榜单《全球最火的 50 个 AI 应用都是哪些?》,Founder Park 此前曾对榜单内的应用进行了归纳和分析。 如今半年...
Gemini被曝光歧视白人,Google再次被围攻,马斯克也加入了!
夕小瑶科技说 原创作者 | 付奶茶Gemini从诞生到今天,出现了不少瓜,最近它又被围攻了!这次它摊上了美国最敏感的种族歧视问题,而且与传统意义的种族歧视相...