标签:图像

首个中文原生DiT架构,已开源!大模型Hunyuan-DiT技术报告详解

直播预告 | 5月23日晚7点,「智猩猩机器人新青年讲座」第6讲正式开讲,论文一作、清华大学在读博士郭旭东将直播讲解《大模型在具身多智能体合作中的研究进展...
阅读原文

Meta首发「变色龙」挑战GPT-4o,34B参数引领多模态革命!10万亿token训练刷新SOTA

新智元报道编辑:桃子乔杨 【新智元导读】GPT-4o发布不到一周,首个敢于挑战王者的新模型诞生!最近,Meta团队发布了「混合模态」Chameleon,可以在单一神经...
阅读原文

多模态AI是医学的未来,谷歌推出三个新模型,Med-Gemini迎来大升级

将 ScienceAI设为星标 第一时间掌握 新鲜的 AI for Science 资讯编辑 | 白菜叶 许多临床任务需要了解专业数据,例如医学图像、基因组学,这类专业知识信息在...
阅读原文

Tunnel Try-on:阿里最新视频试衣生成算法

直播预告 | 5月23日晚7点,「智猩猩机器人新青年讲座」第6讲正式开讲,论文一作、清华大学在读博士郭旭东将直播讲解《大模型在具身多智能体合作中的研究进展...
阅读原文

收集30GB、近20万对训练样本,复旦大学团队发布UniFMIR:用AI突破显微成像极限

作者:梅菜 编辑:李宝珠,三羊 复旦大学计算机科学技术学院研究团队,提出了跨任务、多维度图像增强基础 AI 模型 UniFMIR,实现了对现有荧光显微成像极限的...
阅读原文

首个高光谱显着目标检测基准数据集上线;参与创作者激励计划,百分百得现金大奖!

本周, OpenAI 和 Google 接连在发布会中投出核弹级产品💣。OpenAI 还是一贯地爱抢新闻焦点,在 Google I/O 大会前发布了 GPT-4o。而 Google 也频出大招,正面...
阅读原文

StyleMamba:图片风格不满意?一句话就能调!

夕小瑶科技说 原创作者 | Axe_越你与哈利波特的距离,只剩一个StyleMamba! “我想,把我的图变成朦胧马赛克” “我想,我的画能不能变成美美的莫奈风格” “我想...
阅读原文

GPT-4o再秀神操作,“复现”OpenAI总裁讲课,网友当真了

白交 发自 凹非寺量子位 | 公众号 QbitAI再见了,DALL-E! OpenAI总裁兼联合创始人Greg再次大秀GPT-4o操作,结果网友直接缅怀DALL-E。 直接看效果。 文本拼写...
阅读原文

谷歌反击:Project Astra正面硬刚GPT-4o、Veo对抗Sora、新版Gemini变革搜索

机器之心报道 机器之心编辑部这就是谷歌对 OpenAI 的回应。通用的 AI,能够真正日常用的 AI,不做成这样现在都不好意思开发布会了。 5 月 15 日凌晨,一年一...
阅读原文

Google 发布「AI 全家桶」反击 GPT-4o !搜索引擎罕见大更新, 121 句「AI 」道尽焦虑

紧跟步伐 绝不落后昨晚 OpenAI 发布了 ChatGPT-4o 后,压力就给到了 Google I/O ,仿佛 Google 无论如何也摆脱不了「AI 界的汪峰」这一称号。 而 Google 则通...
阅读原文

今日arXiv最热CV大模型论文:国产开源视觉大模型InternVL 1.5发布,赶超GPT-4V水准

夕小瑶科技说 原创作者 | 墨墨2023年9月,OpenAI发布了多模态大模型GPT-4V,开启了多模态研究热潮。短短8个月时间内,闭源模型如Gemini系列, Qwen-VL-Max,开...
阅读原文

一线创业者圆桌讨论:多模态 AI 的创业机会在于「有用」

多模态 AI 无疑是今年大模型的发展重点之一,Sora、Midjourney、Suno 等文生视频、文生图、文生音乐赛道的代表产品也是用户的关注热点。 多模态 AI 如何落地...
阅读原文

DiT架构大一统:一个框架集成图像、视频、音频和3D生成,可编辑、能试玩

机器之心报道 编辑:杜伟、大盘鸡基于 Diffusion Transformer(DiT)又迎来一大力作「Flag-DiT」,这次要将图像、视频、音频和 3D「一网打尽」。今年 2 月初...
阅读原文

Nature论文:斯坦福团队研发出普通眼镜尺寸的新一代AR头盔

大数据文摘受权转载自头部科技 已经有太多AR设备出现,但都不算成功,斯坦福希望能改变世界。 来自斯坦福大学的科研团队最近展示一件新产品,它是一款原型AR...
阅读原文

跟着开源的InternVL,学习如何做自己的GPT-4V

随着人工智能生成内容(AIGC)的快速发展,多模态大型语言模型(MLLM)在理解和生成结合视觉与语言的信息方面展现出巨大潜力。然而,现有的开源MLLM与商业模...
阅读原文
12331