标签:图片

首次!用合成人脸数据集训练的识别模型,性能高于真实数据集

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

阿里8B模型拿下多页文档理解新SOTA,324个视觉token表示一页,缩减80%

mPLUG团队 投稿量子位 | 公众号 QbitAI高效多页文档理解,阿里通义实验室mPLUG团队拿下新SOTA。 最新多模态大模型mPLUG-DocOwl 2,仅以324个视觉token表示单...
阅读原文

阶跃星辰生图模型上线,国风意境绝美,隐藏咒语曝光!

新智元报道编辑:编辑部 【新智元导读】备受期待的阶跃星辰图像生成大模型Step-1X,正式上线了!创作古诗词配图意境绝美,古典中国园林的每片叶子都很逼真,...
阅读原文

Top 40的AI图片产品,这些出海团队值得关注 | AI 应用出海洞察

文章转载自「白鲸出海」,Founder Park 略有调整。 AI 应用出海,图片赛道可能是目前最成熟、也是最卷的赛道。 不管是图片编辑、图片生成还是平面设计赛道,...
阅读原文

ECCV 2024 | 机器遗忘之后,扩散模型真正安全了吗?

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

难倒了Midjourney和FLux的问题,被它解了!AI生图的终结者杀出来了

夕小瑶科技说 原创作者 | 海野Ideogram,一个一年前发布的AI生图模型,在生成图片领域一直不温不火,甚至大有要被遗忘的趋势。 但就在昨晚,Ideogram重磅推出...
阅读原文

4秒看完2小时电影!阿里发布通用多模态大模型mPLUG-Owl3 | 开源

阿里mPLUG团队 投稿量子位 | 公众号 QbitAI4秒看完2小时电影,阿里团队新成果正式亮相—— 推出通用多模态大模型mPLUG-Owl3,专门用来理解多图、长视频。 具体...
阅读原文

AI美女全军覆没!赛博照妖镜下集体变“鬼”,AI代码拆台AI生图

明敏 克雷西 发自 凹非寺量子位 | 公众号 QbitAI赛博照妖镜下,AI美女全变鬼。 来看它的牙。 把图像饱和度拉满,AI人像的牙齿就会变得非常诡异,边界模糊不清...
阅读原文

直播打游戏的马斯克、TED演讲谷歌小姐姐到底是不是真人?网友猜到怀疑人生

机器之心报道 编辑:杨文、陈陈眼见为实?在AI时代,这句话该过时了。AI正掀起一场「造假」新风暴。近日,一项名为Deep Live Cam的直播换脸项目火了,在Githu...
阅读原文

一手实测字节版Sora,人人免费试用,iOS安卓都能玩

叨乐 发自 凹非寺量子位 | 公众号 QbitAI字节版Sora“即梦AI”上线手机应用商店。 人人可免费试用! 生成效果be like: 怎么样,是不是还挺有电影CG那味儿的。 ...
阅读原文

从 738 个失败的 AI 项目里,我们发现了 AI 创业从 0 到 1 的 3 个难点

去年我们发过一篇 2023 年创业失败的 AI 项目梳理,对「AI Graveyard(AI 坟墓)」上的项目进行了一次简单的梳理,今天这篇,是在熟悉网站上的 738 个关闭的 ...
阅读原文

免费AI神器!对照翻译带公式图表识别,支持批量识别

各位小伙伴们,今天重点介绍一款免费神器,名字为Doc2X,可以在线使用和下载客户端使用, 以及有多种第三方插件和pip包等,所有功能全部免费,下面具体展开介...
阅读原文

将图像自动文本化,图像描述质量更高、更准确了

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

AI墓地,和738个死去的AI项目|甲子光年

它们因何而死?作者|王艺‍‍‍‍ 编辑|王博 这份死亡名单上有738个名字。 其中不乏一些曾经的明星AI项目,例如OpenAI推出的AI语音识别产品Whisper.ai,Stable ...
阅读原文

字节豆包、武大提出 CAL:通过视觉相关的 token 增强多模态对齐效果

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文
1235