标签:图像

2张图2秒钟3D重建!这款AI工具火爆GitHub,网友:忘掉Sora

丰色 发自 凹非寺量子位 | 公众号 QbitAI只需2张图片,无需测量任何额外数据—— 当当,一个完整的3D小熊就有了: 这个名为DUSt3R的新工具,火得一塌糊涂,才上...
阅读原文

复旦等发布AnyGPT:任意模态输入输出,图像、音乐、文本、语音都支持

机器之心报道 机器之心编辑部最近,OpenAI 的视频生成模型 Sora 爆火,生成式 AI 模型在多模态方面的能力再次引起广泛关注。 现实世界本质上是多模态的,生物...
阅读原文

ControlNet作者又出新作:百万数据训练,AI图像生成迎来图层设计

机器之心报道 编辑:陈萍、杜伟有人表示:「等待已久的 AI 图像创建功能终于迎来了图层!」尽管用于生成图像的大模型已经成为计算机视觉和图形学的基础,但令...
阅读原文

Stable Diffusion 解读(一):回顾早期工作

智猩猩和智东西发起主办的2024中国生成式AI大会将于4月18-19日在北京举办。主会场将进行开幕式、大模型专场、AI Infra专场和AIGC应用专场;分会场将进行具身...
阅读原文

ControlNet作者新作:AI绘画能分图层了!项目未开源就斩获660 Star

金磊 发自 凹非寺量子位 | 公众号 QbitAI“绝不是简单的抠图。” ControlNet作者最新推出的一项研究受到了一波高度关注—— 给一句prompt,用Stable Diffusion可...
阅读原文

微软37页论文逆向工程Sora,得到了哪些结论?

机器之心报道 机器之心编辑部一篇论文回顾 Sora 文生视频技术的背景、技术和应用。 追赶 Sora,成为了很多科技公司当下阶段的新目标。研究者们好奇的是:Sora...
阅读原文

首批类Sora模型出现,色拉布上线Snap Video,效果优于Pika、不输Gen-2

机器之心报道 编辑:杜伟、蛋酱文生视频这个战场,入局的玩家越来越多了。这次是阅后即焚 SnapChat 背后的公司。 最近,OpenAI 视频生成模型 Sora 的爆火,给...
阅读原文

每周编辑精选|大模型有自己的 MBTI 数据集、成都理工大学搭建 SCDUNet++ 模型进行滑坡测绘

滑坡是最常见的自然灾害之一,通常由地震和降雨引发,由地震触发的山体滑坡所造成的破坏,有时会比地震本身造成的破坏更为严重。为此,成都理工大学搭建了 SC...
阅读原文

HiDream CTO 姚霆:Sora 出圈,中国 AI 创业公司的机会在哪里?

Sora 的发布无疑是一个历史性的里程碑,扩散模型结合 Transformer,在视觉领域实现了与大语言模型类似的突破。毫无疑问,视觉生成领域将有一次大的技术和商业...
阅读原文

纵览机器学习前生今世,万字整理谷歌首席科学家 Jeff Dean 一小时演讲

经过算法的改进和机器学习专用硬件的显著提升,我们现在能够构建比以往任何时候都更为强大的通用机器学习系统。演讲者| Jeff Dean 整理 |王启隆 自从 2017 年...
阅读原文

ICLR 2024 Spotlight|厦门大学、Intel、大疆联合出品,从网络视频中学习零样本图像匹配大模型

机器之心专栏 机器之心编辑部图像匹配是计算机视觉的一项基础任务,其目标在于估计两张图像之间的像素对应关系。图像匹配是众多视觉应用如三维重建、视觉定位...
阅读原文

Meta计划7月推出Llama 3

点击上方蓝字关注我们据Information消息,Meta计划于七月份推出其最新版本的人工智能大型语言模型Llama 3,旨在更好地应对用户提出的有争议问题。 Meta的研究...
阅读原文

苏剑林:“闭门造车”之多模态模型方案浅谈

智猩猩和智东西发起主办的2024中国生成式AI大会将于4月18-19日在北京举办。主会场将进行开幕式、大模型专场、AI Infra专场和AIGC应用专场;分会场将进行具身...
阅读原文

刚刚,谷歌发布基础世界模型:11B参数,能生成可交互虚拟世界

机器之心报道 机器之心编辑部一键生成可玩游戏世界。 问世才两个星期,谷歌的世界模型也来了,能力看起来更强大:它生成的虚拟世界「自主可控」。刚刚,谷歌...
阅读原文

Sora完整能力曝光!多模态视频理解或成为下次爆点

夕小瑶科技说 原创作者 | 王二狗大家好我是二狗。 就在今天,据推特大V“小互”分享,Sora的完整能力曝光,根据OpenAI 申请的SORA™商标注册描述显示: 除了众所...
阅读原文
1252627282948