图像 - 第 27 页

复旦等发布AnyGPT：任意模态输入输出，图像、音乐、文本、语音都支持

机器之心报道机器之心编辑部最近，OpenAI 的视频生成模型 Sora 爆火，生成式 AI 模型在多模态方面的能力再次引起广泛关注。现实世界本质上是多模态的，生物...

阅读原文

AIGC动态

2年前 (2024)

ControlNet作者又出新作：百万数据训练，AI图像生成迎来图层设计

机器之心报道编辑：陈萍、杜伟有人表示：「等待已久的 AI 图像创建功能终于迎来了图层！」尽管用于生成图像的大模型已经成为计算机视觉和图形学的基础，但令...

阅读原文

AIGC动态

2年前 (2024)

Stable Diffusion 解读（一）：回顾早期工作

智猩猩和智东西发起主办的2024中国生成式AI大会将于4月18-19日在北京举办。主会场将进行开幕式、大模型专场、AI Infra专场和AIGC应用专场；分会场将进行具身...

阅读原文

AIGC动态

2年前 (2024)

ControlNet作者新作：AI绘画能分图层了！项目未开源就斩获660 Star

金磊发自凹非寺量子位 | 公众号 QbitAI“绝不是简单的抠图。” ControlNet作者最新推出的一项研究受到了一波高度关注—— 给一句prompt，用Stable Diffusion可...

阅读原文

AIGC动态

2年前 (2024)

微软37页论文逆向工程Sora，得到了哪些结论？

机器之心报道机器之心编辑部一篇论文回顾 Sora 文生视频技术的背景、技术和应用。追赶 Sora，成为了很多科技公司当下阶段的新目标。研究者们好奇的是：Sora...

阅读原文

AIGC动态

2年前 (2024)

首批类Sora模型出现，色拉布上线Snap Video，效果优于Pika、不输Gen-2

机器之心报道编辑：杜伟、蛋酱文生视频这个战场，入局的玩家越来越多了。这次是阅后即焚 SnapChat 背后的公司。最近，OpenAI 视频生成模型 Sora 的爆火，给...

阅读原文

AIGC动态

2年前 (2024)

每周编辑精选｜大模型有自己的 MBTI 数据集、成都理工大学搭建 SCDUNet++ 模型进行滑坡测绘

滑坡是最常见的自然灾害之一，通常由地震和降雨引发，由地震触发的山体滑坡所造成的破坏，有时会比地震本身造成的破坏更为严重。为此，成都理工大学搭建了 SC...

阅读原文

AIGC动态

2年前 (2024)

HiDream CTO 姚霆：Sora 出圈，中国 AI 创业公司的机会在哪里？

Sora 的发布无疑是一个历史性的里程碑，扩散模型结合 Transformer，在视觉领域实现了与大语言模型类似的突破。毫无疑问，视觉生成领域将有一次大的技术和商业...

阅读原文

AIGC动态

2年前 (2024)

纵览机器学习前生今世，万字整理谷歌首席科学家 Jeff Dean 一小时演讲

经过算法的改进和机器学习专用硬件的显著提升，我们现在能够构建比以往任何时候都更为强大的通用机器学习系统。演讲者| Jeff Dean 整理 |王启隆自从 2017 年...

阅读原文

AIGC动态

2年前 (2024)

ICLR 2024 Spotlight｜厦门大学、Intel、大疆联合出品，从网络视频中学习零样本图像匹配大模型

机器之心专栏机器之心编辑部图像匹配是计算机视觉的一项基础任务，其目标在于估计两张图像之间的像素对应关系。图像匹配是众多视觉应用如三维重建、视觉定位...

阅读原文

AIGC动态

2年前 (2024)

Meta计划7月推出Llama 3

点击上方蓝字关注我们据Information消息，Meta计划于七月份推出其最新版本的人工智能大型语言模型Llama 3，旨在更好地应对用户提出的有争议问题。 Meta的研究...

阅读原文

AIGC动态

2年前 (2024)

苏剑林：“闭门造车”之多模态模型方案浅谈

智猩猩和智东西发起主办的2024中国生成式AI大会将于4月18-19日在北京举办。主会场将进行开幕式、大模型专场、AI Infra专场和AIGC应用专场；分会场将进行具身...

阅读原文

AIGC动态

2年前 (2024)

刚刚，谷歌发布基础世界模型：11B参数，能生成可交互虚拟世界

机器之心报道机器之心编辑部一键生成可玩游戏世界。问世才两个星期，谷歌的世界模型也来了，能力看起来更强大：它生成的虚拟世界「自主可控」。刚刚，谷歌...

阅读原文

AIGC动态

2年前 (2024)

Sora完整能力曝光！多模态视频理解或成为下次爆点

夕小瑶科技说原创作者 | 王二狗大家好我是二狗。就在今天，据推特大V“小互”分享，Sora的完整能力曝光，根据OpenAI 申请的SORA™商标注册描述显示：除了众所...

阅读原文

AIGC动态

2年前 (2024)

就是“快”！字节跳动发布文生图开放模型，迅速冲上Hugging Face Spaces 热榜

作者 | 字节跳动智能创作团队很高兴跟大家分享我们最新的文生图模型 —— SDXL-Lightning，它实现了前所未有的速度和质量，并且已经向社区开放。模型地址：ht...

阅读原文

AIGC动态

2年前 (2024)

标签：图像