标签：图像

一张图即出AI视频！谷歌全新扩散模型，让人物动起来

新智元报道编辑：alan 【新智元导读】近日，来自谷歌的研究人员发布了多模态扩散模型VLOGGER，只需一张照片，和一段音频，就能直接生成人物说话的视频！只需...

阅读原文

AIGC动态

2年前 (2024)

微软亚研院新作：让大模型一口气调用数百万个API！

金磊整理自凹非寺量子位 | 公众号 QbitAI近年来，人工智能发展迅速，尤其是像ChatGPT这样的基础大模型，在对话、上下文理解和代码生成等方面表现出色，能够...

阅读原文

AIGC动态

2年前 (2024)

Sora 在英伟达 H100 上生成 1 分钟视频约需 12 分钟

点击上方蓝字关注我们“Sora模型的成本： Sora的训练需要大量的计算资源，估计需要4211-10528个 Nvidia H100 GPUs运行一个月。推理成本：一个Nvidia H100 GPU...

阅读原文

AIGC动态

2年前 (2024)

扩散模型进军专业图层，斯坦福提出LayerDiffuse实现分层扩散，效果直逼商业网站

大数据文摘受权转载自将门创投目前，视觉扩散生成模型（如Stable Diffusion等）在常规图像生成任务上获得了非常好的效果，但是在内容制作的专业领域，例如对...

阅读原文

AIGC动态

2年前 (2024)

通用文档理解新SOTA，多模态大模型TextMonkey来了

机器之心专栏机器之心编辑部最近，华中科技大学和金山的研究人员在多模态大模型 Monkey [1]（Li et al., CVPR2024）工作的基础上提出 TextMonkey。在多个场...

阅读原文

AIGC动态

2年前 (2024)

复刻Sora的通用视频生成能力，开源多智能体框架Mora来了

机器之心专栏机器之心编辑部何恺明的目标是：探索面向复杂世界的智能。Sora 是首个引起社会广泛关注的大规模通用视频生成模型。自 OpenAI 在 2024 年 2 月推...

阅读原文

AIGC动态

2年前 (2024)

升级！Sora漫步街头的女人可以跳舞啦！科目三蹦迪多种舞姿停不下来，可精准控制动作

夕小瑶科技说原创作者 | 付奶茶Sora为我们展开了一个充满惊喜的新篇章，同时，Viggle这一模型也吸引了公众的目光，并在推特上迅速走红！想象一个场景，你仅...

阅读原文

AIGC动态

2年前 (2024)

微软新作「Mora」，复原了Sora

夕小瑶科技说分享来源 | 新智元微软版Sora诞生了！ Sora虽爆火但闭源，给学术界带来了不小的挑战。学者们只能尝试使用逆向工程来对Sora复现或扩展。尽管提出...

阅读原文

AIGC动态

2年前 (2024)

Sora复刻版来了，微软参与，华人团队打造

白交发自凹非寺量子位 | 公众号 QbitAISora复刻版出现了—— Mora，还是多智能体那种。 △Mora：模拟数字世界Sora有的能力它基本都有，比如文本转视频、扩展视...

阅读原文

AIGC动态

2年前 (2024)

Sora不开源，微软给你开源！全球最接近Sora视频模型诞生，12秒生成效果逼真炸裂

新智元报道编辑：编辑部【新智元导读】用不了多久，开源版的Sora就会涌来！理海大学微软团队已经做出一种全新多AI智能体框架Mora，可以完全复刻Sora能力，且...

阅读原文

AIGC动态

2年前 (2024)

发完最后一篇论文，Stable Diffusion核心团队全要离职了

机器之心报道机器之心编辑部内部核心员工出走频繁，外部投资者不断丧失信心，成立于 2019 年的 AI 初创公司 Stability AI 还能推出伟大的产品吗？离 Stable...

阅读原文

AIGC动态

2年前 (2024)

每周编辑精选｜在线运行 Deepmoney 金融大模型、AI 偏好等多个优质数据集上线

目前，AI 领域对金融模型的研究成果大多是基于公共知识进行训练的，但在实际的金融实践中，这些公共知识对于当前市场的可解释性往往严重不足。一个理想的金融...

阅读原文

AIGC动态

2年前 (2024)

CMU朱俊彦、Adobe新作：512×512图像推理，A100只用0.11秒

机器之心报道编辑：陈萍、杜伟可玩性极强！简笔素描一键变身多风格画作，还能添加额外的描述，这在 CMU、Adobe 联合推出的一项研究中实现了。作者之一为 CM...

阅读原文

AIGC动态

2年前 (2024)

Stable Video 3D震撼上线，视频扩散模型史诗级提升！4090可跑，权重已开放

新智元报道编辑：alan 【新智元导读】近日，Stability AI又发布了新作SV3D，基于视频扩散模型的SV3D将3D模型生成的效果提升了一大截，模型权重已在huggingfac...

阅读原文

AIGC动态

2年前 (2024)

3D重建范式变革！最新模型MVDiffusion++：无需相机姿态，即可实现高清3D模型重建

新智元报道编辑：LRS 【新智元导读】受人类视觉系统的启发，MVDiffusion++结合计算方法高保真和人类视觉系统灵活性，可以根据任意数量的无位姿图片，生成密...

阅读原文

AIGC动态

2年前 (2024)

1…22 232425 26…48