标签:图像

Champ首发开源:人体视频生成新SOTA,5天斩获1k星,demo可玩

机器之心专栏 机器之心编辑部一张照片 + 一段视频,就能让照片活起来!近日,由阿里、复旦大学、南京大学联合发布的可控人体视频生成工作 Champ 火爆全网。该...
阅读原文

一张图即出AI视频!谷歌全新扩散模型,让人物动起来

新智元报道编辑:alan 【新智元导读】近日,来自谷歌的研究人员发布了多模态扩散模型VLOGGER,只需一张照片,和一段音频,就能直接生成人物说话的视频!只需...
阅读原文

微软亚研院新作:让大模型一口气调用数百万个API!

金磊 整理自 凹非寺量子位 | 公众号 QbitAI近年来,人工智能发展迅速,尤其是像ChatGPT这样的基础大模型,在对话、上下文理解和代码生成等方面表现出色,能够...
阅读原文

Sora 在英伟达 H100 上生成 1 分钟视频约需 12 分钟

点击上方蓝字关注我们“Sora模型的成本: Sora的训练需要大量的计算资源,估计需要4211-10528个 Nvidia H100 GPUs运行一个月。 推理成本:一个Nvidia H100 GPU...
阅读原文

扩散模型进军专业图层,斯坦福提出LayerDiffuse实现分层扩散,效果直逼商业网站

大数据文摘受权转载自将门创投 目前,视觉扩散生成模型(如Stable Diffusion等)在常规图像生成任务上获得了非常好的效果,但是在内容制作的专业领域,例如对...
阅读原文

通用文档理解新SOTA,多模态大模型TextMonkey来了

机器之心专栏 机器之心编辑部最近,华中科技大学和金山的研究人员在多模态大模型 Monkey [1](Li et al., CVPR2024)工作的基础上提出 TextMonkey。在多个场...
阅读原文

复刻Sora的通用视频生成能力,开源多智能体框架Mora来了

机器之心专栏 机器之心编辑部何恺明的目标是:探索面向复杂世界的智能。Sora 是首个引起社会广泛关注的大规模通用视频生成模型。自 OpenAI 在 2024 年 2 月推...
阅读原文

升级!Sora漫步街头的女人可以跳舞啦!科目三蹦迪多种舞姿停不下来,可精准控制动作

夕小瑶科技说 原创作者 | 付奶茶Sora为我们展开了一个充满惊喜的新篇章,同时,Viggle这一模型也吸引了公众的目光,并在推特上迅速走红! 想象一个场景,你仅...
阅读原文

微软新作「Mora」,复原了Sora

夕小瑶科技说 分享来源 | 新智元微软版Sora诞生了! Sora虽爆火但闭源,给学术界带来了不小的挑战。学者们只能尝试使用逆向工程来对Sora复现或扩展。尽管提出...
阅读原文

Sora复刻版来了,微软参与,华人团队打造

白交 发自 凹非寺量子位 | 公众号 QbitAISora复刻版出现了—— Mora,还是多智能体那种。 △Mora:模拟数字世界Sora有的能力它基本都有,比如文本转视频、扩展视...
阅读原文

Sora不开源,微软给你开源!全球最接近Sora视频模型诞生,12秒生成效果逼真炸裂

新智元报道编辑:编辑部 【新智元导读】用不了多久,开源版的Sora就会涌来!理海大学微软团队已经做出一种全新多AI智能体框架Mora,可以完全复刻Sora能力,且...
阅读原文

发完最后一篇论文,Stable Diffusion核心团队全要离职了

机器之心报道 机器之心编辑部内部核心员工出走频繁,外部投资者不断丧失信心,成立于 2019 年的 AI 初创公司 Stability AI 还能推出伟大的产品吗? 离 Stable...
阅读原文

每周编辑精选|在线运行 Deepmoney 金融大模型、AI 偏好等多个优质数据集上线

目前,AI 领域对金融模型的研究成果大多是基于公共知识进行训练的,但在实际的金融实践中,这些公共知识对于当前市场的可解释性往往严重不足。一个理想的金融...
阅读原文

CMU朱俊彦、Adobe新作:512×512图像推理,A100只用0.11秒

机器之心报道 编辑:陈萍、杜伟可玩性极强!简笔素描一键变身多风格画作,还能添加额外的描述,这在 CMU、Adobe 联合推出的一项研究中实现了。 作者之一为 CM...
阅读原文

Stable Video 3D震撼上线,视频扩散模型史诗级提升!4090可跑,权重已开放

新智元报道编辑:alan 【新智元导读】近日,Stability AI又发布了新作SV3D,基于视频扩散模型的SV3D将3D模型生成的效果提升了一大截,模型权重已在huggingfac...
阅读原文
1222324252648