标签:图像
以自监督方式去除荧光图像中的噪声,清华团队开发空间冗余去噪Transformer方法
将 ScienceAI设为星标 第一时间掌握 新鲜的 AI for Science 资讯编辑 | 萝卜皮 具有高信噪比的荧光成像已成为生物现象精确可视化和分析的基础。然而,不可避...
揭秘OpenAI Sora的关键要素:时空补丁
点击上方蓝字关注我们“OpenAI Sora 创新运用时空补丁,将静态图像转化为逼真动态视频。该技术革新了视频生成领域,通过多样化的训练数据和灵活的建模方法,So...
OpenAI Sora视频生成模型技术报告中英全文
来源:专知 OpenAI 探索了视频数据生成模型的大规模训练。具体来说,研究人员在可变持续时间、分辨率和宽高比的视频和图像上联合训练了一个文本条件扩散模型...
OpenAI超级视频模型Sora技术报告解读,虚拟世界涌现了
夕小瑶科技说 分享来源 | 新智元 昨天白天,「现实不存在了」开始全网刷屏。 「我们这么快就步入下一个时代了?Sora简直太炸裂了」。 「这就是电影制作的未来...
真·降维打击,Sora与Runway、Pika的对比来了,震撼效果背后是物理引擎模拟现实世界
机器之心报道 编辑:杜伟以后的视频生成领域,恐怕真的只有 OpenAI 的 Sora 和其他模型了。昨天,OpenAI 发布的首个文本生成视频模型 Sora 引爆了社区,其生...
Sora涌现,OpenAI又一次暴力美学的胜利|甲子光年
将 Scaling Law 进行到底。作者|赵健 年前的 1 月 27 日,「甲子光年」参加了一场 AI 生成视频主题的沙龙,会上有一个有趣的互动:AI 视频生成多快迎来 “M...
一锤降维!解密OpenAI超级视频模型Sora技术报告,虚拟世界涌现了
新智元报道编辑:编辑部 【新智元导读】OpenAI首个AI视频模型Sora横空出世,再次创造历史。这个堪称「世界模型」的技术报告也在今天发布了,不过依然没有公开...
文生图新SOTA!Pika北大斯坦福联合推出RPG,多模态助力解决文生图两大难题
新智元报道编辑:alan 【新智元导读】近日,北大、斯坦福、以及Pika Labs发布了新的开源文生图框架,利用多模态LLM的能力成功解决文生图两大难题,表现超越SD...
生成速度快SDXL一倍,9GB GPU也能运行,Stable Cascade来搞性价比了
机器之心报道 编辑:大盘鸡硬件要求越来越低,生成速度越来越快。Stability AI 作为文本到图像的「元老」,不仅在引领该领域的潮流方向,也在模型质量上一次...
PRO | AR 赛道距离它的 ChatGPT 时刻只差一个 LMM 了吗?
2023年,几乎 AI 的每个领域都在以前所未有的速度进化,同时,AI也在不断地推动着具身智能、自动驾驶等关键赛道的技术边界。 多模态趋势下,Transformer 作为...
ChatGPT 变懒最新解释!或和系统Prompt太长有关
夕小瑶科技说 原创作者 | 王二狗大家好我是二狗。 ChatGPT变懒这件事又有了最新解释了。 这两天,推特用户Dylan Patel发文表示: 你想知道为什么 ChatGPT 和 ...
计算机视觉算法,难以落地无人机航拍应用,why?
(谨以此文,献给那些涉及 AI 需求的产品经理,领导,以及某些不称职的算法工程师们) 今天来说点真话,不吐不快。 在ChatGPT 大模型到来之前,人工智能发展...
10X增强!ChatGPT退位,Bard登基
整理|凌敏、核子可乐Bard 功能增强 10 倍2 月 5 日,Priyank Ahuja 在 X(原 Twitter)上发帖称,谷歌 Bard 迎来重大升级,功能增强 10 倍,并表示“告别 Cha...
胡渊鸣创业公司Meshy产品升级:文本转3D,25秒就能出预览
机器之心报道 编辑:张倩Meshy-2 的文本转 3D、图像转 3D、文本到纹理效果均有所提升。刚刚,胡渊鸣创业公司 Meshy 官宣了他们的第二代产品 ——Meshy-2。Meshy...
如何提升多模态效果?从这26个主流大模型来看看
智猩猩和智东西发起主办的2024中国生成式AI大会将于4月18-19日在北京举办。主会场将进行开幕式、大模型专场、AI基础软件专场和AIGC应用专场;分会场将进行具...