标签：视频

单图就能解锁全景视角！北大/港中文/腾讯等推出ViewCrafter | 已开源

ViewCrafter团队投稿量子位 | 公众号 QbitAI随便给张图就能从更多视角查看全景了？！话不多说，先看一波效果，单视角输入be like：难度升级，接下来换成双...

阅读原文

AIGC动态

2年前 (2024)

AI一键生成“类黑神话”！腾讯推出游戏视频模型GameGen-O，业内人士：游戏工作室的ChatGPT时刻

一水发自凹非寺量子位 | 公众号 QbitAI什么？大模型也许很快就能生成《黑神话·悟空》这种3A大作了？！直接看一则demo，《西游记》这就上桌：搭配BGM，是...

阅读原文

AIGC动态

2年前 (2024)

MMLU-Pro基准测试数据集上线，含 12k 个跨学科复杂问题，难度提升，更具挑战性！DeepSeek 数学模型一键部署

在大语言模型 (LLM) 蓬勃发展的时代，诸如大规模多任务语言理解 (MMLU) 之类的基准测试，在推动 AI 于不同领域的语言理解与推理能力迈向极限方面，发挥着至关...

阅读原文

AIGC动态

2年前 (2024)

字节AI版小李子一开口：黄风岭，八百里

叨乐发自凹非寺量子位 | 公众号 QbitAI字节和浙大联合研发的项目Loopy火了！只需一帧图像，一段音频，就能生成一段非常自然的视频！研究团队还放出了Loop...

阅读原文

AIGC动态

2年前 (2024)

音频驱动人像视频模型：字节Loopy、CyberHost研究成果揭秘

机器之心发布机器之心编辑部近期，来自字节跳动的视频生成模型 Loopy，一经发布就在 X 上引起了广泛的讨论。Loopy 可以仅仅通过一张图片和一段音频生成逼真...

阅读原文

AIGC动态

2年前 (2024)

小心！AI能「看懂」你的唇语，悄悄话不再安全！

叨乐发自凹非寺量子位 | 公众号 QbitAI小心悄悄话被AI听见！（嘘）最近国外一款可以读唇语的AI软件火了！具体效果如下：红毯上布莱克·莱弗利小声说：“好...

阅读原文

AIGC动态

2年前 (2024)

数据集汇总｜DeepFake 乱象丛生，用魔法打败魔法！高质量数据集助力伪造监测技术发展

作者：李姝编辑：李姝 HyperAI超神经 (hyper.ai) 为大家汇总了常用的人脸识别、DeepFake 数据集，期望能在一定程度上帮助研究人员更有效地开展相关领域的研...

阅读原文

AIGC动态

2年前 (2024)

Vidu发布「主体参照」功能，有效解决视频生成一致性问题

7 月份正式上线的国产视频大模型 Vidu，在今天发布大版本更新。在今天的生树科技媒体开放日上，Vidu 发布了「主体参照」（Subject Consistency）功能，该功...

阅读原文

AIGC动态

2年前 (2024)

全球首发！Vidu 让任意主体保持一致，视频生成进入新阶段！

上线一个月，Vidu 再度迎来重大更新！ 4月底，由生数科技和清华大学联合研发的国内首个纯自研原创视频大模型 Vidu 面向全球发布，7月底正式上线，全面开放使...

阅读原文

AIGC动态

2年前 (2024)

给我一张脸，视频背景随你换，林黛玉都被清华理工男玩废了｜免费开放

衡宇发自凹非寺量子位 | 公众号 QbitAI让AI视频中任意主体保持一致！就在刚刚，人人都可轻松做到了。而且只需一张图片，就能实现。 ——上面的每一个马斯克...

阅读原文

AIGC动态

2年前 (2024)

Sora陷研究泥潭？OpenAI一年血亏50亿，高盛报告乌龙引AI股！

新智元报道编辑：编辑部 HYZ 【新智元导读】刚刚，外媒曝出：Sora陷入了研究困境！背后原因，就是安全风险以及与好莱坞的合作。另外，最近高盛的报告错误解读...

阅读原文

AIGC动态

2年前 (2024)

新AI编程工具爆火：手机2分钟创建一个APP

金磊发自凹非寺量子位 | 公众号 QbitAI继Cursor之后，编程界又一新贵走红。它就是由AI初创公司Replit推出的智能体——Replit Agent。有了它，现在编程这事...

阅读原文

AIGC动态

2年前 (2024)

Vision Pro 沉浸式视频再上新，前 Google 技术专家揭秘背后独特算法

VIsion Pro 沉浸式视频的背后Apple Vision Pro 的「杀手级」应用到底是什么？网友制作的关于 VIsion Pro 的梗图这个问题从它诞生的那天起就一直不断被提起...

阅读原文

AIGC动态

2年前 (2024)

ECCV 2024 | 比基准高30%，媲美Gemini 1.5 Pro，基于记忆的视频理解智能体来了

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年，机器之心AIxiv专栏接收报道了2000多篇内容，覆盖全球各大高校与企业的顶级实验室，有效促进了学术...

阅读原文

AIGC动态

2年前 (2024)

MiniMax不藏了，大秀视频/语音/文本全模态模型家族，“每天与世界交互30亿次”

明敏衡宇发自凹非寺量子位 | 公众号 QbitAI终于，MiniMax不藏了。首次正式公开亮相，最强大模型、最亮眼产品战绩，全部对外展示。模型全家桶最新版齐上...

阅读原文

AIGC动态

2年前 (2024)

1…5 678 9…54