标签:视频
单图就能解锁全景视角!北大/港中文/腾讯等推出ViewCrafter | 已开源
ViewCrafter团队 投稿量子位 | 公众号 QbitAI随便给张图就能从更多视角查看全景了?! 话不多说,先看一波效果,单视角输入be like:难度升级,接下来换成双...
AI一键生成“类黑神话”!腾讯推出游戏视频模型GameGen-O,业内人士:游戏工作室的ChatGPT时刻
一水 发自 凹非寺量子位 | 公众号 QbitAI什么?大模型也许很快就能生成《黑神话·悟空》这种3A大作了?! 直接看一则demo,《西游记》这就上桌: 搭配BGM,是...
MMLU-Pro基准测试数据集上线,含 12k 个跨学科复杂问题,难度提升,更具挑战性!DeepSeek 数学模型一键部署
在大语言模型 (LLM) 蓬勃发展的时代,诸如大规模多任务语言理解 (MMLU) 之类的基准测试,在推动 AI 于不同领域的语言理解与推理能力迈向极限方面,发挥着至关...
字节AI版小李子一开口:黄风岭,八百里
叨乐 发自 凹非寺量子位 | 公众号 QbitAI字节和浙大联合研发的项目Loopy火了! 只需一帧图像,一段音频,就能生成一段非常自然的视频! 研究团队还放出了Loop...
音频驱动人像视频模型:字节Loopy、CyberHost研究成果揭秘
机器之心发布 机器之心编辑部近期,来自字节跳动的视频生成模型 Loopy,一经发布就在 X 上引起了广泛的讨论。Loopy 可以仅仅通过一张图片和一段音频生成逼真...
小心!AI能「看懂」你的唇语,悄悄话不再安全!
叨乐 发自 凹非寺量子位 | 公众号 QbitAI小心悄悄话被AI听见!(嘘) 最近国外一款可以读唇语的AI软件火了! 具体效果如下: 红毯上布莱克·莱弗利小声说:“好...
数据集汇总|DeepFake 乱象丛生,用魔法打败魔法!高质量数据集助力伪造监测技术发展
作者:李姝 编辑:李姝 HyperAI超神经 (hyper.ai) 为大家汇总了常用的人脸识别、DeepFake 数据集,期望能在一定程度上帮助研究人员更有效地开展相关领域的研...
Vidu发布「主体参照」功能,有效解决视频生成一致性问题
7 月份正式上线的国产视频大模型 Vidu,在今天发布大版本更新。 在今天的生树科技媒体开放日上,Vidu 发布了「主体参照」(Subject Consistency)功能,该功...
全球首发!Vidu 让任意主体保持一致,视频生成进入新阶段!
上线一个月,Vidu 再度迎来重大更新! 4月底,由生数科技和清华大学联合研发的国内首个纯自研原创视频大模型 Vidu 面向全球发布,7月底正式上线,全面开放使...
给我一张脸,视频背景随你换,林黛玉都被清华理工男玩废了|免费开放
衡宇 发自 凹非寺量子位 | 公众号 QbitAI让AI视频中任意主体保持一致!就在刚刚,人人都可轻松做到了。 而且只需一张图片,就能实现。 ——上面的每一个马斯克...
Sora陷研究泥潭?OpenAI一年血亏50亿,高盛报告乌龙引AI股!
新智元报道编辑:编辑部 HYZ 【新智元导读】刚刚,外媒曝出:Sora陷入了研究困境!背后原因,就是安全风险以及与好莱坞的合作。另外,最近高盛的报告错误解读...
新AI编程工具爆火:手机2分钟创建一个APP
金磊 发自 凹非寺量子位 | 公众号 QbitAI继Cursor之后,编程界又一新贵走红。 它就是由AI初创公司Replit推出的智能体——Replit Agent。 有了它,现在编程这事...
Vision Pro 沉浸式视频再上新,前 Google 技术专家揭秘背后独特算法
VIsion Pro 沉浸式视频 的背后Apple Vision Pro 的「杀手级」应用到底是什么? 网友制作的关于 VIsion Pro 的梗图 这个问题从它诞生的那天起就一直不断被提起...
ECCV 2024 | 比基准高30%,媲美Gemini 1.5 Pro,基于记忆的视频理解智能体来了
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
MiniMax不藏了,大秀视频/语音/文本全模态模型家族,“每天与世界交互30亿次”
明敏 衡宇 发自 凹非寺量子位 | 公众号 QbitAI终于,MiniMax不藏了。 首次正式公开亮相,最强大模型、最亮眼产品战绩,全部对外展示。 模型全家桶最新版齐上...