标签：视频

终局之战！OpenAI Sora大佬专访：AI视频模型仍处在GPT-1时代

新智元报道编辑：alan 【新智元导读】Sora一出，谁与争锋！近日，Sora团队的三位负责人Aditya Ramesh、Tim Brooks和Bill Peebles接受了采访，解读了Sora在模...

阅读原文

AIGC动态

2年前 (2024)

OpenAI Sora负责人最新万字干货深访 · 完整版+视频

来源：图灵人工智能文：天空之城·城主在视频生成领域，只有两种模型：OpenAI Sora模型，以及其他不是Sora的模型。 Sora视频生成的能力相比其他视频生成模型...

阅读原文

AIGC动态

2年前 (2024)

清华团队国产“Sora”火了！画面效果对标OpenAI，长度可达16秒，还能读懂物理规律

允中发自凹非寺量子位 | 公众号 QbitAISora席卷世界，也掀起了全球竞逐AI视频生成的热潮。就在今天，国内又有一支短片引发关注。视频来自生数科技联合清...

阅读原文

AIGC动态

2年前 (2024)

“很接近Sora”，直击清华团队视频大模型Vidu发布现场｜甲子光年

中国首个长时长、高一致性、高动态性视频大模型。作者｜王博事先没有一点声张，今天上午，中国首个长时长、高一致性、高动态性视频大模型Vidu就在中关村论坛...

阅读原文

AIGC动态

2年前 (2024)

当前最强国产Sora！清华团队突破16秒长视频，懂多镜头语言，会模拟物理规律

机器之心原创作者：张倩你说箱子里要装满钻石，于是箱子被钻石填满，比实拍还要耀眼。这样的技能，哪个剧组不喜欢？这是前段时间 Adobe 旗下的视频剪辑软件 ...

阅读原文

AIGC动态

2年前 (2024)

今日arXiv最热大模型论文：大模型也来看球，还能判断是否犯规

夕小瑶科技说原创作者 | 谢年年在足球世界，裁判的哨声可谓“千金难买”，因为它能直接决定俱乐部的钱包是鼓是瘪。但球场变化莫测，非常考验裁判的水平。 2022...

阅读原文

AIGC动态

2年前 (2024)

LLaMA 3：大模型之战的新序幕

作者 | 符尧 OneFlow编译翻译｜杨婷、宛子琳、张雪聃本文要点概览：文本数据的扩展可能已经达到了极限，因为易于获取的网络文本资源（如Common Crawl、Git...

阅读原文

AIGC动态

2年前 (2024)

Open-Sora 全面开源升级：支持单镜头16s视频生成和720p分辨率

Open-Sora 在开源社区悄悄更新了，现在支持单镜头长达16秒的视频生成，分辨率最高可达720p，并且可以处理任何宽高比的文本到图像、文本到视频、图像到视频、...

阅读原文

AIGC动态

2年前 (2024)

Open-Sora全面开源升级：支持16s视频生成和720p分辨率

机器之心发布机器之心编辑部Open-Sora 在开源社区悄悄更新了，现在单镜头支持长达16秒的视频生成，分辨率最高可达720p，并且可以处理任何宽高比的文本到图像...

阅读原文

AIGC动态

2年前 (2024)

视频生成技术与应用 AI 技术论坛圆满收官

致力于助力企业和广大从业者掌握 AI 视频生成技术前沿，把握时代机遇的“视频生成技术与应用 — Sora 时代”——机器之心 AI 技术论坛日前圆满收官。活动当天，北...

阅读原文

AIGC动态

2年前 (2024)

Open-Sora 全面开源升级：支持 16s 视频生成和 720p 分辨率

最近，AI 科技评论发现，国产视频生成模型 Open-Sora 在开源社区悄悄更新了！现在支持长达16秒的视频生成，分辨率最高可达720p，并且可以处理任何宽高比的文...

阅读原文

AIGC动态

2年前 (2024)

Meta 眼镜支持多模态 Llama 3，实时翻译、物体识别，AI 眼镜的机会来了！

来自 Meta 官方消息，Meta 自家的雷朋智能眼镜，开始支持多模态版的 Llama 3 了！要知道，Llama 3 的开源版本还没支持多模态。戴上这副智能眼镜，外出旅行坐...

阅读原文

AIGC动态

2年前 (2024)

一张照片+音频=超逼真数字人视频！VASA-1模型拉开「实时交互」大幕

新智元报道编辑：LRS 【新智元导读】仅需一张照片加一段音频，即可生成具有精确唇音同步、逼真面部行为和自然头部运动的超逼真说话面部视频，并且生成速度快...

阅读原文

AIGC动态

2年前 (2024)

在线教程丨刘强东数字人首秀交易额破5千万！用GeneFace++ 生成实时说话数字人

作者：十九编辑：李宝珠，三羊封面图来源：GeneFace++ GeneFace++：输入一段语音，就能生成目标人脸的说话视频。近日，京东创始人刘强东化身「采销东哥 AI ...

阅读原文

AIGC动态

2年前 (2024)

微软「诈骗届」王牌框架，真到可怕！一张照片+音频即可生成数字人

新智元报道编辑：LRS 【新智元导读】想要做出一段能够「以假乱真的人物说话视频」的门槛到底低到什么程度了？仅需一张照片加一段音频，就能生成一段堪称真实...

阅读原文

AIGC动态

2年前 (2024)

1…24 252627 28…54