标签:文本

Sora超逼真视频引恐慌!Nature刊文警示AI视频模型,或在2024年颠覆科学和社会

新智元报道编辑:LRS 【新智元导读】王炸Sora发布后,想要分辨AI视频和真实视频变得更难了,各行各业都面临新的挑战与危机。‍ 技术的发展总是伴随着被滥用的...
阅读原文

超越Sora极限,120秒超长AI视频模型诞生!

新智元报道编辑:润 好困 【新智元导读】UT奥斯丁等机构提出了一种名为StreamingT2V的技术,让AI视频的长度扩展至近乎无限,而且一致性,动作幅度也非常好!S...
阅读原文

在线教程 | 一键启动 Sora 开源平替,俘获 45 万 AI 开发者

作者:十九 编辑:李宝珠,三羊 一款文生视频模型组合 Stable Diffusion + Prompt Travel + AnimateDiff,只需输入关键词提示即可生成好莱坞级别大片1888 年...
阅读原文

月之暗面Kimi正被大厂“围剿”:90后清华学霸带队“卷”长文本,不到一年估值破百亿

作者|冬梅 上周,月之暗面(Moonshot AI)公司宣布旗下对话式 AI 助理产品 Kimi 应用现已支持 200 万字无损上下文输入。去年 10 月发布时,Kimi 仅支持 20 ...
阅读原文

清华微软开源全新提示词压缩工具,长度骤降80%!GitHub怒砍3.1K星

新智元报道编辑:润 好困 【新智元导读】最近,清华和微软的研究人员提出了一种全新的方法,能在保证输出质量不变的前提下,将提示词压缩到原始长度的20%!在...
阅读原文

剑桥团队开源:赋能多模态大模型RAG应用,首个预训练通用多模态后期交互知识检索器

机器之心专栏 机器之心编辑部PreFLMR模型是一个通用的预训练多模态知识检索器,可用于搭建多模态RAG应用。模型基于发表于 NeurIPS 2023 的 Fine-grained Late...
阅读原文

通用文档理解新SOTA,多模态大模型TextMonkey来了

机器之心专栏 机器之心编辑部最近,华中科技大学和金山的研究人员在多模态大模型 Monkey [1](Li et al., CVPR2024)工作的基础上提出 TextMonkey。在多个场...
阅读原文

Kimi连续宕机打醒巨头!阿里百度360连夜出手长文本,大模型商业化厮杀开始了

丰色 明敏 发自 凹非寺量子位 | 公众号 QbitAI一夜之间,国产大模型打起了长文本大战。 从昨晚到今天凌晨,各大厂排队官宣跟进长文本能力: 百度文心一言 下...
阅读原文

OpenAI进军好莱坞:电影制作用Sora指日可待

机器之心报道 编辑:泽南OpenAI 的野心可不仅限于在 TikTok 上发短视屏。自从 OpenAI 推出自动生成视频的 Sora 以后,很多人预测好莱坞可能要被 AI 代替了。...
阅读原文

复刻Sora的通用视频生成能力,开源多智能体框架Mora来了

机器之心专栏 机器之心编辑部何恺明的目标是:探索面向复杂世界的智能。Sora 是首个引起社会广泛关注的大规模通用视频生成模型。自 OpenAI 在 2024 年 2 月推...
阅读原文

微软新作「Mora」,复原了Sora

夕小瑶科技说 分享来源 | 新智元微软版Sora诞生了! Sora虽爆火但闭源,给学术界带来了不小的挑战。学者们只能尝试使用逆向工程来对Sora复现或扩展。尽管提出...
阅读原文

Sora复刻版来了,微软参与,华人团队打造

白交 发自 凹非寺量子位 | 公众号 QbitAISora复刻版出现了—— Mora,还是多智能体那种。 △Mora:模拟数字世界Sora有的能力它基本都有,比如文本转视频、扩展视...
阅读原文

Sora不开源,微软给你开源!全球最接近Sora视频模型诞生,12秒生成效果逼真炸裂

新智元报道编辑:编辑部 【新智元导读】用不了多久,开源版的Sora就会涌来!理海大学微软团队已经做出一种全新多AI智能体框架Mora,可以完全复刻Sora能力,且...
阅读原文

Kimi:来我们比比谁的一口气更长

2023年10月,月之暗面发布了Kimi,是彼时国产大模型的代表作之一,因20万字的输入并整理归纳的能力被很多以“实用为王”的支持者看好。而就在2024年3月18日,Ki...
阅读原文

可控图像生成最新综述!北邮开源20页249篇文献,包揽Text-to-Image Diffusion领域各种「条件」

新智元报道编辑:LRS 【新智元导读】利用文本生成图片(Text-to-Image, T2I)已经满足不了人们的需要了,近期研究在T2I模型的基础上引入了更多类型的条件来生...
阅读原文
191011121322