标签：文本

RAG与Long-Context之争—没必要争

智猩猩与智东西将于4月18-19日在北京共同举办2024中国生成式AI大会，阿里巴巴通义千问大模型技术负责人周畅，「清华系Sora」生数科技CEO唐家渝，云天励飞“云...

阅读原文

AIGC动态

2年前 (2024)

Sora超逼真视频引恐慌！Nature刊文警示AI视频模型，或在2024年颠覆科学和社会

新智元报道编辑：LRS 【新智元导读】王炸Sora发布后，想要分辨AI视频和真实视频变得更难了，各行各业都面临新的挑战与危机。‍ 技术的发展总是伴随着被滥用的...

阅读原文

AIGC动态

2年前 (2024)

LLM性能最高60%提升！谷歌ICLR 2024力作：让大语言模型学会「图的语言」

新智元报道编辑：Mindy 【新智元导读】图是组织信息的一种有用方式，但LLMs主要是在常规文本上训练的。谷歌团队找到一种将图转换为LLMs可以理解的格式的方法...

阅读原文

AIGC动态

2年前 (2024)

超越Sora极限，120秒超长AI视频模型诞生！

新智元报道编辑：润好困【新智元导读】UT奥斯丁等机构提出了一种名为StreamingT2V的技术，让AI视频的长度扩展至近乎无限，而且一致性，动作幅度也非常好！S...

阅读原文

AIGC动态

2年前 (2024)

在线教程 | 一键启动 Sora 开源平替，俘获 45 万 AI 开发者

作者：十九编辑：李宝珠，三羊一款文生视频模型组合 Stable Diffusion + Prompt Travel + AnimateDiff，只需输入关键词提示即可生成好莱坞级别大片1888 年...

阅读原文

AIGC动态

2年前 (2024)

月之暗面Kimi正被大厂“围剿”：90后清华学霸带队“卷”长文本，不到一年估值破百亿

作者｜冬梅上周，月之暗面（Moonshot AI）公司宣布旗下对话式 AI 助理产品 Kimi 应用现已支持 200 万字无损上下文输入。去年 10 月发布时，Kimi 仅支持 20 ...

阅读原文

AIGC动态

2年前 (2024)

清华微软开源全新提示词压缩工具，长度骤降80%！GitHub怒砍3.1K星

新智元报道编辑：润好困【新智元导读】最近，清华和微软的研究人员提出了一种全新的方法，能在保证输出质量不变的前提下，将提示词压缩到原始长度的20%！在...

阅读原文

AIGC动态

2年前 (2024)

剑桥团队开源：赋能多模态大模型RAG应用，首个预训练通用多模态后期交互知识检索器

机器之心专栏机器之心编辑部PreFLMR模型是一个通用的预训练多模态知识检索器，可用于搭建多模态RAG应用。模型基于发表于 NeurIPS 2023 的 Fine-grained Late...

阅读原文

AIGC动态

2年前 (2024)

通用文档理解新SOTA，多模态大模型TextMonkey来了

机器之心专栏机器之心编辑部最近，华中科技大学和金山的研究人员在多模态大模型 Monkey [1]（Li et al., CVPR2024）工作的基础上提出 TextMonkey。在多个场...

阅读原文

AIGC动态

2年前 (2024)

Kimi连续宕醒巨头！阿里百度360连夜出手长文本，大模型商业化厮杀开始了

丰色明敏发自凹非寺量子位 | 公众号 QbitAI一夜之间，国产大模型打起了长文本大战。从昨晚到今天凌晨，各大厂排队官宣跟进长文本能力：百度文心一言下...

阅读原文

AIGC动态

2年前 (2024)

OpenAI进军好莱坞：电影制作用Sora指日可待

机器之心报道编辑：泽南OpenAI 的野心可不仅限于在 TikTok 上发短视屏。自从 OpenAI 推出自动生成视频的 Sora 以后，很多人预测好莱坞可能要被 AI 代替了。...

阅读原文

AIGC动态

2年前 (2024)

复刻Sora的通用视频生成能力，开源多智能体框架Mora来了

机器之心专栏机器之心编辑部何恺明的目标是：探索面向复杂世界的智能。Sora 是首个引起社会广泛关注的大规模通用视频生成模型。自 OpenAI 在 2024 年 2 月推...

阅读原文

AIGC动态

2年前 (2024)

微软新作「Mora」，复原了Sora

夕小瑶科技说分享来源 | 新智元微软版Sora诞生了！ Sora虽爆火但闭源，给学术界带来了不小的挑战。学者们只能尝试使用逆向工程来对Sora复现或扩展。尽管提出...

阅读原文

AIGC动态

2年前 (2024)

Sora复刻版来了，微软参与，华人团队打造

白交发自凹非寺量子位 | 公众号 QbitAISora复刻版出现了—— Mora，还是多智能体那种。 △Mora：模拟数字世界Sora有的能力它基本都有，比如文本转视频、扩展视...

阅读原文

AIGC动态

2年前 (2024)

Sora不开源，微软给你开源！全球最接近Sora视频模型诞生，12秒生成效果逼真炸裂

新智元报道编辑：编辑部【新智元导读】用不了多久，开源版的Sora就会涌来！理海大学微软团队已经做出一种全新多AI智能体框架Mora，可以完全复刻Sora能力，且...

阅读原文

AIGC动态

2年前 (2024)

1…9 101112 13…22