标签:文本

阿里文生视频挑战Gen-2、Pika,1280×720分辨率无压力,3500万文本-视频对显奇效

机器之心报道编辑:张倩、陈萍文生视频领域又卷起来了!文生视频可以精细到什么程度?最近,阿里巴巴的一项研究给出了答案:1280×720 分辨率没有压力,而且生...
阅读原文

杠上了!谷歌官宣开放Gemini API,奥特曼宣布ChatGPT Plus恢复订阅!

夕小瑶科技说 原创作者 | 王二狗大家好我是二狗。AI圈真是太精彩了,OpenAI和谷歌又开始明争暗斗起来了。今日Sam Altman宣布重新启用ChatGPT Plus 订阅;而在...
阅读原文

谷歌DeepMind最先进Imagen 2发布:这些AI图片你能辨别吗?

机器之心报道编辑:陈萍、大盘鸡Imagen 2可以生成质量更高、更逼真、更准确的图像。谷歌最近真是好消息不断。先是前几天祭出大杀器 ,发布会上的一系列 Demo ...
阅读原文

谷歌文生图巅峰之作Imagen 2登场,实测暴打DALL·E 3和Midjourney!

新智元报道编辑:编辑部【新智元导读】卷疯了卷疯了,谷歌刚刚放出了文生图AI模型的巅峰之作Imagen 2,实测效果逼真细腻,生成的美女图仿佛真人照片,对于提...
阅读原文

LLM生成3D场景,无限延伸!斯坦福华人提出3D动画生成框架,一句话一幅图创造无限3D世界

新智元报道编辑:alan 润【新智元导读】近日,斯坦福的华人研究人员提出全新视频生成框架——WonderJourney,一句话或者一张图,即可自动生成一系列3D场景的连...
阅读原文

一张图or文字生成无限3D世界!斯坦福吴佳俊团队新作,让网友直呼“难以置信”

西风 发自 凹非寺量子位 | 公众号 QbitAI斯坦福吴佳俊团队打造AI版“爱丽丝梦游仙境”巨作!仅用一张图or一段文字就能沿相机轨迹生成无限连贯3D场景:只需输入...
阅读原文

阿里又整活儿:一张人脸一句话就能跳《擦玻璃》,服装背景随意换!

金磊 发自 凹非寺量子位 | 公众号 QbitAI继AnimateAnyone之后,阿里又一项“舞蹈整活儿”论文火了——这一次,只需一张脸部照片、一句话描述,就能让你在任何地方...
阅读原文

12.11丨AIGC大事日报

12/11全球AIGC产业要闻1、智谱AI发布文本质量评价模型CritiqueLLM2、智源研究院发布LM-Cocktail模型治理策略3、北大微信AI团队获EMNLP 2023最佳长论文奖4、人...
阅读原文

一文详解大模型归因机制,幻觉问题有救了!

夕小瑶科技说 原创作者 | 谢年年、python大模型的幻觉问题一直是一个亟待解决的挑战。由于大模型的训练语料来源广泛,且都是未经筛选的现实世界文本,预训练...
阅读原文

超越GPT-4!谷歌DeepMind重磅发布Gemini,史上最强最通用大模型!

夕小瑶科技说 原创作者 | 王二狗深夜炸弹!就在刚刚,谷歌 DeepMind 重磅推出了传闻已久的Gemini大模型!号称是谷歌史上功能最强大、最通用的多模态模型,在...
阅读原文

突发!谷歌深夜掀桌子,发最强大模型Gemini,跑分碾压GPT-4【附60页技术报告】

谷歌最强大模型Gemini来了,ChatGPT劲敌,语言理解首次超越人类!作者|香草编辑|漠影北京时间12月7日凌晨,期盼已久的谷歌AI大模型Gemini终于发布了!作为谷...
阅读原文

再见,平面设计师?COLE 结合多个人工智能,按需生成可编辑设计

点击上方蓝字关注我们​“ COLE是一款潜力巨大的平面设计工具,能够通过输入文本提示生成高质量设计,具有可编辑文本和图像对象。虽然目前还不是成熟产品,但已...
阅读原文

追踪溯源?可定位源头模型的AI文本判别器出现了!CMU提出

夕小瑶科技说 原创作者 | 智商掉了一地、Python自从去年底 ChatGPT 发布以来,许多人的工作和生活方式随之变化。作为创作时代的重要拐点,大型语言模型(LLM...
阅读原文

超越同级7B模型! 中国团队开源大规模高质量图文数据集ShareGPT4V,大幅提升多模态性能

新智元报道编辑:LRS【新智元导读】研究人员利用GPT4-Vision构建了一个大规模高质量图文数据集ShareGPT4V,并在此基础上训练了一个7B模型,在多项多模态榜单...
阅读原文

Pika Labs融资5500万美元,推出新AI视频平台挑战Runway

点击上方蓝字关注我们“ Pika Labs发布了Pika 1.0,一个基于文本提示生成和编辑多种视频风格的新网络平台。该消息标志着AI驱动的视频生成领域的最新进展,将Pi...
阅读原文
1131415161720