标签:文本
谷歌10秒视频生成模型破世界记录!LLM终结扩散模型,效果碾压顶流Gen-2
新智元报道编辑:编辑部 【新智元导读】谷歌全新视频生成模型VideoPoet再次引领世界!十秒超长视频生成效果碾压Gen-2,还可进行音频生成,风格转化。AI视频生...
AI读心术震撼登顶会!模型翻译脑电波,人类思想被投屏|NeurIPS 2023
新智元报道编辑:alan 【新智元导读】在最近举办的NeurIPS大会上,研究人员展示了当代AI更震撼的应用场景——AI读心术!我们今天的AI能做到哪些事情? AI画图、...
OpenAI官方的Prompt工程指南:你可以这么玩ChatGPT
机器之心报道 编辑:陈萍、小舟写好 prompt 已经成为 LLM 的一项必修课。随着 ChatGPT、GPT-4 等大型语言模型(LLM)的出现,提示工程(Prompt Engineering...
阿里文生视频挑战Gen-2、Pika,1280×720分辨率无压力,3500万文本-视频对显奇效
机器之心报道编辑:张倩、陈萍文生视频领域又卷起来了!文生视频可以精细到什么程度?最近,阿里巴巴的一项研究给出了答案:1280×720 分辨率没有压力,而且生...
杠上了!谷歌官宣开放Gemini API,奥特曼宣布ChatGPT Plus恢复订阅!
夕小瑶科技说 原创作者 | 王二狗大家好我是二狗。AI圈真是太精彩了,OpenAI和谷歌又开始明争暗斗起来了。今日Sam Altman宣布重新启用ChatGPT Plus 订阅;而在...
谷歌DeepMind最先进Imagen 2发布:这些AI图片你能辨别吗?
机器之心报道编辑:陈萍、大盘鸡Imagen 2可以生成质量更高、更逼真、更准确的图像。谷歌最近真是好消息不断。先是前几天祭出大杀器 ,发布会上的一系列 Demo ...
谷歌文生图巅峰之作Imagen 2登场,实测暴打DALL·E 3和Midjourney!
新智元报道编辑:编辑部【新智元导读】卷疯了卷疯了,谷歌刚刚放出了文生图AI模型的巅峰之作Imagen 2,实测效果逼真细腻,生成的美女图仿佛真人照片,对于提...
LLM生成3D场景,无限延伸!斯坦福华人提出3D动画生成框架,一句话一幅图创造无限3D世界
新智元报道编辑:alan 润【新智元导读】近日,斯坦福的华人研究人员提出全新视频生成框架——WonderJourney,一句话或者一张图,即可自动生成一系列3D场景的连...
一张图or文字生成无限3D世界!斯坦福吴佳俊团队新作,让网友直呼“难以置信”
西风 发自 凹非寺量子位 | 公众号 QbitAI斯坦福吴佳俊团队打造AI版“爱丽丝梦游仙境”巨作!仅用一张图or一段文字就能沿相机轨迹生成无限连贯3D场景:只需输入...
阿里又整活儿:一张人脸一句话就能跳《擦玻璃》,服装背景随意换!
金磊 发自 凹非寺量子位 | 公众号 QbitAI继AnimateAnyone之后,阿里又一项“舞蹈整活儿”论文火了——这一次,只需一张脸部照片、一句话描述,就能让你在任何地方...
12.11丨AIGC大事日报
12/11全球AIGC产业要闻1、智谱AI发布文本质量评价模型CritiqueLLM2、智源研究院发布LM-Cocktail模型治理策略3、北大微信AI团队获EMNLP 2023最佳长论文奖4、人...
一文详解大模型归因机制,幻觉问题有救了!
夕小瑶科技说 原创作者 | 谢年年、python大模型的幻觉问题一直是一个亟待解决的挑战。由于大模型的训练语料来源广泛,且都是未经筛选的现实世界文本,预训练...
超越GPT-4!谷歌DeepMind重磅发布Gemini,史上最强最通用大模型!
夕小瑶科技说 原创作者 | 王二狗深夜炸弹!就在刚刚,谷歌 DeepMind 重磅推出了传闻已久的Gemini大模型!号称是谷歌史上功能最强大、最通用的多模态模型,在...
突发!谷歌深夜掀桌子,发最强大模型Gemini,跑分碾压GPT-4【附60页技术报告】
谷歌最强大模型Gemini来了,ChatGPT劲敌,语言理解首次超越人类!作者|香草编辑|漠影北京时间12月7日凌晨,期盼已久的谷歌AI大模型Gemini终于发布了!作为谷...
再见,平面设计师?COLE 结合多个人工智能,按需生成可编辑设计
点击上方蓝字关注我们“ COLE是一款潜力巨大的平面设计工具,能够通过输入文本提示生成高质量设计,具有可编辑文本和图像对象。虽然目前还不是成熟产品,但已...