标签:图像

英伟达官方盘点2023年10大研究!「神经朗琪罗」秒变逼真大卫,用AI生成3D虚拟世界

‍新智元报道编辑:桃子 润 【新智元导读】英伟达官方盘点2023年10大研究,从CV到AI,从智能体到生成式AI。英伟达不但现实世界中用GPU收割全世界,也在虚拟世...
阅读原文

大模型被偷家!腾讯港中文新研究修正认知:CNN搞多模态不弱于Transfromer

腾讯&港中文团队 投稿量子位 | 公众号 QbitAI在Transformer占据多模态工具半壁江山的时代,大核CNN又“杀了回来”,成为了一匹新的黑马。 腾讯AI实验室与港...
阅读原文

Midjourney V6神图炸出!生图效果碾压DALL·E3,逼真画面光影细节登峰造极

新智元报道编辑:编辑部 【新智元导读】兵贵神速,Midjourney V6昨天上午说要来,下午就真来了。神图纷纷炸出,光影效果登峰造极,主打一个「你能说我就能画...
阅读原文

Midjourney 发布 V6 beta:增强语义理解,支持嵌入英文单词

赶在圣诞假期前,Midjourney 发布了 V6 beta 版本,北京时间下午13:56,老美那边大概夜里10点。 他们是想趁着还没回家过圣诞,赶紧先发了。然后让大家一边过...
阅读原文

谷歌Gemini技术报告出炉,作者多达900余人

机器之心报道 机器之心编辑部从此以后,Google Scholar 数据该出问题了。备受期待的谷歌 Gemini 技术报告完整版,今天终于出炉了。两周前,人们兴奋于谷歌提...
阅读原文

再也不怕合照缺人,Anydoor为图片编辑开了一道「任意门」

机器之心报道 机器之心编辑部「能不能把这张图里的产品,都放到另一张图的桌子上?」面对这样的要求,设计师肯定会脑瓜嗡嗡的。 把指定物品放进另一张图片不...
阅读原文

Midjourney V6史诗级升级,网友惊呼太逼真!神图接连曝出,传今明两天上线

新智元报道编辑:Aeneas 好困 【新智元导读】Midjourney V6刚刚开启了第二次社区评价,网友们被各种神图震惊到失语。光影效果逆天,皮肤和毛发质感细腻,让人...
阅读原文

2023-2024 年影像旗舰,为什么都选它?

影像旗舰 幕后功臣第三代骁龙 8 移动平台提档 10 月发布,带来了一个巨大的连锁反应:Android 旗舰手机纷纷在今年第四季度扎堆发布,在价格和产品力上双双发...
阅读原文

谷歌推出视频生成大型语言模型VideoPoet

点击上方蓝字关注我们“Google推出VideoPoet,一款生成式AI系统,通过文本等输入创建和编辑视频。与竞争模型不同,VideoPoet整合多项功能于单一模型,包括文本...
阅读原文

谷歌重磅发布零样本视频生成模型!效果惊艳,赶超扩散模型?

夕小瑶科技说 原创作者 | 王二狗今日,谷歌AI发布了最新的视频生成模型VideoPoet。 VideoPoet 没有采用流行的扩散模型架构,其本质上是一种多模态大语言模型...
阅读原文

谷歌10秒视频生成模型破世界记录!LLM终结扩散模型,效果碾压顶流Gen-2

新智元报道编辑:编辑部 【新智元导读】谷歌全新视频生成模型VideoPoet再次引领世界!十秒超长视频生成效果碾压Gen-2,还可进行音频生成,风格转化。AI视频生...
阅读原文

Midjourney V6 即将推出,有许多改进

点击上方蓝字关注我们“Midjourney即将推出引领潮流的AI艺术工具Midjourney v6,继具有突破性的V5.2后。预测表明v6将进一步提升对自然语言提示的理解,引入更...
阅读原文

GPT-4V被超越?SEED-Bench多模态大模型测评基准更新

大数据文摘受权转载自将门创投 大语言模型(LLM)的蓬勃发展离不开健全的评测体系,而对于多模态大语言模型(MLLM)而言,一直缺乏类似MMLU、ARC等全面且客观...
阅读原文

阿里文生视频挑战Gen-2、Pika,1280×720分辨率无压力,3500万文本-视频对显奇效

机器之心报道编辑:张倩、陈萍文生视频领域又卷起来了!文生视频可以精细到什么程度?最近,阿里巴巴的一项研究给出了答案:1280×720 分辨率没有压力,而且生...
阅读原文

杠上了!谷歌官宣开放Gemini API,奥特曼宣布ChatGPT Plus恢复订阅!

夕小瑶科技说 原创作者 | 王二狗大家好我是二狗。AI圈真是太精彩了,OpenAI和谷歌又开始明争暗斗起来了。今日Sam Altman宣布重新启用ChatGPT Plus 订阅;而在...
阅读原文
1333435363748