标签:图像
一拖一拽,玫瑰复活了!谷歌提出生成图像动力学,从此万物皆有灵
新智元报道编辑:桃子 润【新智元导读】图中万物皆能动!谷歌团队最新提出的「生成图像动力学」,能将静态图片转化为动态的、无缝循环的视频,甚至还可以交互...
阿里云AI大模型通义千问通过备案,今日正式向全社会开放!
随着ChatGPT的快速进化吸引了全球网友的眼球,国内厂商也纷纷表示将推出相似的产品。而在前段时间,小编曾给大家整理过现在已经宣布推出的国产AI,包括百度“...
腾讯云AI绘画全新发布,25种不同场景风格,5秒内快速出图!
在9月7日的2023腾讯全球数字生态大会上,腾讯云正式推出全新的AI绘画产品,它依托腾讯自研的AI绘画模型,提供AI图像生成与编辑技术API服务,使用户能够轻松地...
7个惊人的AI工具,不管从事什么工作都能够用到!
今天,从自然语言处理到图像识别,从预测分析到机器学习,几乎每一个领域都有大量的人工智能工具可用,帮助你将繁琐的任务自动化,从数据中获得洞察,甚至创...
AIGC最新动态丨9月6日行业大事件汇总!
AIGC行业资讯国外热点速览Prompt2Model:可自动生成专用NLP模型;高斯绘画工具开源,可用于艺术创作和机器学习研究;Zoom正式发布类ChatGPT产品—AI Companion...
带你穿越清明上河图!DragNUWA惊艳亮相:一拖一拽让静图秒变视频
新智元报道编辑:Lumina【新智元导读】微软提出文本图像轨迹条件视频生成模型DragNUWA,支持手绘轨迹驱动图像动态化,实现复杂运动及场景控制。微软开发的视...
Meta发布大规模视觉模型评估基准FACET!开源视觉模型DINOv2允许商用
夕小瑶科技说 原创作者 | 谢年年近日,Meta宣布开源计算机视觉模型DINOv2现在可商业化应用了,并发布了全新的视觉模型评估新基准FACET。DINOv2是Meta AI继「...
MVDream:轻松实现从文本到3D渲染图像
近日,字节跳动研究人员推出了名为MVDream的新技术,它可以仅通过文本描述生成高质量的3D图像。这种从文本到图像的生成技术,被称为“文本到3D”技术,是当前计...
免费科研利器!Meta祭出Nougat,PDF格式转换,公式表格精准识别,扫描版文档也可以
新智元报道编辑:桃子【新智元导读】最新科研神器Nougat,可以把PDF中公示、文本提取出来。做研究的童鞋们简直要狂喜!近来,Meta AI研究人员推出一款OCR神器...
⌈四合一物体传送门⌋,向场景中可控传送物体
作为图像编辑的常用操作,图像合成(image composition)旨在把一张图片的前景物体和另外一张背景图片结合起来得到一张合成图(composite image),视觉效果类似...
Midjourney遇劲敌!免费AI绘画神器Ideogram!
一家总部位于多伦多的人工智能创业公司Ideogram,正式对外发布了其新一代人工智能图像生成系统Ideogram。这家由多位前Google Brain研究员创立的公司获得了来...
哪个视觉语言模型更优?InstructBLIP、MiniGPT-4?全面评估基准LVLM-eHub告诉你
夕小瑶科技说 原创作者 | 王思若LLaMA、GPT-3等大型语言模型实现了对自然语言强大的理解和推理能力,为AI社区构筑了强大的语言基座模型。进而,继续迭代的GPT...