标签:分辨率
AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!
这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...
ECCV 2024收录!旷视提出无需训练的更高分辨率图像生成框架HiDiffusion | 一作、高级研究员张慎主讲预告
在图像生成领域,高分辨率图像的生成一直是一个具有挑战性的工作。Stable Diffusion等强大的预训练扩散模型目前可以生成1024x1024像素的高质量图像。但生成更...
长短大小样样精通!原始分辨率、超长视频输入:更灵活的全开源多模态架构Oryx
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
字节豆包全新图像Tokenizer:生成图像最低只需32个token,最高提速410倍
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
超越CVPR 2024方法,DynRefer在区域级多模态识别任务上,多项SOTA
机器之心发布 机器之心编辑部为了实现高精度的区域级多模态理解,本文提出了一种动态分辨率方案来模拟人类视觉认知系统。本文作者来自于中国科学院大学LAMP实...
把整个地球装进神经网络,北航团队推出全球遥感图像生成模型
克雷西 发自 凹非寺量子位 | 公众号 QbitAI北航的研究团队,用扩散模型“复刻”了一个地球? 在全球的任意位置,模型都能生成多种分辨率的遥感图像,创造出丰富...
4倍内存效率,生成和超分双SOTA!清华&智谱AI发布最新Inf-DiT模型
直播预告 | 5月28日10点,「智猩猩AI新青年讲座」第236讲正式开讲,密歇根大学安娜堡分校在读博士生张挥杰将直播讲解《利用多级框架和多解码器架构提高扩散模...
今日arXiv最热CV大模型论文:国产开源视觉大模型InternVL 1.5发布,赶超GPT-4V水准
夕小瑶科技说 原创作者 | 墨墨2023年9月,OpenAI发布了多模态大模型GPT-4V,开启了多模态研究热潮。短短8个月时间内,闭源模型如Gemini系列, Qwen-VL-Max,开...
DiT架构大一统:一个框架集成图像、视频、音频和3D生成,可编辑、能试玩
机器之心报道 编辑:杜伟、大盘鸡基于 Diffusion Transformer(DiT)又迎来一大力作「Flag-DiT」,这次要将图像、视频、音频和 3D「一网打尽」。今年 2 月初...
超分辨率专题 | 3 种方法、4 个教程、10 个数据集,一文 Get 核心知识点
作者:十九 编辑:李宝珠,三羊 超分辨率能够克服或补偿由于图像采集系统、采集环境本身限制而导致的成像模糊、图像质量低下等问题,提升图像分辨率,为特征...
在线教程|二次元的福音!一键部署APISR,动漫画质飞跃升级
作者:十九 编辑:李宝珠,三羊 APISR 不仅可以恢复并增强低质量、低分辨率的动漫图像和视频源,还能处理各种图像退化问题(如模糊、噪声、压缩伪影等),提...
上海AI Lab开源首个可替代GPT-4V的多模态大模型
夕小瑶科技说 原创作者 | 任同学与开源和闭源模型相比,InternVL 1.5 在 OCR、多模态、数学和多轮对话等 18 个基准测试中的 8 个中取得了最先进的结果。 上海...
Open-Sora 全面开源升级:支持单镜头16s视频生成和720p分辨率
Open-Sora 在开源社区悄悄更新了,现在支持单镜头长达16秒的视频生成,分辨率最高可达720p,并且可以处理任何宽高比的文本到图像、文本到视频、图像到视频、...
Open-Sora全面开源升级:支持16s视频生成和720p分辨率
机器之心发布 机器之心编辑部Open-Sora 在开源社区悄悄更新了,现在单镜头支持长达16秒的视频生成,分辨率最高可达720p,并且可以处理任何宽高比的文本到图像...
Open-Sora 全面开源升级:支持 16s 视频生成和 720p 分辨率
最近,AI 科技评论发现,国产视频生成模型 Open-Sora 在开源社区悄悄更新了! 现在支持长达16秒的视频生成,分辨率最高可达720p,并且可以处理任何宽高比的文...
轻松拿捏4K高清图像理解!这个多模态大模型自动分析网页海报内容,打工人简直不要太方便
陈林 投稿自 凹非寺量子位 | 公众号 QbitAI一个可以自动分析PDF、网页、海报、Excel图表内容的大模型,对于打工人来说简直不要太方便。 上海AI Lab,香港中文...
12