标签:图像
GPAvatar:仅需单图,快速且精准的3D头像重建及其表情控制
大数据文摘授权转载自将门创投 作者:楚选耕 头部虚拟形象的重建对于虚拟现实、在线会议、游戏和电影等行业的应用至关重要。 该领域的主要目标是忠实地重建头...
最新!何恺明团队发布:打破自回归图像生成瓶颈,告别矢量量化
夕小瑶科技说 原创作者 | 21#近日,深度学习领域的杰出研究者何恺明及其团队又放了个大招,推出其团队最新研究工作,在AI研究领域引起了广泛关注。 何恺明202...
微软Florence-2官宣开源,一统视觉基础模型!华人团队联手打造
新智元报道编辑:桃子 【新智元导读】等了半年,微软视觉基础模型Florence-2终于开源了。它能够根据提示,完成字幕、对象检测、分割等各种计算机视觉和语言的...
揭秘大模型技术在快手搜索的应用
演讲嘉宾 | 许坤 快手搜索部门技术专家 审核 |傅宇琪、褚杏娟 策划 | 蔡芳芳 本文整理自快手搜索部门技术专家许坤在 QCon 2024 北京的分享“大模型技术在快手...
导师爆料:这篇CVPR最佳学生论文,从想法到成稿只用一个月,源自业余灵感
机器之心报道 机器之心编辑部按部就班 vs. 好奇心驱动,哪个更容易出研究成果?CVPR 2024 的最佳学生论文,竟然是用一个月的时间写出来的。 北京时间 6 月 20...
字节豆包全新图像Tokenizer:生成图像最低只需32个token,最高提速410倍
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
PhotoMaker 腾讯推出个性化图像生成新高度;LawInstruct 首个法律大型指令数据集上线
PhotoMaker 是由腾讯与南开大学联合开发的 AI 图像生成工具,不仅能够捕捉人物的面部特征,还能根据喜好生成逼真的人物图像,将个性化定制推向了新高度。无论...
斯坦福AI视频生成工具免费开放!30秒时长,马斯克看了效果会沉默
一水 发自 凹非寺量子位 | 公众号 QbitAI将音频、图像、视频整合进同一工作流,这个由斯坦福初创公司发布的视频工具火了! 预览版支持生成30S逼真视频,网友...
超越CVPR 2024方法,DynRefer在区域级多模态识别任务上,多项SOTA
机器之心发布 机器之心编辑部为了实现高精度的区域级多模态理解,本文提出了一种动态分辨率方案来模拟人类视觉认知系统。本文作者来自于中国科学院大学LAMP实...
超1.2万人参加CVPR 2024,谷歌研究院获得最佳论文
大数据文摘授权转载自AI科技评论 作者:赖文昕、马蕊蕾 编辑:陈彩娴 北京时间今天凌晨,美国西雅图正在召开的计算机视觉盛会 CVPR 2024 正式公布了最佳论文...
超 1.2 万人参加 CVPR 2024,谷歌研究院获得最佳论文
视觉基础模型与文生视频成为 CVPR 2024 两大热点。作者丨赖文昕 马蕊蕾 编辑丨陈彩娴 北京时间今天凌晨,美国西雅图正在召开的计算机视觉盛会 CVPR 2024 正式...
Runway 全新 Gen-3 视频生成模型获网友盛赞:比 Sora 更好
编译 | 核子可乐 褚杏娟 凭借广受欢迎的视频生成工具而声名大噪的 AI 厂商 Runway 最近发布了最新版本的 Runway Gen-3。Gen-3 Alpha 是 Runway 在专为大规模...
王者归来!AI视频巨头Runway深夜发布Gen-3,演示暴打Sora惊艳网友
新智元报道编辑:Aeneas 桃子 【新智元导读】太震撼了!AI视频老牌选手Runway出手了,深夜发布的Gen-3在保真度、一致性和精细程度上再次重磅升级,画面细节直...
王者归来!Runway震撼发布Gen3,文生视频再填重磅!
点击上方蓝字关注我们“摘要:Runway发布Gen-3 Alpha,AI视频生成技术取得显著进步,支持多种视频创作功能,引领行业新潮流。Runway 推出了其最新力作——Gen-3 ...
姚班天才,前旷视6号员工范浩强团队发布肖像动画生成模型MegActor
夕小瑶科技说 原创作者 | Axe《完蛋!我被大模型包围了》 不知大家可还记得这个去年底刷爆AI圈的互动游戏,一天之内用户破万,又一天之内因流量过大而关停,...