标签:图像
一万亿token!34亿张图像,扩大10倍!史上最大开源多模态数据集MINT-1T发布!
夕小瑶科技说 原创作者 | 谷雨龙泽众所周知,现在训练AI最需要的是什么? 数据,数据,还是数据。——毕竟只有让AI学好了,AI才能好好地回答你的问题,否则就会...
刚刚,Meta开源「分割一切」2.0模型,视频也能分割了
机器之心报道 机器之心编辑部还记得 Meta 的「分割一切模型」吗?这个模型在去年 4 月发布,被很多人认为是颠覆传统 CV 任务的研究。 时隔一年多,刚刚,Meta...
日均tokens使用量超5000亿,AI生图玩法猛猛上新:豆包大模型为什么越来越「香」了?
机器之心报道 作者:蛋酱2024 年的 AI 图像生成技术,又提升到了一个新高度。 技术的飞速迭代,让这一领域的商业化落地进入加速阶段。前有 Midjourney v6 史...
ECCV 2024|是真看到了,还是以为自己看到了?多模态大模型对文本预训练知识的过度依赖该解决了
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
ICML最佳论文SD3上线公共教程!DreamBench++图像自动评估新基准来了,实现人类偏好深度对齐
近日,ICML 2024 最佳论文公布了!其中就包含年度图像生成的「网红模型」——Stable Diffusion 3(简称 SD3)。SD3 是由 Stability AI 开发的最新文本到图像生...
万字长文分享快手 Kolors 可图大模型应用实践
嘉宾 | 李岩 策划 | 李忠良 在企业提效方面,多模态能力同样具有重要意义。在 AICon 北京站活动中,我们邀请了快手「可图」大模型负责人李岩,他分享了主题为...
在线教程 | Stable Diffusion 3 Medium 现已开源,一键开启你的创作之旅!
作者:小贝 编辑:十九 文生图界的扛把子 Stability AI 开源的模型 Stable Diffusion 3 Medium,在图像质量、复杂提示理解以及资源效率方面都有显著提升,能...
入选ACL 2024!引入零样本学习,华中科大发布针对甲骨文破译优化的条件扩散模型
作者:田小幺 编辑:李宝珠,十九 华中科技大学白翔、刘禹良研究团队联合阿德莱德大学、安阳师范学院、华南理工大学,训练出了一种针对甲骨文破译优化的条件...
ECCV 2024 | 让GPT-4图像理解更易出错,全新策略增强VLP模型对抗迁移性
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
字节跳动科学家组团演讲,揭秘AI视频生成大招!
字节跳动多位视觉大模型研究关键人物同台。 作者|程茜 编辑|心缘 智东西7月19日报道,今日下午,在字节跳动AI技术菁英论坛上,字节跳动豆包大模型视觉基础研...
价值 999!Apache CoC 大会门票免费送;ToT 大模型时间推理基准数据集上新
7 月 26-28 日,Apache 将在杭州举办 CommunityOverCode Asia 2024(简称 CoC),该会议将给大家带来 Apache 社区建设和发展的最新资讯和前沿实践。HyperAI超...
基于LoRA微调多模态大模型一文解析
7月16日19点,「智猩猩AI新青年讲座」第244讲将开讲。上海交通大学和宁波东方理工大学联合培养博士生徐良将主要讲解通用的3D人体动作生成框架ActFormer和人体...
MSRA:视觉生成六大技术问题
古纾旸 投稿量子位 | 公众号 QbitAI文生图、文生视频,视觉生成赛道火热,但仍存在亟需解决的问题。 微软亚洲研究院研究员古纾旸对此进行了梳理,他认为视觉...
一分钟原画变3D角色,清华VAST成果入选图形学顶会SIGGRAPH
CharacterGen团队 投稿量子位 | 公众号 QbitAI随便一张立绘都能生成游戏角色,任意IP快速三维化有新招了! 来自清华大学和VAST的研究人员联合推出了Character...
一键运行 ComfyUI SD3!大规模医学 VQA 评测数据集上线,涉及超 20 个人体器官和部位
为了进一步推进 AI4S 的普适化,HyperAI超神经策划了「Meet AI4S」系列直播栏目。第一期直播将于 7 月 17 日 19:00 准时上线!我们邀请到了浙江大学遥感与地...