标签:图片
记录活在 OpenAI 阴影里的 AI 创业经历
700个开发硬件免费申请➕现金大奖!生成式 AI、机器人 AI、PC AI 三大赛道!AMD Pervasive AI 开发者挑战赛报名火热进行中,扫码了解详情并报名~导读本文是知...
大型多视角高斯模型LGM:5秒产出高质量3D物体,可试玩
机器之心专栏 机器之心编辑部为满足元宇宙中对 3D 创意工具不断增长的需求,三维内容生成(3D AIGC)最近受到相当多的关注。并且,3D 内容创作在质量和速度方...
AI绘图模型训练到推理,一个网页就能搞定
克雷西 发自 凹非寺量子位 | 公众号 QbitAI不会写代码,也能训练AI绘画模型了! 只要借助这个框架,从训练到推理都能一站式搞定,还能一次管理多个模型。 阿...
国内AI绘画哪家强?十大免费工具横评,BAT参战,但不是最强
对国内10款免费AI文生图工具5个梯度的进阶体验对比,哪款工具更得心应手? 作者|程茜 编辑|心缘 距离龙年春节只剩11天了,你的新年头像或红包封面准备好了吗...
「文生图」再升级!学习个性化参照,无限生成多样图片,轻松设计玩具建筑
新智元报道编辑:LRS 【新智元导读】将图片集反演到语义空间的分布,生成多样个性化图片或3D渲染,支持灵活文本编辑、多样性控制、概念混合等。最近,来自南...
OCR终结了?旷视提出支持文档级OCR的多模态大模型,支持中英文,已开源!
国科大&旷视团队 投稿量子位 | 公众号 QbitAI想将一份文档图片转换成Markdown格式? 以往这一任务需要文本识别、布局检测和排序、公式表格处理、文本清洗...
视频一键动漫化AI工具火了,武打戏各种招式丝滑转换,免费在线可玩
西风 发自 凹非寺量子位 | 公众号 QbitAI文字、图片、视频,万物皆可动漫化! 看,两位老兄上一秒还在武馆激烈打斗: 下一秒就转到了二次元世界,出拳、格挡...
微软把DALL-E 3集成到键盘,任何APP中都可生图!
西风 发自 凹非寺量子位 | 公众号 QbitAI微软发福利,DALL-E 3可以和手机键盘绑定了! 键盘区秒变生图区,在任何APP中都能使用。 看,这是X(原Twitter),在...
Nature:2023年度最佳科学图片!
来源:高分子科学前沿2022年,詹姆斯·韦伯太空望远镜由美国宇航局投入使用,带来一系列引人入胜的宇宙景象,震撼人心。时至2023年,这一高科技设备持续发挥其...
随意指定CLIP关注区域!上交复旦等发布Alpha-CLIP:同时保持全图+局部检测能力
新智元报道编辑:LRS【新智元导读】本文介绍了一个名为Alph-CLIP的框架,它在原始的接受RGB三通道输入的CLIP模型的上额外增加了一个alpha通道。在千万量级的R...
「一键脱衣」的 AI,连孩子都不放过
Deepfake变普通了《心灵奇旅》里说,寻找海洋之时,应该知道自己已经生活在水里。AI 之于人类社会似乎也是这样。今年以来,各行各业的「iPhone」时刻不断上演...
北大最新多模态大模型开源:在混合数据集上训练,无需修改直接用到图像视频任务
一个北大投稿 发送至 凹非寺量子位 | 公众号 QbitAI训完130亿参数通用视觉语言大模型,只需3天!北大和中山大学团队又出招了——在最新研究中,研究团队提出了...
太可怕了!AI虚假图片已经达到了新闻摄影获奖的程度…
夕小瑶科技说 原创作者 | 杨灿首先请大家看一副入围新闻摄影获奖的作品:战争期间,一名受伤的以色列年轻女子正痛苦地抓着士兵的手臂。这抓拍的角度,这女子...
训练130亿大模型仅3天,北大提出Chat-UniVi统一图片和视频理解
机器之心专栏机器之心编辑部北京大学和中山大学等机构研究者提出了统一的视觉语言大模型 ——Chat-UniVi。通过构建图片和视频统一表征,该框架使得一个 LLM 能...
视频生成新突破:PixelDance,轻松呈现复杂动作与炫酷特效
机器之心报道机器之心编辑部AI 生成的视频终于能动了。最近,除了大语言模型继续持续刷屏,视频生成技术也取得了重大进展,多家公司相继发布了新模型。首先,...