标签:区域
AI赚钱副业~AI生成影视解说,半个月涨粉变现3.5W+!
这两年大家都在感叹生活不易,然而我想说的是,机会还是有的,但问题不在于有没有,而在于你是否能够认准机会,然后抓住它。 接触过很多咨询项目的人,发现...
图像伪造照妖镜!北大发布多模态LLM图像篡改检测定位框架FakeShield
新智元报道编辑:LRST 【新智元导读】北京大学的研究人员开发了一种新型多模态框架FakeShield,能够检测图像伪造、定位篡改区域,并提供基于像素和图像语义错...
AIGC的风口上,中国企业如何提升出海胜算?|出海大咖说
允中 发自 凹非寺量子位 | 公众号 QbitAI面对出海热,无论是跃跃欲试的新手,还是身经百战的前辈,都在持续审视出海的新趋势、新热点。 而《出海大咖说》是一...
Meta 如何将 AI 图片大规模转制成动画
作者 | Gaurav Sharma 译者 | 王强 策划 | 褚杏娟 我们推出 Meta AI 的目的是让人们以新的方式提高工作效率,并通过生成式人工智能(GenAI) 释放创造力。但...
Science正刊:大脑也能重启,睡觉就能增强记忆力
西风 发自 凹非寺量子位 | 公众号 QbitAI好好睡觉,能增强记忆,还能让大脑“重启”。 这是来自Science最新一篇正经研究! 背课文当天死记硬背、吼破嗓子都背不...
浙大李玺团队:指代表达理解新方法,ScanFormer粗到细迭代消除视觉冗余
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
语言≠思维,大模型学不了推理:一篇Nature让AI社区炸锅了
机器之心报道 机器之心编辑部方向完全搞错了?大语言模型(LLM)为什么空间智能不足,GPT-4 为什么用语言以外的数据训练,就能变得更聪明?现在这些问题有 「...
超越CVPR 2024方法,DynRefer在区域级多模态识别任务上,多项SOTA
机器之心发布 机器之心编辑部为了实现高精度的区域级多模态理解,本文提出了一种动态分辨率方案来模拟人类视觉认知系统。本文作者来自于中国科学院大学LAMP实...
杨幂+小兰会是什么样?中山大学新AI成果,实现人脸个性化SOTA
皓楠投稿自 凹非寺量子位 | 公众号 QbitAI只需上传一张照片,就能瞬间变换身份,获得高精度个人写真! 或是科幻电影中的超级英雄,或是穿越时空的复古角色…… ...
《Nature》视觉在大脑发育中起着关键作用
来源:神经生物学 编辑:Lisa 审核:mingzlee7科学家们早就知道,我们的大脑被组织成专门的区域,每个区域负责不同的任务。例如,视觉皮层处理我们看到的东西...
CVPR 2024 | 仅需文本或图像提示,新框架CustomNeRF精准编辑3D场景
机器之心专栏 机器之心编辑部美图影像研究院(MT Lab)与中国科学院信息工程研究所、北京航空航天大学、中山大学共同提出了 3D 场景编辑方法 ——CustomNeRF,...
CVPR 2024丨文本或图像提示精准编辑 3D 场景,美图&信工所&北航&中大联合提出 3D 编辑方法 CustomNeRF
美图影像研究院(MT Lab)与中国科学院信息工程研究所、北京航空航天大学、中山大学共同提出了3D场景编辑方法——CustomNeRF,同时支持文本描述和参考图像作为3...
揭秘美图AI局部重绘技术
作者| 美图影像研究院 最近,靠着出其不意的扩图效果,“AI 扩图”功能凭借搞笑的补全结果频频出圈,火爆全网。网友们踊跃尝试,180 度的大反转也让网友们直呼...
文生图新SOTA!Pika北大斯坦福联合推出RPG,多模态助力解决文生图两大难题
新智元报道编辑:alan 【新智元导读】近日,北大、斯坦福、以及Pika Labs发布了新的开源文生图框架,利用多模态LLM的能力成功解决文生图两大难题,表现超越SD...
无人出租车深圳中心区收费载客,硅谷同款,首获资质
允中 发自 凹非寺量子位 | 公众号 QbitAI最新消息,深圳宝安区已向AutoX安途颁发首批智能网联汽车无人商业化试点资质,许可AutoX在宝安中心城区进行无人化Rob...
扩散模型更懂复杂提示词!Pika北大斯坦福开源新框架,利用LLM提升理解力
明敏 发自 凹非寺量子位 | 公众号 QbitAIPika北大斯坦福联手,开源最新文本-图像生成/编辑框架! 无需额外训练,即可让扩散模型拥有更强提示词理解能力。 面...
12