标签:图像
华为诺亚&清华:基于认知的万物超分大模型CoSeR
机器之心专栏机器之心编辑部从低清图像中提取认知特征,这样的超分辨率才更真实。图像超分辨率技术旨在将低分辨率图像转换为高分辨率图像,从而提高图像的清...
何恺明新作:简单框架达成无条件图像生成新SOTA!与MIT合作完成
丰色 发自 凹非寺量子位 | 公众号 QbitAI大佬何恺明还未正式入职MIT,但和MIT的第一篇合作研究已经出来了:他和MIT师生一起开发了一个自条件图像生成框架,名...
GTA6预告片播放过亿,AI三巨头也能秒变GTA匪帮
机器之心专栏机器之心编辑部GTA 新出的游戏预告片看了吗?据说,这个预告片已经破了三项吉尼斯世界纪录,观看次数已经破亿。但如果告诉你,AI 三巨头也可以成...
Google 最强大模型发布,GPT-4 要被反超?
与 GPT-4正面对决昨天深夜,Google 突然发布重磅 AI 杀手锏——Gemini。多模态 Gemini 可以理解、操作和结合不同类型的信息,包括文本、代码、音频、图像和视频...
超越GPT-4!谷歌DeepMind重磅发布Gemini,史上最强最通用大模型!
夕小瑶科技说 原创作者 | 王二狗深夜炸弹!就在刚刚,谷歌 DeepMind 重磅推出了传闻已久的Gemini大模型!号称是谷歌史上功能最强大、最通用的多模态模型,在...
Google发布Gemini,超越GPT-4
点击上方蓝字关注我们“ Google 期待已久的 Gemini Pro AI 模型终于在Bard首次亮相,尽管这是一个功能较少的较小版本。此外,Google 还在为 2024 年初推出的更...
小模型也可以「分割一切」,Meta改进SAM,参数仅为原版5%
机器之心报道编辑:陈萍、蛋酱对于 2023 年的计算机视觉领域来说,「」(Segment Anything Model)是备受关注的一项研究进展。Meta四月份发布的「分割一切模...
ChatGPT失业危机!微软Copilot重磅升级,图文代码能力暴涨,还免费
不是ChatGPT用不起,而是微软Copilot更有性价比。作者|香草编辑|李水青智东西12月6日报道,今天凌晨,在旗下AI助手Copilot发布一周年之际,微软宣布Copilot迎...
爆料!马斯克旗下AI公司xAI正计划融资10亿美元…
夕小瑶科技说 原创作者 | 王二狗大家好,我是二狗。马斯克终究是闲不住啊!据外媒最新爆料,马斯克旗下AI公司xAI正计划融资10亿美元。xAI在向美国证券交易委...
一张照片,TikTok小姐姐就都能跳舞了
机器之心报道编辑:杜伟、小舟动画视频生成这几天火了,这次 NUS、字节的新框架不仅效果自然流畅,还在视频保真度方面比其他方法强了一大截。前几日,阿里研...
“离谱的AI扩图”火了!张张那叫一个出其不意
金磊 西风 发自 凹非寺量子位 | 公众号 QbitAI家人们,真的是要被抖音AI扩图给笑死了——主打一个看完让人“意想不到”、“一肚子气”~例如一对恩爱情侣的照片在AI...
通用视觉推理显现,UC伯克利炼出单一纯CV大模型,三位资深学者参与
机器之心报道机器之心编辑部仅靠视觉(像素)模型能走多远?UC 伯克利、约翰霍普金斯大学的新论文探讨了这一问题,并展示了大型视觉模型(LVM)在多种 CV 任...
计算机视觉GPT时刻!UC伯克利三巨头祭出首个纯CV大模型,推理惊现AGI火花
新智元报道编辑:编辑部【新智元导读】UC伯克利的CV三巨头推出首个无自然语言的纯视觉大模型,第一次证明纯CV模型也是可扩展的。更令人震惊的是,LVM竟然也能...
横扫13个视觉语言任务!哈工深发布多模态大模型「九天」,性能直升5%
新智元报道编辑:LRS【新智元导读】哈工深发布全新多模态大语言模型九天(JiuTian-LION),融合细粒度空间感知和高层语义视觉知识,在13个评测任务上实现了so...
突破分辨率极限,字节联合中科大提出多模态文档大模型
克雷西 发自 凹非寺量子位 | 公众号 QbitAI现在连文档都有大模型了,还是高分辨率、多模态的那种!不仅能准确识别出图像里的信息,还能结合用户需求调用自己...