标签:图像

Transformer一作来卷多模态!学术图表也能看懂,100毫秒极速响应|免费试玩

明敏 发自 凹非寺量子位 | 公众号 QbitAI最近多模态大模型是真热闹啊。这不,Transformer一作携团队也带来了新作,一个规模为80亿参数的多模态大模型Fuyu-8B...
阅读原文

AI实时解读大脑信号,7倍速还原图像关键视觉特征,LeCun转发

萧箫 发自 凹非寺量子位 | 公众号 QbitAI现在,AI已经能实时解读大脑信号了!这不是耸人听闻,而是Meta的一项新研究,能够凭脑信号猜出你在0.5秒内看的图,并...
阅读原文

超低训练成本文生图模型PixArt来了,效果媲美MJ,只需SD 10%训练时间

机器之心专栏机器之心编辑部训练一个媲美 MJ 的文生图模型,26K 美元就能实现了。当前,最先进的文本到图像(T2I)模型需要大量的训练成本(例如,数百万个 G...
阅读原文

谷歌视觉语言模型PaLI-3问世,参数仅5B,更小、更快、更强

机器之心报道编辑:杜伟、陈萍在多模态(视觉语言)大模型领域,拼参数赢性能的同时,追求参数更小、速度更快、性能更强是另一条研究路径。在大模型时代,视...
阅读原文

清华团队攻破GPT-4V、谷歌Bard等模型,商用多模态大模型也脆弱?

机器之心专栏机器之心编辑部GPT-4 近日开放了视觉模态(GPT-4V)。以 GPT-4V、谷歌 Bard 为代表的多模态大语言模型 (Multimodal Large Language Models, MLLM...
阅读原文

谷歌重磅发布 PaLI-3,四两拨千斤!

夕小瑶科技说 原创作者 | 智商掉了一地、ZenMoore视觉语言模型(VLM)的参数规模已经扩展到数百亿,甚至数千亿,这使得其性能持续提升。然而,小规模模型仍然...
阅读原文

GPT-4V被曝离谱bug:突然执行神秘代码,空白图片读出打折信息,网友们都看呆了

丰色 明敏 发自 凹非寺量子位 | 公众号 QbitAIGPT-4V出现惊天bug?!原本只是让它分析一张图片,结果它直接犯了致命安全问题,把聊天记录都给抖落出来了。只...
阅读原文

千万人围观「烧焦婴儿」图片!伯克利教授辟谣:AI图片检测器无用

新智元报道编辑:桃子 润【新智元导读】AI无法打败AI,不是没有道理。近来,上千万人围观的婴儿死亡照片,AI检测工具竟无法给出一致答案。AI图片检测器又被冲...
阅读原文

谷歌版AI绘画搜索框里直接玩!基于Imagen打造,网友:DALL-E替代品来了

丰色 发自 凹非寺量子位 | 公众号 QbitAI谷歌自家的“DALL-E/Midjourney”终于上线了。今天,谷歌给自家搜索来了个大更新:只需在搜索框中输入提示词,就能直接...
阅读原文

AI搞定谷歌验证码,最新多模态大模型比GPT-4V空间理解更准确 | 苹果AI/ML团队

Michael 投稿自 凹非寺量子位 | 公众号 QbitAI谷歌人机验证已经拦不住AI了!最新多模态大模型,能轻松找到图中所有交通信号灯,还准确圈出了具体位置。表现直...
阅读原文

Adobe新版AI绘画炸场,2k分辨率在线就能玩,网友:效果比DALL·E 3更强

萧箫 发自 凹非寺量子位 | 公众号 QbitAIFirefly新版文生图工具,直接炸场Adobe春晚!在一年一度的MAX大会上,Adobe推出了一系列新功能。其中最受瞩目的,就...
阅读原文

挑战GPT-4V,浙大校友推出开源版多模态大模型,获GitHub 6k+星标

克雷西 发自 凹非寺量子位 | 公众号 QbitAIGPT-4的视觉能力还没全量放开测试,开源对手就隆重登场了。浙大竺院的一位校友,与微软研究院等机构合作推出了新版...
阅读原文

在PS里一秒生成图像素材!Adobe甩出三大AI模型,100多项AI能力炸场

Adobe的逆天黑科技,让设计师搭上AI顺风车。编译|程茜编辑|李水青智东西10月11日消息,今天凌晨,全球最大设计软件龙头Adobe甩出Adobe Firefly创意生成式AI模...
阅读原文

PS+AI生图一步完成,效果惊人!Adobe Firefly 2重磅更新:模型全面升级,矢量图完美支持

新智元报道编辑:润 贝果【新智元导读】Adobe的AIGC生图平台Firefly最近升级为Firefly 2,提升了图像质量、引入了矢量图生成功能,并增加了多项新功能,极大...
阅读原文

清华全球首颗片上学习忆阻器存算一体芯片,成果登上Science

机器之心报道编辑:杜伟对于攻克「卡脖子」关键核心技术,这类忆阻器存算一体芯片具有积极的意义。10 月 9 日,清华大学官微报道了该校研制全球首颗支持片上...
阅读原文
1414243444548