标签:图像

Grok图像理解功能上线,单挑ChatGPT结果惊人!无地标照片秒定位,18世纪手稿一眼识别

新智元报道编辑:静音 【新智元导读】能识别并转录18世纪手稿、还能推测无地标照片拍摄地……马斯克本人也出来官宣:Grok现在能够理解图像了!就在刚刚,xAI为G...
阅读原文

【一周 AI 热点】AI 操控电脑和手机、纯血鸿蒙发布、多款文生图重磅更新、智谱及科大讯飞产品重大升级

国际要闻OpenAI驳斥 GPT-5 发布传闻,重组安全团队并加速AI媒体生成OpenAI首席执行官Sam Altman在社交媒体上驳斥了有关公司计划在年底前发布新AI模型Orion的...
阅读原文

匹配正确率提升187.9%!华中科技大学CGCL实验室用自监督学习助力胶囊内窥镜图像拼接,「天眼」里也可看肠胃健康

作者:陆枫 编辑:十九,李宝珠 华中科技大学陆枫团队联合上海交通大学、中南民族大学、香港科技大学、香港理工大学、悉尼大学,提出了一种自监督的、基于片...
阅读原文

多模态大模型: 盘点&Highlights part1——从BLIP到LLaVA

讲座预告11月1日上午10点,南开大学在读博士李森茂,将以《基于扩散模型编码器模块的推理加速》为主题进行直播讲解,欢迎扫码报名~导读Hi大家好,我叫延捷,...
阅读原文

NeurIPS 2024 | 如何防御对抗性提示攻击?AdvUnlearn让图片生成风险骤降

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

与OpenAI o1技术理念相似,TDPO-R算法有效缓解奖励过优化问题

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

新的Midjourney就是一个增强版的Photoshop,你现在可以轻松的用它换衣服、换发型了

好久没有聊 Midjourney 了,昨晚他们发布了一项引人注目的新功能:AI 图像编辑,一个基于网页的加强版的Photoshop 呼之欲出,让我大为震撼,也让用户们赞叹不...
阅读原文

极速体验最新版 Gradio 5!超 200 万用户使用;入选 ACCV’24,LoLI-Street 低光照图像增强数据集上线

Gradio 自推出以来,每月已有超 200 万用户使用,在 AI 开发生态系统中扮演着关键角色。其简洁的代码和直观的界面,使得复杂的机器学习模型也能轻松转化为用...
阅读原文

iOS 18.2 苹果 AI 更多新功能上线!首批实测来了,iPhone 更好用了吗

最新功能 版本前瞻iOS 18.2 的首个开发者测试版来了,这也是最接近下周正式推送的版本。 这一 beta 版本继续履行了 WWDC 2024 所推出的 Apple Intelligence ...
阅读原文

自动驾驶不怵恶劣天气,西电&上海AI Lab多模态融合检测端到端算法来了 | NeurlPS Oral

E2E-MFD团队 投稿量子位 | 公众号 QbitAI恶劣天气下,自动驾驶汽车也能准确识别周围物体了?! 西安电子科大、上海AI Lab等提出多模态融合检测算法E2E-MFD,...
阅读原文

集成ChatGPT,苹果AI更多功能放出!最新开发者测试版系统发布

新智元报道编辑:静音 【新智元导读】苹果开发者测试版系统上新!更多Apple Intelligence功能已经可用了,包括ChatGPT集成。iOS 18终于带着ChatGPT来了。 就...
阅读原文

图像伪造照妖镜!北大发布多模态LLM图像篡改检测定位框架FakeShield

新智元报道编辑:LRST 【新智元导读】北京大学的研究人员开发了一种新型多模态框架FakeShield,能够检测图像伪造、定位篡改区域,并提供基于像素和图像语义错...
阅读原文

0.11秒出图!OpenAI发布sCM模型,提速50倍,作者来自清华

夕小瑶科技说 原创作者 | 小鹿家人们,OpenAI 又上新了! 这次他们推出了全新的生成式模型sCM(Simplifying Continuous-Time Consistency Models),支持视频、...
阅读原文

Nature专业户DeepMind又登封面,开源水印技术SynthID-Text,Gemini已经用上了

机器之心报道 机器之心编辑部现如今,大型语言模型(LLM)生成的内容已经充斥了整个互联网,并且这些模型还能模仿各种类似真人的语气和行文风格,让人难以分...
阅读原文

魔法填充+无限扩图,Ideogram推出AI画板工具Canvas

机器之心报道 编辑:Panda今天是个好日子,至少对 AI 来说是如此。过去 24 小时内发布或更新的 AI 服务包括但不限于 Stable Diffusion 3.5 最强模型全家桶、...
阅读原文
1234548