多模态物体幻觉下降23%!UNC斯坦福等推出通用修正器LURE:兼容任意LVLM,专攻三大幻觉成因

新智元报道编辑:LRS【新智元导读】基于LVLM幻觉频发的三个成因(物体共现、物体不确定性、物体位置),北卡教堂山、斯坦福、哥大、罗格斯等大学的研究人员提...
阅读原文

中国发表第一篇计算机顶会的人都怎么样了?中国ACL、AAAI、CVPR第一人是谁

夕小瑶科技说整理 | 王二狗中国大陆发第一篇计算机顶会的人都怎么样了?相信AI从业者对这个话题都会非常感兴趣,本文对知乎上各位大佬的信息做一个整理,分享...
阅读原文

Stable Diffusion被爆包含性别、种族歧视!比AI更可怕的是人类的偏见……

夕小瑶科技说 原创作者 | 付奶茶、王二狗最近,华盛顿邮报的一篇报道引起了“奶茶”我的关注!报道中提到AI图像生成器已经开始暴露出它们学到的偏见。比如将非...
阅读原文

最强开源大模型刚刚易主!李开复率队问鼎全球多项榜单,40万文本处理破纪录

金磊 明敏 发自 凹非寺量子位 | 公众号 QbitAI百模大战,最备受期待的一位选手,终于正式亮相!它便是来自李开复博士创办的AI 2.0公司零一万物的首款开源大模...
阅读原文

马斯克版ChatGPT爆火来袭!不用Python,11人爆肝两个月

梦晨 克雷西 发自 凹非寺量子位 | 公众号 QbitAAI马斯克突然出手截胡,抢在OpenAI开发者大会前发布大模型Grok。与其他ChatGPT类产品不同,Grok可以实时从?推...
阅读原文

大跌眼镜!GPT-4V错觉挑战实录:该错的没错,不该错的反而错了

丰色 发自 凹非寺量子位 | 公众号 QbitAIGPT-4V挑战视觉错误图,结果令人“大跌眼镜”。像这种判断“哪边颜色更亮”的题,一个没做对:读图片中隐藏信息的也傻傻...
阅读原文

国内最大开源模型发布,无条件免费商用!参数650亿,基于2.6万亿token训练

丰色 发自 凹非寺量子位 | 公众号 QbitAI国内规模最大的开源大模型来了:参数650亿、基于2.6-3.2万亿token训练。排名仅次于“猎鹰”和“羊驼”,性能媲美GPT3.5,...
阅读原文

北大具身智能新成果:无需训练,听指令就能灵活走位

北大前沿计算研究中心 投稿量子位 | 公众号 QbitAI北京大学董豪团队具身导航最新成果来了:无需额外建图和训练,只需说出导航指令,如:Walk forward across ...
阅读原文

OpenAI 开发者大会前瞻 / 何小鹏疑喊话余承东 / 李佳琦公司回应员工收百万好处费

?制糖工厂新 Patch,今日发布?OpenAI 首届开发者大会最新爆料?Vision Pro 不会很快成为苹果主要的利润增长点?巴菲特「炒股」亏损近 1800 亿元?保时捷中国 CEO...
阅读原文

OpenAI DevDay提前泄露了大量新功能

点击上方蓝字关注我们图|匡萃彪文|匡萃彪“ OpenAI DevDay即将发布ChatGPT的创新功能,包括全新用户界面、自定义聊天机器人工具Gizmo、企业订阅计划、工作区...
阅读原文

Meta和A16z等面临数10亿美元AI训练数据费用威胁

点击上方蓝字关注我们图|匡萃彪文|匡萃彪“ 美国版权局正在考虑更新其法律以直接处理生成人工智能。Meta、微软、OpenAI 和其他在人工智能领域有利害关系的公...
阅读原文

耐克的新产品,瞄准了还在学走路的孩子 | Feel Good 周报

抓住运动员第一步Feel Good 导读芬兰小城是如何走向「碳中和」的?现在,婴儿都有自己的耐克了vivo 推出新无障碍功能,环境和乐谱都能被「听到」Gucci 推出非...
阅读原文

浅谈 AI 内容生成在影视、娱乐行业的影响

Hello,大家好!我是JioNLP。这篇文章简单来谈谈 AI 内容生成在影视行业的影响。最近有三个关于 AI 的热点新闻还是比较抓人眼球的。一个是 runway 公司发布了...
阅读原文

前沿进展:群论方法解析大脑信息表征的对称性

导语对称性支配着我们所在的世界,而我们的大脑会建立外部世界的模型,这自然引发一个问题:对称性是否也是大脑信息处理的基本原理?本文介绍了研究者近期发...
阅读原文

AI「脑补」画面太强了!李飞飞团队新作ZeroNVS,单个视图360度全场景生成

来源:机器学习研究组订阅近来,利用3D感知扩散模型训练模型,然后对单个物体进行SDS蒸馏的研究数不胜数。但是,能够真正做到「场景级」的画面生成,从未实现...
阅读原文