标签:问题
解决多模态大模型幻觉问题的秘密武器:“啄木鸟”免重训方法!哪里出问题啄哪里!
夕小瑶科技说 原创作者 | 付奶茶、王二狗最近多模态大模型的研究取得了巨大的进展。然而,这些模型在生成时存在着文本与图像不一致的问题,这个问题就是一直...
吴恩达加入图灵三巨头混战,炮轰Sam Altman:AI监管「不会管不如不管」,LeCun转赞
新智元报道编辑:润 alan【新智元导读】针对「AI末日论」引发的大佬们关于AI监管的口水战,吴恩达下场力挺LeCun:「不合格的监管不如不要监管」!Hinton,Ben...
GPT-4V连小学生都不如?最新基准测试错误率竟高达90%:红绿灯认错、勾股定理也不会
新智元报道编辑:LRS 好困【新智元导读】马里兰大学发布首个专为VLM设计的基准测试HallusionBench,全面测试GPT-4V视觉错误和语言幻觉。GPT-4被吹的神乎其神...
MetaAI提出全新验证链框架,大模型通过“三省吾身”缓解幻觉现象
大数据文摘授权转载自将门创投作者:seven_曾子曰:“吾日三省吾身”–出自《论语·学而》时至今日,生成幻觉(hallucination)仍然是大模型研究界中一个令人非常...
多模态大模型幻觉降低30%!中科大等提出首个幻觉修正架构「Woodpecker」啄木鸟
新智元报道编辑:好困【新智元导读】最近,来自中科大等机构的研究人员提出了首个多模态修正架构「啄木鸟」,可有效解决MLLM输出幻觉的问题。视觉幻觉是常见...
国外Java工程师力证:GPT-4不能解决逻辑谜题,但确实具备推理能力
新智元报道编辑:Lumina【新智元导读】IMG Arena的高级软件工程师 Johan LAJILI认为在LLM能够理解概念、通过图灵测试时,我们就该承认它具有推理能力了。GPT-...
北京大学王选所推出 ALCUNA ,大模型新知识理解能力评测再添一榜!
夕小瑶科技说 原创作者 | 付奶茶、ZenMoore你是否好奇大型语言模型(LLMs)在面对未知新知识时会有怎样的表现呢?或者你想知道我们如何让这些大模型了解新知...
用50多年时间,探索最令人困惑的复杂性理论知识极限
选自quantamagazine机器之心编译编辑:Panda证明问题难以解决究竟有多难?元复杂性(meta-complexity)理论研究者数十年来一直探究这个问题。近期的一系列研...
多模态LLM幻觉问题降低30%!业内首个“啄木鸟”免重训方法诞生|中科大
丰色 发自 凹非寺量子位 | 公众号 QbitAI还在用指令微调解决多模态大模型的“幻觉”问题吗?比如下图中模型将橙色柯基错认为“红狗”,还指出周围还有几条。现在...
ICCV 2023丨迈向真实世界的多帧超分
本文介绍的是我们在ICCV2023的工作 Towards Real-world Burst Image Super-Resolution: Benchmark and Method 。arxiv链接:https://arxiv.org/abs/2309.0480...
别再吹 GPT-4V 了!连北京烤鸭都不认识,你敢信??
夕小瑶科技说 原创作者 | 智商掉了一地、ZenMooreGPT-4 被吹的神乎其神,作为具备视觉能力的 GPT-4 版本——GPT-4V,也被大众寄于了厚望。但如果告诉你,GPT-4V...
北大数学课,启用AI助教
衡宇 发自 凹非寺量子位 | 公众号 QbitAI这门北大数学课,学生和老师竟然都在用AI“摸鱼”?!不仅如此,老师还是主动推荐你用,“方便跟上授课进度”。原来,这...
代码生成:基于 AI 大模型的挑战与前景
作者 | Ben Linders 译者 | 马可薇 策划 | 丁晓昀 使用 AI 通用模型来完成代码生成这类非常具体的任务可能会带来问题。人工智能生成的代码就像是陌生人的代码...
陈怡然力荐《关于我博士毕业的这件小事》,Waymo研究员2年半心路分享火了
编者按:搞科研、读博士,这从来都不是一条轻松的路。今年9月,UCLA博士生叶小飞终于通过答辩,正式成为自动驾驶领域的一位“刀客特”。两年半读博期间,叶小飞...
中国科协发布2023重大科学问题、工程技术难题和产业技术问题
来源:科技导报今日科协10月22日,在第二十五届中国科协年会主论坛上,中国科协隆重发布2023重大科学问题、工程技术难题和产业技术问题。人工智能、新能源、...