标签:问题
开发者「第二大脑」来袭,GitHub Copilot更新,人类开发参与进一步减少
机器之心报道机器之心编辑部Copilot 帮助开发者完成更大、更复杂的任务。是什么让 Andrej Karpathy 感慨,人类在软件开发过程中直接编写代码的贡献将越来越小...
姚班天才开发《完蛋!LLM》爆火,一日用户过万,挤爆服务器,被迫停服
夕小瑶科技说 分享来源 | 量子位什么样的“大模型原生”游戏,让各大算法竞赛群里都在玩,还把服务器挤爆了?这款突然爆火的《完蛋!LLM》,让你在解谜挑战之中...
姚班天才开发《完蛋!我被大模型包围了》游戏爆火,一日用户过万挤爆服务器
梦晨 克雷西 发自 凹非寺量子位 | 公众号 QbitAI什么样的“大模型原生”游戏,让各大算法竞赛群里都在玩,还把服务器挤爆了?这款突然爆火的《完蛋!LLM》,让...
Sam Altman放豪言:OpenAI训GPT-5不差钱,人类已接近AGI阈值
新智元报道编辑:Lumina【新智元导读】前段时间,OpenAI CEO Sam Altman和CTO Mira Murati在WSJ的专访里,探讨了AGI、未来GPT的发展、以及AI对人类的影响。「...
再见了,提示~ 谷歌发布自适应提示方法,从此告别提示工程!
夕小瑶科技说 原创作者 | 谢年年、ZenMoore大模型虽好,但却存在着一个恼人的问题:大模型回答得好不好,取决于我们问题问得怎么样。一个好的、详细的问题往...
ILYA:塑造世界的人工智能科学家
点击上方蓝字关注我们“ 人工智能有巨大潜力,解决问题如就业、疾病、贫困,但也带来假新闻、网络攻击、智能武器风险。AGI可能改变一切,需确保目标与人类一致...
对话声网 RTE 创新大赛三强:新一代全球化创业者在思考什么?
声网超音速的第三届 RTE 创新大赛,作为生态伙伴之一,Founder Park 参加了 10 月 24 日的全球总决赛。超音速计划国内年度八强和海外地区 Startup Battlefiel...
何恺明做科研也emo!最新QA完整版在此
西风 发自 凹非寺量子位 | 公众号 QbitAIAI大牛何恺明的一句话火了,他说:科研中95%的时间是令人沮丧的。什么???就连何恺明都觉得科研很煎熬?没错,此话...
解决多模态大模型幻觉问题的秘密武器:“啄木鸟”免重训方法!哪里出问题啄哪里!
夕小瑶科技说 原创作者 | 付奶茶、王二狗最近多模态大模型的研究取得了巨大的进展。然而,这些模型在生成时存在着文本与图像不一致的问题,这个问题就是一直...
吴恩达加入图灵三巨头混战,炮轰Sam Altman:AI监管「不会管不如不管」,LeCun转赞
新智元报道编辑:润 alan【新智元导读】针对「AI末日论」引发的大佬们关于AI监管的口水战,吴恩达下场力挺LeCun:「不合格的监管不如不要监管」!Hinton,Ben...
GPT-4V连小学生都不如?最新基准测试错误率竟高达90%:红绿灯认错、勾股定理也不会
新智元报道编辑:LRS 好困【新智元导读】马里兰大学发布首个专为VLM设计的基准测试HallusionBench,全面测试GPT-4V视觉错误和语言幻觉。GPT-4被吹的神乎其神...
MetaAI提出全新验证链框架,大模型通过“三省吾身”缓解幻觉现象
大数据文摘授权转载自将门创投作者:seven_曾子曰:“吾日三省吾身”–出自《论语·学而》时至今日,生成幻觉(hallucination)仍然是大模型研究界中一个令人非常...
多模态大模型幻觉降低30%!中科大等提出首个幻觉修正架构「Woodpecker」啄木鸟
新智元报道编辑:好困【新智元导读】最近,来自中科大等机构的研究人员提出了首个多模态修正架构「啄木鸟」,可有效解决MLLM输出幻觉的问题。视觉幻觉是常见...
国外Java工程师力证:GPT-4不能解决逻辑谜题,但确实具备推理能力
新智元报道编辑:Lumina【新智元导读】IMG Arena的高级软件工程师 Johan LAJILI认为在LLM能够理解概念、通过图灵测试时,我们就该承认它具有推理能力了。GPT-...
北京大学王选所推出 ALCUNA ,大模型新知识理解能力评测再添一榜!
夕小瑶科技说 原创作者 | 付奶茶、ZenMoore你是否好奇大型语言模型(LLMs)在面对未知新知识时会有怎样的表现呢?或者你想知道我们如何让这些大模型了解新知...