标签:问题
a16z创始人对谈AI创业:AI提供的是服务不是产品;硬件创业更难,但更容易建立优势
a16z 的两位创始人马克·安德森(Marc Andreessen)和本·霍洛维茨(Ben Horowitz)最近在 Youtube 上更新了不少对谈播客,尤其是以 5 月份的两期比较重磅。 第...
A16z 万字对谈:AI 在医疗健康领域落地的挑战与机会是什么?
「娱乐应用 kill time,效率工具 save time,而医疗能延长时间。」 在 AGI Playground 2024 上,百川智能创始人 & CEO 王小川是这么说的。 在他看来,如...
创业者复盘:出海“本地化”过程中,我犯了哪些错?
本文作者杨杰是一位产品经理出身的创业者,所在团队从2019 年开始做国内 SAAS 业务,2022年观察到国内业务出现瓶颈,开始寻求第二增长曲线。 2022年4月,产品...
大模型“自学”后能力反下降,Llama/Mistral都没逃过
PengFei Liu 投稿量子位 | 公众号 QbitAIAI经过多轮“自我提升”,能力不增反降? 上海交通大学GAIR团队最新研究表明,在常识理解、数学推理和代码生成等复杂任...
RAG 技术真的“烂大街”了吗?
嘉宾|郭瑞杰、欧明栋 、张颖峰 、常扬 作者|Kitty 审校 | 蔡芳芳 大语言模型技术迅猛发展的脚步,正引领着信息检索技术进入一个新的纪元。在这一领域中, ...
OpenAI凌晨发布新研究成果!证明者和验证者无限套娃,大模型黑盒变可解释又近一大步!
夕小瑶科技说 原创作者 | 付奶茶 昨天凌晨,OpenAI发布了一项名为Prover-Verifier-Games(证明者-验证者博弈)的新研究! 这项研究的目的是确保语言模型生成...
ACL 2024 | 对25个开闭源模型数学评测,GPT-3.5-Turbo才勉强及格
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
「13.11>13.8」冲上热搜,一道题让人类AI集体降智?所有LLM致命缺点曝光
新智元报道编辑:Aeneas 好困 【新智元导读】13.8和13.11哪个大?这个问题不光难倒了部分人类,还让一票大模型折戟。AI如今都能做AI奥数题了,但简单的常识问...
Mistral AI两连发:7B数学推理专用、Mamba2架构代码大模型
机器之心报道 机器之心编辑部网友很好奇,Mathstral能不能搞定「9.11和9.9谁大」这一问题。昨天,AI圈竟然被「9.11和9.9谁大」这样简单的问题攻陷了,包括Ope...
13.11 和 13.8 哪个大,不只是人类,为什么连大模型也翻车了?
以下文章转载自公众号「量子位」,Founder Park 略有增删。7月12日晚,《歌手 2024》第十期竞演排名公布,每位选手的名字后是得票率,有观众在社交媒体评论区...
大模型集体失智!9.11和9.9哪个大,几乎全翻车了
梦晨 一水 发自 凹非寺量子位 | 公众号 QbitAI没眼看……“9.11和9.9哪个大”这样简单的问题,居然把主流大模型都难倒了?? 强如GPT-4o,都坚定地认为9.11更大。...
OpenAI华人女科学家万字详解大模型「外在幻觉」
夕小瑶科技说 分享来源 | 量子位 大模型幻觉还分内在、外在了—— OpenAI华人科学家翁荔最新Blog,提出LLM外在幻觉(extrinsic hallucination)。 有别于代指模...
科普之旅 :大语言模型的思维链
大数据文摘受权转载数据派THU 作者:胡赟豪 在这个信息爆炸的时代,你是否曾幻想过与机器流畅交谈,或是让AI助你笔下生花,创作出惊艳的文章?这一切,都...
登顶开源AI软件工程师榜首,UIUC无Agent方案轻松解决SWE-bench真实编程问题
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阿里妈妈给出了什么样的赛题,被顶会NeurIPS 2024 pick了?
机器之心原创 作者:张倩会「出价」也是个很实用的技能。在众多人工智能顶会中,NeurIPS 属于什么段位?有人将其代入《甄嬛传》宇宙做了张图:大概配享「后位...