标签:问题
GPT-4作弊被抓!吉娃娃or松饼打乱顺序就出错,LeCun:警惕在训练集上测试
梦晨 发自 凹非寺量子位 | 公众号 QbitAIGPT-4解决网络名梗“吉娃娃or蓝莓松饼”,一度惊艳无数人。然鹅,现在它被指出“作弊”了!全用原题中出现的图,只是打乱...
GPT-4V数学推理如何?微软发布MathVista基准,评测报告长达112页
机器之心专栏机器之心编辑部大型多模态模型会做数学题吗?在微软最新发布的 MathVista 基准上,即使是当前最强的GPT-4V 也会有「挫败感」。微软最近发布了名...
马斯克怒了,发帖挑衅ChatGPT,竟是奥特曼创建Grok同名的GPT?
夕小瑶科技说 原创作者 | 王二狗大家好,我是二狗。今天起猛了,早上刷推特,你们猜我看到了什么?诶你🐎,真是亮瞎了我的24k钛合金狗眼!马斯克你是真狗啊!...
GPT-4比你更会问问题:让大模型自主复述,打破与人类对话的壁垒
机器之心专栏机器之心编辑部在最新的人工智能领域动态中,人工生成的提示(prompt)质量对大语言模型(LLM)的响应精度有着决定性影响。OpenAI 提出的建议指...
爆火大模型解谜游戏作者自述:公开不到一天用户破万,用游戏探索模型的秘密
过去一周,一款大模型解谜小游戏在大模型从业者圈子里广泛传播。《完蛋!我被 LLM 包围了》游戏公开不到 24 小时,用户指数级增长突破一万,作者随即关停了游...
“我不懂的、总有人懂”,软件开发行业已经开始扭曲变形
作者|unixsheikh译者|核子可乐策划|冬梅如今,一批所谓的专家只知道无脑上马那些炒作工具,但对其更深层次的运作方式却一无所知。这是个大问题,甚至正在...
清华大学刘知远:大模型LLM领域,有哪些可以作为学术研究方向?
来源:图灵人工智能作者:刘知远,清华大学计算机系自然语言处理实验室副教授2022年初我做过一个报告题目是《大模型十问》,分享我们认为大模型值得探索的十...
开发者「第二大脑」来袭,GitHub Copilot更新,人类开发参与进一步减少
机器之心报道机器之心编辑部Copilot 帮助开发者完成更大、更复杂的任务。是什么让 Andrej Karpathy 感慨,人类在软件开发过程中直接编写代码的贡献将越来越小...
姚班天才开发《完蛋!LLM》爆火,一日用户过万,挤爆服务器,被迫停服
夕小瑶科技说 分享来源 | 量子位什么样的“大模型原生”游戏,让各大算法竞赛群里都在玩,还把服务器挤爆了?这款突然爆火的《完蛋!LLM》,让你在解谜挑战之中...
姚班天才开发《完蛋!我被大模型包围了》游戏爆火,一日用户过万挤爆服务器
梦晨 克雷西 发自 凹非寺量子位 | 公众号 QbitAI什么样的“大模型原生”游戏,让各大算法竞赛群里都在玩,还把服务器挤爆了?这款突然爆火的《完蛋!LLM》,让...
Sam Altman放豪言:OpenAI训GPT-5不差钱,人类已接近AGI阈值
新智元报道编辑:Lumina【新智元导读】前段时间,OpenAI CEO Sam Altman和CTO Mira Murati在WSJ的专访里,探讨了AGI、未来GPT的发展、以及AI对人类的影响。「...
再见了,提示~ 谷歌发布自适应提示方法,从此告别提示工程!
夕小瑶科技说 原创作者 | 谢年年、ZenMoore大模型虽好,但却存在着一个恼人的问题:大模型回答得好不好,取决于我们问题问得怎么样。一个好的、详细的问题往...
ILYA:塑造世界的人工智能科学家
点击上方蓝字关注我们“ 人工智能有巨大潜力,解决问题如就业、疾病、贫困,但也带来假新闻、网络攻击、智能武器风险。AGI可能改变一切,需确保目标与人类一致...
对话声网 RTE 创新大赛三强:新一代全球化创业者在思考什么?
声网超音速的第三届 RTE 创新大赛,作为生态伙伴之一,Founder Park 参加了 10 月 24 日的全球总决赛。超音速计划国内年度八强和海外地区 Startup Battlefiel...
何恺明做科研也emo!最新QA完整版在此
西风 发自 凹非寺量子位 | 公众号 QbitAIAI大牛何恺明的一句话火了,他说:科研中95%的时间是令人沮丧的。什么???就连何恺明都觉得科研很煎熬?没错,此话...