标签:问题

今日Arxiv最热NLP大模型论文:复旦大学最新研究,如何让大模型说出“我不知道”?

夕小瑶科技说 原创作者 | 松果引言:AI助手的真实性挑战在人工智能(AI)的发展进程中,基于大型语言模型(LLMs)的AI助手已经在多个任务中展现出惊人的性能...
阅读原文

Linus新年首骂:和谷歌大佬大吵4天,“你的代码就是垃圾”

金磊 发自 凹非寺量子位 | 公众号 QbitAI风风火火的Linux之父,Linus Torvalds,他又跃入公众的视线。 “打开方式”依旧是熟悉的配方——骂人。 我们先来看下Linu...
阅读原文

Perplexity 交互剖析:如何基于尼尔森设计原则,开发让用户满意的 AI-Native 产品?

LUI 还是 GUI,AI 时代的产品交互应该遵循怎样的产品交互原则,在 2023 年被讨论过很多次,似乎大家得到的共识是,需要 LUI,但 GUI 也是不可少的。 而作为 A...
阅读原文

OpenAI出手后,GPT-4真的不懒了?网友不买账:只靠打补丁恐怕无济于事!

整理 | 凌敏、核子可乐 大模型会从人类经验中学习,如果人类本身越来越懒,那模仿人类的程序是不是也会越来越懒? OpenAI 发布更新, 解决 GPT-4“变懒”问题 ...
阅读原文

更适合中文LMM体质的基准CMMMU来了:超过30个细分学科,12K专家级题目

机器之心专栏 机器之心编辑部近期,随着多模态大模型(LMM) 的能力不断进步,评估 LMM 性能的需求也日益增长。与此同时,在中文环境下评估 LMM 的高级知识和...
阅读原文

「think step by step」还不够,让模型「think more steps」更有用

机器之心报道 机器之心编辑部本文对思维链的推理步长进行了控制变量实验,发现推理步长和答案的准确性是线性相关的,这种影响机制甚至超越了问题本身所产生的...
阅读原文

“哄女友挑战”上线即爆火,两天烧掉10亿token,AI已通关

梦晨 克雷西 发自 凹非寺量子位 | 公众号 QbitAI女朋友生气了哄不好怎么办? 这款哄哄模拟器,由AI扮演生气的男/女朋友,限定对话次数训练,帮助你提高获得原...
阅读原文

小模型增强可超GPT-4?北航 && 人大 | 提出大模型ICL增强范式,模型越小收益越高!

引言:上下文学习(In-context Learning,ICL)技术是提高模型在自然语言处理任务上表现的高效提示技术,因而众多研究在这个方向上提出各种方法,但大多数都...
阅读原文

AlphaGeometry:DeepMind 大算力再造奇迹,但「算力代替智力」或许并非最优解

作者:李宝珠 编辑:三羊 封面图来源:Google DeepMind DeepMind 用算力堆出奇迹?被夸上天的 AlphaGeometry 含金量有多高近日,谷歌 DeepMind 的 Alpha 系列...
阅读原文

如何1秒内快速总结100多页文档?QQ 浏览器首次揭秘大模型实现技术细节

嘉宾|郭伟东 编辑|李忠良 随着人工智能技术的飞速发展,大型语言模型已成为行业热点,引领着一系列技术创新。在长文档阅读场景下,利用大模型提升阅读效率也...
阅读原文

【数学与物理学】数学家利用量子场论的数学新发现

来源:陈方的发现数学之旅 图的模空间是数学中一个迷人的主题,与各种领域有联系,包括拓扑、代数几何和数学物理。特别是它与代数曲线理论密切相关,代数曲线...
阅读原文

数学界AlphaGo来了!攻破奥数难题登Nature,接近人类金牌水平

谷歌连发两大AI数学模型,奥数金牌得主亲自点赞。 作者|李水青 编辑|心缘 智东西1月18日报道,1月17日,谷歌研发的AI数学模型AlphaGeometry登上国际顶刊Natur...
阅读原文

奥数逼近金牌水平!谷歌最新AlphaGeometry模型登上Nature!菲尔兹奖得主点赞

夕小瑶科技说 原创作者 | 王二狗大家好,我是二狗。 谷歌DeepMind 最新AI研究突破登上了《Nature》! 这篇《Solving olympiad geometry without human demons...
阅读原文

DeepMind人工智能突破迈向AGI关键一步,解题能力接近奥数巅峰

点击上方蓝字关注我们“Google DeepMind的AlphaGeometry系统在解决几何问题方面几乎赶上了世界最聪明学生的水平。其成功回答了国际数学奥林匹克竞赛高中组的25...
阅读原文

数学推理与AI:机器学习系统能在多大程度上理解数学?

导语2023年12月的 NeurIPS 会议上举办了许多主题研讨会,其中 MATH AI 研讨会为第三届,主题为“数学推理与AI”。数学推理是人类认知的基本方面,涉及分析复杂...
阅读原文
1222324252636