标签:答案

8B模型奥数成绩比肩GPT-4!上海AI Lab出品

克雷西 发自 凹非寺量子位 | 公众号 QbitAI只要1/200的参数,就能让大模型拥有和GPT-4一样的数学能力? 来自复旦和上海AI实验室的研究团队,刚刚研发出了具有...
阅读原文

大模型+蒙特卡洛树搜索,一招让LLaMa-3 8B奥数水平直逼GPT-4

机器之心报道 编辑:陈萍、杜伟通过算法层面的创新,未来大语言模型做数学题的水平会不断地提高。这几天,17 岁中专生姜萍在 2024 阿里巴巴全球数学竞赛预选...
阅读原文

AI 问前程:这样的分数高考志愿应该报哪所大学

选择困难症:尽力就行了,难道不选清华是因为自己不想?高考志愿填报,是每个学生人生中的第一次重大选择,也是一场令人倍感焦虑的“选择困难症”考验。面对众...
阅读原文

两句话,让LLM逻辑推理瞬间崩溃!最新「爱丽丝梦游仙境」曝出GPT、Claude等重大缺陷

新智元报道编辑:乔杨 好困 【新智元导读】在基准测试上频频屠榜的大模型们,竟然被一道简单的逻辑推理题打得全军覆没?最近,研究机构LAION的几位作者共同发...
阅读原文

长文 | 大模型偏好对齐全家桶 – RL侧

今天给大家带来一篇Reinforcement Learning from Human Feedback的全家桶,来自知乎@何枝(已授权)。 随着 Llama3 的开源,人们对 Alignment 的重视程度又上...
阅读原文

清北爸爸辅导数学崩溃瞬间,这个国产大模型有解!AI启发问答关键情绪稳定

新智元报道编辑:编辑部 【新智元导读】辅导孩子写作业这件事,竟难倒了一众清北爸爸、海淀妈妈。不过,最近爆火的这个国产大模型,让无数家长疯狂冲进视频留...
阅读原文

今日arXiv最热大模型论文:COLING 2024: 复旦发布AoR,层级聚合推理突破大模型复杂推理上限

夕小瑶科技说 原创作者 | Axe_越“三个臭皮匠,顶个诸葛亮?” “一个模型不行,那就再堆一个?” 过去当我们在处理复杂任务的时候,往往会考虑集成策略(Ensembl...
阅读原文

70亿LLaMA媲美5400亿PaLM!MIT惊人研究用「博弈论」改进大模型|ICLR 2024

新智元报道编辑:桃子 【新智元导读】大模型回答如何更可靠?MIT研究团队设计出「共识博弈」,将数学家常用的博弈论引入LLM改进中。没想到,LLaMA-7B的表现,...
阅读原文

微信一个逆天功能已悄悄上线!99%的人还不知道…

点击上方蓝字关注我们“微信读书新推出的“AI问书”功能,允许用户在阅读时直接查询疑惑内容,答案来自微信读书内书籍,可即时跳转阅读。该功能极大提升了阅读效...
阅读原文

「专业智能体指导」让小模型学会数学推理!微调Mistral-7B实现86.81%准确率

新智元报道编辑:LRS 【新智元导读】小模型也能解锁数学能力,无需多模型集成,7B模型在GSM 8 k数据集上性能超越70B!对于小型语言模型(SLM)来说,数学应用...
阅读原文

西安交大发表鲁棒视觉问答综述,揭秘AI视觉问答的“超强大脑”丨IEEE TPAMI

2024年2月,西安交通大学智能网络与网络安全教育部重点实验室与陕西省大数据知识工程实验室(跨媒体知识融合与工程应用研究所)师生,在人工智能顶级期刊IEEE...
阅读原文

黄仁勋每天都用的 AI 产品,来自 Google,颠覆 Google

要成功 不意味着 要替代 Google因为 Google CEO Sundar Pichai 吃鸡蛋,Perplexity CEO Aravind Srinivas 才能吃鸡蛋。 来自于印度的 Srinivas 从小家庭就吃...
阅读原文

体验完黄仁勋最爱用的 AI 工具:Google 不香了,还能平替 ChatGPT

黄仁勋 都爱用的 AI 工具英伟达创始人黄仁勋最爱用的 AI 聊天机器人是什么?《连线》杂志的采访揭开了谜底——Perplexity。 比起 ChatGPT, Perplexity 的热度...
阅读原文

今日arXiv最热大模型论文:人民大学发布,拯救打工人!Office真实场景下的大模型表格处理

夕小瑶科技说 原创作者 | 松果 引言:探索表格数据处理的新视角在当今的数据驱动世界中,表格数据无处不在,它们以其独特的结构化形式,为各行各业提供了信息...
阅读原文

老黄再曝惊人语录:LLM幻觉有解,AGI五年内必来!

新智元报道编辑:编辑部 【新智元导读】AGI竞赛,正在大科技公司之间紧锣密鼓地展开,作为万亿显卡帝国掌舵人的老黄自然也不会缺席。在最近举办的GTC 2024上...
阅读原文