标签:准确度

两个小模型互相验证,直接比肩大模型?微软的rStar甚至没用CoT和微调

机器之心报道 编辑:Panda互相检查,让小模型也能解决大问题。 众所周知,LLM 很强大,但执行复杂推理的能力还不够强。 举个例子,在 GSM8K 数据集上,Mistra...
阅读原文

苹果让大模型学会偷懒:更快吐出第一个token,准确度还保住了

机器之心报道 机器之心编辑部偷懒才能更好地工作。Llama 3.1 刚刚发布,你是否已经尝试了呢?就算你的个人计算机是最近的顶尖配置,运行其中最小的 8B 版本可...
阅读原文

开发者万字复盘:AI 搜索 ThinkAny 三个月 17 万用户的踩坑与心得

文章来自独立开发者「艾逗笔」,他是个人知识助手产品「知了 zKnown」的开发者。 文章完整复盘了他开发和上线一款 AI 搜索产品 ThinkAny 的完整经历,以及对 ...
阅读原文

用神经架构搜索给LLM瘦身,模型变小,准确度有时反而更高

机器之心报道 编辑:Panda用神经架构搜索给 LLM 瘦身,同等准确度可让 LLaMA2-7B 模型大小降 2 倍。大型语言模型(LLM)的一个主要特点是「大」,也因此其训...
阅读原文

像调鸡尾酒一样调制多技能大模型,智源等机构发布LM-Cocktail模型治理策略

机器之心专栏机器之心编辑部随着大模型技术的发展与落地,「模型治理」已经成为了目前受到重点关注的命题。只不过,在实践中,研究者往往感受到多重挑战。一...
阅读原文

长文本信息准确率超过ChatGPT,Meta提出降低大模型幻觉新方法

克雷西 发自 凹非寺量子位 | 公众号 QbitAI大模型的幻觉问题,又有新的解决方法了!Meta AI实验室提出了一种“分而治之”的解决方案。有了这个方案,Llama-65B...
阅读原文

动物与人类存在的「关键学习期」,联邦学习也有

机器之心分析师网络作者:Jiying编辑:H4O这篇文章中探讨了联邦学习中的关键学习期(CLP)问题。0 引言关于关键学习期问题,我们之前撰写过这样一篇文章。生...
阅读原文