标签:阶段

GPU推理提速4倍,256K上下文全球最长:无问芯穹刷新大模型优化记录

机器之心报道机器之心编辑部想用大模型赚钱?这个实力强劲的新面孔决定先把推理成本打下来。大模型业务到底多烧钱?前段时间,华尔街日报的一则报道给出了参...
阅读原文

让大模型真正学会1+1=2!谷歌教会模型自动学习推理规则,大模型的幻觉有救了

夕小瑶科技说 原创作者 | 谢年年在初学算术加法或乘法时,我们通过数小棍的方式逐步从1+1=2,1+2=3等例子中得出1+3=4,这是一种依赖记忆中的数学表格进行演绎...
阅读原文

DeepMind让大模型学会归纳和演绎,GPT-4准确率提升13.7%

机器之心报道机器之心编辑部当前,大型语言模型(LLM)在推理任务上表现出令人惊艳的能力,特别是在给出一些样例和中间步骤时。然而,prompt 方法往往依赖于 ...
阅读原文

用暂停token重新训练大模型,AI学会三思而后行

梦晨 发自 凹非寺量子位 | 公众号 QbitAI让ChatGPT给出答案之前多想想步骤,就能提高准确率。那么能不能省去提示词,直接把这种能力内化在大模型里呢?CMU与...
阅读原文

ChatGPT/GPT-4/Llama电车难题大PK!大模型具备道德感吗?

夕小瑶科技说 分享来源 | 新智元作者 | Lumina「模型有道德推理能力吗?」这个问题似乎应该跟模型生成的内容政策挂钩,毕竟我们常见的是「防止模型生成不道德...
阅读原文

ChatGPT/GPT-4/Llama电车难题大PK!小模型道德感反而更高?

新智元报道编辑:Lumina【新智元导读】微软对大语言模型的道德推理能力进行了测试,但在电车问题中大尺寸的模型表现反而比小模型差。但最强大语言模型GPT-4的...
阅读原文

野心勃勃的MiniGPT-5出现了!Token变Voken,支持图文交叉生成

夕小瑶科技说 分享来源 | 机器之心大模型正在实现语言和视觉的跨越,有望无缝地理解和生成文本和图像内容。在最近的一系列研究中,多模态特征集成不仅是一种...
阅读原文

统一图像和文字生成的MiniGPT-5来了:Token变Voken,模型不仅能续写,还会自动配图了

机器之心报道机器之心编辑部OpenAI 的 GPT-5 大模型似乎还遥遥无期,但已经有研究者率先推出了创新视觉与语言交叉生成的模型 MiniGPT-5。这对于生成具有连贯...
阅读原文

国内大模型数据之困有解了!头部标注厂商打造,专为垂直行业落地

白交 发自 凹非寺量子位 | 公众号 QbitAI大模型落地垂直行业,数据已打响第一枪。现在,专门面向垂直大模型的数据解决方案来了——直接帮助通用大模型产业落地...
阅读原文

开源 ML 社区的新星,Kubeflow 正式成为 CNCF 项目

作者 | Claudio Masolo 译者 | 刘雅梦 策划 | 丁晓昀 云原生计算基金会(CNCF)最近宣布,在技术监督委员会(TOC)投票后,已接受 Kubeflow,用于在 Kubernet...
阅读原文
123