标签:策略
OpenAI官方的Prompt工程指南:你可以这么玩ChatGPT
机器之心报道 编辑:陈萍、小舟写好 prompt 已经成为 LLM 的一项必修课。随着 ChatGPT、GPT-4 等大型语言模型(LLM)的出现,提示工程(Prompt Engineering...
陶哲轩青睐的证明助手Lean,用上了大模型
机器之心报道编辑:陈萍现在,数学辅助证明工具都用上了大模型。「我预计,如果使用得当,到 2026 年,AI 将成为数学研究和许多其他领域值得信赖的合著者。」...
吞吐量提升近30倍!田渊栋团队最新论文解决大模型部署难题
新智元报道编辑:alan【新智元导读】大语言模型在实际部署中,存在内存和输入长度限制的问题。最近,田渊栋团队一举解决这两大难题,将推理系统的吞吐量提高...
微软教小模型推理进阶版:Orca 2性能媲美10倍参数模型,已开源
机器之心报道机器之心编辑部站在巨人的肩膀上会让你看的更远,而通过让大规模语言模型来「教」较小规模的语言模型进行推理,也会是事半功倍的效果。如你我所...
OpenAI神秘Q*毁灭人类?爆火「Q*假说」竟牵出世界模型,全网AI大佬长文热议
新智元报道编辑:Aeneas 好困【新智元导读】传闻中OpenAI的Q*,已经引得AI大佬轮番下场。AI2研究科学家Nathan Lambert和英伟达高级科学家Jim Fan都激动的写下...
斯坦福提出对比偏好学习:无需强化学习即可从人类反馈中学习
机器之心报道编辑:Panda W我们知道,ChatGPT 的成功离不开 RLHF 这个「秘密武器」。不过 RLHF 并不是完美无缺的,存在难以处理的优化难题。本文中,斯坦福大...
7B羊驼战胜540B“谷歌版GPT”,MIT用博弈论大模型,无需训练就能完成
克雷西 发自 凹非寺量子位 | 公众号 QbitAI基于博弈论,MIT提出了一种新的大模型优化策略。在其加持之下,7B参数的Llama在多个数据集上超越了540B的“谷歌版GP...
一文读懂ChatGPT中的强化学习
大数据文摘授权转载自数据派THU作者:陈之炎编辑:黄继彦校对:龚力ChatGPT基于OpenAI的GPT-3.5创造,是InstructGPT的衍生产品,它引入了一种新的方法,将人...
语言、机器人破壁,MIT等用GPT-4自动生成模拟任务,并迁移到真实世界
机器之心报道编辑:杜伟、小舟GPT-4 与机器人又擦出了新的火花。在机器人领域,实现通用机器人策略需要大量数据,而在真实世界收集这些数据又耗时费力。尽管...
最新AI热点论文(10/9-10/15)
图|匡萃彪文|匡萃彪最新人工智能论文(10/9-10/15):- 环形注意力- 通用模拟器- LLMs中事实性的概述- LLMs 能学规则- LLM的元思维链提示- 医疗保健LLM调查...
谷歌、AMD、英特尔加入挑战,英伟达AI解决方案还能继续“遥遥领先”吗?
夕小瑶科技说 原创编译 | 谢年年要问世界范围内人工智能解决方案谁最“遥遥领先”?那肯定是英伟达!然鹅这一情况很有可能会发生变动。谷歌正在构建自己的人工...
东大华人博士让GPT-4用「心智理论」玩德扑!完胜传统算法,碾压人类新手
新智元报道编辑:Lumina【新智元导读】来自东京大学的Suspicion Agent利用GPT-4,在不完全信息博弈中表现出了高阶的心智理论能力(ToM)。在完全信息博弈中,...
开放模型权重被指将导致AI失控,Meta遭举牌,LeCun:开源AI社区如火如荼
机器之心编译编辑:杜伟、小舟AI 尤其是大模型时代的开源与闭源,有利有弊,重要的是如何在使用的过程中做好文章。一直以来,人们在 AI 领域的开源与闭源选择...
如何降低视觉Transformer计算成本?时间冗余方法让人大吃一惊
机器之心编译编辑:Panda W在为语言领域带来变革之后,Transformer 正在进军视觉领域,但其也有着高计算成本的问题。近日,威斯康星大学麦迪逊分校一个研究团...
智源:70万预算从头开发千亿参数大模型,挑战成功
克雷西 发自 凹非寺量子位 | 公众号 QbitAI预算10万美元(约73万人民币),从头训练一个全新的千亿参数大模型。智源研究院与国内多所高校及南洋理工联合团队...