标签:任务

ChatGPT发布一了,开源大模型都迎头赶上了吗?

机器之心专栏作者:陈海林,焦方锴,李星漩,秦成伟,赵若辰论文旨在成为研究界和商业领域的重要资源,帮助他们了解开源大模型的当前格局和未来潜力。一年前...
阅读原文

DeepMind最新研究:这个AI Agent,几分钟学会人类专家行为,登上Nature子刊

只需要几分钟,就可以成功模仿专家行为,并记住所有学过的知识,Google DeepMind 研发的 AI Agent,登上了 Nature 子刊。据介绍,在 3D 模拟中,该智能体能够...
阅读原文

大语言模型成为了「调包侠」?耶鲁提出代码生成新基准:ML-Bench

夕小瑶科技说 原创作者| 夕小瑶编辑部更实际,更有用的代码生成评测方案来了!ML-Bench提出了新的代码生成Benchmark,其目标在于评测大模型如何利用开源仓库...
阅读原文

从 CoT 到 Agent,最全综述来了!上交出品

夕小瑶科技说 原创作者 | 小戏、Python就在前两天,我们刚刚和大家聊了聊最近相当火爆的 AI Agents 这一概念:。水平所限,我们也只是浅浅为大家梳理了一下 A...
阅读原文

「GPT-4只是在压缩数据」,马毅团队造出白盒Transformer,可解释的大模型要来了吗?

机器之心报道编辑:PandaAGI 到底离我们还有多远?在 ChatGPT 引发的新一轮 AI 爆发之后,一部分研究者指出,大语言模型具备通过观察进行因果归纳的能力,但...
阅读原文

比「让我们一步一步思考」这句咒语还管用,提示工程正在被改进

机器之心报道编辑:rome rome大语言模型可以通过元提示执行自动提示工程,但由于缺乏足够的指导以引导大语言模型中的复杂推理能力,它们的潜力可能没有完全发...
阅读原文

LeCun引战,LLM根本不会推理!大模型「涌现」,终究离不开上下文学习

新智元报道编辑:润拉燕【新智元导读】前段时间,LeCun转发了2篇长文,集中讨论了LLM的规划推理能力和涌现能力的来源。作者认为,LLM本身不具有规划推理能力...
阅读原文

Inflection AI推出Infection-2,性能仅次于GPT4

点击上方蓝字关注我们“ Inflection AI最新推出的AI模型Infection-2在多模态语言理解任务中表现出色,超越了业界巨头的竞争对手,仅次于OpenAI的GPT-4。该模型...
阅读原文

大模型扫盲系列——初识大模型

大数据文摘受权转载自数据派THU作者:金一鸣编辑:黄继彦近年来,随着计算机技术和大数据的快速发展,深度学习在各个领域取得了显著的成果。为了提高模型的性...
阅读原文

教AI Agents学会协作&竞争!首个大模型多智能体框架CAMEL已斩获3.6k星|NeurIPS 2023

新智元报道编辑:LRS【新智元导读】AI Agents是当下大模型领域备受关注的话题,用户可以引入多个扮演不同角色的LLM Agents参与到实际的任务中,Agents之间会...
阅读原文

涵盖500多项研究、50多个模型,代码大模型综述来了

机器之心报道编辑:Panda W本文带你全面洞悉用LLM写代码的各式方法。随着 BERT 和 GPT 等预训练 Transformer 的出现,语言建模近些年来取得了显著进步。随着...
阅读原文

微软发布小型语言模型Orca 2,性能超对手

点击上方蓝字关注我们“ Microsoft发布了Orca 2,小型语言模型在复杂推理任务中表现出色,超越了大型模型。这为资源有限的企业提供了更好的选择。同时,其他公...
阅读原文

GPT-4分不清“很快”是多快,“万金油”CoT也拯救不了

夕小瑶科技说 原创作者 | 谢年年、pythonGPT4也有短板?来自爱丁堡大学的研究人员发现GPT4似乎不擅长处理有关时间推理的任务。比如“洗个冷水澡可以很快地让你...
阅读原文

真正实现一步文生图,谷歌UFOGen极速采样,生成高质量图像

机器之心专栏机器之心编辑部最近一年来,以 Stable Diffusion 为代表的一系列文生图扩散模型彻底改变了视觉创作领域。数不清的用户通过扩散模型产生的图片提...
阅读原文

Meta生成式AI连放大招:视频生成超越Gen-2,动图表情包随心定制

机器之心报道编辑:张倩、陈萍生成式 AI 进入视频时代了。提到视频生成,很多人首先想到的可能是 Gen-2、Pika Labs。但刚刚,Meta 宣布,他们的视频生成效果...
阅读原文
1373839404148