标签:任务

SuperBench大模型综合能力评测报告

在2023年的“百模大战”中,众多实践者推出了各类模型,这些模型有的是原创的,有的是针对开源模型进行微调的;有些是通用的,有些则是行业特定的。如何能合理...
阅读原文

无任务学习及在机器人任务和规划中的应用

大数据文摘授权转载自中国人工智能学会 作者:张宪琦,范晓鹏摘 要: 本文提出了无任务学习的方法,阐述了其与现有方法(包括自监督学习、迁移学习、模仿学习...
阅读原文

两万字实录:该怎么让机器人吃下大模型?

机器人真正融入开放式服务场景,还差哪一步?来源:AI科技评论 作者:吴彤 编辑:麦广炜 大模型技术横空出世,无疑让机器人技术再次成为研究和产业界的焦点。...
阅读原文

新架构掀翻Transformer!无限上下文处理,2万亿token碾压Llama 2

新智元报道编辑:桃子 好困 【新智元导读】Transformer王座即将被取而代之!Meta、USC、CMU和UCSD联合提出了革命性新架构Megalodon,能够处理无限上下文,在2...
阅读原文

用MoE横扫99个子任务!浙大等提出全新通用机器人策略GeRM

新智元报道编辑:LRS 【新智元导读】本文分享论文GeRM: A Generalist Robotic Model with Mixture-of-experts for Quadruped Robot,由西湖大学和浙江大学联...
阅读原文

两万字实录:该怎么让机器人吃下大模型?丨GAIR live

机器人真正融入开放式服务场景,还差哪一步?作者|吴彤 编辑|麦广炜 大模型技术横空出世,无疑让机器人技术再次成为研究和产业界的焦点。 这一技术的核心优...
阅读原文

世界首个AI程序员Devin视频竟造假?博主逐帧解析,Devin代码任务完成很糟糕

新智元报道编辑:桃子 【新智元导读】全球首个AI程序员Devin被爆视频造假?YouTube博主近日揭露了背后明星初创公司Cognition的谎言,通过逐帧分析发现,Devin...
阅读原文

「大模型+强化学习」最新综述!港中文深圳130余篇论文:详解四条主流技术路线

新智元报道编辑:LRS 【新智元导读】用大模型来辅助强化学习,可以提高模型在多任务学习、样本利用率、任务规划等复杂任务下的能力,该论文综述了LLM-enhance...
阅读原文

大模型做时序预测也很强!华人团队激活LLM新能力,超越一众传统模型实现SOTA

蔚明 投稿自 凹非寺量子位 | 公众号 QbitAI大语言模型潜力被激发—— 无需训练大语言模型就能实现高精度时序预测,超越一切传统时序模型。 来自蒙纳士大学、蚂...
阅读原文

超越GPT-4V,苹果多模态大模型上新!

新智元报道编辑:flynne 【新智元导读】苹果开发的多模态模型Ferret-UI增强了对屏幕的理解和交互,在引用、基础和推理方面表现出了卓越的性能,这些增强功能...
阅读原文

苹果发布多模态模型 Ferret-UI,部分手机 UI 任务超越 GPT-4V

手机厂商自研的端侧模型功能,会超越纯正的大模型团队吗?编译 | 赖文昕 编辑 | 陈彩娴 大模型的诞生,让科技巨头与创业公司们在新一轮的竞赛中再次鸣枪出发...
阅读原文

Scaling Laws又失灵了?谷歌新研究:扩散模型不是越大越好

大数据文摘授权转载自夕小瑶科技说作者:Zicy 近年来,模型规模呈现出愈来愈大的趋势,越来越多的人相信“力大砖飞”。 OpenAI 虽然没有公布Sora的训练细节,但...
阅读原文

多模态大模型有了统一分割框架,华科PSALM多任务登顶,模型代码全开源

机器之心专栏 机器之心编辑部最近,多模态大模型(LMM)取得了一系列引人注目的成就,特别是在视觉 - 语言任务上的表现令人瞩目。它们的成功不仅展现了多模态...
阅读原文

Scaling Laws 又失灵了?谷歌新研究:扩散模型不是越大越好

夕小瑶科技说 原创作者 | Zicy近年来,模型规模呈现出愈来愈大的趋势,越来越多的人相信“力大砖飞”。 OpenAI 虽然没有公布Sora的训练细节,但在Sora的技术报...
阅读原文

人民大学:揭示大语言模型事实召回的关键机制

夕小瑶科技说 原创来源 | 芒果 引言:大语言模型事实召回机制探索该论文深入研究了基于Transformer的语言模型在零射击和少射击场景下的事实记忆任务机制。模...
阅读原文
1222324252648