标签:任务
SuperBench大模型综合能力评测报告
在2023年的“百模大战”中,众多实践者推出了各类模型,这些模型有的是原创的,有的是针对开源模型进行微调的;有些是通用的,有些则是行业特定的。如何能合理...
无任务学习及在机器人任务和规划中的应用
大数据文摘授权转载自中国人工智能学会 作者:张宪琦,范晓鹏摘 要: 本文提出了无任务学习的方法,阐述了其与现有方法(包括自监督学习、迁移学习、模仿学习...
两万字实录:该怎么让机器人吃下大模型?
机器人真正融入开放式服务场景,还差哪一步?来源:AI科技评论 作者:吴彤 编辑:麦广炜 大模型技术横空出世,无疑让机器人技术再次成为研究和产业界的焦点。...
新架构掀翻Transformer!无限上下文处理,2万亿token碾压Llama 2
新智元报道编辑:桃子 好困 【新智元导读】Transformer王座即将被取而代之!Meta、USC、CMU和UCSD联合提出了革命性新架构Megalodon,能够处理无限上下文,在2...
用MoE横扫99个子任务!浙大等提出全新通用机器人策略GeRM
新智元报道编辑:LRS 【新智元导读】本文分享论文GeRM: A Generalist Robotic Model with Mixture-of-experts for Quadruped Robot,由西湖大学和浙江大学联...
两万字实录:该怎么让机器人吃下大模型?丨GAIR live
机器人真正融入开放式服务场景,还差哪一步?作者|吴彤 编辑|麦广炜 大模型技术横空出世,无疑让机器人技术再次成为研究和产业界的焦点。 这一技术的核心优...
世界首个AI程序员Devin视频竟造假?博主逐帧解析,Devin代码任务完成很糟糕
新智元报道编辑:桃子 【新智元导读】全球首个AI程序员Devin被爆视频造假?YouTube博主近日揭露了背后明星初创公司Cognition的谎言,通过逐帧分析发现,Devin...
「大模型+强化学习」最新综述!港中文深圳130余篇论文:详解四条主流技术路线
新智元报道编辑:LRS 【新智元导读】用大模型来辅助强化学习,可以提高模型在多任务学习、样本利用率、任务规划等复杂任务下的能力,该论文综述了LLM-enhance...
大模型做时序预测也很强!华人团队激活LLM新能力,超越一众传统模型实现SOTA
蔚明 投稿自 凹非寺量子位 | 公众号 QbitAI大语言模型潜力被激发—— 无需训练大语言模型就能实现高精度时序预测,超越一切传统时序模型。 来自蒙纳士大学、蚂...
超越GPT-4V,苹果多模态大模型上新!
新智元报道编辑:flynne 【新智元导读】苹果开发的多模态模型Ferret-UI增强了对屏幕的理解和交互,在引用、基础和推理方面表现出了卓越的性能,这些增强功能...
苹果发布多模态模型 Ferret-UI,部分手机 UI 任务超越 GPT-4V
手机厂商自研的端侧模型功能,会超越纯正的大模型团队吗?编译 | 赖文昕 编辑 | 陈彩娴 大模型的诞生,让科技巨头与创业公司们在新一轮的竞赛中再次鸣枪出发...
Scaling Laws又失灵了?谷歌新研究:扩散模型不是越大越好
大数据文摘授权转载自夕小瑶科技说作者:Zicy 近年来,模型规模呈现出愈来愈大的趋势,越来越多的人相信“力大砖飞”。 OpenAI 虽然没有公布Sora的训练细节,但...
多模态大模型有了统一分割框架,华科PSALM多任务登顶,模型代码全开源
机器之心专栏 机器之心编辑部最近,多模态大模型(LMM)取得了一系列引人注目的成就,特别是在视觉 - 语言任务上的表现令人瞩目。它们的成功不仅展现了多模态...
Scaling Laws 又失灵了?谷歌新研究:扩散模型不是越大越好
夕小瑶科技说 原创作者 | Zicy近年来,模型规模呈现出愈来愈大的趋势,越来越多的人相信“力大砖飞”。 OpenAI 虽然没有公布Sora的训练细节,但在Sora的技术报...
人民大学:揭示大语言模型事实召回的关键机制
夕小瑶科技说 原创来源 | 芒果 引言:大语言模型事实召回机制探索该论文深入研究了基于Transformer的语言模型在零射击和少射击场景下的事实记忆任务机制。模...