标签：任务

SuperBench大模型综合能力评测报告

在2023年的“百模大战”中，众多实践者推出了各类模型，这些模型有的是原创的，有的是针对开源模型进行微调的；有些是通用的，有些则是行业特定的。如何能合理...

阅读原文

AIGC动态

2年前 (2024)

无任务学习及在机器人任务和规划中的应用

大数据文摘授权转载自中国人工智能学会作者：张宪琦，范晓鹏摘要：本文提出了无任务学习的方法，阐述了其与现有方法（包括自监督学习、迁移学习、模仿学习...

阅读原文

AIGC动态

2年前 (2024)

两万字实录：该怎么让机器人吃下大模型？

机器人真正融入开放式服务场景，还差哪一步？来源：AI科技评论作者：吴彤编辑：麦广炜大模型技术横空出世，无疑让机器人技术再次成为研究和产业界的焦点。...

阅读原文

AIGC动态

2年前 (2024)

新架构掀翻Transformer！无限上下文处理，2万亿token碾压Llama 2

新智元报道编辑：桃子好困【新智元导读】Transformer王座即将被取而代之！Meta、USC、CMU和UCSD联合提出了革命性新架构Megalodon，能够处理无限上下文，在2...

阅读原文

AIGC动态

2年前 (2024)

用MoE横扫99个子任务！浙大等提出全新通用机器人策略GeRM

新智元报道编辑：LRS 【新智元导读】本文分享论文GeRM: A Generalist Robotic Model with Mixture-of-experts for Quadruped Robot，由西湖大学和浙江大学联...

阅读原文

AIGC动态

2年前 (2024)

两万字实录：该怎么让机器人吃下大模型？丨GAIR live

机器人真正融入开放式服务场景，还差哪一步？作者｜吴彤编辑｜麦广炜大模型技术横空出世，无疑让机器人技术再次成为研究和产业界的焦点。这一技术的核心优...

阅读原文

AIGC动态

2年前 (2024)

世界首个AI程序员Devin视频竟造假？博主逐帧解析，Devin代码任务完成很糟糕

新智元报道编辑：桃子【新智元导读】全球首个AI程序员Devin被爆视频造假？YouTube博主近日揭露了背后明星初创公司Cognition的谎言，通过逐帧分析发现，Devin...

阅读原文

AIGC动态

2年前 (2024)

「大模型+强化学习」最新综述！港中文深圳130余篇论文：详解四条主流技术路线

新智元报道编辑：LRS 【新智元导读】用大模型来辅助强化学习，可以提高模型在多任务学习、样本利用率、任务规划等复杂任务下的能力，该论文综述了LLM-enhance...

阅读原文

AIGC动态

2年前 (2024)

大模型做时序预测也很强！华人团队激活LLM新能力，超越一众传统模型实现SOTA

蔚明投稿自凹非寺量子位 | 公众号 QbitAI大语言模型潜力被激发—— 无需训练大语言模型就能实现高精度时序预测，超越一切传统时序模型。来自蒙纳士大学、蚂...

阅读原文

AIGC动态

2年前 (2024)

超越GPT-4V，苹果多模态大模型上新！

新智元报道编辑：flynne 【新智元导读】苹果开发的多模态模型Ferret-UI增强了对屏幕的理解和交互，在引用、基础和推理方面表现出了卓越的性能，这些增强功能...

阅读原文

AIGC动态

2年前 (2024)

苹果发布多模态模型 Ferret-UI，部分手机 UI 任务超越 GPT-4V

手机厂商自研的端侧模型功能，会超越纯正的大模型团队吗？编译 | 赖文昕编辑 | 陈彩娴大模型的诞生，让科技巨头与创业公司们在新一轮的竞赛中再次鸣枪出发...

阅读原文

AIGC动态

2年前 (2024)

Scaling Laws又失灵了？谷歌新研究：扩散模型不是越大越好

大数据文摘授权转载自夕小瑶科技说作者：Zicy 近年来，模型规模呈现出愈来愈大的趋势，越来越多的人相信“力大砖飞”。 OpenAI 虽然没有公布Sora的训练细节，但...

阅读原文

AIGC动态

2年前 (2024)

多模态大模型有了统一分割框架，华科PSALM多任务登顶，模型代码全开源

机器之心专栏机器之心编辑部最近，多模态大模型（LMM）取得了一系列引人注目的成就，特别是在视觉 - 语言任务上的表现令人瞩目。它们的成功不仅展现了多模态...

阅读原文

AIGC动态

2年前 (2024)

Scaling Laws 又失灵了？谷歌新研究：扩散模型不是越大越好

夕小瑶科技说原创作者 | Zicy近年来，模型规模呈现出愈来愈大的趋势，越来越多的人相信“力大砖飞”。 OpenAI 虽然没有公布Sora的训练细节，但在Sora的技术报...

阅读原文

AIGC动态

2年前 (2024)

人民大学：揭示大语言模型事实召回的关键机制

夕小瑶科技说原创来源 | 芒果引言：大语言模型事实召回机制探索该论文深入研究了基于Transformer的语言模型在零射击和少射击场景下的事实记忆任务机制。模...

阅读原文

AIGC动态

2年前 (2024)

1…22 232425 26…48