标签:策略

DeepMind具身智能“足球运动员”登Science Robotics 封面

大数据文摘受权转载自机器人大讲堂 近日,Google DeepMind发表了一项突破性的研究成果,该公司利用深度强化学习方法,成功训练出了一个能够在简化版1v1足球比...
阅读原文

Science Robotics封面!DeepMind强化学习打造超一流机器人球员

新智元报道编辑:wewe 【新智元导读】双足机器人运动技能突破!谷歌DeepMind创新深度强化学习框架,赋能仿人机器人全身控制,征战足球赛场。机器人展现惊人动...
阅读原文

XAI有什么用?探索LLM时代利用可解释性的10种策略

机器之心专栏 机器之心编辑部你是否也好奇,在大模型时代,可解释性人工智能技术(XAI)有怎样的使用价值?近日,来自佐治亚大学、新泽西理工学院、弗吉尼亚...
阅读原文

港大张清鹏团队提出个性化癌症治疗新思路:用 AI 控制癌细胞进化过程

现代癌症治疗里耐药性的发展常常是导致治疗失败和肿瘤进展的原因,每个患者的耐药情况与肿瘤特征更是具有高度个体化的特征。 为了解决传统间歇性雄激素剥夺疗...
阅读原文

斯坦福团队新作:喊话就能指导机器人,任务成功率暴增,网友:特斯拉搞快点

克雷西 发自 凹非寺量子位 | 公众号 QbitAI斯坦福的ALOHA家务机器人团队,发布了最新研究成果—— 项目名为Yell At Your Robot(简称YAY),有了它,机器人的“...
阅读原文

今日arXiv最热大模型论文:南京大学提出用于大模型生成的动态温度采样法,简单有效!

夕小瑶科技说 原创作者 | 松果引言:温度采样在大型语言模型中的作用与局限在自然语言处理(NLP)的领域,大语言模型(LLMs)已经在各种下游语言任务中展现出...
阅读原文

超人类平均水平!伯克利双足机器人2分34秒刷新纪录,还能跳1.4远

大数据文摘授权转载自机器人大讲堂 近日,一则关于双足机器人创造400米新纪录的消息刷爆了科技圈。只见这个名叫Cassie的'机器人运动员',在听到发令枪响的那...
阅读原文

LLM Agent在交互中学习游戏世界模型和进化行为策略

来源:将门创投 作者:张文祺 来源:公众号【量子位】 目前,LLM Agent大多专注于特定任务。研究者在了解该任务的领域知识后,手工编写大量复杂的Prompt,告...
阅读原文

400米2分34秒破纪录!伯克利双足机器人「接管」人类

新智元报道编辑:Aeneas 好困 【新智元导读】UC伯克利的双足机器人,400米直接跑进了2分34秒,这个速度属实是超越不少人类了。而背后的RL通用框架,让它无论...
阅读原文

开源版OpenAI机器人2.5万打造!斯坦福李飞飞团队祭出「灵巧手」,泡茶剪纸炫技

新智元报道编辑:编辑部 【新智元导读】「OpenAI机器人」一出世惊艳众人!最近,李飞飞团队打造了一个开源便携式手部动捕系统——DexCap,成本仅3600美元,就能...
阅读原文

浙大&中科院让Agent学会自我进化,玩德州扑克心机尽显

Wenqi Zhang 投稿量子位 | 公众号 QbitAI基于大模型的Agent,已经成为了大型的博弈游戏的高级玩家,而且玩的还是德州扑克、21点这种非完美信息博弈。 来自浙...
阅读原文

当prompt策略遇上分治算法,南加大、微软让大模型炼成「火眼金睛」

机器之心专栏 机器之心编辑部近年来,大语言模型(LLMs)由于其通用的问题处理能力而引起了大量的关注。现有研究表明,适当的提示设计(prompt enginerring)...
阅读原文

今日arXiv最热大模型论文:北京大学发布,将试错引入大模型代理学习!

夕小瑶科技说 原创编辑 | 松果引言:探索语言智能的新边界在人工智能的发展历程中,语言智能始终是一个核心的研究领域。随着大语言模型(LLM)的兴起,我们对...
阅读原文

人类沦为工具人!斯坦福机器人“吸星大法”:从演示中转移技能,400美元打破训练数据悖论

梦晨 西风 发自 凹非寺量子位 | 公众号 QbitAI斯坦福最新“技能转移”大法,让人类沦为给机器人提供训练数据的工具人。 小哥拿上机械手做示范,机器人就能从收...
阅读原文

陪跑又快又稳,机器人跑步搭子来了

机器之心报道 编辑:陈萍、蛋酱这个机器人名叫Cassie,曾经创下百米跑世界纪录。最近,加州大学伯克利分校的研究者给它开发了一种新的深度强化学习算法,让它...
阅读原文