标签:策略
瑜伽球上遛「狗」!入选英伟达十大项目之一的Eureka有了新突破
机器之心报道 编辑:陈萍机器狗在瑜伽球上稳稳当当的行走,平衡力那是相当的好:各种场景都能拿捏,不管是平坦的人行道、还是充满挑战的草坪都能 hold 住:甚...
加州理工华人用AI颠覆数学证明!提速5倍震惊陶哲轩,80%数学步骤全自动化
新智元报道编辑:编辑部 【新智元导读】让陶哲轩大神赞不绝口的形式化研究神器Lean,运行LLM的推理却有个bug。最近,加州理工团队解决了这个bug,把80%以上的...
DeepMind具身智能“足球运动员”登Science Robotics 封面
大数据文摘受权转载自机器人大讲堂 近日,Google DeepMind发表了一项突破性的研究成果,该公司利用深度强化学习方法,成功训练出了一个能够在简化版1v1足球比...
Science Robotics封面!DeepMind强化学习打造超一流机器人球员
新智元报道编辑:wewe 【新智元导读】双足机器人运动技能突破!谷歌DeepMind创新深度强化学习框架,赋能仿人机器人全身控制,征战足球赛场。机器人展现惊人动...
XAI有什么用?探索LLM时代利用可解释性的10种策略
机器之心专栏 机器之心编辑部你是否也好奇,在大模型时代,可解释性人工智能技术(XAI)有怎样的使用价值?近日,来自佐治亚大学、新泽西理工学院、弗吉尼亚...
港大张清鹏团队提出个性化癌症治疗新思路:用 AI 控制癌细胞进化过程
现代癌症治疗里耐药性的发展常常是导致治疗失败和肿瘤进展的原因,每个患者的耐药情况与肿瘤特征更是具有高度个体化的特征。 为了解决传统间歇性雄激素剥夺疗...
斯坦福团队新作:喊话就能指导机器人,任务成功率暴增,网友:特斯拉搞快点
克雷西 发自 凹非寺量子位 | 公众号 QbitAI斯坦福的ALOHA家务机器人团队,发布了最新研究成果—— 项目名为Yell At Your Robot(简称YAY),有了它,机器人的“...
今日arXiv最热大模型论文:南京大学提出用于大模型生成的动态温度采样法,简单有效!
夕小瑶科技说 原创作者 | 松果引言:温度采样在大型语言模型中的作用与局限在自然语言处理(NLP)的领域,大语言模型(LLMs)已经在各种下游语言任务中展现出...
超人类平均水平!伯克利双足机器人2分34秒刷新纪录,还能跳1.4远
大数据文摘授权转载自机器人大讲堂 近日,一则关于双足机器人创造400米新纪录的消息刷爆了科技圈。只见这个名叫Cassie的'机器人运动员',在听到发令枪响的那...
LLM Agent在交互中学习游戏世界模型和进化行为策略
来源:将门创投 作者:张文祺 来源:公众号【量子位】 目前,LLM Agent大多专注于特定任务。研究者在了解该任务的领域知识后,手工编写大量复杂的Prompt,告...
400米2分34秒破纪录!伯克利双足机器人「接管」人类
新智元报道编辑:Aeneas 好困 【新智元导读】UC伯克利的双足机器人,400米直接跑进了2分34秒,这个速度属实是超越不少人类了。而背后的RL通用框架,让它无论...
开源版OpenAI机器人2.5万打造!斯坦福李飞飞团队祭出「灵巧手」,泡茶剪纸炫技
新智元报道编辑:编辑部 【新智元导读】「OpenAI机器人」一出世惊艳众人!最近,李飞飞团队打造了一个开源便携式手部动捕系统——DexCap,成本仅3600美元,就能...
浙大&中科院让Agent学会自我进化,玩德州扑克心机尽显
Wenqi Zhang 投稿量子位 | 公众号 QbitAI基于大模型的Agent,已经成为了大型的博弈游戏的高级玩家,而且玩的还是德州扑克、21点这种非完美信息博弈。 来自浙...
当prompt策略遇上分治算法,南加大、微软让大模型炼成「火眼金睛」
机器之心专栏 机器之心编辑部近年来,大语言模型(LLMs)由于其通用的问题处理能力而引起了大量的关注。现有研究表明,适当的提示设计(prompt enginerring)...
今日arXiv最热大模型论文:北京大学发布,将试错引入大模型代理学习!
夕小瑶科技说 原创编辑 | 松果引言:探索语言智能的新边界在人工智能的发展历程中,语言智能始终是一个核心的研究领域。随着大语言模型(LLM)的兴起,我们对...