标签:策略

TPAMI | 安全强化学习方法、理论与应用综述,慕工大、同济、伯克利等深度解析

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

Google DeepMind推出DemoStart自主强化学习方法 利用少量示范样本实现复杂操作任务

来源:机器人大讲堂 一直以来,研究人员都在试图开发出能够在现实环境中安全、高效地执行复杂任务(如多指手操作)的机器人技能。传统的机器人学习方法往往需...
阅读原文

一手训练,多手应用:国防科大提出灵巧手抓取策略迁移新方案

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

最高3倍无损提速!数学规划求解器效率升级,论文已中顶刊TPAMI | 中科大&华为诺亚

HEM++团队 投稿量子位 | 公众号 QbitAI最高3倍无损提速,用数学规划求解器寻找最优解更快了! 近日,中科大王杰教授团队(MIRA Lab)和华为诺亚方舟实验室(H...
阅读原文

数据治理如何转化为业务价值?平安产险的探索与实践解析

△大会PPT获取通道已开启,关注数字化经纬公众号,后台回复 “PPT”,即可获取 PPT 下载地址 嘉宾 | 洪广智 平安产险客户大数据团队平台组负责人 编辑 | 高玉娴 ...
阅读原文

ECCV 2024 | 探索离散Token视觉生成中的自适应推理策略

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

o1突发内幕曝光?谷歌8月论文已揭示原理,大模型光有软件不存在护城河

明敏 发自 凹非寺量子位 | 公众号 QbitAI发布不到1周,OpenAI最强模型o1的护城河已经没有了。 有人发现,谷歌DeepMind一篇发表在8月的论文,揭示原理和o1的工...
阅读原文

o1 改变了 Scaling 范式?Self-Play 还值得 All In 吗?

机器之心PRO · 会员通讯 Week 37---- 本周为您解读 ③个值得细品的AI & Robotics业内要事 ---- 1. o1 改变了 Scaling 范式?Self-Play 还值得 All In 吗?...
阅读原文

小模型越级挑战14倍参数大模型,谷歌开启Test-Time端新的Scaling Law

西风 发自 凹非寺量子位 | 公众号 QbitAI不必增加模型参数,计算资源相同,小模型性能超过比它大14倍的模型! 谷歌DeepMind最新研究引发热议,甚至有人表示这...
阅读原文

大模型走向物理世界,TeleAI 发布大模型驱动的具身智能综述,覆盖300篇文献

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

机器人有了"迪士尼魔法"!AI教机器人像卡通人物一样流畅逼真地跳舞

大数据文摘授权转载自机器人大讲堂在计算机动画和机器人控制领域,如何让虚拟角色或实体机器人按照预设轨迹精确执行动作,一直是一个充满挑战的难题。近日,...
阅读原文

Cross-Embodiment/数据集/VLA,具身智能今年的研究重点在哪?

机器之心PRO · 会员通讯 Week 35---- 本周为您解读 ③个值得细品的AI & Robotics业内要事 ---- 1.Cross-Embodiment/数据集/VLA,具身智能今年的研究重点在...
阅读原文

DeepSeek开源数学大模型,高中、大学定理证明新SOTA

机器之心报道 机器之心编辑部DeepSeek-Prover-V1.5 通过结合强化学习和蒙特卡洛树搜索,显著提升了证明生成的效率和准确性。AI 技术与数学发现的进展,正前所...
阅读原文

香港理工:你精心设计的prompt,很容易被用户套出来!

夕小瑶科技说 原创作者 | 谢年年自OpenAI的GPT系列及微软Copilot Studio惊艳登场以来,第三方开发者群体迅速壮大,他们巧妙地设计个性化prompts,并与专业领...
阅读原文

首个支持普通话和方言混说的TTS大模型:河南话、上海话、粤语说得溜

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文
12347