标签:策略
在对齐 AI 时,为什么在线方法总是优于离线方法?
机器之心报道 编辑:Panda W在线和离线对齐算法的性能差距根源何在?DeepMind实证剖析出炉在 AI 对齐问题上,在线方法似乎总是优于离线方法,但为什么会这样...
阿里安全大模型工程实践、NVIDIA NIM 推理微服务解析 | 研讨会直播预告
5月16日19点,智猩猩将举办「企业级大模型工程实践在线研讨会」。阿里巴巴 AI 基础架构工程师刘彬(花名:慧原)、NVIDIA软件解决方案架构师吴金钟两位技术专...
告别3D高斯Splatting算法,带神经补偿的频谱剪枝高斯场SUNDAE开源了
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
瑜伽球上遛「狗」!入选英伟达十大项目之一的Eureka有了新突破
机器之心报道 编辑:陈萍机器狗在瑜伽球上稳稳当当的行走,平衡力那是相当的好:各种场景都能拿捏,不管是平坦的人行道、还是充满挑战的草坪都能 hold 住:甚...
加州理工华人用AI颠覆数学证明!提速5倍震惊陶哲轩,80%数学步骤全自动化
新智元报道编辑:编辑部 【新智元导读】让陶哲轩大神赞不绝口的形式化研究神器Lean,运行LLM的推理却有个bug。最近,加州理工团队解决了这个bug,把80%以上的...
DeepMind具身智能“足球运动员”登Science Robotics 封面
大数据文摘受权转载自机器人大讲堂 近日,Google DeepMind发表了一项突破性的研究成果,该公司利用深度强化学习方法,成功训练出了一个能够在简化版1v1足球比...
Science Robotics封面!DeepMind强化学习打造超一流机器人球员
新智元报道编辑:wewe 【新智元导读】双足机器人运动技能突破!谷歌DeepMind创新深度强化学习框架,赋能仿人机器人全身控制,征战足球赛场。机器人展现惊人动...
XAI有什么用?探索LLM时代利用可解释性的10种策略
机器之心专栏 机器之心编辑部你是否也好奇,在大模型时代,可解释性人工智能技术(XAI)有怎样的使用价值?近日,来自佐治亚大学、新泽西理工学院、弗吉尼亚...
港大张清鹏团队提出个性化癌症治疗新思路:用 AI 控制癌细胞进化过程
现代癌症治疗里耐药性的发展常常是导致治疗失败和肿瘤进展的原因,每个患者的耐药情况与肿瘤特征更是具有高度个体化的特征。 为了解决传统间歇性雄激素剥夺疗...
斯坦福团队新作:喊话就能指导机器人,任务成功率暴增,网友:特斯拉搞快点
克雷西 发自 凹非寺量子位 | 公众号 QbitAI斯坦福的ALOHA家务机器人团队,发布了最新研究成果—— 项目名为Yell At Your Robot(简称YAY),有了它,机器人的“...
今日arXiv最热大模型论文:南京大学提出用于大模型生成的动态温度采样法,简单有效!
夕小瑶科技说 原创作者 | 松果引言:温度采样在大型语言模型中的作用与局限在自然语言处理(NLP)的领域,大语言模型(LLMs)已经在各种下游语言任务中展现出...
超人类平均水平!伯克利双足机器人2分34秒刷新纪录,还能跳1.4远
大数据文摘授权转载自机器人大讲堂 近日,一则关于双足机器人创造400米新纪录的消息刷爆了科技圈。只见这个名叫Cassie的'机器人运动员',在听到发令枪响的那...
LLM Agent在交互中学习游戏世界模型和进化行为策略
来源:将门创投 作者:张文祺 来源:公众号【量子位】 目前,LLM Agent大多专注于特定任务。研究者在了解该任务的领域知识后,手工编写大量复杂的Prompt,告...
400米2分34秒破纪录!伯克利双足机器人「接管」人类
新智元报道编辑:Aeneas 好困 【新智元导读】UC伯克利的双足机器人,400米直接跑进了2分34秒,这个速度属实是超越不少人类了。而背后的RL通用框架,让它无论...
开源版OpenAI机器人2.5万打造!斯坦福李飞飞团队祭出「灵巧手」,泡茶剪纸炫技
新智元报道编辑:编辑部 【新智元导读】「OpenAI机器人」一出世惊艳众人!最近,李飞飞团队打造了一个开源便携式手部动捕系统——DexCap,成本仅3600美元,就能...