标签:算法
在RTX 4090被限制的时代下,让大模型使用RLHF更高效的方法来了
机器之心专栏机器之心编辑部该论文介绍了一种名为 ReMax 的新算法,专为基于人类反馈的强化学习(RLHF)而设计。ReMax 在计算效率(约减少 50% 的 GPU 内存和...
未来大模型顶会?陈丹琦等人组织首届COLM,为语言建模研究提供新平台
机器之心报道编辑:大盘鸡获得了众多学术大牛的支持。随着 ChatGPT 的爆火,NLP、大模型领域已经是个「一天不看新闻就会落后」的地方。虽然如今 AI 领域的顶...
引入大语言模型、首个支持国产算力生态,全新开源RL框架RLLTE来了
机器之心专栏机器之心编辑部本文中,来自香港理工大学、宁波东方理工大学(暂名)、普渡大学和大疆科技的研究者和算法团队发布了名为 RLLTE 的开源强化学习框...
成本低至16.8万的人形机器人,正在成为现实
大数据文摘授权转载自AI科技评论作者:郭思编辑:陈彩娴9月底,一则关于特斯拉机器人的视频流出,外界看到了Optimus擎天柱机器人的最新进展。与此同时,在推...
新型威胁:探索 LLM 攻击对网络安全的冲击
作者 | Anthony Alford 译者 | 平川 策划 | 丁晓昀 来自卡内基梅隆大学(CMU)的研究人员发布了 LLM Attacks,这是一种可以针对各种大型语言模型(LLM)构建...
成本低至 16.8 万的人形机器人,正在成为现实
企业家的嘴:一面说AI毁灭人类,一面又在不断点燃具身智能技术火焰。作者丨郭思编辑丨陈彩娴9月底,一则关于特斯拉机器人的视频流出,外界看到了Optimus擎天...
TradeMaster最新发布沙盒工具箱,探索量化交易的全新维度
TradeMaster 是由新加坡南洋理工大学开发的一款基于强化学习的开源量化交易平台。为了更全面地评价和提升算法性能,我们推出了沙盒工具箱,同时搭配了易于使...
Hugging Face 大语言模型优化技术
作者 | Sergio De Simone 译者 | 明知山 策划 | 丁晓昀 大语言模型的生产部署存在两个主要的挑战,一个是需要大量的参数,一个是需要处理非常长的用于表示上...
从马赛克到高清图,AI生图能力变强了,但如何取得美感与失真的平衡?
机器之心编译编辑:rome rome让图像看起来更好的 AI 工具,往往会导致图像失真,而让图像看起来更真实时,往往会缺少美感,这一问题该如何权衡?在悬疑和科幻...
Astronomaly:利用 CNN 和主动学习识别 400 万张星系图像中的异常
点击上方蓝字,关注我们!By 超神经星系中的异常现象是我们了解宇宙的关键。然而,随着天文观测技术的发展,天文数据正以指数级别增长,超出了天文工作者的分...
从观察、思考到行动,深度强化学习大牛Pieter Abbeel谈如何驯服机器人
机器之心报道编辑:大盘鸡这样学,还能那样学。人类的大脑具有学习新事物的能力,而且学习方式多种多样,从模仿他人到观看在线解说视频,不一而足。如果机器...
2012,改变人类命运的 180 天
伟大是如何诞生的?本文经授权转自《远川研究所》;作者:李墨天,编辑:戴老板2012 年 12 月初的一天,一场秘密竞拍正在美国滑雪胜地太浩湖(Lake Tahoe)的...
清华、微软等淘汰提示工程师?LLM与进化算法结合,创造超强提示优化器
新智元报道编辑:润 Lumina【新智元导读】提示工程可以自动化了?EvoPrompt的出现解决了大型语言模型性能依赖高质量提示的挑战,同时展示了LLM在传统算法中的...
刷榜13个暗光增强基准!清华大学联合ETH等开源Retinexformer:亮、暗都有细节 | ICCV 2023
新智元报道编辑:LRS【新智元导读】全面超越暗光增强sota模型,Retinexformer架构端到端、单阶段解决过曝、伪影、低光等问题!在增强弱光图像时,许多深度学...