标签:算法

李开复首次分享零一万物大模型方法论,并表示十年不变现|甲子光年

AI 2.0时代烧钱逻辑不再适用。作者|赵健 今天,大模型初创公司零一万物宣布了一系列大模型与产品更新: 在模型层,零一万物发布了千亿参数的Yi-Large闭源模...
阅读原文

人类偏好就是尺!SPPO对齐技术让大语言模型左右互搏、自我博弈

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

成立2年产出280篇论文,一个顶尖数学家兼亿万富翁和他打造的新型“科学帝国”|纪念吉姆·西蒙斯(1938-2024)

来源 星空杂谈(XingKongZaTan) 撰文 D.T. Max 编译 张一苇 编辑 魏潇 编者按: 当地时间 2024 年 5 月 10 日,传奇数学家、慈善家,被誉为华尔街最成功投资...
阅读原文

抛弃自回归,连接一致性Diffusion和LLM!UCSD上交新作热度紧追AF 3

新智元报道编辑:乔杨 好困 【新智元导读】来自加州大学圣地亚哥分校和上海交通大学的几位研究者发表了他们关于「一致性大语言模型」的研究成果(Consistency...
阅读原文

RAG还是微调?万字长文总结大模型微调技能图谱

随着大模型的飞速发展,在短短一年间就有了大幅度的技术迭代更新,从LoRA、QLoRA、AdaLoRa、ZeroQuant、Flash Attention、KTO、PPO、DPO、蒸馏技术到模型增量...
阅读原文

独家揭秘,加速进化公司的人形机器人,为什么也能够旋转起身?

大数据文摘受权转载自机器人大讲堂 4月18日,波士顿动力新一代 Atlas 用以恐怖片的方式站起来的动作引起全网震惊,而仅仅一周后,中国人形机器人公司加速进化...
阅读原文

ICLR 2024 Oral|用巧妙的「传送」技巧,让神经网络的训练更加高效

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

微调和量化竟会增加越狱风险!Mistral、Llama等无一幸免

新智元报道编辑:alan 【新智元导读】大模型的安全漏洞又填一笔!最新研究表明,对任何下游任务进行微调和量化都可能会影响LLM的安全性,即使本身并没有恶意...
阅读原文

OpenAI泄密者,投奔马斯克

白交 衡宇 发自 凹非寺量子位 | 公众号 QbitAI刚被OpenAI开除的泄密者,光速投奔马斯克。 当事人Pavel Izmailov(以下简称小P),正是Ilya盟友之一,在Ilya领...
阅读原文

辩证看待“幻觉”问题,蔚来汽车在AI和大模型领域的应用实践

演讲嘉宾|潘鹏举 编辑|何逸灿 随着新能源汽车大战进入“智能化”的下半场,受政策、技术、市场的驱动,车企竞相踏入 AI 大模型这片蓝海。就在几天前,蔚来自...
阅读原文

Meta 联合纽约大学和华盛顿大学提出MetaCLIP,带你揭开CLIP的高质量数据之谜。

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

全面解析RLHF,PPO,DPO,Flash Attention,增量学习等大模型算法

随着大模型的飞速发展,在短短一年间就有了大幅度的技术迭代更新,从LoRA、QLoRA、AdaLoRa、ZeroQuant、Flash Attention、KTO、PPO、DPO、蒸馏技术到模型增量...
阅读原文

CVPR 2024 | 擅长处理复杂场景和语言表达,清华&博世提出全新实例分割网络架构MagNet

AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
阅读原文

OpenAI陷巨大算力荒,国内大厂抢先破局!打破单芯片限制,算力效率提升33%

新智元报道编辑:编辑部 【新智元导读】一切计算皆AI已成为行业共识。大模型参数规模从千亿走向万亿,从单一走向MoE,对算力的需求愈加庞大。我们需要理清的...
阅读原文

这就是OpenAI神秘的Q*?斯坦福:语言模型就是Q函数

机器之心报道 编辑:Panda‍‍还记得去年 11 月底爆出来的 Q* 项目吗?这是传说中 OpenAI 正在秘密开展、或将带来颠覆性变革的 AI 项目。如果你想回忆一下,可...
阅读原文
1789101118