标签:算法
成立2年产出280篇论文,一个顶尖数学家兼亿万富翁和他打造的新型“科学帝国”|纪念吉姆·西蒙斯(1938-2024)
来源 星空杂谈(XingKongZaTan) 撰文 D.T. Max 编译 张一苇 编辑 魏潇 编者按: 当地时间 2024 年 5 月 10 日,传奇数学家、慈善家,被誉为华尔街最成功投资...
抛弃自回归,连接一致性Diffusion和LLM!UCSD上交新作热度紧追AF 3
新智元报道编辑:乔杨 好困 【新智元导读】来自加州大学圣地亚哥分校和上海交通大学的几位研究者发表了他们关于「一致性大语言模型」的研究成果(Consistency...
RAG还是微调?万字长文总结大模型微调技能图谱
随着大模型的飞速发展,在短短一年间就有了大幅度的技术迭代更新,从LoRA、QLoRA、AdaLoRa、ZeroQuant、Flash Attention、KTO、PPO、DPO、蒸馏技术到模型增量...
独家揭秘,加速进化公司的人形机器人,为什么也能够旋转起身?
大数据文摘受权转载自机器人大讲堂 4月18日,波士顿动力新一代 Atlas 用以恐怖片的方式站起来的动作引起全网震惊,而仅仅一周后,中国人形机器人公司加速进化...
ICLR 2024 Oral|用巧妙的「传送」技巧,让神经网络的训练更加高效
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
微调和量化竟会增加越狱风险!Mistral、Llama等无一幸免
新智元报道编辑:alan 【新智元导读】大模型的安全漏洞又填一笔!最新研究表明,对任何下游任务进行微调和量化都可能会影响LLM的安全性,即使本身并没有恶意...
OpenAI泄密者,投奔马斯克
白交 衡宇 发自 凹非寺量子位 | 公众号 QbitAI刚被OpenAI开除的泄密者,光速投奔马斯克。 当事人Pavel Izmailov(以下简称小P),正是Ilya盟友之一,在Ilya领...
辩证看待“幻觉”问题,蔚来汽车在AI和大模型领域的应用实践
演讲嘉宾|潘鹏举 编辑|何逸灿 随着新能源汽车大战进入“智能化”的下半场,受政策、技术、市场的驱动,车企竞相踏入 AI 大模型这片蓝海。就在几天前,蔚来自...
Meta 联合纽约大学和华盛顿大学提出MetaCLIP,带你揭开CLIP的高质量数据之谜。
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
全面解析RLHF,PPO,DPO,Flash Attention,增量学习等大模型算法
随着大模型的飞速发展,在短短一年间就有了大幅度的技术迭代更新,从LoRA、QLoRA、AdaLoRa、ZeroQuant、Flash Attention、KTO、PPO、DPO、蒸馏技术到模型增量...
CVPR 2024 | 擅长处理复杂场景和语言表达,清华&博世提出全新实例分割网络架构MagNet
AIxiv专栏是机器之心发布学术、技术内容的栏目。过去数年,机器之心AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术...
OpenAI陷巨大算力荒,国内大厂抢先破局!打破单芯片限制,算力效率提升33%
新智元报道编辑:编辑部 【新智元导读】一切计算皆AI已成为行业共识。大模型参数规模从千亿走向万亿,从单一走向MoE,对算力的需求愈加庞大。我们需要理清的...
这就是OpenAI神秘的Q*?斯坦福:语言模型就是Q函数
机器之心报道 编辑:Panda还记得去年 11 月底爆出来的 Q* 项目吗?这是传说中 OpenAI 正在秘密开展、或将带来颠覆性变革的 AI 项目。如果你想回忆一下,可...
24GB单卡全量微调Llama 3-8B,仅需添加一行代码
自ChatGPT问世以来,大型语言模型在各个领域引起了广泛兴趣,并催生了基于语言模型的应用,包括但不限于自动文本生成、信息检索、智能助理、聊天机器人以及智...
华为P70闪拍功能意外爆火,CTO亲自下场解读技术原理
克雷西 发自 凹非寺量子位 | 公众号 QbitAI一段博主拍摄的视频,让华为P70的抓拍功能意外火了…… 注意看,这里有一个高速运转的机械,是不是让你看得已经眼花...