标签:算法

值得你花时间看的扩散模型教程,来自普渡大学

机器之心报道 编辑:小舟、泽南Diffusion 不仅可以更好地模仿,而且可以进行「创作」。 扩散模型(Diffusion Model)是图像生成模型的一种。有别于此前 AI 领...
阅读原文

扩散模型攻克算法难题,AGI不远了!谷歌大脑找到迷宫最短路径

新智元报道编辑:桃子 【新智元导读】解决最短路径算法,也能被扩散模型完成。「扩散模型」也能攻克算法难题? 一位博士研究人员做了一个有趣的实验,用「离...
阅读原文

比LoRA还快50%的微调方法来了!一张3090性能超越全参调优,UIUC联合LMFlow团队提出LISA

机器之心专栏 机器之心编辑部2022 年底,随着 ChatGPT 的爆火,人类正式进入了大模型时代。然而,训练大模型需要的时空消耗依然居高不下,给大模型的普及和发...
阅读原文

“深目”AI模盒发布!云天励飞将大模型塞进小盒子,千元成本实现训推一体

覆盖场景超90%,填补长尾算法市场空白。 作者|香草 编辑|漠影 大模型训练推理,最低能压缩到多少成本? 智东西3月29日报道,昨日,AI科创板上市企业云天励飞...
阅读原文

千元成本落地专属大模型的时代来了!|甲子光年

AI 1.0公司如何迎接AI 2.0?作者|赵健 从ChatGPT到Sora,从文生文、文生图像到文生视频,大模型发展日新月异,持续给行业带来惊喜,不仅国内掀起“百模大战”...
阅读原文

只要千元级,人人可用百亿级多模态大模型!国产「AI模盒」秒级训练推理

新智元报道编辑:编辑部 【新智元导读】从今天起,千元级就能解锁专属大模型了!这款搭载首颗纯国产14nm Chiplet大模型推理芯片的「深目」AI模盒,可以轻松实...
阅读原文

全面解析LoRA、QLoRA、RLHF,PPO,DPO,Flash Attention、增量学习等大模型算法

随着大模型的飞速发展,在短短一年间就有了大幅度的技术迭代更新,从LoRA、QLoRA、AdaLoRa、ZeroQuant、Flash Attention、KTO、蒸馏技术到模型增量学习、数据...
阅读原文

哈工深提出基于联邦学习的大模型指令微调

夕小瑶科技说 原创作者 | 松果引言:面对数据匮乏与隐私挑战的联邦指令调整在当今大语言模型(LLMs)发展中,指令调整被证明对于生成与人类对齐的响应至关重...
阅读原文

在 ChatGPT 出现之前,李飞飞的ImageNet如何奠定了人工智能的技术革命?

进入 2024 年,人工智能的发展速度似乎已经快过了时间的更迭。 2 月,OpenAI 发布视频生成模型 Sora,就像一年多前才发布的 ChatGPT 一样,Sora 被外界认为是...
阅读原文

刚刚!马斯克履约开源Grok,超越Llama成全球最大开源模型,却被怀疑是作秀?!

整理| 李冬梅、褚杏娟 本周一,马斯克在他的社交媒体平台 X 上宣布 xAI 开源 Grok,这也兑现了他上周的开源承诺。截至目前,Grok 已经在 GitHub 上获得了 4.3...
阅读原文

今日arXiv最热NLP大模型论文:大模型把《算法导论》学明白了!

夕小瑶科技说 原创编辑 | Tscom 引言:探索自然语言描述算法的执行能力在计算机科学的发展历程中,能够理解和执行自然语言描述的程序一直是一个长期追求的目...
阅读原文

清华姚班本科生连发两作,十年来最大改进:矩阵乘法接近理论最优

选自QuantaMagazine 机器之心编译 作者:Steve Nadis 编辑:杜伟、大盘鸡通过消除「隐藏的低效」问题,计算机科学家提出了一种比以往更快的大型矩阵相乘新方...
阅读原文

Claude 3成功破解未公开算法?智商测试101分超越人类/碾压GPT-4!网友惊呼:实测比跑分还强

新智元报道编辑:编辑部 【新智元导读】网友测试Claude之后惊呼:实测比跑分厉害多了!智商测试中碾压GPT-4,得分高达101。而且能发现量子物理学家还未发表的...
阅读原文

清华大学唐杰:从GPT到GPT Zero会是今年重大阶段性成果|甲子光年

2024年将开启AGI元年。整理|刘杨楠 编辑|王博 “2024年,从GPT到GPT Zero会是重大的阶段性成果,我们相信这一天会在不久的未来到来。” 在2月29日举行的2024...
阅读原文

没有雷军的小米手机发布会,直接发了一台「相机」

全新Ultra 依然王炸就在刚刚,小米再次站在聚光灯下,这次发布会的舞台上,我们看到了熟悉的「新面孔」——卢伟冰。 虽然缺少了雷式幽默,但接棒的卢伟冰带来了...
阅读原文
191011121318