标签:参数

马斯克怒告OpenAI案解密:Ilya看到了什么?125万亿参数Q*细节曝光,53页PDF全网疯转

新智元报道编辑:编辑部 【新智元导读】现在,马斯克起诉OpenAI案的最大未解之谜,就集中在了「Ilya究竟看到了什么」上。他看到的东西,让OpenAI大震荡,所有...
阅读原文

53页PDF爆料OpenAI“AGI时间表”,爆料者:马斯克诉讼搅了局

克雷西 发自 凹非寺量子位 | 公众号 QbitAIOpenAI神秘的Q*计划,又有新鲜爆料。 今天凌晨,一篇53页google文档开始在网络上热传,透露OpenAI“计划在2027年前...
阅读原文

清华、哈工大把大模型压缩到了1bit,把大模型放在手机里跑的愿望就快要实现了!

机器之心专栏 机器之心编辑部近期,清华大学和哈尔滨工业大学联合发布了一篇论文:把大模型压缩到 1.0073 个比特时,仍然能使其保持约 83% 的性能!自从大模...
阅读原文

60行代码,从头开始构建GPT!最全实践指南来了

新智元报道编辑:桃子 【新智元导读】GPT早已成为大模型时代的基础。国外一位开发者发布了一篇实践指南,仅用60行代码构建GPT。60行代码,从头开始构建GPT? ...
阅读原文

微软6页论文爆火:三进制LLM,真香!

金磊 发自 凹非寺量子位 | 公众号 QbitAI现在,大语言模型(LLM)迎来了“1-bit时代”。 这就是由微软和中国中科院大学在最新一项研究中所提出的结论—— 所有的L...
阅读原文

想训练类Sora模型吗?尤洋团队OpenDiT实现80%加速

机器之心报道 机器之心编辑部作为 2024 开年王炸,Sora 的出现树立了一个全新的追赶目标,每个文生视频的研究者都想在最短的时间内复现 Sora 的效果。 根据 O...
阅读原文

知名AI研究者深挖谷歌Gemma:参数不止70亿,设计原则很独特

机器之心报道 编辑:陈萍、杜伟想要了解谷歌 Gemma 与 Llama 2、Mistral 有哪些异同吗?这篇文章值得一读。就在几天前,开源大模型领域迎来了重磅新玩家:谷...
阅读原文

用扩散模型生成网络参数,LeCun点赞尤洋团队新研究

机器之心报道 机器之心编辑部如果你有被 Sora 生成的视频震撼到,那你就已经见识过扩散模型在视觉生成方面的巨大潜力。当然,扩散模型的潜力并不止步于此,它...
阅读原文

打入AI底层!NUS尤洋团队用扩散模型构建神经网络参数,LeCun点赞

克雷西 发自 凹非寺量子位 | 公众号 QbitAI扩散模型,迎来了一项重大新应用—— 像Sora生成视频一样,给神经网络生成参数,直接打入了AI的底层! 这就是新加坡...
阅读原文

用扩散模型生成神经网络?NUS 尤洋团队:这不是开玩笑

Neural Network Diffusion,开始用魔法打败魔法了。作者丨赖文昕 编辑丨郭思、陈彩娴 说起扩散模型生成的东西,你会立刻想到什么? 是OpenAI的经典牛油果椅子...
阅读原文

华为王云鹤:对“小”的大模型的优化重新思考

700个开发硬件免费申请➕现金大奖!生成式 AI、机器人 AI、PC AI 三大赛道!AMD Pervasive AI 开发者挑战赛报名火热进行中,扫码了解详情并报名~导读作者为华...
阅读原文

苹果极致LLM端侧方案:LLM in a flash

700个开发硬件免费申请➕现金大奖!生成式 AI、机器人 AI、PC AI 三大赛道!AMD Pervasive AI 开发者挑战赛报名火热进行中,扫码了解详情并报名~导读本文是知...
阅读原文

人类偏好优化算法哪家强?跟着高手一文学懂DPO、IPO和KTO

选自 huggingface.co/blog 作者:Kashif Rasul 等 机器之心编译 编辑:赵阳‍尽管收集人类对模型生成内容的相对质量的标签,并通过强化学习从人类反馈(RLHF)...
阅读原文

生成速度快SDXL一倍,9GB GPU也能运行,Stable Cascade来搞性价比了

机器之心报道 编辑:大盘鸡硬件要求越来越低,生成速度越来越快。Stability AI 作为文本到图像的「元老」,不仅在引领该领域的潮流方向,也在模型质量上一次...
阅读原文

专访面壁曾国洋:踩过 1000 次大模型的坑后 ,造一个性能小钢炮

以小博大,面壁MiniCPM在大模型赛场上扔出了重磅炸弹。作者丨赖文昕、王悦 编辑丨陈彩娴 2月1日,刚成立一年的面壁智能发布了两个在海内外大模型领域「炸裂级...
阅读原文
191011121316