标签:参数
秒杀700亿Llama 2!最新国产大模型亮相,无需申请即可免费商用,背后公司来自私募巨头
丰色 发自 凹非寺量子位 | 公众号QbitAI国产大模型刚刚出了一位全新选手:参数670亿的DeepSeek。它在近20个中英文的公开评测榜单上直接超越了同量级、700亿的...
不是大模型全局微调不起,只是LoRA更有性价比,教程已经准备好了
选自 Sebastian Raschka 博客机器之心编译编辑:佳琪这是作者 Sebastian Raschka 经过数百次实验得出的经验,值得一读。增加数据量和模型的参数量是公认的提...
手机上0.2秒出图、当前速度之最,谷歌打造超快扩散模型MobileDiffusion
机器之心专栏机器之心编辑部在手机等移动端侧运行 Stable Diffusion 等文生图生成式 AI 大模型已经成为业界追逐的热点之一,其中生成速度是主要的制约因素。...
通义千问爆甩开源全家桶!最强720亿参数超车Llama 2,新上视觉模型看图直出代码
新智元报道编辑:编辑部【新智元导读】通义千问开源全家桶正式上线!业界最强72B模型直接超越开源标杆Llama 2-70B,还有1.8B模型、音频大模型全部开源,阿里...
最新千亿大模型免费商用:1026亿参数,无需授权!诚邀开发者共同训练
明敏 金磊 发自 凹非寺量子位 | 公众号 QbitAI开源大模型这个圈子,真是卷到不行——国内最新纪录来了,直奔千亿量级,达到1026亿。千亿参数、全面开源、无需授...
首个全面开源的千亿模型来了!源2.0全家桶击破算力限制,代码数学强到发指
新智元报道编辑:编辑部【新智元导读】昨天,浪潮信息发布源2.0基础大模型,并一口气开源了1026亿、518亿、21亿三个大模型!而在编程、推理、逻辑这些老大难...
OpenAI内幕文件惊人曝出,Q*疑能破解加密!AI背着人类在编程,网友:三个月接近AGI
新智元报道编辑:Aeneas alan【新智元导读】OpenAI员工曾在Altman被解雇的前一天发帖:AI正在自己编程!这一帖子被挖出后,更多内幕文件被曝出,表示Q*已经破...
简化版Transformer来了,网友:年度论文
机器之心报道机器之心编辑部从大模型的根源开始优化。Transformer 架构可以说是近期深度学习领域许多成功案例背后的主力军。构建深度 Transformer 架构的一种...
李沐大模型公司细节曝光,项目GitHub空仓标星超500
衡宇 发自 凹非寺量子位 | 公众号 QbitAIAI大神李沐大模型创业方向,终于“水落石出”:利用大模型能力,做游戏引擎,且是面向4A游戏。关于4A游戏这个概念,目...
清华提出 SoRA,参数量只有 LoRA 的 70%,表现更好!
夕小瑶科技说 原创作者 | 智商掉了一地、Python现在有很多关于大型语言模型(LLM)的研究,都围绕着如何高效微调展开。微调是利用模型在大规模通用数据上学到...
OpenAI内斗时,Karpathy在录视频:《大型语言模型入门》上线
机器之心报道编辑:杜伟赶紧学习起来吧!OpenAI 的风波暂时告一段落,员工也忙着「干活了」。年初回归 OpenAI 的 Andrej Karpathy 最近做了一场关于大型语言...
让Stable Diffusion一秒出图!清华硕士加速神器爆火,已有公司接入
克雷西 发自 凹非寺量子位 | 公众号 QbitAIAI图像生成,已经进入了秒速级别,只要4步推理就能完成绘制,最快更是能在1秒之内完成。现在,清华大学联合Hugging...
谷歌开源 AI 微调方法: Distilling Step-by-Step
作者 | Anthony Alford 译者 | 王强 策划 | 丁晓昀 华盛顿大学和谷歌研究中心的一个团队最近开源了 Distilling Step-by-Step(逐步蒸馏),一种用于微调规模...
实时文生图速度提升5-10倍,清华LCM/LCM-LoRA爆火,浏览超百万、下载超20万
机器之心报道编辑:张倩、陈萍生成式模型进入「实时」时代?文生图、图生图已经不是什么新鲜事。但在使用这些工具的过程中,我们发现它们通常运行缓慢,导致...