标签:参数

让Stable Diffusion一秒出图!清华硕士加速神器爆火,已有公司接入

克雷西 发自 凹非寺量子位 | 公众号 QbitAIAI图像生成,已经进入了秒速级别,只要4步推理就能完成绘制,最快更是能在1秒之内完成。现在,清华大学联合Hugging...
阅读原文

谷歌开源 AI 微调方法: Distilling Step-by-Step

作者 | Anthony Alford 译者 | 王强 策划 | 丁晓昀 华盛顿大学和谷歌研究中心的一个团队最近开源了 Distilling Step-by-Step(逐步蒸馏),一种用于微调规模...
阅读原文

实时文生图速度提升5-10倍,清华LCM/LCM-LoRA爆火,浏览超百万、下载超20万

机器之心报道编辑:张倩、陈萍生成式模型进入「实时」时代?文生图、图生图已经不是什么新鲜事。但在使用这些工具的过程中,我们发现它们通常运行缓慢,导致...
阅读原文

舍弃99%的参数,还能达到相同的性能!阿里团队发现大模型「合二为一」的黑魔法!而且不用GPU,不需重新训练

夕小瑶科技说 原创作者 | 小戏、Python动漫《龙珠》里,构想了一种“美达摩星人融合术”,通过融合术舞步就可以让譬如悟空与贝吉塔合体,成为“究极超强合体战士...
阅读原文

修改LLaMA2-13B一个参数,语言能力全丧失,复旦等发现大模型新秘密

从年初到现在,以 ChatGPT、LLaMA 等为代表的大语言模型(LLM)展现出了类似人类水平的语言能力,这些大模型可以高效的执行复杂任务,而这些任务往往需要抽象...
阅读原文

Llama与ChatGPT,谁是23年AI模型最大的赢家?

夕小瑶科技说 原创作者 | TscomLlama与ChatGPT,谁是23年AI模型最大的赢家?相对于今年爆🔥的ChatGPT,在短时间内吸引了1亿用户的生成式AI模型 Llama和开源AI...
阅读原文

手机大模型爆发:vivo 发布自研蓝心大模型,参数追赶 GPT-3

蓝厂,它真的只想当手机厂?作者丨郭 思编辑丨陈彩娴11月1日vivo开发者大会上,vivo发布自研AI'蓝心'大模型,并发布大模型矩阵,包括1750亿、1300亿、700亿、...
阅读原文

ChatGPT真实参数只有200亿,首次被微软曝光!网友:难怪OpenAI对开源很紧张

白交 发自 凹非寺量子位 | 公众号 QbitAI突然间,整个大模型圈都在谈论同一件事。微软论文里一张「乍一看不足为奇」的统计图,泄露了“天机”。引领全球风暴的C...
阅读原文

微软惊天泄密:ChatGPT参数只有200亿?

来源:机器之心这合理吗?谁都没有想到,ChatGPT 的核心秘密是由这种方式,被微软透露出来的。昨天晚上,很多讨论 AI 的微信群都被一篇 EMNLP 论文和其中的截...
阅读原文

万万没想到,ChatGPT参数只有200亿?

夕小瑶科技说 分享来源 | 机器之心这合理吗?谁都没有想到,ChatGPT 的核心秘密是由这种方式,被微软透露出来的。昨天晚上,很多讨论 AI 的微信群都被一篇 EM...
阅读原文

微软论文一张截图,曝出GPT-3.5仅有200亿参数?AI圈巨震,网友大呼太离谱!

新智元报道编辑:编辑部【新智元导读】微软最近一篇论文爆料,GPT-3.5的参数量只有20B,远远小于之前GPT-3公布175B。网友表示,ChatGPT能力似乎「配得上」这...
阅读原文

8张3090,1天压缩万亿参数大模型!3.2TB骤降至160GB,压缩率高达20倍

新智元报道编辑:好困【新智元导读】最近,来自ISTA的研究人员提出了一种全新的模型量化方法QMoE,可以将1.6万亿个参数的SwitchTransformer压缩到160GB以下(...
阅读原文

用童话训练AI模型,微软找到了探索生成模型参数的新切入点

选自量子杂志作者:Ben Brubaker机器之心编译编辑:赵阳即便大语言模型的参数规模日渐增长,其模型中的参数到底是如何发挥作用的还是让人难以琢磨,直接对大...
阅读原文

马斯克的AI第一枪,被华人科学家大将打响!xAI首个研究成果:训练无限深度神经网络

大数据文摘受权转载自头部科技文 | Congerry几个月前,马斯克通过 Twitter 宣布自己的人工智能公司xAI正式成立:成立一家 xAI 公司去了解宇宙的真实本质。当...
阅读原文

比传统量子化学计算快约40倍,机器学习揭示了如何将聚合物材料溶解在有机溶剂中

将 ScienceAI设为星标第一时间掌握新鲜的 AI for Science 资讯编辑 | 紫罗用有机溶剂溶解聚合物是高分子材料研究和开发中必不可少的过程,包括塑料回收、聚合...
阅读原文
113141516