标签:内核

浙大“北极熊毛衣”登Science,保温效率达羽绒服5倍

克雷西 发自 凹非寺量子位 | 公众号 QbitAI最近,一波又一波寒潮接踵而至,羽绒服成了人们过冬的必备物品。 而浙大研制了一种新型材料,不仅保暖而且比羽绒服...
阅读原文

PyTorch团队重写「分割一切」模型,比原始实现快8倍

机器之心报道编辑:陈萍我们该如何优化 Meta 的「分割一切」模型,PyTorch 团队撰写的这篇博客由浅入深的帮你解答。从年初到现在,生成式 AI 发展迅猛。但很...
阅读原文

8张3090,1天压缩万亿参数大模型!3.2TB骤降至160GB,压缩率高达20倍

新智元报道编辑:好困【新智元导读】最近,来自ISTA的研究人员提出了一种全新的模型量化方法QMoE,可以将1.6万亿个参数的SwitchTransformer压缩到160GB以下(...
阅读原文

致敬TempleOS,有开发者创建了启动Llama 2的操作系统,网友:8G内存老电脑就能跑

机器之心报道编辑:杜伟不得不说,Llama 2 的「二创」项目越来越硬核、有趣了。自 Meta 发布开源大模型 Llama 2 以来,围绕着该模型的「二创」项目便多了起来...
阅读原文

H100推理飙升8倍!英伟达官宣开源TensorRT-LLM,支持10+模型

新智元报道编辑:桃子 润【新智元导读】H100让模型推理性能最高跃升8倍!英伟达最新开源软件TensorRT-LLM,将彻底改变LLM推理现状。「GPU贫民」即将告别困境...
阅读原文
12