标签:尾数

万字综述:全面梳理 FP8 训练和推理技术

大模型时代最火AI芯片峰会来啦!!9月6-7日,由智猩猩联合主办的2024全球AI芯片峰会将在北京举行。峰会设有数据中心AI芯片、智算集群技术论坛等7大板块。目前...
阅读原文

推倒万亿参数大模型内存墙!万字长文:从第一性原理看神经网络量化

新智元报道编辑:桃子 好困 【新智元导读】为了应对大模型不断复杂的推理和训练,英伟达、AMD、英特尔、谷歌、微软、Meta、Arm、高通、MatX以及Lemurian Labs...
阅读原文