Nvidia B100/B200/GB200 关键技术解读

AIGC动态1年前 (2024)发布人工智能学家

AIGC动态欢迎阅读

原标题：Nvidia B100/B200/GB200 关键技术解读
关键字：芯片,内存,晶体管,带宽,精度
文章来源：人工智能学家
内容字数：3627字

内容摘要：

对GTC keynote中关于AI基础设施的关键信息整理如下，分三个部分：
芯片
服务器
Superpod
芯片
1. GPU芯片
晶体管数：
B200 GPU的晶体管数量是现有H100的两倍多，但B200封装了2080亿个晶体管（而H100/H200上‍为800亿个‍）。
这意味着B200芯片封装密度比H100进一步提高，对管理散热和功耗也提出了更高的要求。
FP4精度：
引入一种新的计算精度，位宽比FP8进一步降低，B200峰值算力达18P。
FP6精度：
‍‍位宽介于FP4和FP8之间。‍
‍NV高带宽接口（Nvidia High Bandwidth Interface）：
‍B200有两个Die，高速连接通道NV-HBI达到10TB/s。两个Die是一个统一的Cuda GPU。NV-HBI会占用一定的芯片面积。‍
内存：
‍B200每个Die有4个24GB的HBM3e stack，合计一个Cuda GPU有192GB内存，内存带宽达8TB/s。相比H200时代六个内存控制器，可以减少内存接口的芯片面积，从而使得计算面积可以更大。‍
GB200：
‍有两个B200（4个GPU D