标签:多维数据处理

DeepGEMM

DeepGEMM是DeepSeek开源的为高效简洁的FP8矩阵乘法(GEMM)设计的库,目前仅支持NVIDIA Hopper张量核心。DeepGEMM支持普通和混合专家(MoE)分组的GEMM操作,...
阅读原文

Gemini 2.0 Flash Thinking:探索谷歌最新实验性推理模型的核心特性与应用潜力

Gemini 2.0 Flash Thinking是谷歌推出的实验性AI模型,能快速思考和解决问题。Gemini 2.0 Flash Thinking展示详细的思考过程,与OpenAI的o1模型不同,Gemini ...
阅读原文