AI项目和框架
DeepSpeed-MII
DeepSpeed-MII 是 DeepSpeed 团队开源的 Python 库,提供高效模型推理。DeepSpeed-MII用阻塞 KV 缓存、连续批处理和动态 SplitFuse 等创新手段,显著提高推理...
DeepSeek-OCR 2
DeepSeek-OCR 2 是 DeepSeek 团队推出的第二代 OCR 模型,通过引入 DeepEncoder V2 架构,实现从固定扫描到语义推理的范式转变。模型采用因果流查询和双流注...
TensorRT LLM
TensorRT LLM 是 NVIDIA 推出的优化大型语言模型(LLM)在 NVIDIA GPU 上的推理性能框架。TensorRT LLM 基于 PyTorch 架构,提供高效易于使用的 Python API,...
Qwen3-Max-Thinking
Qwen3-Max-Thinking是阿里最新推出的千问旗舰推理模型,参数量超1万亿,预训练数据达36T Tokens。模型通过测试时扩展机制和强化学习,显著提升推理性能和效率...
混元图像3.0图生图
混元图像3.0图生图模型(HunyuanImage 3.0-Instruct)是腾讯推出的先进图像生成与编辑模型。模型基于80B参数的混合专家(MoE)架构,能深度理解用户输入的图...
粤公网安备 44011502001135号