AI项目和框架

DeepSpeed-MII

DeepSpeed-MII 是 DeepSpeed 团队开源的 Python 库,提供高效模型推理。DeepSpeed-MII用阻塞 KV 缓存、连续批处理和动态 SplitFuse 等创新手段,显著提高推理...
阅读原文

Earth-2

NVIDIA Earth-2 是英伟达推出的全球首套完全开源的 AI 气象预测模型家族,基于 Atlas、StormScope、HealDA 三大核心架构,分别实现 15 天全球中期预报、0-6 ...
阅读原文

Lucy 2

Lucy 2.0 是 Decart AI推出的实时世界转换模型,支持让高保真视频编辑从离线渲染跃升为可交互的实时体验。
阅读原文

DeepSeek-OCR 2

DeepSeek-OCR 2 是 DeepSeek 团队推出的第二代 OCR 模型,通过引入 DeepEncoder V2 架构,实现从固定扫描到语义推理的范式转变。模型采用因果流查询和双流注...
阅读原文

Vidu Q2参考生Pro

Vidu Q2参考生Pro是全球首创的「万物可参考」视频模型,模型通过支持多模态输入(2个视频和4张图片),为创作者提供强大的功能。
阅读原文

LingBot-Depth

LingBot-Depth 是蚂蚁灵波科技开源的高精度空间感知模型,专为解决机器人在透明、反光物体(如玻璃)场景下的深度感知难题设计。
阅读原文

Kimi K2.5

Kimi K2.5 是月之暗面开源的全新一代全能旗舰模型,模型基于约 15T 视觉与文本数据训练而成,具备顶尖的代码生成、视觉理解能力,支持自主 Agent 集群协作,...
阅读原文

白虎-VTouch

白虎-VTouch是国家地方共建人形机器人创新中心联合纬钛机器人开源的全球首个最大规模跨本体视触觉多模态数据集。数据集包含视触觉传感器数据、RGB-D数据、关...
阅读原文

TensorRT LLM

TensorRT LLM 是 NVIDIA 推出的优化大型语言模型(LLM)在 NVIDIA GPU 上的推理性能框架。TensorRT LLM 基于 PyTorch 架构,提供高效易于使用的 Python API,...
阅读原文

Qwen3-Max-Thinking

Qwen3-Max-Thinking是阿里最新推出的千问旗舰推理模型,参数量超1万亿,预训练数据达36T Tokens。模型通过测试时扩展机制和强化学习,显著提升推理性能和效率...
阅读原文

SGLang

SGLang 是开源的高性能大型语言模型和多模态模型推理框架。框架提供低延迟、高吞吐量的推理服务,支持从单个 GPU 到大规模分布式集群的部署。
阅读原文

vLLM

vLLM 是加州大学伯克利分校 Sky Computing Lab 开源的大语言模型(LLM)推理和部署框架,支持为用户提供快速、低成本的模型服务。vLLM 通过创新的内存管理技...
阅读原文

混元图像3.0图生图

混元图像3.0图生图模型(HunyuanImage 3.0-Instruct)是腾讯推出的先进图像生成与编辑模型。模型基于80B参数的混合专家(MoE)架构,能深度理解用户输入的图...
阅读原文

D4RT

D4RT(Dynamic 4D Reconstruction and Tracking)是谷歌 DeepMind 推出的动态 4D 重建模型。模型通过统一的「时空查询」接口,将 3D 重建、相机追踪和动态物...
阅读原文

FlowAct-R1

FlowAct-R1是字节跳动推出的实时交互数字人视频生成框架,仅需单张参考图和音频,支持流式生成无限时长的全身动态视频。
阅读原文
123168