AI项目和框架

MME-CoT

MME-CoT 是香港中文大学（深圳）、香港中文大学、字节跳动、南京大学、上海人工智能实验室、宾夕法尼亚大学、清华大学等机构共同推出的用于评估大型多模态模...

阅读原文

AI工具

1年前 (2025)

Claude 3.7 Sonnet

Claude 3.7 Sonnet 是 Anthropic 公司推出的全球首款混合推理模型，具备“标准模式”和“扩展思考模式”两种运行方式。标准模式下，Claude 3.7 Sonnet能快速生成...

阅读原文

AI工具

1年前 (2025)

DeepEP

DeepEP 是 DeepSeek 开源的首个专为混合专家模型（MoE）训练和推理设计的开源 EP（专家并行）通信库。提供了高吞吐量和低延迟的全对全 GPU 内核，支持节点内...

阅读原文

AI工具

1年前 (2025)

QwQ-Max

QwQ-Max是阿里巴巴基于Qwen2.5-Max推出的深度推理模型，是 Qwen 系列的一部分。QwQ-Max-Preview作为预览版本推出，QwQ-Max即将正式发布并全面开源。QwQ-Max专...

阅读原文

AI工具

1年前 (2025)

FantasyID

FantasyID 是阿里巴巴集团和北京邮电大学推出新型的身份保持视频生成（IPT2V）框架，基于增强人脸知识生成高质量的身份一致视频。FantasyID基于扩散变换器（D...

阅读原文

AI工具

1年前 (2025)

SigStyle

SigStyle 是吉林大学、南京大学智能科学与技术学院及Adobe推出的新型签名风格迁移框架，支持将单张风格图像中独特的视觉特征（如几何结构、色彩搭配、笔触等...

阅读原文

AI工具

1年前 (2025)

GRUtopia 2.0

GRUtopia 2.0（桃源2.0）是上海人工智能实验室发布的通用具身智能仿真平台。平台在GRUtopia 1.0的基础上进行了全面升级，具备三大核心创新：通用模块化框架、...

阅读原文

AI工具

1年前 (2025)

BioMedGPT-R1

BioMedGPT-R1 是清华大学AI产业研究院（AIR）与北京水木分子生物科技有限公司联合推出的升级版多模态生物医药开源大模型。BioMedGPT-R1基于 DeepSeek R1 技术...

阅读原文

AI工具

1年前 (2025)

SigLIP 2

SigLIP 2 是Google DeepMind 提出先进的多语言视觉-语言模型，是 SigLIP 的升级版本，提升图像与文本之间的对齐能力。通过改进的训练方法和架构，显著增强了...

阅读原文

AI工具

1年前 (2025)

AvatarGO

AvatarGO 是南洋理工大学S-Lab、上海 AI Lab，香港大学联合推出的新型框架，用在从文本输入直接生成可动画化的 4D 人体与物体交互场景。通过零样本（zero-sho...

阅读原文

AI工具

1年前 (2025)

Moonlight-16B-A3B

Moonlight-16B-A3B 是 Moonshot AI 推出的新型 Mixture-of-Expert (MoE) 模型，具有 160 亿总参数和 30 亿激活参数。模型使用了优化后的 Muon 优化器进行训练...

阅读原文

AI工具

1年前 (2025)

FlashMLA

FlashMLA 是 DeepSeek 开源的针对 NVIDIA Hopper 架构 GPU 优化的高效 MLA（Multi-Head Linear Attention）解码内核，专为处理可变长度序列设计。通过优化 KV...

阅读原文

AI工具

1年前 (2025)

MagicArticulate

MagicArticulate 是南洋理工大学和字节跳动Seed实验室推出的自动将静态 3D 模型转换为可动画化资产的框架。MagicArticulate基于自回归生成骨架，预测蒙皮权重...

阅读原文

AI工具

1年前 (2025)

TANGLED

TANGLED是上海科技大学、Deemos Technology和华中科技大学联合推出的3D发型生成方法，支持从任意风格和视角的图像中生成高质量的3D发丝。TANGLED基于三个核心...

阅读原文

AI工具

1年前 (2025)

Llasa TTS

Llasa TTS 是香港科技大学基于 LLaMA 架构推出的开源文本转语音（TTS）模型，支持高质量语音合成和克隆。Llasa TTS 基于单层向量量化（VQ）编解码器和单个 Tr...

阅读原文

AI工具

1年前 (2025)

1…110 111112113 114…196