AI项目和框架

VidSketch

VidSketch 是浙江大学 CAD&CG 国家重点实验室和软件学院推出的创新视频生成框架，根据手绘草图和简单文本提示生成高质量的视频动画。VidSketch基于“层级...

阅读原文

AI工具

1年前 (2025)

Baichuan-Audio

Baichuan-Audio是百川智能推出的端到端音频大语言模型，支持无缝集成音频理解和生成功能，实现支持高质量、可控的实时中英双语对话。Baichuan-Audio基于多码...

阅读原文

AI工具

1年前 (2025)

SongGen

SongGen是上海AI Lab、北京航空航天大学和香港中文大学推出的单阶段自回归Transformer模型，用在从文本生成歌曲。SongGen基于歌词和描述性文本（如乐器、风格...

阅读原文

AI工具

1年前 (2025)

CorrDiff

CorrDiff 是 NVIDIA 推出的生成式 AI 模型，用于将低分辨率的全球天气数据下采样为高分辨率数据，提高天气预测的准确性和效率。采用两步法处理数据：首先通过...

阅读原文

AI工具

1年前 (2025)

Smallpond

Smallpond是DeepSeek推出的基于 DuckDB 和 3FS 构建的轻量级数据处理框架，专为高性能和大规模数据处理设计。Smallpond支持处理 PB 级数据集，借助 DuckDB 的...

阅读原文

AI工具

1年前 (2025)

GPT-4.5

GPT-4.5 是 OpenAI 推出的最新大型语言模型，是目前规模最大、性能最强的聊天模型。基于扩展无监督学习，提升模式识别、知识广度和创意生成能力，减少了幻觉...

阅读原文

AI工具

1年前 (2025)

3FS

3FS（Fire-Flyer File System）是DeepSeek推出的高性能分布式文件系统，专为AI训练和推理任务设计。3FS用现代SSD和RDMA网络技术，基于分离式架构聚合数千个SS...

阅读原文

AI工具

1年前 (2025)

Profiling Data

PProfiling Data是DeepSeek开源的训练和推理框架的性能分析数据，基于PyTorch Profiler捕获的程序运行过程中的详细信息，用在分析和优化软件性能。

阅读原文

AI工具

1年前 (2025)

Phi-4-Multimodal

Phi-4-Multimodal 是微软最新推出的多模态语言模型，拥有 56 亿参数，能将语音、视觉和文本处理集成到一个统一架构中。模型在多个基准测试中表现优异，在自动...

阅读原文

AI工具

1年前 (2025)

R1-Onevision

R1-Onevision 是开源的多模态大语言模型，专注于复杂视觉推理任务。基于 Qwen2.5-VL 微调而成，通过整合视觉和文本数据，能精准地进行多模态信息解释。在数学...

阅读原文

AI工具

1年前 (2025)

Phi-4-Mini

Phi-4-Mini 是微软 Phi-4 系列中最新推出的专注于文本任务的小型语言模型，参数量为 38 亿。基于密集的解码器-only Transformer 架构，结合分组查询注意力（G...

阅读原文

AI工具

1年前 (2025)

IndexTTS

IndexTTS 是 B 站推出的工业级可控文本转语音（TTS）系统。基于 XTTS 和 Tortoise 模型开发，结合了 GPT 风格的生成技术，能将文本高效转化为自然流畅的语音...

阅读原文

AI工具

1年前 (2025)

VideoGrain

VideoGrain 是悉尼科技大学和浙江大学推出的零样本多粒度视频编辑框架，能实现类别级、实例级和部件级的精细视频修改。VideoGrain基于调节时空交叉注意力和自...

阅读原文

AI工具

1年前 (2025)

腾讯混元Turbo S

腾讯混元Turbo S是腾讯推出的新一代快思考模型。模型采用创新的Hybrid-Mamba-Transformer融合架构，有效降低了传统Transformer的计算复杂度，减少了KV-Cache...

阅读原文

AI工具

1年前 (2025)

DualPipe

DualPipe 是DeepSeek开源的创新的双向流水线并行技术，主要用于提升大规模深度学习模型的训练效率。核心思想是将模型的训练过程分为两个独立的管道——前向计算...

阅读原文

AI工具

1年前 (2025)

1…108 109110111 112…196