AI项目和框架
DeepSeek-OCR
DeepSeek-OCR 是 DeepSeek 团队推出的视觉语言模型,专注于通过光学压缩技术高效处理长文本内容。模型由 DeepEncoder 编码器和 DeepSeek3B-MoE 解码器组成,...
PaddleOCR-VL
PaddleOCR-VL是百度飞桨团队开源的多模态文档解析模型,参数量仅0.9B,专为低算力设备优化。在国际权威评测OmnidocBench V1.5中以92.6分登顶全球第一,超越GP...
LongCat-Audio-Codec
LongCat-Audio-Codec 是美团 LongCat 团队开源的语音编解码方案,专为语音大语言模型(Speech LLM)设计。通过语义和声学双 Token 并行提取机制,兼顾语音的...
豆包大模型1.6 lite
豆包大模型1.6 Lite(Doubao-Seed-1.6-lite)是字节跳动推出的轻量级人工智能模型。模型相比旗舰版豆包1.6更轻量、推理速度更快,性价比更高。
DiaMoE-TTS
DiaMoE-TTS 是清华大学和巨人网络联合推出的多方言语音合成(TTS)框架。框架基于国际音标(IPA)统一输入体系,结合方言感知的 Mixture-of-Experts(MoE)架...
Claude Haiku 4.5
Claude Haiku 4.5 是 Anthropic 公司最新推出的高性能、低成本的小型 AI 模型。模型在编码性能上与之前的旗舰模型 Claude Sonnet 4 相当,且在某些任务中表现...
粤公网安备 44011502001135号