AI项目和框架 - 第 47 页

KoalaQA

KoalaQA 是AI大模型驱动的开源售后服务社区，支持智能问答、语义搜索和自动运营等功能。KoalaQA 能帮助团队实现 7×24 小时服务，显著降低人工成本，提升客户...

阅读原文

AI工具

8个月前

DeepSeek-OCR

DeepSeek-OCR 是 DeepSeek 团队推出的视觉语言模型，专注于通过光学压缩技术高效处理长文本内容。模型由 DeepEncoder 编码器和 DeepSeek3B-MoE 解码器组成，...

阅读原文

AI工具

8个月前

Dexter

Dexter 是自主金融研究智能代理（Agent），专为处理复杂金融问题而设计。工具能将复杂查询分解为清晰的分步骤研究计划，通过实时市场数据进行分析。

阅读原文

AI工具

8个月前

PaddleOCR-VL

PaddleOCR-VL是百度飞桨团队开源的多模态文档解析模型，参数量仅0.9B，专为低算力设备优化。在国际权威评测OmnidocBench V1.5中以92.6分登顶全球第一，超越GP...

阅读原文

AI工具

8个月前

Coral NPU

Coral NPU 是谷歌推出的全栈开源AI平台，专为低功耗边缘设备（如智能手表、AR 眼镜等）设计，能解决性能、碎片化和隐私三大挑战。Coral NPU基于 RISC-V 指令...

阅读原文

AI工具

8个月前

LongCat-Audio-Codec

LongCat-Audio-Codec 是美团 LongCat 团队开源的语音编解码方案，专为语音大语言模型（Speech LLM）设计。通过语义和声学双 Token 并行提取机制，兼顾语音的...

阅读原文

AI工具

8个月前

RTFM

RTFM（Real-Time Frame Model）是李飞飞团队推出的实时生成式世界模型。模型能在单块H100 GPU上运行，实时生成3D场景，支持持久交互。

阅读原文

AI工具

8个月前

UniPixel

UniPixel是香港理工大学和腾讯ARC Lab团队开发的首个统一像素级多模态大模型，专注于图像/视频的精细理解与交互。能在单个模型中完成对象指代、像素级分割和...

阅读原文

AI工具

8个月前

豆包语音2.0

豆包语音2.0是字节跳动推出的升级版语音合成模型，包含两大核心模型：豆包语音合成模型2.0（Doubao-Seed-TTS 2.0）和豆包声音复刻模型2.0（Doubao-Seed-ICL 2...

阅读原文

AI工具

8个月前

豆包大模型1.6 lite

豆包大模型1.6 Lite（Doubao-Seed-1.6-lite）是字节跳动推出的轻量级人工智能模型。模型相比旗舰版豆包1.6更轻量、推理速度更快，性价比更高。

阅读原文

AI工具

8个月前

DiaMoE-TTS

DiaMoE-TTS 是清华大学和巨人网络联合推出的多方言语音合成（TTS）框架。框架基于国际音标（IPA）统一输入体系，结合方言感知的 Mixture-of-Experts（MoE）架...

阅读原文

AI工具

8个月前

Claude Haiku 4.5

Claude Haiku 4.5 是 Anthropic 公司最新推出的高性能、低成本的小型 AI 模型。模型在编码性能上与之前的旗舰模型 Claude Sonnet 4 相当，且在某些任务中表现...

阅读原文

AI工具

8个月前

Pyscn

Pyscn 是专为 Python 开发者设计的智能代码质量分析工具，帮助开发者快速发现并清理代码中的问题，如死代码、重复代码、复杂代码结构等。通过控制流图（CFG）...

阅读原文

AI工具

8个月前

Local-NotebookLM

Local-NotebookLM 是开源的本地 AI 工具，能将 PDF 文档转换为引人入胜的音频内容，如播客、访谈、辩论等。支持多种输出格式和内容风格，用户可以根据需求选...

阅读原文

AI工具

8个月前

FS-DFM

FS-DFM（Few-Step Discrete Flow-Matching）是苹果联合俄亥俄州立大学推出的用在快速生成长文本的扩散语言模型。

阅读原文

AI工具

8个月前