AI项目和框架

AipexBase

AipexBase 是中国首个开源的 AI 原生后端服务(Backend-as-a-Service)平台,由北京跨赴科技(KuaFuAI)自主研发。
阅读原文

VitaBench

VitaBench 是美团 LongCat 团队发布的面向复杂问题的大模型智能体评测基准。以外卖点餐、餐厅就餐、旅游出行等高频生活场景为载体,构建了包含66个工具的交互...
阅读原文

KoalaQA

KoalaQA 是AI大模型驱动的开源售后服务社区,支持智能问答、语义搜索和自动运营等功能。KoalaQA 能帮助团队实现 7×24 小时服务,显著降低人工成本,提升客户...
阅读原文

DeepSeek-OCR

DeepSeek-OCR 是 DeepSeek 团队推出的视觉语言模型,专注于通过光学压缩技术高效处理长文本内容。模型由 DeepEncoder 编码器和 DeepSeek3B-MoE 解码器组成,...
阅读原文

Dexter

Dexter 是自主金融研究智能代理(Agent),专为处理复杂金融问题而设计。工具能将复杂查询分解为清晰的分步骤研究计划,通过实时市场数据进行分析。
阅读原文

PaddleOCR-VL

PaddleOCR-VL是百度飞桨团队开源的多模态文档解析模型,参数量仅0.9B,专为低算力设备优化。在国际权威评测OmnidocBench V1.5中以92.6分登顶全球第一,超越GP...
阅读原文

Coral NPU

Coral NPU 是谷歌推出的全栈开源AI平台,专为低功耗边缘设备(如智能手表、AR 眼镜等)设计,能解决性能、碎片化和隐私三大挑战。Coral NPU基于 RISC-V 指令...
阅读原文

LongCat-Audio-Codec

LongCat-Audio-Codec 是美团 LongCat 团队开源的语音编解码方案,专为语音大语言模型(Speech LLM)设计。通过语义和声学双 Token 并行提取机制,兼顾语音的...
阅读原文

RTFM

RTFM(Real-Time Frame Model)是李飞飞团队推出的实时生成式世界模型。模型能在单块H100 GPU上运行,实时生成3D场景,支持持久交互。
阅读原文

UniPixel

UniPixel是香港理工大学和腾讯ARC Lab团队开发的首个统一像素级多模态大模型,专注于图像/视频的精细理解与交互。能在单个模型中完成对象指代、像素级分割和...
阅读原文

豆包语音2.0

豆包语音2.0是字节跳动推出的升级版语音合成模型,包含两大核心模型:豆包语音合成模型2.0(Doubao-Seed-TTS 2.0)和豆包声音复刻模型2.0(Doubao-Seed-ICL 2...
阅读原文

豆包大模型1.6 lite

豆包大模型1.6 Lite(Doubao-Seed-1.6-lite)是字节跳动推出的轻量级人工智能模型。模型相比旗舰版豆包1.6更轻量、推理速度更快,性价比更高。
阅读原文

DiaMoE-TTS

DiaMoE-TTS 是清华大学和巨人网络联合推出的多方言语音合成(TTS)框架。框架基于国际音标(IPA)统一输入体系,结合方言感知的 Mixture-of-Experts(MoE)架...
阅读原文

Claude Haiku 4.5

Claude Haiku 4.5 是 Anthropic 公司最新推出的高性能、低成本的小型 AI 模型。模型在编码性能上与之前的旗舰模型 Claude Sonnet 4 相当,且在某些任务中表现...
阅读原文

Pyscn

Pyscn 是专为 Python 开发者设计的智能代码质量分析工具,帮助开发者快速发现并清理代码中的问题,如死代码、重复代码、复杂代码结构等。通过控制流图(CFG)...
阅读原文
11415161718166