AI工具

Coral NPU

Coral NPU 是谷歌推出的全栈开源AI平台,专为低功耗边缘设备(如智能手表、AR 眼镜等)设计,能解决性能、碎片化和隐私三大挑战。Coral NPU基于 RISC-V 指令...
阅读原文

Seekario

Seekario 是专注于提升求职效率的 AI 平台。平台通过智能技术为求职者提供从简历优化到面试准备的全方位支持,帮助用户快速打造专业简历,精准匹配职位需求,...
阅读原文

LongCat-Audio-Codec

LongCat-Audio-Codec 是美团 LongCat 团队开源的语音编解码方案,专为语音大语言模型(Speech LLM)设计。通过语义和声学双 Token 并行提取机制,兼顾语音的...
阅读原文

Manus 1.5

Manus 1.5 是Manus最新推出的强大 AI Agent系统,全面提升任务执行的速度、可靠性和质量。Manus 1.5基于全新架构,任务完成时间从 15 分钟缩短到不到 4 分钟...
阅读原文

Mentorbook

Mentorbook 是 AI 驱动的个性化编程学习平台,帮助用户从编程新手成长为高手。平台通过 AI 技术根据用户的学习目标、水平和风格,定制专属学习路线,涵盖 Pyt...
阅读原文

RTFM

RTFM(Real-Time Frame Model)是李飞飞团队推出的实时生成式世界模型。模型能在单块H100 GPU上运行,实时生成3D场景,支持持久交互。
阅读原文

Percify

Percify 是强大的 AI 数字人生成平台,专注于创建逼真的虚拟形象(avatar)视频内容。用户上传一张人脸图片和音频,通过简单的文字描述,能生成具有自然表情...
阅读原文

UniPixel

UniPixel是香港理工大学和腾讯ARC Lab团队开发的首个统一像素级多模态大模型,专注于图像/视频的精细理解与交互。能在单个模型中完成对象指代、像素级分割和...
阅读原文

豆包语音2.0

豆包语音2.0是字节跳动推出的升级版语音合成模型,包含两大核心模型:豆包语音合成模型2.0(Doubao-Seed-TTS 2.0)和豆包声音复刻模型2.0(Doubao-Seed-ICL 2...
阅读原文

豆包大模型1.6 lite

豆包大模型1.6 Lite(Doubao-Seed-1.6-lite)是字节跳动推出的轻量级人工智能模型。模型相比旗舰版豆包1.6更轻量、推理速度更快,性价比更高。
阅读原文

DiaMoE-TTS

DiaMoE-TTS 是清华大学和巨人网络联合推出的多方言语音合成(TTS)框架。框架基于国际音标(IPA)统一输入体系,结合方言感知的 Mixture-of-Experts(MoE)架...
阅读原文

Claude Haiku 4.5

Claude Haiku 4.5 是 Anthropic 公司最新推出的高性能、低成本的小型 AI 模型。模型在编码性能上与之前的旗舰模型 Claude Sonnet 4 相当,且在某些任务中表现...
阅读原文

Pyscn

Pyscn 是专为 Python 开发者设计的智能代码质量分析工具,帮助开发者快速发现并清理代码中的问题,如死代码、重复代码、复杂代码结构等。通过控制流图(CFG)...
阅读原文

Local-NotebookLM

Local-NotebookLM 是开源的本地 AI 工具,能将 PDF 文档转换为引人入胜的音频内容,如播客、访谈、辩论等。支持多种输出格式和内容风格,用户可以根据需求选...
阅读原文

FS-DFM

FS-DFM(Few-Step Discrete Flow-Matching)是苹果联合俄亥俄州立大学推出的用在快速生成长文本的扩散语言模型。
阅读原文
12345279