AI工具

dots.ocr

dots.ocr 是小红书 hi lab 开源的多语言文档布局解析模型。模型基于 17 亿参数的视觉语言模型(VLM),能统一进行布局检测和内容识别,同时保持良好的阅读顺序。
阅读原文

DispatchMail

DispatchMail 是开源的、本地运行的 AI 邮件助手,支持通过AI技术自动化收件箱管理。工具能实时监控邮件,用 OpenAI 的 AI Agent根据用户自定义的提示词对邮...
阅读原文

Kimi K2 高速版

Kimi K2 高速版(kimi-k2-turbo-preview)是月之暗面Kimi推出的高性能语言模型,继承 Kimi K2 的强大功能,模型参数保持一致,在输出速度上有显著提升,从每...
阅读原文

FLUX.1 Krea [dev]

FLUX.1 Krea [dev] 是 Black Forest Labs 与 Krea AI 合作推出的最新文本到图像生成模型,支持生成更逼真、更多样化的图像,实现照片级真实感水平。
阅读原文

Qwen3-Coder-Flash

Qwen3-Coder-Flash 是阿里通义千问团队推出的高性能编程模型,全称 Qwen3-Coder-30B-A3B-Instruct。模型具备卓越的 Agentic 能力,擅长代理式编程、工具调用...
阅读原文

Wide Research

Wide Research 是 Manus 平台推出的基础构建功能,支持通过系统级并行处理机制和智能体协作协议,支持上百个通用智能体(Agent)同时工作,帮助用户高效处理...
阅读原文

Seed Diffusion

Seed Diffusion是字节跳动Seed团队推出的实验性扩散语言模型,专注于代码生成任务。模型通过两阶段扩散训练、约束顺序学习和强化高效并行解码等关键技术,实...
阅读原文

即梦数字人

即梦数字人是字节跳动旗下即梦AI推出的AI数字人视频生成工具。用户只需上传一张人物图片和一段音频,可快速生成与音频内容同步的动态数字人视频。核心技术是...
阅读原文

abogen

abogen 是强大的文本转语音工具,支持将 ePub、PDF 或文本文件快速转换为高质量音频,能生成同步字幕。abogen 基于 Kokoro-82M 模型,支持多种语言和语音风格...
阅读原文

Ollama 桌面版

Ollama 桌面版是Ollama推出的本地模型AI对话工具,让用户更便捷地与各种大模型进行对话,支持文件拖放功能,用户可以轻松地将文本或PDF文件拖入应用中,方便...
阅读原文

PodClips

PodClips 是专为播客创作者设计的智能工具,能将播客内容自动转化为适合社交媒体传播的短视频。通过人工智能技术,一键将音频或视频内容剪辑为精彩的短视频片...
阅读原文

Creao.ai

Creao.ai 是专注于人工智能应用开发的创新平台,将用户的创意快速转化为功能完备的 AI 原生应用程序。用户无需编写代码可实现复杂的功能,极大地降低了开发门...
阅读原文

Rustic AI

Rustic AI 是专注于设计领域的 AI 平台,通过人工智能技术帮助用户快速生成和编辑高质量的图像。为电商卖家、创作者、营销人员和设计师等提供了定制化的解决...
阅读原文

Qwen3-30B-A3B-Thinking-2507

Qwen3-30B-A3B-Thinking-2507 是阿里通义开源的推理模型,专为复杂推理任务设计。模型拥有305亿参数,其中33亿被激活,支持256K原生上下文长度,能扩展至1M t...
阅读原文

氢离子

氢离子是阿里健康推出的医学AI助手,提供医学文献搜索,支持通过AI技术辅助用户进行文献精读、翻译、总结和问答。应用收录千万级医学核心期刊文献、超万篇权...
阅读原文
134567254