图像识别 - OpenI

图像识别

LongCat开放平台

LongCat开放平台是美团LongCat团队推出的大模型API服务平台，基于全自研 MoE 架构（Zero-Computation Experts + Shortcut-connected MoE），为用户提供高效、稳定且安全的AI服务。

腾讯觅影

“腾讯觅影”是腾讯公司推出的一款人工智能医疗影像平台，利用人工智能技术，如图像识别、深度学习和大数据处理，为医疗机构提供智能影像诊断和辅助诊断服务。

EVEAI XYZ提供便捷的AI图像生成服务，支持多种模型，高效创作个性化图像。

Graydient AI

Graydient AI提供强大的AI图像和视频生成工具，支持无限创作并提供优质客户支持和云存储。

Dreamlike Art

Dreamlike Art提供免费AI绘画服务，支持多种模型，快速生成高质量艺术作品。

朱雀大模型AI生成图像检测

朱雀大模型检测，精准识别AI生成图像，助力内容真实性鉴别。

Qwen2.5-VL 是一款强大的视觉语言模型，能够理解图像和视频内容并生成相应文本。

OmniParser-v2.0

OmniParser 是一款通用屏幕解析工具，可将 UI 截图转换为结构化格式，提升基于 LLM 的 UI 代理性能。

Google CameraTrapAI

由 Google 训练的 AI 模型，用于对野生动物相机陷阱图像中的物种进行分类。

多模态大模型赋能个人和企业，提供全方位AI解决方案。

智谱AI绘画

智谱AI绘画，提供个性化图像创作与编辑，支持多种艺术风格模仿。

Image to excel

将图片中的表格和文本准确转换为Excel文件的AI工具

DocLayout-YOLO

通过多样化合成数据和全局到局部自适应感知增强文档布局分析

多模态AI开发助手

一个由moondream创建的Hugging Face Space，用于展示注视点相关技术

一款通过生活场景学习日语的APP。

Ollama OCR for web

一个强大的OCR包，使用最先进的视觉语言模型提取图像中的文本。

Electronic-Component-Sorter

AI驱动的电子元件分类器，智能组件管理的终极解决方案。

将图像转换成结构化的Markdown文档

Florence-VL

视觉语言模型增强工具，结合生成式视觉编码器和深度广度融合技术。

InternVL2_5-38B

先进的多模态大型语言模型系列

InternViT-6B-448px-V2_5

基于InternViT-6B-448px-V1-5的增强版视觉模型

Kimi视觉思考模型k1

基于强化学习技术的视觉思考模型，理科测试行业领先

Megrez-3B-Omni

端侧全模态理解开源模型

DeepSeek-VL2-Tiny

先进的大型混合专家视觉语言模型

AnyParser Pro

AnyParser Pro 是一款能够快速准确地从 PDF、PPT 和图像中提取内容的大型语言模型。

AI驱动的视觉搜索引擎，探索视觉故事。

ChatsNow：ChatGPT, Claude SideBar(GPT- 4,Web)

智能助手，基于OpenAI GPT-4和GPT-3.5技术，提供聊天、翻译、图像识别等服务

Torii Image Translator

浏览器插件，一键翻译网页上的图片文字。

一站式OCR代理，快速从图像中生成洞见。

Joy Caption Alpha One

基于人工智能的图像描述生成器

They See Your Photos

揭示照片背后的故事和隐私信息

12 3 4