标签：文本识别

WPS接入DeepSeek，秒变办公神器！

WPS 大家经常用来日常写作，虽然本身提供了AI功能，但可惜需要会员，本文教你三分钟接入最火的DeepSeek，让WPS秒变办公神器。 DeepSeek API申请地址：http:/...

阅读原文

AI教程

1年前 (2025)

AI赚钱副业~AI生成影视解说，半个月涨粉变现3.5W+！

这两年大家都在感叹生活不易，然而我想说的是，机会还是有的，但问题不在于有没有，而在于你是否能够认准机会，然后抓住它。接触过很多咨询项目的人，发现...

使用教程

2年前 (2024)

PP-OCRv6

PP-OCRv6 是百度飞桨 PaddleOCR 团队推出的第六代开源 OCR 模型，首次推出 Tiny（1.5M）、Small（7.7M）、Medium（34.5M）三档模型，覆盖从浏览器端到服务器...

阅读原文

AI工具

2个月前

阿里JVS Claw实测

最近这些天，身边的朋友都在讨论怎么“养虾”。大家口中的“虾”，其实是近期爆火的 AI Agent 框架 OpenClaw，一个24 小时待命的 AI 助理。试问谁不想拥有一...

阅读原文

AI教程

5个月前

Mistral OCR

Mistral OCR 是 Mistral AI 推出的先进光学字符识别（OCR）工具，专为处理复杂文档而设计。能全面理解文档中的文本、图像、表格和数学公式等元素，支持数千种...

阅读原文

AI工具

1年前 (2025)

olmOCR

olmOCR 是 Ai2 推出的开源工具，用在将 PDF 文档高效转换为干净的结构化纯文本。olmOCR结合文档锚定（document-anchoring）技术与Qwen2-VL-7B-Instruct（阿里...

阅读原文

AI工具

1年前 (2025)

什么是光学字符识别（Optical Character Recognition, OCR）

光学字符识别（Optical Character Recognition，OCR）是一种将文本图像转换为机器可读格式的技术。通过自动数据提取，能快速识别扫描文档、相机图像和图像PDF...

阅读原文

AI百科

2年前 (2024)

Text Behind Image：在角色背后插入文字标题

Text Behind Image是开源的在线工具，支持用户在图片中的角色背后添加文字，创建具有视觉冲击力的海报和社交媒体图像。用户在图像中的主体背后添加自定义文本...

阅读原文

AI工具

2年前 (2024)

GOT-OCR2.0

GOT-OCR 2.0是一种先进的光学字符识别（OCR）模型，推动OCR技术进入2.0时代。GOT-OCR 2.0端到端的模型由高压缩编码器和长上下文解码器组成，能处理包括文本、...

阅读原文

AI工具

2年前 (2024)

PaddleOCR 2.9

PaddleOCR 2.9是由百度飞桨（PaddlePaddle）推出的一款开源光学字符识别（OCR）工具库。提供丰富的算法和模型，支持多种语言识别，提供数据标注和合成工具。P...

阅读原文

AI工具

2年前 (2024)

Manga Translator

Manga Translator是Chrome浏览器扩展程序，能帮助用户快速翻译漫画中的对话框文字。工具基于AI技术，支持将漫画、扫描和图像翻译成135种以上不同的语言（包括...

阅读原文

AI工具

2年前 (2024)