标签:数据提取

Browser Operator

Browser Operator 是 Opera 浏览器推出的 AI 驱动的智能代理工具,通过自然语言指令帮助用户更高效地完成网页浏览任务。用户只需输入简单的指令,如“购买商品...
阅读原文

Mistral OCR

Mistral OCR 是 Mistral AI 推出的先进光学字符识别(OCR)工具,专为处理复杂文档而设计。能全面理解文档中的文本、图像、表格和数学公式等元素,支持数千种...
阅读原文

olmOCR

olmOCR 是 Ai2 推出的开源工具,用在将 PDF 文档高效转换为干净的结构化纯文本。olmOCR结合文档锚定(document-anchoring)技术与Qwen2-VL-7B-Instruct(阿里...
阅读原文

Vision Parse

Vision Parse是开源的PDF文档转换工具,基于视觉语言模型(Vision LLMs)将PDF文件转换成Markdown格式。Vision Parse能智能识别和提取PDF中的文本和表格,且...
阅读原文

AniDoc

AniDoc是香港科技大学、蚂蚁集团、南京大学、浙江大学和香港大学共同推出的简化2D动画上色AI模型,基于视频扩散模型自动将草图序列转换成彩色动画,遵循参考...
阅读原文

AskYourPDF

AskYourPDF是一个AI驱动的PDF文档处理工具,支持用户通过自然语言查询与PDF文件进行交互,快速检索和提取信息。用户可以上传文档至其数据库,通过提问获得即...
阅读原文

parsio

Parsio是基于自然语言处理技术,AI驱动的文档解析工具,能从PDF、电子邮件和其他文档中自动提取结构化数据。平台提供PDF解析器和OCR功能,支持多种文档类型,...
阅读原文