Parse4ai 文档

功能特性

解析模式

Parse4ai 提供不同的解析模式以满足您的需求。

模型版本

Pipeline 模式（默认）

标准解析管线
支持 OCR、公式和表格识别
适用于一般文档解析

VLM 模式

基于视觉语言模型的解析
对文档结构有更深入的理解
适用于复杂版式

解析选项

OCR（光学字符识别）

为扫描文档或图片格式启用 OCR。

公式识别

从文档中提取和识别数学公式。

表格识别

检测并提取表格，保持结构完整性。

语言支持

指定文档语言以提高准确性（默认：中文）。

页码范围

使用页码范围语法解析特定页面：

"1-5"：第 1 页到第 5 页
"2,4-6"：第 2 页、第 4 页至第 6 页
"2--2"：从第 2 页到倒数第二页

支持的文件类型

支持的文档格式

输出格式

解析文档的可用输出格式

目录

Pipeline 模式（默认）

OCR（光学字符识别）