MinerU 完整介绍（OpenDataLab 开源文档解析工具，内置 PaddleOCR）-港品优选

MinerU 完整介绍（OpenDataLab 开源文档解析工具，内置 PaddleOCR）

出品方：上海人工智能实验室 OpenDataLab（书生・浦语团队）开源免费项目，主打复杂文档结构化解析，专门服务 RAG 知识库、学术论文、合同扫描件、教材 PDF 处理CSDN博...。
名称含义：Mine Value from Documents —— 挖掘文档数据价值。
核心定位：一站式多模态文档提取工具，把 PDF/Word/PPT/ 扫描图片转成标准Markdown/JSON机器可读格式；内置优化版 PP-OCRv5 作为底层文字识别引擎，完美衔接你正在学习的 PaddleOCR稀土掘金。
开源地址：GitHub/Giteeopendatalab/MinerU，支持商用无闭源限制。

完整 4 步处理链路：

版面布局检测：ViTDet/SwinTransformer 模型，区分标题、段落、表格、图片、公式、页眉页脚；
OCR 文字识别（核心依赖 PaddleOCR）内置深度优化 PP-OCRv5，原生支持109 种语言，中文 / 中英混排、竖排、扫描件专项优化；自动区分「可复制文字 PDF」和「图片扫描 PDF」，扫描件自动启用 OCR 流程；
专项元素解析
- 表格：集成 TableMaster 模型，输出完整 markdown 表格；
- 公式：Unimernet 模型