# paddleocr_table_pdf_demo **Repository Path**: michah/paddleocr_table_pdf_demo ## Basic Information - **Project Name**: paddleocr_table_pdf_demo - **Description**: 本文档提供一个**从图像识别表格 → 生成结构化 JSON → 导出美观 PDF** 的完整流程,使用 **PaddleOCR v3.2.0** 进行表格识别,结合 **ReportLab** 实现高保真 PDF 输出 - **Primary Language**: Unknown - **License**: Apache-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2025-10-30 - **Last Updated**: 2025-10-31 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README ## 第一步 安装 PaddleOCR ``` python -m pip install --upgrade pip pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple # 安装 PaddlePaddle CPU 版本 python -m pip install paddlepaddle==3.2.0 -i https://www.paddlepaddle.org.cn/packages/stable/cpu/ # 安装 PyMuPDF、Pillow、ReportLab、tqdm python -m pip install PyMuPDF Pillow reportlab tqdm # 安装 PaddleOCR 指定版本 python -m pip install paddleocr==3.2.0 ``` ## 第二步 运行代码 ``` python table.py ``` # 第三步 执行结果 ``` python demo.py ```