# paddleocr识别PDF **Repository Path**: welightyear/paddleocr ## Basic Information - **Project Name**: paddleocr识别PDF - **Description**: 本仓库专注于利用 PaddleOCR 实现 PDF 文档的高效文字识别功能。PaddleOCR 是百度基于飞桨(PaddlePaddle)框架开源的全场景文字识别工具,支持多语言、多场景、高精度的 OCR 能力。它覆盖文本检测、识别、方向分类等全流程,广泛应用于文档扫描、票据处理等场景。 在本仓库中,我们通过将 PDF 转换为图像,再利用 PaddleOCR 对图像进行文字识别,从而实现对 PDF - **Primary Language**: Unknown - **License**: Apache-2.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 3 - **Forks**: 0 - **Created**: 2024-06-28 - **Last Updated**: 2025-12-15 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README [English](README_en.md) | 简体中文 | [हिन्दी](./doc/doc_i18n/README_हिन्द.md) | [日本語](./doc/doc_i18n/README_日本語.md) | [한국인](./doc/doc_i18n/README_한국어.md) | [Pу́сский язы́к](./doc/doc_i18n/README_Ру́сский_язы́к.md)
## 简介 PaddleOCR 旨在打造一套丰富、领先、且实用的 OCR 工具库,助力开发者训练出更好的模型,并应用落地。