1
1
<div align =" center " >
2
2
<p >
3
- <a href="https://paddlepaddle.github.io/PaddleOCR/latest/en/index.html" target="_blank">
4
3
<img width="100%" src="./docs/images/Banner_cn.png" alt="PaddleOCR Banner"></a>
5
4
</p >
6
5
7
6
<!-- language -->
8
- [ English] ( ./README_en.md ) | 简体中文| [ 日本語] ( ./README_ja.md )
7
+ 中文 | [ English] ( ./README_en.md ) | [ 日本語] ( ./README_ja.md )
9
8
10
9
<!-- icon -->
11
10
27
26
PaddleOCR自发布以来凭借学术前沿算法和产业落地实践,受到了产学研各方的喜爱,并被广泛应用于众多知名开源项目,例如:Umi-OCR、OmniParser、MinerU、RAGFlow等,已成为广大开发者心中的开源OCR领域的首选工具。2025年5月20日,飞桨团队发布** PaddleOCR 3.0** ,全面适配** 飞桨框架3.0正式版** ,进一步** 提升文字识别精度** ,支持** 多文字类型识别** 和** 手写体识别** ,满足大模型应用对** 复杂文档高精度解析** 的旺盛需求,结合** 文心大模型4.5 Turbo** 显著提升关键信息抽取精度,并新增** 对昆仑芯、昇腾等国产硬件** 的支持。
28
27
29
28
PaddleOCR 3.0** 新增** 三大特色能力::
30
- - 🖼️全场景文字识别模型 [ PP-OCRv5] ( docs/version3.x/algorithm/PP-OCRv5/PP-OCRv5.md ) :单模型支持五种文字类型和复杂手写体识别;整体识别精度相比上一代** 提升13个百分点** 。
31
- - 🧮 通用文档解析方案[ PP-StructureV3] ( docs/version3.x/algorithm/PP-StructureV3/PP-StructureV3.md ) :支持多场景、多版式 PDF 高精度解析,在公开评测集中** 领先众多开源和闭源方案** 。
32
- - 📈 智能文档理解方案[ PP-ChatOCRv4] ( docs/version3.x/algorithm/PP-ChatOCRv4/PP-ChatOCRv4.md ) :原生支持文心大模型4.5 Turbo,精度相比上一代** 提升15个百分点** 。
29
+ - 全场景文字识别模型 [ PP-OCRv5] ( docs/version3.x/algorithm/PP-OCRv5/PP-OCRv5.md ) :单模型支持五种文字类型和复杂手写体识别;整体识别精度相比上一代** 提升13个百分点** 。
30
+ - 通用文档解析方案[ PP-StructureV3] ( docs/version3.x/algorithm/PP-StructureV3/PP-StructureV3.md ) :支持多场景、多版式 PDF 高精度解析,在公开评测集中** 领先众多开源和闭源方案** 。
31
+ - 智能文档理解方案[ PP-ChatOCRv4] ( docs/version3.x/algorithm/PP-ChatOCRv4/PP-ChatOCRv4.md ) :原生支持文心大模型4.5 Turbo,精度相比上一代** 提升15个百分点** 。
33
32
34
33
PaddleOCR 3.0除了提供优秀的模型库外,还提供好学易用的工具,覆盖模型训练、推理和服务化部署,方便开发者快速落地AI应用。
35
34
<div align =" center " >
36
35
<p >
37
- <a href="https://paddlepaddle.github.io/PaddleOCR/latest/en/index.html" target="_blank">
38
36
<img width="100%" src="./docs/images/Arch_cn.png" alt="PaddleOCR Architecture"></a>
39
37
</p >
40
38
</div >
@@ -74,21 +72,19 @@ PaddleOCR 3.0除了提供优秀的模型库外,还提供好学易用的工具
74
72
</details >
75
73
76
74
## ⚡ 快速开始
77
- ### 1. 在线体验无需安装
75
+ ### 1. 在线体验
78
76
[ ![ AI Studio] ( https://img.shields.io/badge/PP_OCRv5-AI_Studio-green )] ( https://aistudio.baidu.com/community/app/91660/webUI )
79
77
[ ![ AI Studio] ( https://img.shields.io/badge/PP_StructureV3-AI_Studio-green )] ( https://aistudio.baidu.com/community/app/518494/webUI )
80
78
[ ![ AI Studio] ( https://img.shields.io/badge/PP_ChatOCRv4-AI_Studio-green )] ( https://aistudio.baidu.com/community/app/518493/webUI )
81
79
82
- ### 2. 本地安装指南
80
+ ### 2. 本地安装
83
81
84
- 首先, 请参考[ 安装指南] ( https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/develop/install/pip/linux-pip.html ) 完成** PaddlePaddle 3.0** 的安装。
82
+ 请参考[ 安装指南] ( https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/develop/install/pip/linux-pip.html ) 完成** PaddlePaddle 3.0** 的安装。
85
83
86
- 然后, 安装paddleocr
84
+ 安装paddleocr
87
85
``` bash
88
- # 1. 安装 paddleocr
86
+ # 安装 paddleocr
89
87
pip install paddleocr
90
- # 2. 安装完毕后自检
91
- paddleocr --version
92
88
```
93
89
94
90
### 3. 命令行方式推理
@@ -99,7 +95,7 @@ paddleocr ocr -i https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_im
99
95
# 运行 PP-StructureV3 推理
100
96
paddleocr PP-StructureV3 -i https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/pp_structure_v3_demo.png
101
97
102
- # 运行 PP-ChatOCRv4 推理
98
+ # 运行 PP-ChatOCRv4 推理前,需要先获得千帆KPI Key
103
99
paddleocr pp_chatocrv4_doc -i https://paddle-model-ecology.bj.bcebos.com/paddlex/imgs/demo_image/vehicle_certificate-1.png -k 驾驶室准乘人数 --qianfan_api_key your_api_key
104
100
105
101
# 查看 "paddleocr ocr" 详细参数
@@ -240,40 +236,42 @@ print(chat_result)
240
236
241
237
</details >
242
238
239
+ [ 进阶指南] ( )
240
+
243
241
### 5. ** 国产化硬件支持**
244
242
- [ 昆仑芯安装指南] ( https://paddlepaddle.github.io/PaddleOCR/latest/version3.x/other_devices_support/paddlepaddle_install_XPU.html )
245
243
- [ 昇腾安装指南] ( https://paddlepaddle.github.io/PaddleOCR/latest/version3.x/other_devices_support/paddlepaddle_install_NPU.html )
246
244
247
- ## 😃 使用 PaddleOCR 的优秀项目
248
- 💗 PaddleOCR 的发展离不开社区贡献!衷心感谢所有开发者、合作伙伴与贡献者!
249
- | 项目名称 | 简介 |
250
- | ------------ | ----------- |
251
- | [ RAGFlow] ( https://github.com/infiniflow/ragflow ) <a href =" https://github.com/infiniflow/ragflow " ><img src =" https://img.shields.io/github/stars/infiniflow/ragflow " ></a >| 基于RAG的AI工作流引擎|
252
- | [ MinerU] ( https://github.com/opendatalab/MinerU ) <a href =" https://github.com/opendatalab/MinerU " ><img src =" https://img.shields.io/github/stars/opendatalab/MinerU " ></a >| 多类型文档转换Markdown工具|
253
- | [ Umi-OCR] ( https://github.com/hiroi-sora/Umi-OCR ) <a href =" https://github.com/hiroi-sora/Umi-OCR " ><img src =" https://img.shields.io/github/stars/hiroi-sora/Umi-OCR " ></a >| 开源批量离线OCR软件|
254
- | [ OmniParser] ( https://github.com/microsoft/OmniParser ) <a href =" https://github.com/microsoft/OmniParser " ><img src =" https://img.shields.io/github/stars/microsoft/OmniParser " ></a > | 基于纯视觉的GUI智能体屏幕解析工具|
255
- | [ QAnything] ( https://github.com/netease-youdao/QAnything ) <a href =" https://github.com/netease-youdao/QAnything " ><img src =" https://img.shields.io/github/stars/netease-youdao/QAnything " ></a > | 基于任意内容的问答系统|
256
- | [ PDF-Extract-Kit] ( https://github.com/opendatalab/PDF-Extract-Kit ) <a href =" https://github.com/opendatalab/PDF-Extract-Kit " ><img src =" https://img.shields.io/github/stars/opendatalab/PDF-Extract-Kit " ></a >| 高效复杂PDF文档提取工具包|
257
- | [ Dango-Translator] ( https://github.com/PantsuDango/Dango-Translator ) <a href =" https://github.com/PantsuDango/Dango-Translator " ><img src =" https://img.shields.io/github/stars/PantsuDango/Dango-Translator " ></a > | 屏幕实时翻译工具|
258
- | [ 更多项目] ( ./awesome_projects.md ) | [ 基于 PaddleOCR 的扩展项目] ( ./awesome_projects.md ) |
259
245
260
- ## 🔄 快速一览运行效果
246
+
247
+ ## 🔄 效果展示
261
248
262
249
<div align =" center " >
263
250
<p >
264
- <a href="https://paddlepaddle.github.io/PaddleOCR/latest/en/index.html" target="_blank">
265
- <img width="100%" src="./docs/images/demo.gif" alt="PP-OCRv5 Demo"></a>
251
+ <img width="100%" src="./docs/images/demo.gif" alt="PP-OCRv5 Demo"></a>
266
252
</p >
267
253
</div >
268
254
269
255
<div align =" center " >
270
256
<p >
271
- <a href="https://paddlepaddle.github.io/PaddleOCR/latest/en/index.html" target="_blank">
272
257
<img width="100%" src="./docs/images/blue_v3.gif" alt="PP-StructureV3 Demo"></a>
273
258
</p >
274
259
</div >
275
260
276
261
## 👩👩👧👦 开发者社区
277
262
263
+ ## 😃 使用 PaddleOCR 的优秀项目
264
+ 💗 PaddleOCR 的发展离不开社区贡献!衷心感谢所有开发者、合作伙伴与贡献者!
265
+ | 项目名称 | 简介 |
266
+ | ------------ | ----------- |
267
+ | [ RAGFlow] ( https://github.com/infiniflow/ragflow ) <a href =" https://github.com/infiniflow/ragflow " ><img src =" https://img.shields.io/github/stars/infiniflow/ragflow " ></a >| 基于RAG的AI工作流引擎|
268
+ | [ MinerU] ( https://github.com/opendatalab/MinerU ) <a href =" https://github.com/opendatalab/MinerU " ><img src =" https://img.shields.io/github/stars/opendatalab/MinerU " ></a >| 多类型文档转换Markdown工具|
269
+ | [ Umi-OCR] ( https://github.com/hiroi-sora/Umi-OCR ) <a href =" https://github.com/hiroi-sora/Umi-OCR " ><img src =" https://img.shields.io/github/stars/hiroi-sora/Umi-OCR " ></a >| 开源批量离线OCR软件|
270
+ | [ OmniParser] ( https://github.com/microsoft/OmniParser ) <a href =" https://github.com/microsoft/OmniParser " ><img src =" https://img.shields.io/github/stars/microsoft/OmniParser " ></a > | 基于纯视觉的GUI智能体屏幕解析工具|
271
+ | [ QAnything] ( https://github.com/netease-youdao/QAnything ) <a href =" https://github.com/netease-youdao/QAnything " ><img src =" https://img.shields.io/github/stars/netease-youdao/QAnything " ></a > | 基于任意内容的问答系统|
272
+ | [ PDF-Extract-Kit] ( https://github.com/opendatalab/PDF-Extract-Kit ) <a href =" https://github.com/opendatalab/PDF-Extract-Kit " ><img src =" https://img.shields.io/github/stars/opendatalab/PDF-Extract-Kit " ></a >| 高效复杂PDF文档提取工具包|
273
+ | [ Dango-Translator] ( https://github.com/PantsuDango/Dango-Translator ) <a href =" https://github.com/PantsuDango/Dango-Translator " ><img src =" https://img.shields.io/github/stars/PantsuDango/Dango-Translator " ></a > | 屏幕实时翻译工具|
274
+ | [ 更多项目] ( ./awesome_projects.md ) | |
275
+
278
276
## 📄 许可协议
279
277
本项目采用 [ Apache 2.0 协议] ( ./LICENSE ) 开源发布。
0 commit comments