14
14
</p >
15
15
16
16
## 简介
17
- PaddleOCR 旨在打造一套丰富、领先、且实用的 OCR 工具库,助力开发者训练出更好的模型,并应用落地。
18
-
19
- <div align =" center " >
20
- <img src="./doc/imgs_results/ch_ppocr_mobile_v2.0/test_add_91.jpg" width="800">
21
- </div >
22
17
23
- <div align =" center " >
24
- <img src="./doc/imgs_results/ch_ppocr_mobile_v2.0/00006737.jpg" width="800">
25
- </div >
18
+ PaddleOCR 旨在打造一套丰富、领先、且实用的 OCR 工具库,助力开发者训练出更好的模型,并应用落地。
26
19
27
20
## 🚀 社区
21
+
28
22
PaddleOCR 由 [ PMC] ( https://github.com/PaddlePaddle/PaddleOCR/issues/12122 ) 监督。Issues 和 PRs 将在尽力的基础上进行审查。欲了解 PaddlePaddle 社区的完整概况,请访问 [ community] ( https://github.com/PaddlePaddle/community ) 。
29
23
30
24
⚠️注意:[ Issues] ( https://github.com/PaddlePaddle/PaddleOCR/issues ) 模块仅用来报告程序🐞Bug,其余提问请移步[ Discussions] ( https://github.com/PaddlePaddle/PaddleOCR/discussions ) 模块提问。如所提Issue不是Bug,会被移到Discussions模块,敬请谅解。
31
25
32
- ## 📣 近期更新
26
+ ## 📣 近期更新( [ more ] ( https://paddlepaddle.github.io/PaddleOCR/update.html ) )
33
27
34
28
- ** 🔥2024.7 添加 PaddleOCR 算法模型挑战赛冠军方案** :
35
29
- 赛题一:OCR 端到端识别任务冠军方案——[ 场景文本识别算法-SVTRv2] ( doc/doc_ch/algorithm_rec_svtrv2.md ) ;
36
30
- 赛题二:通用表格识别任务冠军方案——[ 表格识别算法-SLANet-LCNetV2] ( doc/doc_ch/algorithm_table_slanet.md ) 。
37
31
38
32
- ** 💥2024.6.27 飞桨低代码开发工具 [ PaddleX 3.0] ( https://github.com/paddlepaddle/paddlex ) 重磅更新!**
39
- - 低代码开发范式:支持 OCR 模型全流程低代码开发,提供 Python API,支持用户自定义串联模型;
40
- - 多硬件训推支持:支持英伟达 GPU、昆仑芯、昇腾和寒武纪等多种硬件进行模型训练与推理。PaddleOCR支持的模型见 [ 模型列表] ( doc/doc_ch/hardware/supported_models.md )
33
+ - 低代码开发范式:支持 OCR 模型全流程低代码开发,提供 Python API,支持用户自定义串联模型;
34
+ - 多硬件训推支持:支持英伟达 GPU、昆仑芯、昇腾和寒武纪等多种硬件进行模型训练与推理。PaddleOCR支持的模型见 [ 模型列表] ( doc/doc_ch/hardware/supported_models.md )
41
35
42
- - ** 📚直播和OCR实战打卡营预告 ** :《PP-ChatOCRv2赋能金融报告信息智能化抽取,新金融效率再升级》课程上线,破解复杂版面、表格识别、信息抽取OCR解析难题,直播时间:6月6日(周四)19:00。并于6月11日启动【政务采购合同信息抽取】实战打卡营。报名链接: https://www.wjx.top/vm/eBcYmqO.aspx?udsid=197406
36
+ ## 📚文档
43
37
44
- - ** 🔥2024.5.10 上线星河零代码产线(OCR 相关)** :全面覆盖了以下四大 OCR 核心任务,提供极便捷的 Badcase 分析和实用的在线体验:
45
- - [ 通用 OCR] ( https://aistudio.baidu.com/community/app/91660 ) (PP-OCRv4)。
46
- - [ 通用表格识别] ( https://aistudio.baidu.com/community/app/91661 ) (SLANet)。
47
- - [ 通用图像信息抽取] ( https://aistudio.baidu.com/community/app/91662 ) (PP-ChatOCRv2-common)。
48
- - [ 文档场景信息抽取] ( https://aistudio.baidu.com/community/app/70303 ) (PP-ChatOCRv2-doc)。
49
-
50
- 同时采用了 ** [ 全新的场景任务开发范式] ( https://aistudio.baidu.com/pipeline/mine ) ** ,将模型统一汇聚,实现训练部署的零代码开发,并支持在线服务化部署和导出离线服务化部署包。
51
-
52
- - ** 🔥2023.8.7 发布 PaddleOCR [ release/2.7] ( https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.7 ) **
53
- - 发布[ PP-OCRv4] ( ./doc/doc_ch/PP-OCRv4_introduction.md ) ,提供 mobile 和 server 两种模型
54
- - PP-OCRv4-mobile:速度可比情况下,中文场景效果相比于 PP-OCRv3 再提升 4.5%,英文场景提升 10%,80 语种多语言模型平均识别准确率提升 8%以上
55
- - PP-OCRv4-server:发布了目前精度最高的 OCR 模型,中英文场景上检测模型精度提升 4.9%, 识别模型精度提升 2%
56
- 可参考[ 快速开始] ( ./doc/doc_ch/quickstart.md ) 一行命令快速使用,同时也可在飞桨 AI 套件(PaddleX)中的[ 通用 OCR 产业方案] ( https://aistudio.baidu.com/aistudio/modelsdetail?modelId=286 ) 中低代码完成模型训练、推理、高性能部署全流程
57
- - 🔨** 2022.11 新增实现[ 4 种前沿算法] ( doc/doc_ch/algorithm_overview.md ) ** :文本检测 [ DRRG] ( doc/doc_ch/algorithm_det_drrg.md ) , 文本识别 [ RFL] ( doc/doc_ch/algorithm_rec_rfl.md ) , 文本超分[ Text Telescope] ( doc/doc_ch/algorithm_sr_telescope.md ) ,公式识别[ CAN] ( doc/doc_ch/algorithm_rec_can.md )
58
- - ** 2022.10 优化[ JS 版 PP-OCRv3 模型] ( ./deploy/paddlejs/README_ch.md ) ** :模型大小仅 4.3M,预测速度提升 8 倍,配套 web demo 开箱即用
59
- - ** 💥 直播回放:PaddleOCR 研发团队详解 PP-StructureV2 优化策略** 。微信扫描[ 下方二维码] ( #开源社区 ) ,关注公众号并填写问卷后进入官方交流群,获取直播回放链接与 20G 重磅 OCR 学习大礼包(内含 PDF 转 Word 应用程序、10 种垂类模型、《动手学 OCR》电子书等)
60
- - ** 🔥2022.8.24 发布 PaddleOCR [ release/2.6] ( https://github.com/PaddlePaddle/PaddleOCR/tree/release/2.6 ) **
61
- - 发布[ PP-StructureV2] ( ./ppstructure/README_ch.md ) ,系统功能性能全面升级,适配中文场景,新增支持[ 版面复原] ( ./ppstructure/recovery/README_ch.md ) ,支持** 一行命令完成 PDF 转 Word** ;
62
- - [ 版面分析] ( ./ppstructure/layout/README_ch.md ) 模型优化:模型存储减少 95%,速度提升 11 倍,平均 CPU 耗时仅需 41ms;
63
- - [ 表格识别] ( ./ppstructure/table/README_ch.md ) 模型优化:设计 3 大优化策略,预测耗时不变情况下,模型精度提升 6%;
64
- - [ 关键信息抽取] ( ./ppstructure/kie/README_ch.md ) 模型优化:设计视觉无关模型结构,语义实体识别精度提升 2.8%,关系抽取精度提升 9.1%。
65
- - 🔥** 2022.8 发布 [ OCR 场景应用集合] ( ./applications ) ** :包含数码管、液晶屏、车牌、高精度 SVTR 模型、手写体识别等** 9 个垂类模型** ,覆盖通用,制造、金融、交通行业的主要 OCR 垂类应用。
66
-
67
- > [ 更多] ( ./doc/doc_ch/update.md )
38
+ 完整文档请移步:[ docs] ( https://paddlepaddle.github.io/PaddleOCR/ )
68
39
69
40
## 🌟 特性
70
41
@@ -74,185 +45,33 @@ PaddleOCR 由 [PMC](https://github.com/PaddlePaddle/PaddleOCR/issues/12122) 监
74
45
<img src="https://raw.githubusercontent.com/tink2123/test/master/ppocrv4.png">
75
46
</div >
76
47
77
- > 上述内容的使用方法建议从文档教程中的快速开始体验
78
-
79
-
80
48
## ⚡ 快速开始
81
49
82
50
- 在线免费体验:
83
- - PP-OCRv4 在线体验地址:https://aistudio.baidu.com/community/app/91660
84
- - SLANet 在线体验地址:https://aistudio.baidu.com/community/app/91661
85
- - PP-ChatOCRv2-common 在线体验地址:https://aistudio.baidu.com/community/app/91662
86
- - PP-ChatOCRv2-doc 在线体验地址:https://aistudio.baidu.com/community/app/70303
51
+ - PP-OCRv4 在线体验地址:< https://aistudio.baidu.com/community/app/91660 >
52
+ - SLANet 在线体验地址:< https://aistudio.baidu.com/community/app/91661 >
53
+ - PP-ChatOCRv2-common 在线体验地址:< https://aistudio.baidu.com/community/app/91662 >
54
+ - PP-ChatOCRv2-doc 在线体验地址:< https://aistudio.baidu.com/community/app/70303 >
87
55
88
56
- 一行命令快速使用:[ 快速开始(中英文/多语言/文档分析)] ( ./doc/doc_ch/quickstart.md )
89
57
- 移动端 demo 体验:[ 安装包 DEMO 下载地址] ( https://ai.baidu.com/easyedge/app/openSource?from=paddlelite ) (基于 EasyEdge 和 Paddle-Lite, 支持 iOS 和 Android 系统)
90
58
91
59
## 📖 技术交流合作
92
60
93
- - 飞桨低代码开发工具 PaddleX 官方交流频道:https://aistudio.baidu.com/community/channel/610
61
+ - 飞桨低代码开发工具 PaddleX 官方交流频道:< https://aistudio.baidu.com/community/channel/610 >
94
62
95
63
## 📚《动手学 OCR》电子书
96
- - [ 《动手学 OCR》电子书] ( ./doc/doc_ch/ocr_book.md )
97
-
98
- ## 🛠️ PP-OCR 系列模型列表(更新中)
99
-
100
- | 模型简介 | 模型名称 | 推荐场景 | 检测模型 | 方向分类器 | 识别模型 |
101
- | ------------------------------------- | ----------------------- | --------------- | ------------------------------------------------------------ | ------------------------------------------------------------ | ------------------------------------------------------------ |
102
- | 中英文超轻量 PP-OCRv4 模型(15.8M) | ch_PP-OCRv4_xx | 移动端&服务器端 | [ 推理模型] ( https://paddleocr.bj.bcebos.com/PP-OCRv4/chinese/ch_PP-OCRv4_det_infer.tar ) / [ 训练模型] ( https://paddleocr.bj.bcebos.com/PP-OCRv4/chinese/ch_PP-OCRv4_det_train.tar ) | [ 推理模型] ( https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar ) / [ 训练模型] ( https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_train.tar ) | [ 推理模型] ( https://paddleocr.bj.bcebos.com/PP-OCRv4/chinese/ch_PP-OCRv4_rec_infer.tar ) / [ 训练模型] ( https://paddleocr.bj.bcebos.com/PP-OCRv4/chinese/ch_PP-OCRv4_rec_train.tar ) |
103
- | 中英文超轻量 PP-OCRv3 模型(16.2M) | ch_PP-OCRv3_xx | 移动端&服务器端 | [ 推理模型] ( https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tar ) / [ 训练模型] ( https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_distill_train.tar ) | [ 推理模型] ( https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar ) / [ 训练模型] ( https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_train.tar ) | [ 推理模型] ( https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_infer.tar ) / [ 训练模型] ( https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_rec_train.tar ) |
104
- | 英文超轻量 PP-OCRv3 模型(13.4M) | en_PP-OCRv3_xx | 移动端&服务器端 | [ 推理模型] ( https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_det_infer.tar ) / [ 训练模型] ( https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_det_distill_train.tar ) | [ 推理模型] ( https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_infer.tar ) / [ 训练模型] ( https://paddleocr.bj.bcebos.com/dygraph_v2.0/ch/ch_ppocr_mobile_v2.0_cls_train.tar ) | [ 推理模型] ( https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_rec_infer.tar ) / [ 训练模型] ( https://paddleocr.bj.bcebos.com/PP-OCRv3/english/en_PP-OCRv3_rec_train.tar ) |
105
-
106
- - 超轻量 OCR 系列更多模型下载(包括多语言),可以参考[ PP-OCR 系列模型下载] ( ./doc/doc_ch/models_list.md ) ,文档分析相关模型参考[ PP-Structure 系列模型下载] ( ./ppstructure/docs/models_list.md )
107
-
108
- ### PaddleOCR 场景应用模型
109
-
110
- | 行业 | 类别 | 亮点 | 文档说明 | 模型下载 |
111
- | ---- | ------------ | ---------------------------------- | ------------------------------------------------------------ | --------------------------------------------- |
112
- | 制造 | 数码管识别 | 数码管数据合成、漏识别调优 | [ 光功率计数码管字符识别] ( ./applications/光功率计数码管字符识别/光功率计数码管字符识别.md ) | [ 下载链接] ( ./applications/README.md#模型下载 ) |
113
- | 金融 | 通用表单识别 | 多模态通用表单结构化提取 | [ 多模态表单识别] ( ./applications/多模态表单识别.md ) | [ 下载链接] ( ./applications/README.md#模型下载 ) |
114
- | 交通 | 车牌识别 | 多角度图像处理、轻量模型、端侧部署 | [ 轻量级车牌识别] ( ./applications/轻量级车牌识别.md ) | [ 下载链接] ( ./applications/README.md#模型下载 ) |
115
-
116
- - 更多制造、金融、交通行业的主要 OCR 垂类应用模型(如电表、液晶屏、高精度 SVTR 模型等),可参考[ 场景应用模型下载] ( ./applications )
117
-
118
- ## 📖 文档教程
119
-
120
- - [ 运行环境准备] ( ./doc/doc_ch/environment.md )
121
- - [ PP-OCR 文本检测识别🔥] ( ./doc/doc_ch/ppocr_introduction.md )
122
- - [ 快速开始] ( ./doc/doc_ch/quickstart.md )
123
- - [ 模型库] ( ./doc/doc_ch/models_list.md )
124
- - [ 模型训练] ( ./doc/doc_ch/training.md )
125
- - [ 文本检测] ( ./doc/doc_ch/detection.md )
126
- - [ 文本识别] ( ./doc/doc_ch/recognition.md )
127
- - [ 文本方向分类器] ( ./doc/doc_ch/angle_class.md )
128
- - 模型压缩
129
- - [ 模型量化] ( ./deploy/slim/quantization/README.md )
130
- - [ 模型裁剪] ( ./deploy/slim/prune/README.md )
131
- - [ 知识蒸馏] ( ./doc/doc_ch/knowledge_distillation.md )
132
- - [ 推理部署] ( ./deploy/README_ch.md )
133
- - [ 基于 Python 预测引擎推理] ( ./doc/doc_ch/inference_ppocr.md )
134
- - [ 基于 C++预测引擎推理] ( ./deploy/cpp_infer/readme_ch.md )
135
- - [ 服务化部署] ( ./deploy/pdserving/README_CN.md )
136
- - [ 端侧部署] ( ./deploy/lite/readme.md )
137
- - [ Paddle2ONNX 模型转化与预测] ( ./deploy/paddle2onnx/readme_ch.md )
138
- - [ 云上飞桨部署工具] ( ./deploy/paddlecloud/README.md )
139
- - [ Benchmark] ( ./doc/doc_ch/benchmark.md )
140
- - [ PP-Structure 文档分析🔥] ( ./ppstructure/README_ch.md )
141
- - [ 快速开始] ( ./ppstructure/docs/quickstart.md )
142
- - [ 模型库] ( ./ppstructure/docs/models_list.md )
143
- - [ 模型训练] ( ./doc/doc_ch/training.md )
144
- - [ 版面分析] ( ./ppstructure/layout/README_ch.md )
145
- - [ 表格识别] ( ./ppstructure/table/README_ch.md )
146
- - [ 关键信息提取] ( ./ppstructure/kie/README_ch.md )
147
- - [ 推理部署] ( ./deploy/README_ch.md )
148
- - [ 基于 Python 预测引擎推理] ( ./ppstructure/docs/inference.md )
149
- - [ 基于 C++预测引擎推理] ( ./deploy/cpp_infer/readme_ch.md )
150
- - [ 服务化部署] ( ./deploy/hubserving/readme.md )
151
- - [ 前沿算法与模型🚀] ( ./doc/doc_ch/algorithm_overview.md )
152
- - [ 文本检测算法] ( ./doc/doc_ch/algorithm_overview.md )
153
- - [ 文本识别算法] ( ./doc/doc_ch/algorithm_overview.md )
154
- - [ 端到端 OCR 算法] ( ./doc/doc_ch/algorithm_overview.md )
155
- - [ 表格识别算法] ( ./doc/doc_ch/algorithm_overview.md )
156
- - [ 关键信息抽取算法] ( ./doc/doc_ch/algorithm_overview.md )
157
- - [ 使用 PaddleOCR 架构添加新算法] ( ./doc/doc_ch/add_new_algorithm.md )
158
- - [ 场景应用] ( ./applications )
159
- - 数据标注与合成
160
- - [ 半自动标注工具 PPOCRLabel] ( https://github.com/PFCCLab/PPOCRLabel/blob/main/README_ch.md )
161
- - [ 数据合成工具 Style-Text] ( https://github.com/PFCCLab/StyleText/blob/main/README_ch.md )
162
- - [ 其它数据标注工具] ( ./doc/doc_ch/data_annotation.md )
163
- - [ 其它数据合成工具] ( ./doc/doc_ch/data_synthesis.md )
164
- - 数据集
165
- - [ 通用中英文 OCR 数据集] ( doc/doc_ch/dataset/datasets.md )
166
- - [ 手写中文 OCR 数据集] ( doc/doc_ch/dataset/handwritten_datasets.md )
167
- - [ 垂类多语言 OCR 数据集] ( doc/doc_ch/dataset/vertical_and_multilingual_datasets.md )
168
- - [ 版面分析数据集] ( doc/doc_ch/dataset/layout_datasets.md )
169
- - [ 表格识别数据集] ( doc/doc_ch/dataset/table_datasets.md )
170
- - [ 关键信息提取数据集] ( doc/doc_ch/dataset/kie_datasets.md )
171
- - [ 代码组织结构] ( ./doc/doc_ch/tree.md )
172
- - [ 效果展示] ( #效果展示 )
173
- - [ 《动手学 OCR》电子书📚] ( ./doc/doc_ch/ocr_book.md )
174
- - [ 开源社区] ( #开源社区 )
175
- - FAQ
176
- - [ 通用问题] ( ./doc/doc_ch/FAQ.md )
177
- - [ PaddleOCR 实战问题] ( ./doc/doc_ch/FAQ.md )
178
- - [ 参考文献] ( ./doc/doc_ch/reference.md )
179
- - [ 许可证书] ( #许可证书 )
180
-
181
-
182
- <a name =" 效果展示 " ></a >
183
-
184
- ## 👀 效果展示 [ more] ( ./doc/doc_ch/visualization.md )
185
-
186
- <details open >
187
- <summary >PP-OCRv3 中文模型</summary >
188
-
189
- <div align =" center " >
190
- <img src="doc/imgs_results/PP-OCRv3/ch/PP-OCRv3-pic001.jpg" width="800">
191
- <img src="doc/imgs_results/PP-OCRv3/ch/PP-OCRv3-pic002.jpg" width="800">
192
- <img src="doc/imgs_results/PP-OCRv3/ch/PP-OCRv3-pic003.jpg" width="800">
193
- </div >
194
-
195
- </details >
196
-
197
-
198
- <details open >
199
- <summary >PP-OCRv3 英文模型</summary >
200
64
201
- <div align =" center " >
202
- <img src="doc/imgs_results/PP-OCRv3/en/en_1.png" width="800">
203
- <img src="doc/imgs_results/PP-OCRv3/en/en_2.png" width="800">
204
- </div >
205
-
206
- </details >
207
-
208
-
209
- <details open >
210
- <summary >PP-OCRv3 多语言模型</summary >
211
-
212
- <div align =" center " >
213
- <img src="doc/imgs_results/PP-OCRv3/multi_lang/japan_2.jpg" width="800">
214
- <img src="doc/imgs_results/PP-OCRv3/multi_lang/korean_1.jpg" width="800">
215
- </div >
65
+ - [ 《动手学 OCR》电子书] ( https://paddlepaddle.github.io/PaddleOCR/ppocr/blog/ocr_book.html )
216
66
217
- </ details >
67
+ ## 贡献者
218
68
219
- <details open >
220
- <summary >PP-Structure 文档分析</summary >
69
+ <a href =" https://github.com/PaddlePaddle/PaddleOCR/graphs/contributors " >
70
+ <img src =" https://contrib.rocks/image?repo=PaddlePaddle/PaddleOCR&max=400&columns=20 " />
71
+ </a >
221
72
222
- - 版面分析+表格识别
223
- <div align =" center " >
224
- <img src="./ppstructure/docs/table/ppstructure.GIF" width="800">
225
- </div >
226
-
227
- - SER(语义实体识别)
228
- <div align =" center " >
229
- <img src="https://user-images.githubusercontent.com/14270174/185310636-6ce02f7c-790d-479f-b163-ea97a5a04808.jpg" width="600">
230
- </div >
231
-
232
- <div align =" center " >
233
- <img src="https://user-images.githubusercontent.com/14270174/185539517-ccf2372a-f026-4a7c-ad28-c741c770f60a.png" width="600">
234
- </div >
235
-
236
- <div align =" center " >
237
- <img src="https://user-images.githubusercontent.com/14270174/197464552-69de557f-edff-4c7f-acbf-069df1ba097f.png" width="600">
238
- </div >
239
-
240
- - RE(关系提取)
241
- <div align =" center " >
242
- <img src="https://user-images.githubusercontent.com/14270174/185393805-c67ff571-cf7e-4217-a4b0-8b396c4f22bb.jpg" width="600">
243
- </div >
244
-
245
- <div align =" center " >
246
- <img src="https://user-images.githubusercontent.com/14270174/185540080-0431e006-9235-4b6d-b63d-0b3c6e1de48f.jpg" width="600">
247
- </div >
248
-
249
- <div align =" center " >
250
- <img src="https://user-images.githubusercontent.com/25809855/186094813-3a8e16cc-42e5-4982-b9f4-0134dfb5688d.png" width="600">
251
- </div >
252
-
253
- </details >
254
-
255
- <a name =" 许可证书 " ></a >
73
+ ## ☆ Star
256
74
257
75
## 许可证书
76
+
258
77
本项目的发布受<a href =" https://github.com/PaddlePaddle/PaddleOCR/blob/master/LICENSE " >Apache 2.0 license</a >许可认证。
0 commit comments