File tree 14 files changed +6
-61
lines changed
14 files changed +6
-61
lines changed Original file line number Diff line number Diff line change @@ -51,10 +51,6 @@ PaddleOCR 由 [PMC](https://github.com/PaddlePaddle/PaddleOCR/issues/12122) 监
51
51
52
52
## ⚡ [ 快速开始] ( https://paddlepaddle.github.io/PaddleOCR/quick_start.html )
53
53
54
- ## 📖 技术交流合作
55
-
56
- - 飞桨低代码开发工具 PaddleX 官方交流频道:< https://aistudio.baidu.com/community/channel/610 >
57
-
58
54
## 📚《动手学 OCR》电子书
59
55
60
56
- [ 《动手学 OCR》电子书] ( https://paddlepaddle.github.io/PaddleOCR/ppocr/blog/ocr_book.html )
Original file line number Diff line number Diff line change @@ -16,7 +16,7 @@ Global:
16
16
use_visualdl : false
17
17
infer_img : doc/imgs_words/ch/word_1.jpg
18
18
character_dict_path : ppocr/utils/ppocr_keys_v1.txt
19
- max_text_length : 25
19
+ max_text_length : &max_text_length 25
20
20
infer_mode : false
21
21
use_space_char : true
22
22
distributed : true
Original file line number Diff line number Diff line change @@ -180,11 +180,7 @@ Eval.dataset.transforms.DetResizeForTest: 尺寸
180
180
limit_type: 'min'
181
181
```
182
182
183
- 如需获取已训练模型,请加入PaddleX官方交流频道,获取20G OCR学习大礼包(内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料)
184
-
185
- - PaddleX官方交流频道:< https://aistudio.baidu.com/community/channel/610 >
186
-
187
- 将下载或训练完成的模型放置在对应目录下即可完成模型推理
183
+ 将训练完成的模型放置在对应目录下即可完成模型推理
188
184
189
185
``` python linenums="1"
190
186
cd / home/ aistudio/ PaddleOCR
Original file line number Diff line number Diff line change @@ -49,8 +49,4 @@ PaddleOCR场景应用覆盖通用,制造、金融、交通行业的主要OCR
49
49
50
50
## 模型下载
51
51
52
- 如需下载上述场景中已经训练好的垂类模型,可以加入PaddleX官方交流频道获取20G OCR学习大礼包(内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料)
53
-
54
- - PaddleX官方交流频道:< https://aistudio.baidu.com/community/channel/610 >
55
-
56
52
如果您是企业开发者且未在上述场景中找到合适的方案,可以填写[ OCR应用合作调研问卷] ( https://paddle.wjx.cn/vj/QwF7GKw.aspx ) ,免费与官方团队展开不同层次的合作,包括但不限于问题抽象、确定技术方案、项目答疑、共同研发等。如果您已经使用PaddleOCR落地项目,也可以填写此问卷,与飞桨平台共同宣传推广,提升企业技术品宣。期待您的提交!
Original file line number Diff line number Diff line change @@ -395,11 +395,7 @@ python tools/train.py -c rec_svtr_tiny_none_ctc_ch_train/rec_svtr_tiny_6local_6g
395
395
396
396
### 3.4 验证效果
397
397
398
- 如需获取已训练模型,请加入PaddleX官方交流频道,获取20G OCR学习大礼包(内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料)
399
-
400
- - PaddleX官方交流频道:< https://aistudio.baidu.com/community/channel/610 >
401
-
402
- 将下载或训练完成的模型放置在对应目录下即可完成模型推理
398
+ 将训练完成的模型放置在对应目录下即可完成模型推理
403
399
404
400
#### 指标评估
405
401
Original file line number Diff line number Diff line change @@ -426,10 +426,6 @@ sprider
426
426
427
427
首先下载预训练模型,PP-OCRv3检测模型下载链接:< https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tar >
428
428
429
- 如需获取已训练模型,请加入PaddleX官方交流频道,获取20G OCR学习大礼包(内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料)
430
-
431
- PaddleX官方交流频道:< https://aistudio.baidu.com/community/channel/610 >
432
-
433
429
完成下载后,可将模型存储于如下位置:
434
430
435
431
``` bash linenums="1"
@@ -666,8 +662,4 @@ python tools/train.py -c configs/rec/PP-OCRv3/ch_PP-OCRv3_rec_distillation.yml \
666
662
667
663
可以看到,相较于原始PP-OCRv3的识别精度62.99%,使用合成数据+真实数据finetune后,识别精度能提升24%。
668
664
669
- 如需获取已训练模型,请加入PaddleX官方交流频道,获取20G OCR学习大礼包(内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料)
670
-
671
- PaddleX官方交流频道:< https://aistudio.baidu.com/community/channel/610 >
672
-
673
665
模型的推理部署方法可以参考repo文档: [ docs] ( ../ppocr/infer_deploy/python_infer.md )
Original file line number Diff line number Diff line change @@ -1027,7 +1027,3 @@ Train:
1027
1027
1028
1028
训练完成后可以发现测试集指标达到了61%。
1029
1029
由于数据较少,训练时会发现在训练集上的acc指标远大于测试集上的acc指标,即出现过拟合现象。通过补充数据和一些数据增强可以缓解这个问题。
1030
-
1031
- 如需获取已训练模型,请加入PaddleX官方交流频道,获取20G OCR学习大礼包(内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料)
1032
-
1033
- - PaddleX官方交流频道:< https://aistudio.baidu.com/community/channel/610 >
Original file line number Diff line number Diff line change @@ -257,10 +257,6 @@ LayoutXLM与VI-LayoutXLM针对该场景的训练结果如下所示。
257
257
258
258
可以看出,对于VI-LayoutXLM相比LayoutXLM的Hmean高了1.3%。
259
259
260
- 如需获取已训练模型,请加入PaddleX官方交流频道,获取20G OCR学习大礼包(内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料)
261
-
262
- * PaddleX官方交流频道:< https://aistudio.baidu.com/community/channel/610 >
263
-
264
260
#### 4.4.3 模型评估
265
261
266
262
模型训练过程中,使用的是知识蒸馏的策略,最终保留了学生模型的参数,在评估时,我们需要针对学生模型的配置文件进行修改: [ re_vi_layoutxlm_xfund_zh.yml] ( ../configs/kie/vi_layoutxlm/re_vi_layoutxlm_xfund_zh.yml ) ,修改内容与训练配置相同,包括** 类别映射文件、数据目录** 。
Original file line number Diff line number Diff line change @@ -273,11 +273,7 @@ CUDA_VISIBLE_DEVICES=0 python tools/train.py \
273
273
274
274
使用训练好的模型进行评估,更新模型路径`Global.checkpoints`。
275
275
276
- 如需获取已训练模型,请加入PaddleX官方交流频道,获取20G OCR学习大礼包(内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料)
277
-
278
- - PaddleX官方交流频道:<https://aistudio.baidu.com/community/channel/610>
279
-
280
- 将下载或训练完成的模型放置在对应目录下即可完成模型评估
276
+ 将训练完成的模型放置在对应目录下即可完成模型评估
281
277
282
278
` ` ` bash linenums="1"
283
279
%cd /home/aistudio/PaddleOCR/
Original file line number Diff line number Diff line change @@ -184,11 +184,7 @@ python tools/eval.py -c configs/rec/PP-OCRv3/ch_PP-OCRv3_rec_distillation.yml -o
184
184
[2022/07/14 10:54:06] ppocr INFO: fps:928.948733797251
185
185
```
186
186
187
- 如需获取已训练模型,请加入PaddleX官方交流频道,获取20G OCR学习大礼包(内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料)
188
-
189
- * PaddleX官方交流频道:< https://aistudio.baidu.com/community/channel/610 >
190
-
191
- 将下载或训练完成的模型放置在对应目录下即可完成模型推理
187
+ 将训练完成的模型放置在对应目录下即可完成模型推理
192
188
193
189
## 8. 模型导出推理
194
190
Original file line number Diff line number Diff line change @@ -275,6 +275,3 @@ UIE的建模方式主要是通过 `Prompt` 方式来建模, `Prompt` 在小样
275
275
276
276
![ ] ( ./images/50a49a3c9f8348bfa04e8c8b97d3cce0d0dd6b14040f43939268d120688ef7ca.jpg )
277
277
278
- 更多场景下的垂类模型获取,请加入PaddleX官方交流频道,获取20G OCR学习大礼包(内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料)
279
-
280
- - PaddleX官方交流频道:< https://aistudio.baidu.com/community/channel/610 >
Original file line number Diff line number Diff line change @@ -300,11 +300,7 @@ python tools/eval.py -c configs/det/ch_PP-OCRv3/ch_PP-OCRv3_det_cml.yml -o Globa
300
300
| 3 | PP-OCRv3中英文超轻量检测预训练模型fintune教师模型 | 84.80%|
301
301
| 4 | 基于2和3训练好的模型fintune | 82.70%|
302
302
303
- 如需获取已训练模型,请加入PaddleX官方交流频道,获取20G OCR学习大礼包(内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料)
304
-
305
- - PaddleX官方交流频道:< https://aistudio.baidu.com/community/channel/610 >
306
-
307
- 将下载或训练完成的模型放置在对应目录下即可完成模型推理
303
+ 将训练完成的模型放置在对应目录下即可完成模型推理
308
304
309
305
#### 4.3.6 模型导出推理
310
306
Original file line number Diff line number Diff line change @@ -413,10 +413,6 @@ python tools/eval.py -c configs/rec/PP-OCRv3/ch_PP-OCRv3_rec.yml -o \
413
413
Eval.dataset.label_file_list=[/home/aistudio/data/CCPD2020/PPOCR/test/rec.txt]
414
414
```
415
415
416
- 如需获取已训练模型,请加入PaddleX官方交流频道,获取20G OCR学习大礼包(内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料)
417
-
418
- - PaddleX官方交流频道:< https://aistudio.baidu.com/community/channel/610 >
419
-
420
416
评估部分日志如下:
421
417
422
418
``` bash linenums="1"
Original file line number Diff line number Diff line change @@ -49,10 +49,6 @@ pip install -r PaddleOCR/requirements.txt -i https://mirror.baidu.com/pypi/simpl
49
49
50
50
### 快速使用
51
51
52
- 获取SVTR中文模型文件,请加入PaddleX官方交流频道,获取20G OCR学习大礼包(内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料)
53
-
54
- - PaddleX官方交流频道:< https://aistudio.baidu.com/community/channel/610 >
55
-
56
52
``` bash linenums="1"
57
53
# 解压模型文件
58
54
tar xf svtr_ch_high_accuracy.tar
You can’t perform that action at this time.
0 commit comments