Merge branch 'PaddlePaddle:main' into main

lingskr · web-flow · commit 2b23aa882d21 · 2024-08-19T15:22:25.000+08:00
diff --git a/README.md b/README.md
@@ -51,10 +51,6 @@ PaddleOCR 由 [PMC](https://github.com/PaddlePaddle/PaddleOCR/issues/12122) 监
 
 ## ⚡ [快速开始](https://paddlepaddle.github.io/PaddleOCR/quick_start.html)
 
-## 📖 技术交流合作
-
-- 飞桨低代码开发工具 PaddleX 官方交流频道：<https://aistudio.baidu.com/community/channel/610>
-
 ## 📚《动手学 OCR》电子书
 
 - [《动手学 OCR》电子书](https://paddlepaddle.github.io/PaddleOCR/ppocr/blog/ocr_book.html)
diff --git a/configs/rec/PP-OCRv4/ch_PP-OCRv4_rec_distillation.yml b/configs/rec/PP-OCRv4/ch_PP-OCRv4_rec_distillation.yml
@@ -16,7 +16,7 @@ Global:
   use_visualdl: false
   infer_img: doc/imgs_words/ch/word_1.jpg
   character_dict_path: ppocr/utils/ppocr_keys_v1.txt
-  max_text_length: 25
+  max_text_length: &max_text_length 25
   infer_mode: false
   use_space_char: true
   distributed: true
diff --git a/docs/applications/PCB字符识别.md b/docs/applications/PCB字符识别.md
@@ -180,11 +180,7 @@ Eval.dataset.transforms.DetResizeForTest:  尺寸
         limit_type: 'min'
 ```
 
-如需获取已训练模型，请加入PaddleX官方交流频道，获取20G OCR学习大礼包（内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料）
-
-- PaddleX官方交流频道：<https://aistudio.baidu.com/community/channel/610>
-
-将下载或训练完成的模型放置在对应目录下即可完成模型推理
+将训练完成的模型放置在对应目录下即可完成模型推理
 
 ```python linenums="1"
 cd /home/aistudio/PaddleOCR
diff --git a/docs/applications/overview.md b/docs/applications/overview.md
@@ -49,8 +49,4 @@ PaddleOCR场景应用覆盖通用，制造、金融、交通行业的主要OCR
 
 ## 模型下载
 
-如需下载上述场景中已经训练好的垂类模型，可以加入PaddleX官方交流频道获取20G OCR学习大礼包（内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料）
-
-- PaddleX官方交流频道：<https://aistudio.baidu.com/community/channel/610>
-
 如果您是企业开发者且未在上述场景中找到合适的方案，可以填写[OCR应用合作调研问卷](https://paddle.wjx.cn/vj/QwF7GKw.aspx)，免费与官方团队展开不同层次的合作，包括但不限于问题抽象、确定技术方案、项目答疑、共同研发等。如果您已经使用PaddleOCR落地项目，也可以填写此问卷，与飞桨平台共同宣传推广，提升企业技术品宣。期待您的提交！
diff --git a/docs/applications/光功率计数码管字符识别.md b/docs/applications/光功率计数码管字符识别.md
@@ -395,11 +395,7 @@ python tools/train.py -c rec_svtr_tiny_none_ctc_ch_train/rec_svtr_tiny_6local_6g
 
 ### 3.4 验证效果
 
-如需获取已训练模型，请加入PaddleX官方交流频道，获取20G OCR学习大礼包（内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料）
-
-- PaddleX官方交流频道：<https://aistudio.baidu.com/community/channel/610>
-
-将下载或训练完成的模型放置在对应目录下即可完成模型推理
+将训练完成的模型放置在对应目录下即可完成模型推理
 
 #### 指标评估
 
diff --git a/docs/applications/包装生产日期识别.md b/docs/applications/包装生产日期识别.md
@@ -426,10 +426,6 @@ sprider
 
 首先下载预训练模型，PP-OCRv3检测模型下载链接：<https://paddleocr.bj.bcebos.com/PP-OCRv3/chinese/ch_PP-OCRv3_det_infer.tar>
 
-如需获取已训练模型，请加入PaddleX官方交流频道，获取20G OCR学习大礼包（内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料）
-
-PaddleX官方交流频道：<https://aistudio.baidu.com/community/channel/610>
-
 完成下载后，可将模型存储于如下位置:
 
 ```bash linenums="1"
@@ -666,8 +662,4 @@ python tools/train.py -c configs/rec/PP-OCRv3/ch_PP-OCRv3_rec_distillation.yml \
 
 可以看到，相较于原始PP-OCRv3的识别精度62.99%，使用合成数据+真实数据finetune后，识别精度能提升24%。
 
-如需获取已训练模型，请加入PaddleX官方交流频道，获取20G OCR学习大礼包（内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料）
-
-PaddleX官方交流频道：<https://aistudio.baidu.com/community/channel/610>
-
 模型的推理部署方法可以参考repo文档： [docs](../ppocr/infer_deploy/python_infer.md)
diff --git a/docs/applications/印章弯曲文字识别.md b/docs/applications/印章弯曲文字识别.md
@@ -1027,7 +1027,3 @@ Train:
 
 训练完成后可以发现测试集指标达到了61%。
 由于数据较少，训练时会发现在训练集上的acc指标远大于测试集上的acc指标，即出现过拟合现象。通过补充数据和一些数据增强可以缓解这个问题。
-
-如需获取已训练模型，请加入PaddleX官方交流频道，获取20G OCR学习大礼包（内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料）
-
-- PaddleX官方交流频道：<https://aistudio.baidu.com/community/channel/610>
diff --git a/docs/applications/发票关键信息抽取.md b/docs/applications/发票关键信息抽取.md
@@ -257,10 +257,6 @@ LayoutXLM与VI-LayoutXLM针对该场景的训练结果如下所示。
 
 可以看出，对于VI-LayoutXLM相比LayoutXLM的Hmean高了1.3%。
 
-如需获取已训练模型，请加入PaddleX官方交流频道，获取20G OCR学习大礼包（内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料）
-
-* PaddleX官方交流频道：<https://aistudio.baidu.com/community/channel/610>
-
 #### 4.4.3 模型评估
 
 模型训练过程中，使用的是知识蒸馏的策略，最终保留了学生模型的参数，在评估时，我们需要针对学生模型的配置文件进行修改: [re_vi_layoutxlm_xfund_zh.yml](../configs/kie/vi_layoutxlm/re_vi_layoutxlm_xfund_zh.yml)，修改内容与训练配置相同，包括**类别映射文件、数据目录**。
diff --git a/docs/applications/多模态表单识别.md b/docs/applications/多模态表单识别.md
@@ -273,11 +273,7 @@ CUDA_VISIBLE_DEVICES=0 python tools/train.py \
 
 使用训练好的模型进行评估，更新模型路径`Global.checkpoints`。
 
-如需获取已训练模型，请加入PaddleX官方交流频道，获取20G OCR学习大礼包（内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料）
-
-- PaddleX官方交流频道：<https://aistudio.baidu.com/community/channel/610>
-
-将下载或训练完成的模型放置在对应目录下即可完成模型评估
+将训练完成的模型放置在对应目录下即可完成模型评估
 
 ```bash linenums="1"
 %cd /home/aistudio/PaddleOCR/
diff --git a/docs/applications/手写文字识别.md b/docs/applications/手写文字识别.md
@@ -184,11 +184,7 @@ python tools/eval.py -c configs/rec/PP-OCRv3/ch_PP-OCRv3_rec_distillation.yml -o
 [2022/07/14 10:54:06] ppocr INFO: fps:928.948733797251
 ```
 
-如需获取已训练模型，请加入PaddleX官方交流频道，获取20G OCR学习大礼包（内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料）
-
-* PaddleX官方交流频道：<https://aistudio.baidu.com/community/channel/610>
-
-将下载或训练完成的模型放置在对应目录下即可完成模型推理
+将训练完成的模型放置在对应目录下即可完成模型推理
 
 ## 8. 模型导出推理
 
diff --git a/docs/applications/扫描合同关键信息提取.md b/docs/applications/扫描合同关键信息提取.md
@@ -275,6 +275,3 @@ UIE的建模方式主要是通过 `Prompt` 方式来建模， `Prompt` 在小样
 
 ![](./images/50a49a3c9f8348bfa04e8c8b97d3cce0d0dd6b14040f43939268d120688ef7ca.jpg)
 
-更多场景下的垂类模型获取，请加入PaddleX官方交流频道，获取20G OCR学习大礼包（内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料）
-
-- PaddleX官方交流频道：<https://aistudio.baidu.com/community/channel/610>
diff --git a/docs/applications/液晶屏读数识别.md b/docs/applications/液晶屏读数识别.md
@@ -300,11 +300,7 @@ python tools/eval.py -c configs/det/ch_PP-OCRv3/ch_PP-OCRv3_det_cml.yml -o Globa
 | 3 | PP-OCRv3中英文超轻量检测预训练模型fintune教师模型 |84.80%|
 | 4 | 基于2和3训练好的模型fintune |82.70%|
 
-如需获取已训练模型，请加入PaddleX官方交流频道，获取20G OCR学习大礼包（内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料）
-
-- PaddleX官方交流频道：<https://aistudio.baidu.com/community/channel/610>
-
-将下载或训练完成的模型放置在对应目录下即可完成模型推理
+将训练完成的模型放置在对应目录下即可完成模型推理
 
 #### 4.3.6 模型导出推理
 
diff --git a/docs/applications/轻量级车牌识别.md b/docs/applications/轻量级车牌识别.md
@@ -413,10 +413,6 @@ python tools/eval.py -c configs/rec/PP-OCRv3/ch_PP-OCRv3_rec.yml -o \
     Eval.dataset.label_file_list=[/home/aistudio/data/CCPD2020/PPOCR/test/rec.txt]
 ```
 
-如需获取已训练模型，请加入PaddleX官方交流频道，获取20G OCR学习大礼包（内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料）
-
-- PaddleX官方交流频道：<https://aistudio.baidu.com/community/channel/610>
-
 评估部分日志如下：
 
 ```bash linenums="1"
diff --git a/docs/applications/高精度中文识别模型.md b/docs/applications/高精度中文识别模型.md
@@ -49,10 +49,6 @@ pip install -r PaddleOCR/requirements.txt -i https://mirror.baidu.com/pypi/simpl
 
 ### 快速使用
 
-获取SVTR中文模型文件，请加入PaddleX官方交流频道，获取20G OCR学习大礼包（内含《动手学OCR》电子书、课程回放视频、前沿论文等重磅资料）
-
-- PaddleX官方交流频道：<https://aistudio.baidu.com/community/channel/610>
-
 ```bash linenums="1"
 # 解压模型文件
 tar xf svtr_ch_high_accuracy.tar