File tree Expand file tree Collapse file tree 5 files changed +12
-12
lines changed Expand file tree Collapse file tree 5 files changed +12
-12
lines changed Original file line number Diff line number Diff line change @@ -34,9 +34,9 @@ PaddleOCR 由 [PMC](https://github.com/PaddlePaddle/PaddleOCR/issues/12122) 监
34
34
- ** 🔥2024.10.1 添加OCR领域低代码全流程开发能力** :
35
35
* 飞桨低代码开发工具PaddleX,依托于PaddleOCR的先进技术,支持了OCR领域的低代码全流程开发能力:
36
36
* 🎨 [ ** 模型丰富一键调用** ] ( https://paddlepaddle.github.io/PaddleOCR/latest/paddlex/quick_start.html ) :将文本图像智能分析、通用OCR、通用版面解析、通用表格识别、公式识别、印章识别涉及的** 17个模型** 整合为6条模型产线,通过极简的** Python API一键调用** ,快速体验模型效果。此外,同一套API,也支持图像分类、目标检测、图像分割、时序预测等共计** 200+模型** ,形成20+单功能模块,方便开发者进行** 模型组合** 使用。
37
- * 🚀[ ** 提高效率降低门槛** ] ( https://paddlepaddle.github.io/PaddleOCR/latest/paddlex/overview.html ) :提供基于** 统一命令** 和** 图形界面** 两种方式,实现模型简洁高效的使用、组合与定制。支持** 高性能部署 、服务化部署和端侧部署** 等多种部署方式。此外,对于各种主流硬件如** 英伟达GPU、昆仑芯、昇腾、寒武纪和海光** 等,进行模型开发时,都可以** 无缝切换** 。
37
+ * 🚀[ ** 提高效率降低门槛** ] ( https://paddlepaddle.github.io/PaddleOCR/latest/paddlex/overview.html ) :提供基于** 统一命令** 和** 图形界面** 两种方式,实现模型简洁高效的使用、组合与定制。支持** 高性能推理 、服务化部署和端侧部署** 等多种部署方式。此外,对于各种主流硬件如** 英伟达GPU、昆仑芯、昇腾、寒武纪和海光** 等,进行模型开发时,都可以** 无缝切换** 。
38
38
39
- * 支持文档场景信息抽取v3([PP-ChatOCRv3-doc](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/pipeline_usage/tutorials/information_extration_pipelines/document_scene_information_extraction.md))、基于RT-DETR和PicoDet的 [高精度版面区域检测模型](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/layout_detection.md)、高精度表格结构识别模型[SLANet_Plus](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/table_structure_recognition.md)、版面矫正预测模型 [UVDoc](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/text_image_unwarping.md)、公式识别模型[LatexOCR](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/formula_recognition.md)、基于PP-LCNet的[文档图像方向分类模型](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/doc_img_orientation_classification.md)
39
+ * 支持文档场景信息抽取v3([PP-ChatOCRv3-doc](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/pipeline_usage/tutorials/information_extration_pipelines/document_scene_information_extraction.md))、基于RT-DETR的 [高精度版面区域检测模型]和PicoDet的[高效率版面区域检测模型] (https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/layout_detection.md)、高精度表格结构识别模型[SLANet_Plus](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/table_structure_recognition.md)、文本图像矫正模型 [UVDoc](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/text_image_unwarping.md)、公式识别模型[LatexOCR](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/formula_recognition.md)、基于PP-LCNet的[文档图像方向分类模型](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/doc_img_orientation_classification.md)
40
40
41
41
- ** 🔥2024.7 添加 PaddleOCR 算法模型挑战赛冠军方案** :
42
42
- 赛题一:OCR 端到端识别任务冠军方案——[ 场景文本识别算法-SVTRv2] ( https://paddlepaddle.github.io/PaddleOCR/latest/algorithm/text_recognition/algorithm_rec_svtrv2.html ) ;
Original file line number Diff line number Diff line change @@ -34,9 +34,9 @@ PaddleOCR 由 [PMC](https://github.com/PaddlePaddle/PaddleOCR/issues/12122) 监
34
34
- ** 🔥2024.10.1 添加OCR领域低代码全流程开发能力** :
35
35
* 飞桨低代码开发工具PaddleX,依托于PaddleOCR的先进技术,支持了OCR领域的低代码全流程开发能力:
36
36
* 🎨 [ ** 模型丰富一键调用** ] ( https://paddlepaddle.github.io/PaddleOCR/latest/paddlex/quick_start.html ) :将文本图像智能分析、通用OCR、通用版面解析、通用表格识别、公式识别、印章识别涉及的** 17个模型** 整合为6条模型产线,通过极简的** Python API一键调用** ,快速体验模型效果。此外,同一套API,也支持图像分类、目标检测、图像分割、时序预测等共计** 200+模型** ,形成20+单功能模块,方便开发者进行** 模型组合** 使用。
37
- * 🚀[ ** 提高效率降低门槛** ] ( https://paddlepaddle.github.io/PaddleOCR/latest/paddlex/overview.html ) :提供基于** 统一命令** 和** 图形界面** 两种方式,实现模型简洁高效的使用、组合与定制。支持** 高性能部署 、服务化部署和端侧部署** 等多种部署方式。此外,对于各种主流硬件如** 英伟达GPU、昆仑芯、昇腾、寒武纪和海光** 等,进行模型开发时,都可以** 无缝切换** 。
37
+ * 🚀[ ** 提高效率降低门槛** ] ( https://paddlepaddle.github.io/PaddleOCR/latest/paddlex/overview.html ) :提供基于** 统一命令** 和** 图形界面** 两种方式,实现模型简洁高效的使用、组合与定制。支持** 高性能推理 、服务化部署和端侧部署** 等多种部署方式。此外,对于各种主流硬件如** 英伟达GPU、昆仑芯、昇腾、寒武纪和海光** 等,进行模型开发时,都可以** 无缝切换** 。
38
38
39
- * 支持文档场景信息抽取v3([PP-ChatOCRv3-doc](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/pipeline_usage/tutorials/information_extration_pipelines/document_scene_information_extraction.md))、基于RT-DETR和PicoDet的 [高精度版面区域检测模型](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/layout_detection.md)、高精度表格结构识别模型[SLANet_Plus](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/table_structure_recognition.md)、版面矫正预测模型 [UVDoc](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/text_image_unwarping.md)、公式识别模型[LatexOCR](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/formula_recognition.md)、基于PP-LCNet的[文档图像方向分类模型](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/doc_img_orientation_classification.md)
39
+ * 支持文档场景信息抽取v3([PP-ChatOCRv3-doc](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/pipeline_usage/tutorials/information_extration_pipelines/document_scene_information_extraction.md))、基于RT-DETR的 [高精度版面区域检测模型]和PicoDet的[高效率版面区域检测模型] (https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/layout_detection.md)、高精度表格结构识别模型[SLANet_Plus](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/table_structure_recognition.md)、文本图像矫正模型 [UVDoc](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/text_image_unwarping.md)、公式识别模型[LatexOCR](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/formula_recognition.md)、基于PP-LCNet的[文档图像方向分类模型](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/doc_img_orientation_classification.md)
40
40
41
41
- ** 🔥2024.7 添加 PaddleOCR 算法模型挑战赛冠军方案** :
42
42
- 赛题一:OCR 端到端识别任务冠军方案——[ 场景文本识别算法-SVTRv2] ( https://paddlepaddle.github.io/PaddleOCR/latest/algorithm/text_recognition/algorithm_rec_svtrv2.html ) ;
@@ -47,7 +47,7 @@ PaddleOCR 由 [PMC](https://github.com/PaddlePaddle/PaddleOCR/issues/12122) 监
47
47
48
48
## 🌟 特性
49
49
50
- 支持多种 OCR 相关前沿算法,在此基础上打造产业级特色模型PP-、PP-Structure和PP-ChatOCR,并打通数据生产、模型训练、压缩、预测部署全流程。
50
+ 支持多种 OCR 相关前沿算法,在此基础上打造产业级特色模型PP-OCR 、PP-Structure和PP-ChatOCR,并打通数据生产、模型训练、压缩、预测部署全流程。
51
51
52
52
<img src =" ./images/ppocrv4.png " width =" 600 " />
53
53
Original file line number Diff line number Diff line change 5
5
6
6
* 🎨 ** 模型丰富一键调用** :将文本图像智能分析、通用OCR、通用版面解析、通用表格识别、公式识别、印章识别涉及的** 17个模型** 整合为6条模型产线,通过极简的** Python API一键调用** ,快速体验模型效果。此外,同一套API,也支持图像分类、目标检测、图像分割、时序预测等共计** 200+模型** ,形成20+单功能模块,方便开发者进行** 模型组合** 使用。
7
7
8
- * 🚀 ** 提高效率降低门槛** :提供基于** 统一命令** 和** 图形界面** 两种方式,实现模型简洁高效的使用、组合与定制。支持** 高性能部署 、服务化部署和端侧部署** 等多种部署方式。此外,对于各种主流硬件如** 英伟达GPU、昆仑芯、昇腾、寒武纪和海光** 等,进行模型开发时,都可以** 无缝切换** 。
8
+ * 🚀 ** 提高效率降低门槛** :提供基于** 统一命令** 和** 图形界面** 两种方式,实现模型简洁高效的使用、组合与定制。支持** 高性能推理 、服务化部署和端侧部署** 等多种部署方式。此外,对于各种主流硬件如** 英伟达GPU、昆仑芯、昇腾、寒武纪和海光** 等,进行模型开发时,都可以** 无缝切换** 。
9
9
10
10
> ** 说明** :PaddleX 致力于实现产线级别的模型训练、推理与部署。模型产线是指一系列预定义好的、针对特定AI任务的开发流程,其中包含能够独立完成某类任务的单模型(单功能模块)组合。
11
11
12
12
## 2. OCR相关能力支持
13
13
14
- PaddleX中OCR相关的6条产线均支持本地** 快速推理** ,部分产线支持** 在线体验** ,您可以快速体验各个产线的预训练模型效果,如果您对产线的预训练模型效果满意,可以直接对产线进行[ 高性能部署 ] ( https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/pipeline_deploy/high_performance_deploy.md ) /[ 服务化部署] ( https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/pipeline_deploy/service_deploy.md ) /[ 端侧部署] ( https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/pipeline_deploy/lite_deploy.md ) ,如果不满意,您也可以使用产线的** 二次开发** 能力,提升效果。完整的产线开发流程请参考[ PaddleX产线使用概览] ( https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/pipeline_usage/pipeline_develop_guide.md ) 或各产线使用教程。
14
+ PaddleX中OCR相关的6条产线均支持本地** 快速推理** ,部分产线支持** 在线体验** ,您可以快速体验各个产线的预训练模型效果,如果您对产线的预训练模型效果满意,可以直接对产线进行[ 高性能推理 ] ( https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/pipeline_deploy/high_performance_deploy.md ) /[ 服务化部署] ( https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/pipeline_deploy/service_deploy.md ) /[ 端侧部署] ( https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/pipeline_deploy/lite_deploy.md ) ,如果不满意,您也可以使用产线的** 二次开发** 能力,提升效果。完整的产线开发流程请参考[ PaddleX产线使用概览] ( https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/pipeline_usage/pipeline_develop_guide.md ) 或各产线使用教程。
15
15
16
16
此外,PaddleX为开发者提供了基于[ 云端图形化开发界面] ( https://aistudio.baidu.com/pipeline/mine ) 的全流程开发工具, 详细请参考[ 教程《零门槛开发产业级AI模型》] ( https://aistudio.baidu.com/practical/introduce/546656605663301 )
17
17
@@ -21,7 +21,7 @@ PaddleX中OCR相关的6条产线均支持本地**快速推理**,部分产线
21
21
<td></td>
22
22
<td>在线体验</td>
23
23
<td>快速推理</td>
24
- <td>高性能部署 </td>
24
+ <td>高性能推理 </td>
25
25
<td>服务化部署</td>
26
26
<td>端侧部署</td>
27
27
<td>二次开发</td>
Original file line number Diff line number Diff line change 4
4
5
5
> * 飞桨低代码开发工具[ PaddleX] ( https://github.com/PaddlePaddle/PaddleX/tree/release/3.0-beta1 ) ,依托于PaddleOCR的先进技术,支持了OCR领域的** 低代码全流程** 开发能力。通过低代码开发,可实现简单且高效的模型使用、组合与定制。
6
6
7
- > * PaddleX 致力于实现产线级别的模型训练、推理与部署。模型产线是指一系列预定义好的、针对特定AI任务的开发流程,其中包含能够独立完成某类任务的单模型(单功能模块)组合。本文档提供** OCR相关产线** 的快速使用 ,单功能模块的快速使用以及更多功能请参考[ PaddleOCR低代码开发 ] ( https://paddlepaddle.github.io/PaddleOCR/latest/paddlex/overview.html ) 中相关章节。
7
+ > * PaddleX 致力于实现产线级别的模型训练、推理与部署。模型产线是指一系列预定义好的、针对特定AI任务的开发流程,其中包含能够独立完成某类任务的单模型(单功能模块)组合。本文档提供** OCR相关产线** 的快速推理使用 ,单功能模块的快速使用以及更多功能请参考[ PaddleOCR低代码全流程开发 ] ( https://paddlepaddle.github.io/PaddleOCR/latest/paddlex/overview.html ) 中相关章节。
8
8
9
9
10
10
### 🛠️ 安装
Original file line number Diff line number Diff line change 9
9
10
10
#### ** 🔥2024.10.1 添加OCR领域低代码全流程开发能力**
11
11
* 飞桨低代码开发工具PaddleX,依托于PaddleOCR的先进技术,支持了OCR领域的低代码全流程开发能力:
12
- * 🎨 [ ** 模型丰富一键调用** ] ( https://paddlepaddle.github.io/PaddleOCR/latest/paddlex/quick_start.md ) :将文本图像智能分析、通用OCR、通用表格识别、公式识别、印章识别涉及的** 17个模型** 整合为5条模型产线 ,通过极简的** Python API一键调用** ,快速体验模型效果。此外,同一套API,也支持图像分类、目标检测、图像分割、时序预测等共计** 200+模型** ,形成20+单功能模块,方便开发者进行** 模型组合** 使用。
13
- * 🚀[ ** 提高效率降低门槛** ] ( https://paddlepaddle.github.io/PaddleOCR/latest/paddlex/overview.md ) :提供基于** 统一命令** 和** 图形界面** 两种方式,实现模型简洁高效的使用、组合与定制。支持** 高性能部署 、服务化部署和端侧部署** 等多种部署方式。此外,对于各种主流硬件如** 英伟达GPU、昆仑芯、昇腾、寒武纪和海光** 等,进行模型开发时,都可以** 无缝切换** 。
12
+ * 🎨 [ ** 模型丰富一键调用** ] ( https://paddlepaddle.github.io/PaddleOCR/latest/paddlex/quick_start.html ) :将文本图像智能分析、通用OCR、通用版面解析、 通用表格识别、公式识别、印章识别涉及的** 17个模型** 整合为6条模型产线 ,通过极简的** Python API一键调用** ,快速体验模型效果。此外,同一套API,也支持图像分类、目标检测、图像分割、时序预测等共计** 200+模型** ,形成20+单功能模块,方便开发者进行** 模型组合** 使用。
13
+ * 🚀[ ** 提高效率降低门槛** ] ( https://paddlepaddle.github.io/PaddleOCR/latest/paddlex/overview.html ) :提供基于** 统一命令** 和** 图形界面** 两种方式,实现模型简洁高效的使用、组合与定制。支持** 高性能推理 、服务化部署和端侧部署** 等多种部署方式。此外,对于各种主流硬件如** 英伟达GPU、昆仑芯、昇腾、寒武纪和海光** 等,进行模型开发时,都可以** 无缝切换** 。
14
14
15
- * 支持文档场景信息抽取v3([PP-ChatOCRv3-doc](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/pipeline_usage/tutorials/information_extration_pipelines/document_scene_information_extraction.md))、基于RT-DETR和PicoDet的 [高精度版面区域检测模型](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/layout_detection.md)、高精度表格结构识别模型[SLANet_Plus](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/table_structure_recognition.md)、版面矫正预测模型 [UVDoc](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/text_image_unwarping.md)、公式识别模型[LatexOCR](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/formula_recognition.md)、基于PP-LCNet的[文档图像方向分类模型](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/doc_img_orientation_classification.md)
15
+ * 支持文档场景信息抽取v3([PP-ChatOCRv3-doc](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/pipeline_usage/tutorials/information_extration_pipelines/document_scene_information_extraction.md))、基于RT-DETR的 [高精度版面区域检测模型]和PicoDet的[高效率版面区域检测模型] (https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/layout_detection.md)、高精度表格结构识别模型[SLANet_Plus](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/table_structure_recognition.md)、文本图像矫正模型 [UVDoc](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/text_image_unwarping.md)、公式识别模型[LatexOCR](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/formula_recognition.md)、基于PP-LCNet的[文档图像方向分类模型](https://github.com/PaddlePaddle/PaddleX/blob/release/3.0-beta1/docs/module_usage/tutorials/ocr_modules/doc_img_orientation_classification.md)
16
16
17
17
18
18
#### 🔥 2024.7 添加 PaddleOCR 算法模型挑战赛冠军方案:
You can’t perform that action at this time.
0 commit comments