@@ -39,6 +39,23 @@ comments: true
39
39
<th >介绍</th >
40
40
</tr >
41
41
<tr >
42
+ <td >SLANet</td ><td ><a href =" https://paddle-model-ecology.bj.bcebos.com/paddlex/official_inference_model/paddle3.0.0/SLANet_infer.tar " >推理模型</a >/<a href =" https://paddle-model-ecology.bj.bcebos.com/paddlex/official_pretrained_model/SLANet_pretrained.pdparams " >训练模型</a ></td >
43
+ <td >59.52</td >
44
+ <td >103.08 / 103.08</td >
45
+ <td >197.99 / 197.99</td >
46
+ <td >6.9 M</td >
47
+ <td rowspan =" 1 " >SLANet 是百度飞桨视觉团队自研的表格结构识别模型。该模型通过采用 CPU 友好型轻量级骨干网络 PP-LCNet、高低层特征融合模块 CSP-PAN、结构与位置信息对齐的特征解码模块 SLA Head,大幅提升了表格结构识别的精度和推理速度。</td >
48
+ </tr >
49
+ <tr >
50
+ <td >SLANet_plus</td ><td ><a href =" https://paddle-model-ecology.bj.bcebos.com/paddlex/official_inference_model/paddle3.0.0/SLANet_plus_infer.tar " >推理模型</a >/<a href =" https://paddle-model-ecology.bj.bcebos.com/paddlex/official_pretrained_model/SLANet_plus_pretrained.pdparams " >训练模型</a ></td >
51
+ <td >63.69</td >
52
+ <td >140.29 / 140.29</td >
53
+ <td >195.39 / 195.39</td >
54
+ <td >6.9 M</td >
55
+ <td rowspan =" 1 " >SLANet_plus 是百度飞桨视觉团队自研的表格结构识别模型 SLANet 的增强版。相较于 SLANet,SLANet_plus 对无线表、复杂表格的识别能力得到了大幅提升,并降低了模型对表格定位准确性的敏感度,即使表格定位出现偏移,也能够较准确地进行识别。
56
+ </td >
57
+ </tr >
58
+ <tr >
42
59
<td >SLANeXt_wired</td >
43
60
<td ><a href =" https://paddle-model-ecology.bj.bcebos.com/paddlex/official_inference_model/paddle3.0.0/SLANeXt_wired_infer.tar " >推理模型</a >/<a href =" https://paddle-model-ecology.bj.bcebos.com/paddlex/official_pretrained_model/SLANeXt_wired_pretrained.pdparams " >训练模型</a ></td >
44
61
<td rowspan =" 2 " >69.65</td >
@@ -113,6 +130,22 @@ comments: true
113
130
<th >CPU推理耗时(ms)<br />[常规模式 / 高性能模式]</th >
114
131
<th >模型存储大小(M)</th >
115
132
<th >介绍</th >
133
+ <tr >
134
+ <td >PP-OCRv5_server_det</td ><td ><a href =" https://paddle-model-ecology.bj.bcebos.com/paddlex/official_inference_model/paddle3.0.0/PP-OCRv5_server_det_infer.tar " >推理模型</a >/<a href =" https://paddle-model-ecology.bj.bcebos.com/paddlex/official_pretrained_model/PP-OCRv5_server_det_pretrained.pdparams " >训练模型</a ></td >
135
+ <td >83.8</td >
136
+ <td >- / -</td >
137
+ <td >- / -</td >
138
+ <td >101</td >
139
+ <td >PP-OCRv5 的服务端文本检测模型,精度更高,适合在性能较好的服务器上部署</td >
140
+ </tr >
141
+ <tr >
142
+ <td >PP-OCRv5_mobile_det</td ><td ><a href =" https://paddle-model-ecology.bj.bcebos.com/paddlex/official_inference_model/paddle3.0.0/PP-OCRv5_mobile_det_infer.tar " >推理模型</a >/<a href =" https://paddle-model-ecology.bj.bcebos.com/paddlex/official_pretrained_model/PP-OCRv5_mobile_det_pretrained.pdparams " >训练模型</a ></td >
143
+ <td >79.0</td >
144
+ <td >- / -</td >
145
+ <td >- / -</td >
146
+ <td >4.7</td >
147
+ <td >PP-OCRv5 的移动端文本检测模型,效率更高,适合在端侧设备部署</td >
148
+ </tr >
116
149
</tr >
117
150
</thead >
118
151
<tbody >
@@ -482,6 +515,15 @@ devanagari_PP-OCRv3_mobile_rec_infer.tar">推理模型</a>/<a href="https://padd
482
515
</thead >
483
516
<tbody >
484
517
<tr >
518
+ <td >PP-DocLayout_plus-L</td ><td ><a href =" https://paddle-model-ecology.bj.bcebos.com/paddlex/official_inference_model/paddle3.0.0/PP-DocLayout_plus-L_infer.tar " >推理模型</a >/<a href =" https://paddle-model-ecology.bj.bcebos.com/paddlex/official_pretrained_model/PP-DocLayout_plus-L_pretrained.pdparams " >训练模型</a ></td >
519
+ <td >83.2</td >
520
+ <td >34.6244 / 10.3945</td >
521
+ <td >510.57 / - </td >
522
+ <td >126.01 M</td >
523
+ <td >基于RT-DETR-L在包含中英文论文、多栏杂志、报纸、PPT、合同、书本、试卷、研报、古籍、日文文档、竖版文字文档等场景的自建数据集训练的更高精度版面区域定位模型</td >
524
+ </tr >
525
+ <tr >
526
+ <tr >
485
527
<td >PP-DocLayout-L</td ><td ><a href =" https://paddle-model-ecology.bj.bcebos.com/paddlex/official_inference_model/paddle3.0.0/PP-DocLayout-L_infer.tar " >推理模型</a >/<a href =" https://paddle-model-ecology.bj.bcebos.com/paddlex/official_pretrained_model/PP-DocLayout-L_pretrained.pdparams " >训练模型</a ></td >
486
528
<td >90.4</td >
487
529
<td >34.6244 / 10.3945</td >
@@ -508,7 +550,7 @@ devanagari_PP-OCRv3_mobile_rec_infer.tar">推理模型</a>/<a href="https://padd
508
550
</tbody >
509
551
</table >
510
552
511
- > ❗ 以上列出的是版面检测模块重点支持的<b >3个核心模型 </b >,该模块总共支持<b >11个全量模型 </b >,包含多个预定义了不同类别的模型,完整的模型列表如下:
553
+ > ❗ 以上列出的是版面检测模块重点支持的<b >4个核心模型 </b >,该模块总共支持<b >12个全量模型 </b >,包含多个预定义了不同类别的模型,完整的模型列表如下:
512
554
<details> <summary > 👉模型列表详情</summary >
513
555
* <b> 表格版面检测模型</b >
514
556
<table>
@@ -1984,4 +2026,56 @@ for i, res in enumerate(result["tableRecResults"]):
1984
2026
1985
2027
如果通用表格识别v2产线提供的默认模型权重在您的场景中,精度或速度不满意,您可以尝试利用<b >您自己拥有的特定领域或应用场景的数据</b >对现有模型进行进一步的<b >微调</b >,以提升通用表格识别v2产线的在您的场景中的识别效果。
1986
2028
1987
- ......
2029
+ 由于通用表格识别v2产线包含若干模块,模型产线的效果如果不及预期,可能来自于其中任何一个模块。您可以对识别效果差的图片进行分析,进而确定是哪个模块存在问题,并参考以下表格中对应的微调教程链接进行模型微调。
2030
+
2031
+ <table >
2032
+ <thead >
2033
+ <tr >
2034
+ <th >情形</th >
2035
+ <th >微调模块</th >
2036
+ <th >微调参考链接</th >
2037
+ </tr >
2038
+ </thead >
2039
+ <tbody >
2040
+ <tr >
2041
+ <td >表格分类错误</td >
2042
+ <td >表格分类模块</td >
2043
+ <td ><a href =" " >链接</a ></td >
2044
+ </tr >
2045
+ <tr >
2046
+ <td >表格单元格定位错误</td >
2047
+ <td >表格单元格检测模块</td >
2048
+ <td ><a href =" " >链接</a ></td >
2049
+ </tr >
2050
+ <tr >
2051
+ <td >表格结构识别错误</td >
2052
+ <td >表格结构识别模块</td >
2053
+ <td ><a href =" " >链接</a ></td >
2054
+ </tr >
2055
+ <tr >
2056
+ <td >未能成功检测到表格所在区域</td >
2057
+ <td >版面区域检测模块</td >
2058
+ <td ><a href =" " >链接</a ></td >
2059
+ </tr >
2060
+ <tr >
2061
+ <td >文本存在漏检</td >
2062
+ <td >文本检测模块</td >
2063
+ <td ><a href =" " >链接</a ></td >
2064
+ </tr >
2065
+ <tr >
2066
+ <td >文本内容都不准</td >
2067
+ <td >文本识别模块</td >
2068
+ <td ><a href =" " >链接</a ></td >
2069
+ </tr >
2070
+ <tr >
2071
+ <td >整图旋转/表格旋转矫正不准</td >
2072
+ <td >文档图像方向分类模块</td >
2073
+ <td ><a href =" " >链接</a ></td >
2074
+ </tr >
2075
+ <tr >
2076
+ <td >图像扭曲矫正不准</td >
2077
+ <td >文本图像矫正模块</td >
2078
+ <td >暂不支持微调</td >
2079
+ </tr >
2080
+ </tbody >
2081
+ </table >
0 commit comments