Skip to content

Commit 5f3f747

Browse files
committed
refine docs
1 parent 2bba651 commit 5f3f747

File tree

1 file changed

+96
-2
lines changed

1 file changed

+96
-2
lines changed

docs/version3.x/pipeline_usage/table_recognition_v2.md

Lines changed: 96 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -39,6 +39,23 @@ comments: true
3939
<th>介绍</th>
4040
</tr>
4141
<tr>
42+
<td>SLANet</td><td><a href="https://paddle-model-ecology.bj.bcebos.com/paddlex/official_inference_model/paddle3.0.0/SLANet_infer.tar">推理模型</a>/<a href="https://paddle-model-ecology.bj.bcebos.com/paddlex/official_pretrained_model/SLANet_pretrained.pdparams">训练模型</a></td>
43+
<td>59.52</td>
44+
<td>103.08 / 103.08</td>
45+
<td>197.99 / 197.99</td>
46+
<td>6.9 M</td>
47+
<td rowspan="1">SLANet 是百度飞桨视觉团队自研的表格结构识别模型。该模型通过采用 CPU 友好型轻量级骨干网络 PP-LCNet、高低层特征融合模块 CSP-PAN、结构与位置信息对齐的特征解码模块 SLA Head,大幅提升了表格结构识别的精度和推理速度。</td>
48+
</tr>
49+
<tr>
50+
<td>SLANet_plus</td><td><a href="https://paddle-model-ecology.bj.bcebos.com/paddlex/official_inference_model/paddle3.0.0/SLANet_plus_infer.tar">推理模型</a>/<a href="https://paddle-model-ecology.bj.bcebos.com/paddlex/official_pretrained_model/SLANet_plus_pretrained.pdparams">训练模型</a></td>
51+
<td>63.69</td>
52+
<td>140.29 / 140.29</td>
53+
<td>195.39 / 195.39</td>
54+
<td>6.9 M</td>
55+
<td rowspan="1">SLANet_plus 是百度飞桨视觉团队自研的表格结构识别模型 SLANet 的增强版。相较于 SLANet,SLANet_plus 对无线表、复杂表格的识别能力得到了大幅提升,并降低了模型对表格定位准确性的敏感度,即使表格定位出现偏移,也能够较准确地进行识别。
56+
</td>
57+
</tr>
58+
<tr>
4259
<td>SLANeXt_wired</td>
4360
<td><a href="https://paddle-model-ecology.bj.bcebos.com/paddlex/official_inference_model/paddle3.0.0/SLANeXt_wired_infer.tar">推理模型</a>/<a href="https://paddle-model-ecology.bj.bcebos.com/paddlex/official_pretrained_model/SLANeXt_wired_pretrained.pdparams">训练模型</a></td>
4461
<td rowspan="2">69.65</td>
@@ -113,6 +130,22 @@ comments: true
113130
<th>CPU推理耗时(ms)<br/>[常规模式 / 高性能模式]</th>
114131
<th>模型存储大小(M)</th>
115132
<th>介绍</th>
133+
<tr>
134+
<td>PP-OCRv5_server_det</td><td><a href="https://paddle-model-ecology.bj.bcebos.com/paddlex/official_inference_model/paddle3.0.0/PP-OCRv5_server_det_infer.tar">推理模型</a>/<a href="https://paddle-model-ecology.bj.bcebos.com/paddlex/official_pretrained_model/PP-OCRv5_server_det_pretrained.pdparams">训练模型</a></td>
135+
<td>83.8</td>
136+
<td>- / -</td>
137+
<td>- / -</td>
138+
<td>101</td>
139+
<td>PP-OCRv5 的服务端文本检测模型,精度更高,适合在性能较好的服务器上部署</td>
140+
</tr>
141+
<tr>
142+
<td>PP-OCRv5_mobile_det</td><td><a href="https://paddle-model-ecology.bj.bcebos.com/paddlex/official_inference_model/paddle3.0.0/PP-OCRv5_mobile_det_infer.tar">推理模型</a>/<a href="https://paddle-model-ecology.bj.bcebos.com/paddlex/official_pretrained_model/PP-OCRv5_mobile_det_pretrained.pdparams">训练模型</a></td>
143+
<td>79.0</td>
144+
<td>- / -</td>
145+
<td>- / -</td>
146+
<td>4.7</td>
147+
<td>PP-OCRv5 的移动端文本检测模型,效率更高,适合在端侧设备部署</td>
148+
</tr>
116149
</tr>
117150
</thead>
118151
<tbody>
@@ -482,6 +515,15 @@ devanagari_PP-OCRv3_mobile_rec_infer.tar">推理模型</a>/<a href="https://padd
482515
</thead>
483516
<tbody>
484517
<tr>
518+
<td>PP-DocLayout_plus-L</td><td><a href="https://paddle-model-ecology.bj.bcebos.com/paddlex/official_inference_model/paddle3.0.0/PP-DocLayout_plus-L_infer.tar">推理模型</a>/<a href="https://paddle-model-ecology.bj.bcebos.com/paddlex/official_pretrained_model/PP-DocLayout_plus-L_pretrained.pdparams">训练模型</a></td>
519+
<td>83.2</td>
520+
<td>34.6244 / 10.3945</td>
521+
<td>510.57 / - </td>
522+
<td>126.01 M</td>
523+
<td>基于RT-DETR-L在包含中英文论文、多栏杂志、报纸、PPT、合同、书本、试卷、研报、古籍、日文文档、竖版文字文档等场景的自建数据集训练的更高精度版面区域定位模型</td>
524+
</tr>
525+
<tr>
526+
<tr>
485527
<td>PP-DocLayout-L</td><td><a href="https://paddle-model-ecology.bj.bcebos.com/paddlex/official_inference_model/paddle3.0.0/PP-DocLayout-L_infer.tar">推理模型</a>/<a href="https://paddle-model-ecology.bj.bcebos.com/paddlex/official_pretrained_model/PP-DocLayout-L_pretrained.pdparams">训练模型</a></td>
486528
<td>90.4</td>
487529
<td>34.6244 / 10.3945</td>
@@ -508,7 +550,7 @@ devanagari_PP-OCRv3_mobile_rec_infer.tar">推理模型</a>/<a href="https://padd
508550
</tbody>
509551
</table>
510552

511-
> ❗ 以上列出的是版面检测模块重点支持的<b>3个核心模型</b>,该模块总共支持<b>11个全量模型</b>,包含多个预定义了不同类别的模型,完整的模型列表如下:
553+
> ❗ 以上列出的是版面检测模块重点支持的<b>4个核心模型</b>,该模块总共支持<b>12个全量模型</b>,包含多个预定义了不同类别的模型,完整的模型列表如下:
512554
<details><summary> 👉模型列表详情</summary>
513555
* <b>表格版面检测模型</b>
514556
<table>
@@ -1984,4 +2026,56 @@ for i, res in enumerate(result["tableRecResults"]):
19842026

19852027
如果通用表格识别v2产线提供的默认模型权重在您的场景中,精度或速度不满意,您可以尝试利用<b>您自己拥有的特定领域或应用场景的数据</b>对现有模型进行进一步的<b>微调</b>,以提升通用表格识别v2产线的在您的场景中的识别效果。
19862028

1987-
......
2029+
由于通用表格识别v2产线包含若干模块,模型产线的效果如果不及预期,可能来自于其中任何一个模块。您可以对识别效果差的图片进行分析,进而确定是哪个模块存在问题,并参考以下表格中对应的微调教程链接进行模型微调。
2030+
2031+
<table>
2032+
<thead>
2033+
<tr>
2034+
<th>情形</th>
2035+
<th>微调模块</th>
2036+
<th>微调参考链接</th>
2037+
</tr>
2038+
</thead>
2039+
<tbody>
2040+
<tr>
2041+
<td>表格分类错误</td>
2042+
<td>表格分类模块</td>
2043+
<td><a href="">链接</a></td>
2044+
</tr>
2045+
<tr>
2046+
<td>表格单元格定位错误</td>
2047+
<td>表格单元格检测模块</td>
2048+
<td><a href="">链接</a></td>
2049+
</tr>
2050+
<tr>
2051+
<td>表格结构识别错误</td>
2052+
<td>表格结构识别模块</td>
2053+
<td><a href="">链接</a></td>
2054+
</tr>
2055+
<tr>
2056+
<td>未能成功检测到表格所在区域</td>
2057+
<td>版面区域检测模块</td>
2058+
<td><a href="">链接</a></td>
2059+
</tr>
2060+
<tr>
2061+
<td>文本存在漏检</td>
2062+
<td>文本检测模块</td>
2063+
<td><a href="">链接</a></td>
2064+
</tr>
2065+
<tr>
2066+
<td>文本内容都不准</td>
2067+
<td>文本识别模块</td>
2068+
<td><a href="">链接</a></td>
2069+
</tr>
2070+
<tr>
2071+
<td>整图旋转/表格旋转矫正不准</td>
2072+
<td>文档图像方向分类模块</td>
2073+
<td><a href="">链接</a></td>
2074+
</tr>
2075+
<tr>
2076+
<td>图像扭曲矫正不准</td>
2077+
<td>文本图像矫正模块</td>
2078+
<td>暂不支持微调</td>
2079+
</tr>
2080+
</tbody>
2081+
</table>

0 commit comments

Comments
 (0)