请问如何设置RT-DETR的最大输出检测框的数量 #15073
Replies: 2 comments 2 replies
-
RT-DETR(如RT-DETR-L_wired_table_cell_det和RT-DETR-L_wireless_table_cell_det)默认最大输出检测框数量为300,这是因为模型在推理时有一个nms_post_max_num(或post_process_topk)/max_per_img 参数,控制了NMS后输出的最大检测框数量。对于非常稠密的表格,确实有必要提升该值以保证所有单元格都能被检测出来。 设置方法参考:
注意事项:
结论: 如果上述参数在你使用的接口不可控,建议参考PaddleDetection的官方文档或源码说明进一步修改。 如需针对复杂表格调参提升识别效果,可参考讨论: 如何提高表格识别精度。 如需进一步协助(如具体接口代码修改),可补充你的调用方式。 Response generated by 🤖 feifei-bot | gpt-4.1 |
Beta Was this translation helpful? Give feedback.
-
呃,你后面找到这个目标检测的300在哪了吗 |
Beta Was this translation helpful? Give feedback.
-
根据这个文档 https://paddlepaddle.github.io/PaddleX/latest/module_usage/tutorials/ocr_modules/table_cells_detection.html 我想使用RT-DETR-L_wired_table_cell_det和RT-DETR-L_wireless_table_cell_det进行表格单元格的检测. 但是我发现这两个模型的最大输出数量是300. 我有些表格非常稠密, 需要输出数量超过300, 请问如何设置?
Beta Was this translation helpful? Give feedback.
All reactions