Skip to content

Commit 4828b18

Browse files
authored
Update tsn_dali.md
1 parent 1ebeb7a commit 4828b18

File tree

1 file changed

+8
-7
lines changed

1 file changed

+8
-7
lines changed

docs/zh-CN/model_zoo/recognition/tsn_dali.md

Lines changed: 8 additions & 7 deletions
Original file line numberDiff line numberDiff line change
@@ -1,3 +1,5 @@
1+
[English](../../../en/model_zoo/recognition/tsn_dali.md) | 简体中文
2+
13
# TSN模型-DALI训练加速
24

35
- [方案简介](#方案简介)
@@ -9,7 +11,7 @@
911
- [参考文献](#参考文献)
1012

1113
## 方案简介
12-
训练速度慢是视频模型训练常见的问题,PaddleVideo使用飞桨2.0的dataloader接口进行数据读取,凭借其优异的多进程加速能力,模型的训练速度可以显著增加。TSN是视频领域常用的2D模型,我们对其训练速度进行了进一步优化。基于nvidia DALI的GPU解码能力,我们对nvidia DALI进行了二次开发,实现了其均匀分段的帧采样方式,进一步提升了TSN模型的训练速度。
14+
训练速度慢是视频模型训练常见的问题,PaddleVideo使用飞桨2.0的dataloader接口进行数据读取,凭借其优异的多进程加速能力,模型的训练速度可以显著增加。TSN是视频领域常用的2D模型,我们对其训练速度进行了进一步优化。基于[nvidia DALI](https://github.com/NVIDIA/DALI)的GPU解码能力,我们对nvidia DALI进行了二次开发,实现了其均匀分段的帧采样方式,进一步提升了TSN模型的训练速度。
1315

1416
### 性能
1517

@@ -23,13 +25,12 @@ Cuda: 9.0
2325

2426
训练速度对比如下:
2527

26-
| 加速方式 | batch耗时/s | reader耗时/s | ips:instance/sec |
27-
| :--------------- | :--------: | :------------: | :------------: |
28-
| DALI | 2.083 | 1.804 | 15.36597 |
29-
| Dataloader: 单卡num_workers=4 | 2.943 | 2.649 | 10.87460|
30-
| pytorch实现 | TODO | TODO | TODO |
28+
| 加速方式 | batch耗时/s | reader耗时/s | ips:instance/sec | 加速比 |
29+
| :--------------- | :--------: | :------------: | :------------: | :------------: |
30+
| DALI | 2.083 | 1.804 | 15.36597 | 1.41x |
31+
| Dataloader: 单卡num_workers=4 | 2.943 | 2.649 | 10.87460| base |
32+
| pytorch实现 | TODO | TODO | TODO | TODO |
3133

32-
可以看到,使用DALI可以进一步加速模型训练,相较于dataloader,加速比约为1.5倍。
3334

3435
## 环境配置
3536

0 commit comments

Comments
 (0)