File tree 1 file changed +8
-7
lines changed
docs/zh-CN/model_zoo/recognition
1 file changed +8
-7
lines changed Original file line number Diff line number Diff line change
1
+ [ English] ( ../../../en/model_zoo/recognition/tsn_dali.md ) | 简体中文
2
+
1
3
# TSN模型-DALI训练加速
2
4
3
5
- [ 方案简介] ( #方案简介 )
9
11
- [ 参考文献] ( #参考文献 )
10
12
11
13
## 方案简介
12
- 训练速度慢是视频模型训练常见的问题,PaddleVideo使用飞桨2.0的dataloader接口进行数据读取,凭借其优异的多进程加速能力,模型的训练速度可以显著增加。TSN是视频领域常用的2D模型,我们对其训练速度进行了进一步优化。基于nvidia DALI的GPU解码能力 ,我们对nvidia DALI进行了二次开发,实现了其均匀分段的帧采样方式,进一步提升了TSN模型的训练速度。
14
+ 训练速度慢是视频模型训练常见的问题,PaddleVideo使用飞桨2.0的dataloader接口进行数据读取,凭借其优异的多进程加速能力,模型的训练速度可以显著增加。TSN是视频领域常用的2D模型,我们对其训练速度进行了进一步优化。基于 [ nvidia DALI ] ( https://github.com/NVIDIA/DALI ) 的GPU解码能力 ,我们对nvidia DALI进行了二次开发,实现了其均匀分段的帧采样方式,进一步提升了TSN模型的训练速度。
13
15
14
16
### 性能
15
17
@@ -23,13 +25,12 @@ Cuda: 9.0
23
25
24
26
训练速度对比如下:
25
27
26
- | 加速方式 | batch耗时/s | reader耗时/s | ips: instance /sec |
27
- | :--------------- | :--------: | :------------: | :------------: |
28
- | DALI | 2.083 | 1.804 | 15.36597 |
29
- | Dataloader: 单卡num_workers=4 | 2.943 | 2.649 | 10.87460|
30
- | pytorch实现 | TODO | TODO | TODO |
28
+ | 加速方式 | batch耗时/s | reader耗时/s | ips: instance /sec | 加速比 |
29
+ | :--------------- | :--------: | :------------: | :------------: | :------------: |
30
+ | DALI | 2.083 | 1.804 | 15.36597 | 1.41x |
31
+ | Dataloader: 单卡num_workers=4 | 2.943 | 2.649 | 10.87460| base |
32
+ | pytorch实现 | TODO | TODO | TODO | TODO |
31
33
32
- 可以看到,使用DALI可以进一步加速模型训练,相较于dataloader,加速比约为1.5倍。
33
34
34
35
## 环境配置
35
36
You can’t perform that action at this time.
0 commit comments