|
| 1 | +# 海光 DCU 安装说明 |
| 2 | + |
| 3 | +飞桨框架 DCU 版支持海光 DCU 的训练和推理,提供两种安装方式: |
| 4 | + |
| 5 | +1. 通过飞桨官网发布的 wheel 包安装 |
| 6 | +2. 通过源代码编译安装得到 wheel 包 |
| 7 | + |
| 8 | +## 海光 DCU 系统要求 |
| 9 | + |
| 10 | +| 要求类型 | 要求内容 | |
| 11 | +| --------- | -------- | |
| 12 | +| 芯片型号 | 海光 Z100 系列芯片,包括 Z100、Z100L | |
| 13 | +| 操作系统 | Linux 操作系统,包括 CentOS、KylinV10 | |
| 14 | + |
| 15 | +## 运行环境准备 |
| 16 | + |
| 17 | +推荐使用飞桨官方发布的海光 DCU 开发镜像,该镜像预装有海光 DCU 基础运行环境库(DTK)。 |
| 18 | + |
| 19 | +```bash |
| 20 | +# 拉取镜像 |
| 21 | +docker pull registry.baidubce.com/device/paddle-dcu:dtk23.10.1-kylinv10-gcc73-py310 |
| 22 | + |
| 23 | +# 参考如下命令,启动容器 |
| 24 | +docker run -it --name paddle-dcu-dev -v $(pwd):/work \ |
| 25 | + --workdir=/work --shm-size=128G --network=host \ |
| 26 | + --device=/dev/kfd --device=/dev/dri --group-add video \ |
| 27 | + --cap-add=SYS_PTRACE --security-opt seccomp=unconfined \ |
| 28 | + registry.baidubce.com/device/paddle-dcu:dtk23.10.1-kylinv10-gcc73-py310 /bin/bash |
| 29 | + |
| 30 | +# 检查容器内是否可以正常识别海光 DCU 设备 |
| 31 | +rocm-smi |
| 32 | + |
| 33 | +# 预期得到输出如下 |
| 34 | +============System Management Interface ============ |
| 35 | +==================================================== |
| 36 | +DCU Temp AvgPwr Fan Perf PwrCap VRAM% DCU% |
| 37 | +0 30.0c 38.0W 0.0% auto 280.0W 0% 0% |
| 38 | +1 30.0c 41.0W 0.0% auto 280.0W 0% 0% |
| 39 | +2 29.0c 38.0W 0.0% auto 280.0W 0% 0% |
| 40 | +3 29.0c 39.0W 0.0% auto 280.0W 0% 0% |
| 41 | +==================================================== |
| 42 | +===================End of SMI Log=================== |
| 43 | +``` |
| 44 | + |
| 45 | +## 安装飞桨框架 |
| 46 | + |
| 47 | +**注意**:飞桨框架 DCU 版仅支持海光 C86 架构。 |
| 48 | + |
| 49 | +### 安装方式一:wheel 包安装 |
| 50 | + |
| 51 | +在启动的 docker 容器中,下载并安装飞桨官网发布的 wheel 包。 |
| 52 | + |
| 53 | +```bash |
| 54 | +# 下载 wheel 包 |
| 55 | +wget https://paddle-device.bj.bcebos.com/0.0.0/dcu/paddlepaddle_rocm-0.0.0-cp310-cp310-linux_x86_64.whl |
| 56 | + |
| 57 | +# 安装 wheel 包 |
| 58 | +pip install -U paddlepaddle_rocm-0.0.0-cp310-cp310-linux_x86_64.whl |
| 59 | +``` |
| 60 | + |
| 61 | +### 安装方式二:源代码编译安装 |
| 62 | + |
| 63 | +在启动的 docker 容器中,下载 Paddle 源码并编译,CMAKE 编译选项含义请参见[编译选项表](https://www.paddlepaddle.org.cn/documentation/docs/zh/develop/install/Tables.html#Compile)。 |
| 64 | + |
| 65 | +```bash |
| 66 | +# 下载 Paddle 源码 |
| 67 | +git clone https://github.com/PaddlePaddle/Paddle.git -b develop |
| 68 | +cd Paddle |
| 69 | + |
| 70 | +# 创建编译目录 |
| 71 | +mkdir build && cd build |
| 72 | + |
| 73 | +# cmake 编译命令 |
| 74 | +cmake .. -DCMAKE_EXPORT_COMPILE_COMMANDS=ON -DCMAKE_CXX_FLAGS="-Wno-error -w" \ |
| 75 | + -DPY_VERSION=3.10 -DPYTHON_EXECUTABLE=`which python3` -DWITH_CUSTOM_DEVICE=OFF \ |
| 76 | + -DWITH_TESTING=OFF -DON_INFER=ON -DWITH_DISTRIBUTE=ON -DWITH_MKL=ON \ |
| 77 | + -DWITH_ROCM=ON -DWITH_RCCL=ON |
| 78 | + |
| 79 | +# make 编译命令 |
| 80 | +make -j16 |
| 81 | + |
| 82 | +# 编译产出在 build/python/dist/ 路径下,使用 pip 安装即可 |
| 83 | +pip install -U paddlepaddle_rocm-0.0.0-cp310-cp310-linux_x86_64.whl |
| 84 | +``` |
| 85 | + |
| 86 | +## 基础功能检查 |
| 87 | + |
| 88 | +安装完成后,在 docker 容器中输入如下命令进行飞桨基础健康功能的检查。 |
| 89 | + |
| 90 | +```bash |
| 91 | +# 检查当前安装版本 |
| 92 | +python -c "import paddle; paddle.version.show()" |
| 93 | +# 预期得到输出如下 |
| 94 | +commit: d37bd8bcf75cf51f6c1117526f3f67d04946ebb9 |
| 95 | +cuda: False |
| 96 | +cudnn: False |
| 97 | +nccl: 0 |
| 98 | + |
| 99 | +# 飞桨基础健康检查 |
| 100 | +python -c "import paddle; paddle.utils.run_check()" |
| 101 | +# 预期得到输出如下 |
| 102 | +Running verify PaddlePaddle program ... |
| 103 | +PaddlePaddle works well on 1 GPU. |
| 104 | +PaddlePaddle works well on 8 GPUs. |
| 105 | +PaddlePaddle is installed successfully! Let's start deep learning with PaddlePaddle now. |
| 106 | +``` |
| 107 | +
|
| 108 | +## 如何卸载 |
| 109 | +
|
| 110 | +请使用以下命令卸载: |
| 111 | +
|
| 112 | +```bash |
| 113 | +pip uninstall paddlepaddle-rocm |
| 114 | +``` |
0 commit comments