- 项目作者 王子瑞
- 文章地址 https://blog.csdn.net/wzduang/article/details/113093206
- 项目代码 https://github.com/Wongziseoi/PaddleMario
bilibili
- ubuntu 20.04
- python 3.8
- CUDA 11.2
- CUDNN 8.3
- paddlepaddle-gpu==2.2.2.post112
-
下载代码
$ git clone https://github.com/dyh/super_mario_bros_paddle.git
-
进入目录
$ cd super_mario_bros_paddle
-
创建 python 虚拟环境
$ python3 -m venv venv
-
激活虚拟环境
$ source venv/bin/activate
-
升级pip和setuptools
$ python -m pip install --upgrade pip $ pip install --upgrade setuptools
-
安装paddlepaddle
根据你的操作系统、安装工具以及CUDA版本,在 https://www.paddlepaddle.org.cn/install/quick?docurl=/documentation/docs/zh/install/pip/linux-pip.html 找到对应的安装命令。我的环境是 ubuntu 20.04、pip、CUDA 11.2。
$ python -m pip install paddlepaddle-gpu==2.2.2.post112 -f https://www.paddlepaddle.org.cn/whl/linux/mkl/avx/stable.html
-
安装其他包
$ pip install -r requirements.txt
-
运行多进程训练程序
设置 8 进程,总耗时 54.31 分钟,日志请见 train_log_1_1.txt 文件,大约 Episode: 352 完成第一关的训练
$ python train_mp.py
-
运行预测程序
第一关训练完成的权重文件保存在 ./models/mario_1_1.pdparams
$ python run_eval.py