AlphaZero_Gomoku

本项目主要是采用蒙特卡洛搜索树与残差神经网络实现的一个可在小规模硬件设施上短期训练一个拥有较强棋力的五子棋 AI。参考 AlphaGo Zero 原始论文《Mastering the game of Go without human knowledge》实现的一个在五子棋游戏上的复现，实现过程中采用相应的原创性方法进行改进，使其算法更加适应项目需求并最终取得的较好的效果。MCTS 部分使用 C++编写的带虚拟损失的树并行版本的 Python 扩展，训练管道与神经网络部分均使用 Python 编写。

模型与弈心的部分对弈棋谱（模型执黑）

人机对弈运行截图

由于本人只在一块GTX1060的笔记本显卡上训练了3天，所以其实模型性能上还是可以有很大的提升的，但是这并不影响本项目的模型仍有棋力非常强劲，在无禁手规则下，理论上先手条件下人类玩家几乎无法战胜，后手条件下也以极大胜率战胜人类玩家，对战弈心的职业四段棋力,在先手条件下，也有小概率可以获胜（大约10局赢1到2局)

项目实现的功能

人机对弈
模型与弈心对弈
模型自对弈强化学习

可能需要

Windows 10; NVIDIA显卡; Python 3.8; VS 2019; CUDA 11.3; PyTorch 1.10 Libtorch 1.10

文件结构

Data文件夹中保存的是模型自对弈训练过程中生成的部分数据
Models文件夹中保存的是模型数据，分别为Libtorch模型和Pytorch模型

安装弈心

运行YiXin2017_May.exe文件安装弈心程序

注意

本程序并未编写图形界面部分的代码，为了使得人机对弈的体验更佳，我们使用的是弈心的对弈界面，所以在运行过程中尽量不要让窗口覆盖住弈心程序的窗口
如果只想了解神经网络部分内容或者只是进行简单对弈体验棋力，不需要下载Libtorch,蒙特卡洛搜索树部分的代码我们已经打包为CppLibs.pyd(window) CppLibs.so(linux)，可以直接当成python扩展包进行调用
各个文件的具体实现功能以及算法训练和原理在上述AlphaZero_Gomoku.pdf文档,其中进行了非常详细的讲解，可以进行浏览学习，有其他问题可以在issues中进行提问

模型与玩家对弈

运行弈心程序
直接运行Scripts_function.py文件
在弈心的图像界面中进行落子对弈

提示：start函数中的cnt起始值决定玩家先手还是模型先手，0为模型先手，1为玩家先手可以自行设置，默认为模型先手

模型与弈心对弈

运行弈心程序，可以自行设置弈心的难度
将Scripts_function.py中start函数中的TURN_by_human替换为TURN
运行Scripts_function.py文件，可以在弈心的程序窗口观看模型与弈心的对弈过程

训练

直接运行train.py文件即可，可在config.py文件中修改训练参数

致谢

本项目主要是在以下两位的工作基础上展开拓展的，非常感谢他们的工作

Name		Name	Last commit message	Last commit date
Latest commit History 29 Commits
Data		Data
Image		Image
Models		Models
APV_MCTS.cpp		APV_MCTS.cpp
APV_MCTS.h		APV_MCTS.h
AlphaZero_Gomoku.pdf		AlphaZero_Gomoku.pdf
CMakeLists.txt		CMakeLists.txt
CppLibs.cpp		CppLibs.cpp
CppLibs.cpython-38-x86_64-linux-gnu.so		CppLibs.cpython-38-x86_64-linux-gnu.so
CppLibs.pyd		CppLibs.pyd
GomokuBoard.cpp		GomokuBoard.cpp
GomokuBoard.h		GomokuBoard.h
NeuralNet.cpp		NeuralNet.cpp
NeuralNet.h		NeuralNet.h
README.md		README.md
Scripts_function.py		Scripts_function.py
ThreadPool.h		ThreadPool.h
Yixin2017_May.exe		Yixin2017_May.exe
config.py		config.py
human.cpp		human.cpp
policy_value_net.py		policy_value_net.py
test.cpp		test.cpp
train.py		train.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

AlphaZero_Gomoku

项目实现的功能

可能需要

文件结构

安装弈心

注意

模型与玩家对弈

提示：start函数中的cnt起始值决定玩家先手还是模型先手，0为模型先手，1为玩家先手可以自行设置，默认为模型先手

模型与弈心对弈

训练

致谢

About

Releases

Packages

Languages

yfismine/AlphaZeroGomoku

Folders and files

Latest commit

History

Repository files navigation

AlphaZero_Gomoku

项目实现的功能

可能需要

文件结构

安装弈心

注意

模型与玩家对弈

提示：start函数中的cnt起始值决定玩家先手还是模型先手，0为模型先手，1为玩家先手可以自行设置，默认为模型先手

模型与弈心对弈

训练

致谢

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages