Flappy Biry Using Q Learning On Python

pip install numpy #可以在命令行中通过此命令安装pip

针对最经典的表格型Q learning算法进行了复现，能够支持gym中大多数的离散动作和状态空间的环境，譬如CliffWalking-v0。以悬崖寻路（CliffWalking-v0）为例，测试结果为 epoch: 998, avg_return: -13.0 针对最经典的表格型Q learning算法进行了复现，能够支持gym中大多数的离散 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果

pip install numpy #可以在命令行中通过此命令安装pip

今日热点