Skip to content

Membangun sebuah sistem Q-learning untuk menemukan optimum policy sehingga Agent yang berada di posisi Start (1,1) mampu menemukan Goal yang berada di posisi (10,10) dengan mendapatkan Total Reward maksimum

Notifications You must be signed in to change notification settings

SarahFLestari/Qlearning

About

Membangun sebuah sistem Q-learning untuk menemukan optimum policy sehingga Agent yang berada di posisi Start (1,1) mampu menemukan Goal yang berada di posisi (10,10) dengan mendapatkan Total Reward maksimum

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages