Reinforcement learning za Car Racing igru #9

bmijanovic · 2023-05-03T22:45:23Z

Cilj ovog problema je naučiti agenata (automobil) kako da se kreće po stazi u što kraćem vremenskom periodu.
U ovom okruženju, agent (automobil) ima pristup stanju igre, kao što su položaj i brzina automobila, ugao i brzina zakretanja volana, te senzori koji detektuju prepreke i udaljenost od ivica staze.
Ovo okruženje koristi Box2D engine iz gymnasium biblioteke. To uključuje ubrzanje, brzinu, trenje, gravitaciju, sudare i druge sile koje deluju na automobil.

Nagrada je -0.1 za svaki frejm, a +1000/N za svaki posećeni segment staze, gde je N ukupan broj posećenih segmenata u stazi. Na primer, ako je završeno u 732 frejma, nagrada je 1000 - 0.1*732 = 926.8 bodova.

Epizoda se završava kada se posete svi segmenti. Automobil takođe može da ode van staze, kada će dobiti kaznu od -100 bodova i izgubiti.

Fickos · 2023-05-18T18:32:10Z

Tema je odobrena.

rozicd · 2023-07-02T22:10:31Z

bandjeo added the Filip Volarić label May 14, 2023

Fickos added the Tema odobrena label May 18, 2023

Provide feedback