q-learning-delusion

A counterexample for Q-Learning, discussed in "Non-delusional Q-learning and value-iteration."

Lu, Tyler, Dale Schuurmans, and Craig Boutilier. "Non-delusional Q-learning and value-iteration." Advances in Neural Information Processing Systems. 2018.

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
.gitignore		.gitignore
LICENSE		LICENSE
Q-Learning Delusion.ipynb		Q-Learning Delusion.ipynb
README.md		README.md
agent.py		agent.py
environment.py		environment.py
rl_glue.py		rl_glue.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

q-learning-delusion

About

Releases

Packages

Languages

License

EhsanEI/q-learning-delusion

Folders and files

Latest commit

History

Repository files navigation

q-learning-delusion

About

Resources

License

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages