Apprendre le 421

L'apprentissage automatique consiste à rendre un logiciel capable d'apprendre par lui-même. Dans le cadre qui nous intéresse, le logiciel doit apprendre un comportement à adopter dans le cadre d'un jeu. L'apprentissage s'effectue en renforçant ces connaissances avec sa propre expérience. Jouer et apprendre en jouant.

Support (PDF)

Mise en pratique:

Implémenter un "Q-Learning" sur le jeu 421.

Étapes:

Initialiser un dictionnaire des Q-Valeurs.
Mettre à jour ce dictionnaire pour chaque état croisé. ('perciece')
Décider sur une modalité epsilon greedy

Aller plus loin: identifier dans votre cadre professionnel une problématique de prise de décision séquentielle.

Plus de détail sur la page de Q-learning en python proposant une aide pour une implémentation simple.

PreviousIntroduction Next(Q-learning en Python)

Last updated 3 years ago

Was this helpful?

hashtagMise en pratique:

Mise en pratique: