Apprendre le 421
L'apprentissage automatique consiste à rendre un logiciel capable d'apprendre par lui-même. Dans le cadre qui nous intéresse, le logiciel doit apprendre un comportement à adopter dans le cadre d'un jeu. L'apprentissage s'effectue en renforçant ces connaissances avec sa propre expérience. Jouer et apprendre en jouant.
Mise en pratique:
Implémenter un "Q-Learning" sur le jeu 421.
Étapes:
Initialiser un dictionnaire des Q-Valeurs.
Mettre à jour ce dictionnaire pour chaque état croisé. ('perciece')
Décider sur une modalité
epsilon greedy
Aller plus loin: identifier dans votre cadre professionnel une problématique de prise de décision séquentielle.
Plus de détail sur la page de Q-learning en python proposant une aide pour une implémentation simple.
Last updated
Was this helpful?