Apprendre le 421

L'apprentissage automatique consiste à rendre un logiciel capable d'apprendre par lui-même. Dans le cadre qui nous intéresse, le logiciel doit apprendre un comportement à adopter dans le cadre d'un jeu. L'apprentissage s'effectue en renforçant ces connaissances avec sa propre expérience. Jouer et apprendre en jouant.

Mise en pratique:

Implémenter un "Q-Learning" sur le jeu 421.

Étapes:

  1. Initialiser un dictionnaire des Q-Valeurs.

  2. Mettre à jour ce dictionnaire pour chaque état croisé. ('perciece')

  3. Décider sur une modalité epsilon greedy

Aller plus loin: identifier dans votre cadre professionnel une problématique de prise de décision séquentielle.

Plus de détail sur la page de Q-learning en python proposant une aide pour une implémentation simple.

Last updated

Was this helpful?