FA-PAIO
  • Project on AI & Opti.
  • Plan du module
  • Jeux et Évaluation
    • Le jeu 421
    • Le jeu Risky
    • Rendus Attendus
  • Agir et apprendre à agir
    • Introduction
    • Apprendre le 421
    • (Q-learning en Python)
    • Convergence au 421
    • Model-Based Learning
    • Passer à l'échelle
  • Heuristiques
    • Introduction
    • Rappel (1/2)
    • Rappel (2/2)
    • Stratégie
    • Étude des heuristiques (1/4)
    • Étude des heuristiques (2/4)
    • Étude des heuristiques (3/4)
    • Étude des heuristiques (4/4)
    • Propriétés des heuristiques
    • Qualité des heuristiques (1/2)
    • Qualité des heuristiques (2/2)
    • Production d'heuristiques
  • Théorie des jeux
    • Introduction
Powered by GitBook
On this page

Was this helpful?

  1. Agir et apprendre à agir

Apprendre le 421

PreviousIntroductionNext(Q-learning en Python)

Last updated 2 years ago

Was this helpful?

L'apprentissage automatique consiste à rendre un logiciel capable d'apprendre par lui-même. Dans le cadre qui nous intéresse, le logiciel doit apprendre un comportement à adopter dans le cadre d'un jeu. L'apprentissage s'effectue en renforçant ces connaissances avec sa propre expérience. Jouer et apprendre en jouant.

Mise en pratique:

Implémenter un "Q-Learning" sur le jeu 421.

Étapes:

  1. Initialiser un dictionnaire des Q-Valeurs.

  2. Mettre à jour ce dictionnaire pour chaque état croisé. ('perciece')

  3. Décider sur une modalité epsilon greedy

Aller plus loin: identifier dans votre cadre professionnel une problématique de prise de décision séquentielle.

Plus de détail sur la page de proposant une aide pour une implémentation simple.

Support (PDF)
Q-learning en python