· Vincent Bourdon · video · 1 min read
Reinforcement Learning - Part 5: Statistiques des agents
Un épisode de la série reinforcement learning consacré à la collecte de statistiques pour comparer le comportement des différents agents.

Cet épisode de la série reinforcement learning est consacré à la collecte de statistiques pour comparer le comportement des différents agents. Bumble dev avance de façon incrémentale pour construire un projet pédagogique autour d’un jeu de Tic Tac Toe codé en C#.
L’intérêt de la série est de rendre un sujet souvent perçu comme abstrait beaucoup plus concret. En découpant le projet en petites étapes, la vidéo permet de comprendre progressivement les briques nécessaires avant de parler d’apprentissage et de stratégie.



