Historique des versions de « Apprentissage par renforcement »

Aller à la navigation Aller à la recherche

Sélection du diff : cochez les boutons radio des versions à comparer et appuyez sur entrée ou sur le bouton en bas.
Légende : (actu) = différence avec la dernière version, (diff) = différence avec la version précédente, m = modification mineure.

  • actudiff 2 mai 2022 à 23:05Eren Atolgan discussion contributions 239 octets +239 Page créée avec « L’apprentissage par renforcement correspond au cas où l'algorithme apprend un comportement étant donnée une observation. L'action de l'algorithme sur l'environnement produit une valeur de retour qui guide l'algorithme d'apprentissage. »