Différences entre les versions de « Apprentissage par renforcement »
Aller à la navigation
Aller à la recherche
(Page créée avec « L’apprentissage par renforcement correspond au cas où l'algorithme apprend un comportement étant donnée une observation. L'action de l'algorithme sur l'environnement produit une valeur de retour qui guide l'algorithme d'apprentissage. ») |
(Aucune différence)
|
Version actuelle datée du 2 mai 2022 à 23:05
L’apprentissage par renforcement correspond au cas où l'algorithme apprend un comportement étant donnée une observation. L'action de l'algorithme sur l'environnement produit une valeur de retour qui guide l'algorithme d'apprentissage.