Différences entre les versions de « Apprentissage par renforcement »

Version actuelle datée du 2 mai 2022 à 23:05

L’apprentissage par renforcement correspond au cas où l'algorithme apprend un comportement étant donnée une observation. L'action de l'algorithme sur l'environnement produit une valeur de retour qui guide l'algorithme d'apprentissage.

Différences entre les versions de « Apprentissage par renforcement »

Version actuelle datée du 2 mai 2022 à 23:05

Menu de navigation

Rechercher

Différences entre les versions de « Apprentissage par renforcement »