L'entraînement d'un agent d'intelligence artificielle consiste à lui apprendre à prendre des décisions pour atteindre un objectif. On peut comparer cela à l'éducation d'un enfant ou au dressage d'un animal.
1. L'apprentissage supervisé
(L'élève et le professeur)
C’est la méthode la plus courante. On donne à l'IA une immense base de données où chaque exemple contient déjà la réponse.
- Le principe : On montre une image de chat en disant « C’est un chat ». L'IA ajuste ses calculs jusqu'à ce qu'elle reconnaisse d'elle-même les motifs (oreilles, moustaches).
Analogie : Suivre un manuel scolaire où les corrigés sont à la fin de chaque exercice.
2. L'apprentissage non supervisé
(L'explorateur)
Ici, l'IA travaille seule sur des données qui ne sont pas étiquetées. Elle doit trouver des structures ou des points communs par elle-même.
- Le principe : On donne 10 000 photos d'animaux en vrac. L'IA va regrouper les oiseaux ensemble et les poissons ensemble, sans savoir comment ils s'appellent.
Analogie : Trier un bac de pièces de Lego par couleur ou par forme sans instructions.
3. L'apprentissage par renforcement
(L'essai et l'erreur)
C’est la méthode privilégiée pour les agents qui doivent agir dans un environnement (jeux vidéo, robots, voitures autonomes).
- Le principe : L'agent tente une action. S'il réussit, il reçoit une récompense (+). S'il échoue, il reçoit une pénalité.
Analogie : Dresser un chien avec des croquettes : il finit par comprendre que s'asseoir lui donne une récompense.
En résumé
| Méthode |
Source |
Objectif |
| Supervisé |
Données étiquetées |
Prédire / Classer |
| Non supervisé |
Données brutes |
Trouver des motifs |
| Renforcement |
Récompenses |
Stratégie d'action |