Le sous-apprentissage survient quand un modèle est trop simple pour apprendre la structure des données, d'où de mauvaises performances même à l'entraînement.
📖 Définition
Le sous-apprentissage (underfitting) survient lorsqu'un modèle est trop simple pour capturer la structure réelle des données : il ne parvient pas à apprendre les relations importantes et obtient de mauvaises performances même sur les données d'entraînement. C'est le défaut opposé du surapprentissage : alors qu'un modèle en surapprentissage « mémorise » ses exemples, un modèle en sous-apprentissage n'apprend pas assez. Le signe caractéristique est une erreur élevée à la fois sur le jeu d'entraînement et sur le jeu de test (le surapprentissage, lui, donne une faible erreur en entraînement mais une forte erreur en test). Les causes typiques : un modèle pas assez complexe (par exemple une droite pour des données courbes), trop peu de variables (features) pertinentes, ou un entraînement interrompu trop tôt. Les remèdes : choisir un modèle plus expressif, ajouter des variables informatives, réduire la régularisation, ou prolonger l'entraînement. Trouver le bon équilibre entre sous-apprentissage et surapprentissage est au cœur du compromis biais-variance.
💬 En termes simples
C'est comme réviser un examen en ne retenant qu'une règle générale trop vague : on rate aussi bien les exercices du cours que les questions de l'examen, faute d'avoir vraiment compris la matière.
🎯 Exemple concret
On tente de prédire le prix de maisons avec une simple droite alors que le vrai lien est courbe : le modèle se trompe d'environ 30 % autant sur les maisons d'entraînement que sur de nouvelles, signe qu'il est trop simple.
💡 Le saviez-vous ?
Un modèle en sous-apprentissage peut donner l'illusion d'être « stable » parce qu'il se trompe de façon constante ; c'est pourtant le signe qu'il n'a presque rien appris.
❓ Questions fréquentes
Comment reconnaître le sous-apprentissage ?
Par une erreur élevée à la fois sur les données d'entraînement et de test ; le surapprentissage, lui, donne une faible erreur en entraînement mais élevée en test.
Comment y remédier ?
Utiliser un modèle plus complexe, ajouter des variables pertinentes, réduire la régularisation ou entraîner plus longtemps.
Reçois chaque semaine le meilleur de l'actualité IA, directement dans ta boîte.
Pas de pourriel, désinscription en 1 clic.
✉️
Restez informé
Recevez nos sélections d'outils et articles directement dans votre boîte courriel.
🔐 Connexion rapide
Entrez votre courriel pour recevoir un code à 6 chiffres.
Pas besoin de mot de passe ni d'inscription. Entrez votre courriel, recevez un code par courriel, et c'est tout !
✓
Paramètres de confidentialité
Nous utilisons des témoins (cookies) pour assurer le bon fonctionnement du site, analyser le trafic et personnaliser le contenu. Vous pouvez gérer vos préférences ci-dessous.
Politique de confidentialité