Sous-apprentissage

Terme Intermédiaire 🧠 Concepts fondamentaux

Mis à jour le 22 juillet 2026

En bref

Le sous-apprentissage survient quand un modèle est trop simple pour apprendre la structure des données, d'où de mauvaises performances même à l'entraînement.

📖 Définition

Le sous-apprentissage (underfitting) survient lorsqu'un modèle est trop simple pour capturer la structure réelle des données : il ne parvient pas à apprendre les relations importantes et obtient de mauvaises performances même sur les données d'entraînement. C'est le défaut opposé du surapprentissage : alors qu'un modèle en surapprentissage « mémorise » ses exemples, un modèle en sous-apprentissage n'apprend pas assez. Le signe caractéristique est une erreur élevée à la fois sur le jeu d'entraînement et sur le jeu de test (le surapprentissage, lui, donne une faible erreur en entraînement mais une forte erreur en test). Les causes typiques : un modèle pas assez complexe (par exemple une droite pour des données courbes), trop peu de variables (features) pertinentes, ou un entraînement interrompu trop tôt. Les remèdes : choisir un modèle plus expressif, ajouter des variables informatives, réduire la régularisation, ou prolonger l'entraînement. Trouver le bon équilibre entre sous-apprentissage et surapprentissage est au cœur du compromis biais-variance.

💬 En termes simples

C'est comme réviser un examen en ne retenant qu'une règle générale trop vague : on rate aussi bien les exercices du cours que les questions de l'examen, faute d'avoir vraiment compris la matière.

🎯 Exemple concret

On tente de prédire le prix de maisons avec une simple droite alors que le vrai lien est courbe : le modèle se trompe d'environ 30 % autant sur les maisons d'entraînement que sur de nouvelles, signe qu'il est trop simple.

💡 Le saviez-vous ?

Un modèle en sous-apprentissage peut donner l'illusion d'être « stable » parce qu'il se trompe de façon constante ; c'est pourtant le signe qu'il n'a presque rien appris.

❓ Questions fréquentes

Comment reconnaître le sous-apprentissage ?

Par une erreur élevée à la fois sur les données d'entraînement et de test ; le surapprentissage, lui, donne une faible erreur en entraînement mais élevée en test.

Comment y remédier ?

Utiliser un modèle plus complexe, ajouter des variables pertinentes, réduire la régularisation ou entraîner plus longtemps.

Accueil

Outils

Annuaire

Apprendre