Généralisation

Terme Intermédiaire 🧠 Concepts fondamentaux

Mis à jour le 22 juillet 2026

En bref

La généralisation est la capacité d'un modèle à rester performant sur des données nouvelles, jamais rencontrées pendant l'entraînement.

📖 Définition

La généralisation désigne la capacité d'un modèle d'apprentissage automatique à bien performer sur de nouvelles données, jamais vues pendant l'entraînement. C'est le but ultime de l'apprentissage : on ne veut pas un modèle qui récite par cœur ses exemples, mais un modèle qui a saisi des régularités transposables à des cas inédits. Un modèle qui généralise bien obtient des performances comparables sur ses données d'entraînement et sur un jeu de test indépendant. À l'inverse, un fort écart entre les deux signale un surapprentissage (le modèle a « mémorisé » au lieu d'apprendre) ; de mauvaises performances partout signalent un sous-apprentissage. La généralisation est étroitement liée au compromis biais-variance et se favorise par des techniques comme la régularisation, l'augmentation de données ou la validation croisée. C'est elle qui distingue un modèle réellement utile d'un modèle qui ne fonctionne qu'en laboratoire.

💬 En termes simples

C'est comme un élève qui a vraiment compris une matière : il sait répondre à des questions nouvelles à l'examen, et pas seulement réciter les exercices corrigés en classe.

🎯 Exemple concret

Un modèle entraîné à reconnaître des chats sur 10 000 photos est jugé sur sa généralisation : s'il identifie correctement des chats sur des photos jamais vues, avec une précision proche de celle de l'entraînement, il généralise bien.

💡 Le saviez-vous ?

Augmenter indéfiniment la précision sur les données d'entraînement peut nuire à la généralisation : passé un certain point, le modèle se met à apprendre le « bruit » plutôt que le signal.

❓ Questions fréquentes

Pourquoi la généralisation est-elle si importante ?

Parce qu'un modèle n'a de valeur que s'il fonctionne sur des données réelles inédites, pas seulement sur ses exemples d'entraînement.

Quel lien avec le surapprentissage ?

Le surapprentissage est précisément un défaut de généralisation : le modèle excelle sur l'entraînement mais échoue sur les nouvelles données.

Accueil

Outils

Annuaire

Apprendre