Données d'entraînement
Aussi appelé : training data · jeu de données d'apprentissage · dataset d'entraînement · données d'apprentissage
Mis à jour le
Les données d'entraînement sont l'ensemble des informations (textes, images, sons) utilisées par un algorithme d'IA pour apprendre à identifier des motifs et à accomplir sa tâche spécifique.
📖 Définition
💬 En termes simples
C'est comme les manuels scolaires et les exercices qu'un étudiant utilise pour étudier avant son examen final.
🎯 Exemple concret
Des milliers de photos de chats et de chiens montrées à une IA pour qu'elle apprenne à les différencier.
💡 Le saviez-vous ?
La qualité de l'IA dépend directement de la qualité des données : Garbage in, garbage out.
❓ Questions fréquentes
Pourquoi la qualité des données est-elle plus importante que la quantité ?
D'où proviennent les données d'entraînement des grands modèles d'IA ?
Quels sont les enjeux légaux liés à ces données ?
📚 Sources
- Google AI - Data for Machine Learning (Google, 2024)
- Wikipedia - Training data (Wikipedia, 2024)