Veille IA Veille IA sans buzz : pour stratèges québécois.
La veille

Encodeur-décodeur

Encodeur-décodeur

Encodeur-décodeur

Terme Avancé 🧠 Concepts fondamentaux

Mis à jour le

L'architecture encodeur-décodeur compresse l'entrée en une représentation intermédiaire (encodeur) puis génère la sortie à partir de celle-ci (décodeur).

📖 Définition

L'architecture encodeur-décodeur (encoder-decoder) est un type de réseau de neurones composé de deux modules complémentaires. L'encodeur lit l'entrée (par exemple une phrase) et la transforme en une représentation intermédiaire compacte — un vecteur ou une séquence de vecteurs — qui en résume le sens. Le décodeur part de cette représentation pour générer la sortie, le plus souvent de façon autorégressive (token par token). Ce schéma est au cœur des modèles de séquence à séquence (seq2seq), historiquement utilisés pour la traduction automatique : l'encodeur « comprend » la phrase source, le décodeur « rédige » la phrase cible. Le Transformer original (« Attention Is All You Need », 2017) est lui-même une architecture encodeur-décodeur, où chaque module empile des couches d'attention. Selon la tâche, on n'utilise parfois qu'une moitié : les modèles de type BERT sont surtout des encodeurs (compréhension), tandis que les modèles de génération comme GPT sont surtout des décodeurs (production). Comprendre cette séparation aide à saisir comment une IA passe d'une entrée à une sortie de nature parfois différente.

💬 En termes simples

C'est comme un traducteur humain : l'encodeur est l'oreille qui écoute et comprend la phrase dans une langue (le sens), le décodeur est la bouche qui la reformule dans une autre langue.

🎯 Exemple concret

Pour traduire « Bonjour le monde » en anglais, l'encodeur compresse la phrase française en une représentation de sens, puis le décodeur génère « Hello world » mot après mot à partir de cette représentation.

💡 Le saviez-vous ?

Beaucoup de grands modèles actuels n'utilisent qu'une moitié de l'architecture : GPT est essentiellement un décodeur, et les modèles à la BERT essentiellement un encodeur — l'architecture complète reste reine pour la traduction.

❓ Questions fréquentes

À quoi sert l'architecture encodeur-décodeur ?
À transformer une séquence d'entrée en une séquence de sortie (seq2seq), comme en traduction automatique : l'encodeur capte le sens, le décodeur produit le résultat.
GPT est-il un encodeur-décodeur ?
GPT est essentiellement un décodeur (génération autorégressive) ; le Transformer original combinait encodeur et décodeur, mais beaucoup de modèles n'en gardent qu'une moitié selon la tâche.
🔐 Connexion rapide

Entrez votre courriel pour recevoir un code à 6 chiffres.

Pas besoin de mot de passe ni d'inscription. Entrez votre courriel, recevez un code par courriel, et c'est tout !