Fenêtre de contexte
Aussi appelé : Context Window · context-window · contexte de jetons · limite de contexte
Mis à jour le
La fenêtre de contexte est la quantité maximale d'informations (mesurée en tokens) qu'un modèle de langage peut traiter et garder en mémoire lors d'une seule interaction.
📖 Définition
💬 En termes simples
Imaginez que vous lisez un très long roman québécois, mais que vous ne pouvez garder en mémoire que les 200 dernières pages lues. Si un personnage important a été introduit au début du livre, vous risquez de l'avoir oublié au dernier chapitre. La fenêtre de contexte fonctionne exactement ainsi pour un modèle de langage.
🎯 Exemple concret
En 2026, les modèles les plus avancés offrent des fenêtres de plus d'un million de jetons, permettant d'analyser des documents juridiques complets. Un avocat montréalais peut soumettre un contrat entier pour obtenir une analyse cohérente. Les outils de résumé exploitent des fenêtres élargies pour condenser des rapports annuels sans perdre d'informations.
💡 Le saviez-vous ?
GPT-2 (2019) disposait d'une fenêtre de 1 024 jetons, tandis que certains modèles de 2025 atteignent plus de 2 millions — une multiplication par 2 000 en six ans. Les modèles ont tendance à accorder moins d'attention aux informations situées au milieu de leur fenêtre, un phénomène surnommé lost in the middle.
❓ Questions fréquentes
Pourquoi la taille de la fenêtre de contexte est-elle si importante ?
Que se passe-t-il si vous dépassez cette limite ?
Comment la technologie évolue-t-elle à ce sujet ?
📚 Sources
- Google DeepMind - Long Context Window (Google, 2024)
- Anthropic - 200k Context Window (Anthropic, 2023)