Veille IA Veille IA sans buzz : pour stratèges québécois.
La veille

Fenêtre de contexte

Fenêtre de contexte

Fenêtre de contexte

Aussi appelé : Context Window · context-window · contexte de jetons · limite de contexte

Vulgarisation Débutant 🧠 Concepts fondamentaux

Mis à jour le

La fenêtre de contexte est la quantité maximale d'informations (mesurée en tokens) qu'un modèle de langage peut traiter et garder en mémoire lors d'une seule interaction.

📖 Définition

La fenêtre de contexte désigne la quantité maximale de texte qu'un modèle de langage peut prendre en compte simultanément. Elle se mesure en jetons (tokens). Tout ce qui dépasse cette limite est ignoré par le modèle, ce qui peut affecter la cohérence de ses réponses. La taille de cette fenêtre est l'une des caractéristiques les plus déterminantes des grands modèles de langage modernes.

💬 En termes simples

Imaginez que vous lisez un très long roman québécois, mais que vous ne pouvez garder en mémoire que les 200 dernières pages lues. Si un personnage important a été introduit au début du livre, vous risquez de l'avoir oublié au dernier chapitre. La fenêtre de contexte fonctionne exactement ainsi pour un modèle de langage.

🎯 Exemple concret

En 2026, les modèles les plus avancés offrent des fenêtres de plus d'un million de jetons, permettant d'analyser des documents juridiques complets. Un avocat montréalais peut soumettre un contrat entier pour obtenir une analyse cohérente. Les outils de résumé exploitent des fenêtres élargies pour condenser des rapports annuels sans perdre d'informations.

💡 Le saviez-vous ?

GPT-2 (2019) disposait d'une fenêtre de 1 024 jetons, tandis que certains modèles de 2025 atteignent plus de 2 millions — une multiplication par 2 000 en six ans. Les modèles ont tendance à accorder moins d'attention aux informations situées au milieu de leur fenêtre, un phénomène surnommé lost in the middle.

❓ Questions fréquentes

Pourquoi la taille de la fenêtre de contexte est-elle si importante ?
Elle détermine la capacité de l'IA à comprendre de longs documents. Une petite fenêtre obligera le modèle à « oublier » le début d'un livre ou d'une conversation. Une grande fenêtre (comme 1 million de tokens) permet d'analyser des centaines de pages de rapports ou des milliers de lignes de code d'un seul coup.
Que se passe-t-il si vous dépassez cette limite ?
L'IA subit une forme d'amnésie : les informations les plus anciennes sont évacuées pour laisser place aux nouvelles. Le modèle risque alors de se contredire ou de perdre le fil de vos instructions initiales. C'est pourquoi il est parfois nécessaire de résumer les échanges précédents pour rester dans les limites du modèle.
Comment la technologie évolue-t-elle à ce sujet ?
On voit apparaître des architectures capables de gérer des fenêtres de contexte de plus en plus vastes grâce à des optimisations du mécanisme d'attention. L'objectif est de permettre à l'IA de « lire » et de mettre en relation l'intégralité de la base de connaissances d'une entreprise en une seule fois.

📚 Sources

🔐 Connexion rapide

Entrez votre courriel pour recevoir un code à 6 chiffres.

Pas besoin de mot de passe ni d'inscription. Entrez votre courriel, recevez un code par courriel, et c'est tout !