OCR
Aussi appelé : Optical Character Recognition · OCRs · reconnaissance de caractères · lecture optique
Mis à jour le
La reconnaissance optique de caractères (OCR) est une technologie permettant de convertir des documents numérisés ou des images en fichiers textes exploitables et modifiables par ordinateur.
📖 Définition
💬 En termes simples
Imaginez un employé administratif qui reçoit une pile de formulaires papier et qui doit retranscrire chaque information dans un système informatique. L'OCR joue exactement ce rôle, mais à une vitesse et une échelle incomparables, en lisant automatiquement le contenu imprimé ou manuscrit pour le convertir en texte numérique.
🎯 Exemple concret
Revenu Québec utilise l'OCR pour traiter automatiquement des millions de déclarations fiscales papier. Une firme d'avocats montréalaise numérise l'ensemble de ses archives juridiques. Un centre hospitalier de Québec convertit les ordonnances manuscrites des médecins en données structurées.
💡 Le saviez-vous ?
Les premières technologies d'OCR remontent aux années 1920, bien avant l'ère de l'IA. Aujourd'hui, les systèmes les plus avancés atteignent des taux de précision supérieurs à 99 % sur des documents imprimés et reconnaissent plus de 120 langues.
❓ Questions fréquentes
Quelle est la différence entre l'OCR classique et l'OCR propulsé par l'IA ?
Quand devriez-vous privilégier l'utilisation de l'OCR dans vos processus ?
Quelles sont les limites actuelles de cette technologie ?
📚 Sources
- Wikipedia - Reconnaissance optique de caractères (Contributeurs de Wikipédia, 2024)
- Tesseract OCR Documentation (Google / Tesseract Open Source, 2024)
🔗 Termes liés
🏷️ Catégorie parente