Attaque adversariale

Aussi appelé : Adversarial Attack · attaque adverse · adversarial-attack · adversarial attacks

Terme IA Avancé 🛡️ Sécurité et éthique

Mis à jour le 5 juin 2026

Une attaque adversariale est une tentative délibérée de tromper un modèle d'IA en introduisant des perturbations subtiles et souvent invisibles dans les données d'entrée pour provoquer une erreur de prédiction.

📖 Définition

Une attaque adversariale consiste à manipuler délibérément les données d'entrée d'un modèle d'IA afin de le tromper et de provoquer des erreurs de prédiction. Ces perturbations sont souvent imperceptibles pour l'être humain mais déstabilisent le modèle. Les attaques peuvent cibler la reconnaissance d'images, le NLP ou la détection de fraude. Elles constituent un enjeu majeur de cybersécurité.

💬 En termes simples

Imaginez un faussaire qui modifie à peine un billet de banque canadien — un micro-détail invisible — mais qui suffit à tromper un guichet automatique. L'attaque adversariale fonctionne de la même manière : une modification infime qui induit le système d'IA en erreur.

🎯 Exemple concret

Une banque canadienne effectue des tests d'attaques adversariales sur son système de détection de fraude. Un constructeur automobile teste la robustesse de la conduite autonome face à des panneaux de signalisation modifiés. Un organisme gouvernemental audite la sécurité de son système de reconnaissance faciale.

💡 Le saviez-vous ?

Des chercheurs ont démontré qu'il est possible de tromper un système de reconnaissance d'images en modifiant un seul pixel. Le domaine a donné naissance à l'entraînement adversarial, où l'on expose volontairement un modèle à des exemples manipulés pour le rendre plus robuste.

❓ Questions fréquentes

Comment peut-on « piéger » une intelligence artificielle ?

En modifiant quelques pixels sur une image ou quelques caractères dans un texte. Par exemple, en ajoutant un bruit imperceptible sur un panneau de signalisation, on peut forcer une voiture autonome à le lire comme une limite de vitesse à 100 km/h au lieu d'un « Arrêt », créant ainsi un danger réel sans que l'humain ne voie le changement.

Quels sont les risques pour la cybersécurité ?

Les attaquants peuvent utiliser ces techniques pour contourner des filtres antispam, des systèmes de détection de fraude bancaire ou de reconnaissance faciale. Comme ces attaques exploitent le fonctionnement mathématique interne de l'IA, elles sont très difficiles à détecter par les méthodes de sécurité informatique traditionnelles.

Comment pouvez-vous protéger vos systèmes d'IA ?

Vous devez pratiquer l'entraînement adversarial, qui consiste à montrer des exemples d'attaques au modèle pendant son apprentissage pour qu'il devienne plus robuste. L'utilisation de multiples modèles de vérification et la mise en place de gardes-fous humains pour les décisions critiques restent aussi des stratégies de défense indispensables.

📚 Sources

OpenAI - Adversarial Attacks and Defenses (Ian Goodfellow et al., 2017)
Wikipedia - Adversarial machine learning (Wikipedia, 2024)

🔗 Termes liés

🏷️ Catégorie parente

Cybersécurité

🌿 Sous-termes

Data poisoning Vol de modèle Prompt injection Jailbreak AI red teaming

Accueil

Outils

Annuaire

Apprendre