La recherche sémantique trouve l'information par le sens, en comparant des vecteurs (embeddings), plutôt que par la correspondance exacte de mots-clés.
📖 Définition
La recherche sémantique cherche par le sens plutôt que par la correspondance exacte de mots-clés. Elle transforme la requête et les documents en embeddings (vecteurs numériques) et identifie les documents dont le vecteur est le plus proche de celui de la requête (recherche des plus proches voisins dans l'espace vectoriel). Cette approche comprend les synonymes et l'intention : une requête « voiture » peut ainsi retrouver des textes parlant d'« automobile » ou de « véhicule », même si le mot exact n'y figure pas. Elle est au cœur du RAG et des moteurs de recherche modernes, où elle remplace ou complète la recherche lexicale classique. Sa qualité dépend du modèle d'embedding utilisé et de la façon dont les documents ont été découpés (chunking) et indexés.
💬 En termes simples
C'est comme un libraire d'expérience : tu lui décris vaguement « le roman avec un vieux pêcheur et un gros poisson » et il te tend « Le vieil homme et la mer », sans que tu aies eu besoin du titre exact.
🎯 Exemple concret
Un utilisateur tape « comment réduire ma facture d'électricité ». La recherche sémantique remonte un article intitulé « 10 astuces pour diminuer sa consommation énergétique », alors qu'aucun des mots de la requête n'y apparaît littéralement.
💡 Le saviez-vous ?
Contrairement à la recherche par mots-clés, la recherche sémantique peut retrouver un document pertinent même s'il ne contient aucun mot exact de la requête, en se basant uniquement sur la proximité de sens.
❓ Questions fréquentes
Quelle différence avec la recherche par mots-clés ?
La recherche par mots-clés exige une correspondance littérale des termes ; la recherche sémantique compare le SENS via des embeddings et retrouve donc synonymes et reformulations.
Quel est le lien avec le RAG ?
Le RAG s'appuie sur la recherche sémantique pour retrouver, dans une base vectorielle, les passages les plus pertinents à fournir au modèle de langage.
Reçois chaque semaine le meilleur de l'actualité IA, directement dans ta boîte.
Pas de pourriel, désinscription en 1 clic.
✉️
Restez informé
Recevez nos sélections d'outils et articles directement dans votre boîte courriel.
🔐 Connexion rapide
Entrez votre courriel pour recevoir un code à 6 chiffres.
Pas besoin de mot de passe ni d'inscription. Entrez votre courriel, recevez un code par courriel, et c'est tout !
✓
Paramètres de confidentialité
Nous utilisons des témoins (cookies) pour assurer le bon fonctionnement du site, analyser le trafic et personnaliser le contenu. Vous pouvez gérer vos préférences ci-dessous.
Politique de confidentialité