RAG (Retrieval Augmented Generation)
RAG est une technique IA qui combine la génération de texte d'un grand modèle de langage (LLM) avec la recherche d'information en temps réel. Au lieu de se fier uniquement à sa mémoire interne — figée à une date d'entraînement — l'IA consulte des sources externes actuelles pour générer des réponses plus précises, plus récentes et mieux sourcées.
En pratique : quand vous posez une question à Perplexity ou à ChatGPT avec accès internet, le système commence par chercher des pages web pertinentes, extrait les passages les plus utiles, puis génère une réponse en s'appuyant sur ces extraits. C'est du RAG.
Pourquoi c'est important pour le GEO
ChatGPT (mode recherche), Perplexity et Claude utilisent tous RAG pour leurs fonctions de recherche web. Comprendre comment fonctionne RAG explique directement pourquoi certains sites sont cités et d'autres non.
Le système RAG sélectionne les passages à inclure selon plusieurs critères : pertinence sémantique avec la requête, clarté et structure du texte, fraîcheur du contenu, et autorité perçue de la source. Un site dont le contenu est dense, mal structuré, ou rédigé dans un jargon trop technique sera ignoré au profit d'une page qui répond clairement à la question posée.
Pour les B2B, cela signifie qu'un contenu bien structuré sur une question précise ("comment choisir un partenaire d'infogérance") a plus de chances d'être extrait par RAG qu'une page de services générique, même si cette dernière est plus ancienne et plus connue.
Comment optimiser pour RAG
- Créer du contenu sémantiquement riche : utiliser naturellement les termes de votre secteur, les synonymes, les questions associées — les moteurs RAG cherchent par similarité sémantique, pas seulement par mots-clés exacts
- Formuler des réponses directes et autonomes : chaque section de votre page doit pouvoir être extraite seule et rester compréhensible hors contexte
- Utiliser des headings descriptifs qui correspondent aux questions réelles de vos clients
- Inclure des faits vérifiables avec sources — les systèmes RAG favorisent les affirmations sourcées
- Maintenir le contenu à jour : RAG privilégie les sources récentes pour les sujets qui évoluent vite
- Éviter les blocs de texte trop longs — les fenêtres d'extraction RAG sont généralement limitées à quelques centaines de tokens
Exemple concret
Un cabinet de recrutement publie une page répondant à la question "quel est le coût moyen d'un recrutement raté en France". La page donne une réponse chiffrée dès le premier paragraphe (entre 30 000 et 150 000 € selon le poste), explique la méthodologie de calcul, cite des études, et structure le tout avec des titres explicites.
Quand un DRH demande à ChatGPT cette question, le système RAG extrait ce passage, le cite comme source, et redirige l'utilisateur vers la page. Sans cette structure, l'information noyée dans une brochure commerciale ne serait jamais extraite.
Erreurs fréquentes
- Rédiger pour les humains seulement : un texte fluide mais sans structure claire est difficile à segmenter pour un système RAG. Ajoutez des titres, des listes, des tableaux.
- Contenu trop long sans chapitrage : RAG extrait des passages, pas des pages entières. Un article de 4 000 mots sans découpage clair produit des extraits incohérents.
- Jargon interne non expliqué : si votre page utilise des acronymes propres à votre entreprise sans les définir, le système RAG ne sait pas comment les relier à la requête de l'utilisateur.
- Omettre les dates et sources : les systèmes RAG accordent un poids important à la vérifiabilité. Un contenu sans date ni référence externe est moins fiable aux yeux de l'algorithme.