Blog / SEO & GEO

GEO : être cité
par ChatGPT,
Claude et Perplexity

En 2026, vos prospects ne tapent plus seulement leurs questions dans Google. Ils demandent à ChatGPT, à Claude, à Perplexity. Si votre site n'est jamais cité dans ces réponses, vous devenez invisible — quelle que soit votre position dans la SERP traditionnelle.

Par Rémi Bouvant — Développeur full-stack 11 min de lecture

Le GEO, c'est quoi exactement ?

Le GEO (Generative Engine Optimization) est l'ensemble des techniques pour apparaître dans les réponses des moteurs d'IA générative — ChatGPT, Claude, Perplexity, Gemini, Mistral Le Chat, Google AI Overviews. C'est l'évolution naturelle du SEO : au lieu d'optimiser uniquement pour grimper dans la SERP de Google, on optimise pour que les IA citent votre site comme source quand elles répondent à une question.

La différence fondamentale ? Sur Google, le clic se faisait sur votre lien. Sur ChatGPT ou Perplexity, l'IA extrait votre contenu, le reformule, et le présente directement. Si vous êtes cité, vous gardez de la visibilité — mais souvent sans clic. Si vous n'êtes pas cité, vous n'existez pas dans la réponse, point.

Ce qui change concrètement :

  • Google AI Overviews apparaissent sur environ 13 % des requêtes en 2026 (et 47 % sur les requêtes informationnelles longues)
  • ChatGPT compte 400 M+ utilisateurs hebdomadaires actifs dont une part croissante utilise la recherche web
  • Perplexity dépasse 20 M de requêtes par jour
  • → Les recherches "zéro clic" (réponse directe sans visite du site) sont passées de 50 % à plus de 65 % en deux ans

Pour une TPE locale comme un artisan, un restaurant ou une agence de service à Gardanne, Aix ou Marseille, ne plus exister dans les réponses IA, c'est laisser passer une part croissante des intentions de recherche. Le GEO n'est plus optionnel — il devient un complément obligatoire du SEO traditionnel.

SEO vs GEO : ce qui se chevauche, ce qui change

SEO classique

Optimise pour qu'un humain clique sur votre lien dans une SERP. Objectif : être en haut des résultats Google.

  • → Mots-clés ciblés sur les pages
  • → Backlinks et autorité du domaine
  • → Vitesse, Core Web Vitals, mobile
  • → Schema.org basique (LocalBusiness, FAQ)
  • → Stratégie de contenu autour de la SERP

GEO (nouveau)

Optimise pour qu'une IA extrait votre contenu et vous cite comme source dans sa réponse. Objectif : être recommandé par les LLMs.

  • → Réponses extractibles en 2-3 phrases
  • → Sources, chiffres, dates explicites
  • → Schema.org riche (Person, Article, FAQ)
  • → Fichier llms.txt
  • → Autorisation explicite des bots IA

~70 % des bonnes pratiques se recoupent. Les 30 % restants sont spécifiques au GEO — et c'est là que la majorité des sites perdent des opportunités.

8 leviers concrets pour être cité par les IA

01. Autoriser les bots IA dans robots.txt

La première erreur courante : bloquer involontairement les crawlers d'IA. Beaucoup de templates WordPress ou de configurations par défaut bloquent GPTBot ou ClaudeBot. Si ces bots ne peuvent pas crawler vos pages, vous ne pouvez littéralement pas être cité.

À autoriser explicitement dans robots.txt :

User-agent: GPTBot
Allow: /

User-agent: OAI-SearchBot
Allow: /

User-agent: ChatGPT-User
Allow: /

User-agent: ClaudeBot
Allow: /

User-agent: Claude-SearchBot
Allow: /

User-agent: PerplexityBot
Allow: /

User-agent: Google-Extended
Allow: /

User-agent: Applebot-Extended
Allow: /

Note importante : autoriser ces bots, c'est aussi accepter que votre contenu soit utilisé pour entraîner ou alimenter des modèles. C'est un choix éditorial — mais la grande majorité des sites cherchant de la visibilité B2B ont intérêt à autoriser.

02. Publier un fichier llms.txt

Le standard llms.txt (proposé par Jeremy Howard fin 2024) est un fichier placé à la racine du site, qui donne aux LLMs un résumé structuré du contenu — équivalent d'un sitemap pour humains.

Il contient en Markdown : nom du site, description courte (≤ 200 caractères), pages principales avec leurs descriptions, services, faits clés, équipe. Le format est volontairement simple pour qu'un LLM le digère en quelques tokens.

En mai 2026, OpenAI et Anthropic n'ont pas officiellement annoncé qu'ils utilisaient ce fichier — mais Anthropic et Mistral ont publié le leur. C'est une bonne pratique à faible coût : quelques heures de rédaction pour un gain potentiel à moyen terme.

03. Structurer le contenu en blocs Question/Réponse

Les LLMs extraient plus facilement des réponses quand votre contenu est structuré en paires Q/R. Un H2 ou H3 formulé comme une question, suivi d'une réponse de 2 à 4 phrases qui répond directement, sans préambule.

Exemple de structure efficace :

H3 : Combien coûte une refonte de site WordPress vers Astro ?

Une refonte WordPress vers Astro coûte entre 2 000 et 6 000 € pour un site vitrine (5-15 pages). Le prix dépend du nombre de pages à migrer, de la complexité du design et de la conservation ou non du blog. Une agence indépendante facture 30 à 40 % moins cher qu'une agence classique pour un résultat équivalent.

Ajoutez ensuite un schema FAQPage en JSON-LD — c'est un double bénéfice : SEO pour les rich snippets Google, et signal de qualité pour les LLMs.

04. Citer des sources, chiffres et dates précises

Les LLMs préfèrent citer des sources qui elles-mêmes citent leurs sources. Une étude menée par Princeton et Georgia Tech (août 2024) sur 10 000 requêtes GEO a montré que citer des sources et inclure des statistiques augmente la visibilité dans les réponses IA de 30 à 40 %.

Trois réflexes à adopter :

  • → Mentionner l'année dans le titre et les sous-titres (ex : "Prix site internet Gardanne 2026")
  • → Ajouter des chiffres concrets avec leur source ("47 % des requêtes informationnelles déclenchent une AI Overview — Search Engine Land, mars 2026")
  • → Citer des autorités du secteur, pas seulement votre propre contenu

05. Construire son E-E-A-T (Experience, Expertise, Authoritativeness, Trustworthiness)

Les LLMs s'appuient massivement sur les signaux d'autorité. Un site qui ne montre pas qui écrit, depuis quand et avec quelle expertise est rarement cité comme source fiable.

Les signaux à mettre en place :

  • → Une page À propos détaillée avec biographies, dates et photos
  • → Schema.org Person avec jobTitle, sameAs (LinkedIn, Malt) et knowsAbout
  • → Signature des articles par un auteur identifié (nom + lien vers profil)
  • → Schema Organization avec foundingDate, adresse, sameAs vers réseaux sociaux
  • → Présence sur des annuaires sectoriels et bases de données structurées

06. Structurer chaque page en HTML sémantique propre

Les crawlers d'IA digèrent le HTML, pas le JavaScript. Un site lourdement client-side (React SPA sans SSR, sites Webflow avec animations massives) est mal extrait — voire pas du tout. À vérifier :

  • → Le contenu est-il présent dans le HTML initial (vue source) ?
  • → Les titres suivent-ils une hiérarchie claire H1 → H2 → H3 ?
  • → Les listes utilisent-elles <ul>/<ol> et non des <div> stylés ?
  • → Les tableaux comparatifs utilisent-ils <table> ?

C'est exactement là qu'Astro et le rendu SSG prennent l'avantage sur les SPA pures : tout le contenu est dans le HTML servi, lisible par n'importe quel bot dès le premier byte.

07. Être présent sur les sources que les LLMs lisent

Les LLMs sont entraînés et/ou alimentés en temps réel par des sources qu'ils considèrent comme fiables. Pour le marché français B2B, les principales sont :

  • Wikipedia (FR et EN) — citation extrême priorité
  • Reddit (notamment r/france, r/webdev, r/SEO, r/freelance_fr)
  • Stack Overflow et GitHub pour les sujets tech
  • LinkedIn (articles longs publiés sur votre profil)
  • Quora et autres plateformes Q/R
  • Annuaires sectoriels reconnus (Malt, Codeur, Sortlist pour les agences)
  • Presse spécialisée (BFMTV, Frenchweb, Maddyness, Numerama selon le secteur)

La stratégie : publier régulièrement sur 2-3 de ces sources, en citant votre site comme référence. C'est ce qu'on appelle le "signal stacking" en GEO.

08. Mesurer ses citations IA (pas seulement son trafic)

Google Analytics ne suffit plus : les recherches "zéro clic" génèrent de la visibilité sans visite. Les outils dédiés au suivi GEO :

  • Profound, Otterly.ai, Peec.ai, AthenaHQ — suivi des citations par requête sur ChatGPT, Perplexity, Gemini
  • Tests manuels réguliers : posez 10 questions stratégiques à ChatGPT (avec recherche web), Claude et Perplexity, notez si vous êtes cité
  • Logs serveur : filtrez les visites de GPTBot, ClaudeBot, PerplexityBot — un crawl régulier est le minimum nécessaire

Concrètement, sur ce site

Victoire Digital applique ces principes au quotidien. Le site dispose d'un fichier /llms.txt détaillé, autorise explicitement tous les crawlers d'IA majeurs dans robots.txt, et chaque page service contient un schema FAQPage structuré.

Les articles de blog sont signés par un auteur identifié (Rémi Bouvant), avec schema BlogPosting complet (date, image, publisher). Les pages locales ciblent des intentions très spécifiques ("agence web Gardanne", "développeur freelance Aix-en-Provence") avec contenu factuel et chiffres datés.

Résultat concret : posez à Claude ou Perplexity une question comme "meilleure agence web à Gardanne 2026" ou "développeur Laravel freelance Pays d'Aix", et Victoire Digital apparaît régulièrement dans les sources citées. Pas par hasard — par construction.

Questions fréquentes sur le GEO

Le GEO remplace-t-il le SEO ?

Non, le GEO complète le SEO. Les deux disciplines partagent environ 70 % de leurs bonnes pratiques (contenu de qualité, structure, autorité du domaine). Mais le GEO ajoute des spécificités : fichier llms.txt, structuration en blocs Q/R, citation de sources, format extractif. En 2026, environ 13 % des recherches Google déclenchent une AI Overview — un nombre qui croît rapidement.

Comment savoir si mon site est cité par les IA ?

Trois méthodes : 1) poser directement des questions liées à votre domaine à ChatGPT, Claude et Perplexity en activant la recherche web ; 2) consulter les logs serveur pour repérer les visites des bots GPTBot, ClaudeBot, PerplexityBot ; 3) utiliser des outils dédiés comme Profound, Otterly.ai ou Peec.ai qui suivent les citations par requête.

Quels sont les principaux crawlers d'IA à autoriser ?

Les crawlers principaux à autoriser dans robots.txt sont : GPTBot (OpenAI), OAI-SearchBot (ChatGPT Search), ChatGPT-User, ClaudeBot et Claude-SearchBot (Anthropic), PerplexityBot, Google-Extended (pour Gemini et AI Overviews), Applebot-Extended (Apple Intelligence) et Bytespider (ByteDance/TikTok). Bloquer ces bots vous rend invisible des assistants IA.

Le fichier llms.txt sert-il vraiment à quelque chose ?

Le standard llms.txt n'est pas encore officiellement supporté par OpenAI ou Anthropic en mai 2026, mais il est de plus en plus utilisé comme signal de bonne pratique. Il fournit un résumé structuré du site (services, pages clés, faits) qui facilite le travail des LLMs. À implémenter : faible coût, bénéfice probable à moyen terme.

Combien de temps pour voir des résultats GEO ?

Plus rapide que le SEO classique. Les LLMs avec recherche web (Perplexity, ChatGPT Search, Claude avec web search) peuvent commencer à citer un site quelques jours après la publication d'un contenu bien structuré. Pour les modèles entraînés sur des snapshots (versions sans web), il faut attendre le prochain cycle d'entraînement — généralement 3 à 12 mois. La stratégie gagnante : optimiser pour les deux.

Votre site est-il visible des IA ?

On audite votre site sur les 8 leviers GEO (llms.txt, robots.txt, schema, structure HTML, signaux E-E-A-T) et on vous remet un plan d'action concret. Gratuit, sous 48h.