Une page qui n’est pas indexée par Google n’existe pas. Pour vos prospects, elle n’a tout simplement jamais été publiée. Et le problème touche bien plus de sites B2B qu’on ne l’imagine : sur 16 millions de pages analysées par IndexCheckr en 2024, près de 62 % de celles présentes sur des domaines pourtant connus de Google ne sont jamais servies dans les résultats de recherche.
Le rapport « Indexation des pages » dit tout, encore faut-il le lire
Tout commence dans Google Search Console, dans le rapport « Indexation des pages ». C’est lui qui distingue les URL effectivement présentes dans l’index de celles que Google a vues, parfois crawlées, mais écartées.
Les statuts à connaître sont peu nombreux. Les plus parlants en B2B :
- Détectée, actuellement non indexée : Google connaît l’URL mais a différé son crawl.
- Explorée, actuellement non indexée : Google a lu la page et a choisi de ne pas l’ajouter à son index.
- Page en double sans URL canonique sélectionnée par l’utilisateur : deux versions très proches existent, Google a tranché tout seul.
- Soft 404 : la page renvoie un code 200 mais son contenu est jugé vide ou trompeur.
- Bloquée par le fichier robots.txt ou Exclue par la balise « noindex » : la consigne vient du site lui-même.
Avant toute chose, ouvrez ce rapport. Si vous trouvez plusieurs centaines de pages dans l’un de ces statuts, vous tenez votre point de départ.
Les blocages techniques que tout le monde connaît, et qui passent quand même
Commençons par le plus banal. Une bonne moitié des problèmes d’indexation sur les sites B2B se règle en corrigeant trois ou quatre points purement techniques.
Le robots.txt mal écrit reste un classique. Une ligne Disallow: / oubliée après une migration, et le moteur cesse de visiter le site. La balise noindex laissée sur un environnement de pré-production basculé en prod sans nettoyage produit le même effet, en plus discret.
Les balises canoniques mal posées sont un autre piège fréquent. Si toutes vos pages services pointent vers la home via un rel="canonical" mal configuré, vous demandez vous-même à Google de ne retenir que la home. Il s’exécute.
Sur un site B2B, chaque page service ou étude de cas non indexée représente une porte fermée à un cycle de vente qui peut durer des mois.
Les redirections en chaîne et les soft 404 complètent le tableau. Un parcours qui passe par trois ou quatre 301 successives finit par épuiser la patience de Googlebot. Une page « catégorie vide » qui répond 200 alors qu’elle ne contient rien sera, elle, requalifiée en soft 404 et écartée.
Vérifiez aussi vos en-têtes HTTP. Une directive X-Robots-Tag: noindex envoyée par le serveur ne se voit pas dans le code source de la page. Elle suffit pourtant à exclure une URL de l’index.
« Détectée » et « Explorée » non indexées : les deux statuts qui coûtent le plus cher
Ces deux libellés méritent un développement à part. Ils sont mal compris, et c’est sous eux que se cachent les vraies pertes de visibilité.
Détectée, actuellement non indexée signifie que Google a découvert l’URL, le plus souvent via un sitemap ou un lien interne, mais a choisi de ne pas la crawler tout de suite. Deux causes dominent. Premièrement, votre serveur répond mal ou trop lentement, et Google préserve ses ressources. Deuxièmement, le site dans son ensemble n’inspire pas assez confiance pour que de nouvelles URL soient prioritaires.
Explorée, actuellement non indexée est plus sec. Google a lu la page, l’a évaluée, et a décidé qu’elle n’apportait rien à son index. Ce n’est pas un problème de robots.txt ni de balises. C’est un jugement de valeur.
Concrètement, les pages concernées ressemblent souvent à ceci :
- Articles de blog très courts ou redondants avec d’autres pages du site.
- Pages catégorie avec un contenu rédactionnel inexistant.
- Fiches services génériques, recopiées d’un secteur à l’autre.
- Pages issues d’une production massive faite à la chaîne, IA non relue comprise.
Le constat est inconfortable, mais il faut le poser : ces statuts traduisent rarement un problème technique. Ils traduisent un problème de qualité perçue.
Quand Google juge votre site, il regarde l’ensemble
Voici l’angle que peu d’articles français traitent vraiment. L’indexation n’est plus, depuis le déploiement du Helpful Content System intégré à l’algorithme principal en mars 2024, une affaire de pages prises isolément.
Google évalue la qualité globale d’un domaine. Si une portion significative de vos URL est jugée peu utile, l’ensemble du site est crawlé moins agressivement, indexé moins volontiers, et déclassé sur les nouvelles publications. Une étude de Search Engine Journal sur le Core Update de mars 2024 a documenté la désindexation totale de 1,7 % des sites du panel monitoré, soit plusieurs centaines de domaines. La purge de mai 2025 documentée par Indexing Insight a fait pire encore : sur 2 millions d’URL suivies, un quart a été activement retiré de l’index.
Autrement dit, vos meilleures pages peuvent souffrir des plus faibles. Une dizaine d’anciens articles fins, vides ou mal positionnés sur des intentions hors sujet contaminent la perception du site entier. C’est aussi un sujet d’erreurs techniques que beaucoup de sites B2B traînent sans le savoir , au point d’en faire une cause majeure de stagnation organique.
La conséquence pratique : la solution ne consiste pas toujours à publier davantage. Elle consiste souvent à supprimer, fusionner ou réécrire ce qui pèse vers le bas.
Les pages orphelines et le maillage défaillant
Une page sans aucun lien interne entrant est une page que Google découvre par accident, le plus souvent via le sitemap. C’est suffisant pour qu’elle soit détectée. Pas pour qu’elle soit jugée importante.
Dans les sites B2B, les pages orphelines sont généralement les mêmes : anciennes landing pages de campagnes, pages d’inscription à des webinaires terminés, articles produits puis oubliés. Aucun lien depuis le menu, aucun lien depuis un autre article, aucun signal d’intérêt.
La règle, simple : toute URL que vous voulez voir indexée doit être atteignable depuis la home en moins de trois clics, et recevoir au moins un lien depuis une page thématiquement proche. Pas dix. Un suffit, à condition qu’il existe.
La profondeur de clic est le second critère. Au-delà de quatre niveaux de navigation, la priorité d’indexation chute nettement. Sur un site B2B classique de 200 à 500 URL, ce n’est pas un sujet. Sur un catalogue ou une base documentaire dépassant les 10 000 pages, cela devient structurel.
Par où commencer concrètement
Une méthode qui fonctionne dans 80 % des cas, sans outil payant.
- Exporter le rapport « Indexation des pages » depuis Search Console. Trier par statut.
- Inspecter cinq URL au hasard dans chacun des statuts « Détectée non indexée » et « Explorée non indexée ». Ouvrir, lire, juger honnêtement leur valeur ajoutée.
- Identifier les pages orphelines avec un crawl Screaming Frog ou Sitebulb croisé avec votre sitemap. Tout ce qui est dans le sitemap et que le crawler ne trouve pas par les liens internes mérite un audit.
- Trancher : améliorer, fusionner, ou supprimer (avec un 301 vers la page la plus proche).
- Vérifier le
robots.txt, les en-têtesX-Robots-Taget les canoniques sur les modèles de pages concernés. - Demander une nouvelle exploration via l’outil URL Inspection une fois les corrections en place.
Ce travail ne se voit pas à court terme. Il se voit trois à six mois plus tard, quand la part de pages indexables effectivement présentes dans l’index repasse au-dessus de 90 %, et quand les nouvelles publications sont crawlées en quelques jours plutôt qu’en quelques semaines. C’est une étape qu’on intègre généralement dans un audit SEO B2B mené dès la phase de cadrage , parce qu’aucune action de contenu ou de netlinking ne rattrape un site dont l’indexation fuit.
Questions fréquentes
Combien de temps faut-il à Google pour indexer une nouvelle page ?
D’après IndexCheckr (2024), 14 % des pages indexables sont indexées sous 7 jours, 65 % sous 30 jours, 77 % sous 90 jours. Une page qui n’est toujours pas indexée après trois mois ne le sera probablement jamais sans intervention.
Comment forcer l’indexation d’une page importante ?
L’outil URL Inspection de Search Console permet de demander une réexploration. C’est utile ponctuellement. Si la page reste écartée après deux ou trois demandes, le problème n’est pas technique : il est éditorial ou lié à la qualité globale du site.
Une page non indexée peut-elle quand même recevoir du trafic ?
Pas depuis Google search. Elle peut continuer à recevoir du trafic direct, depuis des liens externes, ou depuis Bing, qui a sa propre logique d’indexation. En B2B, où l’organique pèse souvent 40 à 70 % des leads entrants, c’est une perte sèche.
Faut-il désindexer volontairement certaines pages ?
Oui, et c’est même recommandé pour tout ce qui ne mérite pas d’être positionné : pages de remerciement, espaces clients, doublons techniques, anciennes landing pages obsolètes. Mieux vaut un index propre de 80 pages utiles qu’un index pollué de 800 pages dont la moitié dilue la perception de qualité.
L’indexation n’est plus un sujet purement technique. C’est devenu un indicateur direct de la qualité perçue de votre site. Avant d’investir dans la production de nouveau contenu ou dans le netlinking, vérifiez d’abord ce que Google fait vraiment de ce que vous publiez déjà. Le diagnostic prend une demi-journée. Les bénéfices se mesurent sur l’année.