Sitemap.xml : quel intérêt pour Google ?

Par Yohann , le 21 décembre 2024 - 5 minutes de lecture
sitemap xml seo importance google

Le sitemap.xml est un GPS pour Google, il lui permet de savoir quelles urls aller voir, quelles sont les plus importantes (etc.) mais, comme pour un GPS de voiture, il s’autorise à ne pas le suivre. C’est ce qui rend le sitemap.xml simple et complexe à la fois. Agence SEO sur La Rochelle, je vous explique tout en détail, y compris comment le créer et où le mettre pour que Google le voie. Attachez votre ceinture.

Qu’est-ce que le sitemap.xml ?

Le sitemap.xml (ou plan du site) est une page listant l’ensemble des urls d’un site Internet que l’on souhaite indexer. Ainsi, les robots d’indexation (Googlebots…) peuvent aller les voir. Ces urls peuvent être des pages, articles, images, catégories…

Je mets directement les pieds dans le plat, ne confondez pas sitemap.xml et plan du site (en HTML) humain (listing des urls). Pour des raisons SEO (datant des années 2010), on voyait régulièrement un plan du site dans le footer avec les urls de l’ensemble du site web. L’objectif était de mettre les urls à 1 clic de la page d’accueil…

Revenons au sitemap.xml, il est au format XML (eXtrensible Mark-up Language ou langage de balisage extensible) car c’est un langage standardisé par le W3C (World Wide Web Consortium). C’est un fichier normalisé donc compréhensible de tous les robots d’indexation.

Pour la petite histoire, c’est Google, en 2025, qui a proposé ce protocole. Il a ensuite été adopté par Bing, Yahoo (etc.). Quand le leader demande, les suiveurs suivent !

Que faut-il mettre dans un sitemap.xml ?

La base est de mettre les urls de votre site web sur ce format :

<url>
<loc>https://www.example.com/page/</loc>
</url>

Ensuite, vous pouvez ajouter :

  • La date de mise à jour : <lastmod>2024-12-01</lastmod>
  • La fréquence de mise à jour : <changefreq>daily</changefreq> (weekly ou monthly)
  • La priorité de la page : <priority>0.8</priority> (note de 0 à 1 ; 1 étant la meilleure)
  • Les équivalences étrangères :
    <xhtml:link rel=« alternate » hreflang=« fr » href=« https://www.example.com/fr/page » />
    <xhtml:link rel=« alternate » hreflang=« es » href=« https://www.example.com/es/page » />
  • Pour les sites de news : <news:news> </news:news>

Je vous conseille d’indiquer les 3 premiers points soit :

<url>
<loc>https://www.example.com/page/</loc>
<
lastmod>2024-12-01</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>

Ne trichez pas sur la fréquence de mise à jour et faites attention à bien prioriser vos pages importantes. Pour rappel, si toutes vos pages sont importantes, finalement, aucune ne l’est !

Comment créer un sitemap.xml ?

Pas de panique, si votre site est sur WordPress, la majorité des plugins spécifiques SEO le génère automatiquement (Yoast SEO, Rank Math, All in one SEO, SEO Key…) ! À partir du moment où vous laissez votre page en « index » (c’est-à-dire indexable par Google), dès la publication, il va mettre l’url dans le sitemap.xml. A l’inverse, si vous mettez une url en « noindex », elle n’y sera pas présente.

Si vous utilisez un autre CMS (Joomla, Shopify, Magento, PrestaShop…), même principe, des plugins ou des extensions gèrent cela.

Si votre site est personnalisé en JavaScript par exemple, votre agence de création de site Internet doit prendre cela en compte et l’automatiser si vous avez un blog. À mettre dans son cahier des charges.

Sachez que Google met à disposition une page officielle pour créer et envoyer un sitemap.xml mais c’est assez technique… voir la page.

Comment l’indiquer à Google ?

Pour cela, rien de plus simple, vous indiquez l’url dans la Search Console, dans le menu à gauche. Indiquez bien l’url racine du sitemap.xml.

search console sitemap

Je commande également de l’indiquer dans le robots.txt car on sait que c’est le 1er fichier d’un site web que les robots d’indexation vont voir :

sitemap: https://www.example.com/sitemap.xml

Comment connaitre l’url de son sitemap.xml ?

La manière la plus simple est de la récupérer dans votre plugin SEO, celui qui génère le fameux sitemap.xml.

L’autre manière est d’indiquer « /sitemap.xml » ou « /sitemap_index.xml » à la fin de son nom de domaine. Exemple, mon nom de domaine est yj-seo.fr, cela donne yj-seo.fr/sitemap_index.xml.

Contradiction sitemap.xml et robots.txt

Pour rappel, le robots.txt permet d’indiquer notamment les urls que vous souhaitez éviter que Google voit. Le sitemap.xml, c’est tout l’inverse, vous indiquez les urls que vous voulez que Google voit.

Il est fréquent que vous interdisiez le passage des robots d’indexation avec le robots.txt mais que vous laissiez l’url dans le sitemap.xml ! Du coup, c’est contradictoire pour Google qui vous l’indiquera dans les erreurs dans la Search Console.

Sitemap.xml : ne laissez pas votre SEO dans l’impasse

Le fichier sitemap.xml est très important, car il permet de prendre la main à Google pour lui dire quelles urls aller voir, lesquelles sont prioritaires ou sont régulièrement mises à jour. Il se crée automatiquement avec les plugins SEO et se met dans la Search Console. Il faut juste faire attention à ne pas avoir des indications contradictoires avec le robots.txt. Ne négligez pas cet allié précieux car un sitemap.xml bien conçu, c’est comme une carte bien tracée… indispensable pour que Google ne se perde pas en chemin !

5/5 - (1 vote)

Yohann

Expert SEO depuis + de 10 ans, je suis à votre disposition si vous avez un projet SEO, une création de site internet ou former vos équipes au SEO.

Commentaires

Laisser un commentaire

Votre commentaire sera révisé par les administrateurs si besoin.