🗺️ Extracteur d'URLs de Sitemap

Analysez et extrayez les URLs d'un sitemap.xml en un clic

📥 Source du sitemap

💡 Exemples : https://example.com/sitemap.xml, https://example.com/sitemap_index.xml
📄 Formats acceptés : .xml, .xml.gz
Exemple : <?xml version="1.0"?> <urlset> <url> <loc>https://example.com</loc> </url> </urlset>
📚 Guide d'utilisation
🌐 Depuis une URL

Entrez l'URL complète du sitemap (généralement https://site.com/sitemap.xml). L'outil récupère et analyse automatiquement le fichier.

📁 Depuis un fichier

Téléchargez un fichier sitemap.xml depuis votre ordinateur. Supporte aussi les fichiers compressés .xml.gz.

📋 Coller le XML

Copiez-collez directement le contenu XML du sitemap dans la zone de texte pour une analyse instantanée.

ℹ️ Limites : Taille maximale de 50 Mo par sitemap (limite du protocole sitemap.org). Les fichiers .gz sont automatiquement décompressés.

✨ Fonctionnalités
  • Extraction de toutes les URLs
  • Métadonnées : lastmod, priority, changefreq
  • Support des sitemap index
  • Filtrage et tri avancés
  • Export multi-formats
💡 Cas d'usage
  • Audit SEO de site web
  • Migration de site
  • Analyse de contenu
  • Crawl budget analysis
  • Vérification d'indexation
❓ Questions fréquentes

Un sitemap XML est un fichier qui liste toutes les URLs d'un site web que son propriétaire souhaite faire indexer par les moteurs de recherche. Il contient des métadonnées comme la date de dernière modification, la priorité et la fréquence de changement de chaque page.

Le sitemap se trouve généralement à https://site.com/sitemap.xml ou https://site.com/sitemap_index.xml. Vous pouvez aussi consulter le fichier robots.txt à https://site.com/robots.txt qui indique souvent l'emplacement du sitemap.

Un sitemap classique contient directement les URLs des pages. Un sitemap index est un fichier qui référence plusieurs sitemaps (utile pour les gros sites avec plus de 50 000 URLs). Notre outil détecte automatiquement les deux types.

Oui, absolument. Tous les traitements sont effectués localement dans votre navigateur. Aucune donnée n'est envoyée à nos serveurs. Le sitemap est analysé directement sur votre appareil.

Oui, vous pouvez exporter les URLs extraites en plusieurs formats : CSV (pour Excel/Google Sheets), TXT (liste simple), JSON (avec toutes les métadonnées) ou simplement copier la liste des URLs dans le presse-papier.

📖 Tout savoir sur l'extraction d'URLs de sitemap

Pourquoi extraire les URLs d'un sitemap ?

L'extraction des URLs d'un sitemap est une tâche courante en SEO et développement web. Elle permet d'obtenir rapidement la liste complète de toutes les pages d'un site, avec leurs métadonnées importantes (date de modification, priorité, fréquence de mise à jour). C'est essentiel pour les audits SEO, les migrations de site, l'analyse de contenu et la vérification d'indexation.

Les métadonnées du sitemap XML

Chaque URL dans un sitemap peut contenir plusieurs métadonnées importantes :

  • loc : L'URL complète de la page (obligatoire)
  • lastmod : Date de dernière modification (format ISO 8601)
  • changefreq : Fréquence estimée de changement (always, hourly, daily, weekly, monthly, yearly, never)
  • priority : Priorité relative de la page (0.0 à 1.0)

Utilisations professionnelles

Pour le SEO : Vérifiez que toutes vos pages importantes sont présentes dans le sitemap, analysez les priorités attribuées, identifiez les pages récemment modifiées.

Pour les migrations : Exportez la liste complète des URLs à migrer, comparez l'ancien et le nouveau sitemap pour détecter les pages manquantes.

Pour les développeurs : Automatisez l'extraction d'URLs pour des scripts de crawl, de test ou de génération de rapports.