Accéder au contenu principal

Sitemap.xml généré automatiquement

 

Sitemap.xml ?

Un sitemap.xml est un fichier qui liste toutes les URLs importantes de votre site web. Il permet de guider Google et les autres moteurs de recherche à indexer votre site. Mettre en place un sitemap.xml fait partie des bonnes pratiques (actuelles).
Le fait qu'il s'agisse d'un fichier XML montre que cette pratique date un peu, aujourd'hui on ferait plutôt un fichier JSON, surtout au vu des données contenues qui ne mérite pas un format de fichier complexe. Mais, bon, c'est la norme... Alors on va faire du XML.

Un script bash pour générer votre sitemap.xml

Pour faciliter la création et la mise à jour de votre sitemap.xml, j'ai développé un petit script bash qui automatise ce processus. Voici ses principales caractéristiques :
  • Génération automatique : Le script parcourt votre site et crée le sitemap.xml sans intervention manuelle.
  • Mise à jour facile : Vous pouvez exécuter le script régulièrement pour maintenir votre sitemap à jour.
  • Simplicité d'utilisation : Il suffit de fournir l'URL de votre site pour générer le sitemap.  

#!/bin/sh

if [ $# -ge 1 ]; then
echo "Génère le sitemap.xml de $1"
else
echo
echo "Usage: make-sitemap.sh https://mon-site-web.com";
echo
exit;
fi

echo '<?xml version="1.0" encoding="UTF-8"?>' > sitemap.xml
echo '<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">' >> sitemap.xml

# on récupère toutes les URL du site avec HTML (ou /)
wget --spider --no-check-certificate --force-html -r -l 0 \
-R "*.jpg" -R "*.png" -R "*.jpeg" -R "*.css" -R "*.js" -R "*.svg" -R "*.pdf" \
$1 2>&1 | grep '^--' | awk '{ print $3 }' | grep '\(html\|/\)$' | sort | uniq >urls.txt

while read url; do
# on récupère uniquement le header --spider --server-response
# on récupère le champ LastModified qui est à au format "%a, %d %b %Y %H:%M:%S GMT"
LAST=`wget --spider --server-response $1 2>&1 | grep Last-Modified | sed 's/.*ed: //'`

# on doit forcer la langue en anglais, car HTTP renvoie la date en anglais...
# on convertit le format pour être compatible avec sitemap.xml +"%Y-%m-%dT%H:%M:%S%:z"
DATE=''

# MacOX
if test `uname` = 'Darwin'; then
DATE=`LANG=en_US.UTF-8 date -j -f "%a, %d %b %Y %H:%M:%S GMT" "$LAST" +"%Y-%m-%dT%H:%M:%S%:z"`
fi
# Linux
if test `uname` = 'Linux'; then
DATE=`LANG=en_US.UTF-8 date --date "$LAST" +"%Y-%m-%dT%H:%M:%S%:z"`
fi

(
echo " <url>"
echo " <loc>$url</loc>"
echo " <lastmod>$DATE</lastmod>"
echo " </url>"
) >> sitemap.xml
done < urls.txt
rm urls.txt

echo '</urlset>' >> sitemap.xml

Comment ça marche ?

  • Le script utilise wget pour récupérer le contenu de votre site.
  • Un petit peu de grep, awk, sort, uniq, pour générer un fichier urls.txt avec toutes les URL des pages web.
  • On génère ensuite le sitemap avec de simples echo.
  • On re-utilise wget pour chaque URL afin de récupérer la date de dernière modification de la page.
Une remarque pour le format de la date... HTTP renvoie une date dans le format ISO 8601, il faut donc le lire en définissant le format -f "%a, %d %b %Y %H:%M:%S GMT", mais en plus, la date est en anglais (et mon terminal est en français), d'où le LANG=en_US.UTF-8 qui précède la commande. La date dans le fichier sitemap.xml est au format  W3C Datetime soit de l'ISO 8601

Sur le site web

Il vous reste à mettre le fichier sitemap.xml à la racine de votre site web, puis à ajouter une ligne dans votre fichier Robots.txt : Sitemap: https://votre-site-web/sitemap.xml 
Evidemment, il faut refaire le sitemap.xml à chaque modification du site, ce que vous pouvez faire en crontab facilement.














Commentaires

Posts les plus consultés de ce blog

Tailles d'écran et iTunesConnect

 Lorsque l'on crée une nouvelle application, nous devons inclure des photos d'écran dans l'interface d'iTunes Connect :      Pour l'iPad, ce n'est pas bien compliqué, c'est indiqué, : Il faut les photos d'écran d'un iPadPro 12,9 pouce de 6ème (sans bouton home) et de 2e génération (avec le bouton home). Mais pour les iPhone c'est plus problématique, car il n'est indiqué que la taille de l'écran, et pas le modèle de l'appareil. Or dans la sélection des simulateurs, il n'y a pas les tailles des écrans des différent modèles ! Il faut donc se renseigner ici ;-) Appareil Taille iTunes Connect iPhone Pro Max 12, 13 6,7” Optionnel iPhone 11 Pro Max 6,5” Obligatoire iPhone 11, 12, 13 iPhone Pro 12, 13 6,1” iPhone X 5,8” iPhone 6+, 6S+, 7+, 8+ 5,5” Obligatoire iPhone 6, 6S, 7, 8 4,7” iPhone 5, 5S, SE 4” iPhone 4s 3,5” Personnellement, je ne savais pas que l'iPhone 11 Pro Max était le seul iPhone avec un écran 6,5 pouces !

malloc: xzm: failed to initialize deferred reclamation buffer

Lorsque je lance une de mes applications avec Xcode sur mon iPhone .... J'ai ce message de début :  malloc: xzm: failed to initialize deferred reclamation buffer (46)  Et franchement, je n'aime pas avoir des message que je ne comprends pas et qui contiennent le mot "failed" ! Mais le message n'existe pas avec mon iPad IOS16. Donc, ok, malloc je connais, on parle de la fonction de base d'allocation de mémoire système, il y a pleins d'outils pour les problèmes d'allocation mémoire, "xzm" doit être un de ces outils. Je ne trouve rien sur internet ! RIEN ! Perplexity ou Claude ne savent pas non plus ce que c'est. Je suis obligé de faire des suppositions... XZ est un format de compression conçu pour remplacer BZIP qui est conçu pour remplacer GZIP qui est conçu pour remplacer Z. Peut-être que les données de debug de Xcode transitent en étant compressé par défaut ? Allons voir dans le schéma du projet, pour voir les options concernant les mallo...

Réglages MACCATALYST

Lors de l'envoi de la mise à jour de mon application Appel sur Mac, Apple m'a refusé cette mise à jour au motif que le bouton Réglages ne fonctionnait pas. Il faut dire que mon application est une application IOS qui fonctionne sur Mac avec MACCATALYST, c'est à dire un peu comme dans un simulateur. Jusque là, Apple n'avait jamais fait de remarque sur ce sujet, il y a dû y avoir des changements de politique de test. C'est un peu gonflé de la part d'Apple, puisqu'une application IOS n'a pas forcément de réglages systèmes, ni de réglages tout court. Or, MACCATALYST crée le menu système avec une entrée "Réglages" par défaut, sans que le développeur n'ai rien demandé. Mais il n'y a pas d'action par défaut... C'est idiot, autant ne pas mettre l'entrée du tout. Bon, ceci étant dit, il faut tout de même gérer la chose. On ne peut pas le faire dans l'éditeur de ressource (ce que l'on ferait avec une application MacOSX), le me...