Accéder au contenu principal

Sitemap.xml généré automatiquement

 

Sitemap.xml ?

Un sitemap.xml est un fichier qui liste toutes les URLs importantes de votre site web. Il permet de guider Google et les autres moteurs de recherche à indexer votre site. Mettre en place un sitemap.xml fait partie des bonnes pratiques (actuelles).
Le fait qu'il s'agisse d'un fichier XML montre que cette pratique date un peu, aujourd'hui on ferait plutôt un fichier JSON, surtout au vu des données contenues qui ne mérite pas un format de fichier complexe. Mais, bon, c'est la norme... Alors on va faire du XML.

Un script bash pour générer votre sitemap.xml

Pour faciliter la création et la mise à jour de votre sitemap.xml, j'ai développé un petit script bash qui automatise ce processus. Voici ses principales caractéristiques :
  • Génération automatique : Le script parcourt votre site et crée le sitemap.xml sans intervention manuelle.
  • Mise à jour facile : Vous pouvez exécuter le script régulièrement pour maintenir votre sitemap à jour.
  • Simplicité d'utilisation : Il suffit de fournir l'URL de votre site pour générer le sitemap.  

#!/bin/sh

if [ $# -ge 1 ]; then
echo "Génère le sitemap.xml de $1"
else
echo
echo "Usage: make-sitemap.sh https://mon-site-web.com";
echo
exit;
fi

echo '<?xml version="1.0" encoding="UTF-8"?>' > sitemap.xml
echo '<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">' >> sitemap.xml

# on récupère toutes les URL du site avec HTML (ou /)
wget --spider --no-check-certificate --force-html -r -l 0 \
-R "*.jpg" -R "*.png" -R "*.jpeg" -R "*.css" -R "*.js" -R "*.svg" -R "*.pdf" \
$1 2>&1 | grep '^--' | awk '{ print $3 }' | grep '\(html\|/\)$' | sort | uniq >urls.txt

while read url; do
# on récupère uniquement le header --spider --server-response
# on récupère le champ LastModified qui est à au format "%a, %d %b %Y %H:%M:%S GMT"
LAST=`wget --spider --server-response $1 2>&1 | grep Last-Modified | sed 's/.*ed: //'`

# on doit forcer la langue en anglais, car HTTP renvoie la date en anglais...
# on convertit le format pour être compatible avec sitemap.xml +"%Y-%m-%dT%H:%M:%S%:z"
DATE=''

# MacOX
if test `uname` = 'Darwin'; then
DATE=`LANG=en_US.UTF-8 date -j -f "%a, %d %b %Y %H:%M:%S GMT" "$LAST" +"%Y-%m-%dT%H:%M:%S%:z"`
fi
# Linux
if test `uname` = 'Linux'; then
DATE=`LANG=en_US.UTF-8 date --date "$LAST" +"%Y-%m-%dT%H:%M:%S%:z"`
fi

(
echo " <url>"
echo " <loc>$url</loc>"
echo " <lastmod>$DATE</lastmod>"
echo " </url>"
) >> sitemap.xml
done < urls.txt
rm urls.txt

echo '</urlset>' >> sitemap.xml

Comment ça marche ?

  • Le script utilise wget pour récupérer le contenu de votre site.
  • Un petit peu de grep, awk, sort, uniq, pour générer un fichier urls.txt avec toutes les URL des pages web.
  • On génère ensuite le sitemap avec de simples echo.
  • On re-utilise wget pour chaque URL afin de récupérer la date de dernière modification de la page.
Une remarque pour le format de la date... HTTP renvoie une date dans le format ISO 8601, il faut donc le lire en définissant le format -f "%a, %d %b %Y %H:%M:%S GMT", mais en plus, la date est en anglais (et mon terminal est en français), d'où le LANG=en_US.UTF-8 qui précède la commande. La date dans le fichier sitemap.xml est au format  W3C Datetime soit de l'ISO 8601

Sur le site web

Il vous reste à mettre le fichier sitemap.xml à la racine de votre site web, puis à ajouter une ligne dans votre fichier Robots.txt : Sitemap: https://votre-site-web/sitemap.xml 
Evidemment, il faut refaire le sitemap.xml à chaque modification du site, ce que vous pouvez faire en crontab facilement.














Commentaires

Posts les plus consultés de ce blog

Tailles d'écran et iTunesConnect

 Lorsque l'on crée une nouvelle application, nous devons inclure des photos d'écran dans l'interface d'iTunes Connect :      Pour l'iPad, ce n'est pas bien compliqué, c'est indiqué, : Il faut les photos d'écran d'un iPadPro 12,9 pouce de 6ème (sans bouton home) et de 2e génération (avec le bouton home). Mais pour les iPhone c'est plus problématique, car il n'est indiqué que la taille de l'écran, et pas le modèle de l'appareil. Or dans la sélection des simulateurs, il n'y a pas les tailles des écrans des différent modèles ! Il faut donc se renseigner ici ;-) Appareil Taille iTunes Connect iPhone Pro Max 12, 13 6,7” Optionnel iPhone 11 Pro Max 6,5” Obligatoire iPhone 11, 12, 13 iPhone Pro 12, 13 6,1” iPhone X 5,8” iPhone 6+, 6S+, 7+, 8+ 5,5” Obligatoire iPhone 6, 6S, 7, 8 4,7” iPhone 5, 5S, SE 4” iPhone 4s 3,5” Personnellement, je ne savais pas que l'iPhone 11 Pro Max était le seul iPhone avec un écran 6,5 pouces !

Les bases de la programmation : Le binaire

Le binaire ”Ce monde est un code binaire où nous avons seulement deux options : accepter ou refuser. ” Ardit BEQIRI Lorsque l’on parle d’ordinateur on dit très souvent que ce n’est qu’un outil qui traite des 0 et 1, et ce n’est pas faux. Si l’on résume un ordinateur à de l’électronique, effectivement la mémoire, le processeur, les périphériques peuvent se résumer à des suites binaires, donc des suites de 0 et de 1. Mais c’est comme dire que le cerveau n’est qu’un imbroglio de neurones, c’est réducteur. La complexité du système est tel que l’on peut oublier qu’à la base c’est un système binaire, du reste un utilisateur d’ordinateur n’a même pas à savoir comment cela fonctionne, et même un programmeur n’a pas toujours à le savoir. Cependant, tous les langages informatiques comprennent une partie binaire. Et donc la compréhension du binaire est essentielle à un moment ou à un autre. En fait il y a plusieurs sujets interconnectés, la logique binaire, les opérations binaires, les nombr

xCode: auto-incrémentation du BUILD_VERSION

 Lorsque vous envoyez votre application à Apple, vous devez mettre à jour deux valeurs, le numéro de version et le numéro de build : Pour le numéro de Version, ce n'est pas vraiment un problème puisque celui-ci n'augmente que lors d'une mise à jour sur l'appStore. Cela peut être fait à la main. Pour le numéro de Build, c'est plus embêtant. Si vous êtes comme moi, et que vous faites de nombreuses bêta, il faut mettre à jour le numéro à chaque envoi de l'app, et on oublie souvent d'incrémenter la valeur. Le plus simple est alors d'incrémenter automatiquement la valeur à chaque compilation. Ainsi plus besoin de s'en occuper. J'avais trouvé ce script, à insérer avant la compilation : Cela fonctionnait très bien, mais xCode a changé, et les nouveaux projets ne range plus directement le numéro de Build dans le fichier Info.plist et cela ne fonctionne donc plus. J'ai donc cherché une nouvelle méthode, et la voici. Tout d'abord il faut changer l&