Accéder au contenu principal

Sitemap.xml généré automatiquement

 

Sitemap.xml ?

Un sitemap.xml est un fichier qui liste toutes les URLs importantes de votre site web. Il permet de guider Google et les autres moteurs de recherche à indexer votre site. Mettre en place un sitemap.xml fait partie des bonnes pratiques (actuelles).
Le fait qu'il s'agisse d'un fichier XML montre que cette pratique date un peu, aujourd'hui on ferait plutôt un fichier JSON, surtout au vu des données contenues qui ne mérite pas un format de fichier complexe. Mais, bon, c'est la norme... Alors on va faire du XML.

Un script bash pour générer votre sitemap.xml

Pour faciliter la création et la mise à jour de votre sitemap.xml, j'ai développé un petit script bash qui automatise ce processus. Voici ses principales caractéristiques :
  • Génération automatique : Le script parcourt votre site et crée le sitemap.xml sans intervention manuelle.
  • Mise à jour facile : Vous pouvez exécuter le script régulièrement pour maintenir votre sitemap à jour.
  • Simplicité d'utilisation : Il suffit de fournir l'URL de votre site pour générer le sitemap.  

#!/bin/sh

if [ $# -ge 1 ]; then
echo "Génère le sitemap.xml de $1"
else
echo
echo "Usage: make-sitemap.sh https://mon-site-web.com";
echo
exit;
fi

echo '<?xml version="1.0" encoding="UTF-8"?>' > sitemap.xml
echo '<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">' >> sitemap.xml

# on récupère toutes les URL du site avec HTML (ou /)
wget --spider --no-check-certificate --force-html -r -l 0 \
-R "*.jpg" -R "*.png" -R "*.jpeg" -R "*.css" -R "*.js" -R "*.svg" -R "*.pdf" \
$1 2>&1 | grep '^--' | awk '{ print $3 }' | grep '\(html\|/\)$' | sort | uniq >urls.txt

while read url; do
# on récupère uniquement le header --spider --server-response
# on récupère le champ LastModified qui est à au format "%a, %d %b %Y %H:%M:%S GMT"
LAST=`wget --spider --server-response $1 2>&1 | grep Last-Modified | sed 's/.*ed: //'`

# on doit forcer la langue en anglais, car HTTP renvoie la date en anglais...
# on convertit le format pour être compatible avec sitemap.xml +"%Y-%m-%dT%H:%M:%S%:z"
DATE=''

# MacOX
if test `uname` = 'Darwin'; then
DATE=`LANG=en_US.UTF-8 date -j -f "%a, %d %b %Y %H:%M:%S GMT" "$LAST" +"%Y-%m-%dT%H:%M:%S%:z"`
fi
# Linux
if test `uname` = 'Linux'; then
DATE=`LANG=en_US.UTF-8 date --date "$LAST" +"%Y-%m-%dT%H:%M:%S%:z"`
fi

(
echo " <url>"
echo " <loc>$url</loc>"
echo " <lastmod>$DATE</lastmod>"
echo " </url>"
) >> sitemap.xml
done < urls.txt
rm urls.txt

echo '</urlset>' >> sitemap.xml

Comment ça marche ?

  • Le script utilise wget pour récupérer le contenu de votre site.
  • Un petit peu de grep, awk, sort, uniq, pour générer un fichier urls.txt avec toutes les URL des pages web.
  • On génère ensuite le sitemap avec de simples echo.
  • On re-utilise wget pour chaque URL afin de récupérer la date de dernière modification de la page.
Une remarque pour le format de la date... HTTP renvoie une date dans le format ISO 8601, il faut donc le lire en définissant le format -f "%a, %d %b %Y %H:%M:%S GMT", mais en plus, la date est en anglais (et mon terminal est en français), d'où le LANG=en_US.UTF-8 qui précède la commande. La date dans le fichier sitemap.xml est au format  W3C Datetime soit de l'ISO 8601

Sur le site web

Il vous reste à mettre le fichier sitemap.xml à la racine de votre site web, puis à ajouter une ligne dans votre fichier Robots.txt : Sitemap: https://votre-site-web/sitemap.xml 
Evidemment, il faut refaire le sitemap.xml à chaque modification du site, ce que vous pouvez faire en crontab facilement.














Commentaires

Posts les plus consultés de ce blog

Tailles d'écran et iTunesConnect

 Lorsque l'on crée une nouvelle application, nous devons inclure des photos d'écran dans l'interface d'iTunes Connect :      Pour l'iPad, ce n'est pas bien compliqué, c'est indiqué, : Il faut les photos d'écran d'un iPadPro 12,9 pouce de 6ème (sans bouton home) et de 2e génération (avec le bouton home). Mais pour les iPhone c'est plus problématique, car il n'est indiqué que la taille de l'écran, et pas le modèle de l'appareil. Or dans la sélection des simulateurs, il n'y a pas les tailles des écrans des différent modèles ! Il faut donc se renseigner ici ;-) Appareil Taille iTunes Connect iPhone Pro Max 12, 13 6,7” Optionnel iPhone 11 Pro Max 6,5” Obligatoire iPhone 11, 12, 13 iPhone Pro 12, 13 6,1” iPhone X 5,8” iPhone 6+, 6S+, 7+, 8+ 5,5” Obligatoire iPhone 6, 6S, 7, 8 4,7” iPhone 5, 5S, SE 4” iPhone 4s 3,5” Personnellement, je ne savais pas que l'iPhone 11 Pro Max était le seul iPhone avec un écran 6,5 pouces !

Les bases de la programmation : Le binaire

Le binaire ”Ce monde est un code binaire où nous avons seulement deux options : accepter ou refuser. ” Ardit BEQIRI Lorsque l’on parle d’ordinateur on dit très souvent que ce n’est qu’un outil qui traite des 0 et 1, et ce n’est pas faux. Si l’on résume un ordinateur à de l’électronique, effectivement la mémoire, le processeur, les périphériques peuvent se résumer à des suites binaires, donc des suites de 0 et de 1. Mais c’est comme dire que le cerveau n’est qu’un imbroglio de neurones, c’est réducteur. La complexité du système est tel que l’on peut oublier qu’à la base c’est un système binaire, du reste un utilisateur d’ordinateur n’a même pas à savoir comment cela fonctionne, et même un programmeur n’a pas toujours à le savoir. Cependant, tous les langages informatiques comprennent une partie binaire. Et donc la compréhension du binaire est essentielle à un moment ou à un autre. En fait il y a plusieurs sujets interconnectés, la logique binaire, les opérations binaires, les nombr...

buildMenuWithBuilder

 J'ai pas mal d'application IOS qui sont passé sous MacOSX avec Catalyst, Apple voulant profiter du catalogue iPad pour booster le Mac et pour Vision son casque de réalité virtuelle. Par exemple, mon application LOGO, fonctionne maintenant sur iPad et sur Mac. Mais le champ texte qui contient le code à exécuter substituait tout seul les guillemet simple en guillemet ouvrante ou fermante... Embêtant quand le langage ne comprenait pas cette subtilité. La première chose est en fait d'enlever les fonctionnalité du menu de l'application. Mais il n'y a pas de menu d'application sous iPad. Il faut deux choses.  1 - Il faut que l'application soit UIResponder. En effet, mon application étant vieille, le AppDelegate était dérivé de NSObject et pas de UIResponder. Donc la fonction qui permet de toucher aux menus n'était pas appelée. 2 - Il faut créer une fonction  buildMenuWithBuilder:  dans l'implémentation de AppDelegate, celle-ci prend en paramètre le menu e...