Ceux qui me connaissent savent ma passion pour les logs serveur (oui, c’est vraiment un truc de geek). J’ai un temps commercialisé un analyseur de logs qui a depuis été largement dépassé par Botify, Oncrawl et autres SEOlyzer.

Avant le développement des outils de Web Analytics, (Xiti, Google Analytics, …), le standard pour mesurer l’audience était l’analyse des logs serveur. La plupart des hébergeurs proposent d’ailleurs toujours les solutions Open Source Webalizer ou AWstats.

Les outils de Web Analytics ont tué le game, en déposant des cookies, ils permettent un suivi du comportement de l’utilisateur inégalé.

Sur le pur suivi d’audience, j’ai cependant toujours considéré les logs comme une source d’information beaucoup plus fiable. Tag analytics qui saute lors d’une refonte, pages non trackées, non-déclenchement du JavaScript,… Les biais sont nombreux avec les outils de Web Analytics.

Chez certains clients, j’ai mis en place un suivi d’audience logs en parallèle du suivi Analytics. Plus d’une fois, il a permis de détecter qu’une baisse d’audience constatée par Google Analytics ou AT internet n’était pas une réalité, mais un bug de suivi.

Aujourd’hui, c’est carrément devenu un enfer, entre le RGPD qui exige un consentement avec le dépôt d’un cookie, les navigateurs qui tendent à interdire les cookies tiers, … la fiabilité des données est devenue plus que douteuse.

Le retour en force des logs à venir ? Ce n’est pas si évident. Avec la généralisation du cloud computing et des CDN, il n’est pas toujours facile de les récupérer de manière exhaustive. Mais une fois le travail fait, vous pourrez suivre votre audience sans remettre tous les jours en question la fiabilité de ce que vous voyez.

Dans cet exemple, on suit le trafic SEO d’un site internet. En bleu le trafic mesuré par les logs, en rouge le trafic mesuré par AT internet. Les volumes sont différents (on ne mesure pas exactement de la même manière) mais les tendances sont parfaitement similaires. Sauf à un moment (zone entourée) ou le trafic AT internet s’effondre. Un double suivi AT Internet / Logs permets instantanément d’identifier que la baisse de trafic n’est pas réelle, c’est un bug de suivi.