Ce que j’aime dans le référencement, c’est qu’on en apprends tous les jours.

Je viens de découvrir le concept de « soft 404 ». Celui-ci n’est pas nouveau, mais j’étais passé à côté.

Le terme « soft 404 » a été inventé par Google pour désigner les pages qui ont tout d’une page 404, mais qui ne retournent pas le code 404.

Typiquement, sur un site marchand, ce sont les pages qui retournent un message du type « ce produit n’existe plus » tout en retournant un code 200 (OK).

Les « soft 404 » sont problématiques à plusieurs égards : elles indiquent aux moteurs de recherche que ce sont des pages valides alors que ce n’est clairement pas le cas. Elles sont donc suceptibles d’être crawlées (crawl inutile) et d’être indexées (duplicate content + pages sans valeurs). Il faut donc les éliminer !

Pour les identifier, rien de plus simple, direction Google Webmaster Tools. Dans Diagnostic > Erreurs d’exploration > Erreur de type « soft 404 ».

Une fois identifiées, restent à appliquer à ces pages un code 404 ou une redirection 301.