Erreur 404. Tous les internautes sont tombés sur ce message indiquant une page web supprimée, introuvable ou déplacée. Cette mésaventure s'explique : 38 % des pages web qui existaient en 2013 ne sont pas disponibles aujourd'hui. Selon une enquête menée par l'institut Pew Research Center, "dans la plupart des cas, cela s'explique par le fait qu'une page a été supprimée ou supprimée sur un site web par ailleurs fonctionnel."
Pour les auteurs de l'étude, cette "dégradation numérique" touche aussi bien les sites institutionnels (gouvernementaux par exemple) que les sites d'information ou Wikipédia notamment la section "Références" particulièrement riche en liens sortants. Du côté des sites gouvernementaux, 21 % des pages contiennent au moins un lien brisé, un chiffre qui monte à 23 % pour les sites d'actualité et qui culmine à 54 % pour Wikipédia !
Près d'un tweet sur cinq n'est plus visible publiquement
Les réseaux sociaux ne sont pas épargnés, à commencer par X. "Près d'un tweet sur cinq n'est plus visible publiquement sur le site quelques mois seulement après avoir été publié" constate l'étude ; "dans 60 % de ces cas, le compte qui a publié le tweet à l'origine a été rendu privé, suspendu ou entièrement supprimé. Dans les 40 % restants, le titulaire du compte a supprimé le tweet, mais le compte lui-même existe toujours."
Pour réaliser cette étude, le Pew Research Center s'est basé sur un échantillon aléatoire de près d'un million de pages web collectées par le service d'archives Common Crawl. Il a ensuite échantillonné les pages collectées chaque année de 2013 à 2023 (environ 90 000 pages par an) et vérifié si ces pages existaient encore aujourd'hui.
Précision importante, cette étude porte uniquement sur des pages web anglophones et des sites officiels nord-américains.