Au cœur d’une ancienne église, un billion de pages web trouvent la vie éternelle

0
428

À deux pas du Presidio de San Francisco, un édifice blanc orné de colonnes gothiques s’élève au milieu du paysage, comme un pont entre spiritualité ancienne et mémoire numérique moderne. Lieu de culte chrétien pendant des décennies, l’ancienne église abrite désormais un sanctuaire d’un autre genre : l’Internet Archive, gigantesque bibliothèque numérique consacrée depuis près de trente ans à préserver l’histoire du web.

Dans la nef ornée de vitraux, le murmure des sermons a été remplacé par la vibration grave et continue des serveurs. C’est là que la célèbre Wayback Machine conserve, ligne par ligne, code par code, les anciennes versions de sites web que le monde entier a oubliés. Le mois dernier, la machine a dépassé un cap symbolique : un billion de pages archivées, devenant ainsi l’un des plus grands projets de mémoire numérique jamais entrepris.

La tâche de l’Internet Archive n’a jamais été aussi urgente. La disparition rapide de contenus gouvernementaux américains en début d’année, l’avènement des paywalls, et surtout la montée fulgurante de l’intelligence artificielle – qui génère, réécrit ou remplace les contenus humains – menacent de faire disparaître des pans entiers de notre histoire numérique. L’équipe de l’Archive, composée de bibliothécaires, d’ingénieurs et d’archivistes, assume la responsabilité complexe de capturer ce qui, chaque jour, risque de s’effacer.

Brewster Kahle, fondateur passionné de l’institution, évoque ce projet monumental avec l’enthousiasme d’un enseignant amoureux du savoir. Assis sur les bancs de bois d’origine du sanctuaire, il explique avoir choisi ce bâtiment pour sa symbolique : la permanence, la mémoire, la transmission. À ses yeux, internet est aujourd’hui ce que représentait autrefois la Bibliothèque d’Alexandrie : un espace où chaque fragment du savoir humain peut – ou devrait – être sauvegardé.

Lorsque Kahle a lancé l’Internet Archive en 1996, une année de données tenait sur deux téraoctets, un volume équivalent au stockage d’un téléphone moderne. Aujourd’hui, ce sont 150 téraoctets par jour qui sont ingérés. La Wayback Machine ne capture pas seulement des images statiques : elle enregistre l’architecture complète des pages – HTML, scripts, styles – permettant de « rejouer » fidèlement un site même lorsque le serveur d’origine a disparu.

L’arrivée de l’IA bouleverse cette logique. Pour la première fois, l’Archive doit désormais préserver aussi les contenus générés par des modèles comme ChatGPT. Résumés automatiques, réponses de chatbot, extraits synthétiques affichés en tête des recherches : tout cela doit être archivé pour documenter la manière dont l’information circule aujourd’hui. Une équipe élabore quotidiennement des séries de requêtes pour capter ces interactions, créant une mémoire parallèle de l’ère algorithmique.

Dans un immense entrepôt où sont stockés la majorité des serveurs – et dans la nef même de l’ancienne église, où d’autres machines sont exposées volontairement – l’Archive affirme un principe fondamental : la mémoire est un bien collectif. Les 200 employés numérisent aussi des livres, des disques vinyles, des films, des jeux vidéo et des microfilms, transformant le bâtiment en un laboratoire vivant de préservation culturelle. Une « armée » de statues en trois dimensions, représentant les employés les plus anciens, complète ce décor étrange et fascinant, comme une métaphore de la résistance contre l’oubli numérique.

Pour Kahle, l’Internet Archive n’est pas un musée chargé de raconter une version unique de l’histoire. C’est une matière première, un socle destiné à permettre au public, aux chercheurs, aux journalistes, et même aux futurs créateurs d’IA, d’explorer, comparer, et comprendre le passé numérique.

Sa mission : empêcher qu’une génération entière de contenus disparaisse sans laisser de trace.

À l’heure où l’intelligence artificielle réécrit le réel plus vite que nous ne pouvons le vérifier, préserver l’ADN technique et visuel du web est devenu un acte essentiel. Et cela se joue, paradoxalement, au cœur d’une ancienne église où se construit, page après page, la mémoire du futur.

Source : CNN (novembre 2025).

Swiv TekTek sou tout rezo yo pou plis nouvèl sou teknoloji, inovasyon ak avni dijital la :

Twitter/X : @iam_tektek

Threads : @iam_tektek

Instagram : @iam_tektek

WhatsApp Channel : TekTek

Partager

Comments are closed.