"En tant qu'historienne du web, le défi n'est pas le manque de sources, mais leur profusion"

Valérie Schafer est directrice adjointe du C²DH, à l'Université du Luxembourg. - © C2DH

Publié le par Florence Santrot

Quand on dit que vous travaillez sur l’histoire du Web, à quoi ressemble concrètement votre travail ?

Il est très fragmenté. Je navigue entre des archives du Web, de la presse, des entretiens oraux, des documents institutionnels, parfois même des logiciels anciens. On ne se limite jamais aux traces en ligne seules. Les archives du web ne suffisent pas : il faut les mettre en regard d’autres sources pour comprendre ce que l’on a sous les yeux.

Qu’est-ce qui est le plus complexe dans ce type de recherche ?

C’est la constitution des corpus. Longtemps, quand on allait aux archives ou à la bibliothèque, on savait ce qu’il y avait, on disposait d’inventaires. Aujourd’hui, on peut identifier des sites web, mais on ne sait jamais si l’information que l’on cherche a été archivée au bon moment, ni si on va y accéder. Il y a toujours une part d’incertitude.

La question de la sécurisation des archives numériques est-elle devenue centrale dans votre travail ?

Oui, parce que le numérique est fragile. Il y a des enjeux majeurs de cybersécurité, de protection des infrastructures, de protection des lieux où sont stockées les données. On n’est pas à l’abri de cyberattaques, ni de défaillances techniques. On l’a vu récemment avec la British Library, qui a subi une attaque très lourde : les contenus n’ont pas été détruits, mais les infrastructures d’accès ont été profondément touchées, et il faut des mois pour s’en remettre.

Il y a aussi des attaques sur l’organisation Internet Archive, avec des effets plus limités, mais qui montrent bien la vulnérabilité de ces systèmes. Cela pose la question du stockage, de la redondance, du fait de ne pas tout conserver au même endroit. Comme pour les archives papier, il faut penser à la protection, à la duplication, et à la résilience des dispositifs.

Le web change-t-il la nature même des archives ?

Oui. Les archives numériques, qu’elles soient numérisées ou nativement numériques, sont davantage pensées comme des données. On peut en extraire des informations, faire de la lecture distante, computationnelle, extraire un certain nombre de données pour faire du topic modeling [faire ressortir automatiquement les grands thèmes d’un vaste ensemble de textes, NLDR]. Ça change nos façons de travailler, mais ça ne remplace pas le regard critique sur les documents.

Vous évoquez aussi le cas de Skyblog. Pourquoi est-ce un exemple important pour vous ?

Quand Skyrock a annoncé l’arrêt de Skyblog, la BnF [Bibliothèque Nationale de France] a sauvegardé des milliers de Skyblogs. Et là, beaucoup de personnes ont découvert que leurs contenus étaient toujours accessibles, qu’ils entraient dans le patrimoine. C’est intéressant, parce que ce sont des traces très personnelles, très amateurs, qui n’étaient pas pensées pour être conservées à long terme.

Ça montre bien ce double mouvement : d’un côté, des sites ou des contenus disparaissent, et de l’autre, certaines traces sont conservées, parfois même à l’insu de leurs auteurs. Ça pose des questions sur ce qu’on choisit de garder, sur ce que les gens auraient peut-être préféré oublier, et sur la façon dont ces archives prennent une valeur historique avec le temps.

Cette abondance de données facilite-t-elle le travail de l’historien ?

Pas forcément. Le défi n’est pas le manque de sources, mais leur profusion. Il faut faire des choix, renoncer à certaines choses. Et il y a aussi des pertes. On aimerait avoir toutes les données en même temps, mais on sait que ce n’est ni possible ni souhaitable. Il y a aussi des coûts : financiers, techniques, mais aussi écologiques et citoyens.

Y a-t-il malgré tout des moments de satisfaction très concrets dans ce travail ?

Oui, bien sûr. Retrouver un vieux blog intact, accéder à des ressources qu’on ne trouve plus ailleurs, pouvoir rejouer ou émuler des logiciels anciens… Ce sont des moments très forts. On accède à des documents qui ont parfois complètement disparu du Web vivant. C’est une matière de recherche passionnante.

Comment le numérique a-t-il transformé la manière d’écrire l’histoire ?

On croise toujours les sources, comme les historiens l’ont toujours fait. Mais on évolue vers des pratiques nouvelles, collectivement. Les archives sont de plus en plus pensées comme des ensembles de données, et il y a aussi des réflexions sur les narrations numériques, sur la façon de raconter l’histoire autrement, de la documenter et de la transmettre.

L’intelligence artificielle change-t-elle déjà votre métier ?

À l’heure actuelle, je dirais qu’on est encore à un stade prudent, balbutiant, voire réticent pour certains. On n’a pas une révolution de l’IA dans la discipline historienne. Et pourtant, on voit bien ce que l’intelligence artificielle peut faire à l’histoire, notamment pour les archives et leur analyse, ou avec la production de contenus inventés, les deepfakes, et la difficulté à différencier ce qui est falsifié de ce qui est authentique. Cela pose des questions sur la façon dont l’histoire peut être racontée et sur la circulation de récits fabriqués.

Malgré toutes ces difficultés, restez-vous optimiste ?

Oui. Le travail devient plus complexe, mais toujours plus intéressant. On doit inventer de nouvelles méthodes, travailler davantage en équipe, avec des informaticiens, des juristes. Ce n’est pas seulement inquiétant. C’est intellectuellement très stimulant.

Sujets associés