Sur fond de débat sur le droit à l’oubli numérique, la BnF, dont la mission de conservation s’étend désormais aux sites web, s’interroge sur la constitution d’un patrimoine numérique issu de l’Internet. Que doit-elle garder des millions de sites qui naissent et s’éteignent chaque jour en France ? À quoi et à qui ces collections serviront-elles ? Après un premier après-midi d’étude en mars dernier, consacré à l’archivage des sites électoraux et militants, la BnF s’est intéressée, le jeudi 17 juin 2010 [1], à la sphère du privé : sites personnels, blogs, réseaux sociaux et micro-blogging (sites de type Twitter).
Le phénomène des blogs, avec le développement qu’il a connu récemment, n’a encore que bien peu de recul aux yeux de l’observateur : une dizaine d’années. La galaxie où nous gravitons, la blogosphère comme on dit, constitue un espace continuellement en mouvement et en devenir ; les blogs sont des objets périssables, de nouveaux naissent chaque jour, certains disparaissent, beaucoup émigrent d’une adresse à une autre. Dépositaire de toute la matière écrite qui se publie en France, la BNF a souhaité prendre en compte ce « phénomène de société ». Mais il ne lui est évidemment pas possible de conserver, ni même de recenser, la totalité des blogs existants dans l’Hexagone, d’autant plus qu’il s’agit d’un paysage éphémère. Une tentative est donc en cours pour mettre en œuvre une autre solution.
Philippe Lejeune, président de l’Association pour l’Autobiographie (APA), s’était posté en embuscade pendant un an (sur le tournant de 1999 à 2000) pour débusquer les journaux en ligne, plutôt rares à l’époque : une soixantaine au début de la période, le double à la fin. Il en a tenu un journal de terrain (base de son livre « Cher écran ») qui constitue « une des rares traces publiques d’un paysage disparu », qu’il dit avoir observé « comme pionnier et comme archéologue.
Autrefois, les journaux intimes écrits dans des cahiers étaient promis à la longue durée, à la survie dans les archives, mais aujourd’hui « les journaux et leurs supports risquent de disparaître avant nous ». Dans les blogs, toute nouvelle entrée se place en premier et chasse vers le bas la plus ancienne. C’est que « l’espace a remplacé le temps » à la manière dont Régis Debray dit que « la communication a remplacé la transmission ».
Il y avait eu en ces années d’enfance de l’Internet une initiative individuelle : Mongolo, un des premiers blogueurs francophones, avait créé son « orphelinat » – un site destiné à sauvegarder les journaux que leurs auteurs voulaient abandonner [2]. Par la suite, le développement du phénomène a rendu nécessaire l’intervention de l’État pour assurer ses responsabilités patrimoniales et archivistiques. C’est ainsi que la BnF en a été chargée dans le cadre de la loi du 1er août 2006.
Christine Genin, du département Littérature de la BnF, a ensuite décrit la situation actuelle en matière de collecte de blogs et de sites personnels. La Bibliothèque a adopté une solution mixte : d’une part une collecte large automatisée (par robot) sur tous les domaines en .fr (environ 1,7 million), d’autre part des collectes ciblées thématiques, par une veille documentaire menée par les bibliothécaires et qui a permis de recenser en littérature française environ 1200 sites dont 550 d’écrivains francophones. Parallèlement, elle a a mis en place une collaboration avec l’APA dont le webmestre, Bernard Massip, a réuni autour de lui un groupe de travail « veille internet » constitué de blogueurs (dont fait partie votre humble servante). Ce partenariat procède depuis 2007 à deux collectes par an, ce qui a permis d’ajouter au « fonds » virtuel une cinquantaine de sites à chaque collecte – soit un total actuel de 540 sites dont 370 toujours en activité. Ces archives sont consultables sur place à la BnF (mais uniquement à la bibliothèque de recherche).
Bernard Massip (APA) a évoqué la collecte de blogs réalisée avec son équipe de 5-6 personnes à partir des blogrolls, des listes de chacun des blogueurs. Au fil de ce travail, des critères de sélection ont été fixés et affinés : durée de vie du blog (au moins un an d’existence), lisibilité des contenus, expression de la subjectivité de la personne, originalité, spécificité, qualité d’écriture. Puis les blogs retenus sont classés par catégories. Il s’agit « d’une méthode artisanale, empirique – on ne cherche pas à faire une archive représentative, mais à établir un échantillon significatif » prenant cependant en compte le maximum de profils et de sujets traités.
Contrairement à l’APA, où toute démarche d’archivage est faite à la demande des déposants, ici les auteurs ne sont pas consultés. Afin que les choses soient claires, l’APA a affiché sur son site un communiqué informant les auteurs de blogs de leurs droits. (En gros, le contenu d’un blog étant publié se trouve dans le domaine public et les auteurs ne peuvent pas s’opposer à son archivage. Ils peuvent par contre créer un blog privé avec code d’accès, qui ne pourra pas être collecté.)
Deux blogueuses ont ensuite porté témoignage de leur pratique du blog et de leur point de vue sur l’archivage des contenus. Gilda Fiermonte s’est déclarée « vigilante » sur les traces laissées dans le virtuel. Elle avait créé son premier blog intiutlé « Sans nouvelles » au début de 2005 pour le comité de soutien à Florence Aubenas. « C’était un feuilleton sur l’attente – je ne pensais pas à la conservation à l’époque. » Dans son blog actuel, Traces et trajets, elle s‘attache à capter l’air du temps : un matériau « plutôt volatil » (où l’on trouve des traces « d’un Paris sans Vélib et où on pouvait fumer dans les cafés »), mais avec le temps, dit-elle modestement, « cela peut présenter un intérêt. » Elle mène de front plusieurs autres blogs et fotologs, déclarant « se dissimuler dans l’éparpillement ».
Martine Sonnet est historienne, écrivain et blogueuse – ce jour-là, c’est surtout l’historienne qui parlait. Pour celle-ci, « les récits de soi sont une matière première de premier ordre ». Internet représente un phénomène très récent (15 ans) à l’échelle du temps des historiens… Aujourd’hui la facilité d’accès aux sources, leur profusion, leur immédiateté font que les historiens sont bousculés, leurs repères brouillés, « un peu dans la sidération par rapport aux possibilités nouvelles ». Les blogs sont des sources publiées mais sans validation extérieure (comme dans la publication de journaux papier). De plus ce sont des objets hybrides intégrant d’autres composantes : photos, vidéos, son… (Contrairement à Gilda, Martine cherche à concentrer tous les fils de ses activités virtuelles sur un seul site.)
Un point de vue rejoint par André Gunthert (EHESS), auteur du site « Culture Visuelle ». Internet a bouleversé l’état des choses pour les chercheurs, transformés en chercheurs/collecteurs ayant à gérer leurs propres archives. Corollaire : « c’est en constituant l’archive que vous écrivez l’histoire »… Le problème du choix de quoi archiver n’est pas nouveau : on n’a jamais TOUT conservé (par ex. les traces de la culture populaire). Mais le Net a accéléré les choses, et pris une place croissante en tant que source de documents, d’où la perte d’autorité d’institutions comme la BnF. « Internet est devenu ma source principale, explique André Gunthert. Après avoir récupéré la maîtrise de mon archive, je ne suis pas prêt à en rendre la gestion – parce que c’est un point crucial. » Ce qui est important aujourd’hui, c’est d’arriver à « produire du sens » alors que nous fabriquons du passé, devenu objet d’histoire, plus rapidement qu’auparavant.
Publié le mardi 22 Juin 2010 par Elizabeth Legros Chapuis sur son blog "Sédiments"
Image : Les boites mystérieuses où la BnF stocke ses archives du virtuel...
________________________________________
[1] J’ai assisté essentiellement à la première partie de cette session, mon compte-rendu ne sera donc pas exhaustif.
[2] Ce site est aujourd’hui fermé, mais son contenu a fait l’objet d’un dépôt à l’APA, ainsi que le journal de Mongolo lui-même.