N° 28 – Préservation numérique : introduction à LOCKSS Réponse

La gestion des ressources électroniques dans les bibliothèques implique la prise en compte de plusieurs préoccupations. L’une d’elles et non des moindres est la conservation et le stockage à long terme de ces ressources, comme nous sommes arrivés à le faire avec les documents imprimés. Même si « bizarrement » nous ne nous suffisons plus des formes de conservation actuelle des imprimés, produisant maintenant en grande quantité, des versions numériques des ces documents. Avons-nous, pour autant, réglé définitivement le problème de la conservation numérique où devrons-nous dans un avenir lointain refaire la même chose qu’aujourd’hui, c’est-à-dire, faire migrer nos documents numériques actuels vers d’autres formats non encore inventés et qui pourraient l’être ? Brève question pour un avenir incertain en l’état et qui me fait revenir à des considérations purement de mon temps, même si celles-ci sont forcément à liées à l’avenir. Voyons pourquoi.

En général, les bibliothèques actuelles possèdent un fonds de ressources électroniques. Celles qui m’intéressent dans ce propos sont celles qui sont publiées en ligne, via les réseaux et dont l’espace de stockage (les serveurs) ne sont pas toujours physiquement et visiblement identifiés et localisés (comme on le ferait pour un bâtiment de bibliothèque ou rayon dans cette même bibliothèque). Que se passe-t-il alors pour une bibliothèque acquérant ce type de ressources ? L’éditeur lui fournit un accès à ladite ressource stockée sur son serveur (de l’éditeur) avec des conditions d’utilisation généralement restrictives (accès réservé aux seuls abonnés, nombre limite de connexions simultanées, connexions circonscrites à un espace géographique bien défini, etc.).Mais le fait le plus marquant est que la bibliothèque ne dispose pas de la ressource elle-même dans son fonds (la ressource est dans le serveur du fournisseur) et est ainsi exposée à beaucoup de risques liés à la pérennité d’accès à ladite ressource (disparition de l’éditeur, panne de serveur, changement d’éditeur d’une revue, etc.. et donc perte de l’information que l’on a déjà payée). L’enjeu est donc de faire des bibliothécaires les dépositaires du contenu des ressources en ligne qu’elles ont acquises pour en faire des possesseurs et ne plus avoir l’impression de les « louer ». C’est fort de ce souhait que la Bibliothèque de l’Université de Stanford a développé depuis 1999 l’application LOCKSS pour permettre aux bibliothèques de collecter, gérer et accéder aux copies locales des ressources en ligne. LOCKSS (Lots of Copies Keep Stuff Safe) qui signifie littéralement : « Beaucoup de copies rendent la marchandise sécurisée » est devenue depuis lors, une initiative communautaire internationale qui a pour but de fournir aux bibliothèques des outils de conservation numérique et l’appui pour qu’elles puissent facilement et à bon marché rassembler et préserver leurs propres copies de contenu numérique.

C’est une technologie qui repose sur une infrastructure open-source, peer-to-peer (P2P) et décentralisée, dont l’efficacité repose donc sur la collaboration des structures participant au programme LOCKSS. Collaboration des bibliothèques entre elles mais aussi avec les éditeurs (nous en verrons l’importance quand il s’agira d’expliquer le fonctionnement du modèle). Depuis 10 ans quelques 344 éditeurs de revues scientifiques, 194 bibliothèques des 5 continents participent au programme et des milliers de titres sont concernés. L’application LOCKSS est conforme aux stipulations du modèle OAIS traité dans le billet N° 09 et permet de préserver tous formats et genres de contenu publiés sur le Web.

Comment tout cela fonctionne-t-il ? Quels sont les prérequis techniques pour le mettre en route ?

Au prochain post pour répondre à ces questions.


Creative Commons License
Ce document est mis en ligne sous Licence Creative Commons.

Publicités

N° 09 – Modèle OAIS (archivage numérique) Réponse

Notre deuxième cargaison, au port des modèles conceptuels, concerne l’archivage des documents numériques, avec une vue d’ensemble (résumée) du modèle OAIS.  Pour mieux appréhender l’environnement qui entoure ce modèle, il me paraît judicieux de faire un bref rappel des enjeux liés à la préservation des objets numériques.

Nous sommes en présence d’une production exponentielle de documents numériques et cela n’est pas près de s’arrêter bien au contraire. Cette donnée implique un questionnement sur le devenir de toute cette masse documentaire produite, accessible et consultable par le seul biais de la technologie qui est elle-même évolutive. Donc tous les supports, les outils, les protocoles sont susceptibles « d’évoluer », voire de disparaître entraînant de facto, une possible inexploitabilité de tout ce qui a été produit (ou est produit maintenant). Il va sans dire que pareil scenario est inacceptable, voire inimaginable et  des outils ont été pensés et élaborés pour éviter un tel « cataclysme ».

Dans l’espace dédié à la préservation des documents numériques, l’OAIS a été élaboré comme modèle de référence pour un triple but : conserver le document numérique, le rendre accessible à une communauté d’utilisateurs ciblés et surtout en préserver l’intelligibilité (c’est-à-dire le rendre exploitable avec des outils »ouverts » et/ou documentés et non avec des outils propriétaires). Il est devenu Norme ISO 14721 et un résumé est disponible ici.

Concrètement l’OAIS n’est pas recueils de spécifications techniques destinées à être directement implementées, mais un modèle abstrait qui : définit des concepts et une terminologie, décrit les parties prenantes de l’organisation d’un tel système (acteurs, fonctions) et surtout indique un canevas par lequel on peut se poser toutes les questions pertinentes pour mettre en place un système d’archivage électronique. Je passerai sur les détails qui caractérisent le modèle et vous renvoie aux divers liens de ce billet (vive l’hypertexte). Je vais seulement exposer quelques fondamentaux.

  • Dans l’OAIS l’information se présente sous forme de paquets, qui ont des spécificités propres. On en dénombre trois types qui sont liées respectivement, à l’activité menée par les différents acteurs du modèle (production, management, utilisation).
  • L’OAIS définit ausi une organisation fonctionnelle du système d’archivage selon 6 entités qui s’articulent entre-elles. Chacun de ces domaines fonctionnels (Entités) détient des rôles qu’il remplit en communiquant et interagissant avec les autres domaines sous forme de flux de données. 
  • Enfin le modèle ne serait pas complet s’il n’indiquait pas des méthodes pouvant être mises en oeuvre pour garantir la pérennisation de l’information. Il en propose une qui est la Migration (en informatique le terme désigne, le passage d’un état existant d’un système d’information ou d’une application vers une cible définie dans un projet ou un programme, source Wikipedia) et en distingue 4 types : le rafraîchissement, la duplication, le ré-empaquetage et la transformation. Pour plus de détails  sur ces trois points, voir ce lien.

Ce modèle de référence s’est imposé au niveau international et son utilisation au niveau de nos structures documentaires ou sur des projets nationaux envisagés, peut-être le gage de réussite de tout projet d’archivage électronique. Cela nous permettra de « prévenir » et non pas essayer de « guérir » quand il sera peut-être trop tard. (Je ne peux m’empêcher de vous indiquer ce lien, qui montre l’urgence de définir des environnements normatifs de travail afin que chacun sache quelles sont ses prérogatives, ses limites d’action et de compétences. Je n’ai rien contre les gens qui gèrent ce projet, mais je crois qu’il y a des gens plus indiqués pour y intervenir et le prendre en charge, d’autant plus qu’il concerne une Université soucieuse de préserver sa renommée et donc devant être attentive à la professionnalisation des activités qui y ont cours.) 

Avec ce modèle apparaît aussi, et toujours, cette évidence tantôt évoquée dans un de mes billets précédents et qui est la nécessaire intégration des métiers de l’information documentaire et l’informatique. Car dans le cas de figure qu’est l’OAIS, bibliothécaires, archivistes et informaticiens sont embarqués dans le même bateau. L’archivage numérique est aujourd’hui, un carrefour (parmi d’autres) où nos routes se croisent naturellement, nos spécificités s’obligeant à une « fusion » inéluctable. Les bibliothèques numériques ne constituent-elles pas en même temps des dépôts de fichiers informatiques (donc des archives électroniques) ? Si oui, alors ces fonds électroniques peuvent être traitées en utilisant un même modèle (OAIS) dès lors qu’on décide mettre en place un système de préservation pérenne et quelque soit le type d’institution concernée (Bibliothèques ou Centre d’archives).

Pour rappel, le modèle OAIS est le résultat d’un travail du CCSDS (Consultative Committe for Space Data Systems – Organisme international de normalisation des agences spatiales) auquel ont été associés des représentants de bibliothèques et d’archives institutionnelles. Tout un symbole !

Prochaine escale dans l’univers XML