N° 07 – Métadonnées (2) Réponse

Je vous propose pour ce post-ci un résumé sous forme de slides, de mes propos de l’article précédent. J’espère que cette forme de présentation permettra de mieux appréhender l’environnement complexe des métadonnées. Tour à tour j’y propose un compendium des trois types de métadonnées (description, structure et administration), précédé d’un essai de définition du document numérique et de ses formes de présentation. Ce slideshow s’inspire du cours « Métadonnées de préservation » dispensé par Mme Emmanuelle Bermès de la BNF et que j’ai suivi au cours du stage international «Ressources électroniques en bibliothèques» de 2006.

Voir ici

En conclusion, je voudrai rappeler ces quelques considérations concernant les métadonnées et leur gestion dans les structures documentaires. Ainsi elles (métadonnées) impliquent pour nous, acteurs de ces structures :

une évolution des besoins

plus seulement des métadonnées descriptives,

gestion de documents structurés ou à structurer (XML, une petite découverte de la syntaxe de ce langage de balisage me paraît utile, voir pour cela un dossier sur le web assez complet)

 

une évolution des compétences métier

augmentation des compétences techniques

gestion des compétences documentaires dans un environnement nouveau

 

un défi

continuer à remplir les missions de conservation et de communication dans un environnement nouveau

collaborer avec d’autres acteurs que les bibliothèques : Musées, Administration (pour ce dernier cas précis et pour montrer concrètement ce que nous pouvons apporter à la bonne gouvernance et à la modernisation de l’Etat, pensons à proposer l’utilisation des métadonnées pour décrire les ressources web du gouvernement du Sénégal. Une piste de réflexion de plus et à la fin une « utopie » réalisable, l’exemple du gouvernement du Canada le prouve, je vous propose ici les avantages et la pertinence identifiés quant à la mise en place d’une telle chose).

Semaine prochaine : Modèle FRBR : Functional Requirements for Bibliographic Records

N° 06 – Métadonnées (1) Réponse

Que sont les métadonnées ?

La documentation sur la question foisonne sur le web et l’article dans Wikipédia est très complet, je vous y renvoie volontiers. La définition communément admise fait d’une métadonnée, tout simplement, « une donnée sur une autre donnée » et quelque soit le type de support d’information. Même si le terme est apparu dans le cadre de la description de ressources sur Internet dans les années 1990, la définition suggère que les catalogueurs, par exemple, ont toujours créé des métadonnées comme Callimaque de Cyrène (bibliothécaire d’Alexandrie) qui rédigea le premier catalogue raisonné de la littérature grecque les Pinakes au IIIe siècle avant Jésus-Christ. Elles sont organisées et/ou présentées sous forme de schémas publiés par des organismes de standardisation avec des comités de gestion chargés de leur maintenance. On en distingue généralement trois types : les métadonnées de description, conçues en vue de la recherche, du repérage et de l’identification des ressources (titre, auteur, résumé, mots clefs, date de parution…) ; les métadonnées de structure, qui facilitent la navigation et la présentation des ressources électroniques, elles fournissent des informations sur la structure interne des ressources (table des matières, index, chapitre, section, page) ; les métadonnées d’administration qui facilitent la gestion, la validation, l’archivage des ressources, elles incluent des données techniques notamment, la gestion des droits, le contrôle d’accès et les conditions d’utilisation. Ces trois types sont complémentaires et souvent les frontières entre elles ne sont pas visibles dans la pratique. En d’autres termes pour ceux qui se posent la question sur leur utilité, elles permettent de localiser et d’accéder à un document surtout en ligne (les documents imprimés l’étant par le biais des données catalographiques informatisées ou non). En effet les documents en ligne ont été caractérisés, à leur apparition, par une difficulté d’accès à leur contenu par le biais des formats de description classiques (ISBD par exemple), il a fallu attendre l’avènement du Marc et de sa zone 856 pour y accéder via la saisie de l’URL. Face à l’explosion de ces ressources en ligne et l’apparition des moteurs de recherche et autres outils (moissonneurs d’entrepôts d’archives ouvertes, exemple : OAIHarvester2), il fallait structurer ces éléments de description et de localisation pour rendre ces moteurs de recherche (certains, pas tous) plus performants dans la recherche et la récupération desdites ressources. Le souci était aussi de permettre l’interopérabilité c’est-à-dire la capacité d’échanger des données entre systèmes multiples disposant de différentes caractéristiques en terme de matériels, logiciels, structures de données et interfaces, et avec le minimum de perte d’information et fonctionnalités. Les métadonnées participent ainsi à cela en complémentarité avec d’autres processus. Au niveau technique cette interopérabilité se réalise à trois niveaux complémentaires : une description des ressources avec des sémantiques communes issues de différents jeux de métadonnées standardisés (Dublin Core, Marc-XML, BiblioML, EAD pour les archives,…), un cadre d’implémentation de ces descriptions dans des langages structurés standardisés, interprétables par les machines (HTML, XHTML, XML, RDF…) et des protocoles informatiques d’échange de ces données normalisées (HTTP, OAI-PMH, SRU/SRW,…).Dans l’univers des métadonnées descriptives, le jeu de métadonnées plus populaire est sans nul doute le Dublin core passé de standard à norme ISO avec un statut officiel au sein du W3C (Consortium du World Wide Web, instance internationale permanente chargée de l’avenir du Web). Je vous invite à consulter en ligne sur Slideshare, la présentation que j’avais faite sur la question lors d’un atelier du COBESS (vous pouvez récupérer le fichier .ppt).

A huitaine !

N° 05 – Open source : suite et fin Réponse

La semaine dernière je vous ai présenté quelques ressources libres et donné quelques indications sur comment aborder la prise en compte éventuelle de ces ressources. Mon propos d’aujourd’hui se veut être complémentaire, par la présentation d’autres logiciels susceptibles de nous intéresser. Pour les SIGB, deux applications retiennent mon attention, il s’agit de Evergreen et de PMB.

  • Evergreen : il est adopté par un nombre assez important de bibliothèques et dispose d’un staff de développeurs compétents. Il dispose d’un wiki qui lui est dédié où peuvent ête retrouvées beaucoup d’informations relatives à son fonctionnement et développement. Une version démonstration en ligne du catalogue est disponible ici. Il est avec Koha (dont la version 3.0 en anglais est disponible) l’un des logiciels préconisé par eIFL-FOSS.
  • PMB : sans doute le plus connu des deux parce qu’étant déjà utilisé par des bibliothèques sénégalaises. Ce qui est intéressant avec ce logiciel, c’est la prise en charge d’applications Web 2.0 dans sa version 3. En effet ce SIGB qui en est à la version 3.1 (novembre 2007) propose un OPAC social depuis la version 3.0 (possibilité de laisser des avis, tags, des mots-clefs sur les notices et pouvant être gérés par le bibliothécaire dans le module catalogue). En outre un Plugin proposant une interface entre SPIP (CMS libre) et PMB est disponible voir les détails ici. Le conseil que je donne est de faire appel à votre « informaticien-maison » pour vous aider à mieux comprendre les mécanismes de mise en oeuvre de ces fonctionnalités (migration vers une nouvelle version, adoption de plugin, etc.) pour en tirer le meilleur profit au besoin.

Cette association entre PMB et SPIP montre l’importance des outils que sont les CMS, notamment dans la création de sites web dynamiques et l’utilisation que nous pouvons en faire dans un environnement d’information documentaire. Ces CMS peuvent nous aider à améliorer nos sites, mais surtout nous faire prendre conscience que l’ère des sites web statiques et révolue et qu’en fin de compte savoir créer un site web ne se limite plus à uniquement maîtriser Frontpage ou Dreamweaver, mais aussi à pouvoir adjoindre à tout outil de création de site, des CMS pour « contôler » et « entretenir » celui-ci (le site web). Voici donc quelques uns de ces outils libres, liste loin d’être exhaustive.

  • SPIP : projet né en 2001 et traduit en une vingtaine de langues. On dénombre plus de 6000 sites web sous SPIP, une grande communauté d’utilisateurs qui implique une base de connaissances pouvant profiter à tout utilisateur ou futur utilisateur.
  • Joomla : CMS orienté Web 2.0 (inclusion des fonctionnalités suivantes : des flux RSS, des news, une version imprimable des pages, des blogs, des sondages, des recherches) dont la présentation donne des informations très complètes.
  • Drupal : CMS qui permet de créer une grande variété de sites Internet (blogs, sites Internet institutionnels, sites communautaires, sites d’informations, boutiques en ligne). Voir le site Drupalsites pour avoir un aperçu des différentes possibiltés offertes et surtout rejoindre la communauté d’utilisateurs du monde entier.

L’utilisation de tels outils peut être pertinente pour nous et porteuse de valeur ajoutée si elle se couple d’une connaissance de base (même théorique) des technologies informatiques sur lesquelles ils reposent (PHP, MySQL, Apache server, etc.). Des ressources pour se former sont disponibles en ligne, comme le site du CRDP de Bourgogne. Je vous conseille plus particulièrement ce lien pour installer un serveur Web étape par étape.

Pour finir mon propos, il faut savoir que tout ce qui est gratuit n’est pas Libre et tout ce qui est Libre n’est pas gratuit, cette confusion découle de la compréhension du terme « free » qui est utilisé en anglais pour les deux notions. D’où, actuellement, l’apellation consacrée et généralement admise de FOSS (free and open source software) pour désigner les logiciels libres et gratuits. Voir pour plus de précisions ce dernier lien

Semaine prochaine intrusion dans la baie des métadonnées

N° 04 – De l’Open Source pour espaces documentaires 1

Nous commençons cette année par une escale au port de l’Open Source, plus particulièrement du FOSS (Free and Open Source Software), véritable mine gratuite et libre de logiciels. L’espace documentaire en est pourvu en quantité et le défi est de pouvoir y trouver la qualité mais aussi d’adopter des méthodes de travail rationnelles pour une prise en main optimum de ces ressources (j’y reviendrai plus loin). J’aurai voulu que ce post soit une vaste recueil de   « Know-how » ou « Savoir-faire », c’est-à-dire comment gérer les différentes ressources qui seront exposées ici. Vous conviendrez avec moi que c’est une entreprise difficile à réaliser dans cet article qui doit répondre aux desiderata du format d’édition qu’est un blog. Je vous propose donc une liste de quelques ressources libres dédiées à l’environnement documentaire et exclusivement consacrée, pour cette semaine, aux systèmes intégrés de gestion de bibliothèque (SIGB ou ILS en anglais) ou d’archives.  

  • GNUTECA : logiciel de bibliothèque proposant une interface web et graphique GTK.
  • Koha Open Source Library System : je vous propose une présentation en ligne faite par un chef de projet Koha.
  • Archimede : Logiciel de dépôt institutionnel, qui permet de stocker et de gérer les archives électroniques. Il permet aussi de verser plusieurs documents à la fois, avec les formulaires pour entrer les métadonnées.
  • Museolog : logiciel de catalogage d’information muséologique

Les ressources citées ici ne sont pas les plus importantes, ni même les plus populaires, le débat que je veux soulever concerne le choix et la gestion de ces outils libres. Adopter de tels logiciels peut être pertinent pour nos structures sous-développées mais il faut savoir que ce n’est pas la panacée et qu’il faut beaucoup de choses pour accompagner un tel choix. Par exemple :

         prévoir un plan de formation initiale pour les utilisateurs en vue de prendre en compte les fonctionnalités du logiciel

         prévoir un plan de formation continue pour les versions futures qui ne sont pas aussi automatiques que dans le monde des logiciels payants. D’où la nécessité de faire une veille logicielle pour s’encquérir des nouveaux développements

         prévoir un service de maintenance physique et logique. En d’autres termes un Help desk qualifié pour résoudre les problèmes de fonctionnement et de développement. Cette dernière exigence montre la nécessité de la formation solide en informatique des bibliothécaires, archivistes et documentalistes. L’heure est venue de disposer de vrais informaticiens-bibliothécaires ou de documentalistes-informaticiens pour prendre en charge les enjeux et challenges des TIC dans nos structures et ne plus dépendre de « l’extérieur ». 

Semaine prochaine : Open Source suite et fin