N° 08 – Modèles conceptuels : FRBR Réponse

Aujourd’hui nous accostons au quai des modèles conceptuels créés pour la gestion de l’information. Brièvement présentés les modèles conceptuels sont : des outils de dialogue et d’intercompréhension entre des personnes d’horizons différents (par exemple : spécialistes d’un domaine et informaticiens) ; des outils de dialogue entre réservoirs de données hétérogènes ; des outils d’aide à la conception des systèmes ; des outils de comparaison, d’échange et de stockage de données ; des outils d’intégration au Web sémantique. Ils se situent au-dessus des schémas de métadonnées (voir posts précédents), donnant une vue d’ensemble abstraite de l’information fournie et fixent un idéal à atteindre quant à la gestion de cette information.

Mon propos, pour ce post, consiste en une introduction sur le modèle FRBR (Fundamental Requirements for Bibliographic Records ou en français, spécifications fonctionnelles des notices bibliographiques). C’est un modèle conceptuel développé par l’IFLA entre 1992 et 1998, sur la base de 9 résolutions adoptées en 1990 suite au séminaire de Stockholm sur les notices bibliographiques. Ce cadre conceptuel a pour but d’atteindre une compréhension commune et partagée des finalités des notices bibliographiques. Plus précisément il s’agit, de définir un niveau de catalogage minimal mais efficace pour les agences bibliographiques nationales et de mettre en adéquation les données bibliographiques avec les besoins des utilisateurs.

Ainsi les champs de l’étude sont : 1) les données (ensemble des données constutitives des notices bibliographiques, c’est-à-dire les données associées aux différents champs décrits dans les catalogues de bibliothèque et les bibliographies nationales); 2) les utilisateurs (tous les utilisateurs potentiels des notices : usagers des bibliothèques, personnels des bibliothèques, éditeurs, distributeurs, gestionnaires de droits d’auteur, etc.) ; 3) les besoins de ces utilisateurs (besoins relatifs aux buts recherchés dans le processus de consultation des catalogues : trouver des références en fonction de critères de recherche, identifier une ressource, la sélectionner en fonction de ses modalités d’utilisation et enfin y accéder).

La méthode repose sur une analyse des données bibliographiques selon le modèle Entité-Relation qui définit : un regroupement d’éléments de données en "entités" qui sont organisés en 3 groupes dans le FRBR, une identification des "relations" existant entres ces différentes entités et une identification d’"attributs" susceptibles de les affecter. Pour le détail concernant les entités je vous renvoie à cet article.

Les avantages pour les bibliothécaires se résument à : un catalogage facilité, une oeuvre est cataloguée une fois pour toutes pour toutes ses formes d’expression (traductions notamment), ces expressions elles-mêmes cataloguées une seule fois pour toutes les manifestations liées (éditeur, lieu d’édition, date, etc.), d’où enfin une organisation logique du catalogue. Pour l’utilisateur, la recherche est facilitée, car une seule recherche permet de trouver tous les types de matériel d’une oeuvre sans doublons, toutes les expressions sont affichées en une seule opération et sa navigation dans le catalogue est plus naturelle.

Pour l’intégration du modèle dans sa bibliothèque, il faut choisir un fournisseur de logiciel intégrant le modèle (voir VTLS inc). Désolé je n’ai pas trouvé de SIGB libre intégrant cet outil, néanmoins une consultation du lien précédent vous permettra d’en savoir plus sur le mécanisme de fonctionnement du modèle avec le tutoriel en ligne qui y est proposé.

Les FRBR restent cependant un modèle théorique dont l’application n’est pas aisée. La masse des données structurées en ISBD ou MARC est énorme et l’élaboration de programmes de conversion vers le FRBR est problématique (notamment du fait aussi de la "babelisation" du MARC). Aussi comment ne pas prendre en compte l’ingérence du Web 2.0 dans l’espace bibliothéconomique qui propose toute une nouvelle démarche qui va plus loin dans la prise en compte des besoins des utilisateurs (Opac social, folksonomie, métamoteur à affichage cartographique comme Kartoo …). Toutes ces remarques (parmi tant d’autres) ne constituent-ils pas des facteurs de blocage qui font que le modèle soit toujours confiné à des projets limités aujourd’hui ? 

Pour de plus amples informations sur le sujet voir les liens ci-après, la brochure de Barabara Tillett, le rapport final du groupe de travail de l’IFLA.

Prochaine cargaison : Modèle OAIS

N° 07 – Métadonnées (2) Réponse

Je vous propose pour ce post-ci un résumé sous forme de slides, de mes propos de l’article précédent. J’espère que cette forme de présentation permettra de mieux appréhender l’environnement complexe des métadonnées. Tour à tour j’y propose un compendium des trois types de métadonnées (description, structure et administration), précédé d’un essai de définition du document numérique et de ses formes de présentation. Ce slideshow s’inspire du cours « Métadonnées de préservation » dispensé par Mme Emmanuelle Bermès de la BNF et que j’ai suivi au cours du stage international «Ressources électroniques en bibliothèques» de 2006.

Voir ici

En conclusion, je voudrai rappeler ces quelques considérations concernant les métadonnées et leur gestion dans les structures documentaires. Ainsi elles (métadonnées) impliquent pour nous, acteurs de ces structures :

une évolution des besoins

plus seulement des métadonnées descriptives,

gestion de documents structurés ou à structurer (XML, une petite découverte de la syntaxe de ce langage de balisage me paraît utile, voir pour cela un dossier sur le web assez complet)

 

une évolution des compétences métier

augmentation des compétences techniques

gestion des compétences documentaires dans un environnement nouveau

 

un défi

continuer à remplir les missions de conservation et de communication dans un environnement nouveau

collaborer avec d’autres acteurs que les bibliothèques : Musées, Administration (pour ce dernier cas précis et pour montrer concrètement ce que nous pouvons apporter à la bonne gouvernance et à la modernisation de l’Etat, pensons à proposer l’utilisation des métadonnées pour décrire les ressources web du gouvernement du Sénégal. Une piste de réflexion de plus et à la fin une « utopie » réalisable, l’exemple du gouvernement du Canada le prouve, je vous propose ici les avantages et la pertinence identifiés quant à la mise en place d’une telle chose).

Semaine prochaine : Modèle FRBR : Functional Requirements for Bibliographic Records

N° 06 – Métadonnées (1) Réponse

Que sont les métadonnées ?

La documentation sur la question foisonne sur le web et l’article dans Wikipédia est très complet, je vous y renvoie volontiers. La définition communément admise fait d’une métadonnée, tout simplement, "une donnée sur une autre donnée" et quelque soit le type de support d’information. Même si le terme est apparu dans le cadre de la description de ressources sur Internet dans les années 1990, la définition suggère que les catalogueurs, par exemple, ont toujours créé des métadonnées comme Callimaque de Cyrène (bibliothécaire d’Alexandrie) qui rédigea le premier catalogue raisonné de la littérature grecque les Pinakes au IIIe siècle avant Jésus-Christ. Elles sont organisées et/ou présentées sous forme de schémas publiés par des organismes de standardisation avec des comités de gestion chargés de leur maintenance. On en distingue généralement trois types : les métadonnées de description, conçues en vue de la recherche, du repérage et de l’identification des ressources (titre, auteur, résumé, mots clefs, date de parution…) ; les métadonnées de structure, qui facilitent la navigation et la présentation des ressources électroniques, elles fournissent des informations sur la structure interne des ressources (table des matières, index, chapitre, section, page) ; les métadonnées d’administration qui facilitent la gestion, la validation, l’archivage des ressources, elles incluent des données techniques notamment, la gestion des droits, le contrôle d’accès et les conditions d’utilisation. Ces trois types sont complémentaires et souvent les frontières entre elles ne sont pas visibles dans la pratique. En d’autres termes pour ceux qui se posent la question sur leur utilité, elles permettent de localiser et d’accéder à un document surtout en ligne (les documents imprimés l’étant par le biais des données catalographiques informatisées ou non). En effet les documents en ligne ont été caractérisés, à leur apparition, par une difficulté d’accès à leur contenu par le biais des formats de description classiques (ISBD par exemple), il a fallu attendre l’avènement du Marc et de sa zone 856 pour y accéder via la saisie de l’URL. Face à l’explosion de ces ressources en ligne et l’apparition des moteurs de recherche et autres outils (moissonneurs d’entrepôts d’archives ouvertes, exemple : OAIHarvester2), il fallait structurer ces éléments de description et de localisation pour rendre ces moteurs de recherche (certains, pas tous) plus performants dans la recherche et la récupération desdites ressources. Le souci était aussi de permettre l’interopérabilité c’est-à-dire la capacité d’échanger des données entre systèmes multiples disposant de différentes caractéristiques en terme de matériels, logiciels, structures de données et interfaces, et avec le minimum de perte d’information et fonctionnalités. Les métadonnées participent ainsi à cela en complémentarité avec d’autres processus. Au niveau technique cette interopérabilité se réalise à trois niveaux complémentaires : une description des ressources avec des sémantiques communes issues de différents jeux de métadonnées standardisés (Dublin Core, Marc-XML, BiblioML, EAD pour les archives,…), un cadre d’implémentation de ces descriptions dans des langages structurés standardisés, interprétables par les machines (HTML, XHTML, XML, RDF…) et des protocoles informatiques d’échange de ces données normalisées (HTTP, OAI-PMH, SRU/SRW,…).Dans l’univers des métadonnées descriptives, le jeu de métadonnées plus populaire est sans nul doute le Dublin core passé de standard à norme ISO avec un statut officiel au sein du W3C (Consortium du World Wide Web, instance internationale permanente chargée de l’avenir du Web). Je vous invite à consulter en ligne sur Slideshare, la présentation que j’avais faite sur la question lors d’un atelier du COBESS (vous pouvez récupérer le fichier .ppt).

A huitaine !

N° 05 – Open source : suite et fin Réponse

La semaine dernière je vous ai présenté quelques ressources libres et donné quelques indications sur comment aborder la prise en compte éventuelle de ces ressources. Mon propos d’aujourd’hui se veut être complémentaire, par la présentation d’autres logiciels susceptibles de nous intéresser. Pour les SIGB, deux applications retiennent mon attention, il s’agit de Evergreen et de PMB.

  • Evergreen : il est adopté par un nombre assez important de bibliothèques et dispose d’un staff de développeurs compétents. Il dispose d’un wiki qui lui est dédié où peuvent ête retrouvées beaucoup d’informations relatives à son fonctionnement et développement. Une version démonstration en ligne du catalogue est disponible ici. Il est avec Koha (dont la version 3.0 en anglais est disponible) l’un des logiciels préconisé par eIFL-FOSS.
  • PMB : sans doute le plus connu des deux parce qu’étant déjà utilisé par des bibliothèques sénégalaises. Ce qui est intéressant avec ce logiciel, c’est la prise en charge d’applications Web 2.0 dans sa version 3. En effet ce SIGB qui en est à la version 3.1 (novembre 2007) propose un OPAC social depuis la version 3.0 (possibilité de laisser des avis, tags, des mots-clefs sur les notices et pouvant être gérés par le bibliothécaire dans le module catalogue). En outre un Plugin proposant une interface entre SPIP (CMS libre) et PMB est disponible voir les détails ici. Le conseil que je donne est de faire appel à votre "informaticien-maison" pour vous aider à mieux comprendre les mécanismes de mise en oeuvre de ces fonctionnalités (migration vers une nouvelle version, adoption de plugin, etc.) pour en tirer le meilleur profit au besoin.

Cette association entre PMB et SPIP montre l’importance des outils que sont les CMS, notamment dans la création de sites web dynamiques et l’utilisation que nous pouvons en faire dans un environnement d’information documentaire. Ces CMS peuvent nous aider à améliorer nos sites, mais surtout nous faire prendre conscience que l’ère des sites web statiques et révolue et qu’en fin de compte savoir créer un site web ne se limite plus à uniquement maîtriser Frontpage ou Dreamweaver, mais aussi à pouvoir adjoindre à tout outil de création de site, des CMS pour "contôler" et "entretenir" celui-ci (le site web). Voici donc quelques uns de ces outils libres, liste loin d’être exhaustive.

  • SPIP : projet né en 2001 et traduit en une vingtaine de langues. On dénombre plus de 6000 sites web sous SPIP, une grande communauté d’utilisateurs qui implique une base de connaissances pouvant profiter à tout utilisateur ou futur utilisateur.
  • Joomla : CMS orienté Web 2.0 (inclusion des fonctionnalités suivantes : des flux RSS, des news, une version imprimable des pages, des blogs, des sondages, des recherches) dont la présentation donne des informations très complètes.
  • Drupal : CMS qui permet de créer une grande variété de sites Internet (blogs, sites Internet institutionnels, sites communautaires, sites d’informations, boutiques en ligne). Voir le site Drupalsites pour avoir un aperçu des différentes possibiltés offertes et surtout rejoindre la communauté d’utilisateurs du monde entier.

L’utilisation de tels outils peut être pertinente pour nous et porteuse de valeur ajoutée si elle se couple d’une connaissance de base (même théorique) des technologies informatiques sur lesquelles ils reposent (PHP, MySQL, Apache server, etc.). Des ressources pour se former sont disponibles en ligne, comme le site du CRDP de Bourgogne. Je vous conseille plus particulièrement ce lien pour installer un serveur Web étape par étape.

Pour finir mon propos, il faut savoir que tout ce qui est gratuit n’est pas Libre et tout ce qui est Libre n’est pas gratuit, cette confusion découle de la compréhension du terme "free" qui est utilisé en anglais pour les deux notions. D’où, actuellement, l’apellation consacrée et généralement admise de FOSS (free and open source software) pour désigner les logiciels libres et gratuits. Voir pour plus de précisions ce dernier lien

Semaine prochaine intrusion dans la baie des métadonnées

N° 04 – De l’Open Source pour espaces documentaires 1

Nous commençons cette année par une escale au port de l’Open Source, plus particulièrement du FOSS (Free and Open Source Software), véritable mine gratuite et libre de logiciels. L’espace documentaire en est pourvu en quantité et le défi est de pouvoir y trouver la qualité mais aussi d’adopter des méthodes de travail rationnelles pour une prise en main optimum de ces ressources (j’y reviendrai plus loin). J’aurai voulu que ce post soit une vaste recueil de   « Know-how » ou « Savoir-faire », c’est-à-dire comment gérer les différentes ressources qui seront exposées ici. Vous conviendrez avec moi que c’est une entreprise difficile à réaliser dans cet article qui doit répondre aux desiderata du format d’édition qu’est un blog. Je vous propose donc une liste de quelques ressources libres dédiées à l’environnement documentaire et exclusivement consacrée, pour cette semaine, aux systèmes intégrés de gestion de bibliothèque (SIGB ou ILS en anglais) ou d’archives.  

  • GNUTECA : logiciel de bibliothèque proposant une interface web et graphique GTK.
  • Koha Open Source Library System : je vous propose une présentation en ligne faite par un chef de projet Koha.
  • Archimede : Logiciel de dépôt institutionnel, qui permet de stocker et de gérer les archives électroniques. Il permet aussi de verser plusieurs documents à la fois, avec les formulaires pour entrer les métadonnées.
  • Museolog : logiciel de catalogage d’information muséologique

Les ressources citées ici ne sont pas les plus importantes, ni même les plus populaires, le débat que je veux soulever concerne le choix et la gestion de ces outils libres. Adopter de tels logiciels peut être pertinent pour nos structures sous-développées mais il faut savoir que ce n’est pas la panacée et qu’il faut beaucoup de choses pour accompagner un tel choix. Par exemple :

-         prévoir un plan de formation initiale pour les utilisateurs en vue de prendre en compte les fonctionnalités du logiciel

-         prévoir un plan de formation continue pour les versions futures qui ne sont pas aussi automatiques que dans le monde des logiciels payants. D’où la nécessité de faire une veille logicielle pour s’encquérir des nouveaux développements

-         prévoir un service de maintenance physique et logique. En d’autres termes un Help desk qualifié pour résoudre les problèmes de fonctionnement et de développement. Cette dernière exigence montre la nécessité de la formation solide en informatique des bibliothécaires, archivistes et documentalistes. L’heure est venue de disposer de vrais informaticiens-bibliothécaires ou de documentalistes-informaticiens pour prendre en charge les enjeux et challenges des TIC dans nos structures et ne plus dépendre de « l’extérieur ». 

Semaine prochaine : Open Source suite et fin

N° 03 – De la bibliothèque 2.0 : exemples et pratiques Réponse

Mon propos d’aujourd’hui se veut plus orienté sur la pratique que les post précédents. En d’autres termes j’essaierai de vous proposer une liste, non exhaustive, de bibliothèques se servant de dynamiques 2.0, ou de sites orientés bibliothèque 2.0. 

Les exemples les plus nombreux et les plus accomplis se retrouvent dans l’univers anglo-saxon, c’est pourquoi ils seront les plus fréquents dans cet article. Eh oui ! Je crois que les francophones doivent se réveiller.

  • Westmont public library : Utilise Flickr pour montrer ses nouvelles acquisitions. Voir des exemples avec liens suivants : Jeux videos, Livres, etc.
  • Hennepin county library  : OPAC 2.0 (ou OPAC social, autre appellation), où on peut commenter un ouvrage et discuter avec d’autres utilisateurs.
  • Library thing : Permet a tout un chacun de cataloguer ses livres personnels en ligne, de partager ses collections avec les autres utilisateurs, et de faire des recommandations à la communauté d’utilisateurs (21 millions de livres catalogués à ce jour). Utilisation possible par une bibliothèque institutionnelle qui pourrait ainsi vulgariser ses collections sans même passer par son propre site web. Les notices sont importées automatiquement d’Amazon.com et de plus de 175 bibliothèques du monde entier y compris la Library of congress. On y retrouve :

  * Une indexation « standard » : notice au format MARC, indexation DEWEY, LC « subjects headings », visible via le lien « DETAILS » .

* Une indexation sociale : des tags associés, des fiches de lecture et revues de la communauté des utilisateurs, un système de suggestion de documents à lire, etc.

  • Lamson library : OPAC 2.0 de la bibliothèque de Plymouth State University, utilise la technologie des blogs pour permettre aux utilisateurs de ‘décrire’ avec leurs propres mots les documents de la bibliothèque, et ajouter des commentaires sur le livre ou la notice. Exemple de notice :
    http://www.plymouth.edu/library/read/212932
     
     
     
     
  • MIT Libraries’ The Virtual Browsery (Beta) : OPAC a base de blog aussi comme le précédent.

  • Bibliopedia (site wiki collaboratif en français pour professionnels de l’information documentaire)
  • Babelio : même principe que dans Library thing. Créer une bibliothèque de livres et la partager sur le web. Pour une bibliothèque institutionnelle il est possible, par exemple, d’y partager ses nouvelles acquisitions et recueillir des commentaires de lecteurs et des tags (étiquettes ou mots-clefs) de ces mêmes lecteurs. (Site en français)
  • Bibliothèque & Catalogue : site qui donne accès aux documents et à leur contenu par un nuage de tags.
  • : propose un OPAC social où on peut commenter les livres

 Toute cette nouvelle tendance 2.0 pose aussi une problématique nouvelle pour nous et qui est la « bibliothéconomie-documentation de masse », dans laquelle on retrouve nécessairement des questions liées :

1- à « l’indexabilité » de la masse documentaire actuelle (présente sur le web notamment : peut-on et doit-on tout indexer ?).

2- aux « nouvelles » bornes de l’indexation, concernant sa régulation et son contrôle (qui a autorité pour indexer ?), son expertise (qui a compétence et maîtrise pour indexer ?) et son but final et son usage (qui a besoin d’indexer ?).

« Redoutons » que d’autres trouvent les réponses à notre place. 

Prochaine escale : « De l’Open Source pour espaces documentaires »