N° 70 – ICA-AtoM, logiciel de gestion archivistique 4

Ayant découvert ce logiciel dès ses premières versions il y a 04 ans, je ne m’y suis pas trop intéressé depuis, peut-être parce qu’étant extérieur au corps de métier des archivistes et leurs règles de description spécifiques. Je ne sentais pas trop, en tant que bibliothécaire, la nécessité d’en faire un centre d’intérêt. Ajoutée à cela, une culture informatique très basique qui était un frein à toute initiative d’installation du logiciel (que je trouvais compliquée) et donc de découverte de ses potentialités. Alors qu’est-ce qui a bien pu changer fondamentalement pour que ce billet puisse voir le jour ?

  • Tout d’abord un intérêt professionnel, lorsqu’il m’a fallu trouver un outil capable de gérer un petit fonds d’archives institutionnelles et qui soit typiquement dédié à cela. Il est regrettable de constater la faiblesse de l’offre logicielle archivistique, comparée à celle bibliothéconomique qui foisonne de logiciels aussi bien libres que propriétaires.
  • Ensuite, un désir de partager avec des collègues archivistes ou assimilés, l’existence d’un outil capable d’améliorer le traitement descriptif de leurs fonds d’archives, avec la possibilité de les rendre accessibles en ligne à l’image des OPAC de bibliothèque.

Eh bien, ICA-AtoM, c’est exactement cela et c’est performant en plus.

En effet il permet d’informatiser un fond d’archives en prenant en charge toutes les opérations archivistiques traditionnellement effectuées en mode manuel et cela dans le strict respect des normes définies par le Conseil International des Archives (CIA), qui est partie prenante et partenaire dans son développement en cours. Avec une interface simple d’utilisation, où l’utilisateur final n’éprouve aucune difficulté à prendre l’outil en main, y saisir des données, personnaliser l’application, l’administrer, etc.. Un prérequis est peut-être de maîtriser effectivement, les règles normées  de la description archivistique (Le savoir-faire de base du métier). Cependant rien de vraiment compliqué, même pour un non-archiviste comme moi, étant donné que des infobulles indicatives sont prévues, pour beaucoup de zones et leurs formulaires de saisie respectifs, et renvoient aux normes à utiliser spécifiquement. Ces normes sont généralement accessibles et consultables en ligne (ISDA , ISAAR , ISDF, ISDIAH).

 L’autre bonne chose à souligner est l’intégration possible d’extensions (plugins) relatives aux standards de métadonnées. Cela permet l’interopérabilité d’une application ICA-AtoM avec d’autres applications utilisant des protocoles semblables. Concrètement, cela veut dire qui si un fonds d’archives est informatisé avec ICA-AtoM et que soit activé le plugin du Dublin Core (sfDcPlugin), il devient de ce fait moissonnable par un moissonneur OAI, tout en donnant la possibilité d’importer et exporter des données au format XML. D’autres standards de métadonnées sont également pris en compte comme EAD (format d’encodage des données archivistiques), MODS, mais aussi des standards de métadonnées issues des normes archivistiques du CIA citées supra. Cette possibilité d’interopérabilité offerte par les extensions de métadonnées crée par exemple, une passerelle entre les mondes archivistique et bibliothéconomique, qui peuvent ainsi communiquer en utilisant des protocoles d’échange de données, ce qui est impossible dans un environnement numérique inexistant ou classique.

L’objet de ce billet n’est pas de disserter sur les procédures d’installation et d’utilisation de l’application, je réserve cela à la présentation ci-dessous qui, je l’espère, pourra aider les intéressés à le faire. Néanmoins je voudrais juste dire quelques mots sur l’installation que j’ai faite. C’est une installation en local sous Windows 7 avec  Wampserver pour le serveur Web. A ce niveau je conseille de télécharger la version WampServer2.1e disponible dans Sourceforge. Mon installation initiale sur Wampserver2.2 n’ayant pas marché. La version téléchargée d’ICA-AtoM est la 1.2, la  version 1.3 étant prévue pour septembre prochain. Des ressources supplémentaires (démo en ligne, manuel d’utilisateur, lien de téléchargement,…) peuvent être eues sur le site du logiciel.

Ceci est juste une contribution qui vise à enrichir celles qui concernent l’informatisation des fonds d’archives et avec le souci de toujours inciter les collègues aux moyens limités, à découvrir pour certains, des solutions logicielles libres et les adopter pour mieux améliorer leur offre de services professionnels.

Au fait, vu que ICA-AtoM permet de disposer d’un instrument de recherche public accessible en ligne, quel pourrait être l’appellation consacrée pour faire OPAC à l’instar des bibliothèques, OPAF peut-être, pour Online Public Access Finding Aid ?

Publicités

N° 57 – Découverte d’Invenio, système de gestion de bibliothèque numérique 8

Du 22 au 26 novembre 2010 j’ai participé à Rabat au Maroc, à la deuxième école sur les bibliothèques numériques organisée conjointement par le CERN et l’UNESCO et avec comme maître d’oeuvre le CNRST du Maroc. Lors de cet atelier, j’ai pu découvrir le logiciel de bibliothèque numérique Invenio développé et utilisé au CERN. Nous étions une trentaine de participants provenant de 05 pays africains : Bénin, Cameroun, Maroc, Sénégal et Tunisie.  Le format de ce cours alliait des exposés théoriques sur les concepts de bibliothèque numérique et d’Open Access, sur les langages Web et formats de métadonnées et des travaux pratiques sur Invenio, à savoir : son installation, son paramétrage et son utilisation.
Invenio est une suite logicielle gratuite qui permet de gérer sa propre bibliothèque numérique ou des documents référencés sur le web. La technologie offerte par le logiciel couvre tous les aspects de la gestion d’une bibliothèque numérique, de l’acquisition du document à sa diffusion en passant par à la classification, l’indexation et la conservation. Invenio est compatible  avec les standards tel que  le protocole de collecte de de métadonnées Open Archives Initiative  (OAI-PMH) et utilise MARC 21 comme format de base des données bibliographiques. La flexibilité et la performance de Invenio en font une solution complète pour la gestion de dépôts de documents de taille modérée ou grande (pouvant aller jusqu’à plusieurs millions d’enregistrements).

Invenio a été initialement développé au CERN pour être le serveur de documents de l’institution, avec la gestion de plus de 1.000.000 notices bibliographiques en Physique des hautes énergies depuis 2002, couvrant articles, livres, revues, photos, vidéos, etc.. Invenio est co-développé grâce une collaboration internationale comprenant des instituts comme le CERN, DESY, EPFL, FNAL, SLAC et est utilisé par une trentaine d’institutions scientifiques du monde entier (voir ici).

Il offre plusieurs fonctionnalités comme : la navigation par collections hiérarchisées ; un puissant moteur de recherche interne ; une flexibilité dans l’utilisation des métadonnées ; la personnalisation possible de l’interface utilisateur et plusieurs formats d’export.
Autant de possibilités offertes par beaucoup d’outils actuels, mais ce qui fait encore plus l’originalité d’Invenio est qu’il remplit les fonctions d’un SIGB classique (comme la gestion des emprunts, des statistiques, etc.) en sus de son option principale qu’est la gestion d’une bibliothèque numérique, voire au-delà, car il est fait aussi d’archive ouverte où l’auto-archivage par l’utilisateur est possible. Nous sommes bien en présence d’un SIGBN (Système intégré de gestion de bibliothèque numérique). Plus besoin avec cet outil d’avoir deux ou trois systèmes distincts, c’est-à-dire un SIGB pour les opérations bibliothéconomiques et documentaires classiques (par exemple, PMB ou Koha), un système de gestion de bibliothèque numérique (exemple, Greenstone) et un système de gestion dépôt institutionnel (exemple, DSpace)
Pour plus de détails voir la documentation en anglais en attendant une probable traduction en français.
Voici donc un autre outil qui vient enrichir la grande famille des systèmes de bibliothèque Open Source mais qui n’est cependant déployable que dans un environnement Linux.

Voici une démo pour découvrir l’outil et se familiariser avec son interface et ensuite si l’envie de le télécharger vous tente, alors foncez. 🙂

Pour les supports du cours de Rabat et les autres ressources associées, les obtenir ici.

Share

N° 24 – Un peu de Web sémantique Réponse

Que de chemin parcouru depuis que Tim Berners-Lee créa le Web en 1991. Année qui a aussi vu l’apparition de la première génération des outils dédiés à la recherche de sites Web. Ces sites ont connu une évolution quantitative exponentielle entraînant de fait, une surproduction d’information (infobésité), ce qui implique aujourd’hui, la nécessité d’avoir des mécanismes et outils de recherche qui permettent une recherche efficace (rapidité et pertinence) de l’information ainsi publiée. Cette nécessité a été levier de l’évolution technologique des moteurs de recherche, mais aussi de l’apparition du « nouveau » concept qu’est le Web sémantique, dont je me propose de faire l’exposé dans ce billet.

Qu’en est-il ?

Brièvement expliqué, ce concept a pour objet de faciliter l’accès aux informations disponibles sur le Web. La vision de Tim Berners-Lee est de rendre la sémantique des ressources du Web explicite, de manière que les programmes puissent l’exploiter comme nous autres humains. Cela grâce à l’interopérabilité des métadonnées qui va permettre aux moteurs de trouver et de mettre en relation des données jusqu’alors confinées dans leurs sites (ou leurs bases de données, une grande partie du Web invisible est confinée dans des bases de données). Le but est de permettre aux robots (fureteurs du Web) de « comprendre » le contenu des sites, grâce à l’emploi de langages adéquats (le RDF ou Resource Description Framework pour les métadonnées ; le OWL : Web Ontology Language pour les ontologies).

Pour  illustrer ce qu’est le Web sémantique, prenons un exemple tout simple : on choisit de faire une recherche sur « Abdou Diouf ». Un moteur classique comme Google va afficher des milliers de pages où figure le nom Abdou Diouf, mais un moteur estampillé Web sémantique va orienter la recherche en proposant le nom « Abdou Diouf » selon des qualificatifs (fonction, profession,…plus précisément pour cet exemple : président du Sénégal, secrétaire général de la francophonie, etc.). Donc il faut arriver à ce que les moteurs de recherche puissent « saisir le sens » des ressources du Web qu’ils indexent (expression qui a une autre signification ici et qui est différente d’une quelconque compréhension du langage naturel par les machines). Ceci implique, dans l’ « idéologie » du Web sémantique de rendre cette information disponible à  ces programmes sous forme d’ontologies (voir ci-dessus). Le bénéfice principal que l’on obtient avec pareille chose, est l’abrègement considérable du temps de recherche et qui rime avec réduction importante du bruit (informations superflues non désirées).

La philosophie du Web sémantique est aussi d’exprimer les métadonnées dans un modèle entité-relation (voir les FRBR) et d’identifier toutes les entités à l’aide d’URI (Uniform Resource Identifier, « identifiant uniforme de ressource »). Pour nous bibliothécaires et assimilés, les enjeux que nous devons saisir concernent : l’exposition des données structurées dont nous disposons par l’émiettement de la connaissance en proposant une description bibliographique au niveau le plus élémentaire. Cet enrichissement des données nécessite la reconnaissance d’entités nommées (de façon à ce que les moteurs reconnaissent les noms de personne, les lieux, les manifestations., etc.), leur catégorisation et leur localisation géographique.

Dans le prochain billet je me propose d’approfondir l’argumentation ainsi introduite et qui vise à monter que les bibliothèques sont très bien placées pour réaliser ce travail et doivent être des acteurs sûrs et « incontournables » du Web des données (autre appellation du Web sémantique).

Pour ce qui est des outils, je vous propose trois moteurs estampillés Web sémantique :

  • Hakia : (2006) Le défi d’Hakia est de construire un moteur de recherche sémantique, c’est-à-dire, destiné à rendre les résultats des recherches basés plus particulièrement sur le sens des mots clés. Le principe étant de faire la relation entre les mots, à la manière du cerveau humain. C’est une nouveauté par rapport aux moteurs de recherche classiques qui utilisent la popularité et les occurrences par indexation conventionnelle. 
  • Spock : moteur pour recherche d’individus (fonctionnement depuis août 2007). La fonction de recherche y est accessible à tous les internautes, sans inscription préalable. Il suffit de renseigner le nom d’un individu et éventuellement d’affiner la requête avec son âge, son sexe et son origine géographique. Spock offre aussi la possibilité de rechercher des individus à partir de mots-clés comme «Senegalese musician», qui remonte alors une liste de musiciens sénégalais (je vous laisse deviner ceux qui sont les premiers cités ou bien faites l’expérience). Chaque profil apparaît sous forme de fiche renseignée d’une photo, de tags (mots-clés) censés décrire l’individu, et d’une liste de proches. Si l’accès à la recherche de base est accessible à tous, Spock invite les utilisateurs à s’inscrire afin de profiter de fonctions supplémentaires. Cela leur permet d’affiner leur propre profil mais aussi de participer à l’amélioration du service en ajoutant des tags aux individus pour mieux les qualifier (par exemple, journaliste, musicien…), l’objectif étant d’améliorer la pertinence du moteur.
  • Swoogle : (développé depuis 2004 par Ebiquity group à l’Université du Maryland) moteur de recherche sur les ontologies.

Ce Web sémantique, selon certains spécialistes, est la future évolution du Web (3.0 ?), raison de plus de demeurer éveillé et/ou veilleur pour ne pas rester en rade.

Merci à Pani Zuza Wiorogorska pour ta précieuse collaboration

Prochainement la suite au même port d’escale.

PS : pensée pieuse pour madame Rose Dieng (éteinte ce 30 juin 2008 à Nice), spécialiste d’Intelligence Artificielle à l’INRIA et travaillant ces dernières années sur la gestion des connaissances et le web sémantique. Cette compatriote s’était vue décerner par le Ministère de la Recherche (France) et le groupe EADS le prix Irène Joliot-Curie 2005 distinguant ainsi une femme qui s’est affirmée par son parcours et sa contribution à la science. Je vous propose une de ses interventions concernant le web du futur où elle parle entre autres du Web sémantique.


Creative Commons License

Ce document est mis en ligne sous Licence Creative Commons.

N° 17 – RDA & FRBR 3

Ce billet a pour objet de donner un aperçu de ce que représente le modèle FRBR dans la « philosophie » des RDA. Pour une meilleure compréhension du discours contenu dans ce post, un rappel des différentes caractéristiques du modèle FRBR s’impose, pour cela voir le billet N° 08 qui lui est consacré dans ce blog. Pour rappel ce modèle est un « cadre conceptuel permettant de comprendre clairement, sous une forme précisément exprimée et dans un langage qui soit parlant pour tout le monde, l’essence même de ce sur quoi la notice bibliographique est censée renseigner « . On retrouve ici l’un des objectifs de la norme RDA qui est de proposer des notices dont les données sont en adéquation avec les besoins de l’utilisateur. En d’autres termes les concepteurs des RDA ne pouvaient faire abstraction des possibilités offertes par les FRBR (modèle de référence à suivre pour le futur ?).

Les catalogueurs ont toujours consciemment ou inconsciemment voulu la simplification des règles de catalogage. Ainsi il fallait élaborer un schéma qui donnerait la possibilité de traiter toutes les ressources actuelles, mais aussi les nouvelles qui apparaitront (retour vers le futur ?) et d’appréhender la nouvelle logique de perception de l’entité ‘oeuvre’. Il apparaît en évidence que les modèles conceptuels d’information bibliographique FRBR et FRAD (Functional Requirements for Authority Data) ont inspiré l’élaboration des RDA qui, par ailleurs, vont encourager l’usage de ces modèles, d’où découlera probablement une interdépendance entre les deux, vu le niveau d’utilisation assez faible des modèles en question et le poids que vont prendre les RDA (en tant que nouveaux AACR) dans la sphère bibliothéconomique. Pour mieux comprendre cette norme, les concepteurs (Joint Steering Committe for Development of RDA) conseillent d’ailleurs de se familiariser d’abord avec la structure et le vocabulaire des FRBR.

Après analyse, on peut remarquer que les RDA intègrent la structure des FRBR :

  1. en reprenant leur terminologie (oeuvre, expression, manifestation et item).
  2. en rendant compte des attributs de leurs entités et des relations qu’elles peuvent avoir entre elles.
  3. en associant chaque élément de donnée (contenu de l’information bibliographique) à ces entités

Est-ce que RDA va satisfaire les attentes ? Nous verrons à la publication officielle annoncée pour 2009 pour lever certains doutes (?). Quoiqu’il en soit, une réalité est là qui est l’existence de ce modèle (FRBR) et de cette norme future (RDA). Il est absolument nécessaire de maîtriser ce qui est là (formation continue ou académique) pour que nous soyons prêts, éventuellement, à les utiliser le moment venu. Nous ne pouvons pas nous permettre, nous professionnels sénégalais, une non-appropriation de tels savoirs bibliothéconomiques. Anticiper le savoir-faire, à ce que je sache, n’a jamais fait de mal à qui veut être au diapason des évolutions du métier qu’il a choisi. Donnons-nous les moyens de prendre en charge ces outils de description bibliographique, pour qu’au moment de mettre en place une structure bibliographique nationale digne de ce nom (toujours repoussée aux calendes grecques), nous ayions une matière première (synonyme aussi de « produit fini », donc prêt-à-l’emploi, dans le monde numérique) pour garnir la réflexion et agir.

Pour mieux comprendre RDA et le RDA/FRBR « mapping » je conseille la veille sur la page des FAQ (Foire aux questions / Frequently asked questions) du site de RDA JSC. Et encore, toujours pour en savoir plus : RDA to FRBR mapping document en pdf (English version), présentant les relations de concordance entre les deux. Le blog FRBR est aussi intéressant à consulter.

😉 A Zuza pour ta précieuse collaboration lors de la rédaction de ce billet

Prochainement, navigation vers des eaux plus paisibles avec vent arrière. 🙂


Creative Commons License
Ce document est mis en ligne sous Licence Creative Commons.

N° 16 – RDA : quelques considérations générales Réponse

Dans le billet de la semaine dernière, mon intérêt s’est porté sur l’ISBD consolidé publié en août 2007. Parallèlement un autre travail est entrain d’être accompli dans la sphère bibliothéconomique nord-américaine, toujours dans le sillage des nouvelles orientations imaginées pour faire évoluer le catalogage. En terme plus précis, il s’agit de la mise en place d’un nouveau code de catalogage dénommé RDA (Resource Description and Access).

Historique

En 2003, l’organisme de maintenance des AACR (Anglo-American Cataloguing Rules), en l’occurrence le Joint Steering Committee for revision of AACR (JSC) décida de réviser profondément ces règles. La dernière publication officielle (AACR2) est la seconde édition révisée en 2002 et mise à jour en 2003, 2004 et 2005. A sa suite, le draft de la première partie des AACR3 fut publié en décembre 2004. En 2005 le JSC décida de changer l’intitulé des AACR en adoptant celui de RDA, dont le premier draft sera publié en décembre 2005, suivi de la publication d’autres moutures concernant ses différents chapitres en 2006 et 2007. Pour une présentation plus complète (sur les RDA et l’organisation fonctionnelle du JSC) ce site peut vous aider à y voir plus clair. Les travaux sont en cours et la publication définitive est prévue en 2009.

Présentation et objectifs

  • code de catalogage adapté au nouveau contexte des catalogues : publication des règles sous forme électronique, pour décrire tous les types de ressources (électroniques et autres) dans des notices utilisables dans l’environnement numérique (Internet, OPAC web…)
  • approche centrée sur l’utilisateur et l’information dont il a besoin : la « norme » est conçue pour être facilement utilisable et produire des notices dont les données seront appropriées et pertinentes pour l’utilisateur
  • les directives sont basées sur des principes et non sur des règles contraignantes ou restrictives, le but étant de faciliter le processus de description des ressources selon un plan logique.
  • référence aux modèles d’information bibliographique (FRBR et FRAD, je me propose de faire prochainement, un billet sur ce dernier modèle qui concerne les données d’autorité). Ces derniers étant les bases de la construction des directives des RDA. Le prochain post portera sur l’articulation entre les RDA et les FRBR.
  • vocation internationale
  • possibilité d’un contrôle bibliographique plus efficace
  • compatibilité avec des normes de description semblables
  • utilisation préconisée au-delà de la communauté des bibliothèques : compatibilité avec les normes nord-américaines d’archives et de gestion des objets muséographiques

RDA et les métadonnées

RDA est conçu pour être utilisable avec des schémas d’encodage de métadonnées. Les notices bibliographiques créées sous RDA peuvent être stockées et transmises sous format MARC et des formats de métadonnées, tels que le Dublin Core (Dublin Core working group for RDA) ou MODS (slide sur MODS et RDA). Parallèlement un travail de développement d’un profil d’application pour RDA est entrain d’être mené, ainsi que celui d’un vocabulaire d’éléments.

Pour finir

Parler de RDA en l’état actuel (travaux d’élaboration en cours) est un exercice difficile tant le deadline quant à sa finalisation (2009) est encore long. Ce que j’ai voulu faire ressortir dans ce mini-dossier, à compléter lors du prochain post, c’est son importance ultérieure dans la construction du Web sémantique où, nous bibliothécaires et autres acteurs de l’information documentaire, devront avoir le « beau rôle », avec les informations contenues dans nos catalogues et répertoires accessibles sur le Web. Pour permettre aux moteurs de recherche d’accéder à ces données, il faut revoir et continuer à améliorer les formats et structures des catalogues, mais aussi les règles de catalogage, c’est le souci des concepteurs des RDA. Souhaitons qu’ils atteignent les buts escomptés et que les espoirs pour la profession (annonce de l’IFLA) ne soient pas déçus.

Prochainement RDA et modèle FRBR


Creative Commons License

Ce document est mis en ligne sous Licence Creative Commons.

N° 14 – RSS : agrégateurs en ligne 1

Suite et fin de ce mini dossier sur RSS par une présentation d’autres outils permettant de d’utiliser cette technologie PUSH. Pourquoi le choix des agrégateurs en ligne, parce que tout simplement ils ne nécessitent pas de téléchargement pour être utilisés, ce qui permet à tout un chacun de retrouver ses informations depuis n’importe quel ordinateur connecté à Internet. Dans mon premier post concernant ce dossier (billet n° 12) j’avais indiqué quelques lecteurs RSS hors-ligne (RSSReader et FeedReader,) qu’il fallait télécharger pour pouvoir les utiliser.

Après avoir défini ce qu’est un agrégateur avec les avantages que l’on peut en tirer, je vous proposerai une liste de quelques outils de ce type étant entendu que, leur maîtrise passera nécessairement par une pratique assidue.

Avantages :

  • centralisation de flux RSS d’origines très diverses : donc réduction du temps de consultation
  • proposition de résumés des informations reçues : donc aperçu du contenu des nouveautés apparaissant sur le site et tri possible avant la consultation de ces informations
  • facilité et simplicité dans l’utilisation : le processus d’abonnement et de désabonnement à des flux se fait de manière très rapide sans aucune contrainte technique particulière
  • possibilité de sauvegarder ses abonnements grâce au format OPML : cette capacité a son importance car la principale fragilité d’un agrégateur en ligne, est qu’il dépend de la plateforme mère (qui le produit et l’administre). Si par malheur cette « maison-mère » n’est plus accessible par Internet on risque de perdre tous les fils auxquels on s’est abonné.

Modus operandi :

En général, tous les agrégateurs en ligne ont des modes d’emploi semblables, en voici quelques caractéristiques communes :

  • étape 1 : inscription en donnant des informations personnelles pour obtenir un Login et un mot de passe qui permettront d’accéder à sa page personnelle de n’importe quel point du globe (forêt équatoriale africaine comprise)
  • étape 2 : repérer un onglet, ou bouton, ou un lien… ayant comme intitulé : « ajouter du contenu » ou « ajouter un flux » ou encore pour les anglophones « add… », cliquer dessus pour intégrer dans l’agrégateur, les fils RSS préalablement identifiés et choisis
  • étape 3 : ce fil vient s’afficher dans la page personnelle qu’on est entrain de créer ou d’enrichir avec possibilité d’afficher ce flux partout où on veut sur la page
  • étape 4 : la page est fonctionnelle depuis que l’on a agrégé le premier fil et les nouvelles informations apparaissent dans cet espace au fil (pardon pour la répétition) des mises à jour du « site-mère ».
  • étape 5 : on peut aller en Tasmanie en toute quiétude sans s’encombrer d’un laptop, seulement se souvenir de l’agrégateur utilisé, de son login et de son mot de passe pour avoir accès aux sites qu’on choisi de (sur)veiller.

Pour pratiquer et profiter de cette formidable technologie gratuite (pour combien de temps encore ?) voici une liste jamais exhaustive de quelques « joyaux »

Les cinq premiers sites, en plus des fils RSS, proposent des widgets de bureau qui permettent d’avoir accès à des informations particulières (courrier électronique, actualités, météo,…). Cette possibilité d’agréger une multiplicité de sites Internet dans un espace est offerte par XML. Les flux sont reçus et affichés sans l’aspect graphique des sites dont ils sont issus et les temps de chargement s’en trouvent forcément réduits. Voir cet exemple pour une meilleure compréhension de cela.

Pour nous professionnels de l’information documentaire, l’usage des agrégateurs en ligne trouve sa pertinence dans la possibilité qu’il nous offre de faire une veille documentaire efficace sur différentes sources d’information et fournir une qualité de service appréciée pour nos usagers.

Prochain wharf de mouillage : retour dans les eaux de la description bibliographique avec l’ISBD consolidé


Creative Commons LicenseCe document est mis en ligne sous Licence Creative Commons.

N° 13 – RSS : usages documentaires Réponse

L’usage des flux RSS dans le monde de l’information-documentation est plus facile à comprendre lorsqu’il est confronté à la mission essentielle qui est la nôtre, c’est-à-dire, la diffusion de l’information sous toutes ses formes. Depuis longtemps nous nous sommes appropriés les technologies informatiques pour donner une « nouvelle » identité à nos métiers, refondant nos manières d’être, d’agir et de SERVIR.

Il y a vingt ans, au moment de mes premiers « atomes crochus » avec l’ordinateur personnel (dans l’embryon de salle informatique d’alors à l’EBAD), m’amusant à créer de petits programmes en BASIC, beaucoup de bibliothécaires n’osaient même pas penser un jour, ranger le sacro- saint catalogue manuel aux oubliettes du château bibliothéconomique. Eh bien c’est fait (et bien fait ?), plus encore le « servir de la documentation » ne se fait plus seulement in Situ (rayons des bibliothèques et dépôts d’archives) mais « urbi et orbi » (pour reprendre une expression chère à un certain milieu). Dans tous les cas, qu’il se situât dans ou hors-les-murs du service d’information documentaire, l’utilisateur demeurait et demeure encore dans le schéma classique de la recherche d’informations (consultation des catalogues, même de l’OPAC à distance). Là nous lui proposons la méthode la plus courante pour accéder à nos trésors, celle du PULL.

Cependant avec les flux RSS la méthode change (radicalement ?) et se mue en PUSH où l’information est « poussée » vers l’utilisateur qui passe ainsi de consommateur actif à consommateur passif. L’enjeu pour nous est alors d’imaginer ce que nous pouvons faire de cette technologie RSS pour accroître la visibilité de nos produits et par ricochet leur valeur ajoutée, mais aussi de nous positionner dans le vaste bazar de l’infosphère virtuelle dont la majeure partie des éléments qui la constituent (masse documentaire) échappent au contrôle de nos structures. Cela ne remet-il pas en cause notre exclusivité en matière de diffusion de l’information-documentation ? Imaginons être à la place des usagers qui doivent certainement se poser la question de l’utilité d’une bibliothèque ou d’un centre de documentation au Sénégal, quand le Web hypertextuel foisonne de documents. Nous avons le devoir de leur répondre que oui, une bibliothèque, un centre d’archives… c’est toujours utile, voire indispensable dans les processus d’acquisition de Savoir. Que nous aussi, savons et pouvons user de RSS et autres technologies « nouvelles » pour les satisfaire et les aider à se retrouver dans le labyrinthe virtuel qu’ils investissent si souvent. 

Des utilisations possibles du RSS (liste non exhaustive) en voilà : veille sur les parutions pour booster la politique d’acquisition (Fils RSS des librairies, des éditeurs, des revues électroniques, des archives ouvertes, etc.) ; alerte sur les nouvelles acquisitions d’une bibliothèque (celles-ci pouvant être personnalisées selon le profil d’un utilisateur) ; informations événementielles ; bulletins de sommaires avec les fils RSS de chaque revue, etc..

Et voici un « florilège » de quelques usages réels pêchés dans les eaux pas troubles des espaces documentaires du Web.

  • Hennepin county library qui propose un large choix de fils RSS 
  • Pubmed : base de données de la National Library of Medicine dont l’interface Hubmed permet à l’usager d’y effectuer des recherches et de souscrire des abonnements aux fils RSS proposant des nouveautés issues des différents termes de recherche utilisés. Adaptée à un OPAC cette technologie permet de générer des flux RSS issus des termes de recherche entrés dans le catalogue.
  • University of Saskatchewan Library : propose la liste de toutes les revues électroniques auxquelles elle s’est abonnée et particulièrement celles qui ont des fils RSS. En s’abonnant aux flux qui l’intéressent, l’usager accède à la table des matières de chaque nouveau numéro reçu.
  • SCD de l’université Jean Moulin Lyon3 : RSS de nouvelles acquisitions
  • University of Warsaw Library : RSS d’actualités

 Le RSS s’est imposé dans les usages au point d’être incontournable pour qui veut s’informer, se documenter. C’est une technologie facile à mettre en place dès lors que l’on possède le « Know-how » de base en XML. Alors « XMLisons » nos espaces professionnels pour être plus performants dans nos missions, en alliant mimétisme technologique et utilitarisme professionnel.

Escale continue pour d’autres méthodes d’appropriation du RSS

Creative Commons License

Ce document est mis en ligne sous Licence Creative Commons.

N° 12 – RSS : une introduction Réponse

Parmi les possibilités offertes par XML, figure celle de pouvoir diffuser l’information par le biais des fils RSS. Pour une compréhension très simple, posons-nous des questions et essayons d’y répondre.

  • C’est quoi, un fil RSS ?

Combien de fois, chaque jour, ouvrez-vous par exemple Seneweb (pub gratuite) pour avoir des nouvelles et combien de temps perdez-vous en attendant le chargement de sa page d’accueil pleine d’images, surtout que la plupart de nos réseaux n’ont pas le label « à grande vitesse » ? Eh bien les flux RSS ont été inventés, entre autres, pour rendre l’accès aux sites Web plus simple et plus efficace et permettent aux internautes que nous sommes d’être au courant de toutes les « news » ou nouveautés d’un site. Les fils RSS (pour Really Simple Syndication ou RDF Site Summary) sont donc des flux répertoriant des contenus mis à disposition par des sites Internet. Ils peuvent contenir des titres d’articles, de dépêches,… et permettent d’un simple clic d’afficher le texte correspondant. Ils s’actualisent automatiquement sur l’écran de votre ordinateur sans que vous ayez besoin de vous connecter au site web d’origine.

  • A quoi ça sert ?

Dès qu’une nouvelle information est publiée, votre ordinateur vous l’annonce. Ainsi, plutôt que de devoir vous connecter régulièrement à votre site Internet de (p)référence, vous pouvez consulter à tout moment les derniers titres mis à jour. Dès qu’un titre vous intéresse, il vous suffit de cliquer sur celui-ci, pour accéder directement à l’article correspondant.

  • Comment ça fonctionne ?

Pour pouvoir lire des fils d’information au format RSS, vous avez quelques possibilités :

1 – Télécharger un « lecteur de flux RSS »
Vous devez d’abord télécharger un logiciel spécifique, un « lecteur d’informations » (news reader) qui vous permet ensuite de recevoir les titres issus des sites que vous aurez présélectionnés. Il existe un très grand nombre de ces logiciels, comme RSSReader ou FeedReader, pour PC (gratuits tous les deux), ou RSSOwl (gratuit), pour Mac.

Par exemple pour se tenir au courant des différentes mises à jour intervenant sur ce blog : une fois le programme installé sur votre ordinateur, revenez sur cette page, copiez le lien affiché ci-dessous et collez-le dans votre logiciel de lecture de fils RSS. https://louisar.wordpress.com/feed/

2 – Avec le navigateur Firefox
Téléchargez et installez le navigateur Internet Firefox (pour PC, Mac ou Linux).

Après avoir installé Firefox, affichez la page d’accueil de SENBIBDOC. Une icône orange apparaît en bas à droite de la fenêtre du navigateur ou à droite dans la barre d’adresse. Cliquez dessus. Les articles apparaîtront dorénavant automatiquement dans les Favoris ou la Barre de favoris du navigateur, sans que vous ayez à vous connecter au site.

Voir, pour des cas pratiques, ces pages démonstratives, incluant le navigateur Internet Explorer.

Bonne lecture jusqu’au prochain chargement : RSS, usages documentaires

 

 

 

 

 

Creative Commons License
Cet article est mis en ligne sous une licence Creative Commons.

N° 11 – XML : initiation pratique 1

Suite de mon introduction à XML.

Après avoir exposé les usages du langage dans la sphère bibliothéconomique, je vais dans ce billet faire une présentation pratique de ce qu’est XML. Le moyen que j’ai choisi est un slideshow, qui je l’espère permettra de mieux appréhender le sujet. Le but n’étant pas, bien entendu, de former des experts en la matière, je me suis limité à une présentation en surface.

Pour ceux qui sont intéressés par une découverte plus profonde, je vous propose la version intégrale de la présentation.

Dans le même souci de faciliter la compréhension je vous propose ci-dessous le film sur le web 2.0, réalisé par Michael Wesch anthropologue à Kansas State University, où sont exposées les possibilités offertes par XML. Le même film a été suggéré dans un commentaire à la suite de mon billet n° 04.

et ci-après, Web 2.0 traduction, envoyé par Thomas-Berthelon, une tentative de traduction sous-titrée en français pour ceux dont la langue anglaise n’est pas la tasse de thé préférée.

A bientôt pour une autre escale avec une v(t)oile cousue de fil RSS.

Creative Commons License
Cet article est mis en ligne sous un contrat Creative Commons.

N° 10 – XML et bibliothèques 1

A l’occasion des dix ans d’XML (10 février 2008), je profite de l’événement pour ancrer ma yole au port de cette syntaxe de balisage créée a l’initiative du consortium du Web  qu’est le W3C. Je ne m’appesentirai pas outre mesure sur l’historique de sa création, tant l’information sur la question est abondamment disponible sur l’incontournable Web. Soucions-nous plutôt de son utilisation et de son importance surtout dans l’environnement bibliothéconomique.

XML (Extensible markup language) est un langage de balisage générique dont le but est de permettre la fonctionnalité et l’interopérabilité du Web en permettant a plusieurs systèmes dinformation hétérogènes de communiquer et d’échanger. Autrement dit il repose sur des principes : c’est un langage de balisage extensible ; sa maintenance est assurée par le W3C ; les balises ne sont pas prédéfinies mais libres et précisent le sens ou la structure et non pas la présentation graphique (comme le fait HTML) ; le contenu, la structure et la présentation sont nettement dissociés ; la structure des informations est arborescente. 

Les raisons qui rendent intéressantes son utilisation sont que : c’est un format libre et ouvert ; il est indépendant de toute plateforme informatique ; il est promis à une certaine pérennité (il est répandu dans plusieurs domaines et bénéficie d’une solide structure de maintenance) ; il facilite l’interopérabilité. Pour de plus amples informations voir le dossier que j’avais indiqué sur un billet précédent. 

En bibliothèque son utilisation permet : d’afficher des notices bibliographiques sur le Web (MarcXML, MODS, BiblioML…) ; d’y échanger ces notices (OAI, Dublin Core…) ; d’y éditer des ressources (TEI, EAD…) ; d’y diffuser de l’information (RDF, RSS, Atom…). Pour mieux cerner les possibilités permises par XML, faisons une petite comparaison avec le format Marc que nous connaissons tous. Marc se matérialise sous la forme d’un format de saisie constitué de zones prédifinies et immuables, certaines de ces zones permettent de communiquer avec d’autres systèmes utilisant le même format ce qui permet à plusieurs bibliothèques d’échanger des notices bibliographiques par l’import ou l’export de celles-ci. Mais ces échanges ne concernent pas les usagers de nos bibliothèques qui sont dans l’impossibilité d’accéder aux notices via le Web (pour cela ils doivent préalablement passer par le site de la Bibliothèque pour accéder à son OPAC). Alors qu’avec XML, ces notices bibliographiques deviennent visibles à partir du Web parce qu’étant repérables par les différents outils de recherche qui le sillonnent. En d’autres termes nos OPAC sont mis en surface et accessibles, en principe, à tout internaute. Un autre avantage parmi d’autres est, par exemple, le changement de formats de notices de Marc à XML qui se fait sans perte de données, permettant ainsi une retroconversion « fidèle » de ces dernières… Ce souci de pallier l’incapacité du Marc à permettre les échanges sur le WEB,  sera à l’origine de la création du MarcXML par la Bibliothèque du Congrès en juin 2002. Je vous renvoie au billet N° 06 de ce blog où j’expose, dans la présentation en bas de page, les différentes insuffisances du format Marc face au Web et l’alternative offerte par les formats de métadonnées qui supportent, entre autres, un balisage en XML.

Cette visibilité de nos notices se manifeste aussi par l’utilisation des flux RSS, qui permettent de diffuser de l’information sous forme d’alerte. Un exemple tout simple est de créer un flux RSS de nouvelles acquisitions qui permet à tout utlisateur inscrit à ce flux d’être averti dès qu’il y a de nouvelles notices dans l’OPAC. Nous sommes là en présence d’un vraie application « bibliothèque 2.0 », ce qui montre qu’XML mérite toute notre attention et qu’il serait judicieux de l’intégrer dans nos pratiques présentes et futures.

Prochainement, XML : initiation à la pratique