N° 84 – Les catalogues de données 1

Je poursuis mon parcours dans l’univers des données après le billet précédent portant sur une revue listée et catégorisée des sources de données disponibles sur le Web. Parmi celle-ci, il était fait état de sources à caractère national, donc de données produites au niveau des pays, notamment africains. Une investigation accrue dans ce sens, doublée d’un désir de satisfaire une curiosité professionnelle, m’a amené à m’intéresser à la manière dont les données «africaines» pouvaient être décrites et accessibles, selon un procédé identique  à celui des documents présents dans les catalogues classiques des bibliothèques. J’ai ainsi pu dénicher quelques très belles perles, dont le catalogue des données de l’ANSD (Agence Nationale de la Statistique et de la Démographie) du Sénégal. Il est produit dans le cadre du programme d’archivage national des données du Sénégal (ANADS) géré par l’ANSD elle-même.
L’archivage des données, arrimé à Internet, fait surtout référence au concept de microdonnée. Ces microdonnées, qui sont des ressources importantes pour les gouvernements, les institutions nationales et les chercheurs du monde académique, surtout ceux en sciences sociales, sont le plus souvent issues d’enquêtes et de recensements. Elles représentent des ressources indispensables et doivent être gérées de façon à encourager leur utilisation et réutilisation. La politique nationale d’archivage des données se décline généralement en 06 activités qui vont de l’acquisition des données à leur dissémination en passant par la conservation, la documentation, le catalogage et l’anonymisation. Parmi celles-ci se trouve une activité essentielle qui est celle de la documentation, qui permet la réexploitation des données d’enquête et donc de nouveaux traitements statistiques. En effet ceux-ci ne sont possibles que si les producteurs d’enquêtes fournissent tous les documents qu’ils ont élaborés durant leur activité de collecte de données (conception d’échantillon, méthodologies, questionnaires, dictionnaires de variables, nomenclatures, etc.). Les Archives de données ont donc élaboré des techniques adaptées pour donner accès à l’information sur les données disponibles, afin de faciliter l’accès aux données elles-mêmes, respectant ainsi les spécifications définies par l’Initiative de Documentation des Données (DDI en anglais) et même celles des métadonnées du Dublin Core.
DDI est un standard technique de documentation basé sur le format XML qui permet de décrire des enquêtes et sondages en sciences humaines et sociales allant de la description du projet à la description détaillée de chaque variable. Pour ce faire, il a été élaboré un dictionnaire de balises de la norme DDI en anglais, traduit également en français.

L’activité de catalogage des données proprement dite, suit des procédures établies pour que les utilisateurs puissent identifier et accéder facilement aux informations recherchées. Ces informations mises à jour continuellement sont relatives au titre, au contenu, au contexte géographique, à l’opportunité, à la disponibilité et l’accessibilité de chaque ressource. Cet accès s’appuie sur un travail d’indexation et la mise à disposition d’un moteur de recherche interne.

De prime abord, tout cela peut paraître confus et peut susciter certaines interrogations légitimes, comme, par exemple, la manière de mise en œuvre pratique. Cependant, en découvrant le catalogue de l’ANSD du Sénégal, j’ai pu vérifier la faisabilité de tout cela en parcourant différentes notices figurant dans ledit catalogue. En poussant mes investigations j’ai pu découvrir que les activités de documentation, de catalogage, de dissémination, entre autres, sont effectivement possibles en grâce à un logiciel Libre dénommé NADA.
NADA qui en est à sa version 4.2, requérant au minimum une version PHP 5.3 ou supérieure et MySQL 5.3 ou supérieure pour une installation sans couacs, est une application Web de catalogage de microdonnées servant de portail aux chercheurs pour parcourir, rechercher, comparer et télécharger des données de recensement pertinents ou des résultats d’enquête. Il a été développé à l’origine pour soutenir la création d’Archives nationales de données d’enquête. L’application est utilisée par un nombre varié et croissant d’organisations nationales, régionales et internationales. D’ailleurs à part le Sénégal d’autres pays africains comme l’Ethiopie et l’Ouganda, par le biais de leur bureau statistique national, ont élaboré des catalogues utilisant ce logiciel. Pour en savoir plus sur son fonctionnement, ses composantes techniques, son téléchargement mais aussi découvrir d’autres outils comme l’éditeur de métadonnées en DDI, vous pouvez toujours visiter le site dédié à NADA.

Avec ce modeste exposé j’espère que vous en savez un peu plus sur ce que pourrait être un DATA LIBRARIAN.

Advertisements

Un commentaire

Laisser un commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l'aide de votre compte WordPress.com. Déconnexion / Changer )

Image Twitter

Vous commentez à l'aide de votre compte Twitter. Déconnexion / Changer )

Photo Facebook

Vous commentez à l'aide de votre compte Facebook. Déconnexion / Changer )

Photo Google+

Vous commentez à l'aide de votre compte Google+. Déconnexion / Changer )

Connexion à %s