N° 43 – A la découverte de « Linked Data »

Il y a un an j’introduisais, avec la prudence qui sied à un non spécialiste, le sujet du Web sémantique. Depuis beaucoup d’eau a coulé sous le « pont-abri » sous lequel je m’abritais et j’ose maintenant sortir de cet abri pour approfondir mon discours sur le concept. Lors du dernier IFLA 2009 (section Information Technology) il a été souvent question de ce  Web sémantique et plus spécialement de  « Linked Data« . Pour comprendre de quoi il est question, il faut faire un bref rappel de ce qu’est le Web tel que nous le connaissons, l’utilisons et le pratiquons aujourd’hui. Ce Web traditionnel est une gigantesque quantité de documents reliés entre eux par des liens hypertextes et accessibles grâce au protocole de communication HTTP. Ces documents sont lisibles et l’on peut suivre les liens qui y sont inclus et accéder à d’autres documents renvoyant eux-mêmes à d’autres documents et…c’est tout. Soyons clairs, mon intention n’est nullement d’amoindrir les effets bénéfiques de ce Web qui a contribué à faire de notre planète une Pangée virtuelle. Mais il se trouve qu’au-delà du document il y a de la matière plus fine, un composant de ce même document, dont la prise en compte renforcerait plus, les fondations de ce supercontinent virtuel adoré qu’est le Web. Cet élément si important n’est autre que la donnée qui est le constituant principal du document. Il ne s’agit ni plus ni moins que de faire de cette donnée une matière première essentielle à la manufacture du Web futur (3.0 ?).

Le Linked Data s’inscrit dans cette logique car son objectif  est de permettre aux gens de partager des données structurées sur le Web aussi facilement qu’ils peuvent partager des documents aujourd’hui.

C’est Tim Berners-Lee lui-même qui invente le terme dans son article Linked Data. En effet qui de mieux que le créateur du Web pouvait être à la base d’une telle idée visant à tracer la courbe évolutive de son oeuvre ? Le terme se réfère à un style de publication et d’interconnexion des données structurées sur le Web. L’hypothèse de base du Linked Data est que, plus une donnée est étroitement liée à une autre, plus augmentent sa valeur et son utilité. En résumé, le Linked Data est tout simplement une utilisation du Web pour créer des liens entre des données provenant de sources différentes.

linkeddata_cloud

Les principes de base du Linked Data sont les suivants :

  • utiliser le modèle de données RDF pour publier des données structurées sur le Web
  • utiliser des liens RDF pour interconnecter des données provenant de différentes sources

Appliquer ces deux principes conduit à la création d’une communauté de données sur le Web, un espace où les gens et les organisations peuvent fournir et consommer n’importe quel type de données. Cette communauté de données est souvent appelé le Web de données ou Web sémantique.

Le Web de données est accessible par l’utilisation des navigateurs Linked Data (exemples : DISCO, Openlink version demo), tout comme le Web des documents (traditionnel) l’est par le biais des navigateurs HTML. Toutefois, au lieu de suivre des liens entre les pages HTML, les navigateurs Linked Data permettent aux utilisateurs de surfer entre les différentes sources de données en suivant des liens RDF. Cela permet à l’utilisateur de démarrer par une source de données et ensuite de se mouvoir dans un Web potentiellement infini de sources interconnectées grâce à ces liens RDF. Par exemple, pendant qu’un usager étudie  les données sur une personne provenant d’une source, il peut être intéressé par des informations sur la ville de résidence de cette dernière. En suivant un lien RDF, l’usager peut accéder  à l’information concernant cette ville, information figurant dans un autre silo de données.  Le Linked Data permet donc d’établir des relations entre des données et c’est de cela qu’il s’agit fondamentalement. Ces relations peuvent être de différentes natures. Par exemple, un lien RDF qui relie des données sur les personnes peut affirmer que deux personnes se connaissent, aussi un lien RDF qui connecte les informations personnelles avec des informations sur les publications dans une base de données bibliographiques, pourrait stipuler qu’une personne est l’auteur d’un document particulier.

Il faut donc retenir que tout comme le document Web traditionnel peut être exploré en suivant des liens hypertextes, le Web de données s’explore en suivant les liens RDF. Le ciment qui maintient ensemble les documents sur le Web traditionnel est constitué par les liens hypertextes dans les pages HTML. Celui du Web de données l’étant par liens RDF.

Lien hypertexte versus Lien RDF, un face-à-face : où cependant demeure un dénominateur commun, à savoir l’incontournable HTTP, ce protocole sans lequel aucune ressource (document) n’est accessible sur le Web. En effet c’est ce même protocole qui permettra d’accéder aux données reliées entre elles,  mais par des URI (Uniform Resource Identifier). Avec le Linked Data, HTTP permettra d’accéder non plus aux documents seulement, mais sera utilisé pour des personnes, des lieux, des événements, etc. et n’importe quel concept sur le Web aura un nom commençant par HTTP qui sera son identifiant unique. Avec l’utilisation de ce protocole HTTP, le Web nous renvoie des informations, des données qui sont importantes ou utiles parce qu’elles peuvent susciter un intérêt insoupçonné au départ : par exemple si c’est un événement, qui s’y rend ? Si c’est une personne, où est-elle née ?.  Ces données une fois récupérées ne fournissent pas uniquement des renseignements sur elles-mêmes, mais aussi et surtout des relations. Par exemple je  fais une recherche sur Senghor qui est né à Joal, Joal étant une ville du Sénégal. Dès qu’il y a une relation entre deux données, l’élément lié est nommé avec un nom commençant par HTTP. A partir de son nom HTTP je peux accéder à cette ressource, ici « Senghor », ensuite je peux accéder à sa ville de naissance « Joal », à son pays le « Sénégal », à la population de son pays, etc.. Ici apparaît un formidable intérêt, qui est la réduction du temps de recherche sur le Web et un affinement automatiquement de cette recherche. Dès l’affichage du résultat on dispose de toutes les données connexes à une ressource requise.

Dans le Linked Data imaginé par Tim Bernes-Lee il faut juste des données, disponibles, brutes, émanant de toutes sources, individuelle ou collective pour rendre le monde encore meilleur.

A la prochaine pour des informations supplémentaires et surtout pour voir comment les bibliothécaires peuvent participer au mouvement.

Creative Commons License
Ce document est mis en ligne sous Licence Creative Commons.

Share

Publicité

6 commentaires sur « N° 43 – A la découverte de « Linked Data » »

  1. Merci pour ce cours magistral nous te devons beaucoup car tu nous mets toujours au diapason de ce qui se fait dans le monde de l’information scientifique et technique. La preuve est cet article très fouillé et pointu dans le monde du Web. Mais on aimerait avoir une plateforme pour des cas pratiques de formation.
    Je te souhaite bon courage et bonne continuation

    1. Merci
      pour ces appréciations. Tu émets une idée importante (formation), nous pouvons réfléchir à cela. Avis à tous ceux qui cela intéresse et qui peuvent faire part de leurs idées sur cette question.

  2. Bonjour,

    Je vais présenter mes félicitations à Benoît pour sa nomination comme Membre correspondant du Comité permanent de la Section « Information Literacy » de l’IFLA. en utilisant ce post sur les « linked data ».
    Au fait, comme M. Jourdain qui faisait de la prose sans le savoir, ne suis je pas en train de faire du « linking data »? (rires…)
    Toutes mes félicitations donc cher « promotionnaire de LVV » et je vais reprendre les termes mêmes de Mandiaye qui, je pense a bien « défini » Benoit en le présentant comme  » ce collègue engagé au service de la communauté professionnelle avec un haut sens du partage. Il avait d’ailleurs eu à écrire sur l’Information Literacy dans son post N° 30.

    Cette nomination est doublement importante pour nous professionnels de l’information car, coïncidence intéressante, le président OBAMA a déclaré le mois d’octobre comme mois de l’Information Literacy aux USA .

    Avec cet appui de taille, bien que se passant Outre Atlantique, nous professionnels africains nous devons de saisir la balle au bond pour nous positionner et réaffirmer notre rôle qui est essentiel pour cette « maîtrise de l’information » avec tous les enjeux qui en découlent dans les domaines de l’éducation et du développement.
    C’est donc à nous de nous positionner afin d’ amener nos autorités gouvernementales à prendre cette donne au sérieux et à donner aux professionnels de l’info doc que nous sommes leur place en tant qu’acteurs pouvant œuvrer pour le développement du pays.

Votre commentaire

Entrez vos coordonnées ci-dessous ou cliquez sur une icône pour vous connecter:

Logo WordPress.com

Vous commentez à l’aide de votre compte WordPress.com. Déconnexion /  Changer )

Photo Facebook

Vous commentez à l’aide de votre compte Facebook. Déconnexion /  Changer )

Connexion à %s