N° 100 – De l’Intelligence artificielle dans l’écosystème de l’information documentaire

Voilà un titre qui, à lui seul, pourrait inspirer un opus quantitativement plus épais, à la dimension d’un livre, tant ce qu’il y a à dire autour de ce diptyque, mettant en parallèle Intelligence Artificielle (IA) et Infodoc, est immense en termes d’enjeux, de défis, d’opportunités, etc.

ia_homme

Commençons par un bref rappel de ce qu’est l’IA, à savoir « une branche de l’informatique qui vise à créer des machines capables d’apprendre (Machine Learning), de raisonner et de résoudre des problèmes de manière autonome, en imitant certaines capacités humaines« . En d’autres termes, une sorte d’organisme cybernétique (cyborg), ayant des dispositions intellectuelles proches de l’humain, dont la faculté d’apprendre, de construire des bases de connaissances et de trouver des solutions en fonction de ces aptitudes. Cette nature de l’IA prouve qu’elle peut s’appliquer, transversalement, à tout secteur d’activités, y compris celui de notre catégorie socioprofessionnelle de type documentaire.

Il n’est plus nécessaire de rappeler l’importance des bibliothèques, centres de documentation, services d’archives et autres organisations similaires ou connexes dans l’environnement social et le rôle que les acteurs que nous sommes y sont appelés à jouer au jour le jour, fort de nos acquis éducatifs et formatifs et renforcés par de la pratique éprouvée au fil du temps actif. Cependant, avec l’émergence croissante des technologies d’IA, il y a lieu de se questionner sur ce qu’impliquerait l’immixtion des cyborgs et autres chatbot (agent conversationnel) dans notre quotidien de théoriciens et praticiens des sciences et des techniques documentaires.

Alors quels enjeux ?

Partons de ce qui fait l’essence de notre identité professionnelle, à savoir la médiation, être un pont entre l’information et l’utilisateur, que cette information fournie soit un besoin conscient ou non de l’usager. Notre ambition est de toujours faciliter l’accès à l’information à tous nos publics. Le premier enjeu est lié à la manière dont l’IA nous permettrait d’amplifier la délivrance de ce service d’informations à l’usager, et qui va au-delà de ce que nous offrent nos dispositifs traditionnels de médiation qui se sont digitalisés avec l’outil technologique et l’infrastructure logicielle corollaire. Quelle plus-value à nos OPAC (catalogues en ligne), nos dépôts institutionnels et autres types de bibliothèques numériques, nos instruments de recherche en ligne chers aux archivistes, nos hubs de connaissance, etc. ?

A priori, un outil d’IA n’agit pas comme un moteur de recherche classique de type généraliste comme Google ou spécifique, comme celui d’un portail documentaire ou de catalogue en ligne de bibliothèque. La médiation n’est donc pas encore optimisée par l’intelligence artificielle dans le cadre strict de résultats de recherche issus du Web. Cependant, ce que mon utilisation personnelle d’un chatbot comme ChatGPT m’a appris, c’est sa capacité d’exploitation intellectuelle du contenu substantiel de ces résultats de recherche, en termes d’analyse, d’argumentation et d’affinement de ces résultats découlant des requêtes exprimées dans le prompt d’interrogation. Par exemple, en lieu et place d’une liste de résultats brute, comme peut la présenter un moteur de recherche, l’outil d’IA pourra proposer une liste de références sous forme de bibliographie, avec style de citation standardisé, pour peu qu’on le lui demande. Cette bibliographie pouvant même se coupler successivement avec une analyse de contenu sur un sujet bien déterminé. L’IA agit ainsi, comme un fournisseur de « documents secondaires » et c’est là où un de ses intérêts se manifeste le plus dans un contexte documentaire professionnel.

Ci-dessous un exemple illustratif avec le prompt suivant :

Voir ici, le résultat de cette requête

Les avantages saillants de l’IA, à ce propos, sont de pouvoir faire face à la constitution de données massives pour en faire des analyses sectorielles efficaces, par sa capacité d’automatisation des processus de traitement de l’information et donc une amélioration de la recherche documentaire.

Un autre enjeu, en termes d’avantage substantiel considérable de l’utilisation de l’IA, est celui relatif aux processus d’apprentissage en situation de formation initiale comme continue. L’IA peut être parfaite pour maîtriser des techniques documentaires qui font ou doivent faire partie de notre bagage professionnel, par exemple :

  • cataloguer en ISBD et en MARC (21, UNIMARC)
  • décrire des ressources numériques en Dublin Core
  • encoder en XML des ressources d’information : pour le Web sémantique avec RDF est ses dérivés, dont OWL pour la création d’ontologies Web structurées et SPARQL, dont les services contribuent à constituer la toile de fond du Web des données (ou Linked Open Data) ;
  • encoder en XML des ressources archivistiques en EAD.
  • modéliser des plans de classement, des tableaux de gestion et autres inventaires pour les archives.
  • modéliser des thésaurus et autres taxonomies analogiques, y compris des listes de vedettes-matières.
  • Etc.

L’idée est d’utiliser l’IA pour aider à comprendre la structuration de ces différents formats, standards, produits documentaires et maitriser leur mise en œuvre pratique. Dans cette même veine « formationelle », l’idée est de pousser les professionnels de l’Infodoc à s’investir dans la formation des usagers pour la culture et la maîtrise de l’IA, pour accompagner les publics intéressés par l’usage de l’IA dans leurs activités.  L’exemple présenté précédemment est illustratif de la plus-value que nous pouvons apporter à des utilisateurs en situation de production académique, avec constitution d’une liste de références et dans un délai de traitement hyper-court. Toutefois, cela suppose que nous développions de nouveaux rôles professionnels dans le secteur de l’information documentaire et que nous ayons des compétences indispensables dans l’utilisation de l’IA. Construire un cercle vertueux entre le développement de capacités personnel et celui des publics que nous servons, pour ne pas rester en rade des nouveaux défis qui nous sont imposés par l’IA émergente.

Cette posture liée à l’IA implique que nous soyons tout aussi attentifs :

  • aux défis de la protection de la vie privée et des données personnelles,
  • aux défis liés au risque de biais dans les analyses et traitements de données, impliquant que nous revoyions les propositions analytiques et les données fournies par l’IA, en utilisant nos compétences et aptitudes en évaluation de l’information, avant diffusion à l’usager. Pour illustration, une vérification des URLs Web proposées dans la bibliographie résultant de notre exemple de dialogue avec ChatGPT, donne un taux de 33% (2 sur 6) de liens valides, impliquant par conséquent une nécessaire opération de correction en aval.
  • aux défis liés à la transparence des processus automatisés.

Ces défis seront surmontés avec la mise en place de politiques de protection des informations confidentielles, la formation adéquate des professionnels du secteur documentaire et la compréhension des techniques utilisées par les algorithmes pour traiter les données.

A. B. D.

P.-S.

Au fait, ce billet finissant aurait pu être généré via un outil d’IA, pour faire plus facile certes, voire plus rapide, mais ma posture d’auteur, aimant l’écriture et le processus d’idéation en amont, en aurait subi un sacré coup d’ordre moral. C’est là où réside un autre enjeu éthique de l’utilisation de l’IA. Doit-on substituer l’intelligence de la machine à la nôtre qui est biologique ? Le jeu du temps à gagner vaut-il la chandelle de léthargiser, voire cryogéniser nos neurones par l’inaction ?

Laisser un commentaire