N° 110 – L’intelligence artificielle dans la gestion documentaire : nécessité de synergie efficiente entre technologie et savoir-faire

L’intelligence artificielle (IA) est appelée à occuper une place de plus en plus centrale dans la transformation des métiers de l’information documentaire. Loin d’être une simple évolution, elle représente une révolution majeure dans cet écosystème. Le présent billet vise à démontrer comment cette technologie, en symbiose avec les compétences humaines, transforme en profondeur les pratiques de gestion documentaire. Cette analyse s’appuie sur ma communication a un colloque portant sur l’impact de l’IA dans ce domaine.

page_titre_cosica

Contexte et enjeux de l’IA dans la gestion documentaire

L’IA dans le management de l’information documentaire repose sur plusieurs concepts clés qui en façonnent les applications. Elle peut être définie simplement comme la capacité des machines à simuler l’intelligence humaine, leur permettant ainsi d’accomplir des tâches complexes comme l’apprentissage et la prise de décisions. En gestion documentaire, l’objectif est d’optimiser le processus de traitement, stockage et diffusion des documents, tout en automatisant certaines tâches grâce à des algorithmes. Ces algorithmes, qui sont des ensembles d’instructions prédéfinies, résolvent des problèmes et réalisent des opérations spécifiques. Un type particulier d’IA, dénommé générative, permet même de créer du contenu inédit, tandis que le traitement du langage naturel (NLP) s’attaque à la compréhension et à la génération de textes en langage humain, facilitant ainsi les interactions homme-machine. Le Machine Learning (ML) ou apprentissage automatique, quant à lui, permet aux systèmes d’apprendre à partir des données sans être explicitement programmés. Les modèles de langage avancés ou grands modèles de langage(LLM), comme GPT, illustrent parfaitement cette capacité, avec une compréhension contextuelle leur permettant de traiter et générer du texte à partir de vastes corpus. Des outils tels que les prompts, qui sont des instructions données à l’IA pour exécuter une tâche spécifique, jouent un rôle fondamental dans l’interaction entre les humains et les machines. Enfin, les interfaces API (Application Programming Interface) et le format JSON facilitent la communication entre les systèmes documentaires et les applications externes, rendant ainsi les échanges de données plus fluides et interopérables.

Analyse d’enquête sommaire

L’étude repose sur une enquête en ligne réalisée auprès de 54 professionnels de l’information documentaire issus de divers secteurs en Afrique, tant anglophone que francophone. Cette enquête visait à évaluer leurs perceptions et usages de l’IA. Les questions abordaient des thématiques variées : la connaissance de l’IA, les usages actuels, les avantages perçus, ainsi que les préoccupations éthiques et professionnelles. Les résultats révèlent une diversité des profils professionnels (bibliothécaires, archivistes, documentalistes et quelques journalistes) et une répartition équilibrée en termes d’expérience professionnelle. Environ 49% des répondants déclarent avoir une connaissance limitée de la nature de l’IA, tandis que seulement 11% estiment avoir une bonne appréhension de cette technologie, l’autre moitié déclarant en être complètement ignorante. Cette disparité souligne un besoin criant de formation et de montée en compétences dans ce domaine. Pour ce qui est de l’utilisation actuelle et des avantages perçus, plus de 60% des répondants ont déjà, plus ou moims. utilisé des outils d’IA dans leur travail, principalement pour la recherche d’informations (61%), la gestion des collections numériques (22%) ou les services de référence (28%). L’automatisation des tâches répétitives et l’amélioration de l’accès à l’information sont parmi les principaux avantages perçus.

La majorité des répondants (80%) la voient aussi comme un atout stratégique, capable d’augmenter l’efficacité de leur travail tout en améliorant la qualité des services documentaires. Cependant, 20% soulèvent des préoccupations éthiques, notamment en matière de confidentialité des données.

Cela se retrouve, par ailleurs, dans les réponses à la question ouverte sur l’avenir de l’IA dans la profession et qui montrent un optimisme général quant à l’amélioration de l’efficacité et de l’accès à l’information grâce à l’automatisation des tâches et au traitement du langage naturel. Elle est perçue comme un outil essentiel pour gérer la surcharge d’informations et lutter contre la désinformation, tout en offrant des opportunités professionnelles, notamment pour les femmes et les filles, contribuant ainsi à une meilleure égalité des chances en termes de genre. De même, des préoccupations éthiques subsistent, notamment en matière d’inclusion sociale et de gestion des biais algorithmiques, soulignant la nécessité d’une adoption réfléchie et équilibrée de cette technologie.

Révolution des outils et méthodologies

L’IA introduit une panoplie de nouveaux outils et méthodes révolutionnaires pour automatiser et améliorer la gestion documentaire. Ces outils se déploient sur plusieurs axes opérationnels, dont voici quelques-uns :

  • Collecte de données : l’automatisation de la collecte des données est l’une des premières révolutions apportées par l’IA. À travers des scripts et des algorithmes, il est désormais possible d’extraire automatiquement des informations depuis diverses plateformes en ligne et bases de données documentaires. Cette automatisation réduit drastiquement le temps consacré à la recherche manuelle de données, permettant aux professionnels de se concentrer sur des tâches à plus forte valeur ajoutée.
  • Classification automatique des documents : un autre domaine clé est la classification des documents via des algorithmes de Machine Learning. Ces modèles peuvent catégoriser les documents selon des thésaurus prédéfinis, comme le Macrothésaurus de l’OCDE (qui a été pendant longtemps mon compagnon institutionnel d’indexation analytique), en utilisant des API pour recevoir et analyser le texte. Ce processus garantit une classification plus rapide, tout en maintenant la précision nécessaire pour organiser de grandes collections de données.
  • Analyse prédictive pour la gestion des collections : l’IA s’illustre également par ses capacités à prédire les besoins futurs en documents. En analysant les données historiques et en appliquant des modèles de prévision, les algorithmes peuvent estimer les tendances de la demande documentaire, facilitant ainsi l’optimisation des collections et la gestion des ressources. Cette approche prédictive permet une meilleure anticipation des besoins des usagers, améliorant ainsi la réactivité des institutions documentaires.

Ces méthodologies ne se limitent pas à automatiser les tâches, elles renforcent également l’interaction avec les utilisateurs en rendant les systèmes documentaires plus dynamiques, plus intelligents et plus adaptés aux besoins spécifiques des institutions.

Exemples d’applications possibles de l’IA

L’intégration de l’IA dans les bibliothèques, archives et centres de documentation s’accompagne de nombreux exemples d’applications pratiques. Ces scénarios illustrent la manière dont elle révolutionne les processus documentaires à travers différents cas d’usage :

  • Mise en place d’un système d’indexation automatique dans une bibliothèque universitaire : face à une vaste collection de documents nécessitant une indexation rapide et précise, l’université peut implémenter un système d’indexation automatique basé sur des algorithmes d’IA. Elle analyse les métadonnées des documents, extrait les mots-clés pertinents grâce au traitement du langage naturel, puis indexe les documents de manière quasi-instantanée. Ce système permettrait une réduction du temps d’indexation de 50%, tout en augmentant la précision des résultats de recherche.
  • Restauration numérique en archives patrimoniales : elle peut intervenir aussi dans la restauration de documents anciens et fragiles, tels que ceux présents dans des Archives patrimoniales. Les documents numérisés sont améliorés via des algorithmes de restauration d’image, puis traités par des outils de reconnaissance de caractères (OCR) et/ou de textes manuscrits (HTR) pour les rendre consultables, navigables et interprétables plein-texte. Cette numérisation et classification automatique facilitent l’accès à des documents historiques qui, autrement, restent très souvent difficilement accessibles dans leur version initiale analogique.
  • Catalogage automatisé : dans les processus de description documentaire, l’IA peut également jouer un rôle déterminant. Par exemple, des modèles de langage sont utilisés pour automatiser la création de notices descriptives. À partir des informations de base, comme le titre, l’auteur/créateur et l’ISBN, elle génère des descriptions, mots-clés et classements adaptés, avant que le professionnel ne vérifie et approuve les fiches pour leur intégration finale dans le catalogue.
  • Archivage en municipalité : un autre cas pertinent est l’utilisation de modèles de langage pour créer un plan de classement des documents d’état-civil au sein d’une municipalité. L’IA analyse les catégories existantes, propose une classification détaillée, qui est ensuite révisée et ajustée par les archivistes avant son implémentation dans le système d’archivage.

plan_classement_etatcivil

  • Rédaction automatisée de rapports en entreprise : elle peut être mise à contribution pour automatiser la rédaction de rapports de synthèse dans des contextes d’entreprise. À partir de documents internes collectés, elle analyse et compile les informations essentielles, créant ainsi des rapports sur mesure qui peuvent être ajustés par les documentalistes avant leur diffusion interne (DSI notamment).

Ces exemples montrent bien la flexibilité et la puissance de l’IA pour répondre à une grande variété de besoins documentaires.

Compétences humaines et interaction avec l’IA

Malgré les avancées technologiques, l’IA ne fonctionne pas en autarcie et nécessite une interaction étroite avec les compétences humaines pour maximiser son potentiel. Trois axes principaux se dessinent dans cette interaction.

  • Compréhension des modèles de langage : les professionnels doivent comprendre les modèles de langage (LLM) utilisés dans les systèmes d’IA, notamment leur fonctionnement interne basé sur des « tokens » (jetons). Ces unités de texte sont la base sur laquelle les modèles d’intelligence artificielle génèrent et analysent le langage humain. Cette connaissance technique permet aux documentalistes d’exploiter pleinement les outils basés sur ces technologies et de comprendre le processus d’inférence en IA générative.
  • Développement de prompts efficaces : la formulation de requêtes claires et précises est essentielle pour obtenir des résultats pertinents de l’IA. Des méthodes comme la « chaîne de pensée » (Chain-of-Thought, CoT) permettent de structurer des requêtes complexes et d’encourager l’IA à suivre des étapes logiques dans son raisonnement. La qualité de ses réponses est directement liée à la précision des prompts formulés par les utilisateurs. La maitrise de la chaine de pensée du LLM se matérialise par une suite de questions successives qui permettent d’affiner au fur et à mesure les réponses générées.
  • Éthique et biais algorithmiques : l’aspect éthique demeure un sujet important. Les biais algorithmiques, susceptibles de créer des déséquilibres dans le développement et la gestion des collections, doivent être identifiés et corrigés par les professionnels, par exemple, en évitant de favoriser certains groupes sociaux ou perspectives au détriment d’autres. Il est également important de garantir la confidentialité des données sensibles, notamment lors de la gestion de documents contenant des informations personnelles.

L’IA se positionne comme un catalyseur de la modernisation des pratiques de gestion documentaire. En automatisant des processus fastidieux et en facilitant l’accès à l’information, elle permet aux professionnels de se concentrer sur des tâches à plus forte valeur ajoutée. Dans ce contexte, les institutions africaines, en particulier, ont l’opportunité de tirer parti de ces technologies pour préserver leur patrimoine documentaire tout en renforçant leur souveraineté informationnelle. L’adoption stratégique de l’IA dans le domaine documentaire ouvre ainsi des perspectives passionnantes, bien que la formation et la résolution des défis éthiques restent des prérequis essentiels à une implémentation réussie.

Lien vers la presentation colloquiale.

2 commentaires sur « N° 110 – L’intelligence artificielle dans la gestion documentaire : nécessité de synergie efficiente entre technologie et savoir-faire »

Répondre à amonnoyeur Annuler la réponse.