N° 113 – Intégration de l’IA et d’AtoM pour la gestion et description des fonds archivistiques

Dans le cadre de nos activités archivistiques, il est essentiel de toujours chercher à moderniser nos pratiques pour optimiser le traitement des fonds documentaires et leur diffusion. Aujourd’hui, je partage une expérience qui mêle intelligence artificielle, gestion des fonds d’archives numériques et normes de description ISAD(G). Cette démarche se veut à la fois pratique et pédagogique pour aider les collègues archivistes à mieux appréhender l’utilisation de technologies telles que ChatGPT et les métadonnées EAD 2002, afin d’améliorer leurs compétences dans ce domaine clé.

Contexte de l’expérience

L’objectif de cette expérience était de voir comment un modèle de langage comme ChatGPT pouvait être intégré pour automatiser et améliorer les processus de description des fonds archivistiques dans un environnement professionnel, tout en respectant les standards internationaux comme ISAD(G) et EAD 2002. Cela a inclus la génération de description détaillée, la création de fichier XML compatibles avec le logiciel d’archivage AtoM et l’importation des métadonnées de manière systématique.

Les fichiers utilisés pour cette expérience comprenaient plusieurs (deux) documents de correspondance administrative relatifs à une Institution d’archives fictive dénommée Atlantis et décrite en ISDIAH dans ma propre instance d’AtoM. J’ai exploité diverses fonctionnalités de ChatGPT pour analyser les fichiers, en extraire le contenu pertinent et structurer des descriptions archivistiques professionnellement standardisées. Ce processus a permis de créer des fichiers EAD 2002 et CSV importables dans AtoM, tout en facilitant la liaison entre différents niveaux de description dans l’institution archivistique fictive.

atlantis_archives_home

Étapes principales de la démarche

1. Utilisation de ChatGPT pour la description ISAD(G)

Les archivistes doivent maîtriser la norme ISAD(G), qui est la base de toute description archivistique. ChatGPT a été donc utilisé pour analyser les deux documents pour en extraire des métadonnées ISAD(G) plus ou moins complètes :

Cote : identifiant unique pour chaque document.
Titre : titre complet du document.
Dates : date de création du document ou de l’événement relaté.
Niveau de description : niveau hiérarchique (fonds, série, sous-série, pièce).
Portée et contenu : résumé détaillé du contenu.
Nom du producteur : entité ou personne ayant créé le document.
Contexte de la conservation : informations sur la provenance et l’historique du document.
Conditions d’accès : spécificités de consultation (libre ou restreinte).
Sources complémentaires : références et documents connexes.

Cette structuration a été effectuée de manière automatisée, ce qui montre à quel point l’IA peut être utile pour les archivistes, en leur permettant de gagner du temps sur des tâches de traitement documentaire répétitives.

2. Création de fichiers EAD 2002 pour l’import dans AtoM

L’étape suivante consistait à transformer ces descriptions en fichiers XML conformes à la norme EAD 2002, utilisée donc pour l’encodage des descriptions archivistiques. Dans ce contexte, nous avons rédigé un script pour générer un fichier XML structuré de la manière suivante :

Élément racine <ead> : contenant global des métadonnées.
En-tête <eadheader> : informations sur le fichier lui-même (titre, auteur).
Description du fonds <archdesc> : description générale du fonds (niveau de Fonds).
Description hiérarchique <dsc> : contenant les différents niveaux de description (séries, sous-séries,…,pièces).

description_sous-serie_item

Chaque document a été décrit individuellement avec ses informations propres. Les archivistes, comme tout autres professionnels de la documentation d’ailleurs, doivent se former à la manipulation de XML pour créer et surtout pouvoir modifier (corriger, ajuster, compléter) ses fichiers, car ce langage est essentiel pour interagir avec des systèmes professionnels comme AtoM et la quasi-totalité des logiciels documentaires courants. Une bonne maîtrise de EAD et de ses balises permet également de garantir l’interopérabilité des données archivistiques entre différentes plateformes.

3. Intégration et importation dans AtoM

L’importation de ces fichiers dans AtoM se fait via l’interface d’administration :

Se connecter avec un compte administrateur.
Aller dans Administration > Import. Deux options possibles ici.
- Utiliser l’icône d’import à partir du menu de navigation : idéal si l’on décrit une collection à partir de Zéro (Niveau Fonds)
- Utiliser le lien d’import sur la barre latérale de droite : idéal si on veut ajouter des descriptions de niveau inférieur (Série, sous-série, dossier, pièce) à un fonds déjà décrit. Ce qui est le cas pour notre exemple.
Sélectionner le fichier XML EAD généré.
Vérifier les options d’importation, notamment pour gérer les conflits potentiels ou les doublons.
Cliquer sur Importer et attendre la confirmation de la réussite de l’opération.

Cette étape est très importante pour assurer la cohérence de la base de données archivistique, car AtoM utilise les informations contenues dans le fichier EAD pour créer la hiérarchie des descriptions. D’où la nécessité de bien coder la description avec les balises qui permettent, notamment, de délimiter les niveaux de description (<archdesc> et <dsc><c>).

Résultat après importation

La première image ci-dessous montre la description hiérarchique initiale avec seulement deux sous-séries pour la série « SA – Service administratif »

serie_service_administratif

La suivante présente la même série, mais avec ajout par importation XML EAD 2002 d’une troisième sous-série « Correspondance administrative » et les descriptions de ses deux pièces à un niveau inférieur. Cela se conforme à la capture d’écran du code XML affiché plus haut dans ce document.

sous-serie_correspondance administrative

Pourquoi les archivistes et corps assimilés doivent maîtriser XML et EAD ?

La gestion archivistique devient de plus en plus numérique (c’est une lapalissade) et l’utilisation de formats comme XML est aujourd’hui incontournable. Voici quelques raisons pour lesquelles les archivistes, en début de carrière surtout, devraient se pencher sérieusement sur l’apprentissage de ces technologies :

Interopérabilité : les fichiers XML EAD peuvent être échangés entre différentes institutions, facilitant ainsi la collaboration et le partage d’informations.
Automatisation : un archiviste compétent en XML peut automatiser le processus de description, ce qui réduit les erreurs manuelles (aspect qualitatif) tout en accroissant quantitativement sa productivité professionnelle.
Intégration de l’IA : l’utilisation d’outils comme les LLM pour générer des fichiers XML montre qu’une bonne maîtrise de ces langages permet de tirer parti des technologies émergentes. Toutefois, il faut d’abord personnellement comprendre la logique de structuration du balisage pour pouvoir améliorer les rendus issus du LLM et/ou de les adapter.
Adaptabilité : la compréhension de EAD ouvre la porte à l’utilisation d’autres standards (Dublin Core, MARCXML, MODS, METS…) et vice-versa, élargissant ainsi les possibilités professionnelles.

Il est donc fortement recommandé de s’y former, car ces compétences offrent une véritable plus-value dans le cadre de la gestion documentaire et archivistique en particulier. Vous pouvez suivre des cours en ligne, utiliser des tutoriels spécifiques à AtoM, ou participer à des ateliers de formation continue. Les gains en efficacité et la qualité des descriptions archivistiques, bibliographiques ou muséographiques s’en ressentiront immédiatement. Je partage d’ailleurs un modèle de présentation pratique des différents champs d’EAD, de leur balise XML correspondante et de leur équivalent en MARC 21, car autant EAD a une vocation initiale archivistique, autant elle est utilisable en bibliothèque pour décrire des documents patrimoniaux notamment.

L	M	M	J	V	S	D
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

	Les bibliothèques pu… dans N° 110 – L’intelligence…
	amonnoyeur dans N° 110 – L’intelligence…
	Alkhna DRAME dans N° 103 – Intelligence artifici…
	Veille et sensibilis… dans N° 103 – Intelligence artifici…
	A. B. DIOUF dans N° 98 – Discours sur la…

L	M	M	J	V	S	D
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

	Les bibliothèques pu… dans N° 110 – L’intelligence…
	amonnoyeur dans N° 110 – L’intelligence…
	Alkhna DRAME dans N° 103 – Intelligence artifici…
	Veille et sensibilis… dans N° 103 – Intelligence artifici…
	A. B. DIOUF dans N° 98 – Discours sur la…

Partager :

Articles similaires

Laisser un commentaire Annuler la réponse.