L’archivage du corpus ESLO

 

La conservation et la pérennisation du corpus ESLO se fait dans le cadre des missions du Ministère de la Culture (BnF et Service Interministériel des Archives de France) et du Ministère de l’Enseignement Supérieur et de la Recherche (CNRS, Très Grande Infrastructure de Recherche Huma-Num). Il est assuré par le service des archives sonores du département de l’audiovisuel de la BnF et le projet COCOON « COllections de COrpus Oraux Numériques » (http://cocoon.huma-num.fr/) en lien avec la TGIR Huma-Num (http://www.huma-num.fr/).

Le rôle de la BnF

Les bandes originales et la documentation ESLO1 ont été données au service des archives sonores de la BnF qui en assure la conservation, la numérisation, la description et l’accès local. Ce fonds est décrit par un instrument de recherche en EAD (Encoded Archival Description) faisant partie du catalogue Archives et manuscrits. http://archivesetmanuscrits.bnf.fr/ead.html?id=FRBNFEAD000095934

Le corpus ESLO2 qui est nativement numérique, sera également versé à la BnF dès la stabilisation d’une première version. Ce don donnera lieu à un traitement similaire à celui d’ESLO1 (pérennisation des versions numériques, description et accès).

L’archivage scientifique

COCOON, en lien avec la TGIR Huma-Num et en coordination avec la BnF, assure le pilotage de l’archivage des ressources qui ont servi à la recherche scientifique (les versions numérisées des enregistrements, les transcriptions qui en ont été faites ainsi que les métadonnées qui accompagnent ces 2 types de ressources).

Description du transfert des données d'ESLO vers COCOON

L'application développée pour la gestion du corpus ESLO permet aux chercheurs qui participent à son élaboration et à son enrichissement de travailler au quotidien sur les données. Pour chaque ressource (enregistrement ou transcription) et suivant son état d'avancement, le gestionnaire du projet peut déclencher une validation qui va figer l'état d'une version de la ressource. La validation entraîne la création par l'application d'un paquet d'information (données accompagnées de métadonnées) qui, une fois constitué, sera récupéré par l'entrepôt COCOON qui prendra alors le relais de la gestion de la ressource.

COCOON récupère une fois par jour les paquets d'information préparés par l'application ESLO. Si la récupération d'un paquet se déroule correctement (contrôles de bonne formation des fichiers et de complétude des informations), la ressource correspondante vient alimenter l'entrepôt de COCOON et l'application ESLO change son statut pour signaler son archivage et empêcher toute modification ultérieure. 

COCOON, lors de la prise en charge d'une ressource, veille en particulier à :

  • affecter des identifiants pérennes permettant de la citer ;
  • dériver à partir du format d'origine, d'autres formats plus adaptés à une diffusion web ;
  • donner accès aux métadonnées à travers le protocole de moissonnage de l'OAI ;
  • donner accès aux données à travers des URL et des interfaces web de consultation ;
  • référencer ces informations sur des plateformes communautaires et en particulier auprès d'Isidore qui assure par la suite leur ré-exposition dans le « linked open data » et offre un moteur de recherche sur l'ensemble des ressources moissonnées dans le domaine des sciences humaines et sociales (http://www.rechercheisidore.fr/) ;
  • conserver les informations de manière pérenne en les confiant au système d'archivage d'Huma-Num qui les conservera sur la plateforme du CINES avant de les verser, à terme, aux archives nationales.