La transcription
La transcription des corpus ESLOs est une transcription zéro que nous considérons comme une première annotation prévue pour une simple navigation dans le signal de parole. Ce choix est guidé par un double objectif : transcrire vite une grande quantité d’enregistrements et limiter l’impact de la transcription sur les analyses.
Les conventions de transcription répondent, par ailleurs, à une contrainte forte d’interopérabilité : pouvoir être utilisable par tout chercheur quel que soit son objet d’étude. En ce sens, il s’agit d’une transcription orthographique, accompagnée de quelques phénomènes propres à l’oral tels que les répétions, les amorces, etc. (pour en savoir plus : voir les conventions de transcription dans le document « Guide du transcripteur/relecteur » GUIDE_TRANSCRIPTEUR_V4_mai2013).
Les transcriptions sont synchronisées au son à l’aide du logiciel Transcriber, qui permet une segmentation à plusieurs niveaux : des sections, des locuteurs, des tours de paroles.
Chaque enregistrement dispose de trois versions de transcription, toutes sont conservées :
- Première version (version A, version brute)
- Deuxième version (version B, version relue) : relecture/correction de la version A
- Troisième version (version C, version validée) : relecture/correction de la version B
Seules les troisièmes versions sont accessibles à l’ensemble des utilisateurs de la base de données. Pour accéder aux deux premières versions, il est nécessaire de signer une convention et d’en faire la demande à l’administrateur du site, par le biais de l’adresse suivante : Cette adresse e-mail est protégée contre les robots spammeurs. Vous devez activer le JavaScript pour la visualiser.
Une procédure qui prend en compte les tâches inhérentes à la transcription a été élaborée. Elle a pour objectif de répartir ces tâches entre les trois versions afin de limiter le nombre d’actions à effectue. On peut représenter cela de la façon suivante (pour en savoir plus : voir les procédures de transcription, relecture, validation dans le document « Guide du transcripteur/relecteur » ( GUIDE_TRANSCRIPTEUR_V4_mai2013) :
Evaluation du temps de transcription :
- Version A : durée d’enregistrement multipliée par 10
- Version B : durée d’enregistrement multipliée par 5
- Version C : durée d’enregistrement multipliée par 5
Conventions/guides/formations
Plusieurs versions de guides du transcripteur/relecteur ont été élaborées dans le but de fournir les informations utiles à la manipulation du logiciel Transcriber d’une part, et de donner les conventions de transcription propre au projet ESLO. Les différentes versions correspondent à des périodes au cours desquelles des modifications ont été apportées aux méthodes de transcription :
Guide du transcripteur/relecteur :
- version 1 - mai 2008 ( GUIDE_TRANSCRIPTEUR_V1_mai2008)
- version 2 – février 2010 ( GUIDE_TRANSCRIPTEUR_V2_Fevrier2010)
- version 3 - juin 2011 ( GUIDE_TRANSCRIPTEUR_V3_juin2011)
- version 4 - mai 2013 ( GUIDE_TRANSCRIPTEUR_V4_mai2013)
Les guides sont assortis d’un Lexique ESLO qui recense les choix orthographiques pris sur des termes qui ne figurent pas dans le dictionnaire, sur certains noms propres, etc. Ce lexique est alimenté au fur et à mesure des difficultés rencontrées par les transcripteurs.
Lexique ESLO du 5 mai 2014 : Lexique ESLO