Corpus ESLO >Accéder au corpus > Ecouter l'enregistrement

ch_GB9: écouter
euh bon donc je vais m'en passer
ch_GB9: écouter
je vais présenter mon travail en trois grandes parties donc quatre parce que
ch_GB9: écouter
[pi:pronounce:instantaneous]
ch_GB9: écouter
euh la première partie va euh
ch_GB9: écouter
[b:noise:instantaneous] s'intituler d'abord
ch_GB9: écouter
va revenir sur
ch_GB9: écouter
le type de données sur lesquelles nous sommes amenés à travailler
ch_GB9: écouter
quand nous faisons de la linguistique
ch_GB9: écouter
le l'objet sur lequel nous travaillons puisqu'on est parti à faire des citations littéraires
ch_GB9: écouter
le nôtre il est plus léger plus soluble dans l'air ça revient dans
ch_GB9: écouter
[pi:pronounce:instantaneous]
ch_GB9: écouter
euh
ch_GB9: écouter
on travaille sur un élément qui est pour nous essentiel qui est la parole
ch_GB9: écouter
euh le discours tel qu'on peut l'entendre
ch_GB9: écouter
et vous le savez son énorme problème
ch_GB9: écouter
c'est que c'est bien notre matériau
ch_GB9: écouter
mais ce matériau-là a un inconvénient terrible
ch_GB9: écouter
c'est que dès qu'on a fini de parler
ch_GB9: écouter
on a tout oublié
ch_GB9: écouter
nous vérifions chaque année au moment des partiels avec nos étudiants
ch_GB9: écouter
donc premier type de problème
ch_GB9: écouter
on a bien un matériau qui est facilement accessible
ch_GB9: écouter
mais euh qui en quantité à peu près illimité
ch_GB9: écouter
mais en même temps il est extrêmement difficile
ch_GB9: écouter
euh d'en conserver une présence
ch_GB9: écouter
on a ensuite un deuxième état qui lui est plus stable heureusement
ch_GB9: écouter
euh c'est la façon dont notre langue est présente
ch_GB9: écouter
dans notre cerveau
ch_GB9: écouter
elle est présente sous différentes formes
ch_GB9: écouter
à la fois sous la forme de ce qu'on appelle l-
ch_GB9: écouter
le discours intérieur ou la parole intérieure
ch_GB9: écouter
le fait qu'on se parle à soi-même tout le temps
ch_GB9: écouter
elle est aussi présente sous la forme de ce qu'on appelle le stock lexical
ch_GB9: écouter
les les familles de mots trente mille mots que nous avons en tête
ch_GB9: écouter
dont à peu près cinq mille marques commerciales aujourd'hui
ch_GB9: écouter
[b:noise:instantaneous]
ch_GB9: écouter
[pi:pronounce:instantaneous]
ch_GB9: écouter
[rire en fond:noise:instantaneous]
ch_GB9: écouter
avec euh le développement de l'économie
ch_GB9: écouter
donc on a ce ce stock qui est présent
ch_GB9: écouter
mais lui présente un défaut très lourd
ch_GB9: écouter
c'est en particulier lui qui nous intéresse en tant que linguistes
ch_GB9: écouter
c'est moins les propos qu'on tient et qu'on dit
ch_GB9: écouter
que ce qui en reste dans la tête des gens
ch_GB9: écouter
mais vous le savez cet élément-là lui a un énorme inconvénient
ch_GB9: écouter
il n'est pas directement observable et accessible
ch_GB9: écouter
et même si on attrape des gens et qu'on les
ch_GB9: écouter
[pi:pronounce:instantaneous] on sait faire
ch_GB9: écouter
euh y a rien dans le cerveau qui va nous indiquer
ch_GB9: écouter
par exemple quelle quelle était la langue que parlait quelqu'un
ch_GB9: écouter
on a aujourd'hui aucun moyen si on nous présente des cerveaux
ch_GB9: écouter
de dire tiens euh vous m'avez encore amené un Chinois
ch_GB9: écouter
c'est impossible avec les éléments que nous avons en tout cas aujourd'hui d'observation
ch_GB9: écouter
d'avoir la moindre prédiction sur ce qu'il y a
ch_GB9: écouter
comment ça se passe dans le cerveau
ch_GB9: écouter
si on prend le fait qu'un élément qui
ch_GB9: écouter
s'évanouit en permanence la parole
ch_GB9: écouter
si on prend le fait qu'on a un élément non observable
ch_GB9: écouter
pour constituer un savoir sur la langue il a fallu quelque chose qui ne s-
ch_GB9: écouter
qui soit observable
ch_GB9: écouter
et qui soit un peu plus permanent
ch_GB9: écouter
cette chose-là nous la connaissons
ch_GB9: écouter
ça s'appelle l'écriture
ch_GB9: écouter
c'était une invention bah évidemment décisive dans l'histoire de l'humanité
ch_GB9: écouter
et pendant très longtemps on a
ch_GB9: écouter
confondu
ch_GB9: écouter
l'étude des langues avec l'étude
ch_GB9: écouter
de
ch_GB9: écouter
manifestations écrites des langues
ch_GB9: écouter
et comme le dit Saussure
ch_GB9: écouter
euh Saussure est
ch_GB9: écouter
le nom que nous citons à chaque fois avec faveur et un léger trémolo dans la voix
ch_GB9: écouter
c'est notre espèce de gourou à nous
ch_GB9: écouter
euh comme le dit Saussure euh
ch_GB9: écouter
c'est un petit peu comme si on prétendait étudier l'anatomie
ch_GB9: écouter
en regardant des portraits au musée du Louvre
ch_GB9: écouter
évidemment on peut en déduire quelque chose
ch_GB9: écouter
mais c'est pas exactement ça
ch_GB9: écouter
un corps humain
ch_GB9: écouter
lorsqu'on représente
ch_GB9: écouter
[tx:noise:instantaneous]
ch_GB9: écouter
une forme
ch_GB9: écouter
[tx:noise:instantaneous]
ch_GB9: écouter
on a
ch_GB9: écouter
euh longtemps été
ch_GB9: écouter
bloqué par ce
ch_GB9: écouter
par ce type de démarche
ch_GB9: écouter
et euh on n'a pas pu facilement avancer
ch_GB9: écouter
même si on a eu quand même un certain nombre de de progrès dans ce domaine
ch_GB9: écouter
mais on a fini par confondre
ch_GB9: écouter
ce qui était l'étude
ch_GB9: écouter
de la langue écrite
ch_GB9: écouter
et l'étude
ch_GB9: écouter
de la langue
ch_GB9: écouter
en oubliant que le fait que cette langue soit écrite
ch_GB9: écouter
entraîne on le verra un certain nombre de propriétés très particulières
ch_GB9: écouter
qui sont objectivement très trompeuses
ch_GB9: écouter
par rapport à nous
ch_GB9: écouter
je vais juste en donner un exemple
ch_GB9: écouter
la vraie révolution pour nous en linguistique
ch_GB9: écouter
ça a été l'émergence
ch_GB9: écouter
de l'étude du son
ch_GB9: écouter
du son des langues
ch_GB9: écouter
or typiquement si vous travaillez sur des textes écrits c'est quelque chose de
ch_GB9: écouter
pas inutile certes mais de pas très utile
ch_GB9: écouter
lorsqu'on lit des textes on peut les lire avec un accent épouvantable
ch_GB9: écouter
n'importe qui ici parmi nous
ch_GB9: écouter
sauf quelques rares collègues dispersés dans la salle lisant de l'anglais
ch_GB9: écouter
nous en donnerait une démonstration euh
ch_GB9: écouter
on sait très bien que ça n'empêche pas ni
ch_GB9: écouter
[toux en fond:noise:instantaneous]
ch_GB9: écouter
[pi:pronounce:instantaneous] spécialement la compréhension
ch_GB9: écouter
ni en tout cas la compréhension de la personne qui lit
ch_GB9: écouter
ces écrits euh se sont euh bien sûr accumulés
ch_GB9: écouter
euh
ch_GB9: écouter
[tx:noise:instantaneous]
ch_GB9: écouter
jusqu'au dix-neuvième siècle on s'est posé la question
ch_GB9: écouter
est-ce qu'il y a finalement une vraie différence
ch_GB9: écouter
entre ce que nous appelons aujourd'hui un linguiste et ce qu'on appelle un philologue ?
ch_GB9: écouter
quelqu'un qui étudie les textes
ch_GB9: écouter
et très longtemps nous avons pu passer euh
ch_GB9: écouter
horresco referens tamen refero
ch_GB9: écouter
euh pour des espèces de sciences annexes de l'histoire
ch_GB9: écouter
euh les historiens avaient ces textes
ch_GB9: écouter
je dirais qu'ils en avaient l'interprétation
ch_GB9: écouter
et nous étions
ch_GB9: écouter
convoqués pour les aider à élucider tel élément
ch_GB9: écouter
[toux en fond:noise:instantaneous] de langue
ch_GB9: écouter
qui aurait pu euh leur être obscur
ch_GB9: écouter
mais lorsque les historiens travaillent les textes
ch_GB9: écouter
ils ont une petite couche qui les intéresse pas que j'ai déjà mentionnée
ch_GB9: écouter
qui est la façon dont le texte se prononce
ch_GB9: écouter
et c'est sur c-
ch_GB9: écouter
ça les intéresse très peu ils ont donc très peu à faire
ch_GB9: écouter
et sur cette très beau
ch_GB9: écouter
très mince frange
ch_GB9: écouter
euh qui n'intéressait pas les historiens
ch_GB9: écouter
qu'est apparue la linguistique au tout début du dix-neuvième siècle en mille huit cent seize
ch_GB9: écouter
lorsqu'on s'est aperçu que cet élément euh sonore
ch_GB9: écouter
[porte:noise:instantaneous]
ch_GB9: écouter
avait comme particularité qu'il se retrouvait même si c'est sous des formes transformées
ch_GB9: écouter
à travers un certain nombre de langues
ch_GB9: écouter
et euh
ch_GB9: écouter
ça a été le début de ce qu'on a appelé la grammaire comparée des langues indo-européennes
ch_GB9: écouter
qui ont fondé la première marque de linguistique
ch_GB9: écouter
les autres révolutions qui nous sont arrivées sont deux
ch_GB9: écouter
euh
ch_GB9: écouter
et c'est sur celles-ci que aujourd'hui nous avons un autre regard et un autre rapport
ch_GB9: écouter
euh sur la linguistique et en particulier dans notre laboratoire
ch_GB9: écouter
le premier c'est en mille huit cent soixante-dix-sept lorsque Edison réussit
ch_GB9: écouter
à imprimer sur une plaque de cire
ch_GB9: écouter
que Marie a un petit ami
ch_GB9: écouter
en anglais dans la langue originale
ch_GB9: écouter
donc enregistre pour sa fille pour la première fois une chanson
ch_GB9: écouter
et euh l'histoire se continuera
ch_GB9: écouter
avec notre ami euh Nipper que tout le monde connaît ici
ch_GB9: écouter
c'est le petit chien de la voix de son maître
ch_GB9: écouter
euh qui euh va porter cette idée
ch_GB9: écouter
que désormais le l'oral la parole
ch_GB9: écouter
est devenue quelque chose qu'on peut rendre permanent
ch_GB9: écouter
ça commence certain temps à avoir des techniques de plus en plus souples
ch_GB9: écouter
mais l'idée qu'il y a de la permanence de la parole
ch_GB9: écouter
entre l'observation directe
ch_GB9: écouter
possible
ch_GB9: écouter
de quelque chose qui n'est pas écrit
ch_GB9: écouter
c'est une révolution qui ne nous appartient pas
ch_GB9: écouter
qui vient euh de la physique
ch_GB9: écouter
[pi:pronounce:instantaneous] électrique
ch_GB9: écouter
la la
ch_GB9: écouter
lorsqu'on a obtenu ceci
ch_GB9: écouter
on a obtenu très rapidement
ch_GB9: écouter
des milliers des dizaines de milliers des centaines de milliers d'heures d'enregistrements
ch_GB9: écouter
et là s'est posé le deuxième problème
ch_GB9: écouter
c'est que lorsque vous avez toutes ces heures d'enregistrements
ch_GB9: écouter
comment fait-on pour les maîtriser ?
ch_GB9: écouter
pour savoir ce qu'il y a dans une heure d'enregistrement
ch_GB9: écouter
il faut une heure d'écoute
ch_GB9: écouter
si vous voulez savoir ce qu'il y a dans cent heures il faut cent heures d'écoute
ch_GB9: écouter
et au bout de la centième heure
ch_GB9: écouter
vous avez complètement oublié ce qu'il y avait dans la première
ch_GB9: écouter
donc on a eu besoin d'un deuxième outil
ch_GB9: écouter
il est pas venu
ch_GB9: écouter
là non plus de la linguistique
ch_GB9: écouter
mais dont nous
ch_GB9: écouter
servons très largement qui est l'informatique
ch_GB9: écouter
qui va nous servir on va le voir comment
ch_GB9: écouter
à dominer à maîtriser des données qui sinon
ch_GB9: écouter
nous euh
ch_GB9: écouter
dépassent complètement
ch_GB9: écouter
et sur lesquelles nous ne pouvons pas avoir de maîtrise
ch_GB9: écouter
voilà pour le la présentation de notre problème et
ch_GB9: écouter
pour le Laboratoire Ligérien de Linguistique
ch_GB9: écouter
nous avons euh investi dans ce champ-là
ch_GB9: écouter
à travers une notion que nous appelons des corpus oraux
ch_GB9: écouter
donc notre problème n'est pas de travailler sur des enregistrements
ch_GB9: écouter
des enregistrements il y en a des milliards d'heures aujourd'hui disponibles
ch_GB9: écouter
chaque jour sur Youtube
ch_GB9: écouter
il doit s'en mettre quelques milliers des dizaines de milliers supplémentaires
ch_GB9: écouter
on ne sait plus quoi faire des enregistrements
ch_GB9: écouter
et c'est là qu'arrive le linguiste
ch_GB9: écouter
[toux en fond:noise:instantaneous] donc ce ne sont plus des corpus
ch_GB9: écouter
oraux
ch_GB9: écouter
mais vu l'utilité que nous avons
ch_GB9: écouter
ce sont des corpus
ch_GB9: écouter
oraux
ch_GB9: écouter
[zoraux:pronounce:instantaneous] nous venons sauver la situation en disant
ch_GB9: écouter
[rire en fond:noise:instantaneous]
ch_GB9: écouter
nous avons les moyens
ch_GB9: écouter
oui c'est de l'oral
ch_GB9: écouter
[pi:pronounce:instantaneous] faire parler
ch_GB9: écouter
donc
ch_GB9: écouter
[pi:pronounce:instantaneous] vous faire parler
ch_GB9: écouter
euh
ch_GB9: écouter
nous allons
ch_GB9: écouter
euh proposer des solutions
ch_GB9: écouter
à notre manière
ch_GB9: écouter
pour
ch_GB9: écouter
euh essayer de voir comment
ch_GB9: écouter
on peut maîtriser ce champ-là
ch_GB9: écouter
comme est maîtrisé euh
ch_GB9: écouter
dans le champ déjà de la bibliothèque du
ch_GB9: écouter
[pi:pronounce:instantaneous]
ch_GB9: écouter
avec les études sur le livre
ch_GB9: écouter
comme on a mis
ch_GB9: écouter
très progressivement au point des techniques
ch_GB9: écouter
qui nous permettent
ch_GB9: écouter
en gros de savoir ce qu'il y a dans un livre sans jamais le lire
ch_GB9: écouter
ça aussi nos étudiants savent faire
ch_GB9: écouter
euh et bien de la même manière
ch_GB9: écouter
on va essayer de trouver une technique
ch_GB9: écouter
qui nous permettrait
ch_GB9: écouter
de
ch_GB9: écouter
d'identifier le plus rapidement possible ce qu'il peut y avoir
ch_GB9: écouter
dans des données orales
ch_GB9: écouter
[toux en fond:noise:previous]
ch_GB9: écouter
sans être obligé de les réécouter systématiquement
ch_GB9: écouter
ou de telle manière qu'on puisse aller comme il y a un index dans les livres
ch_GB9: écouter
aller chercher l'information exactement là où elle est
ch_GB9: écouter
très rapidement
ch_GB9: écouter
pour cela il nous faut construire des objets d'observation
ch_GB9: écouter
d'ailleurs on ne se contente pas d'aller récupérer des heures d'enregistrements
ch_GB9: écouter
et de dire bon bah on va voir ce qu'on peut en faire
ch_GB9: écouter
on va constituer
ch_GB9: écouter
des outils qu'on va
ch_GB9: écouter
je vais vous le dire par la suite
ch_GB9: écouter
qui est ce que l'on appelle
ch_GB9: écouter
des corpus oraux
ch_GB9: écouter
alors si on dit des corpus oraux
ch_GB9: écouter
euh ça veut dire que c'est pas exactement de simples enregistrements
ch_GB9: écouter
ça veut dire qu'ils ont
ch_GB9: écouter
des propriétés
ch_GB9: écouter
des propriétés qui vont nous servir à
ch_GB9: écouter
être opératoires sur d'abord
ch_GB9: écouter
des langues qui n'ont pas d'écriture
ch_GB9: écouter
notre problème n'est pas spécialement d'étudier des langues à écriture
ch_GB9: écouter
je vous l'ai même dit ça a été longtemps un obstacle pour nous
ch_GB9: écouter
notre problème est au contraire d'étudier des langues sans écriture
ch_GB9: écouter
des langues sans écriture aujourd'hui
ch_GB9: écouter
pour aller très vite on estime
ch_GB9: écouter
c'est des
ch_GB9: écouter
c'est à prendre avec toutes les précautions d'usage
ch_GB9: écouter
on estime qu'il y a à peu près sept mille langues sur Terre
ch_GB9: écouter
on estime qu'il y en a au moins cinq mille
ch_GB9: écouter
qui ne sont pas transcrites ou pas transcrites d'une façon
ch_GB9: écouter
[b:noise:instantaneous] accessible satisfaisante correcte
ch_GB9: écouter
c'est-à-dire qu'il peut y en avoir qui ont été transcrites comme ça
ch_GB9: écouter
par quelqu'un qui s'est essayé
ch_GB9: écouter
avec un alphabet latin
ch_GB9: écouter
à transcrire sa propre langue
ch_GB9: écouter
mais pour que ce soit à peu près utilisable
ch_GB9: écouter
on estime donc qu'il y a déjà aujourd'hui cinq mille langues à peu près
ch_GB9: écouter
dont la plupart extrêmement menacées
ch_GB9: écouter
plusieurs centaines dont moins de vingt personnes qui les parlent
ch_GB9: écouter
donc ce sont déjà
ch_GB9: écouter
des langues demain mortes
ch_GB9: écouter
une langue à vingt personnes a à peu près aucune chance aujourd'hui d'être d'être sauvée
ch_GB9: écouter
ça va servir aussi pour repérer
ch_GB9: écouter
euh ce que sont les éléments dans les langues
ch_GB9: écouter
qui ne sont pas observables
ch_GB9: écouter
par les écritures
ch_GB9: écouter
tout à l'heure j'écoutais Bernard Gratuze
ch_GB9: écouter
co- mais comme j'écoute jamais
ch_GB9: écouter
ce que ra- disent les gens mais justement la façon dont ils le disent
ch_GB9: écouter
c'est pour ça que j'ai toujours l'air d'écouter
ch_GB9: écouter
euh
ch_GB9: écouter
tout à l'heure Bernard Gratuze par exemple nous a d- nous a parlé de l'arsenic
ch_GB9: écouter
[arsnic:pronounce:instantaneous]
ch_GB9: écouter
bon
ch_GB9: écouter
E hein y a un E mais il ne l'a pas réalisé
ch_GB9: écouter
euh hm
ch_GB9: écouter
Jean Garrigues vous l'avez peut-être noté
ch_GB9: écouter
euh parle comme à Sciences Po
ch_GB9: écouter
il met toujours l'accent tonique sur la première syllabe
ch_GB9: écouter
hé bien si on a le texte de Bernard euh Gratuze ou celui de Jean Garrigues
ch_GB9: écouter
on n'aura aucun moyen savoir que euh
ch_GB9: écouter
Jean Guar- euh Bernard Gratuze ne prononce pas le E
ch_GB9: écouter
muet
ch_GB9: écouter
[pi:pronounce:instantaneous] de l'arsenic
ch_GB9: écouter
et euh que Jean Garrigues accentue sur la première
ch_GB9: écouter
mais néanmoins n'allonge pas la longueur de la voyelle
ch_GB9: écouter
euh comment on pourrait s'y attendre dans ce cas-là
ch_GB9: écouter
il continue bien à garder l'allongement sur la dernière syllabe
ch_GB9: écouter
ces indications-là vous n'avez aucun moyen de les repérer
ch_GB9: écouter
sur des textes écrits aucun
ch_GB9: écouter
euh
ch_GB9: écouter
c'est ce on ne l'indique pas tout simplement
ch_GB9: écouter
de même qu'on n'indique pas que à tel moment la voix a pu trembler
ch_GB9: écouter
ou qu'elle est pu être en maximum
ch_GB9: écouter
en accélération
ch_GB9: écouter
tous ces éléments-là nous pourtant on veut les préserver
ch_GB9: écouter
et on veut les préserver pour en faire une étude scientifique
ch_GB9: écouter
dans des corpus oraux
ch_GB9: écouter
alors qu'est-ce qu'on appelle le corpus ?
ch_GB9: écouter
c'est ce sont des enregistrements
ch_GB9: écouter
évidemment de toute façon
ch_GB9: écouter
y a pas d'autres solutions autrefois
ch_GB9: écouter
on a commencé je vous l'ai dit avec des rouleaux on a fait ensuite sur de la cire
ch_GB9: écouter
y a eu le moment où y avait les fils magnétiques
ch_GB9: écouter
avant les bandes magnétiques c'est du fil en métal
ch_GB9: écouter
euh y a eu un très grand nombre de
ch_GB9: écouter
[pi:pronounce:instantaneous] y a eu les disques sur vinyle y a euh
ch_GB9: écouter
aujourd'hui c'est des enregistrements numériques évidemment
ch_GB9: écouter
c'est des enregistrements qu'on essaie d'avoir dans une qualité le plus supportable possible
ch_GB9: écouter
après on fait pas toujours dans l'idéal vous imaginez
ch_GB9: écouter
si nous enregistrons ici les bruits de porte de retardataire bonjour
ch_GB9: écouter
qui arrive et cetera
ch_GB9: écouter
donc tous ces petits problèmes que nous pouvons avoir lorsqu'il y a de de l'enregistrement
ch_GB9: écouter
euh
ch_GB9: écouter
on a ensuite
ch_GB9: écouter
des principes de représentativité
ch_GB9: écouter
il nous faut des éléments les plus divers possibles
ch_GB9: écouter
on verra que c'est une clause qui n'a pas été très tôt respectée
ch_GB9: écouter
il faut que ces éléments soient exploitables
ch_GB9: écouter
de façon non destructive ça nos camarades savent faire
ch_GB9: écouter
euh mais euh non seulement de façon non
ch_GB9: écouter
non destructive mais comment dire avec un affreux anglicisme de façon versatile
ch_GB9: écouter
c'est-à-dire que
ch_GB9: écouter
y a au fond c'est mieux si ça peut servir aussi
ch_GB9: écouter
à des sociologues à des historiens à des économistes
ch_GB9: écouter
et pas seulement à des linguistes qui veulent étudier
ch_GB9: écouter
la forme de la langue
ch_GB9: écouter
on souhaite qu'ils soient
ch_GB9: écouter
catalogués dans un format qui soit accessible
ch_GB9: écouter
et là on n'est pas au bout de nos peines
ch_GB9: écouter
on a organisé ici y a trois ans un
ch_GB9: écouter
premier euh
ch_GB9: écouter
colloque international de Catcod catalogage codage
ch_GB9: écouter
sur les corpus oraux
ch_GB9: écouter
et on a du mal à faire le deuxième
ch_GB9: écouter
parce que on s'est déjà tous tellement disputé qu'on ne sait plus comment
ch_GB9: écouter
se remettre
ch_GB9: écouter
[pi:pronounce:instantaneous]
ch_GB9: écouter
[rire en fond:noise:instantaneous]
ch_GB9: écouter
ensuite
ch_GB9: écouter
euh et ça c'est et de loin le plus long
ch_GB9: écouter
il faut transcrire
ch_GB9: écouter
euh tout ça
ch_GB9: écouter
parce que quoi qu'on en pense on ne sait pas aujourd'hui
ch_GB9: écouter
chercher un mot dans un enregistrement
ch_GB9: écouter
on peut espérer le retrouver
ch_GB9: écouter
on peut avoir
ch_GB9: écouter
certaines chances selon la qualité de l'enregistrement de le repérer
ch_GB9: écouter
mais si on prend un enregistrement de deux heures
ch_GB9: écouter
[b:noise:instantaneous] et on veut savoir si quelqu'un dedans a prononcé
ch_GB9: écouter
n'importe quoi mettons Mélenchon
ch_GB9: écouter
euh
ch_GB9: écouter
si on veut savoir si quelqu'un a dit Mélenchon
ND454: écouter
par exemple
ch_GB9: écouter
hm par exemple
ch_GB9: écouter
[rire en fond:noise:instantaneous]
ch_GB9: écouter
[conv:noise:instantaneous]
VD276: écouter
au hasard
VD276: écouter
[conv:noise:instantaneous]
ch_GB9: écouter
on risque d'avoir euh
ch_GB9: écouter
une difficulté
ch_GB9: écouter
parce que Mélenchon
ch_GB9: écouter
n'est pas un terme suffisamment caractéristique en français
ch_GB9: écouter
pour se distinguer
ch_GB9: écouter
euh de son contexte
ch_GB9: écouter
et on risque de sortir tout un tas de formes du type mélangeons enfin et cetera
ch_GB9: écouter
qui sont beaucoup trop proches phonétiquement
ch_GB9: écouter
donc on va être obligé de transcrire et ça c'est atrocement long
ch_GB9: écouter
euh pour vous donner une idée quelqu'un de très entraîné qui fait une bonne transcription
ch_GB9: écouter
c'est une heure pour trois minutes
ch_GB9: écouter
et on considère qu'il faut que trois personnes fassent la même transcription
ch_GB9: écouter
pour vérifier que c'est à peu près valable
ch_GB9: écouter
ce qui veut dire que quand on a euh
ch_GB9: écouter
en gros pour une minute une heure c'est à peu près le temps où il faut payer des gens
ch_GB9: écouter
donc vous imaginez euh l'esclavage qu'il faut développer
ch_GB9: écouter
c'est pour ça que nous cherchons des étudiants en linguistique
ch_GB9: écouter
[rire en fond:noise:instantaneous]
ch_GB9: écouter
finalement après en
ch_GB9: écouter
[pi:pronounce:instantaneous]
ch_GB9: écouter
euh il faut que cette transcription soit dans un format
ch_GB9: écouter
qui soit encore lisible dans cinq ans dans dix ans dans cinquante ans dans deux cents ans
ch_GB9: écouter
or tout ça se fait sous des formes informatiques
ch_GB9: écouter
donc autant vous dire que nous avons quelques inquiétudes et quelques soucis
ch_GB9: écouter
et enfin euh et c'est tout ça un corpus
ch_GB9: écouter
et ça c'est la partie vraiment qui nous passionne le plus
ch_GB9: écouter
parce que les transcriptions faut les faire mais bon c'est pas très drôle
ch_GB9: écouter
il faut que ce corpus soit lui-même associé
ch_GB9: écouter
à des métadonnées
ch_GB9: écouter
qui vont les identifier et un certain nombre d'outils
ch_GB9: écouter
qui vont en assurer
ch_GB9: écouter
une première forme de traitement automatique
ch_GB9: écouter
alors on a des outils pour reconnaître par exemple
ch_GB9: écouter
euh automatiquement les catégories grammaticales
ch_GB9: écouter
on a des outils qui vont faire l'analyse syntaxique des phrases
ch_GB9: écouter
avec des taux d'échec qui sont variables
ch_GB9: écouter
[b:noise:instantaneous] selon les outils
ch_GB9: écouter
mais qui aujourd'hui sont relativement bas
ch_GB9: écouter
en tout cas le traitement automatique est très très très largement supérieur
ch_GB9: écouter
à ce que nous pourrions faire
ch_GB9: écouter
euh
ch_GB9: écouter
manuellement
ch_GB9: écouter
parce que de toute façon c'est ou les machines qui reconnaissent les catégories des mots
ch_GB9: écouter
ou c'est l'étudiant qu'on paye pour le faire
ch_GB9: écouter
et la machine fait plutôt moins de fautes finalement que l'étudiant
ch_GB9: écouter
[toux en fond:noise:instantaneous]
ch_GB9: écouter
voilà donc ce que sont nos corpus oraux
ch_GB9: écouter
une fois qu'on les a euh constitués donc comme je vous l'ai dit
ch_GB9: écouter
euh c'est une opération qui est très longue
ch_GB9: écouter
on a essayé de
ch_GB9: écouter
dans la présentation dans notre dossier
ch_GB9: écouter
donc ce que nous avons négocié avec le ministère notre reconnaissance
ch_GB9: écouter
d'en faire une liste
ch_GB9: écouter
on est arrivé à peu près à l'idée qu'il y a soixante-quinze opérations
ch_GB9: écouter
du moment où on commence à se dire
ch_GB9: écouter
ah on va faire un corpus
ch_GB9: écouter
au moment où il est là livré en état absolument fini
ch_GB9: écouter
ça représente un avantage c'est qu'on peut toujours dire au ministère
ch_GB9: écouter
que c'est presque fini mais
ch_GB9: écouter
soixante-quinze comprenez il en reste encore euh
ch_GB9: écouter
deuxième euh
ch_GB9: écouter
problème c'est que euh
ch_GB9: écouter
je vais en reparler aussi c'est que c'est un travail qui est à peu près infini
ch_GB9: écouter
on ne sait pas
ch_GB9: écouter
quand est-ce qu'un corpus peut être considéré comme ayant été terminé
ch_GB9: écouter
c'est-à-dire même si on a un nombre d'heures fini
ch_GB9: écouter
à partir de quel moment on peut considérer de façon exhaustive
ch_GB9: écouter
on en a rendu compte
ch_GB9: écouter
on l'a traité d'une façon qui soit satisfaisante
ch_GB9: écouter
et puis enfin je vous ai indiqué rapidement euh la quantité de temps que ça prend
ch_GB9: écouter
aujourd'hui au niveau européen
ch_GB9: écouter
on est en train d'engager j'étais encore ce matin
ch_GB9: écouter
une opération générale pour avoir des corpus de référence
ch_GB9: écouter
dans les principales langues
ch_GB9: écouter
et maintenant comme
ch_GB9: écouter
[pi:pronounce:instantaneous]
ch_GB9: écouter
est officiel pour ça
ch_GB9: écouter
c'est euh il faut compter
ch_GB9: écouter
un euro
ch_GB9: écouter
par mot de corpus
ch_GB9: écouter
alors pour vous donner un ordre d'idées
ch_GB9: écouter
le corpus qui est prévu pour le français
ch_GB9: écouter
est actuellement situé entre trois et six millions de mots
ch_GB9: écouter
donc euh hein on on fait conversion
ch_GB9: écouter
euh donc voilà
ch_GB9: écouter
[tx:noise:instantaneous]
ch_GB9: écouter
que de trouver trois à six millions d'euros
ch_GB9: écouter
et euh nous allons enfin pouvoir donner l'outil que la France attend
ch_GB9: écouter
très bien
ch_GB9: écouter
euh
ch_GB9: écouter
alors dans tout ça vous avez dû noter que je vous ai parlé d'à peu près tout
ch_GB9: écouter
sauf de ce que nous fabriquons concrètement
ch_GB9: écouter
euh hé bien on va en parler maintenant
ch_GB9: écouter
puisque euh beaucoup de gens ici euh notre vice-président du conseil scientifique est venu
ch_GB9: écouter
pour savoir
ch_GB9: écouter
[toux en fond:noise:previous]
ch_GB9: écouter
si on travaillait vraiment
ch_GB9: écouter
donc je vais vous dire que fait le Laboratoire Ligérien de Linguistique
ch_GB9: écouter
à part demander des lignes de crédit
ch_GB9: écouter
[pi:pronounce:instantaneous]
ch_GB9: écouter
[tx:noise:instantaneous]
ch_GB9: écouter
alors première chose euh
ch_GB9: écouter
nous notre travail c'est de faire on est linguiste
ch_GB9: écouter
c'est notre métier
ch_GB9: écouter
c'est de faire une analyse scientifique des langues
ch_GB9: écouter
c'est la définition qu'on donne traditionnellement à notre discipline
ch_GB9: écouter
[b:noise:instantaneous]
ch_GB9: écouter
et dans ces langues d'abord des langues qui sont
ch_GB9: écouter
peu
ch_GB9: écouter
ou pas transcrites
ch_GB9: écouter
[b:noise:instantaneous]
ch_GB9: écouter
comme tout laboratoire de linguistique un peu sérieux
ch_GB9: écouter
nous avons ce que nous appelons un portefeuille de langues
ch_GB9: écouter
c'est-à-dire quelques langues qui ne s'étudient que à Orléans
ch_GB9: écouter
euh ou bien euh dans euh deux ou trois autres endroits maximum dans le monde évidemment
ch_GB9: écouter
alors vous savez avec sept mille langues y a de quoi nourrir beaucoup de monde heureusement
ch_GB9: écouter
donc nous on a dans notre portefeuille de langues une petite dizaine de langues
ch_GB9: écouter
où il y a ici le spécialiste mondial
ch_GB9: écouter
euh ou bien un des deux trois quatre spécialistes au monde
ch_GB9: écouter
euh qui peuvent enfin
ch_GB9: écouter
euh
ch_GB9: écouter
notre doyen vous a cité pour euh pour commencer on
ch_GB9: écouter
je vais très rapidement les rappeler donc nous avons un portefeuille sur
ch_GB9: écouter
une demande du ministère d'outre-mer
ch_GB9: écouter
trois langues de Guyane
ch_GB9: écouter
qui sont donc des langues de France
ch_GB9: écouter
ces gens-là étaient français bien avant le savoyard
ch_GB9: écouter
euh bah eux ils étaient pas au courant les savoyards si normalement
ch_GB9: écouter
[rire en fond:noise:instantaneous] euh
ch_GB9: écouter
[tx:noise:instantaneous]
ch_GB9: écouter
donc euh trois langues euh
ch_GB9: écouter
qui sont parlées en Guyane française
ch_GB9: écouter
le palikur le wayana et wayampi qui appartiennent à trois familles
ch_GB9: écouter
linguistiques distinctes
ch_GB9: écouter
on travaille surtout sur le palikur mais aussi sur les deux autres
ch_GB9: écouter
on a euh deux langues euh au Burkina Faso
ch_GB9: écouter
l'une dont on vient de sortir l'ouvrage enfin
ch_GB9: écouter
euh la société linguistique
ch_GB9: écouter
de Paris
ch_GB9: écouter
[pi:pronounce:instantaneous]
ch_GB9: écouter
[toux en fond:noise:instantaneous]
ch_GB9: écouter
et l'autre qui s'appelle le sèmè sur lesquels nous commençons les études
ch_GB9: écouter
euh le Burkina Faso a quarante-neuf langues
ch_GB9: écouter
donc euh y a encore un peu de la marge pour continuer enfin certains les décrivent
ch_GB9: écouter
euh nous avons une langue du Nigéria
ch_GB9: écouter
[pi:pronounce:instantaneous] une langue au Cameroun le samba leko
ch_GB9: écouter
et euh les créoles à base portugaise
ch_GB9: écouter
parce que y a pas que des langues qui disparaissent y a aussi des langues qui apparaissent
ch_GB9: écouter
nous avons une collègue ici qui a travaillé sur une mixing language
ch_GB9: écouter
une langue qui apparait an contact de deux langues
ch_GB9: écouter
celle-ci est apparue au contact du français et de l'anglais
ch_GB9: écouter
Marie-Eve Perrot donc le chiac en au Nouveau-Brunswick au Canada
ch_GB9: écouter
et aussi euh sur les créoles à base portugaise
ch_GB9: écouter
où Orléans est le plus important centre mondial d'étude du créole à base portugaise
ch_GB9: écouter
car c'est le seul endroit au monde où il y a deux personnes qui travaillent sur cette spécialité
ch_GB9: écouter
[pi:pronounce:instantaneous]
ch_GB9: écouter
d'ailleurs y en a une dizaine au monde
ch_GB9: écouter
donc des créoles qui se parlent au Cap-Vert en Casamance au Sénégal euh
ch_GB9: écouter
en Guinée-Bissau et à Sao Tomé-et-Principe
ch_GB9: écouter
dans le
ch_GB9: écouter
golfe de Guinée
ch_GB9: écouter
donc d'une part on a ces langues-là mais
ch_GB9: écouter
je vous rassure on travaille aussi sur des langues dont vous connaissez le nom
ch_GB9: écouter
comme le chinois par exemple euh
ch_GB9: écouter
mais pas seulement
ch_GB9: écouter
puisque nous avons ici une doctorante qui travaille euh
ch_GB9: écouter
euh sur le kota au Congo
ch_GB9: écouter
euh
ch_GB9: écouter
nous avons euh des langues
ch_GB9: écouter
comme le l'espagnol nous avons des langues comme l'allemand
ch_GB9: écouter
comme l'anglais bien sûr
ch_GB9: écouter
euh ça c'est surtout nos collègues de Tours qui sont très
ch_GB9: écouter
beaucoup plus pointus que nous là-dessus
ch_GB9: écouter
et puis euh inévitablement
ch_GB9: écouter
euh celle que vous attendez tous le français
ch_GB9: écouter
oui nous travaillons aussi sur le français
ch_GB9: écouter
nous travaillons d'ailleurs surtout sur le français
ch_GB9: écouter
pour une raison qui s'explique de façon assez simple
ch_GB9: écouter
c'est que nous sommes des enseignants chercheurs
ch_GB9: écouter
et que pour l'enseignement euh
ch_GB9: écouter
bah on est quand même beaucoup plus sollicité par le français
ch_GB9: écouter
que par les autres langues
ch_GB9: écouter
ce qui fait que nous avons ici
ch_GB9: écouter
euh plus de collègues qui travaillent sur le français que sur d'autres langues
ch_GB9: écouter
et ça vous explique
ch_GB9: écouter
euh cette ce déséquilibre
ch_GB9: écouter
alors sur quel euh type de données travaillons-nous ?
ch_GB9: écouter
nous avons eu une chance de pendu à Orléans et je parle pas de Jeanne d'Arc pour cette fois
ch_GB9: écouter
mais je parle des Anglais
ch_GB9: écouter
euh
ch_GB9: écouter
en mille neuf cent cinq- euh soixante
ch_GB9: écouter
les travaillistes arrivent au pouvoir en Angleterre
ch_GB9: écouter
et décident qu'on va moderniser l'enseignement des langues
ch_GB9: écouter
ce fut déjà une mini embuscade comme endroit
ch_GB9: écouter
euh on va moderniser l'enseignement des langues
ch_GB9: écouter
et ça va se faire
ch_GB9: écouter
avec disent-ils
ch_GB9: écouter
les deux grandes révolutions qui viennent d'arriver l'informatique
ch_GB9: écouter
et euh le l'audio-visuel
ch_GB9: écouter
donc ils décident de c'est le français donc à l'époque
ch_GB9: écouter
et de très loin la langue la plus enseignée
ch_GB9: écouter
la langue étrangère la plus enseignée en Angleterre
ch_GB9: écouter
ils décident donc de donner
ch_GB9: écouter
à leurs élèves un enseignement avec de l'audio avec des magnétophones
ch_GB9: écouter
et donc il leur faut des enregistrements de français
ch_GB9: écouter
ils demandent au ministère de l'éducation en France et au ministère de la culture
ch_GB9: écouter
d'ouvrir toutes les archives disponibles
ch_GB9: écouter
de français parlé
ch_GB9: écouter
[pi:pronounce:instantaneous] des droits d'auteur est vraiment associé
ch_GB9: écouter
et très libéralement l'Etat français
ch_GB9: écouter
euh autorisera les Anglais
ch_GB9: écouter
ils avaient pour habitude de faire du commerce avec nous
ch_GB9: écouter
autorisera les Anglais à venir exploiter toutes les données sonores disponibles du français
ch_GB9: écouter
et la réponse après exportation des archives
ch_GB9: écouter
c'est qu'il n'y a pas plus de quatre minutes
ch_GB9: écouter
le chiffre n'est
ch_GB9: écouter
[pi:pronounce:instantaneous] exploitable
ch_GB9: écouter
par rapport à leur projet
ch_GB9: écouter
il y a tout le français de la radio et de la télé comme on
ch_GB9: écouter
comme disent poliment nos collègues anglais
ch_GB9: écouter
les gens s'écoutent parler mais c'était dans les années soixante hein ça a changé
ch_GB9: écouter
euh
ch_GB9: écouter
il y avait euh
ch_GB9: écouter
ils avaient surtout beaucoup espéré
ch_GB9: écouter
parce qu'il y avait eu une grande enquête dans les années cinquante
ch_GB9: écouter
pour le français fondamental
ch_GB9: écouter
ce qui servait à faire les listes de fréquence du vocabulaire le plus usuel
ch_GB9: écouter
mais ceux qui avaient fait le français fondamental
ch_GB9: écouter
on leur avait expliqué qu'une bande magnétique coûtait très cher
ch_GB9: écouter
et qu'il fallait effacer au fur et à mesure
ch_GB9: écouter
donc on transcrivait on effaçait on transcrivait on effaçait
ch_GB9: écouter
donc on a rien derrière
ch_GB9: écouter
pas une bande magnétique du français fondamental des années cinquante
ch_GB9: écouter
qui sont pourtant très intéressantes
ch_GB9: écouter
et qui avait donné du travail à des tas de gens pour faire des transcriptions
ch_GB9: écouter
pour un pauvre type de chômeur qui s'appelait Roland Barthes
ch_GB9: écouter
qui a été transcripteur pour le français fondamental
ch_GB9: écouter
comme quoi ça peut servir
ch_GB9: écouter
ce projet
ch_GB9: écouter
comme les Anglais n'ont plus d-
ch_GB9: écouter
n'ont pas de données ils décident de faire eux-mêmes l'enquête
ch_GB9: écouter
et ils choisissent la plus belle ville du monde sur le bord de la Loire
ch_GB9: écouter
et ils vont donc venir à Orléans pour faire cette enquête
ch_GB9: écouter
trois cent cinquante heures d'enregistrements
ch_GB9: écouter
et
ch_GB9: écouter
[pi:pronounce:instantaneous]
ch_GB9: écouter
ils vont d'une part identifier les données
ch_GB9: écouter
et deuxièmement les conserver
ch_GB9: écouter
donc au lieu de tout effacer
ch_GB9: écouter
ils vont les garder
ch_GB9: écouter
ils vont les transcrire
ch_GB9: écouter
bon c'est des transcriptions faites par des Anglais
ch_GB9: écouter
ils sont assez fautifs quand même faut bien le dire
ch_GB9: écouter
mais quand même l'effort était louable
ch_GB9: écouter
euh en plus ils ont transcrit à la main
ch_GB9: écouter
[pi:pronounce:instantaneous] au crayon
ch_GB9: écouter
donc c'est pas terrible
ch_GB9: écouter
mais néanmoins il y a eu cette idée et
ch_GB9: écouter
euh si vous allez aujourd'hui sur internet euh les livres d'occasion
ch_GB9: écouter
vous tapez les Orléanais ont la parole
ch_GB9: écouter
et vous n'aurez pas le programme politique de monsieur Grouard
ch_GB9: écouter
mais vous aurez le manuel de base des Anglais de cette époque-là
ch_GB9: écouter
avec des photos touchantes
ch_GB9: écouter
d'Orléans
ZR652: écouter
[tx:noise:instantaneous]
ch_GB9: écouter
avec des enregistrements
ZR652: écouter
c'est la même chose
ch_GB9: écouter
pardon
ch_GB9: écouter
c'est ?
ZR652: écouter
c'est la même chose
ch_GB9: écouter
c'est la même chose bon
ch_GB9: écouter
[rire:noise:instantaneous]
ch_GB9: écouter
euh
ch_GB9: écouter
donc vous aurez
ch_GB9: écouter
euh la joie de retrouver des paysages qui vous sont familiers
ch_GB9: écouter
et des gens qui euh que vous entendrez interviewés euh
ch_GB9: écouter
bah euh je suis boucher je pèse je sais pas moi soixante kilos de viande
ch_GB9: écouter
vous les entendez
ch_GB9: écouter
[pi:pronounce:instantaneous] les enregistrements qui servaient de
ch_GB9: écouter
de base à euh
ch_GB9: écouter
à ces à ces groupes
ch_GB9: écouter
euh c'est évidemment un document tout à fait merveilleux et euh
ch_GB9: écouter
après les travaillistes
ch_GB9: écouter
les Anglais ont
ch_GB9: écouter
[b:noise:instantaneous] ils ont peu de choses
ch_GB9: écouter
il se passe peu de choses dans leur histoire euh
ch_GB9: écouter
en politique intérieure mais sans emprunts ils passent des travaillistes aux conservateurs
ch_GB9: écouter
et madame Thatcher ayant coupé les crédits de l'université
ch_GB9: écouter
les Anglais nous ont appelé un jour pour nous dire
ch_GB9: écouter
si vous venez pas chercher tout ça on le met à la poubelle
ch_GB9: écouter
bon alors on a donc récupéré les archives elles sont elles sont ici au laboratoire
ch_GB9: écouter
et du coup ça nous a un petit peu suscité pour refaire la même enquête
ch_GB9: écouter
donc nous sommes dans de la confection d'un
ch_GB9: écouter
alors cette enquête s'appelait Eslo enquête sociolinguistique à Orléans
ch_GB9: écouter
et nous sommes dans donc Eslo deux maintenant nous faisons la même enquête la même
ch_GB9: écouter
on a transposé évidemment
ch_GB9: écouter
par rapport aux aux données du temps
ch_GB9: écouter
euh la même enquête
ch_GB9: écouter
à euh quarante ans d'intervalle et avec les mêmes euh exigences
ch_GB9: écouter
ce qui va nous permettre de mesurer y compris
ch_GB9: écouter
la transformation
ch_GB9: écouter
à travers euh les classes
ch_GB9: écouter
sociales
ch_GB9: écouter
[tx:noise:instantaneous]
ch_GB9: écouter
est-ce que les femmes
ch_GB9: écouter
[interférences téléphone:noise:instantaneous] d'il y a quarante ans
ch_GB9: écouter
parlent comme les femmes d'aujourd'hui par rapport à ce que les
ch_GB9: écouter
[b:noise:instantaneous]
ch_GB9: écouter
il y a quarante ans on parlait comme les hommes d'aujourd'hui ?
ch_GB9: écouter
est-ce que les ouvriers d'il y a quarante ans parlent comme les hommes
ch_GB9: écouter
les ouvriers d'aujourd'hui ? et cetera
ch_GB9: écouter
donc on va pouvoir euh on peut on a commencé heureusement
ch_GB9: écouter
on peut faire cette comparaison et
ch_GB9: écouter
comme il n'y a que les Anglais qui avaient fait des enregistrements
ch_GB9: écouter
il n'y a qu'à Orléans que nous puissions
ch_GB9: écouter
[pi:pronounce:instantaneous]
ch_GB9: écouter
c'est ce qu'on appelle une situation de monopole
ch_GB9: écouter
c'est très avantageux et ça nous sert énormément
ch_GB9: écouter
à obtenir de temps en temps euh quelques
ch_GB9: écouter
[pi:pronounce:instantaneous]
ch_GB9: écouter
euh de
ch_GB9: écouter
[pi:pronounce:instantaneous]
ch_GB9: écouter
cette enquête
ch_GB9: écouter
euh
ch_GB9: écouter
est intéressante à énormément d'égards
ch_GB9: écouter
d'abord parce qu'à l'époque on n'avait pas de problèmes juridiques
ch_GB9: écouter
euh nous on a passé à peu près la moitié de notre temps à savoir
ch_GB9: écouter
comment il fallait faire l'autorisation juridique pour les gens
ch_GB9: écouter
euh on n'a même pas
ch_GB9: écouter
enfin on a on a un modèle qui aujourd'hui est considéré comme à peu près le plus supportable
ch_GB9: écouter
mais on n'est même pas sûr que ça va se passer
ch_GB9: écouter
alors qu'à l'époque par exemple on a des dizaines d'heures d'entretiens
ch_GB9: écouter
de mères de famille sur les problèmes scolaires de leurs enfants
ch_GB9: écouter
avec des conseillers psychopédagogiques
ch_GB9: écouter
euh des choses absolument euh
ch_GB9: écouter
donc aujourd'hui on ne peut plus obtenir ça
ch_GB9: écouter
c'est c'est pas possible
ch_GB9: écouter
on a euh la chef du personnel de chez Servier
ch_GB9: écouter
qui explique comment euh ça se gère
ch_GB9: écouter
[rire en fond:noise:instantaneous]
ch_GB9: écouter
[pi:pronounce:instantaneous]
ch_GB9: écouter
je vais peut-être en faire quelque chose
ch_GB9: écouter
[pi:pronounce:instantaneous]
ch_GB9: écouter
euh
ch_GB9: écouter
[b:noise:instantaneous]
ch_GB9: écouter
l'énorme avantage c'est que les collègues Anglais qui ont fait ça
ch_GB9: écouter
étaient eux-mêmes de vrais linguistes
ch_GB9: écouter
et on a des données qui sont extrêmement originales pour l'époque
ch_GB9: écouter
une de celles qui nous intéressent le plus
ch_GB9: écouter
par exemple c'est euh
ch_GB9: écouter
ce sont des enregistrements faits en
ch_GB9: écouter
en entretien individuel
ch_GB9: écouter
donc on a toutes le données sur les personnes y compris des données très complètes
ch_GB9: écouter
puisqu'une des questions c'est pour qui votez-vous ?
ch_GB9: écouter
aujourd'hui c'est une question qu'on ne peut plus poser
ch_GB9: écouter
et les gens répondent
ch_GB9: écouter
[pi:pronounce:instantaneous] très clair
ch_GB9: écouter
[rire en fond:noise:instantaneous]
ch_GB9: écouter
euh mais enfin voilà
ch_GB9: écouter
poser la question
ch_GB9: écouter
à quel syndicat appartenez-vous ?
ch_GB9: écouter
on avait des questions euh
ch_GB9: écouter
qui aujourd'hui euh on aura un peu plus de euh de tact pour les poser on s'en doute
ch_GB9: écouter
en tout cas nous on les pose plus
ch_GB9: écouter
euh
ch_GB9: écouter
ou du moins pas directement
ch_GB9: écouter
[rire en fond:noise:instantaneous]
ch_GB9: écouter
euh
ch_GB9: écouter
donc on a euh des données et i- ils ont pensé à poser des questions extrêmement intéressantes
ch_GB9: écouter
et notamment une sur laquelle on a énormément travaillé de manière collective
ch_GB9: écouter
qui est hm
ch_GB9: écouter
voilà alors maintenant je vais vous poser une question qui peut-être va vous faire rire
ch_GB9: écouter
mais je la pose quand même
ch_GB9: écouter
hm
ch_GB9: écouter
dites-moi monsieur hm comment est-ce qu'on fait une omelette
ch_GB9: écouter
chez vous ?
ch_GB9: écouter
et ils vont poser à une centaine de personnes la question
ch_GB9: écouter
comment est-ce qu'on fait une omelette ?
ch_GB9: écouter
alors pour un linguiste c'est merveilleux
ch_GB9: écouter
comme euh comme euh type d'enquête d'avoir cent personnes qui donne l'omelette
ch_GB9: écouter
et inutile de vous dire que dans le Eslo deux il y a
ch_GB9: écouter
et maintenant je vais vous poser une question qui peut-être et cetera
ch_GB9: écouter
bon j'ai pas je prends pas l'accent anglais quand même pour la poser
ch_GB9: écouter
mais nous reposons la même question
ch_GB9: écouter
dans ce type de cadre euh
ch_GB9: écouter
on est évidemment en recherche de levier pour euh intégrer
ch_GB9: écouter
euh ce type de projet alors on a eu la chance d'avoir ce qu'on appelle une euh
ch_GB9: écouter
une ANR c'est-à-dire un subside
ch_GB9: écouter
de l'Agence Nationale de la Recherche
ch_GB9: écouter
qui nous a permis de
ch_GB9: écouter
donner une première base donc de
ch_GB9: écouter
[pi:pronounce:instantaneous] à notre travail sur Eslo deux
ch_GB9: écouter
même si on allait comme toujours moins vite qu'on ne l'aurait voulu
ch_GB9: écouter
euh mais en tout cas ça a marché
ch_GB9: écouter
on a eu deuxièmement euh la chance d'avoir
ch_GB9: écouter
à la Bibliothèque Nationale de France
ch_GB9: écouter
des gens avec qui on a pu parler
ch_GB9: écouter
ce qui fait qu'aujourd'hui
ch_GB9: écouter
non seulement nous avons le monopole de la seule enquête de soixante-huit
ch_GB9: écouter
mais nous avons grâce à nos collègues de la phonothèque
ch_GB9: écouter
euh de euh la Bibliothèque Nationale de France
ch_GB9: écouter
le monopole sur toute les données sonores
ch_GB9: écouter
euh du dépôt légal
ch_GB9: écouter
c'est-à-dire celles qui sont en accès public
ch_GB9: écouter
euh
ch_GB9: écouter
et des conservateurs intelligents qui travaillent avec nous
ch_GB9: écouter
quoi que comme nous le disaient nos collègues
ch_GB9: écouter
on ne s'appelle pas conservateurs pour rien
ch_GB9: écouter
euh
ch_GB9: écouter
nous avons euh
ch_GB9: écouter
pu obtenir euh de
ch_GB9: écouter
développer des pratiques d'outillage avec la Equipex
ch_GB9: écouter
qui vient de nous arriver mais c'est l'initiative de
ch_GB9: écouter
[pi:pronounce:instantaneous]
ch_GB9: écouter
ce qui va nous permettre avec nos collègues de Nancy d'Aix et de Paris Nanterre
ch_GB9: écouter
euh de travailler de façon euh
ch_GB9: écouter
un petit peu lourde sur euh l'outillage de nos corpus
ch_GB9: écouter
et maintenant euh il nous reste à voir qu'est-ce
ch_GB9: écouter
qu'on fait avec tout ça ?
ch_GB9: écouter
[tx:noise:instantaneous]
ch_GB9: écouter
donc ça veut dire je vous ai dit euh ce que nous avions
ch_GB9: écouter
notre objectif c'est de réunir à peu près
ch_GB9: écouter
ça va dépendre un petit peu de ce qu'on va y intégrer exactement
ch_GB9: écouter
mais entre
ch_GB9: écouter
au minimum trois cents heures et au maximum sept cents heures
ch_GB9: écouter
d'enregistrements
ch_GB9: écouter
corpus
ch_GB9: écouter
transcrits
ch_GB9: écouter
si possible de la façon la plus impeccable possible
ch_GB9: écouter
on a pour ça des étudiants que nous payons
ch_GB9: écouter
euh qui ont un tarif syndical
ch_GB9: écouter
vous connaissez maintenant le principe c'est euh
ch_GB9: écouter
trois minutes d'enregistrements une heure de travail
ch_GB9: écouter
nous faisons relire par un deuxième étudiant
ch_GB9: écouter
et nous faisons relire la troisième version
ch_GB9: écouter
euh par un enseignant chercheur
ch_GB9: écouter
qui va se charger de mettre au point la dernière version
ch_GB9: écouter
pour vous donner un ordre d'idée euh de ce que j'ai fait moi
ch_GB9: écouter
en gros sur une heure
ch_GB9: écouter
je fais avec la troisième version avec deux étudiants sérieux qui ont bien travaillé avant
ch_GB9: écouter
entre cinq cents et sept cents modifications
ch_GB9: écouter
euh de toutes sortes hein
ch_GB9: écouter
c'est souvent de toutes petites choses
ch_GB9: écouter
il s'agit de resegmenter un petit peu différemment dans l'écoute
ch_GB9: écouter
il s'agit de rajouter un un symbole une balise
ch_GB9: écouter
et cetera
ch_GB9: écouter
[tx:noise:instantaneous]
ch_GB9: écouter
mais c'est un travail absolument énorme à
ch_GB9: écouter
à refaire et à reprendre
ch_GB9: écouter
mais on voulait avoir au moins une base qui soit absolument impeccable
ch_GB9: écouter
pour commencer à travailler dessus
ch_GB9: écouter
et je vous parle pas quand il faut faire des transcriptions
ch_GB9: écouter
c'est qu'on appelle les effets cocktail
ch_GB9: écouter
l'effet cocktail c'est lorsque vous êtes dans une assemblée où il y a beaucoup de monde
ch_GB9: écouter
qui parle et cetera
ch_GB9: écouter
et vous avez un micro au milieu et il faut commencer à transcrire tout ça
ch_GB9: écouter
alors ça généralement c'est l'étudiant qu'on veut punir à qui on donne ça
ch_GB9: écouter
[rire en fond:noise:instantaneous]
ch_GB9: écouter
trois minutes et cetera
ch_GB9: écouter
c'est
ch_GB9: écouter
atroce
ch_GB9: écouter
qu'est-ce que nous faisons avec ça ?
ch_GB9: écouter
bien d'abord on fait progresser la science
ch_GB9: écouter
ça peut toujours être utile on ne sait jamais
ch_GB9: écouter
euh on essaye de travailler aussi avec nos outils pour comprendre
ch_GB9: écouter
comment est-ce que peuvent se faire se réaliser
ch_GB9: écouter
un certain nombre de
ch_GB9: écouter
[pi:pronounce:instantaneous]
ch_GB9: écouter
je vais vous en prendre des exemples qui seront euh
ch_GB9: écouter
peut-être plus
ch_GB9: écouter
faciles à comprendre
ch_GB9: écouter
on peut travailler sur évidemment toutes les données
ch_GB9: écouter
euh un des problèmes que l'on se pose aujourd'hui c'est
ch_GB9: écouter
comment obtenir des principes de commande automatique ?
ch_GB9: écouter
ou euh de l'interprétation d'un certain nombre d'éléments
ch_GB9: écouter
de telle manière qu'il n'y ait pas d'erreurs
ch_GB9: écouter
dans les opérations
ch_GB9: écouter
pour prendre un exemple simple
ch_GB9: écouter
si on demande à une machine de sortir
ch_GB9: écouter
elle va défoncer la porte
ch_GB9: écouter
sauf si on lui dit qu'il faut d'abord ouvrir la porte
ch_GB9: écouter
euh ça a l'air idiot mais c'est comme ça
ch_GB9: écouter
ici ce que nous avons vu
ch_GB9: écouter
et je vais reprendre mon exemple de l'omelette
ch_GB9: écouter
c'est qu'à peu près personne
ch_GB9: écouter
[tx:noise:instantaneous]
ch_GB9: écouter
dans nos enregistrements
ch_GB9: écouter
ne fait cuire son omelette
ch_GB9: écouter
[conv:noise:instantaneous]
ch_GB9: écouter
ne fait cuire son omelette
ch_GB9: écouter
[rire en fond:noise:instantaneous]
ch_GB9: écouter
parce que tous disent la même chose ils disent
ch_GB9: écouter
et je la mets dans la poêle
ch_GB9: écouter
parce qu'en français si vous mettez dans une poêle c'est pour faire chauffer
ch_GB9: écouter
y a donc pas besoin de dire que vous faites chauffer puisque vous avez utilisez le mot
ch_GB9: écouter
poêle qui va
ch_GB9: écouter
[tx:noise:instantaneous]
ch_GB9: écouter
fonctionner
ch_GB9: écouter
[tx:noise:instantaneous]
ch_GB9: écouter
comme étant l'équivalent de faire chauffer
ch_GB9: écouter
[b:noise:instantaneous]
ch_GB9: écouter
on a un autre problème sur lequel a travaillé ici une personne
ch_GB9: écouter
que sa modestie nous servira de nommer puisqu'elle est présente
ch_GB9: écouter
euh qui est que lorsqu'on fait une omelette
ch_GB9: écouter
je reprends mon exemple il est plus facile
ch_GB9: écouter
lorsqu'on fait une omelette
ch_GB9: écouter
y a le moment où vous avez des oeufs
ch_GB9: écouter
à la fin y a un moment où vous avez une omelette
ch_GB9: écouter
mais y a une phase entre les deux
ch_GB9: écouter
où les gens sont très embarrassés pour le dé- pour dire ce que c'est
ch_GB9: écouter
parce qu'à la fois il faudrait comiquement passer
ch_GB9: écouter
d'un pluriel à un singulier
ch_GB9: écouter
d'un masculin à un féminin
ch_GB9: écouter
et en plus le machin que tu as entre les deux comme dirait Bossuet
ch_GB9: écouter
ça
ch_GB9: écouter
[pi:pronounce:instantaneous] dans aucune
ch_GB9: écouter
enfin si en français ça s'appelle un appareil mais peu importe personne ne le sait
ch_GB9: écouter
ou quasiment
ch_GB9: écouter
euh
ch_GB9: écouter
l'état intermédiaire
ch_GB9: écouter
alors ça c'est ce qu'on appelle les problèmes d'anaphore
ch_GB9: écouter
comment est-ce que font les gens pour repérer dans un texte
ch_GB9: écouter
que c'est bien le même élément dont on parle ?
ch_GB9: écouter
c'est un cas très classique bien connu dans les contes
ch_GB9: écouter
la sorcière car c'était elle
ch_GB9: écouter
donc vous voyez hein on avait quelqu'un et puis d'un seul coup ce
ch_GB9: écouter
quelqu'un change d'identité
ch_GB9: écouter
et il faut quand même repérer dans le texte
ch_GB9: écouter
que c'est bien la même personne
ch_GB9: écouter
donc ce type de processus les processus d'anaphores
ch_GB9: écouter
comment on va pouvoir les repérer
ch_GB9: écouter
à travers le texte ?
ch_GB9: écouter
voilà le type de travail que nous pouvons faire entre autres
ch_GB9: écouter
l'étiquetage comment on étiquette dans ces cas-là ?
ch_GB9: écouter
pour le dire rapidement l'étiquette
ch_GB9: écouter
morphologique et grammaticale change complètement
ch_GB9: écouter
alors que euh l'étiquetage sémantique doit rester identique
ch_GB9: écouter
c'est un problème très connu
ch_GB9: écouter
si vous dites j'ai attrapé le canard dans la cour
ch_GB9: écouter
et euh
ch_GB9: écouter
une fois que vous l'avez attrapé plumé et cetera
ch_GB9: écouter
lorsque tout à fait à la fin de votre récit vous direz
ch_GB9: écouter
et alors franchement le canard il passait pas
ch_GB9: écouter
euh hé bien c'est pas exactement sous la même forme
ch_GB9: écouter
que se présente le canard dont on parlait au début qui était dans la basse-cour
ch_GB9: écouter
et celui qu'on va bientôt restituer dans les waters
ch_GB9: écouter
[conv:noise:instantaneous]
ch_GB9: écouter
des usages ceci dit
ch_GB9: écouter
il y a des usages didactiques
ch_GB9: écouter
que nous développons ici
ch_GB9: écouter
des usages qui vont servir
ch_GB9: écouter
à l'enseignement aussi bien du français langue étrangère
ch_GB9: écouter
qu'à des observations sur le français langue maternelle
ch_GB9: écouter
comment est-ce qu'on peut euh identifier des éléments ?
ch_GB9: écouter
comment est-ce qu'on peut faire aujourd'hui des manuels ?
ch_GB9: écouter
et pour nous c'est particulièrement important parce qu'on a un master
ch_GB9: écouter
qui travaille sur les didacticiels
ch_GB9: écouter
et on a une articulation de ce travail de recherche
ch_GB9: écouter
avec une autre partie enseignement
ch_GB9: écouter
dans euh le master euh
ch_GB9: écouter
de didactique
ch_GB9: écouter
didactique
ch_GB9: écouter
[pi:pronounce:instantaneous]
ch_GB9: écouter
une belle technologie
ch_GB9: écouter
et puis euh
ch_GB9: écouter
sur le traitement automatique des langues
ch_GB9: écouter
qui est l'autre aspect de l'exploitation c'est là que
ch_GB9: écouter
[pi:pronounce:instantaneous]
ch_GB9: écouter
sur le traitement automatique des langues
ch_GB9: écouter
il y a des aspects sur lesquels nous ne travaillerons pas ici
ch_GB9: écouter
on ne peut pas tout faire
ch_GB9: écouter
euh donc on a fait des choix on a éliminé
ch_GB9: écouter
délibérément un certain nombre d'études c'est aussi
ch_GB9: écouter
la complémentarité dans laquelle nous sommes avec l'Equipex
ch_GB9: écouter
euh je vous ai dit que nous sommes avec quatre laboratoires
ch_GB9: écouter
celui d'Aix-en-Provence et un des deux grands laboratoires français de phonétique
ch_GB9: écouter
ici nous ne faisons pas du tout d'études phonétiques
ch_GB9: écouter
on ne cherche pas
ch_GB9: écouter
à interpréter à repérer ces éléments
ch_GB9: écouter
c'est de la phonologie mais c'est une autre discipline
ch_GB9: écouter
on ne on n'a pas comme ambition
ch_GB9: écouter
d'essayer de faire de la reconnaissance automatique de la parole
ch_GB9: écouter
on n'a pas comme ambition de euh chercher comment était articulé
ch_GB9: écouter
telle ou telle unité
ch_GB9: écouter
on ne travaille pas sur le dialogue homme-machine
ch_GB9: écouter
c'est des gens quand vous appelez les
ch_GB9: écouter
la SNCF et puis vous tombez sur une machine qui va vous répondre
ch_GB9: écouter
euh y a des études de linguistique là-dessus c'est très particulier
ch_GB9: écouter
[tx:noise:previous]
ch_GB9: écouter
y a des personnes
ch_GB9: écouter
qui ont
ch_GB9: écouter
[bruit de chaise:noise:previous]
ch_GB9: écouter
qui ont travaillé dans notre domaine
ch_GB9: écouter
par exemple sur les échanges dans les tours de contrôle
ch_GB9: écouter
pour éviter les accidents
ch_GB9: écouter
comme les observations de ce type-là
ch_GB9: écouter
on ne travaille pas sur ces aspects
ch_GB9: écouter
[pi:pronounce:instantaneous]
ch_GB9: écouter
c'est pas notre euh
ch_GB9: écouter
c'est pas notre domaine ici
ch_GB9: écouter
on ne travaille pas euh sur la génération automatique de textes par omission hein
ch_GB9: écouter
autant de domaines sur lesquels on pourrait être
ch_GB9: écouter
alors vous allez dire mais alors qu'est-ce qu'il reste ?
ch_GB9: écouter
hé bien il reste tout sur quoi euh nous travaillons
ch_GB9: écouter
alors nous on travaille sur euh
ch_GB9: écouter
sur euh ce que j'ai essayé de vous indiquer
ch_GB9: écouter
euh les travaux sur le lexique
ch_GB9: écouter
comment est-ce que ça s'organise ?
ch_GB9: écouter
comment est-ce que ça fonctionne ?
ch_GB9: écouter
comment est-ce que ça se met en série ?
ch_GB9: écouter
comment est-ce qu'on peut compiler très rapidement des dictionnaires ?
ch_GB9: écouter
alors on fait sur le français
ch_GB9: écouter
où on a une très bonne maîtrise une très bonne connaissance de la langue
ch_GB9: écouter
il faut voir que notre objectif c'est nos collègues qui travaillent sur le palikur
ch_GB9: écouter
font des transcriptions
ch_GB9: écouter
et l'idée c'est de faire des dictionnaires automatiques
ch_GB9: écouter
c'est-à-dire qu'une fois qu'on a les transcriptions
ch_GB9: écouter
la machine va aligner les mots les uns après les autres
ch_GB9: écouter
et puis comme on a des taggers
ch_GB9: écouter
des systèmes qui reconnaissent automatiquement les catégories
ch_GB9: écouter
tout de suite après ça vous donne la catégorie
ch_GB9: écouter
et puis comme on a des
ch_GB9: écouter
[pi:pronounce:instantaneous]
ch_GB9: écouter
c'est-à-dire des systèmes qui donnent automatiquement la transcription phonétique
ch_GB9: écouter
alors euh automatiquement ça veut dire qu'on a travaillé avant
ch_GB9: écouter
pour les mettre au point
ch_GB9: écouter
ça se lit pas tout seul
ch_GB9: écouter
automatiquement ça va vous mettre la transcription phonétique
ch_GB9: écouter
et puis ça va vous mettre tous les exemples
ch_GB9: écouter
où on va trouver cette unité-là
ch_GB9: écouter
donc ça va vous donner en tout cas les les contextes
ch_GB9: écouter
et la traduction qu'on a donnée à cet endroit-là
ch_GB9: écouter
alors c'est un travail euh ce que je vous décris là
ch_GB9: écouter
c'est on y sera dans dix ans hein c'est
ch_GB9: écouter
[pi:pronounce:instantaneous]
ch_GB9: écouter
mais expérimentalement
ch_GB9: écouter
on sait
ch_GB9: écouter
toutes les techniques qui permettent de faire
ch_GB9: écouter
et on le fait concrètement aujourd'hui sur le français
ch_GB9: écouter
où là c'est infiniment plus facile
ch_GB9: écouter
puisqu'on a des dictionnaires de
ch_GB9: écouter
phonétique
ch_GB9: écouter
[bruit de chaise:noise:previous]
ch_GB9: écouter
et le reste
ch_GB9: écouter
[bruit de chaise:noise:instantaneous]
ch_GB9: écouter
alors y a quelque chose qui nous empoisonne la v-
ch_GB9: écouter
euh la vie depuis une é-
ch_GB9: écouter
dont on est les grands spécialistes en France
ch_GB9: écouter
c'est l'anonymisation automatique
ch_GB9: écouter
euh nous avons promis aux gens
ch_GB9: écouter
que leurs enregistrements les rendraient célèbres dans toute l'histoire
ch_GB9: écouter
puisqu'on leur a dit qu'ils seraient sur internet
ch_GB9: écouter
mais on leur a promis aussi qu'ils ne seraient pas
ch_GB9: écouter
je veux dire directement identifiables
ch_GB9: écouter
parce qu'on ne va quand même pas transformer leurs voix
ch_GB9: écouter
euh sinon ça en perd quand même beaucoup
ch_GB9: écouter
donc il faut qu'on anonymise
ch_GB9: écouter
[tx:noise:instantaneous]
ch_GB9: écouter
alors anonymiser au début
ch_GB9: écouter
c'est facile
ch_GB9: écouter
les gens ils zappaient les noms propres
ch_GB9: écouter
vous imaginez un match de foot raconté sans noms propres bon
ch_GB9: écouter
[pi:pronounce:instantaneous]
ch_GB9: écouter
euh on avait droit au fait que
ch_GB9: écouter
oui à Orléans La Poste elle est place
ch_GB9: écouter
[bb:noise:instantaneous]
ch_GB9: écouter
donc il fallait dire à la machine non il faut garder De Gaulle
ch_GB9: écouter
bah ça sert à rien de le supprimer
ch_GB9: écouter
en revanche
ch_GB9: écouter
euh si tu mets les noms propres bah nous on sait à peu près faire
ch_GB9: écouter
c'est relativement facile
ch_GB9: écouter
on est très au point
ch_GB9: écouter
on fait ça avec le laboratoire d'informatique de Tours
ch_GB9: écouter
qui sont très pointus là-dedans
ch_GB9: écouter
le très gros problème c'est que la loi est plus compliquée que ça
ch_GB9: écouter
la loi dit
ch_GB9: écouter
l'anonymisation c'est ne pas pouvoir reconnaître une personne
ch_GB9: écouter
et quelqu'un qui dans un enregistrement dit
ch_GB9: écouter
je suis radiologue je me suis installé à Olivet en soixante-dix-sept
ch_GB9: écouter
ça prend dix secondes pour savoir qui c'est aujourd'hui avec internet
ch_GB9: écouter
donc il faut anonymiser toutes les données
ch_GB9: écouter
qui permettent potentiellement d'identifier quelqu'un
ch_GB9: écouter
c'est-à-dire les repérer dans le temps
ch_GB9: écouter
donc toute une partie
ch_GB9: écouter
très
ch_GB9: écouter
difficile très fastidieuse de notre travail
ch_GB9: écouter
est de faire aujourd'hui
ch_GB9: écouter
la conception de l'outil
ch_GB9: écouter
qui permet de repérer à partir de combinés d'informations croisées
ch_GB9: écouter
on peut identifier quelqu'un
ch_GB9: écouter
euh vous pouvez à peu près imaginer le genre de défi que ça représente
ch_GB9: écouter
ça devrait vous permettre logiquement de demander du crédit à l'année
ch_GB9: écouter
pendant les cinquante prochaines années
ch_GB9: écouter
[rire en fond:noise:instantaneous]
ch_GB9: écouter
donc euh
ch_GB9: écouter
et puis bon on a quelques petits domaines je vais juste rester sur le dernier
ch_GB9: écouter
parce que là c'est notre spécialité mondiale c'est un des points sur lesquels
ch_GB9: écouter
on essaye de prendre de l'avance aujourd'hui
ch_GB9: écouter
parce qu'on est à peu près les seuls à y avoir pensé
ch_GB9: écouter
je vous ai dit que nous considérions qu'une transcription était bonne
ch_GB9: écouter
quand nous l'avions faite
ch_GB9: écouter
trois fois
ch_GB9: écouter
donc à chaque fois on a des versions qui sont différentes
ch_GB9: écouter
je vous ai dit que pour la troisième
ch_GB9: écouter
après deux bonnes lectures j'avais encore
ch_GB9: écouter
entre cinq cents et mille
ch_GB9: écouter
corrections à faire par heure
ch_GB9: écouter
mais euh de façon intelligente
ch_GB9: écouter
un des collègues qui est un des grands animateurs de ce programme Olivier Baude
ch_GB9: écouter
a eu cette idée extraordinaire que nous gardons toutes les versions
ch_GB9: écouter
et nous les gardons avec leur aliment
ch_GB9: écouter
donc nous avons les moyens de comparer
ch_GB9: écouter
toutes les versions
ch_GB9: écouter
sur une même euh
ch_GB9: écouter
un même enregistrement
ch_GB9: écouter
toutes les versions qui ont été faites
ch_GB9: écouter
et nous comptons bien nous servir
ch_GB9: écouter
de
ch_GB9: écouter
ces différentes versions
ch_GB9: écouter
non pas comme l'ont fait nos prédécesseurs en nous disant
ch_GB9: écouter
on cherche la bonne version et on efface les précédentes
ch_GB9: écouter
mais en utilisant les différences d'écoute
ch_GB9: écouter
qu'ont les gens
ch_GB9: écouter
pour apprendre quelque chose de plus sur les enregistrements
ch_GB9: écouter
le linguiste n'est pas celui pour en revenir à mon point de départ
ch_GB9: écouter
n'est pas celui qui étudie la façon dont les gens parlent
ch_GB9: écouter
c'est celui qui étudie la façon dont les gens entendent
ch_GB9: écouter
et le fait que des gens aient pu entendre
ch_GB9: écouter
de façon nette autre chose
ch_GB9: écouter
est tout à fait intéressant
ch_GB9: écouter
euh je vais prendre un exemple pour ceux qui sont de vieux Orlé- de vieux Orléanais ici
ch_GB9: écouter
euh il y avait une entreprise qui a fait faillite y a
ch_GB9: écouter
une trentaine d'années maintenant peut-être vingt-cinq
ch_GB9: écouter
qui s'appelait Chenesseau
ch_GB9: écouter
qui fabriquait des outils ou des ou des stations-services et cetera
ch_GB9: écouter
[tx:noise:instantaneous]
ch_GB9: écouter
et
ch_GB9: écouter
[tx:noise:instantaneous]
ch_GB9: écouter
parmi nos interviewés il y a un des Chenesseau qui explique ce qu'il fabrique dans la boîte
ch_GB9: écouter
et il dit oui nous chez Chenesseau on fait ça ici
ch_GB9: écouter
mais donc les transcripteurs c'est des petits jeunes ils connaissent à peine Maurice Chevalier
ch_GB9: écouter
euh
ch_GB9: écouter
[rire en fond:noise:instantaneous]
ch_GB9: écouter
ils bah oui parce que c'est des enregistrements de soixante-huit
ch_GB9: écouter
qu'on leur a d'abord donné et après quelques parfois quelques petites erreurs
ch_GB9: écouter
mais c'était facile à à corriger pour quelqu'un comme moi
ch_GB9: écouter
euh
ch_GB9: écouter
comme ils connaissaient pas Chenesseau
ch_GB9: écouter
[pi:pronounce:instantaneous] être Orléanais faut le connaître c'est même pas une
ch_GB9: écouter
une star
ch_GB9: écouter
euh ils savaient pas pourquoi mais comme ça parlait des cuves à essence
ch_GB9: écouter
alors
ch_GB9: écouter
[pi:pronounce:instantaneous]
ch_GB9: écouter
c'était chez Esso
ch_GB9: écouter
donc voilà
ch_GB9: écouter
[conv:noise:instantaneous]
ch_GB9: écouter
alors c'est typiquement l- le genre de choses qui nous intéresse
ch_GB9: écouter
parce que comment ont travaillé les gens ?
ch_GB9: écouter
qu'est-ce qu'ils ont fait ? quel type de reconstruction ?
ch_GB9: écouter
voilà à peu près le type de domaine sur lequel on travaille
ch_GB9: écouter
voilà à peu près quel est le travail que nous faisons constamment voilà
ch_GB9: écouter
je vous remercie
ch_GB9: écouter
[applaude:noise:instantaneous]
CBruneau: écouter
bien
CBruneau: écouter
merci je crois que tu as bien montré que la
CBruneau: écouter
la force d'un laboratoire c'est sa capacité à travailler collectivement
CBruneau: écouter
ça c'est très très intéressant très bien
CBruneau: écouter
alors y a-t-il euh des des questions sur euh
CBruneau: écouter
tout ce qu'on vient de ?
CBruneau: écouter
[conv:noise:instantaneous]
CBruneau: écouter
non seulement d'entendre mais d'écouter aussi oui tu
CBruneau: écouter
[conv:noise:instantaneous]
ZR652: écouter
par rapport au dernier exemple là
ZR652: écouter
Chenesseau
ZR652: écouter
euh est-ce que tu as des
ZR652: écouter
est-ce que tu as la possibilité d'avoir des outils euh
ZR652: écouter
à caractère rigoureux de type informatique scientifique et cetera
ZR652: écouter
conforme à la démarche
ZR652: écouter
euh que vous avez
ZR652: écouter
pour identifier euh la part de de l'histoire là-dedans
ZR652: écouter
parce que effectivement euh
ZR652: écouter
quand tu dis
ZR652: écouter
euh
ZR652: écouter
un jeune étudiant
ZR652: écouter
[pi:pronounce:instantaneous] chez Esso
ZR652: écouter
c'est parce qu'il ne connaît pas euh le contexte
ZR652: écouter
de
ZR652: écouter
de l'énonciation
ZR652: écouter
et donc là y a y a quelque chose tout à fait intéressant euh je pense
ZR652: écouter
est-ce que vous travaillez aussi sur ce type de choses ?
ZR652: écouter
[b:noise:instantaneous]
ZR652: écouter
[pi:pronounce:instantaneous] je ne sais pas comment il faut l'appeler de
ZR652: écouter
de linguistique historique ou de sociolinguistique
ZR652: écouter
qui permet de d'avoir des repères
ZR652: écouter
euh
ZR652: écouter
au moins des repères pas forcément les analyser en détail
ZR652: écouter
des repères en disant là y a une fracture parce que
ZR652: écouter
y a un problème qui relève du contexte euh
ZR652: écouter
géographique historique et cetera
ZR652: écouter
mais pas un contexte strictement linguistique
ch_GB9: écouter
alors en effet ce qu'on fait facilement euh
ch_GB9: écouter
enfin ce qu'on fait classiquement dans un labo
ch_GB9: écouter
on a une étudiante en thèse dessus
ch_GB9: écouter
pour faire une typologie parce qu'on n'a même pas ça aujourd'hui
ch_GB9: écouter
une typologie de toutes les erreurs possibles à partir d'un corpus
ch_GB9: écouter
[b:noise:instantaneous] il y a déjà des typologies d'erreurs
ch_GB9: écouter
c'est quand même des choses classiques
ch_GB9: écouter
mais là on a cet avantage énorme dont on a quand même maintenant
ch_GB9: écouter
plus de trois cents heures transcrites
ch_GB9: écouter
[b:noise:instantaneous]
ch_GB9: écouter
correctement trois versions
ch_GB9: écouter
[b:noise:instantaneous]
ch_GB9: écouter
et du coup euh nous on peut maintenant
ch_GB9: écouter
faire la comparaison
ch_GB9: écouter
à très très grande échelle de toutes les différences
ch_GB9: écouter
parce que y a des logiciels qui eux sortent toutes les différences
ch_GB9: écouter
sur les enregistrements
ch_GB9: écouter
donc euh ça ça paraît immédiatement donc ça va très très vite
ch_GB9: écouter
et elle doit maintenant enfin elle doit elle est en train dessus
ch_GB9: écouter
une thèse déjà en sept ans
ch_GB9: écouter
euh elle est en train de de d'essayer de faire une typologie dans
ch_GB9: écouter
ces questions-là
ch_GB9: écouter
[bruit de chaises:noise:previous] mais en réalité
ch_GB9: écouter
ce qui nous intéresse nous le plus
ch_GB9: écouter
c'est plutôt la démarche de la personne qui
ch_GB9: écouter
j'avais ça en phonétique
ch_GB9: écouter
qu'est-ce que je sors en
ch_GB9: écouter
[pi:pronounce:instantaneous]
ch_GB9: écouter
en gros elle a à peu près perçu le signal
ch_GB9: écouter
mais euh comment est-ce que je reconstruis ?
ch_GB9: écouter
sachant qu'on a notamment dans les transcriptions des choses ahurissantes
ch_GB9: écouter
euh je je dis bien que ce sont des étudiants sérieux c'est pas
ch_GB9: écouter
ça du tout la question
ch_GB9: écouter
mais euh on voit quand même qu'il y en a
ch_GB9: écouter
quelques-uns à certains moments qui ont vraiment pensé à autre chose hein
ch_GB9: écouter
qui avaient
ch_GB9: écouter
[pi:pronounce:instantaneous]
ch_GB9: écouter
donc on a ce type d'erreurs
ch_GB9: écouter
on a des types d'erreurs par approximation on a des types d'erreur par euh
ch_GB9: écouter
des faits historiques
ch_GB9: écouter
on a des types d'erreurs enfin historiques dans le sens
ch_GB9: écouter
[pi:pronounce:instantaneous]
ch_GB9: écouter
on a des erreurs euh de type euh évidemment énormément euh
ch_GB9: écouter
simplement de de grammaire de de fautes de transcription
ch_GB9: écouter
alors ça c'est même les plus courantes et de loin
ch_GB9: écouter
euh on a ensuite les qu'est-ce qu'on a des ?
ch_GB9: écouter
on a demandé à la machine de nous sortir que le lexique
ch_GB9: écouter
[b:noise:instantaneous]
ch_GB9: écouter
et on voit arriver toutes les coquilles
ch_GB9: écouter
parce qu'évidemment
ch_GB9: écouter
la machine ne connaît pas le mot orthographié comme ça
ch_GB9: écouter
donc elle nous le le restitue
ch_GB9: écouter
ça c'est un un un très gros travail qui fait partie de cette de cette démarche
ch_GB9: écouter
[tx:noise:instantaneous]
VD276: écouter
j'ai une question très précise comment vous choisissez les langues euh
VD276: écouter
ce sont principalement les langues africaines
VD276: écouter
donc euh est-ce que c'est vous qui choisissez ? est-ce que ça vous est
VD276: écouter
imposé ? proposé ?
ch_GB9: écouter
euh
ch_GB9: écouter
je crois euh
ch_GB9: écouter
je sais plus qui disait euh
ch_GB9: écouter
euh
ch_GB9: écouter
qui disait ça
ch_GB9: écouter
ça doit être euh
ch_GB9: écouter
je crois que c'est Merleau-Ponty qui disait
ch_GB9: écouter
les chercheurs c'est comme les pirates ça prend ce que ça trouve
ch_GB9: écouter
[rire en fond:noise:instantaneous]
ch_GB9: écouter
euh
ch_GB9: écouter
on a des des collègues qui travaillent sur le Burkina
ch_GB9: écouter
c'est au départ
ch_GB9: écouter
euh le le le
ch_GB9: écouter
tout début du travail sur le dagara en l'occurrence
ch_GB9: écouter
c'est un collègue qui avait pris un poste là-bas en coopération pendant dix ans
ch_GB9: écouter
[pi:pronounce:instantaneous]
ch_GB9: écouter
euh le
ch_GB9: écouter
le les langues de Guyane c'est parce que lorsque que l'IRD s'est installé à Orléans
ch_GB9: écouter
les collègues sont venus nous voir en disant
ch_GB9: écouter
y a des langues là-bas on peut trouver des crédits on y va
ch_GB9: écouter
euh y a sûrement pas de
ch_GB9: écouter
[bruit de chaise:noise:instantaneous]
ch_GB9: écouter
d'intention au départ
MB834: écouter
est-ce que est-ce que vos corpus se se périment ?
MB834: écouter
est-ce qu'il faut les refaire ? ou bien
MB834: écouter
je veux dire par rapport à une évolution éventuelle de la langue elle-même
MB834: écouter
à partir de quand considérez-vous que les cor- les corpus oraux sont fixes et suffisants ?
ch_GB9: écouter
pour faire une bonne description selon moi ?
MB834: écouter
oui
ch_GB9: écouter
ah euh c'est une bonne réponse
ch_GB9: écouter
c'est une bonne question euh enfin oui quand on pose mais
ch_GB9: écouter
le le problème d'abord c'est que lorsqu'on travaille sur des corpus oraux
ch_GB9: écouter
se sont par définition nous le souhaitons
ch_GB9: écouter
des corpus non normatifs
ch_GB9: écouter
euh donc non prescriptifs
ch_GB9: écouter
et à ce titre-là euh on
ch_GB9: écouter
[tx:noise:instantaneous]
ch_GB9: écouter
le pire de de ce qu'on peut entendre me va très bien
ch_GB9: écouter
je veux dire après tout ça en fait partie
ch_GB9: écouter
on a fait venir la semaine passée nos collègues du British National Corpus
ch_GB9: écouter
parce qu'ils avaient pris un peu d'avance
ch_GB9: écouter
donc les Anglais ont déjà fait ce type de travail dans leur pays
ch_GB9: écouter
en soixan- en quatre-vingt-dix-huit
ch_GB9: écouter
et ce collègue nous expliquait en technique d'enregistrement
ch_GB9: écouter
je sais pas si on obtiendrait en France les autorisations
ch_GB9: écouter
ils ont demandé
ch_GB9: écouter
ils ont fait un appel dans la presse nationale
ch_GB9: écouter
et ils ont demandé aux gens
ch_GB9: écouter
d'accepter de laisser un magnétophone qui tournait
ch_GB9: écouter
tout le temps dans le séjour
ch_GB9: écouter
c'est quand même un peu spécial comme technique
ch_GB9: écouter
et il disait
ch_GB9: écouter
parmi les choses intéressantes qu'on a eues
ch_GB9: écouter
c'est qu'il y avait quatre familles ou cinq familles qui avaient des ados
ch_GB9: écouter
qui dans
ch_GB9: écouter
[pi:pronounce:instantaneous]
ch_GB9: écouter
les gens ont tourné le dos ils sont arrivés en disant you fuck fuck fuck
ch_GB9: écouter
[rire en fond:noise:instantaneous]
ch_GB9: écouter
hé et euh mais nous ça nous intéresse énormément
ch_GB9: écouter
parce que d'abord
ch_GB9: écouter
[pi:pronounce:instantaneous]
ch_GB9: écouter
[tx:noise:instantaneous]
ch_GB9: écouter
euh
ch_GB9: écouter
est-ce qu'on peut dire qu'un corpus se périme ?
ch_GB9: écouter
pour nous l- euh
ch_GB9: écouter
euh
ch_GB9: écouter
c'est
ch_GB9: écouter
[pi:pronounce:instantaneous] qui disait ça
ch_GB9: écouter
[b:noise:instantaneous] tout le mouvement toute la langue est dans le changement
ch_GB9: écouter
euh les langues changent absolument sans arrêt
ch_GB9: écouter
on a quand même fait un test
ch_GB9: écouter
qui va répondre un tout petit peu à ta question mais qui qui est pas une bonne réponse
ch_GB9: écouter
première chose que l'on constate
ch_GB9: écouter
le palikur qui est une langue orale et cetera
ch_GB9: écouter
change plus vite actuellement que le français
ch_GB9: écouter
on a des enregistrements par nos collègues qui ont été faits il y a trente ans
ch_GB9: écouter
le palikur change beaucoup plus vite que le français
ch_GB9: écouter
c'est pas une langue écrite c'est pas une langue de scolarisation et cetera
ch_GB9: écouter
y a rien qui la retient
ch_GB9: écouter
elle très au contact avec le créole de Guyane avec le français standard
ch_GB9: écouter
et avec le portugais du Brésil
ch_GB9: écouter
donc c'est une langue qui bouge très très vite
ch_GB9: écouter
avec beaucoup d'emprunts et des changements phonétiques en cours extrêmement rapides
ch_GB9: écouter
on on se croirait à peu près dans ce qu'on nous décrit dans l'ancien français
ch_GB9: écouter
dans ces moments de mutation quoi
ch_GB9: écouter
comme la seule fois en un siècle la langue ch- avait complètement changé
ch_GB9: écouter
pour le français on a fait le test avec nos étudiants
ch_GB9: écouter
de leur passer des enregistrements ESLO soixante-huit
ch_GB9: écouter
et ESLO euh deux mille huit
ch_GB9: écouter
alors précision
ch_GB9: écouter
c'est la même personne
ch_GB9: écouter
on a retrouvé dix locuteurs de soixante-huit qu'on a réenregistrés
ch_GB9: écouter
dont une nous a soutenu qu'elle avait jamais été enregistré
ch_GB9: écouter
alors d'un côté y avait son propre enregistrement
ch_GB9: écouter
elle a dit c'est pas la peine je sais bien que c'est pas moi
ch_GB9: écouter
bon on a laissé faire
ch_GB9: écouter
[rire en fond:noise:instantaneous]
ch_GB9: écouter
[conv:noise:instantaneous]
ZR652: écouter
c'est c'est pas toi
ZR652: écouter
[pi:pronounce:instantaneous]
ch_GB9: écouter
non c'est pas moi
ch_GB9: écouter
[rire en fond:noise:instantaneous]
ch_GB9: écouter
en soixante-huit j'étais pas à Orléans
ch_GB9: écouter
euh
ch_GB9: écouter
donc on a on a on a fait une thèse de la comparaison
ch_GB9: écouter
nos étudiants ne peuvent repérer
ch_GB9: écouter
quel est le plus vieil enregistrement qu'à une chose
ch_GB9: écouter
la mauvaise qualité sonore de
ch_GB9: écouter
[pif:pronounce:instantaneous]
ch_GB9: écouter
ils n'ont aucun moyen et nous-mêmes on n'a pas les moyens
ch_GB9: écouter
la seule chose qu'on ne
ch_GB9: écouter
la seule chose qu'on puisse dire
ch_GB9: écouter
c'est que dans les enregistrements de soixante-huit
ch_GB9: écouter
on ne trouve pas certaines choses qu'on s'attendrait à
ch_GB9: écouter
[pi:pronounce:instantaneous]
ch_GB9: écouter
par exemple
ch_GB9: écouter
on ne trouve quasiment jamais
ch_GB9: écouter
la forme OK en soixante-huit
ch_GB9: écouter
[conv:noise:instantaneous]
ch_GB9: écouter
alors qu'aujourd'hui en
ch_GB9: écouter
cinq minutes de d'oral j'en récupère euh quatre
MP087: écouter
et comment vous faites pour
MP087: écouter
[pi:pronounce:instantaneous] vous allez être amenés à faire d'autres corpus oraux ?
ch_GB9: écouter
oh non non on fait que
ch_GB9: écouter
[pi:pronounce:instantaneous]
ch_GB9: écouter
[bruit de chaise:noise:previous]
ch_GB9: écouter
les corpus ça
ch_GB9: écouter
ça s'appelle des jouvences en terme de
ch_GB9: écouter
[pi:pronounce:instantaneous]
ch_GB9: écouter
on fait des jouvences tout le temps tout le temps tout le temps
MP087: écouter
[pi:pronounce:instantaneous]
MP087: écouter
c'est ça ?
ch_GB9: écouter
euh y avait quatre raisons
ch_GB9: écouter
il fallait que ça soit pas Paris
ch_GB9: écouter
il fallait que ça soit près de Paris pour venir facilement
ch_GB9: écouter
il fallait qu'il y ait pas d'accent dialectal marqué
ch_GB9: écouter
comme je vous disais
ch_GB9: écouter
et y avait une quatrième raison
ch_GB9: écouter
[pi:pronounce:instantaneous] universitaire
ch_GB9: écouter
[pi:pronounce:instantaneous]
ch_GB9: écouter
ils ont été un peu déçu
ch_GB9: écouter
[rire en fond:noise:instantaneous]
MP087: écouter
pourquoi pas Paris ?
ch_GB9: écouter
pardon ?
MP087: écouter
pourquoi pas Paris ?
ch_GB9: écouter
parce que Paris est la moins française de toutes les villes
ch_GB9: écouter
[conv:noise:instantaneous]
ch_GB9: écouter
c'est ce qu'on a fait dans la nouvelle enquête ESLO
ch_GB9: écouter
on a une enquête qui s'appelle langues en contact à Orléans
ch_GB9: écouter
nous on a rajouté le français des immigrés
ch_GB9: écouter
parlant français
ch_GB9: écouter
enfin et et leur langue d'origine bien sûr
ch_GB9: écouter
mais on a aussi rajouté du français immigrant
ch_GB9: écouter
alors que les Anglais
ch_GB9: écouter
[pi:pronounce:instantaneous] aucun
ch_GB9: écouter
mais ils n'avaient pas d'exclusion
ch_GB9: écouter
il n'était pas nécessaire d'être né à Orléans
ch_GB9: écouter
ils ont délibérément gardé des gens
ch_GB9: écouter
dont ils savaient parfaitement qu'ils n'étaient orléanais
ch_GB9: écouter
on a un Lorrain qui explique que la charcuterie ici c'est nul
ch_GB9: écouter
[rire en fond:noise:instantaneous]
ch_GB9: écouter
on a un pied-noir
ch_GB9: écouter
on a quelqu'un de l'Ariège c'est le seul qui va
ch_GB9: écouter
[pi:pronounce:instantaneous] le E muet
ch_GB9: écouter
on le reconnaît tout de suite
ch_GB9: écouter
[conv:noise:instantaneous]
ch_GB9: écouter
on peut demander la recette de l'omelette
ch_GB9: écouter
[rire en fond:noise:instantaneous]
ch_GB9: écouter
[pi:pronounce:instantaneous]
ch_GB9: écouter
[rire en fond:noise:instantaneous]
ch_GB9: écouter
euh bon
ch_GB9: écouter
oui
LEC_RH699: écouter
à partir de quand on estime qu'une langue est nouvelle ?
LEC_RH699: écouter
c'est-à-dire euh
LEC_RH699: écouter
quelle est la différence entre les variations d'une langue qui va beaucoup changer
LEC_RH699: écouter
et puis le moment où
LEC_RH699: écouter
[pi:pronounce:instantaneous] vous définissez ça euh ?
ch_GB9: écouter
alors pour nous une euh
ch_GB9: écouter
normalement
ch_GB9: écouter
si on était rigoureux
ch_GB9: écouter
on ne dirait jamais le français
ch_GB9: écouter
on dirait le latin
ch_GB9: écouter
de France euh du vingtième siècle
ch_GB9: écouter
et si on était vraiment rigoureux
ch_GB9: écouter
on dirait l'indo-européen
ch_GB9: écouter
[rire en fond:noise:instantaneous]
ch_GB9: écouter
euh non mais je c'est un exemple qu'on donne toujours
ch_GB9: écouter
mais les Grecs ils disent toujours qu'ils parlent grec hein c'est
ch_GB9: écouter
c'est vraiment par convention que nous utilisons ces langues-là
ch_GB9: écouter
alors notre critère est toujours le même
ch_GB9: écouter
c'est euh
ch_GB9: écouter
c'est la même chose pour les dialectes
ch_GB9: écouter
à partir du moment où il y a plus intercompréhension
ch_GB9: écouter
c'est-à-dire à partir du moment où on estime
ch_GB9: écouter
que même en écoutant longtemps
ch_GB9: écouter
quelqu'un qui parlerait
ch_GB9: écouter
une langue qu'on estime être la nôtre on ne le comprendrait plus
ch_GB9: écouter
je suis pas très sûr du français du seizième siècle à vrai dire
ch_GB9: écouter
mais je pense qu'avec un peu d'accoutumance on y arriverait
ch_GB9: écouter
euh y a qu'à voir déjà notre difficulté avec les Québecquois
ch_GB9: écouter
mais on y arrive au bout d'un moment une fois qu'on a compris que quand ils disent
ch_GB9: écouter
[mertem:pronounce:instantaneous]
ch_GB9: écouter
ça veut dire maritime
ch_GB9: écouter
une fois qu'on a compris ça c'est facile
ch_GB9: écouter
[bruit de porte:noise:instantaneous]
ch_GB9: écouter
[bruit de porte:noise:instantaneous]
ch_GB9: écouter
donc nous c'est pour
ch_GB9: écouter
[pi:pronounce:instantaneous] s'il y a intercompréhension
ch_GB9: écouter
[pi:pronounce:instantaneous]
ch_GB9: écouter
je vais laisser peut-être oui
CBruneau: écouter
oui
CBruneau: écouter
[conv:noise:instantaneous]
FLegouy: écouter
j'ai j'ai lu euh y a déjà déjà n'est-ce pas fort longtemps
FLegouy: écouter
un petit ouvrage qui euh
FLegouy: écouter
qui expliquait que euh il était possible de reconstituer par exemple la la langue des Celtes
FLegouy: écouter
au travers de la langue irlandaise écossaise et euh
FLegouy: écouter
et euh comment dire ? et galloise
FLegouy: écouter
est-ce que
FLegouy: écouter
[pi:pronounce:instantaneous] euh
FLegouy: écouter
en partie bretonne
FLegouy: écouter
est-ce que c'est euh
FLegouy: écouter
tout à fait exact ou pas ?
FLegouy: écouter
est-ce qu'on peut autrement dit
FLegouy: écouter
est-ce qu'on peut reconstituer des langues anciennes qui sont
FLegouy: écouter
qui sont considérées comme disparues au travers de langues euh récentes
FLegouy: écouter
qui existent ?
ch_GB9: écouter
euh on peut reconstituer
ch_GB9: écouter
avec un taux de fiabilité qui est variable selon les données dont on dispose
ch_GB9: écouter
euh en sachant que
ch_GB9: écouter
objectivement pour un linguiste ça va être un peu décevant
ch_GB9: écouter
euh la façon dont réellement ça se prononçait à la limite on s'en moque
ch_GB9: écouter
on va noter ça enfin l'exemple typique c'est c'est celui de l'indo-européen
ch_GB9: écouter
où on note ça avec des signes qui sont de pures conventions
ch_GB9: écouter
si vous avez déjà vu des transcriptions de l'indo-européen
ch_GB9: écouter
sinon vous allez à Wikipédia où de l'indo-européen il y en a
ch_GB9: écouter
vous tapez euh fable euh le le cheval et le mouton
ch_GB9: écouter
euh pour vous sortir cette fable transcrite comme on les transcrit aujourd'hui
ch_GB9: écouter
vous allez voir apparaître H
ch_GB9: écouter
deux petit W en l'air K T petit W en l'air
ch_GB9: écouter
H croix O euh et cetera donc c-
ch_GB9: écouter
euh
FLegouy: écouter
des équations
ch_GB9: écouter
pardon ?
FLegouy: écouter
c'est des équations ?
ch_GB9: écouter
c'est des c'est une sorte d'équation oui
ch_GB9: écouter
euh mais ça nous suffit nous par rapport à ce qu'on veut faire
ch_GB9: écouter
notre objectif est pas de dire je vais vous parler comme le faisait Vercingétorix
ch_GB9: écouter
mais ou enfin peu importe qui euh
ch_GB9: écouter
latin n'existe plus
ch_GB9: écouter
on a en même temps si on voulait reconstituer à peu près la façon dont parlait Vercingétorix
ch_GB9: écouter
je pense qu'on aurait assez de données pour avoir quelque chose
ch_GB9: écouter
qui serait assez réaliste objectivement
ch_GB9: écouter
mais je dirais que pour nous c'est de la prouesse euh
FLegouy: écouter
[tx:noise:instantaneous]
ch_GB9: écouter
c'est pas de la science
ch_GB9: écouter
[conv:noise:instantaneous]
ch_GB9: écouter
sur le gaulois ?
ch_GB9: écouter
sur le gaulois ?
ch_GB9: écouter
on a
ch_GB9: écouter
on a à peu près aujourd'hui euh l'équival- euh
ch_GB9: écouter
en inscription on en a quand même euh
ch_GB9: écouter
je sais pas à à vue de nez je dirais que ça on doit en être entre trois mille et sept mille pages
ch_GB9: écouter
en équivalent
ch_GB9: écouter
ce qui est énorme
ch_GB9: écouter
très souvent répétitif très très très très souvent répétitif
ch_GB9: écouter
mais y en a y en a y en a
ch_GB9: écouter
à force hein
ch_GB9: écouter
mais de quand je dis inscriptions c'est tout hein c'est euh
ch_GB9: écouter
c'est un morceau de mot sur une pièce
ch_GB9: écouter
c'est enfin c'est y a de tout
ch_GB9: écouter
c'est des trucs sur des briques ça peu être n'importe quoi
ch_GB9: écouter
à partir de ça
ch_GB9: écouter
euh le gaulois est une langue indo-européenne
ch_GB9: écouter
donc on connaît un certain nombre de ses principes
ch_GB9: écouter
on a la comparaison avec d'autres familles de de langues celtiques
ch_GB9: écouter
on sait à peu près
ch_GB9: écouter
on a quand même quelques témoignages de transcriptions dans des caractères grecs par les Grecs
ch_GB9: écouter
dans des caractères latins par les Latins
ch_GB9: écouter
on sait comment ont évolué un certain nombre de mots gaulois
ch_GB9: écouter
par des noms propres et cetera
ch_GB9: écouter
si on cumule tout ça les taux de réalisation doivent être forts
ch_GB9: écouter
euh pour donner juste un exemple et on on va peut-être en rester là
ch_GB9: écouter
mais c'est pour la méthode
ch_GB9: écouter
euh prenez le plus grand linguiste du début du vingtième siècle et de la région
ch_GB9: écouter
c'est Antoine Meillet qui est de Châteaumeillant du côté de
ch_GB9: écouter
[b:noise:instantaneous]
ch_GB9: écouter
euh
ch_GB9: écouter
de Saint-Amand-Montrond
ch_GB9: écouter
[interférences téléphone:noise:instantaneous]
ch_GB9: écouter
et nous avons fait un un colloque en hommage de Meillet bien sûr au laboratoire
ch_GB9: écouter
pour rendre hommage à ce monsieur
ch_GB9: écouter
et il y a à côté un site gaulois
ch_GB9: écouter
et euh
ch_GB9: écouter
y a pas grand chose mais enfin y a des petites choses
ch_GB9: écouter
qui ont été exposées dans le musée local
ch_GB9: écouter
et ce musée local c'est l'instituteur le monsieur qui nous fait visiter
ch_GB9: écouter
et il nous f- donc et là tous les indo-européanistes de France et de Navarre étaient venus
ch_GB9: écouter
même de l'étranger
ch_GB9: écouter
et il nous fait visiter son musée et il nous dit voilà c'est une inscription qu'on a trouvée
ch_GB9: écouter
qui est qui est qui est d'ici et y a marqué ça s'adoucit
ch_GB9: écouter
[pi:pronounce:instantaneous]
ch_GB9: écouter
et le malheureux ignorait qu'il y avait là
ch_GB9: écouter
les deux meilleurs spécialistes en monde du euh du gaulois
ch_GB9: écouter
qui disent mais de toute façon peut-être que vous l'avez trouvé là
ch_GB9: écouter
mais c'est du dialecte bourguignon que nous avons là enfin il
ch_GB9: écouter
[rire en fond:noise:instantaneous]
ch_GB9: écouter
et manque de pot évidemment le deuxième n'était pas d'accord en disant
ch_GB9: écouter
ou alors si c'est du bourguignon c'est du bourguignon du sud
ch_GB9: écouter
[rire en fond:noise:instantaneous]
ch_GB9: écouter
et je voyais mon instituteur se décomposer progressivement
ch_GB9: écouter
donc rien que sur une inscription qui n'a pas été très lisible
ch_GB9: écouter
euh deux spécialistes peuvent vous dire tout de suite mais ça c'est tel sous-dialecte c'est
CBruneau: écouter
voilà bien
CBruneau: écouter
merci au-
CBruneau: écouter
[applaude:noise:instantaneous]