ch_GB9:
|
|
euh bon donc je vais m'en passer
|
ch_GB9:
|
|
je vais présenter mon travail en trois grandes parties donc quatre parce que
|
ch_GB9:
|
|
[pi:pronounce:instantaneous]
|
ch_GB9:
|
|
euh la première partie va euh
|
ch_GB9:
|
|
[b:noise:instantaneous] s'intituler d'abord
|
ch_GB9:
|
|
|
ch_GB9:
|
|
le type de données sur lesquelles nous sommes amenés à travailler
|
ch_GB9:
|
|
quand nous faisons de la linguistique
|
ch_GB9:
|
|
le l'objet sur lequel nous travaillons puisqu'on est parti à faire des citations littéraires
|
ch_GB9:
|
|
le nôtre il est plus léger plus soluble dans l'air ça revient dans
|
ch_GB9:
|
|
[pi:pronounce:instantaneous]
|
ch_GB9:
|
|
|
ch_GB9:
|
|
on travaille sur un élément qui est pour nous essentiel qui est la parole
|
ch_GB9:
|
|
euh le discours tel qu'on peut l'entendre
|
ch_GB9:
|
|
et vous le savez son énorme problème
|
ch_GB9:
|
|
c'est que c'est bien notre matériau
|
ch_GB9:
|
|
mais ce matériau-là a un inconvénient terrible
|
ch_GB9:
|
|
c'est que dès qu'on a fini de parler
|
ch_GB9:
|
|
|
ch_GB9:
|
|
nous vérifions chaque année au moment des partiels avec nos étudiants
|
ch_GB9:
|
|
donc premier type de problème
|
ch_GB9:
|
|
on a bien un matériau qui est facilement accessible
|
ch_GB9:
|
|
mais euh qui en quantité à peu près illimité
|
ch_GB9:
|
|
mais en même temps il est extrêmement difficile
|
ch_GB9:
|
|
euh d'en conserver une présence
|
ch_GB9:
|
|
on a ensuite un deuxième état qui lui est plus stable heureusement
|
ch_GB9:
|
|
euh c'est la façon dont notre langue est présente
|
ch_GB9:
|
|
|
ch_GB9:
|
|
elle est présente sous différentes formes
|
ch_GB9:
|
|
à la fois sous la forme de ce qu'on appelle l-
|
ch_GB9:
|
|
le discours intérieur ou la parole intérieure
|
ch_GB9:
|
|
le fait qu'on se parle à soi-même tout le temps
|
ch_GB9:
|
|
elle est aussi présente sous la forme de ce qu'on appelle le stock lexical
|
ch_GB9:
|
|
les les familles de mots trente mille mots que nous avons en tête
|
ch_GB9:
|
|
dont à peu près cinq mille marques commerciales aujourd'hui
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[pi:pronounce:instantaneous]
|
ch_GB9:
|
|
[rire en fond:noise:instantaneous]
|
ch_GB9:
|
|
avec euh le développement de l'économie
|
ch_GB9:
|
|
donc on a ce ce stock qui est présent
|
ch_GB9:
|
|
mais lui présente un défaut très lourd
|
ch_GB9:
|
|
c'est en particulier lui qui nous intéresse en tant que linguistes
|
ch_GB9:
|
|
c'est moins les propos qu'on tient et qu'on dit
|
ch_GB9:
|
|
que ce qui en reste dans la tête des gens
|
ch_GB9:
|
|
mais vous le savez cet élément-là lui a un énorme inconvénient
|
ch_GB9:
|
|
il n'est pas directement observable et accessible
|
ch_GB9:
|
|
et même si on attrape des gens et qu'on les
|
ch_GB9:
|
|
[pi:pronounce:instantaneous] on sait faire
|
ch_GB9:
|
|
euh y a rien dans le cerveau qui va nous indiquer
|
ch_GB9:
|
|
par exemple quelle quelle était la langue que parlait quelqu'un
|
ch_GB9:
|
|
on a aujourd'hui aucun moyen si on nous présente des cerveaux
|
ch_GB9:
|
|
de dire tiens euh vous m'avez encore amené un Chinois
|
ch_GB9:
|
|
c'est impossible avec les éléments que nous avons en tout cas aujourd'hui d'observation
|
ch_GB9:
|
|
d'avoir la moindre prédiction sur ce qu'il y a
|
ch_GB9:
|
|
comment ça se passe dans le cerveau
|
ch_GB9:
|
|
si on prend le fait qu'un élément qui
|
ch_GB9:
|
|
s'évanouit en permanence la parole
|
ch_GB9:
|
|
si on prend le fait qu'on a un élément non observable
|
ch_GB9:
|
|
pour constituer un savoir sur la langue il a fallu quelque chose qui ne s-
|
ch_GB9:
|
|
|
ch_GB9:
|
|
et qui soit un peu plus permanent
|
ch_GB9:
|
|
cette chose-là nous la connaissons
|
ch_GB9:
|
|
|
ch_GB9:
|
|
c'était une invention bah évidemment décisive dans l'histoire de l'humanité
|
ch_GB9:
|
|
et pendant très longtemps on a
|
ch_GB9:
|
|
|
ch_GB9:
|
|
l'étude des langues avec l'étude
|
ch_GB9:
|
|
|
ch_GB9:
|
|
manifestations écrites des langues
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
le nom que nous citons à chaque fois avec faveur et un léger trémolo dans la voix
|
ch_GB9:
|
|
c'est notre espèce de gourou à nous
|
ch_GB9:
|
|
euh comme le dit Saussure euh
|
ch_GB9:
|
|
c'est un petit peu comme si on prétendait étudier l'anatomie
|
ch_GB9:
|
|
en regardant des portraits au musée du Louvre
|
ch_GB9:
|
|
évidemment on peut en déduire quelque chose
|
ch_GB9:
|
|
mais c'est pas exactement ça
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
et euh on n'a pas pu facilement avancer
|
ch_GB9:
|
|
même si on a eu quand même un certain nombre de de progrès dans ce domaine
|
ch_GB9:
|
|
mais on a fini par confondre
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
en oubliant que le fait que cette langue soit écrite
|
ch_GB9:
|
|
entraîne on le verra un certain nombre de propriétés très particulières
|
ch_GB9:
|
|
qui sont objectivement très trompeuses
|
ch_GB9:
|
|
|
ch_GB9:
|
|
je vais juste en donner un exemple
|
ch_GB9:
|
|
la vraie révolution pour nous en linguistique
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
or typiquement si vous travaillez sur des textes écrits c'est quelque chose de
|
ch_GB9:
|
|
pas inutile certes mais de pas très utile
|
ch_GB9:
|
|
lorsqu'on lit des textes on peut les lire avec un accent épouvantable
|
ch_GB9:
|
|
n'importe qui ici parmi nous
|
ch_GB9:
|
|
sauf quelques rares collègues dispersés dans la salle lisant de l'anglais
|
ch_GB9:
|
|
nous en donnerait une démonstration euh
|
ch_GB9:
|
|
on sait très bien que ça n'empêche pas ni
|
ch_GB9:
|
|
[toux en fond:noise:instantaneous]
|
ch_GB9:
|
|
[pi:pronounce:instantaneous] spécialement la compréhension
|
ch_GB9:
|
|
ni en tout cas la compréhension de la personne qui lit
|
ch_GB9:
|
|
ces écrits euh se sont euh bien sûr accumulés
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
jusqu'au dix-neuvième siècle on s'est posé la question
|
ch_GB9:
|
|
est-ce qu'il y a finalement une vraie différence
|
ch_GB9:
|
|
entre ce que nous appelons aujourd'hui un linguiste et ce qu'on appelle un philologue ?
|
ch_GB9:
|
|
quelqu'un qui étudie les textes
|
ch_GB9:
|
|
et très longtemps nous avons pu passer euh
|
ch_GB9:
|
|
horresco referens tamen refero
|
ch_GB9:
|
|
euh pour des espèces de sciences annexes de l'histoire
|
ch_GB9:
|
|
euh les historiens avaient ces textes
|
ch_GB9:
|
|
je dirais qu'ils en avaient l'interprétation
|
ch_GB9:
|
|
|
ch_GB9:
|
|
convoqués pour les aider à élucider tel élément
|
ch_GB9:
|
|
[toux en fond:noise:instantaneous] de langue
|
ch_GB9:
|
|
qui aurait pu euh leur être obscur
|
ch_GB9:
|
|
mais lorsque les historiens travaillent les textes
|
ch_GB9:
|
|
ils ont une petite couche qui les intéresse pas que j'ai déjà mentionnée
|
ch_GB9:
|
|
qui est la façon dont le texte se prononce
|
ch_GB9:
|
|
|
ch_GB9:
|
|
ça les intéresse très peu ils ont donc très peu à faire
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
euh qui n'intéressait pas les historiens
|
ch_GB9:
|
|
qu'est apparue la linguistique au tout début du dix-neuvième siècle en mille huit cent seize
|
ch_GB9:
|
|
lorsqu'on s'est aperçu que cet élément euh sonore
|
ch_GB9:
|
|
[porte:noise:instantaneous]
|
ch_GB9:
|
|
avait comme particularité qu'il se retrouvait même si c'est sous des formes transformées
|
ch_GB9:
|
|
à travers un certain nombre de langues
|
ch_GB9:
|
|
|
ch_GB9:
|
|
ça a été le début de ce qu'on a appelé la grammaire comparée des langues indo-européennes
|
ch_GB9:
|
|
qui ont fondé la première marque de linguistique
|
ch_GB9:
|
|
les autres révolutions qui nous sont arrivées sont deux
|
ch_GB9:
|
|
|
ch_GB9:
|
|
et c'est sur celles-ci que aujourd'hui nous avons un autre regard et un autre rapport
|
ch_GB9:
|
|
euh sur la linguistique et en particulier dans notre laboratoire
|
ch_GB9:
|
|
le premier c'est en mille huit cent soixante-dix-sept lorsque Edison réussit
|
ch_GB9:
|
|
à imprimer sur une plaque de cire
|
ch_GB9:
|
|
|
ch_GB9:
|
|
en anglais dans la langue originale
|
ch_GB9:
|
|
donc enregistre pour sa fille pour la première fois une chanson
|
ch_GB9:
|
|
et euh l'histoire se continuera
|
ch_GB9:
|
|
avec notre ami euh Nipper que tout le monde connaît ici
|
ch_GB9:
|
|
c'est le petit chien de la voix de son maître
|
ch_GB9:
|
|
euh qui euh va porter cette idée
|
ch_GB9:
|
|
que désormais le l'oral la parole
|
ch_GB9:
|
|
est devenue quelque chose qu'on peut rendre permanent
|
ch_GB9:
|
|
ça commence certain temps à avoir des techniques de plus en plus souples
|
ch_GB9:
|
|
mais l'idée qu'il y a de la permanence de la parole
|
ch_GB9:
|
|
entre l'observation directe
|
ch_GB9:
|
|
|
ch_GB9:
|
|
de quelque chose qui n'est pas écrit
|
ch_GB9:
|
|
c'est une révolution qui ne nous appartient pas
|
ch_GB9:
|
|
qui vient euh de la physique
|
ch_GB9:
|
|
[pi:pronounce:instantaneous] électrique
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
on a obtenu très rapidement
|
ch_GB9:
|
|
des milliers des dizaines de milliers des centaines de milliers d'heures d'enregistrements
|
ch_GB9:
|
|
et là s'est posé le deuxième problème
|
ch_GB9:
|
|
c'est que lorsque vous avez toutes ces heures d'enregistrements
|
ch_GB9:
|
|
comment fait-on pour les maîtriser ?
|
ch_GB9:
|
|
pour savoir ce qu'il y a dans une heure d'enregistrement
|
ch_GB9:
|
|
il faut une heure d'écoute
|
ch_GB9:
|
|
si vous voulez savoir ce qu'il y a dans cent heures il faut cent heures d'écoute
|
ch_GB9:
|
|
et au bout de la centième heure
|
ch_GB9:
|
|
vous avez complètement oublié ce qu'il y avait dans la première
|
ch_GB9:
|
|
donc on a eu besoin d'un deuxième outil
|
ch_GB9:
|
|
|
ch_GB9:
|
|
là non plus de la linguistique
|
ch_GB9:
|
|
|
ch_GB9:
|
|
servons très largement qui est l'informatique
|
ch_GB9:
|
|
qui va nous servir on va le voir comment
|
ch_GB9:
|
|
à dominer à maîtriser des données qui sinon
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
et sur lesquelles nous ne pouvons pas avoir de maîtrise
|
ch_GB9:
|
|
voilà pour le la présentation de notre problème et
|
ch_GB9:
|
|
pour le Laboratoire Ligérien de Linguistique
|
ch_GB9:
|
|
nous avons euh investi dans ce champ-là
|
ch_GB9:
|
|
à travers une notion que nous appelons des corpus oraux
|
ch_GB9:
|
|
donc notre problème n'est pas de travailler sur des enregistrements
|
ch_GB9:
|
|
des enregistrements il y en a des milliards d'heures aujourd'hui disponibles
|
ch_GB9:
|
|
|
ch_GB9:
|
|
il doit s'en mettre quelques milliers des dizaines de milliers supplémentaires
|
ch_GB9:
|
|
on ne sait plus quoi faire des enregistrements
|
ch_GB9:
|
|
et c'est là qu'arrive le linguiste
|
ch_GB9:
|
|
[toux en fond:noise:instantaneous] donc ce ne sont plus des corpus
|
ch_GB9:
|
|
|
ch_GB9:
|
|
mais vu l'utilité que nous avons
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[zoraux:pronounce:instantaneous] nous venons sauver la situation en disant
|
ch_GB9:
|
|
[rire en fond:noise:instantaneous]
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[pi:pronounce:instantaneous] faire parler
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[pi:pronounce:instantaneous] vous faire parler
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
euh proposer des solutions
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
euh essayer de voir comment
|
ch_GB9:
|
|
on peut maîtriser ce champ-là
|
ch_GB9:
|
|
|
ch_GB9:
|
|
dans le champ déjà de la bibliothèque du
|
ch_GB9:
|
|
[pi:pronounce:instantaneous]
|
ch_GB9:
|
|
avec les études sur le livre
|
ch_GB9:
|
|
|
ch_GB9:
|
|
très progressivement au point des techniques
|
ch_GB9:
|
|
|
ch_GB9:
|
|
en gros de savoir ce qu'il y a dans un livre sans jamais le lire
|
ch_GB9:
|
|
ça aussi nos étudiants savent faire
|
ch_GB9:
|
|
euh et bien de la même manière
|
ch_GB9:
|
|
on va essayer de trouver une technique
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
d'identifier le plus rapidement possible ce qu'il peut y avoir
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[toux en fond:noise:previous]
|
ch_GB9:
|
|
sans être obligé de les réécouter systématiquement
|
ch_GB9:
|
|
ou de telle manière qu'on puisse aller comme il y a un index dans les livres
|
ch_GB9:
|
|
aller chercher l'information exactement là où elle est
|
ch_GB9:
|
|
|
ch_GB9:
|
|
pour cela il nous faut construire des objets d'observation
|
ch_GB9:
|
|
d'ailleurs on ne se contente pas d'aller récupérer des heures d'enregistrements
|
ch_GB9:
|
|
et de dire bon bah on va voir ce qu'on peut en faire
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
je vais vous le dire par la suite
|
ch_GB9:
|
|
qui est ce que l'on appelle
|
ch_GB9:
|
|
|
ch_GB9:
|
|
alors si on dit des corpus oraux
|
ch_GB9:
|
|
euh ça veut dire que c'est pas exactement de simples enregistrements
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
des propriétés qui vont nous servir à
|
ch_GB9:
|
|
être opératoires sur d'abord
|
ch_GB9:
|
|
des langues qui n'ont pas d'écriture
|
ch_GB9:
|
|
notre problème n'est pas spécialement d'étudier des langues à écriture
|
ch_GB9:
|
|
je vous l'ai même dit ça a été longtemps un obstacle pour nous
|
ch_GB9:
|
|
notre problème est au contraire d'étudier des langues sans écriture
|
ch_GB9:
|
|
des langues sans écriture aujourd'hui
|
ch_GB9:
|
|
pour aller très vite on estime
|
ch_GB9:
|
|
|
ch_GB9:
|
|
c'est à prendre avec toutes les précautions d'usage
|
ch_GB9:
|
|
on estime qu'il y a à peu près sept mille langues sur Terre
|
ch_GB9:
|
|
on estime qu'il y en a au moins cinq mille
|
ch_GB9:
|
|
qui ne sont pas transcrites ou pas transcrites d'une façon
|
ch_GB9:
|
|
[b:noise:instantaneous] accessible satisfaisante correcte
|
ch_GB9:
|
|
c'est-à-dire qu'il peut y en avoir qui ont été transcrites comme ça
|
ch_GB9:
|
|
par quelqu'un qui s'est essayé
|
ch_GB9:
|
|
|
ch_GB9:
|
|
à transcrire sa propre langue
|
ch_GB9:
|
|
mais pour que ce soit à peu près utilisable
|
ch_GB9:
|
|
on estime donc qu'il y a déjà aujourd'hui cinq mille langues à peu près
|
ch_GB9:
|
|
dont la plupart extrêmement menacées
|
ch_GB9:
|
|
plusieurs centaines dont moins de vingt personnes qui les parlent
|
ch_GB9:
|
|
|
ch_GB9:
|
|
des langues demain mortes
|
ch_GB9:
|
|
une langue à vingt personnes a à peu près aucune chance aujourd'hui d'être d'être sauvée
|
ch_GB9:
|
|
ça va servir aussi pour repérer
|
ch_GB9:
|
|
euh ce que sont les éléments dans les langues
|
ch_GB9:
|
|
qui ne sont pas observables
|
ch_GB9:
|
|
|
ch_GB9:
|
|
tout à l'heure j'écoutais Bernard Gratuze
|
ch_GB9:
|
|
co- mais comme j'écoute jamais
|
ch_GB9:
|
|
ce que ra- disent les gens mais justement la façon dont ils le disent
|
ch_GB9:
|
|
c'est pour ça que j'ai toujours l'air d'écouter
|
ch_GB9:
|
|
|
ch_GB9:
|
|
tout à l'heure Bernard Gratuze par exemple nous a d- nous a parlé de l'arsenic
|
ch_GB9:
|
|
[arsnic:pronounce:instantaneous]
|
ch_GB9:
|
|
|
ch_GB9:
|
|
E hein y a un E mais il ne l'a pas réalisé
|
ch_GB9:
|
|
|
ch_GB9:
|
|
Jean Garrigues vous l'avez peut-être noté
|
ch_GB9:
|
|
euh parle comme à Sciences Po
|
ch_GB9:
|
|
il met toujours l'accent tonique sur la première syllabe
|
ch_GB9:
|
|
hé bien si on a le texte de Bernard euh Gratuze ou celui de Jean Garrigues
|
ch_GB9:
|
|
on n'aura aucun moyen savoir que euh
|
ch_GB9:
|
|
Jean Guar- euh Bernard Gratuze ne prononce pas le E
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[pi:pronounce:instantaneous] de l'arsenic
|
ch_GB9:
|
|
et euh que Jean Garrigues accentue sur la première
|
ch_GB9:
|
|
mais néanmoins n'allonge pas la longueur de la voyelle
|
ch_GB9:
|
|
euh comment on pourrait s'y attendre dans ce cas-là
|
ch_GB9:
|
|
il continue bien à garder l'allongement sur la dernière syllabe
|
ch_GB9:
|
|
ces indications-là vous n'avez aucun moyen de les repérer
|
ch_GB9:
|
|
sur des textes écrits aucun
|
ch_GB9:
|
|
|
ch_GB9:
|
|
c'est ce on ne l'indique pas tout simplement
|
ch_GB9:
|
|
de même qu'on n'indique pas que à tel moment la voix a pu trembler
|
ch_GB9:
|
|
ou qu'elle est pu être en maximum
|
ch_GB9:
|
|
|
ch_GB9:
|
|
tous ces éléments-là nous pourtant on veut les préserver
|
ch_GB9:
|
|
et on veut les préserver pour en faire une étude scientifique
|
ch_GB9:
|
|
|
ch_GB9:
|
|
alors qu'est-ce qu'on appelle le corpus ?
|
ch_GB9:
|
|
c'est ce sont des enregistrements
|
ch_GB9:
|
|
évidemment de toute façon
|
ch_GB9:
|
|
y a pas d'autres solutions autrefois
|
ch_GB9:
|
|
on a commencé je vous l'ai dit avec des rouleaux on a fait ensuite sur de la cire
|
ch_GB9:
|
|
y a eu le moment où y avait les fils magnétiques
|
ch_GB9:
|
|
avant les bandes magnétiques c'est du fil en métal
|
ch_GB9:
|
|
euh y a eu un très grand nombre de
|
ch_GB9:
|
|
[pi:pronounce:instantaneous] y a eu les disques sur vinyle y a euh
|
ch_GB9:
|
|
aujourd'hui c'est des enregistrements numériques évidemment
|
ch_GB9:
|
|
c'est des enregistrements qu'on essaie d'avoir dans une qualité le plus supportable possible
|
ch_GB9:
|
|
après on fait pas toujours dans l'idéal vous imaginez
|
ch_GB9:
|
|
si nous enregistrons ici les bruits de porte de retardataire bonjour
|
ch_GB9:
|
|
|
ch_GB9:
|
|
donc tous ces petits problèmes que nous pouvons avoir lorsqu'il y a de de l'enregistrement
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
des principes de représentativité
|
ch_GB9:
|
|
il nous faut des éléments les plus divers possibles
|
ch_GB9:
|
|
on verra que c'est une clause qui n'a pas été très tôt respectée
|
ch_GB9:
|
|
il faut que ces éléments soient exploitables
|
ch_GB9:
|
|
de façon non destructive ça nos camarades savent faire
|
ch_GB9:
|
|
euh mais euh non seulement de façon non
|
ch_GB9:
|
|
non destructive mais comment dire avec un affreux anglicisme de façon versatile
|
ch_GB9:
|
|
|
ch_GB9:
|
|
y a au fond c'est mieux si ça peut servir aussi
|
ch_GB9:
|
|
à des sociologues à des historiens à des économistes
|
ch_GB9:
|
|
et pas seulement à des linguistes qui veulent étudier
|
ch_GB9:
|
|
|
ch_GB9:
|
|
on souhaite qu'ils soient
|
ch_GB9:
|
|
catalogués dans un format qui soit accessible
|
ch_GB9:
|
|
et là on n'est pas au bout de nos peines
|
ch_GB9:
|
|
on a organisé ici y a trois ans un
|
ch_GB9:
|
|
|
ch_GB9:
|
|
colloque international de Catcod catalogage codage
|
ch_GB9:
|
|
|
ch_GB9:
|
|
et on a du mal à faire le deuxième
|
ch_GB9:
|
|
parce que on s'est déjà tous tellement disputé qu'on ne sait plus comment
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[pi:pronounce:instantaneous]
|
ch_GB9:
|
|
[rire en fond:noise:instantaneous]
|
ch_GB9:
|
|
|
ch_GB9:
|
|
euh et ça c'est et de loin le plus long
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
parce que quoi qu'on en pense on ne sait pas aujourd'hui
|
ch_GB9:
|
|
chercher un mot dans un enregistrement
|
ch_GB9:
|
|
on peut espérer le retrouver
|
ch_GB9:
|
|
|
ch_GB9:
|
|
certaines chances selon la qualité de l'enregistrement de le repérer
|
ch_GB9:
|
|
mais si on prend un enregistrement de deux heures
|
ch_GB9:
|
|
[b:noise:instantaneous] et on veut savoir si quelqu'un dedans a prononcé
|
ch_GB9:
|
|
n'importe quoi mettons Mélenchon
|
ch_GB9:
|
|
|
ch_GB9:
|
|
si on veut savoir si quelqu'un a dit Mélenchon
|
ND454:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[rire en fond:noise:instantaneous]
|
ch_GB9:
|
|
[conv:noise:instantaneous]
|
VD276:
|
|
|
VD276:
|
|
[conv:noise:instantaneous]
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
n'est pas un terme suffisamment caractéristique en français
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
et on risque de sortir tout un tas de formes du type mélangeons enfin et cetera
|
ch_GB9:
|
|
qui sont beaucoup trop proches phonétiquement
|
ch_GB9:
|
|
donc on va être obligé de transcrire et ça c'est atrocement long
|
ch_GB9:
|
|
euh pour vous donner une idée quelqu'un de très entraîné qui fait une bonne transcription
|
ch_GB9:
|
|
c'est une heure pour trois minutes
|
ch_GB9:
|
|
et on considère qu'il faut que trois personnes fassent la même transcription
|
ch_GB9:
|
|
pour vérifier que c'est à peu près valable
|
ch_GB9:
|
|
ce qui veut dire que quand on a euh
|
ch_GB9:
|
|
en gros pour une minute une heure c'est à peu près le temps où il faut payer des gens
|
ch_GB9:
|
|
donc vous imaginez euh l'esclavage qu'il faut développer
|
ch_GB9:
|
|
c'est pour ça que nous cherchons des étudiants en linguistique
|
ch_GB9:
|
|
[rire en fond:noise:instantaneous]
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[pi:pronounce:instantaneous]
|
ch_GB9:
|
|
euh il faut que cette transcription soit dans un format
|
ch_GB9:
|
|
qui soit encore lisible dans cinq ans dans dix ans dans cinquante ans dans deux cents ans
|
ch_GB9:
|
|
or tout ça se fait sous des formes informatiques
|
ch_GB9:
|
|
donc autant vous dire que nous avons quelques inquiétudes et quelques soucis
|
ch_GB9:
|
|
et enfin euh et c'est tout ça un corpus
|
ch_GB9:
|
|
et ça c'est la partie vraiment qui nous passionne le plus
|
ch_GB9:
|
|
parce que les transcriptions faut les faire mais bon c'est pas très drôle
|
ch_GB9:
|
|
il faut que ce corpus soit lui-même associé
|
ch_GB9:
|
|
|
ch_GB9:
|
|
qui vont les identifier et un certain nombre d'outils
|
ch_GB9:
|
|
|
ch_GB9:
|
|
une première forme de traitement automatique
|
ch_GB9:
|
|
alors on a des outils pour reconnaître par exemple
|
ch_GB9:
|
|
euh automatiquement les catégories grammaticales
|
ch_GB9:
|
|
on a des outils qui vont faire l'analyse syntaxique des phrases
|
ch_GB9:
|
|
avec des taux d'échec qui sont variables
|
ch_GB9:
|
|
[b:noise:instantaneous] selon les outils
|
ch_GB9:
|
|
mais qui aujourd'hui sont relativement bas
|
ch_GB9:
|
|
en tout cas le traitement automatique est très très très largement supérieur
|
ch_GB9:
|
|
à ce que nous pourrions faire
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
parce que de toute façon c'est ou les machines qui reconnaissent les catégories des mots
|
ch_GB9:
|
|
ou c'est l'étudiant qu'on paye pour le faire
|
ch_GB9:
|
|
et la machine fait plutôt moins de fautes finalement que l'étudiant
|
ch_GB9:
|
|
[toux en fond:noise:instantaneous]
|
ch_GB9:
|
|
voilà donc ce que sont nos corpus oraux
|
ch_GB9:
|
|
une fois qu'on les a euh constitués donc comme je vous l'ai dit
|
ch_GB9:
|
|
euh c'est une opération qui est très longue
|
ch_GB9:
|
|
|
ch_GB9:
|
|
dans la présentation dans notre dossier
|
ch_GB9:
|
|
donc ce que nous avons négocié avec le ministère notre reconnaissance
|
ch_GB9:
|
|
|
ch_GB9:
|
|
on est arrivé à peu près à l'idée qu'il y a soixante-quinze opérations
|
ch_GB9:
|
|
du moment où on commence à se dire
|
ch_GB9:
|
|
|
ch_GB9:
|
|
au moment où il est là livré en état absolument fini
|
ch_GB9:
|
|
ça représente un avantage c'est qu'on peut toujours dire au ministère
|
ch_GB9:
|
|
que c'est presque fini mais
|
ch_GB9:
|
|
soixante-quinze comprenez il en reste encore euh
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
je vais en reparler aussi c'est que c'est un travail qui est à peu près infini
|
ch_GB9:
|
|
|
ch_GB9:
|
|
quand est-ce qu'un corpus peut être considéré comme ayant été terminé
|
ch_GB9:
|
|
c'est-à-dire même si on a un nombre d'heures fini
|
ch_GB9:
|
|
à partir de quel moment on peut considérer de façon exhaustive
|
ch_GB9:
|
|
|
ch_GB9:
|
|
on l'a traité d'une façon qui soit satisfaisante
|
ch_GB9:
|
|
et puis enfin je vous ai indiqué rapidement euh la quantité de temps que ça prend
|
ch_GB9:
|
|
aujourd'hui au niveau européen
|
ch_GB9:
|
|
on est en train d'engager j'étais encore ce matin
|
ch_GB9:
|
|
une opération générale pour avoir des corpus de référence
|
ch_GB9:
|
|
dans les principales langues
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[pi:pronounce:instantaneous]
|
ch_GB9:
|
|
|
ch_GB9:
|
|
c'est euh il faut compter
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
alors pour vous donner un ordre d'idées
|
ch_GB9:
|
|
le corpus qui est prévu pour le français
|
ch_GB9:
|
|
est actuellement situé entre trois et six millions de mots
|
ch_GB9:
|
|
donc euh hein on on fait conversion
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
que de trouver trois à six millions d'euros
|
ch_GB9:
|
|
et euh nous allons enfin pouvoir donner l'outil que la France attend
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
alors dans tout ça vous avez dû noter que je vous ai parlé d'à peu près tout
|
ch_GB9:
|
|
sauf de ce que nous fabriquons concrètement
|
ch_GB9:
|
|
euh hé bien on va en parler maintenant
|
ch_GB9:
|
|
puisque euh beaucoup de gens ici euh notre vice-président du conseil scientifique est venu
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[toux en fond:noise:previous]
|
ch_GB9:
|
|
si on travaillait vraiment
|
ch_GB9:
|
|
donc je vais vous dire que fait le Laboratoire Ligérien de Linguistique
|
ch_GB9:
|
|
à part demander des lignes de crédit
|
ch_GB9:
|
|
[pi:pronounce:instantaneous]
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
nous notre travail c'est de faire on est linguiste
|
ch_GB9:
|
|
|
ch_GB9:
|
|
c'est de faire une analyse scientifique des langues
|
ch_GB9:
|
|
c'est la définition qu'on donne traditionnellement à notre discipline
|
ch_GB9:
|
|
|
ch_GB9:
|
|
et dans ces langues d'abord des langues qui sont
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
comme tout laboratoire de linguistique un peu sérieux
|
ch_GB9:
|
|
nous avons ce que nous appelons un portefeuille de langues
|
ch_GB9:
|
|
c'est-à-dire quelques langues qui ne s'étudient que à Orléans
|
ch_GB9:
|
|
euh ou bien euh dans euh deux ou trois autres endroits maximum dans le monde évidemment
|
ch_GB9:
|
|
alors vous savez avec sept mille langues y a de quoi nourrir beaucoup de monde heureusement
|
ch_GB9:
|
|
donc nous on a dans notre portefeuille de langues une petite dizaine de langues
|
ch_GB9:
|
|
où il y a ici le spécialiste mondial
|
ch_GB9:
|
|
euh ou bien un des deux trois quatre spécialistes au monde
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
notre doyen vous a cité pour euh pour commencer on
|
ch_GB9:
|
|
je vais très rapidement les rappeler donc nous avons un portefeuille sur
|
ch_GB9:
|
|
une demande du ministère d'outre-mer
|
ch_GB9:
|
|
|
ch_GB9:
|
|
qui sont donc des langues de France
|
ch_GB9:
|
|
ces gens-là étaient français bien avant le savoyard
|
ch_GB9:
|
|
euh bah eux ils étaient pas au courant les savoyards si normalement
|
ch_GB9:
|
|
[rire en fond:noise:instantaneous] euh
|
ch_GB9:
|
|
|
ch_GB9:
|
|
donc euh trois langues euh
|
ch_GB9:
|
|
qui sont parlées en Guyane française
|
ch_GB9:
|
|
le palikur le wayana et wayampi qui appartiennent à trois familles
|
ch_GB9:
|
|
|
ch_GB9:
|
|
on travaille surtout sur le palikur mais aussi sur les deux autres
|
ch_GB9:
|
|
on a euh deux langues euh au Burkina Faso
|
ch_GB9:
|
|
l'une dont on vient de sortir l'ouvrage enfin
|
ch_GB9:
|
|
euh la société linguistique
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[pi:pronounce:instantaneous]
|
ch_GB9:
|
|
[toux en fond:noise:instantaneous]
|
ch_GB9:
|
|
et l'autre qui s'appelle le sèmè sur lesquels nous commençons les études
|
ch_GB9:
|
|
euh le Burkina Faso a quarante-neuf langues
|
ch_GB9:
|
|
donc euh y a encore un peu de la marge pour continuer enfin certains les décrivent
|
ch_GB9:
|
|
euh nous avons une langue du Nigéria
|
ch_GB9:
|
|
[pi:pronounce:instantaneous] une langue au Cameroun le samba leko
|
ch_GB9:
|
|
et euh les créoles à base portugaise
|
ch_GB9:
|
|
parce que y a pas que des langues qui disparaissent y a aussi des langues qui apparaissent
|
ch_GB9:
|
|
nous avons une collègue ici qui a travaillé sur une mixing language
|
ch_GB9:
|
|
une langue qui apparait an contact de deux langues
|
ch_GB9:
|
|
celle-ci est apparue au contact du français et de l'anglais
|
ch_GB9:
|
|
Marie-Eve Perrot donc le chiac en au Nouveau-Brunswick au Canada
|
ch_GB9:
|
|
et aussi euh sur les créoles à base portugaise
|
ch_GB9:
|
|
où Orléans est le plus important centre mondial d'étude du créole à base portugaise
|
ch_GB9:
|
|
car c'est le seul endroit au monde où il y a deux personnes qui travaillent sur cette spécialité
|
ch_GB9:
|
|
[pi:pronounce:instantaneous]
|
ch_GB9:
|
|
d'ailleurs y en a une dizaine au monde
|
ch_GB9:
|
|
donc des créoles qui se parlent au Cap-Vert en Casamance au Sénégal euh
|
ch_GB9:
|
|
en Guinée-Bissau et à Sao Tomé-et-Principe
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
donc d'une part on a ces langues-là mais
|
ch_GB9:
|
|
je vous rassure on travaille aussi sur des langues dont vous connaissez le nom
|
ch_GB9:
|
|
comme le chinois par exemple euh
|
ch_GB9:
|
|
|
ch_GB9:
|
|
puisque nous avons ici une doctorante qui travaille euh
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
nous avons euh des langues
|
ch_GB9:
|
|
comme le l'espagnol nous avons des langues comme l'allemand
|
ch_GB9:
|
|
|
ch_GB9:
|
|
euh ça c'est surtout nos collègues de Tours qui sont très
|
ch_GB9:
|
|
beaucoup plus pointus que nous là-dessus
|
ch_GB9:
|
|
et puis euh inévitablement
|
ch_GB9:
|
|
euh celle que vous attendez tous le français
|
ch_GB9:
|
|
oui nous travaillons aussi sur le français
|
ch_GB9:
|
|
nous travaillons d'ailleurs surtout sur le français
|
ch_GB9:
|
|
pour une raison qui s'explique de façon assez simple
|
ch_GB9:
|
|
c'est que nous sommes des enseignants chercheurs
|
ch_GB9:
|
|
et que pour l'enseignement euh
|
ch_GB9:
|
|
bah on est quand même beaucoup plus sollicité par le français
|
ch_GB9:
|
|
que par les autres langues
|
ch_GB9:
|
|
ce qui fait que nous avons ici
|
ch_GB9:
|
|
euh plus de collègues qui travaillent sur le français que sur d'autres langues
|
ch_GB9:
|
|
|
ch_GB9:
|
|
euh cette ce déséquilibre
|
ch_GB9:
|
|
alors sur quel euh type de données travaillons-nous ?
|
ch_GB9:
|
|
nous avons eu une chance de pendu à Orléans et je parle pas de Jeanne d'Arc pour cette fois
|
ch_GB9:
|
|
mais je parle des Anglais
|
ch_GB9:
|
|
|
ch_GB9:
|
|
en mille neuf cent cinq- euh soixante
|
ch_GB9:
|
|
les travaillistes arrivent au pouvoir en Angleterre
|
ch_GB9:
|
|
et décident qu'on va moderniser l'enseignement des langues
|
ch_GB9:
|
|
ce fut déjà une mini embuscade comme endroit
|
ch_GB9:
|
|
euh on va moderniser l'enseignement des langues
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
les deux grandes révolutions qui viennent d'arriver l'informatique
|
ch_GB9:
|
|
|
ch_GB9:
|
|
donc ils décident de c'est le français donc à l'époque
|
ch_GB9:
|
|
et de très loin la langue la plus enseignée
|
ch_GB9:
|
|
la langue étrangère la plus enseignée en Angleterre
|
ch_GB9:
|
|
ils décident donc de donner
|
ch_GB9:
|
|
à leurs élèves un enseignement avec de l'audio avec des magnétophones
|
ch_GB9:
|
|
et donc il leur faut des enregistrements de français
|
ch_GB9:
|
|
ils demandent au ministère de l'éducation en France et au ministère de la culture
|
ch_GB9:
|
|
d'ouvrir toutes les archives disponibles
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[pi:pronounce:instantaneous] des droits d'auteur est vraiment associé
|
ch_GB9:
|
|
et très libéralement l'Etat français
|
ch_GB9:
|
|
euh autorisera les Anglais
|
ch_GB9:
|
|
ils avaient pour habitude de faire du commerce avec nous
|
ch_GB9:
|
|
autorisera les Anglais à venir exploiter toutes les données sonores disponibles du français
|
ch_GB9:
|
|
et la réponse après exportation des archives
|
ch_GB9:
|
|
c'est qu'il n'y a pas plus de quatre minutes
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[pi:pronounce:instantaneous] exploitable
|
ch_GB9:
|
|
par rapport à leur projet
|
ch_GB9:
|
|
il y a tout le français de la radio et de la télé comme on
|
ch_GB9:
|
|
comme disent poliment nos collègues anglais
|
ch_GB9:
|
|
les gens s'écoutent parler mais c'était dans les années soixante hein ça a changé
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
ils avaient surtout beaucoup espéré
|
ch_GB9:
|
|
parce qu'il y avait eu une grande enquête dans les années cinquante
|
ch_GB9:
|
|
pour le français fondamental
|
ch_GB9:
|
|
ce qui servait à faire les listes de fréquence du vocabulaire le plus usuel
|
ch_GB9:
|
|
mais ceux qui avaient fait le français fondamental
|
ch_GB9:
|
|
on leur avait expliqué qu'une bande magnétique coûtait très cher
|
ch_GB9:
|
|
et qu'il fallait effacer au fur et à mesure
|
ch_GB9:
|
|
donc on transcrivait on effaçait on transcrivait on effaçait
|
ch_GB9:
|
|
|
ch_GB9:
|
|
pas une bande magnétique du français fondamental des années cinquante
|
ch_GB9:
|
|
qui sont pourtant très intéressantes
|
ch_GB9:
|
|
et qui avait donné du travail à des tas de gens pour faire des transcriptions
|
ch_GB9:
|
|
pour un pauvre type de chômeur qui s'appelait Roland Barthes
|
ch_GB9:
|
|
qui a été transcripteur pour le français fondamental
|
ch_GB9:
|
|
comme quoi ça peut servir
|
ch_GB9:
|
|
|
ch_GB9:
|
|
comme les Anglais n'ont plus d-
|
ch_GB9:
|
|
n'ont pas de données ils décident de faire eux-mêmes l'enquête
|
ch_GB9:
|
|
et ils choisissent la plus belle ville du monde sur le bord de la Loire
|
ch_GB9:
|
|
et ils vont donc venir à Orléans pour faire cette enquête
|
ch_GB9:
|
|
trois cent cinquante heures d'enregistrements
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[pi:pronounce:instantaneous]
|
ch_GB9:
|
|
ils vont d'une part identifier les données
|
ch_GB9:
|
|
et deuxièmement les conserver
|
ch_GB9:
|
|
donc au lieu de tout effacer
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
bon c'est des transcriptions faites par des Anglais
|
ch_GB9:
|
|
ils sont assez fautifs quand même faut bien le dire
|
ch_GB9:
|
|
mais quand même l'effort était louable
|
ch_GB9:
|
|
euh en plus ils ont transcrit à la main
|
ch_GB9:
|
|
[pi:pronounce:instantaneous] au crayon
|
ch_GB9:
|
|
|
ch_GB9:
|
|
mais néanmoins il y a eu cette idée et
|
ch_GB9:
|
|
euh si vous allez aujourd'hui sur internet euh les livres d'occasion
|
ch_GB9:
|
|
vous tapez les Orléanais ont la parole
|
ch_GB9:
|
|
et vous n'aurez pas le programme politique de monsieur Grouard
|
ch_GB9:
|
|
mais vous aurez le manuel de base des Anglais de cette époque-là
|
ch_GB9:
|
|
avec des photos touchantes
|
ch_GB9:
|
|
|
ZR652:
|
|
|
ch_GB9:
|
|
|
ZR652:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ZR652:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[rire:noise:instantaneous]
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
euh la joie de retrouver des paysages qui vous sont familiers
|
ch_GB9:
|
|
et des gens qui euh que vous entendrez interviewés euh
|
ch_GB9:
|
|
bah euh je suis boucher je pèse je sais pas moi soixante kilos de viande
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[pi:pronounce:instantaneous] les enregistrements qui servaient de
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
euh c'est évidemment un document tout à fait merveilleux et euh
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[b:noise:instantaneous] ils ont peu de choses
|
ch_GB9:
|
|
il se passe peu de choses dans leur histoire euh
|
ch_GB9:
|
|
en politique intérieure mais sans emprunts ils passent des travaillistes aux conservateurs
|
ch_GB9:
|
|
et madame Thatcher ayant coupé les crédits de l'université
|
ch_GB9:
|
|
les Anglais nous ont appelé un jour pour nous dire
|
ch_GB9:
|
|
si vous venez pas chercher tout ça on le met à la poubelle
|
ch_GB9:
|
|
bon alors on a donc récupéré les archives elles sont elles sont ici au laboratoire
|
ch_GB9:
|
|
et du coup ça nous a un petit peu suscité pour refaire la même enquête
|
ch_GB9:
|
|
donc nous sommes dans de la confection d'un
|
ch_GB9:
|
|
alors cette enquête s'appelait Eslo enquête sociolinguistique à Orléans
|
ch_GB9:
|
|
et nous sommes dans donc Eslo deux maintenant nous faisons la même enquête la même
|
ch_GB9:
|
|
on a transposé évidemment
|
ch_GB9:
|
|
par rapport aux aux données du temps
|
ch_GB9:
|
|
|
ch_GB9:
|
|
à euh quarante ans d'intervalle et avec les mêmes euh exigences
|
ch_GB9:
|
|
ce qui va nous permettre de mesurer y compris
|
ch_GB9:
|
|
|
ch_GB9:
|
|
à travers euh les classes
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[interférences téléphone:noise:instantaneous] d'il y a quarante ans
|
ch_GB9:
|
|
parlent comme les femmes d'aujourd'hui par rapport à ce que les
|
ch_GB9:
|
|
|
ch_GB9:
|
|
il y a quarante ans on parlait comme les hommes d'aujourd'hui ?
|
ch_GB9:
|
|
est-ce que les ouvriers d'il y a quarante ans parlent comme les hommes
|
ch_GB9:
|
|
les ouvriers d'aujourd'hui ? et cetera
|
ch_GB9:
|
|
donc on va pouvoir euh on peut on a commencé heureusement
|
ch_GB9:
|
|
on peut faire cette comparaison et
|
ch_GB9:
|
|
comme il n'y a que les Anglais qui avaient fait des enregistrements
|
ch_GB9:
|
|
il n'y a qu'à Orléans que nous puissions
|
ch_GB9:
|
|
[pi:pronounce:instantaneous]
|
ch_GB9:
|
|
c'est ce qu'on appelle une situation de monopole
|
ch_GB9:
|
|
c'est très avantageux et ça nous sert énormément
|
ch_GB9:
|
|
à obtenir de temps en temps euh quelques
|
ch_GB9:
|
|
[pi:pronounce:instantaneous]
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[pi:pronounce:instantaneous]
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
est intéressante à énormément d'égards
|
ch_GB9:
|
|
d'abord parce qu'à l'époque on n'avait pas de problèmes juridiques
|
ch_GB9:
|
|
euh nous on a passé à peu près la moitié de notre temps à savoir
|
ch_GB9:
|
|
comment il fallait faire l'autorisation juridique pour les gens
|
ch_GB9:
|
|
|
ch_GB9:
|
|
enfin on a on a un modèle qui aujourd'hui est considéré comme à peu près le plus supportable
|
ch_GB9:
|
|
mais on n'est même pas sûr que ça va se passer
|
ch_GB9:
|
|
alors qu'à l'époque par exemple on a des dizaines d'heures d'entretiens
|
ch_GB9:
|
|
de mères de famille sur les problèmes scolaires de leurs enfants
|
ch_GB9:
|
|
avec des conseillers psychopédagogiques
|
ch_GB9:
|
|
euh des choses absolument euh
|
ch_GB9:
|
|
donc aujourd'hui on ne peut plus obtenir ça
|
ch_GB9:
|
|
|
ch_GB9:
|
|
on a euh la chef du personnel de chez Servier
|
ch_GB9:
|
|
qui explique comment euh ça se gère
|
ch_GB9:
|
|
[rire en fond:noise:instantaneous]
|
ch_GB9:
|
|
[pi:pronounce:instantaneous]
|
ch_GB9:
|
|
je vais peut-être en faire quelque chose
|
ch_GB9:
|
|
[pi:pronounce:instantaneous]
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
l'énorme avantage c'est que les collègues Anglais qui ont fait ça
|
ch_GB9:
|
|
étaient eux-mêmes de vrais linguistes
|
ch_GB9:
|
|
et on a des données qui sont extrêmement originales pour l'époque
|
ch_GB9:
|
|
une de celles qui nous intéressent le plus
|
ch_GB9:
|
|
|
ch_GB9:
|
|
ce sont des enregistrements faits en
|
ch_GB9:
|
|
|
ch_GB9:
|
|
donc on a toutes le données sur les personnes y compris des données très complètes
|
ch_GB9:
|
|
puisqu'une des questions c'est pour qui votez-vous ?
|
ch_GB9:
|
|
aujourd'hui c'est une question qu'on ne peut plus poser
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[pi:pronounce:instantaneous] très clair
|
ch_GB9:
|
|
[rire en fond:noise:instantaneous]
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
à quel syndicat appartenez-vous ?
|
ch_GB9:
|
|
on avait des questions euh
|
ch_GB9:
|
|
qui aujourd'hui euh on aura un peu plus de euh de tact pour les poser on s'en doute
|
ch_GB9:
|
|
en tout cas nous on les pose plus
|
ch_GB9:
|
|
|
ch_GB9:
|
|
ou du moins pas directement
|
ch_GB9:
|
|
[rire en fond:noise:instantaneous]
|
ch_GB9:
|
|
|
ch_GB9:
|
|
donc on a euh des données et i- ils ont pensé à poser des questions extrêmement intéressantes
|
ch_GB9:
|
|
et notamment une sur laquelle on a énormément travaillé de manière collective
|
ch_GB9:
|
|
|
ch_GB9:
|
|
voilà alors maintenant je vais vous poser une question qui peut-être va vous faire rire
|
ch_GB9:
|
|
mais je la pose quand même
|
ch_GB9:
|
|
|
ch_GB9:
|
|
dites-moi monsieur hm comment est-ce qu'on fait une omelette
|
ch_GB9:
|
|
|
ch_GB9:
|
|
et ils vont poser à une centaine de personnes la question
|
ch_GB9:
|
|
comment est-ce qu'on fait une omelette ?
|
ch_GB9:
|
|
alors pour un linguiste c'est merveilleux
|
ch_GB9:
|
|
comme euh comme euh type d'enquête d'avoir cent personnes qui donne l'omelette
|
ch_GB9:
|
|
et inutile de vous dire que dans le Eslo deux il y a
|
ch_GB9:
|
|
et maintenant je vais vous poser une question qui peut-être et cetera
|
ch_GB9:
|
|
bon j'ai pas je prends pas l'accent anglais quand même pour la poser
|
ch_GB9:
|
|
mais nous reposons la même question
|
ch_GB9:
|
|
dans ce type de cadre euh
|
ch_GB9:
|
|
on est évidemment en recherche de levier pour euh intégrer
|
ch_GB9:
|
|
euh ce type de projet alors on a eu la chance d'avoir ce qu'on appelle une euh
|
ch_GB9:
|
|
une ANR c'est-à-dire un subside
|
ch_GB9:
|
|
de l'Agence Nationale de la Recherche
|
ch_GB9:
|
|
|
ch_GB9:
|
|
donner une première base donc de
|
ch_GB9:
|
|
[pi:pronounce:instantaneous] à notre travail sur Eslo deux
|
ch_GB9:
|
|
même si on allait comme toujours moins vite qu'on ne l'aurait voulu
|
ch_GB9:
|
|
euh mais en tout cas ça a marché
|
ch_GB9:
|
|
on a eu deuxièmement euh la chance d'avoir
|
ch_GB9:
|
|
à la Bibliothèque Nationale de France
|
ch_GB9:
|
|
des gens avec qui on a pu parler
|
ch_GB9:
|
|
ce qui fait qu'aujourd'hui
|
ch_GB9:
|
|
non seulement nous avons le monopole de la seule enquête de soixante-huit
|
ch_GB9:
|
|
mais nous avons grâce à nos collègues de la phonothèque
|
ch_GB9:
|
|
euh de euh la Bibliothèque Nationale de France
|
ch_GB9:
|
|
le monopole sur toute les données sonores
|
ch_GB9:
|
|
|
ch_GB9:
|
|
c'est-à-dire celles qui sont en accès public
|
ch_GB9:
|
|
|
ch_GB9:
|
|
et des conservateurs intelligents qui travaillent avec nous
|
ch_GB9:
|
|
quoi que comme nous le disaient nos collègues
|
ch_GB9:
|
|
on ne s'appelle pas conservateurs pour rien
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
développer des pratiques d'outillage avec la Equipex
|
ch_GB9:
|
|
qui vient de nous arriver mais c'est l'initiative de
|
ch_GB9:
|
|
[pi:pronounce:instantaneous]
|
ch_GB9:
|
|
ce qui va nous permettre avec nos collègues de Nancy d'Aix et de Paris Nanterre
|
ch_GB9:
|
|
euh de travailler de façon euh
|
ch_GB9:
|
|
un petit peu lourde sur euh l'outillage de nos corpus
|
ch_GB9:
|
|
et maintenant euh il nous reste à voir qu'est-ce
|
ch_GB9:
|
|
qu'on fait avec tout ça ?
|
ch_GB9:
|
|
|
ch_GB9:
|
|
donc ça veut dire je vous ai dit euh ce que nous avions
|
ch_GB9:
|
|
notre objectif c'est de réunir à peu près
|
ch_GB9:
|
|
ça va dépendre un petit peu de ce qu'on va y intégrer exactement
|
ch_GB9:
|
|
|
ch_GB9:
|
|
au minimum trois cents heures et au maximum sept cents heures
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
si possible de la façon la plus impeccable possible
|
ch_GB9:
|
|
on a pour ça des étudiants que nous payons
|
ch_GB9:
|
|
euh qui ont un tarif syndical
|
ch_GB9:
|
|
vous connaissez maintenant le principe c'est euh
|
ch_GB9:
|
|
trois minutes d'enregistrements une heure de travail
|
ch_GB9:
|
|
nous faisons relire par un deuxième étudiant
|
ch_GB9:
|
|
et nous faisons relire la troisième version
|
ch_GB9:
|
|
euh par un enseignant chercheur
|
ch_GB9:
|
|
qui va se charger de mettre au point la dernière version
|
ch_GB9:
|
|
pour vous donner un ordre d'idée euh de ce que j'ai fait moi
|
ch_GB9:
|
|
|
ch_GB9:
|
|
je fais avec la troisième version avec deux étudiants sérieux qui ont bien travaillé avant
|
ch_GB9:
|
|
entre cinq cents et sept cents modifications
|
ch_GB9:
|
|
euh de toutes sortes hein
|
ch_GB9:
|
|
c'est souvent de toutes petites choses
|
ch_GB9:
|
|
il s'agit de resegmenter un petit peu différemment dans l'écoute
|
ch_GB9:
|
|
il s'agit de rajouter un un symbole une balise
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
mais c'est un travail absolument énorme à
|
ch_GB9:
|
|
|
ch_GB9:
|
|
mais on voulait avoir au moins une base qui soit absolument impeccable
|
ch_GB9:
|
|
pour commencer à travailler dessus
|
ch_GB9:
|
|
et je vous parle pas quand il faut faire des transcriptions
|
ch_GB9:
|
|
c'est qu'on appelle les effets cocktail
|
ch_GB9:
|
|
l'effet cocktail c'est lorsque vous êtes dans une assemblée où il y a beaucoup de monde
|
ch_GB9:
|
|
|
ch_GB9:
|
|
et vous avez un micro au milieu et il faut commencer à transcrire tout ça
|
ch_GB9:
|
|
alors ça généralement c'est l'étudiant qu'on veut punir à qui on donne ça
|
ch_GB9:
|
|
[rire en fond:noise:instantaneous]
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
qu'est-ce que nous faisons avec ça ?
|
ch_GB9:
|
|
bien d'abord on fait progresser la science
|
ch_GB9:
|
|
ça peut toujours être utile on ne sait jamais
|
ch_GB9:
|
|
euh on essaye de travailler aussi avec nos outils pour comprendre
|
ch_GB9:
|
|
comment est-ce que peuvent se faire se réaliser
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[pi:pronounce:instantaneous]
|
ch_GB9:
|
|
je vais vous en prendre des exemples qui seront euh
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
on peut travailler sur évidemment toutes les données
|
ch_GB9:
|
|
euh un des problèmes que l'on se pose aujourd'hui c'est
|
ch_GB9:
|
|
comment obtenir des principes de commande automatique ?
|
ch_GB9:
|
|
ou euh de l'interprétation d'un certain nombre d'éléments
|
ch_GB9:
|
|
de telle manière qu'il n'y ait pas d'erreurs
|
ch_GB9:
|
|
|
ch_GB9:
|
|
pour prendre un exemple simple
|
ch_GB9:
|
|
si on demande à une machine de sortir
|
ch_GB9:
|
|
elle va défoncer la porte
|
ch_GB9:
|
|
sauf si on lui dit qu'il faut d'abord ouvrir la porte
|
ch_GB9:
|
|
euh ça a l'air idiot mais c'est comme ça
|
ch_GB9:
|
|
|
ch_GB9:
|
|
et je vais reprendre mon exemple de l'omelette
|
ch_GB9:
|
|
c'est qu'à peu près personne
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
ne fait cuire son omelette
|
ch_GB9:
|
|
[conv:noise:instantaneous]
|
ch_GB9:
|
|
ne fait cuire son omelette
|
ch_GB9:
|
|
[rire en fond:noise:instantaneous]
|
ch_GB9:
|
|
parce que tous disent la même chose ils disent
|
ch_GB9:
|
|
et je la mets dans la poêle
|
ch_GB9:
|
|
parce qu'en français si vous mettez dans une poêle c'est pour faire chauffer
|
ch_GB9:
|
|
y a donc pas besoin de dire que vous faites chauffer puisque vous avez utilisez le mot
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
comme étant l'équivalent de faire chauffer
|
ch_GB9:
|
|
|
ch_GB9:
|
|
on a un autre problème sur lequel a travaillé ici une personne
|
ch_GB9:
|
|
que sa modestie nous servira de nommer puisqu'elle est présente
|
ch_GB9:
|
|
euh qui est que lorsqu'on fait une omelette
|
ch_GB9:
|
|
je reprends mon exemple il est plus facile
|
ch_GB9:
|
|
lorsqu'on fait une omelette
|
ch_GB9:
|
|
y a le moment où vous avez des oeufs
|
ch_GB9:
|
|
à la fin y a un moment où vous avez une omelette
|
ch_GB9:
|
|
mais y a une phase entre les deux
|
ch_GB9:
|
|
où les gens sont très embarrassés pour le dé- pour dire ce que c'est
|
ch_GB9:
|
|
parce qu'à la fois il faudrait comiquement passer
|
ch_GB9:
|
|
d'un pluriel à un singulier
|
ch_GB9:
|
|
d'un masculin à un féminin
|
ch_GB9:
|
|
et en plus le machin que tu as entre les deux comme dirait Bossuet
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[pi:pronounce:instantaneous] dans aucune
|
ch_GB9:
|
|
enfin si en français ça s'appelle un appareil mais peu importe personne ne le sait
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
alors ça c'est ce qu'on appelle les problèmes d'anaphore
|
ch_GB9:
|
|
comment est-ce que font les gens pour repérer dans un texte
|
ch_GB9:
|
|
que c'est bien le même élément dont on parle ?
|
ch_GB9:
|
|
c'est un cas très classique bien connu dans les contes
|
ch_GB9:
|
|
la sorcière car c'était elle
|
ch_GB9:
|
|
donc vous voyez hein on avait quelqu'un et puis d'un seul coup ce
|
ch_GB9:
|
|
quelqu'un change d'identité
|
ch_GB9:
|
|
et il faut quand même repérer dans le texte
|
ch_GB9:
|
|
que c'est bien la même personne
|
ch_GB9:
|
|
donc ce type de processus les processus d'anaphores
|
ch_GB9:
|
|
comment on va pouvoir les repérer
|
ch_GB9:
|
|
|
ch_GB9:
|
|
voilà le type de travail que nous pouvons faire entre autres
|
ch_GB9:
|
|
l'étiquetage comment on étiquette dans ces cas-là ?
|
ch_GB9:
|
|
pour le dire rapidement l'étiquette
|
ch_GB9:
|
|
morphologique et grammaticale change complètement
|
ch_GB9:
|
|
alors que euh l'étiquetage sémantique doit rester identique
|
ch_GB9:
|
|
c'est un problème très connu
|
ch_GB9:
|
|
si vous dites j'ai attrapé le canard dans la cour
|
ch_GB9:
|
|
|
ch_GB9:
|
|
une fois que vous l'avez attrapé plumé et cetera
|
ch_GB9:
|
|
lorsque tout à fait à la fin de votre récit vous direz
|
ch_GB9:
|
|
et alors franchement le canard il passait pas
|
ch_GB9:
|
|
euh hé bien c'est pas exactement sous la même forme
|
ch_GB9:
|
|
que se présente le canard dont on parlait au début qui était dans la basse-cour
|
ch_GB9:
|
|
et celui qu'on va bientôt restituer dans les waters
|
ch_GB9:
|
|
[conv:noise:instantaneous]
|
ch_GB9:
|
|
|
ch_GB9:
|
|
il y a des usages didactiques
|
ch_GB9:
|
|
|
ch_GB9:
|
|
des usages qui vont servir
|
ch_GB9:
|
|
à l'enseignement aussi bien du français langue étrangère
|
ch_GB9:
|
|
qu'à des observations sur le français langue maternelle
|
ch_GB9:
|
|
comment est-ce qu'on peut euh identifier des éléments ?
|
ch_GB9:
|
|
comment est-ce qu'on peut faire aujourd'hui des manuels ?
|
ch_GB9:
|
|
et pour nous c'est particulièrement important parce qu'on a un master
|
ch_GB9:
|
|
qui travaille sur les didacticiels
|
ch_GB9:
|
|
et on a une articulation de ce travail de recherche
|
ch_GB9:
|
|
avec une autre partie enseignement
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[pi:pronounce:instantaneous]
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
sur le traitement automatique des langues
|
ch_GB9:
|
|
qui est l'autre aspect de l'exploitation c'est là que
|
ch_GB9:
|
|
[pi:pronounce:instantaneous]
|
ch_GB9:
|
|
sur le traitement automatique des langues
|
ch_GB9:
|
|
il y a des aspects sur lesquels nous ne travaillerons pas ici
|
ch_GB9:
|
|
on ne peut pas tout faire
|
ch_GB9:
|
|
euh donc on a fait des choix on a éliminé
|
ch_GB9:
|
|
délibérément un certain nombre d'études c'est aussi
|
ch_GB9:
|
|
la complémentarité dans laquelle nous sommes avec l'Equipex
|
ch_GB9:
|
|
euh je vous ai dit que nous sommes avec quatre laboratoires
|
ch_GB9:
|
|
celui d'Aix-en-Provence et un des deux grands laboratoires français de phonétique
|
ch_GB9:
|
|
ici nous ne faisons pas du tout d'études phonétiques
|
ch_GB9:
|
|
|
ch_GB9:
|
|
à interpréter à repérer ces éléments
|
ch_GB9:
|
|
c'est de la phonologie mais c'est une autre discipline
|
ch_GB9:
|
|
on ne on n'a pas comme ambition
|
ch_GB9:
|
|
d'essayer de faire de la reconnaissance automatique de la parole
|
ch_GB9:
|
|
on n'a pas comme ambition de euh chercher comment était articulé
|
ch_GB9:
|
|
|
ch_GB9:
|
|
on ne travaille pas sur le dialogue homme-machine
|
ch_GB9:
|
|
c'est des gens quand vous appelez les
|
ch_GB9:
|
|
la SNCF et puis vous tombez sur une machine qui va vous répondre
|
ch_GB9:
|
|
euh y a des études de linguistique là-dessus c'est très particulier
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[bruit de chaise:noise:previous]
|
ch_GB9:
|
|
qui ont travaillé dans notre domaine
|
ch_GB9:
|
|
par exemple sur les échanges dans les tours de contrôle
|
ch_GB9:
|
|
pour éviter les accidents
|
ch_GB9:
|
|
comme les observations de ce type-là
|
ch_GB9:
|
|
on ne travaille pas sur ces aspects
|
ch_GB9:
|
|
[pi:pronounce:instantaneous]
|
ch_GB9:
|
|
|
ch_GB9:
|
|
c'est pas notre domaine ici
|
ch_GB9:
|
|
on ne travaille pas euh sur la génération automatique de textes par omission hein
|
ch_GB9:
|
|
autant de domaines sur lesquels on pourrait être
|
ch_GB9:
|
|
alors vous allez dire mais alors qu'est-ce qu'il reste ?
|
ch_GB9:
|
|
hé bien il reste tout sur quoi euh nous travaillons
|
ch_GB9:
|
|
alors nous on travaille sur euh
|
ch_GB9:
|
|
sur euh ce que j'ai essayé de vous indiquer
|
ch_GB9:
|
|
euh les travaux sur le lexique
|
ch_GB9:
|
|
comment est-ce que ça s'organise ?
|
ch_GB9:
|
|
comment est-ce que ça fonctionne ?
|
ch_GB9:
|
|
comment est-ce que ça se met en série ?
|
ch_GB9:
|
|
comment est-ce qu'on peut compiler très rapidement des dictionnaires ?
|
ch_GB9:
|
|
alors on fait sur le français
|
ch_GB9:
|
|
où on a une très bonne maîtrise une très bonne connaissance de la langue
|
ch_GB9:
|
|
il faut voir que notre objectif c'est nos collègues qui travaillent sur le palikur
|
ch_GB9:
|
|
|
ch_GB9:
|
|
et l'idée c'est de faire des dictionnaires automatiques
|
ch_GB9:
|
|
c'est-à-dire qu'une fois qu'on a les transcriptions
|
ch_GB9:
|
|
la machine va aligner les mots les uns après les autres
|
ch_GB9:
|
|
et puis comme on a des taggers
|
ch_GB9:
|
|
des systèmes qui reconnaissent automatiquement les catégories
|
ch_GB9:
|
|
tout de suite après ça vous donne la catégorie
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[pi:pronounce:instantaneous]
|
ch_GB9:
|
|
c'est-à-dire des systèmes qui donnent automatiquement la transcription phonétique
|
ch_GB9:
|
|
alors euh automatiquement ça veut dire qu'on a travaillé avant
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
automatiquement ça va vous mettre la transcription phonétique
|
ch_GB9:
|
|
et puis ça va vous mettre tous les exemples
|
ch_GB9:
|
|
où on va trouver cette unité-là
|
ch_GB9:
|
|
donc ça va vous donner en tout cas les les contextes
|
ch_GB9:
|
|
et la traduction qu'on a donnée à cet endroit-là
|
ch_GB9:
|
|
alors c'est un travail euh ce que je vous décris là
|
ch_GB9:
|
|
c'est on y sera dans dix ans hein c'est
|
ch_GB9:
|
|
[pi:pronounce:instantaneous]
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
toutes les techniques qui permettent de faire
|
ch_GB9:
|
|
et on le fait concrètement aujourd'hui sur le français
|
ch_GB9:
|
|
où là c'est infiniment plus facile
|
ch_GB9:
|
|
puisqu'on a des dictionnaires de
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[bruit de chaise:noise:previous]
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[bruit de chaise:noise:instantaneous]
|
ch_GB9:
|
|
alors y a quelque chose qui nous empoisonne la v-
|
ch_GB9:
|
|
|
ch_GB9:
|
|
dont on est les grands spécialistes en France
|
ch_GB9:
|
|
c'est l'anonymisation automatique
|
ch_GB9:
|
|
euh nous avons promis aux gens
|
ch_GB9:
|
|
que leurs enregistrements les rendraient célèbres dans toute l'histoire
|
ch_GB9:
|
|
puisqu'on leur a dit qu'ils seraient sur internet
|
ch_GB9:
|
|
mais on leur a promis aussi qu'ils ne seraient pas
|
ch_GB9:
|
|
je veux dire directement identifiables
|
ch_GB9:
|
|
parce qu'on ne va quand même pas transformer leurs voix
|
ch_GB9:
|
|
euh sinon ça en perd quand même beaucoup
|
ch_GB9:
|
|
donc il faut qu'on anonymise
|
ch_GB9:
|
|
|
ch_GB9:
|
|
alors anonymiser au début
|
ch_GB9:
|
|
|
ch_GB9:
|
|
les gens ils zappaient les noms propres
|
ch_GB9:
|
|
vous imaginez un match de foot raconté sans noms propres bon
|
ch_GB9:
|
|
[pi:pronounce:instantaneous]
|
ch_GB9:
|
|
euh on avait droit au fait que
|
ch_GB9:
|
|
oui à Orléans La Poste elle est place
|
ch_GB9:
|
|
|
ch_GB9:
|
|
donc il fallait dire à la machine non il faut garder De Gaulle
|
ch_GB9:
|
|
bah ça sert à rien de le supprimer
|
ch_GB9:
|
|
|
ch_GB9:
|
|
euh si tu mets les noms propres bah nous on sait à peu près faire
|
ch_GB9:
|
|
c'est relativement facile
|
ch_GB9:
|
|
|
ch_GB9:
|
|
on fait ça avec le laboratoire d'informatique de Tours
|
ch_GB9:
|
|
qui sont très pointus là-dedans
|
ch_GB9:
|
|
le très gros problème c'est que la loi est plus compliquée que ça
|
ch_GB9:
|
|
|
ch_GB9:
|
|
l'anonymisation c'est ne pas pouvoir reconnaître une personne
|
ch_GB9:
|
|
et quelqu'un qui dans un enregistrement dit
|
ch_GB9:
|
|
je suis radiologue je me suis installé à Olivet en soixante-dix-sept
|
ch_GB9:
|
|
ça prend dix secondes pour savoir qui c'est aujourd'hui avec internet
|
ch_GB9:
|
|
donc il faut anonymiser toutes les données
|
ch_GB9:
|
|
qui permettent potentiellement d'identifier quelqu'un
|
ch_GB9:
|
|
c'est-à-dire les repérer dans le temps
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
difficile très fastidieuse de notre travail
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
qui permet de repérer à partir de combinés d'informations croisées
|
ch_GB9:
|
|
on peut identifier quelqu'un
|
ch_GB9:
|
|
euh vous pouvez à peu près imaginer le genre de défi que ça représente
|
ch_GB9:
|
|
ça devrait vous permettre logiquement de demander du crédit à l'année
|
ch_GB9:
|
|
pendant les cinquante prochaines années
|
ch_GB9:
|
|
[rire en fond:noise:instantaneous]
|
ch_GB9:
|
|
|
ch_GB9:
|
|
et puis bon on a quelques petits domaines je vais juste rester sur le dernier
|
ch_GB9:
|
|
parce que là c'est notre spécialité mondiale c'est un des points sur lesquels
|
ch_GB9:
|
|
on essaye de prendre de l'avance aujourd'hui
|
ch_GB9:
|
|
parce qu'on est à peu près les seuls à y avoir pensé
|
ch_GB9:
|
|
je vous ai dit que nous considérions qu'une transcription était bonne
|
ch_GB9:
|
|
quand nous l'avions faite
|
ch_GB9:
|
|
|
ch_GB9:
|
|
donc à chaque fois on a des versions qui sont différentes
|
ch_GB9:
|
|
je vous ai dit que pour la troisième
|
ch_GB9:
|
|
après deux bonnes lectures j'avais encore
|
ch_GB9:
|
|
entre cinq cents et mille
|
ch_GB9:
|
|
corrections à faire par heure
|
ch_GB9:
|
|
mais euh de façon intelligente
|
ch_GB9:
|
|
un des collègues qui est un des grands animateurs de ce programme Olivier Baude
|
ch_GB9:
|
|
a eu cette idée extraordinaire que nous gardons toutes les versions
|
ch_GB9:
|
|
et nous les gardons avec leur aliment
|
ch_GB9:
|
|
donc nous avons les moyens de comparer
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
toutes les versions qui ont été faites
|
ch_GB9:
|
|
et nous comptons bien nous servir
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
non pas comme l'ont fait nos prédécesseurs en nous disant
|
ch_GB9:
|
|
on cherche la bonne version et on efface les précédentes
|
ch_GB9:
|
|
mais en utilisant les différences d'écoute
|
ch_GB9:
|
|
|
ch_GB9:
|
|
pour apprendre quelque chose de plus sur les enregistrements
|
ch_GB9:
|
|
le linguiste n'est pas celui pour en revenir à mon point de départ
|
ch_GB9:
|
|
n'est pas celui qui étudie la façon dont les gens parlent
|
ch_GB9:
|
|
c'est celui qui étudie la façon dont les gens entendent
|
ch_GB9:
|
|
et le fait que des gens aient pu entendre
|
ch_GB9:
|
|
de façon nette autre chose
|
ch_GB9:
|
|
est tout à fait intéressant
|
ch_GB9:
|
|
euh je vais prendre un exemple pour ceux qui sont de vieux Orlé- de vieux Orléanais ici
|
ch_GB9:
|
|
euh il y avait une entreprise qui a fait faillite y a
|
ch_GB9:
|
|
une trentaine d'années maintenant peut-être vingt-cinq
|
ch_GB9:
|
|
qui s'appelait Chenesseau
|
ch_GB9:
|
|
qui fabriquait des outils ou des ou des stations-services et cetera
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
parmi nos interviewés il y a un des Chenesseau qui explique ce qu'il fabrique dans la boîte
|
ch_GB9:
|
|
et il dit oui nous chez Chenesseau on fait ça ici
|
ch_GB9:
|
|
mais donc les transcripteurs c'est des petits jeunes ils connaissent à peine Maurice Chevalier
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[rire en fond:noise:instantaneous]
|
ch_GB9:
|
|
ils bah oui parce que c'est des enregistrements de soixante-huit
|
ch_GB9:
|
|
qu'on leur a d'abord donné et après quelques parfois quelques petites erreurs
|
ch_GB9:
|
|
mais c'était facile à à corriger pour quelqu'un comme moi
|
ch_GB9:
|
|
|
ch_GB9:
|
|
comme ils connaissaient pas Chenesseau
|
ch_GB9:
|
|
[pi:pronounce:instantaneous] être Orléanais faut le connaître c'est même pas une
|
ch_GB9:
|
|
|
ch_GB9:
|
|
euh ils savaient pas pourquoi mais comme ça parlait des cuves à essence
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[pi:pronounce:instantaneous]
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[conv:noise:instantaneous]
|
ch_GB9:
|
|
alors c'est typiquement l- le genre de choses qui nous intéresse
|
ch_GB9:
|
|
parce que comment ont travaillé les gens ?
|
ch_GB9:
|
|
qu'est-ce qu'ils ont fait ? quel type de reconstruction ?
|
ch_GB9:
|
|
voilà à peu près le type de domaine sur lequel on travaille
|
ch_GB9:
|
|
voilà à peu près quel est le travail que nous faisons constamment voilà
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[applaude:noise:instantaneous]
|
CBruneau:
|
|
|
CBruneau:
|
|
merci je crois que tu as bien montré que la
|
CBruneau:
|
|
la force d'un laboratoire c'est sa capacité à travailler collectivement
|
CBruneau:
|
|
ça c'est très très intéressant très bien
|
CBruneau:
|
|
alors y a-t-il euh des des questions sur euh
|
CBruneau:
|
|
|
CBruneau:
|
|
[conv:noise:instantaneous]
|
CBruneau:
|
|
non seulement d'entendre mais d'écouter aussi oui tu
|
CBruneau:
|
|
[conv:noise:instantaneous]
|
ZR652:
|
|
par rapport au dernier exemple là
|
ZR652:
|
|
|
ZR652:
|
|
|
ZR652:
|
|
est-ce que tu as la possibilité d'avoir des outils euh
|
ZR652:
|
|
à caractère rigoureux de type informatique scientifique et cetera
|
ZR652:
|
|
|
ZR652:
|
|
|
ZR652:
|
|
pour identifier euh la part de de l'histoire là-dedans
|
ZR652:
|
|
parce que effectivement euh
|
ZR652:
|
|
|
ZR652:
|
|
|
ZR652:
|
|
|
ZR652:
|
|
[pi:pronounce:instantaneous] chez Esso
|
ZR652:
|
|
c'est parce qu'il ne connaît pas euh le contexte
|
ZR652:
|
|
|
ZR652:
|
|
|
ZR652:
|
|
et donc là y a y a quelque chose tout à fait intéressant euh je pense
|
ZR652:
|
|
est-ce que vous travaillez aussi sur ce type de choses ?
|
ZR652:
|
|
|
ZR652:
|
|
[pi:pronounce:instantaneous] je ne sais pas comment il faut l'appeler de
|
ZR652:
|
|
de linguistique historique ou de sociolinguistique
|
ZR652:
|
|
qui permet de d'avoir des repères
|
ZR652:
|
|
|
ZR652:
|
|
au moins des repères pas forcément les analyser en détail
|
ZR652:
|
|
des repères en disant là y a une fracture parce que
|
ZR652:
|
|
y a un problème qui relève du contexte euh
|
ZR652:
|
|
géographique historique et cetera
|
ZR652:
|
|
mais pas un contexte strictement linguistique
|
ch_GB9:
|
|
alors en effet ce qu'on fait facilement euh
|
ch_GB9:
|
|
enfin ce qu'on fait classiquement dans un labo
|
ch_GB9:
|
|
on a une étudiante en thèse dessus
|
ch_GB9:
|
|
pour faire une typologie parce qu'on n'a même pas ça aujourd'hui
|
ch_GB9:
|
|
une typologie de toutes les erreurs possibles à partir d'un corpus
|
ch_GB9:
|
|
[b:noise:instantaneous] il y a déjà des typologies d'erreurs
|
ch_GB9:
|
|
c'est quand même des choses classiques
|
ch_GB9:
|
|
mais là on a cet avantage énorme dont on a quand même maintenant
|
ch_GB9:
|
|
plus de trois cents heures transcrites
|
ch_GB9:
|
|
|
ch_GB9:
|
|
correctement trois versions
|
ch_GB9:
|
|
|
ch_GB9:
|
|
et du coup euh nous on peut maintenant
|
ch_GB9:
|
|
|
ch_GB9:
|
|
à très très grande échelle de toutes les différences
|
ch_GB9:
|
|
parce que y a des logiciels qui eux sortent toutes les différences
|
ch_GB9:
|
|
|
ch_GB9:
|
|
donc euh ça ça paraît immédiatement donc ça va très très vite
|
ch_GB9:
|
|
et elle doit maintenant enfin elle doit elle est en train dessus
|
ch_GB9:
|
|
une thèse déjà en sept ans
|
ch_GB9:
|
|
euh elle est en train de de d'essayer de faire une typologie dans
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[bruit de chaises:noise:previous] mais en réalité
|
ch_GB9:
|
|
ce qui nous intéresse nous le plus
|
ch_GB9:
|
|
c'est plutôt la démarche de la personne qui
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[pi:pronounce:instantaneous]
|
ch_GB9:
|
|
en gros elle a à peu près perçu le signal
|
ch_GB9:
|
|
mais euh comment est-ce que je reconstruis ?
|
ch_GB9:
|
|
sachant qu'on a notamment dans les transcriptions des choses ahurissantes
|
ch_GB9:
|
|
euh je je dis bien que ce sont des étudiants sérieux c'est pas
|
ch_GB9:
|
|
|
ch_GB9:
|
|
mais euh on voit quand même qu'il y en a
|
ch_GB9:
|
|
quelques-uns à certains moments qui ont vraiment pensé à autre chose hein
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[pi:pronounce:instantaneous]
|
ch_GB9:
|
|
donc on a ce type d'erreurs
|
ch_GB9:
|
|
on a des types d'erreurs par approximation on a des types d'erreur par euh
|
ch_GB9:
|
|
|
ch_GB9:
|
|
on a des types d'erreurs enfin historiques dans le sens
|
ch_GB9:
|
|
[pi:pronounce:instantaneous]
|
ch_GB9:
|
|
on a des erreurs euh de type euh évidemment énormément euh
|
ch_GB9:
|
|
simplement de de grammaire de de fautes de transcription
|
ch_GB9:
|
|
alors ça c'est même les plus courantes et de loin
|
ch_GB9:
|
|
euh on a ensuite les qu'est-ce qu'on a des ?
|
ch_GB9:
|
|
on a demandé à la machine de nous sortir que le lexique
|
ch_GB9:
|
|
|
ch_GB9:
|
|
et on voit arriver toutes les coquilles
|
ch_GB9:
|
|
|
ch_GB9:
|
|
la machine ne connaît pas le mot orthographié comme ça
|
ch_GB9:
|
|
donc elle nous le le restitue
|
ch_GB9:
|
|
ça c'est un un un très gros travail qui fait partie de cette de cette démarche
|
ch_GB9:
|
|
|
VD276:
|
|
j'ai une question très précise comment vous choisissez les langues euh
|
VD276:
|
|
ce sont principalement les langues africaines
|
VD276:
|
|
donc euh est-ce que c'est vous qui choisissez ? est-ce que ça vous est
|
VD276:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
je sais plus qui disait euh
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
je crois que c'est Merleau-Ponty qui disait
|
ch_GB9:
|
|
les chercheurs c'est comme les pirates ça prend ce que ça trouve
|
ch_GB9:
|
|
[rire en fond:noise:instantaneous]
|
ch_GB9:
|
|
|
ch_GB9:
|
|
on a des des collègues qui travaillent sur le Burkina
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
tout début du travail sur le dagara en l'occurrence
|
ch_GB9:
|
|
c'est un collègue qui avait pris un poste là-bas en coopération pendant dix ans
|
ch_GB9:
|
|
[pi:pronounce:instantaneous]
|
ch_GB9:
|
|
|
ch_GB9:
|
|
le les langues de Guyane c'est parce que lorsque que l'IRD s'est installé à Orléans
|
ch_GB9:
|
|
les collègues sont venus nous voir en disant
|
ch_GB9:
|
|
y a des langues là-bas on peut trouver des crédits on y va
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[bruit de chaise:noise:instantaneous]
|
ch_GB9:
|
|
|
MB834:
|
|
est-ce que est-ce que vos corpus se se périment ?
|
MB834:
|
|
est-ce qu'il faut les refaire ? ou bien
|
MB834:
|
|
je veux dire par rapport à une évolution éventuelle de la langue elle-même
|
MB834:
|
|
à partir de quand considérez-vous que les cor- les corpus oraux sont fixes et suffisants ?
|
ch_GB9:
|
|
pour faire une bonne description selon moi ?
|
MB834:
|
|
|
ch_GB9:
|
|
ah euh c'est une bonne réponse
|
ch_GB9:
|
|
c'est une bonne question euh enfin oui quand on pose mais
|
ch_GB9:
|
|
le le problème d'abord c'est que lorsqu'on travaille sur des corpus oraux
|
ch_GB9:
|
|
se sont par définition nous le souhaitons
|
ch_GB9:
|
|
|
ch_GB9:
|
|
euh donc non prescriptifs
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
le pire de de ce qu'on peut entendre me va très bien
|
ch_GB9:
|
|
je veux dire après tout ça en fait partie
|
ch_GB9:
|
|
on a fait venir la semaine passée nos collègues du British National Corpus
|
ch_GB9:
|
|
parce qu'ils avaient pris un peu d'avance
|
ch_GB9:
|
|
donc les Anglais ont déjà fait ce type de travail dans leur pays
|
ch_GB9:
|
|
en soixan- en quatre-vingt-dix-huit
|
ch_GB9:
|
|
et ce collègue nous expliquait en technique d'enregistrement
|
ch_GB9:
|
|
je sais pas si on obtiendrait en France les autorisations
|
ch_GB9:
|
|
|
ch_GB9:
|
|
ils ont fait un appel dans la presse nationale
|
ch_GB9:
|
|
et ils ont demandé aux gens
|
ch_GB9:
|
|
d'accepter de laisser un magnétophone qui tournait
|
ch_GB9:
|
|
tout le temps dans le séjour
|
ch_GB9:
|
|
c'est quand même un peu spécial comme technique
|
ch_GB9:
|
|
|
ch_GB9:
|
|
parmi les choses intéressantes qu'on a eues
|
ch_GB9:
|
|
c'est qu'il y avait quatre familles ou cinq familles qui avaient des ados
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[pi:pronounce:instantaneous]
|
ch_GB9:
|
|
les gens ont tourné le dos ils sont arrivés en disant you fuck fuck fuck
|
ch_GB9:
|
|
[rire en fond:noise:instantaneous]
|
ch_GB9:
|
|
hé et euh mais nous ça nous intéresse énormément
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[pi:pronounce:instantaneous]
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
est-ce qu'on peut dire qu'un corpus se périme ?
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[pi:pronounce:instantaneous] qui disait ça
|
ch_GB9:
|
|
[b:noise:instantaneous] tout le mouvement toute la langue est dans le changement
|
ch_GB9:
|
|
euh les langues changent absolument sans arrêt
|
ch_GB9:
|
|
on a quand même fait un test
|
ch_GB9:
|
|
qui va répondre un tout petit peu à ta question mais qui qui est pas une bonne réponse
|
ch_GB9:
|
|
première chose que l'on constate
|
ch_GB9:
|
|
le palikur qui est une langue orale et cetera
|
ch_GB9:
|
|
change plus vite actuellement que le français
|
ch_GB9:
|
|
on a des enregistrements par nos collègues qui ont été faits il y a trente ans
|
ch_GB9:
|
|
le palikur change beaucoup plus vite que le français
|
ch_GB9:
|
|
c'est pas une langue écrite c'est pas une langue de scolarisation et cetera
|
ch_GB9:
|
|
|
ch_GB9:
|
|
elle très au contact avec le créole de Guyane avec le français standard
|
ch_GB9:
|
|
et avec le portugais du Brésil
|
ch_GB9:
|
|
donc c'est une langue qui bouge très très vite
|
ch_GB9:
|
|
avec beaucoup d'emprunts et des changements phonétiques en cours extrêmement rapides
|
ch_GB9:
|
|
on on se croirait à peu près dans ce qu'on nous décrit dans l'ancien français
|
ch_GB9:
|
|
dans ces moments de mutation quoi
|
ch_GB9:
|
|
comme la seule fois en un siècle la langue ch- avait complètement changé
|
ch_GB9:
|
|
pour le français on a fait le test avec nos étudiants
|
ch_GB9:
|
|
de leur passer des enregistrements ESLO soixante-huit
|
ch_GB9:
|
|
et ESLO euh deux mille huit
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
on a retrouvé dix locuteurs de soixante-huit qu'on a réenregistrés
|
ch_GB9:
|
|
dont une nous a soutenu qu'elle avait jamais été enregistré
|
ch_GB9:
|
|
alors d'un côté y avait son propre enregistrement
|
ch_GB9:
|
|
elle a dit c'est pas la peine je sais bien que c'est pas moi
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[rire en fond:noise:instantaneous]
|
ch_GB9:
|
|
[conv:noise:instantaneous]
|
ZR652:
|
|
|
ZR652:
|
|
[pi:pronounce:instantaneous]
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[rire en fond:noise:instantaneous]
|
ch_GB9:
|
|
en soixante-huit j'étais pas à Orléans
|
ch_GB9:
|
|
|
ch_GB9:
|
|
donc on a on a on a fait une thèse de la comparaison
|
ch_GB9:
|
|
nos étudiants ne peuvent repérer
|
ch_GB9:
|
|
quel est le plus vieil enregistrement qu'à une chose
|
ch_GB9:
|
|
la mauvaise qualité sonore de
|
ch_GB9:
|
|
[pif:pronounce:instantaneous]
|
ch_GB9:
|
|
ils n'ont aucun moyen et nous-mêmes on n'a pas les moyens
|
ch_GB9:
|
|
|
ch_GB9:
|
|
la seule chose qu'on puisse dire
|
ch_GB9:
|
|
c'est que dans les enregistrements de soixante-huit
|
ch_GB9:
|
|
on ne trouve pas certaines choses qu'on s'attendrait à
|
ch_GB9:
|
|
[pi:pronounce:instantaneous]
|
ch_GB9:
|
|
|
ch_GB9:
|
|
on ne trouve quasiment jamais
|
ch_GB9:
|
|
la forme OK en soixante-huit
|
ch_GB9:
|
|
[conv:noise:instantaneous]
|
ch_GB9:
|
|
|
ch_GB9:
|
|
cinq minutes de d'oral j'en récupère euh quatre
|
MP087:
|
|
et comment vous faites pour
|
MP087:
|
|
[pi:pronounce:instantaneous] vous allez être amenés à faire d'autres corpus oraux ?
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[pi:pronounce:instantaneous]
|
ch_GB9:
|
|
[bruit de chaise:noise:previous]
|
ch_GB9:
|
|
|
ch_GB9:
|
|
ça s'appelle des jouvences en terme de
|
ch_GB9:
|
|
[pi:pronounce:instantaneous]
|
ch_GB9:
|
|
on fait des jouvences tout le temps tout le temps tout le temps
|
MP087:
|
|
[pi:pronounce:instantaneous]
|
MP087:
|
|
|
ch_GB9:
|
|
euh y avait quatre raisons
|
ch_GB9:
|
|
il fallait que ça soit pas Paris
|
ch_GB9:
|
|
il fallait que ça soit près de Paris pour venir facilement
|
ch_GB9:
|
|
il fallait qu'il y ait pas d'accent dialectal marqué
|
ch_GB9:
|
|
|
ch_GB9:
|
|
et y avait une quatrième raison
|
ch_GB9:
|
|
[pi:pronounce:instantaneous] universitaire
|
ch_GB9:
|
|
[pi:pronounce:instantaneous]
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[rire en fond:noise:instantaneous]
|
MP087:
|
|
|
ch_GB9:
|
|
|
MP087:
|
|
|
ch_GB9:
|
|
parce que Paris est la moins française de toutes les villes
|
ch_GB9:
|
|
[conv:noise:instantaneous]
|
ch_GB9:
|
|
c'est ce qu'on a fait dans la nouvelle enquête ESLO
|
ch_GB9:
|
|
on a une enquête qui s'appelle langues en contact à Orléans
|
ch_GB9:
|
|
nous on a rajouté le français des immigrés
|
ch_GB9:
|
|
|
ch_GB9:
|
|
enfin et et leur langue d'origine bien sûr
|
ch_GB9:
|
|
mais on a aussi rajouté du français immigrant
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[pi:pronounce:instantaneous] aucun
|
ch_GB9:
|
|
mais ils n'avaient pas d'exclusion
|
ch_GB9:
|
|
il n'était pas nécessaire d'être né à Orléans
|
ch_GB9:
|
|
ils ont délibérément gardé des gens
|
ch_GB9:
|
|
dont ils savaient parfaitement qu'ils n'étaient orléanais
|
ch_GB9:
|
|
on a un Lorrain qui explique que la charcuterie ici c'est nul
|
ch_GB9:
|
|
[rire en fond:noise:instantaneous]
|
ch_GB9:
|
|
|
ch_GB9:
|
|
on a quelqu'un de l'Ariège c'est le seul qui va
|
ch_GB9:
|
|
[pi:pronounce:instantaneous] le E muet
|
ch_GB9:
|
|
on le reconnaît tout de suite
|
ch_GB9:
|
|
[conv:noise:instantaneous]
|
ch_GB9:
|
|
on peut demander la recette de l'omelette
|
ch_GB9:
|
|
[rire en fond:noise:instantaneous]
|
ch_GB9:
|
|
[pi:pronounce:instantaneous]
|
ch_GB9:
|
|
[rire en fond:noise:instantaneous]
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
LEC_RH699:
|
|
à partir de quand on estime qu'une langue est nouvelle ?
|
LEC_RH699:
|
|
|
LEC_RH699:
|
|
quelle est la différence entre les variations d'une langue qui va beaucoup changer
|
LEC_RH699:
|
|
|
LEC_RH699:
|
|
[pi:pronounce:instantaneous] vous définissez ça euh ?
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
on ne dirait jamais le français
|
ch_GB9:
|
|
|
ch_GB9:
|
|
de France euh du vingtième siècle
|
ch_GB9:
|
|
et si on était vraiment rigoureux
|
ch_GB9:
|
|
on dirait l'indo-européen
|
ch_GB9:
|
|
[rire en fond:noise:instantaneous]
|
ch_GB9:
|
|
euh non mais je c'est un exemple qu'on donne toujours
|
ch_GB9:
|
|
mais les Grecs ils disent toujours qu'ils parlent grec hein c'est
|
ch_GB9:
|
|
c'est vraiment par convention que nous utilisons ces langues-là
|
ch_GB9:
|
|
alors notre critère est toujours le même
|
ch_GB9:
|
|
|
ch_GB9:
|
|
c'est la même chose pour les dialectes
|
ch_GB9:
|
|
à partir du moment où il y a plus intercompréhension
|
ch_GB9:
|
|
c'est-à-dire à partir du moment où on estime
|
ch_GB9:
|
|
que même en écoutant longtemps
|
ch_GB9:
|
|
|
ch_GB9:
|
|
une langue qu'on estime être la nôtre on ne le comprendrait plus
|
ch_GB9:
|
|
je suis pas très sûr du français du seizième siècle à vrai dire
|
ch_GB9:
|
|
mais je pense qu'avec un peu d'accoutumance on y arriverait
|
ch_GB9:
|
|
euh y a qu'à voir déjà notre difficulté avec les Québecquois
|
ch_GB9:
|
|
mais on y arrive au bout d'un moment une fois qu'on a compris que quand ils disent
|
ch_GB9:
|
|
[mertem:pronounce:instantaneous]
|
ch_GB9:
|
|
|
ch_GB9:
|
|
une fois qu'on a compris ça c'est facile
|
ch_GB9:
|
|
[bruit de porte:noise:instantaneous]
|
ch_GB9:
|
|
[bruit de porte:noise:instantaneous]
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[pi:pronounce:instantaneous] s'il y a intercompréhension
|
ch_GB9:
|
|
[pi:pronounce:instantaneous]
|
ch_GB9:
|
|
je vais laisser peut-être oui
|
CBruneau:
|
|
|
CBruneau:
|
|
[conv:noise:instantaneous]
|
FLegouy:
|
|
j'ai j'ai lu euh y a déjà déjà n'est-ce pas fort longtemps
|
FLegouy:
|
|
|
FLegouy:
|
|
qui expliquait que euh il était possible de reconstituer par exemple la la langue des Celtes
|
FLegouy:
|
|
au travers de la langue irlandaise écossaise et euh
|
FLegouy:
|
|
et euh comment dire ? et galloise
|
FLegouy:
|
|
|
FLegouy:
|
|
[pi:pronounce:instantaneous] euh
|
FLegouy:
|
|
|
FLegouy:
|
|
|
FLegouy:
|
|
tout à fait exact ou pas ?
|
FLegouy:
|
|
est-ce qu'on peut autrement dit
|
FLegouy:
|
|
est-ce qu'on peut reconstituer des langues anciennes qui sont
|
FLegouy:
|
|
qui sont considérées comme disparues au travers de langues euh récentes
|
FLegouy:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
avec un taux de fiabilité qui est variable selon les données dont on dispose
|
ch_GB9:
|
|
|
ch_GB9:
|
|
objectivement pour un linguiste ça va être un peu décevant
|
ch_GB9:
|
|
euh la façon dont réellement ça se prononçait à la limite on s'en moque
|
ch_GB9:
|
|
on va noter ça enfin l'exemple typique c'est c'est celui de l'indo-européen
|
ch_GB9:
|
|
où on note ça avec des signes qui sont de pures conventions
|
ch_GB9:
|
|
si vous avez déjà vu des transcriptions de l'indo-européen
|
ch_GB9:
|
|
sinon vous allez à Wikipédia où de l'indo-européen il y en a
|
ch_GB9:
|
|
vous tapez euh fable euh le le cheval et le mouton
|
ch_GB9:
|
|
euh pour vous sortir cette fable transcrite comme on les transcrit aujourd'hui
|
ch_GB9:
|
|
vous allez voir apparaître H
|
ch_GB9:
|
|
deux petit W en l'air K T petit W en l'air
|
ch_GB9:
|
|
H croix O euh et cetera donc c-
|
ch_GB9:
|
|
|
FLegouy:
|
|
|
ch_GB9:
|
|
|
FLegouy:
|
|
|
ch_GB9:
|
|
c'est des c'est une sorte d'équation oui
|
ch_GB9:
|
|
euh mais ça nous suffit nous par rapport à ce qu'on veut faire
|
ch_GB9:
|
|
notre objectif est pas de dire je vais vous parler comme le faisait Vercingétorix
|
ch_GB9:
|
|
mais ou enfin peu importe qui euh
|
ch_GB9:
|
|
|
ch_GB9:
|
|
on a en même temps si on voulait reconstituer à peu près la façon dont parlait Vercingétorix
|
ch_GB9:
|
|
je pense qu'on aurait assez de données pour avoir quelque chose
|
ch_GB9:
|
|
qui serait assez réaliste objectivement
|
ch_GB9:
|
|
mais je dirais que pour nous c'est de la prouesse euh
|
FLegouy:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[conv:noise:instantaneous]
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
on a à peu près aujourd'hui euh l'équival- euh
|
ch_GB9:
|
|
en inscription on en a quand même euh
|
ch_GB9:
|
|
je sais pas à à vue de nez je dirais que ça on doit en être entre trois mille et sept mille pages
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
très souvent répétitif très très très très souvent répétitif
|
ch_GB9:
|
|
mais y en a y en a y en a
|
ch_GB9:
|
|
|
ch_GB9:
|
|
mais de quand je dis inscriptions c'est tout hein c'est euh
|
ch_GB9:
|
|
c'est un morceau de mot sur une pièce
|
ch_GB9:
|
|
c'est enfin c'est y a de tout
|
ch_GB9:
|
|
c'est des trucs sur des briques ça peu être n'importe quoi
|
ch_GB9:
|
|
|
ch_GB9:
|
|
euh le gaulois est une langue indo-européenne
|
ch_GB9:
|
|
donc on connaît un certain nombre de ses principes
|
ch_GB9:
|
|
on a la comparaison avec d'autres familles de de langues celtiques
|
ch_GB9:
|
|
|
ch_GB9:
|
|
on a quand même quelques témoignages de transcriptions dans des caractères grecs par les Grecs
|
ch_GB9:
|
|
dans des caractères latins par les Latins
|
ch_GB9:
|
|
on sait comment ont évolué un certain nombre de mots gaulois
|
ch_GB9:
|
|
par des noms propres et cetera
|
ch_GB9:
|
|
si on cumule tout ça les taux de réalisation doivent être forts
|
ch_GB9:
|
|
euh pour donner juste un exemple et on on va peut-être en rester là
|
ch_GB9:
|
|
mais c'est pour la méthode
|
ch_GB9:
|
|
euh prenez le plus grand linguiste du début du vingtième siècle et de la région
|
ch_GB9:
|
|
c'est Antoine Meillet qui est de Châteaumeillant du côté de
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
|
ch_GB9:
|
|
[interférences téléphone:noise:instantaneous]
|
ch_GB9:
|
|
et nous avons fait un un colloque en hommage de Meillet bien sûr au laboratoire
|
ch_GB9:
|
|
pour rendre hommage à ce monsieur
|
ch_GB9:
|
|
et il y a à côté un site gaulois
|
ch_GB9:
|
|
|
ch_GB9:
|
|
y a pas grand chose mais enfin y a des petites choses
|
ch_GB9:
|
|
qui ont été exposées dans le musée local
|
ch_GB9:
|
|
et ce musée local c'est l'instituteur le monsieur qui nous fait visiter
|
ch_GB9:
|
|
et il nous f- donc et là tous les indo-européanistes de France et de Navarre étaient venus
|
ch_GB9:
|
|
|
ch_GB9:
|
|
et il nous fait visiter son musée et il nous dit voilà c'est une inscription qu'on a trouvée
|
ch_GB9:
|
|
qui est qui est qui est d'ici et y a marqué ça s'adoucit
|
ch_GB9:
|
|
[pi:pronounce:instantaneous]
|
ch_GB9:
|
|
et le malheureux ignorait qu'il y avait là
|
ch_GB9:
|
|
les deux meilleurs spécialistes en monde du euh du gaulois
|
ch_GB9:
|
|
qui disent mais de toute façon peut-être que vous l'avez trouvé là
|
ch_GB9:
|
|
mais c'est du dialecte bourguignon que nous avons là enfin il
|
ch_GB9:
|
|
[rire en fond:noise:instantaneous]
|
ch_GB9:
|
|
et manque de pot évidemment le deuxième n'était pas d'accord en disant
|
ch_GB9:
|
|
ou alors si c'est du bourguignon c'est du bourguignon du sud
|
ch_GB9:
|
|
[rire en fond:noise:instantaneous]
|
ch_GB9:
|
|
et je voyais mon instituteur se décomposer progressivement
|
ch_GB9:
|
|
donc rien que sur une inscription qui n'a pas été très lisible
|
ch_GB9:
|
|
euh deux spécialistes peuvent vous dire tout de suite mais ça c'est tel sous-dialecte c'est
|
CBruneau:
|
|
|
CBruneau:
|
|
|
CBruneau:
|
|
[applaude:noise:instantaneous]
|