1 Productions et apprentissage 3. Outils de transcription et d analyse Master 1 : 2011
Enregistrement et transcription 2 Questions pratiques: Comment faire un enregistrement vidéo sur ordinateur Comment transcrire les phénomènes de l oral Comment délimiter les segments pour la transcription Comment choisir et utiliser un outil de transcription
Enregistrer sur ordinateur 3 Ouvrir Windows Movie Maker (Programmes Accessoires Divertissement) Cliquer sur Tâches
Capture vidéo 4 Choisir Capturer la vidéo - Capturer à partir du périphérique vidéo Le logiciel détectera la (les) caméra(s) Donner un nom au fichier et choisir l emplacement Suivre ensuite les fenêtres qui s affichent
Exemples d enregistrement 5 1 2 Enregistrement sonore ou vidéo (pour la gestualité etc.) De préférence sous forme numérique Utiliser un micro externe de bonne qualité
Aides à la transcription 6 Soundscriber : outil de transcription (U. du Michigan: http://lw.lsa.umich.edu/eli/micase/index.htm Outils intégrés dans des systèmes de transcription/analyse (Walker Controller de CLAN) Outils d analyse acoustique (Sonic Mode, PRAAT)
Les problèmes de transcription 7 Une bonne transcription prend du temps jusqu à une heure pour une minute Comment transcrire les caractéristiques de l oral en L2: erreurs hésitations et pauses formes intermédiaires répétitions et reprises Importance des conventions de transcription
Exercice de transcription 8 Le déclencheur L enregistrement
*INV: www. [+ bch] *401: c' est dommage #0_882 &=rire! *401: #0_278 c' est dommage +/. *INV: uhhuh. *401: +, <parce+que:> [/] <um #> [#1_085] parce+que: [*] #0_406 ils vont mettre le [*] frigo #0_581 <dans le:@fs> [/] <(u)m #> [#1_561] dans le [*] appartement [*] #0_569 pour [*] la fenêtre. *401: #0_621 mai:s [/] #1_764 mai:s #0_871 le frigo a: [/] #0_511 a [*] tombé #0_593 dans [*] le:@fs [*] #1_202 voitour [: voiture] [*] #0_900 parce+que <le@fs [*] fenêtre c' est> [/] <# um #> [#2_282] c e:st <# um # er> [#1_620] <comment on dit ça>["] #1_626 le@fs [*] fenêtre #0_360 c' e:st [*] #0_754 dans [*] le douzième [: deuxième] [*] <# uh> [#1_074] étage. *401: #0_650 donc #0_865 e:t le frigo s' est [//] <# er #> [#3_048] s' est #1_103 +... *INV: mmhm. *401:+< <ah je ne sais comment on dit ça>["]. *INV: mmhm. *401: mais <um &=bouche> [#1_312] mais après #0_661 le:@fs [/]<um #> [#0_633] le frigo a [*] tombé #0_302 dans [*] l@fs [*] voiture #0_261 donc #0_296 ça c' est dommage &=rire. 9
Principales conventions de transcription 10 xxx séquence incompréhensible xx mot incompréhensible # pause +/ interruption (énoncé incomplet) + reprise d un énoncé interrompu [?] interprétation plausible (best guess) [*] erreur (renvoi à la couche %err: voir plus loin) [/] répétition d un élément précédent [//] répétition avec correction
Conventions de transcription 11 Pour plus de détails sur les conventions de transcription, voir: le manuel de CHAT (en anglais) http://childes.psy.cmu.edu/manuals/chat.pdf le manuel du corpus PAROLE (en français): http://talkbank.org/bilingbank/ cliquer ensuite sur PAROLE documents, puis PAROLE_manuel.pdf Note: les conventions de transcription de CHILDES (pp. 16-30) peuvent être utilisées quel que soit l outil de transcription.
Transcription détaillée Fichier de transcription
13 Autres exemples Enregistrements Transcriptions 406A 417A
Créer un fichier son 14 Pour visualiser la courbe sonore et pour utiliser la détection automatique des pauses, il faudra un fichier son à part Pour extraire le son du fichier vidéo, utiliser un convertisseur vidéo audio exemple: Free Video to Audio Converter http://www.free-audio-editor.com/otherfreeproducts/products.htm
Délimiter des segments 15 L oral n est pas clairement découpé en phrases Trois solutions possibles: transcrire au kilomètre utiliser des critères syntaxiques et sémantiques pour délimiter les énoncés (à la main) faire un découpage selon les pauses (à la main ou automatiquement) Le choix dépendra des analyses à faire
Choisir un outil de transcription 16 WORD ou tout autre traitement de texte CLAN http://childes.psy.cmu.edu/ ELAN http://www.lat-mpi.eu/tools/elan DIGITAL REPLAY SYSTEM http://web.mac.com/andy.crabtree/ncess_ Digital_Records_Node/Welcome.html PRAAT http://www.fon.hum.uva.nl/praat Simple à utiliser, mais mal adapté. Impossible de lier transcription et son. Format non-exportable. Nombreux programmes d analyse. Lien transcription son par balises. Interface pas très conviviale. Interface plus moderne, multilingue. Bonne gestion vidéo+audio. Détection des silences; concordancier intégré. Conçu pour des transcriptions multimodales. Outil très complet, mais assez complexe. En anglais seulement. Dédié aux analyses phonétiques. Détection des syllabes avec un script supplémentaire.
17 CLAN et ELAN comparés
18 CLAN
ELAN play 19
Avantages de CLAN et d ELAN 20 mode de transcription facile manuel : conventions de transcription éprouvées base de données CHILDES interface plus moderne accepte divers formats de fichier son/vidéo possibilité d importer/exporter nombreux outils d analyse dans CLAN: freq, mlu, etc. analyseur MOR concordancier intégré transcription phonétique possible possibilité d échanger des fichiers entre CLAN et ELAN
Pour transcrire avec ELAN 21 Ouvrir ELAN: vous verrez une page blanche Dans fichier/ouvrir, sélectionner le(s) fichier(s) à transcrire fichier audio et/ou vidéo Vous verrez alors l écran de transcription Ici, deux fichiers, vidéo et son, pour le même enregistrement
Ecran de transcription 22 Si le lecteur vidéo ne s affiche pas, aller dans Affichage/Media Player Si la courbe sonore est trop plate, faire un clic droit et choisir Zoom Vertical
Délimiter les séquences 23 Choisir l onglet Audio Recognizer
24 Sélectionner un segment de silence dans la courbe acoustique et cliquer sur Add Channel 1 Sélectionner un autre segment pour Add Channel 2 Positionner le curseur pour Minimal silence duration et Minimal non-silence duration Cliquer sur Start Si le résultat semble satisfaisant, cliquer sur Create tier(s)
Transcription 25 Cocher mode de sélection Dans la couche transcription, sélectionner une séquence Alt-N pour annoter Cliquer sur Taper la transcription Valider la transcription avec Ctrl+Enter
Les couches de transcription 26 Chaque transcription possède une couche principale (main tier) et éventuellement des couches dépendantes Exemples de couches dépendantes: %com: commentaire %err: pour coder les erreurs %mor: analyse morpho-syntaxique %phon: transcription phonologique Dans ELAN et dans CLAN on peut créer autant de couches dépendantes qu on le souhaite
Couche dépendante: %err 27 Transcription de l erreur dans la couche principale: Si le sujet produit une forme inexistante, on transcrit généralement la forme correcte visée, suivie de [*] S il produit une forme existante, mais inappropriée, on la transcrit telle quelle, toujours suivie de [*] On insère en-dessous une couche %err pour expliciter l erreur, en utilisant la notation forme produite = forme visée *06N: um # xxx # elle a um enfant [*]. %err: enfante = enfant
Mesurer les pauses dans ELAN 28 A la main: sélectionner la couche de découpage double-clic dans un segment de silence la durée apparaît au-dessus des boutons de lecture Automatique: sélectionner «rechercher» choisir la couche («acteur») de découpage rechercher «s» Exemple de résultat: diapo. suivante
Mesure automatique 29 Liste de toutes les silences, avec début, fin et durée
Pour transcrire avec CLAN 1 ère étape: gérer les fichiers 30 Ouvrir CLAN - Les boutons permettent de définir 4 dossiers: working: dossier de travail, où CLAN va chercher les fichiers qu il doit traiter output: dossier de sortie, où il place les fichiers qu il crée. Par défaut ce dossier est le même que le dossier de travail. lib: bibliothèque contient des fichiers d exemples, etc. mor lib: contient les fichiers utilisés pour l analyse morphosyntaxique Si la palette de commande disparaît, elle peut être réouverte avec Ctrl-D
Pour transcrire avec CLAN 2 ème étape: lecture du fichier son 31 1. Avec Walker Controller permet une écoute par segments, avec pause automatique (pour taper) possiblitié de régler la durée des segments et des pauses 2. Avec Transcribe Mode permet de poser des balises pour lier le son à la transcription segmentation un peu fastidieuse, mais transcription plus facile par la suite
32 Ouvrir Clan Dans le menu Window, sélectionner Walker Controller Définir: Walk length (durée de chaque segment, en millisecondes) Loop number (nombre de répétitions) Backspace (retour) Walk Pause Length (pause entre chaque écoute) Cliquer sur «Open Media» pour sélectionner le fichier à transcrire (fichier.wav) Ensuite, pour contrôler la lecture : lancer la lecture (avec répétitions et pauses automatiques) : F6 revenir sur le segment précédent : F7 relire le segment courant : F8 sauter au segment suivant : F9 Walker Controller
33 Ouvrir Clan Dans le menu Mode, sélectionner Transcribe sound or movie (ou faire F5) Choisir le fichier Découper l enregistrement en segments: à la fin de chaque énoncé, appuyer une fois sur la barre espace une balise est posée (matérialisée par un point) continuer à poser les balises jusqu à la fin de l enregistrement En cas d erreur: effacer les balises mal placées appuyer sur F5 pour relancer l enregistrement reprendre la segmentation (barre espace) Transcribe Mode
Fichier segmenté 34 Chaque balise marque la fin d un segment Pour écouter un segment, placer le curseur à l intérieur et faire F4 Si la segmentation est convenable, enregistrer le fichier Vous êtes prêt à transcrire
Mesurer les pauses dans CLAN 35 Ouvrir Sonic Mode Repérer la pause sur le tracé acoustique Sélectionner avec la souris La durée (en millisecondes) apparaît à gauche