Transcrire avec EXMARaLDA Etapes dans la transcription: installer et lancer EXMARaLDA choisir le fichier à transcrire créer des pistes de transcription (une piste par locuteur + d éventuelles pistes pour annotations) délimiter un premier segment transcrire le segment au besoin, ajouter des annotations (erreurs, etc.) délimiter le segment suivant EXMARaLDA comporte trois programmes: Outil de transcription Partitur Editor Gestion de corpus COMA (Corpus Manager) Outil d analyse EXAKT Seul le Partitur Editor est nécessaire pour la transcription Choisir la langue d interface Par défaut, l interface est en anglais. Pour choisir une autre langue, ouvrir Partitur-Editor et aller dans le menu Edit / Preferences, cliquer sur l onglet Language et choisir la langue dans la liste déroulante. Choisir le fichier à transcrire Choisir File New [Fichier Nouveau] ou Ctrl N Transcription Recordings [Transcription Enregistrements] Dans la fenêtre Edit media files, utiliser le bouton Add pour sélectionner les fichiers. La transcription peut se faire à partir d un fichier vidéo, mais pour visualiser la courbe, il faudra également un fichier son (.wav) à part. Pour extraire le son du fichier vidéo, utiliser un convertisseur vidéo audio comme Free Video to Audio Converter : http://www.free-audio-editor.com/otherfreeproducts/products.htm
Courbe sonore Pour augmenter ou diminuer l amplitude de la courbe sonore: CTRL+MAJ+tourner la molette de la souris Pour faire un zoom avant/arrière : CTRL+ molette de la souris Panneau vidéo Si le panneau vidéo ne s affiche pas, aller dans le menu Présentation et sélectionner Outil audio/vidéo Si le panneau audio/vidéo s affiche mais ne contient pas de fenêtre vidéo, comme dans l exemple cidessous, vérifier que c est bien un fichier vidéo et non pas un fichier audio qui est sélectionné. Utiliser la liste déroulante pour basculer entre fichier audio et fichier vidéo Si le panneau audio/vidéo affiche un écran noir, il suffit généralement de mettre le fichier en lecture pour que la vidéo apparaisse. Si EXMARaLDA ne peut toujours pas lire votre fichier vidéo. EXMARaLDA comporte plusieurs lecteurs, capables de lire des formats différents. Si votre vidéo ne s affiche pas, il peut être utile de choisir un autre lecteur. Aller dans Edition/Préférences et cliquer sur l onglet Média. En-dessous de Choose a media player, sélectionner un autre lecteur dans la liste déroulante. Il faudra ensuite redémarrer Partitur Editor pour que le changement prenne effet.
Table des locuteurs [Speakertable] On commence par créer un tableau avec les informations concernant chaque locuteur. Pour ouvrir le tableau: Menu Transcription Speakertable [Transcription Table des locuteurs] Le tableau contient par défaut un locuteur (SPK0) appelé X. Modifier le nom dans le champ «Abréviation». On peut aussi définir le sexe, la langue cible et la L1, et d autres attributs que vous pouvez définir vous-même. S il y a d autres locuteurs dans l enregistrement, cliquer sur «Ajouter locuteur» [Add speaker] pour ajouter les informations concernant le deuxième locuteur. Pistes de transcription et d annotation [Tiers] On définit ensuite une piste de transcription pour chaque locuteur. Pour définir la première piste, cliquer sur le nom du premier locuteur. La piste apparaîtra en bleu pour indiquer qu elle est sélectionnée. Une fois la piste sélectionnée, aller dans le Menu Piste Propriétés de piste
Chaque piste appartient à un Type, à sélectionner dans un menu déroulant. Il existe 3 principaux types de piste : T(ranscription) : pour transcrire les paroles du locuteur ; une piste par locuteur D(escription) : pour des commentaires généraux ; ces pistes ne sont pas nécessairement associées à un locuteur A(nnotation) : pour des annotations d erreurs, des traductions, des indications phonétiques, etc. Une piste d annotation est toujours associée à un locuteur. Il existe deux autres types de piste L(ink) et U(ser) D(efined) mais vous n aurez sans doute pas besoin de les utiliser. Chaque piste appartient aussi à une Catégorie. Par défaut, la catégorie d une piste de transcription est v (pour verbal). Vous pouvez définir une catégorie plus explicite (par exemple Transcription) en tapant le nom que vous voulez lui donner dans la case Catégorie, à la place du v. Pour des pistes d annotation, vous pouvez définir d autres catégories, comme Erreurs ou Phonétique. Note : la Catégorie d une piste sert à plusieurs choses : Le nom de la catégorie apparaît au début de la piste, pour l identifier, comme dans l exemple ci-dessous Il sera utilisé pour l insertion de certaines annotations (voir plus loin : panneau d annotation) Il facilite les recherches avec l outil d analyse Exakt
Exemple de début de transcription, avec les catégories de couche. Ajouter des pistes Pour ajouter de nouvelles pistes, pour d autres locuteurs ou pour des annotations, Menu Piste Ajouter piste. Choisir le locuteur (ou no speaker, pour une piste de Description) et puis le type de piste (Transcription, Annotation ou Description) et la catégorie Modification des pistes En cliquant sur Piste Edition de pistes vous pouvez afficher un tableau qui résume les caractéristiques de toutes les couches que vous avez créées et où vous pouvez faire des modifications si nécessaire. Commencer la transcription Au départ, la fenêtre de transcription ressemblera à ceci: En jaune: le premier - et unique segment, qui commence à 00:00 En rouge: la fin de l enregistrement, qui se situe à 02:00.0 (l enregistrement dure 2 minutes)
Note: si vous choisissez un affichage proportionnel au temps [Menu Présentation Proportionnel au temps], le segment jaune s étendra pour occuper toute la fenêtre. Pour commencer à transcrire, il faut donc délimiter un premier segment plus court. Cliquer sur le bouton Vous verrez maintenant trois zones: En bleu: le nouveau segment sélectionné En jaune: le reste de l enregistrement. En rouge: la fin de l enregistrement Ajuster le segment Lorsqu on clique sur «Joindre intervalle», EXMARaLDA sélectionne automatiquement un segment de 2 secondes. Pour agrandir ou diminuer le segment placer le curseur sur la borne rouge et la faire glisser vers la droite ou vers la gauche. On peut ajuster la borne du segment de façon très précise avec la roue de la souris Comment délimiter un segment? L oral n est pas clairement découpé en phrases. Comment découper un enregistrement en segments? Deux solutions sont possibles: (1) utiliser des critères syntaxiques et sémantiques pour délimiter les énoncés ou (2) faire un découpage selon les pauses (à la main ou automatiquement). On peut aussi combiner critères syntaxiques et pauses...
Boutons de lecture Pour faciliter la transcription, les boutons de lecture permettent différents modes d écoute du segment sélectionné : Début de transcription Taper la transcription dans cette fenêtre, qui s ajustera automatiquement à la longueur de la transcription. Appuyer sur la touche «Entrée» à la fin de la transcription du segment. Continuer la transcription Pour transcrire le segment suivant, cliquer à nouveau sue «Joindre interval». Ajuster la borne de droite et procéder ensuite de la même façon que pour le premier segment
Annoter EXMARaLDA intègre plusieurs outils pour faciliter le travail d annotation, dont voici les principaux. Panneau API Pour insérer de caractères phonétiques, aller dans Présentation Outil API. Le panneau des symboles de l API s affichera. Placer le curseur à l endroit de la piste où vous voulez insérer les caractères phonétiques et cliquer sur un symbole pour l insérer. Panneau d annotation Pour faciliter l insertion répétée de certaines annotations, EXMARaLDA possède un panneau d annotation configurable, qui est accessible par le menu Présentation Outil d annotation. Cliquer ensuite sur Open pour sélectionner le fichier de configuration (c est un fichier xml). Pour l annotation des erreurs, vous aurez besoin d un fichier intitulé AnnotationPanel_Erreurs.xml, que vous pourrez télécharger sur le site masterfle. Placez-le dans le dossier de travail sur votre disque dur. C est ce fichier qu il faudra sélectionner après avoir cliqué sur Open. Pour insérer un code d erreur, placez le curseur à l endroit de la piste où vous voulez l insérer. Sélectionnez le code d erreur dans le panneau d annotation (une courte description apparaîtra alors en bas du panneau) et faites un double clic pour l insérer.
Mesure des pauses Pour mesurer la durée d une pause, sélectionner le segment correspondant dans la courbe sonore avec la souris. Cliquer sur le bouton de lecture du segment pour vérifier que la sélection correspond bien à un silence. Ajuster les bornes si nécessaire. La durée du segment, en millisecondes, s affiche juste audessus de la courbe sonore. NOTE : cette technique peut être utilisée pour mesurer n importe quel segment, pas seulement les pauses silencieuses. Pour insérer la pause dans votre transcription, placer le curseur au bon endroit dans la piste de transcription et cliquer sur le bouton Insérer pause : Par défaut, EXMARaLDA insérera la pause sous la forme ((0,9s)), en utilisant des parenthèses doubles et en arrondissant la durée à la dixième de seconde. On peut choisir une autre représentation en allant dans Edition Préférences Segmentation et en faisant les modifications nécessaires : point ou virgule, nombre de chiffres après la virgule, et en changeant le préfixe et/ou le suffixe. Enregistrer la transcription Fichier Enregistrer sous permet d enregistrer la transcription sous EXMARaLDA (fichier.exb). Il est possible de l enregistrer aussi sous d autres formats (fichier texte par exemple) avec Fichier Edition, mais toujours conserver le fichier.exb, qui sera nécessaire pour continuer à travailler sur la transcription.