Transcription phonétique et analyse phonologique avec PHON



Documents pareils
La syllabe (1/5) Unité intuitive (différent du phonème) Constituant essentiel pour la phonologie au même titre que phonème et trait

C RÉATION DE PDF (1) Cours SEM 205 Mieux utiliser le format PDF

N SIMON Anne-Catherine

Le modèle standard, SPE (1/8)

FileMaker Server 11. Publication Web personnalisée avec XML et XSLT

Documentation utilisateur. [EIP] TransLSF

Une fois votre tableau excel complet, cliquer sur fichier enregistrer sous type de fichier (menu déroulant) csv (séparateur : point virgule).

Studio. HERITIER Emmanuelle PERSYN Elodie. SCHMUTZ Amandine SCHWEITZER Guillaume

PACK NUMERIQUE EDUCATION GUIDE UTILISATEUR

Premiers pas avec AviTice School

Les logiciels gratuits en ligne

Guide de démarrage Tradedoubler. Manuel éditeur / affilié

FileMaker Server 12. publication Web personnalisée avec XML

FEN FICHE EMPLOIS NUISANCES

UE11 Phonétique appliquée

Guide d utilisation 2012

Support pour les langues s écrivant de droite à gauche

Manuel d utilisation du site web de l ONRN

Contenu Acomba 9.57 ATELIER 1 VUE D ENSEMBLE DU PROGRAMME ATELIER 3 RAPPORTS ATELIER 2 MODULE COMPTABILITÉ TRANSACTIONS ATELIER 4 MODULE CLIENTS.

Découvrez Windows NetMeeting

Gestion collaborative de documents

Objectif. Cette formation doit permettre au client d être autonome dans la création de ses rapports avancés en utilisant la fonctionnalité Excel +.

Google Documents permet d élaborer un questionnaire, de le diffuser sur le net pour ensuite le dépouiller.

A C T I V I T É S CE QUE JE CONNAIS CONTEXTE PROFESSIONNEL. Quel est l élément essentiel du poste informatique? ...

Open-Sankoré. Mise en route. Guide utilisateur Février 2013 NTICE (E. S.)

Lutter contre les virus et les attaques... 15

Brochure produit interactive ::

Guide à l usage des bibliothécaires du réseau départemental

Guide utilisateur i-milo >> Décisionnel

Mode d emploi VOUS ETES UN PROFESSIONNEL DE L ACCOMPAGNEMENT A LA CREATION D ENTREPRISE?

SYSTRAN 7 Guide de démarrage

Tutoriels. 01 Utiliser Praat. 02 Transcrire sous Praat en utilisant les conventions VALIBEL. Sylviane Bachy. Rédaction octobre 2005

Antidote et vos logiciels

Tutoriel Prosogram. 1. Installation. Tutoriel prosogram

Logiciel de sauvegarde Echo

MAÎTRISE DE L ENVIRONNEMENT WINDOWS VISTA

FORMATION KAWET. Formation : Créer une appli mobile avec Kawet

Créer un fichier PDF/A DÉPÔT ÉLECTRONIQUE

Contenu Microsoft Windows 8.1

Descriptif des fonctionnalités de notre site professionnel. Page 1 sur 13

ENVOI EN NOMBRE DE MESSAGES AUDIO

Guide de l'utilisateur

Présentation de Firefox

Des outils numériques simples et conviviaux!

FileMaker Pro 12. Guide de configuration de l installation réseau

italc - GUIDE DE PRISE EN MAIN RAPIDE

Accès instantané aux mots et aux locutions Le dictionnaire électronique offre une traduction rapide d'un mot ou d'une locution

KIELA CONSULTING. Microsoft Office Open Office Windows - Internet. Formation sur mesure

COORDONNÉES PROFESSIONNELLES PARCOURS PROFESSIONNEL FORMATION

Séminaire d information MIGRATION WINDOWS 7 ET OFFICE 2010

Business Intelligence

Gestion des documents avec ALFRESCO

FAA : Fonctions Automatiques de l Application. Les fonctions automatiques incluses dans vos applications développées avec


Solution informatique pour l accueil, le suivi et l accompagnement de l usager. DOCUMENT DE FORMATION «Volet administratif»

Premiers pas avec NetSupport SCHOOL

Système de Gestion Informatisée des. Exploitations Agricoles Irriguées avec Contrôle de l Eau

Manuel d utilisation du logiciel Signexpert Paraph

VidZone, qu est-ce que c est? INSTALLATION DE VidZone

Table des matières ENVIRONNEMENT

eevision 2 Guide utilisateur Mail : contact@naotic.fr Tél. +33 (0) Fax. +33 (0)

Antidote et vos logiciels

Évaluation des compétences. Identification du contenu des évaluations. Septembre 2014

Mon aide mémoire traitement de texte (Microsoft Word)

EndNote X7.

Suite Messerli Gest (gestion de chantier) Prestations (imputations des heures) Procédure d'installation du programme ou d'une mise à jour

Utilisation de Sarbacane 3 Sarbacane Software

UltraBackup NetStation 4. Guide de démarrage rapide

5. Excel 2010, le tableur collaboratif. a. Concevez des tableaux lisibles

Manuel d Utilisation Nouvelle Plateforme CYBERLIBRIS : ScholarVox Management

Logiciel de gestion pour restaurants et Bars

Installation et compilation de gnurbs sous Windows

On trouvera sur le site du CCDMD un exemple d album construit avec Cantare. (

Avertissement : Nos logiciels évoluent rendant parfois les nouvelles versions incompatibles avec les anciennes.

Mindjet pour Windows - Guide d utilisation

INITIATION A L INFORMATIQUE. MODULE : Initiation à l'environnement Windows XP. Table des matières :

Utilisation de la Plateforme Office365 et d Oultlook Web App

Guide d usage pour Word 2007

Qu est ce que web meeting?

Connexion entre une BD FileMaker Pro 10 et ArcGis 10.x sous Windows 7

IBM System i. DB2 Web Query for System i : le successeur de Query/400? Oui, mais bien plus!!!

mailpro mode d'emploi

FORMATION MULTIMÉDIA LVE

L import massif introduit plusieurs nouvelles fonctionnalités, selon que l on importe un thésaurus, un ensemble de valeurs contrôlées ou un corpus.

Equinoxe vous informe

pas à pas prise en main du service sur le web Le Cloud

Conférence et partage avec NetMeeting

Installation et utilisation de Cobian Backup 8

Tutoriel code::blocks

ENDNOTE X2 SOMMAIRE. 1. La bibliothèque EndNote 1.1. Créer une nouvelle bibliothèque 1.2. Ouvrir une bibliothèque EndNote 1.3. Fermer une bibliothèque

Le Logiciel de Facturation ultra simplifié spécial Auto-Entrepreneur

Avant-propos FICHES PRATIQUES EXERCICES DE PRISE EN MAIN CAS PRATIQUES

SCI6052 Information documentaire numérique École de bibliothéconomie et des sciences de l information

Table des Matières. Pages 3-4. A propos d emblue. Page 5. L environnement emblue. Création d une campagne d marketing. Pages 6-15.

Procédure d installation

CREER ET ANIMER SON ESPACE DE TRAVAIL COLLABORATIF

COMMENT METTRE A JOUR SON SITE WEB?

LES TABLETTES : EN PRATIQUE

Cet article fait suite au premier tutorial MSN publié sur le site (Tutorial MSN 7.0)

Transcription:

Outils et Recherches pour les Corpus d'acquisition du Langage, 18-19 nov 2010 Transcription phonétique et analyse phonologique avec PHON Naomi Yamaguchi Laboratoire de Phonétique et Phonologie & Structures Formelles du Langage

Plan 1. Introduction 2. Segmentation et alignement 3. Transcription 4. Recherches et analyses o Principes o Exemples 2

1. Introduction

Introduction Conçu par Yvan Rose et développé par Y. Rose, G. Hedlund et al. Projet PhonBank Gratuit, open source et en développement Plate-formes : Mac et Windows Utilisation de Unicode Conversion CLAN-PHON 4

Structure du logiciel Projet : ensemble de corpus. Fichier.phon Corpus : peut correspondre à un enfant Session : sessions d enregistrement pour chaque enfant Projet > Corpus > Session 5

Démarrage de PHON Créer un nouveau projet Liste des projets déjà créés Chercher un projet qui n est pas dans la liste 6

Ouvrir un projet 7

Structure de PHON 2 fenêtres séparées : Media (PhonMedia) et Phon 8

Modules de PHON Division de la fenêtre principale en plusieurs modules Modules activables dans le menu «View» 1 module = 1 onglet Possibilité de séparer chaque module de la fenêtre principale, de les déplacer Flexibilité de la personnalisation 9

Modules de PHON 10

Modules nécessaires Visualisation par défaut : Informations de session : date, location du media, participants Fiche («Record Data») : 1 fiche par segment et par participant. Ensemble des fiches = transcription de la session 11

2. Segmentation et alignement

Préparation : informations de session 1. Dater la session 2. Lier le media 3. Ajouter les participants 13

Segmentation Activation du module «Media segmentation» Lancement du media (video/audio) Découpage en fiches : tours de paroles, phrases 1 fiche = 1 segment de media = 1 participant 2 moyens : clics ou raccourcis clavier Ajuster le timing de la séquence : numérique ou signal audio Diversité des moyens d effectuer une action 14

Durée par défaut de chaque fiche Segmentation selon les participants Contrôles du media 15

3. Transcription

Principe Transcrire : remplir chaque fiche 6 lignes («tiers») par défaut : participant, Orthography, IPA Target, IPA Actual, Notes, Segment Possibilité de rajouter des lignes via le module «Tier management» : gestes, situation, etc. Tableau API disponible Différentes options et bonus 17

Groupement & alignement 2 groupes pour ces lignes 18

IPA Lookup Activation du module «IPA Lookup» : meilleur ami du transcripteur économie de temps et rapidité Dictionnaire de formes phonétiques : catalan, allemand, anglais, français, islandais, italien, néerlandais, espagnol. Principe : reconnaissance des mots sur la ligne Ortho. Sinon «?» Possibilité d homographies 19

IPA Lookup : attention Ne reconnaît pas les signes de ponctuation 1 mot = une espace avant, une espace après Attention aux élisions : pas «l école» mais «l école» Français «standard» : doucement [dusmɑ] Liaisons non prises en compte 20

Signal audio Module «Waveform» Permet de : o Créer le fichier son de toute la vidéo (dossier media avec le fichier.phon) o Visualiser le signal audio de la séquence o Ajuster la segmentation de la fiche o Exporter le fichier son d une séquence (fiche) 21

Séquence audio

Syllabification Module «Syllabification & Alignment» Se base sur les lignes IPA Target et IPA Actual Recherches sur les positions syllabiques 1 couleur par position S adapte à toutes les théories : coda, attaque de noyau vide, segment extrasyllabique Pas de théorie «a priori», neutralité 23

Syllabification et alignement 24

Transcription aveugle Plusieurs transcriptions phonétiques pour une seule session Ligne Orthography conservée Comparaisons lignes IPA Validation des doubles transcriptions via le module «Transcript Validation» 25

Validation 26

4. Recherches Principes

Principes - Langages Plusieurs types de recherches, certaines prédéfinies Langages d interrogation : o Plain text : texte simple (exemple : un mot) o Regex : expressions régulières avec certains codes (exemple : mots à début identique) o Phonex : spécialement conçu pour Phon. 28

Phonex Syntaxe particulière : {Matcher}:<Stress Information>,<Syllable Information>Quantifier Terminologie linguistique : traits, classes naturelles (Coronal, Obstruent, Coda ) «linguist-friendly» (liste des termes utilisés dans le manuel) 29

Principes On peut faire une même recherche : o À l intérieur d une session o Sur plusieurs sessions d un seul corpus o Sur plusieurs sessions de plusieurs corpus Mais que dans un seul projet à la fois Query History (Menu Project) «étoiler» une recherche 30

Filtres et paramètres/options Selon le groupe (nombre et position) Selon les mots (par mot, nombre, position) Selon la syllabe (par syllabe, nombre, position) Selon l accentuation Filtre par participant (nom, âge) Filtre sur une ligne particulière 31

Export des résultats Document pdf Fichier Ms Excel Document Ms Word Document texte Open Office Fichier html Base de données CSV 32

Rubriques des résultats Liste de tous les paramètres et options choisis Résumé global et par session (si plusieurs sessions cherchées) Inventaire des résultats et/ou des metadonnées Résultats fiche par fiche ou non (avec quelles lignes pour chaque fiche) 33

4. Recherches Exemples

Recherches simples A l intérieur d une seule session Via le module «Record list» Recherches textuelles simples : o Fiches d un seul participant (Attention à la casse!) o Un mot en particulier 35

Recherches via «Search» Soit comparaison de 2 lignes différentes (recherches alignées) soit recherche sur une seule ligne Aligned Groups : compare 2 séquences qui se trouvent sur 2 lignes groupées o 3 langages possibles o Tous les mots (Orthography) qui ont un [l] (IPA Actual 36

«Search» : Aligned Phones Compare 2 séquences qui se trouvent sur IPA Target et IPA Actual. Phonex uniquement! Exemples : o Liste de mots d une session (méthode Phonex) o Inventaire segmental selon position syllabique : toutes les consonnes en coda de syllabe 37

«Search» : Aligned Phones 2 o Production d une co-occurrence particulière : cluster Obstruante-Liquide en attaque o Réalisation d une classe naturelle : voyelles antérieures arrondies o Troncations syllabiques 38

«Search»: CV Sequence Recherche sur IPA Target ou IPA Actual Phonex uniquement! Liste de toutes les syllabes CVC d un participant 39

«Search» : Data tiers Recherche d une séquence sur n importe quelle ligne. 3 langages possibles o Tous les mots d une session (méthode Regex, ligne Orthography) o Évolution d un mot sur plusieurs sessions o Toutes les consonnes d une session o Ligne personnalisée (Gestes?) 40

Autres recherches Harmony Metathesis Word Shapes : même principe que CV Sequence mais selon l accentuation D autres idées? 41

Remerciements Yvan Rose et Greg Hedlund pour leur écoute, patience, réactivité, efficacité! L équipe Colaje (et spécialement Aliyah Morgenstern, Christophe Parisse et Stéphanie Caët) pour la conversion CLAN-PHON 42

Liens Télécharger, manuel et forums techniques: http://phon.ling.mun.ca/phontrac Liste de diffusion : http://groups.google.com/group/phon Projet PhonBank : http://childes.psy.cmu.edu/phon Concepteur : Y. Rose : yrose@mun.ca Moi : naomi.yamaguchi@univ-paris3.fr 43

[ ]