Caractérisation prosodique et linguistique de phonogenres Approche semi-automatique et applications Prosodic and linguistic characterisation of speaking styles: semi-automatic approach and applications Subside fns 100012_134818/1 ; requérant Antoine Auchlin, UniGe Collaborateurs: Tea Prsir; Jean-Philippe Goldman
En bref: Objet: description de la variation phonostylistique situationnelle et individuelle en français I. par la description d un corpus de parole II. à l aide d outils semi-automatiques de traitement de la parole Deux collaborateurs (temps partiel) et le requérant Durée trois ans (2011-2014)
Objectifs principaux Description et modélisation prosodique de plusieurs phonogenres, plusieurs idiostyles; comparaison inter-styles et intra-styles Extension significative d'un corpus de référence en français, annoté (pour distribution libre) Perfectionnement d'outils automatiques de traitement et de description de la parole (pour distribution libre) Recherche sur les unités de discours par combinaison d'informations syntaxiques et prosodiques Manipulation et intégration dans un système de synthèse adaptable à différentes circonstances types
Variation phonostylistique Toute parole amalgame: variables prosodiques situationnelles et individuelles Situationnelle contextuelle: type d activité communicative engagée Individuelle (idiolectale): conditions et habitudes phonatoires (accent, etc.)
Variation phonostylistique Phonogenre: image acoustique typifiée par hypothèse: déterminé par le type d activité communicative (analysée en «invariants situationnels» Lucci; «traits conceptionnels» Koch & Oesterreicher) Phonostyle: caractéristique d un échantillon de parole dans (pour) un certain genre Corpus: constitué d échantillons pré-classés par le type d activité de leur occurrence
Phonogenre - phonostyle => 2 études: Étude «phonogenre»: 5 phonogenres retenus 10 locuteurs de 3 minutes (C-Prom: 7 genres, 3 locuteurs de 3 minutes) Étude «idiostyle» orientée locuteur(s): 2 locuteurs, 30 minutes / locuteur
Corpus de parole: genres, traits
Corpus de parole: quantités C-Prom (7 genres, 70 min, en ligne; Avanzi & al 2010) réduit à 5 genres, 50 min. C-Prom2 (à constituer) études phonogenres et idiostyles
Traitement semi-automatique ProsoBox: chaîne d outils pour le traitement prosodique: I. EasyAlign: alignement texte son au niveau segmental (phones); phonétisation syllabation II. ProsoProm: détection de proéminences syllabiques III. ProsoReport: rapport prosodique global (70 + descripteurs;) IV. ProsoDyn: rapport prosodique dynamique (en développement; Simon & al 2011; Audrit & al 2012 submitted; Goldman 2012 submitted)
Approche conjointe syntaxe-discoursprosodie Identification d unités syntaxiques Maximales / unités de rection maximales «phrases» Intermédiaires (séquences - syntagmes) Minimales lexicales Manuelle ou semi-automatique (interface Fips en développement) Corrélations avec unités prosodiques (BDU-Degand & Simon) Connexions avec plans d organisation du discours (statut informationnel: propos - focus - arrière-plan; énonciatif: discours rapporté; interactionnel: initiatif-réactif; etc)
Validation & applications Tests de reconnaissance de genres, re-synthèse de parole dé-lexicalisée (ma ma ma) selon les paramètres globaux et locaux (syllabiques) des genres synthèse vocale «profilée genre»: ajustement globaux (F0 range; taux d articulation; débit; taux de proéminences) ajustements locaux ciblés (syllabes: durée relative; pente tonale; localisation des proéminences, i-f)
Etapes du processus de traitement complet
Exemple de TextGrid Praat annoté
Intérêts, retombées (scientifiques) meilleure connaissance de la variation linguistique, phonostylistique et idiostylistique; meilleure connaissance de la «fonction identificatrice» dans la parole meilleure connaissance de la consistance et de la substance acoustique des différents phonogenres en français adaptation à d'autres types de variations prosodiques (accent régionaux, idiostyles remarquables, attitudes et émotions) validité méthodologique pour d'autres langues - approche contrastive interlangues substantielle amélioration méthodologique et technologique, par l'amélioration des procédures et de l'articulation des niveaux d'analyse - toute langue
Intérêts, retombées (industrie, public) Toute application liée à la synthèse de parole: systèmes embarqués (GPS) portails audio (natel) livres audio, lecture orale de web, journaux, cours boursiers, annonces publiques, etc. Imitation prosodique d'un locuteur (complément à l imitation de timbre)
Références en ligne Recherche phonogenres http://www.unige.ch/lettres/linguistique/recherche/discours/ phonogenres-11-14.html EasyAlign et autres outils http://latlntic.unige.ch/phonetique/ Corpus C-Prom http://sites.google.com/site/corpusprom Autres recherches - collaborations Corpus prosodique de référence en français parlé «Rhapsodie» http://rhapsodie.risc.cnrs.fr/fr/ «Caractérisation et analyse ( ) des traits phonético-phonologiques d apprenants hispanophones de FLE» (I. Racine) http://www.unige.ch/lettres/elcf/projetsderecherche.html
Merci de votre attention