Faculté des Sciences Appliquées Laboratoires d Images, Signaux et Dispositifs de Télécommunications Synthèse des voix pathologiques Samia Fraj Thèse présentée en vue de l obtention du titre de Docteur en Sciences de l Ingénieur, réalisée sous la direction des Professeurs Jean Schoentgen et Francis Grenez Année académique 2009-2010
Résumé L objectif de la thèse est le développement et la validation d un synthétiseur des voix pathologiques. Peu d études ont été consacrées à la synthèse des voix avec des dyspériodicités vocales malgré les nombreux arguments en faveur du développement et de l amélioration des simulateurs des voix dysphoniques. Dans le cadre de ce travail, nous avons mis en œuvre un synthétiseur permettant de contrôler l excitation glottique d une manière fine et par conséquent de simuler efficacement les différentes catégories des dysphonies. Les troubles simulés sont la gigue vocale, le tremblement vocal, la biphonation, la diplophonie et les vibrations aléatoires. Le shimmy vocal résulte de la distorsion de modulation dans le conduit vocal qui transforme la gigue en shimmy vocal. Le souffle est synthétisé par la modulation d un bruit Brownien. Des expériences préliminaires ont montré la capacité du synthétiseur à produire différentes catégories de voyelles. Pour la validation, nous avons utilisé des modèles de troubles simulés. Les résultats des expériences d évaluations perceptives, portant sur des corpus de stimuli synthétiques ou humains, modales ou dysphoniques, sont encourageants et montrent la capacité du synthétiseur à produire des voix aussi bien modales que troublées avec des timbres indiscernables des humains. Enfin, les résultats d une expérience d exploitation concernant la classification des stimuli synthétiques selon les échelles ordinales GRB suggèrent que troubles simulés et évaluations perceptives concordent. Aussi, les scores perceptifs prédits à partir des paramètres de contrôle du synthétiseur et les scores attribués par des experts sont fortement corrélés.
Table des matières Table des matières... Erreur! Signet non Table des figures... Erreur! Signet non Avant propos... Erreur! Signet non 1. Introduction... Erreur! Signet non 1.1. Motivations... Erreur! Signet non 1.2. Anatomie... Erreur! Signet non 1.2.1. Larynx... Erreur! Signet non 1.2.2. Poumons et trachée... Erreur! Signet non 1.2.3. Conduit vocal et fonctions d aire... Erreur! Signet non 1.3. Vibration des plis vocaux... Erreur! Signet non 1.4. Modèle acoustique... Erreur! Signet non 1.4.1. Fréquences de résonance du conduit vocalerreur! Signet non 1.4.2. Voix et sons de parole... Erreur! Signet non 1.4.3. Voyelles... Erreur! Signet non 1.5. Pathologies du larynx... Erreur! Signet non 1.5.1. Dysphonies d origines organiques... Erreur! Signet non 1.5.2. Dysphonies d origines neurologiques Erreur! Signet non 1.6. Troubles de la voix... Erreur! Signet non 1.6.1. Régimes de vibrations non-modaux... Erreur! Signet non 1.6.2. Amplification de la gigue vocale et du shimmy vocalerreur! Signet non 1.6.3. Tremblement vocal... Erreur! Signet non 1.6.4. Bruit de turbulence excessif... Erreur! Signet non 1.6.5. Vibrations non sollicitées des bandes ventriculaireserreur! Signet non 1.6.6. Transitions incontrôlées entre différents régimes de vibrationerreur! Signet non 1.7. Indices acoustiques pour les troubles de la voixerreur! Signet non 1.8. Synthétiseurs vocaux... Erreur! Signet non 1.8.1. Le vocodeur à canaux... Erreur! Signet non 1.8.2. Le synthétiseur à formants... Erreur! Signet non 1.8.3. Le synthétiseur LPC... Erreur! Signet non 1.8.4. La synthèse par modèle articulatoire. Erreur! Signet non 1.9. Revue de la littérature sur la synthèse des voix pathologiqueserreur! Signet non 1.10. Objectif de ce travail... Erreur! Signet non 1.11. Plan de la thèse... Erreur! Signet non 2. Le synthétiseur... Erreur! Signet non 2.1. Introduction... Erreur! Signet non 2.2. Description du synthétiseur... Erreur! Signet non 2.3. Modèle de l aire glottique... Erreur! Signet non 2.3.1. Coefficients des polynômes... Erreur! Signet non 2.3.2. Contrôle de la fréquence instantanée Erreur! Signet non 2.3.3. Contrôle de la richesse en harmoniqueerreur! Signet non 2.4. Modèle du débit d air glottique... Erreur! Signet non
2.5. Modèle du conduit vocal sans pertes.. Erreur! Signet non 2.5.1. Propagation de l onde acoustique dans le conduit vocalerreur! Signet non 2.5.2. Délai de propagation... Erreur! Signet non 2.5.3. Coefficient de réflexion à la jonction et équationserreur! Signet non 2.5.4. Conditions aux limites... Erreur! Signet non 2.5.5. Réponse fréquentielle du conduit vocalerreur! Signet non 2.6. Modèle du conduit sous-glottique... Erreur! Signet non 2.7. Modèles des pertes dans le conduit vocalerreur! Signet non 2.7.1. Simulation des pertes par vibration des paroiserreur! Signet non 2.7.2. Simulation des pertes par frottement visqueux et conduction... thermique... Erreur! Signet non 2.7.3. Simulation des pertes par rayonnement aux lèvreserreur! Signet non 2.7.4. Simulation des pertes à la glotte... Erreur! Signet non 2.7.5. Simulation des pertes sous-glottiques Erreur! Signet non 2.8. Résumé... Erreur! Signet non 3. Synthèse des troubles de la voix... Erreur! Signet non 3.1. Introduction... Erreur! Signet non 3.2. Simulation de la gigue vocale... Erreur! Signet non 3.3. Simulation du shimmy vocal... Erreur! Signet non 3.4. Simulation du tremblement vocal... Erreur! Signet non 3.5. Simulation de la diplophonie... Erreur! Signet non 3.6. Simulation de la biphonation... Erreur! Signet non 3.7. Simulation des vibrations aléatoires... Erreur! Signet non 3.8. Simulation du bruit additif... Erreur! Signet non 3.9. Résumé... Erreur! Signet non 4. Corpus et méthodes d évaluations perceptiveserreur! Signet non 4.1. Introduction... Erreur! Signet non 4.2. Description des corpus... Erreur! Signet non 4.2.1. Corpus de six catégories de voyelles modaleserreur! Signet non 4.2.2. Corpus de voyelles [a] modales... Erreur! Signet non 4.2.3. Corpus de voyelles [a] avec des valeurs croissantes de la gigue... vocale... Erreur! Signet non 4.2.4. Corpus de voyelles [a] avec des valeurs croissantes du bruit additif..... Erreur! Signet non 4.2.5. Corpus de voyelles [a] avec des valeurs combinées de gigue... vocale et bruit additif... Erreur! Signet non 4.2.6. Corpus de voyelles [a] dysphoniques Erreur! Signet non 4.2.7. Corpus de voyelles soutenues et de couples de voyelleserreur! Signet non 4.3. Méthodes d évaluations perceptives.. Erreur! Signet non 4.3.1. Catégorisation... Erreur! Signet non 4.3.2. Comparaison deux à deux... Erreur! Signet non 4.3.3. Analyse multidimensionnelle... Erreur! Signet non 4.3.4. Evaluation sur échelle ordinale... Erreur! Signet non 4.4. Résumé... Erreur! Signet non 5. Expériences de validation... Erreur! Signet non
5.1. Introduction... Erreur! Signet non 5.2. Corpus versus expériences perceptiveserreur! Signet non 5.3. Expériences préliminaires... Erreur! Signet non 5.3.1. Identification des catégories phonétiques de voyelles synthétiques..... Erreur! Signet non 5.3.1.1. Objectif... Erreur! Signet non 5.3.1.2. Procédure... Erreur! Signet non 5.3.1.3. Résultats... Erreur! Signet non 5.3.2. Evaluation des timbres des voyelles synthétiques en fonction du... quotient d ouverture à la glotte et du coefficient de réflexion aux... poumon... Erreur! Signet non 5.3.2.1. Objectif... Erreur! Signet non 5.3.2.2. Procédure... Erreur! Signet non 5.3.2.3. Résultats... Erreur! Signet non 5.4. Expériences de validation... Erreur! Signet non 5.4.1. Classification des voyelles synthétiques modales en cinq... catégories selon le critère naturel... Erreur! Signet non 5.4.1.1. Objectif... Erreur! Signet non 5.4.1.2. Procédure... Erreur! Signet non 5.4.1.3. Résultats... Erreur! Signet non 5.4.2. Mise en rang de voyelles synthétiques modales par... comparaison deux à deux selon le critère naturel Erreur! Signet non 5.4.2.1. Objectif... Erreur! Signet non 5.4.2.2. Procédure... Erreur! Signet non 5.4.2.3. Résultats... Erreur! Signet non 5.4.3. Classification binaire humaine/synthétique de voyelles modaleserreur! Signet non 5.4.3.1. Objectif... Erreur! Signet non 5.4.3.2. Procédure... Erreur! Signet non 5.4.3.3. Résultats... Erreur! Signet non 5.4.4. Classification binaire humaine /synthétique des voyelles... modales : expérience en ligne... Erreur! Signet non 5.4.4.1. Objectifs... Erreur! Signet non 5.4.4.2. Procédure... Erreur! Signet non 5.4.4.3. Résultats... Erreur! Signet non 5.4.5. Dissimilarités entre les voyelles modales humaines et... synthétiques... Erreur! Signet non 5.4.5.1. Objectifs... Erreur! Signet non 5.4.5.2. Procédure... Erreur! Signet non 5.4.5.3. Résultats... Erreur! Signet non 5.4.6. Validation du modèle de la gigue vocaleerreur! Signet non 5.4.6.1. Objectifs... Erreur! Signet non 5.4.6.2. Procédure... Erreur! Signet non 5.4.6.3. Résultats... Erreur! Signet non 5.4.7. Validation du modèle du bruit additif Erreur! Signet non 5.4.7.1. Objectif... Erreur! Signet non 5.4.7.2. Procédure... Erreur! Signet non 5.4.7.3. Résultats... Erreur! Signet non 5.4.8. Validation du synthétiseur avec de la gigue vocale et du bruit... additif combinés... Erreur! Signet non 5.4.8.1. Objectifs... Erreur! Signet non
5.4.8.2. Procédure... Erreur! Signet non 5.4.8.3. Résultats... Erreur! Signet non 5.4.9. Classification binaire humaine/synthétique de voyelles... dysphoniques : expérience en ligne... Erreur! Signet non 5.4.9.1. Objectifs... Erreur! Signet non 5.4.9.2. Procédure... Erreur! Signet non 5.4.9.3. Résultats... Erreur! Signet non 5.5. Expérience d exploitation... Erreur! Signet non 5.5.1. Objectifs... Erreur! Signet non 5.5.2. Procédure... Erreur! Signet non 5.5.3. Résultats... Erreur! Signet non 5.6. Discussion... Erreur! Signet non 5.6.1. Expériences préliminaires... Erreur! Signet non 5.6.1.1. Identification des catégories phonétiqueserreur! Signet non 5.6.1.2. Evaluation des timbres des voyelles synthétiques en fonction du... quotient d ouverture à la glotte et du coefficient de réflexion aux poumonserreur! Signet non 5.6.2. Expériences d évaluations perceptiveserreur! Signet non 5.6.2.1. Evaluation du critère naturel des voyelles synthétiques par... deux méthodes différentes... Erreur! Signet non 5.6.2.2. Classification binaire humaine/synthétique de voyelles modaleserreur! Signet non 5.6.2.3. Mesure de similarité entre voyelles modales synthétiques et... humaines... Erreur! Signet non 5.6.2.4. Perception des différents niveaux d enrouementserreur! Signet non 5.6.2.5. Classification humaine/ synthétique des voix troubléeserreur! Signet non 5.6.3. Expérience d exploitation... Erreur! Signet non 5.7. Résumé... Erreur! Signet non 6. Conclusion et perspectives... Erreur! Signet non Bibliographie... Erreur! Signet non