La reconnaissance vocale PARTIE A : ANALYSE ET SYNTHESE DE DOCUMENTS SCIENTIFIQUES

La reconnaissance vocale Mots-clefs : Reconnaissance vocale. Contexte du sujet : De plus en plus d appareils d utilisation courante (smartphones, ordinateurs ou plateformes téléphoniques) utilisent aujourd hui la reconnaissance vocale. Comment fonctionne-t-elle? PARTIE A : ANALYSE ET SYNTHESE DE DOCUMENTS SCIENTIFIQUES Document 1 : Reconnaissance vocale La reconnaissance vocale fait intervenir un processus complexe, permettant à une machine d'identifier des mots ou des phrases en vue d'exécuter un ordre, d'identifier une personne ou bien encore de transcrire la parole humaine en texte écrit. Elle peut être mise en oeuvre par l'identification de spectrogrammes : des représentations graphiques des fréquences sonores émises en fonction du temps. De plus en plus d'appareils d'utilisation courante utilisent aujourd'hui la reconnaissance vocale. La reconnaissance automatique de la parole (souvent improprement appelée reconnaissance vocale) est une technique informatique qui permet d'analyser la parole captée au moyen d'un microphone pour la transcrire sous la forme d'un texte exploitable par une machine. La reconnaissance de la parole, ainsi que la synthèse de la parole, I'identification du locuteur ou la vérification du locuteur, font partie des techniques de traitement de la parole. Ces techniques permettent notamment de réaliser des interfaces vocales c'est-à-dire des interfaces homme-machine (lhm) où une partie de I'interaction se fait à la voix. Parmi les nombreuses applications, on peut citer les applications de dictée vocale sur PC où la difficulté tient à la taille du vocabulaire et à la longueur des phrases, mais aussi les applications téléphoniques de type serveur vocal, où la difficulté tient plutôt à la nécessité de reconnaître n'importe quelle voix dans des conditions acoustiques variables et souvent bruyantes (téléphones mobiles dans des lieux publics). Extrait du site Internet Wikipédia. Document 2 : Techniques de la reconnaissance vocale (Extrait du manuel Bordas TS spécialité physique chimie) Pour identifier le langage parlé, deux techniques peuvent être employées en fonction de l'application utilisée. L'approche globale s'intéresse directement aux mots. Une image acoustique d'un certain nombre de mots est enregistrée dans une base et comparée à l'image acoustique du mot prononcé. Cette technique est efficace, mais le nombre de mots est limité à cause de la capacité de stockage et de traitement de la machine. L'approche analytique est basée sur la reconnaissance des phonèmes et syllabes. L'avantage est incomparable : tous les mots de la langue française peuvent être prononcés avec seulement 36 phonèmes. Pour pallier les différences d'accent, de timbre, ou de rythme de parole, on "entraîne" le système de reconnaissance en faisant lire au locuteur des phrases choisies. La plus grande difficulté est que la machine doit interpréter le sens du discours pour ne pas confondre deux phrases phonétiquement identiques. Au café de la Paix, grand-père, il se fait tard Oh! Qu'à fait de la pègre en péril ce fêtard? (Lucien Reymond) Document 3 : Principe de la reconnaissance vocale Voici les trois étapes nécessaires pour réaliser une reconnaissance vocale : 1. Le son est découpé en petites tranches et l ordinateur procède à une analyse fréquentielle de chacune d'elles suivant une méthode mathématique appelée décomposition de Fourier. Reconnaissance vocale Page 1 / 6 C. Grange-Reynas

2. Le résultat de la décomposition de Fourier de chaque tranche est analysé pour en extraire des segments élémentaires de parole. Un apprentissage de la voix de l'utilisateur est parfois nécessaire pour avoir un résultat efficace. 3. Enfin, l'ordinateur associe les segments élémentaires de parole, utilise un dictionnaire et le contexte pour reconstruire des mots et des phrases afin de trouver le discours le plus probable. Document 4 : (Extrait du manuel Hachette TS spécialité physique chimie) Reconnaissance vocale Page 2 / 6 C. Grange-Reynas

Document 5 : Exemples de spectrogrammes Les spectrogrammes sont employés pour identifier les sons. Dans le langage parlé, les sons sont constitués d'une multitude de fréquences et évoluent au cours du temps. Un spectrogramme permet de suivre l'évolution de la fréquence au cours du temps. Document 6 : Domaines de la reconnaissance vocale La reconnaissance vocale est une technologie relativement récente, qui séduit énormément les professionnels et le grand public par son aspect pratique, ludique et ergonomique. Les applications de cette technologie sont nombreuses : navigation sur un serveur vocal au téléphone, apprentissage d'une langue étrangère, commandes vocales dans les voitures, les téléphones ou bien encore dans les salles d'opérations chirurgicales, dictée vocale (écriture en directe d'un texte dicté), identification vocale dans les zones sécurisées ou bien dans le cadre d'une enquête judiciaire, etc. Le vieux rêve de la communication avec les machines en utilisant simplement la parole n'a jamais été aussi près d'être atteint. Fig 5 : Ce robot peut obéir à des ordres simples grâce à la reconnaissance vocale Reconnaissance vocale Page 3 / 6 C. Grange-Reynas

Document 7 (Extrait du manuel Hachette TS spécialité physique chimie) Reconnaissance vocale Page 4 / 6 C. Grange-Reynas

Extraire et exploiter des informations 1. Quelles sont les deux techniques utilisées pour la reconnaissance vocale? 2. Ces deux techniques décomposent-elles les phrases de la même façon? 3. Quels sont les avantages et inconvénients pour chacune d'entre elles? 4. Pourquoi dit-on souvent que le fonctionnement de certains systèmes de reconnaissance vocale s apparente à de l intelligence artificielle? 5. Dans les spectrogrammes des fig. 1 ; 2 ; 3 et 4, quelle grandeur est représentée en abscisse? En ordonnée? 6. Quelles sont les unités de ces grandeurs? 7. Associer à chaque application de la reconnaissance vocale citée dans le doc. 6 la technique de reconnaissance qui semble être la plus logiquement employée. 8. Les voix des personnes de sexe féminin sont souvent plus aiguës que celles des personnes de sexe masculin. Dans le doc. 5, les deux personnes qui ont été enregistrées étaient de sexes opposés et ont prononcé "envoyer" et "annuler". Quel est le mot prononcé sur la figure 3? Sur la figure 4? 9. Retrouver la paire de mots prononcée par chacun. Associer à la personne le sexe le plus probable. 10. Pourquoi dit-on que la reconnaissance vocale n'est pas qu'un problème d'informatique? 11. Pourquoi, malgré tous les progrès actuels, la reconnaissance vocale d'un texte parlé dans la langue naturelle n'est-elle pas fiable à 100 %? Ce qu il faut retenir : La reconnaissance vocale est un système de traitement du son qui analyse la voix humaine. Les premiers travaux sur la reconnaissance vocale ont commencé en 1950. Ce système utilise toutes les techniques d analyse du son et des signaux périodiques. Ses applications sont multiples : gestion des appareils d assistance humaine (notamment des fauteuils roulants) ; saisie de texte informatique dicté sur ordinateur ; contrôle d accès par reconnaissance d «empreinte» vocale ; contrôle complet d un équipement informatique (ordinateur domestique, smartphone, etc.). La reconnaissance vocale, domaine scientifique en plein essor, peut se décomposer en quatre étapes : 1. Le traitement acoustique, qui numérise le signal et le traite par analyse spectrale (appelée analyse de Fourier) ; 2. La décomposition du mot en phonèmes ; 3. L apprentissage automatique, qui compare des séquences enregistrées à une base de séquences connues ; 4. Le décodage, qui reconstitue le discours le plus probable en assemblant les séquences apprises précédemment. Reconnaissance vocale Page 5 / 6 C. Grange-Reynas

PARTIE B : RESOLUTION DE PROBLEMES SCIENTIFIQUES (Extrait du manuel Hachette TS spécialité physique chimie) Reconnaissance vocale Page 6 / 6 C. Grange-Reynas