La reconnaissance vocale PARTIE A : ANALYSE ET SYNTHESE DE DOCUMENTS SCIENTIFIQUES

Documents pareils
Cours / Formation pour débutant en informatique, bureautique, Internet etc... (pour débutants)

Le chiffre est le signe, le nombre est la valeur.

COMMUNICATEUR BLISS COMMANDE PAR UN SENSEUR DE POSITION DE L'OEIL

LES DIFFÉRENTS FORMATS AUDIO NUMÉRIQUES

UEO11 COURS/TD 1. nombres entiers et réels codés en mémoire centrale. Caractères alphabétiques et caractères spéciaux.

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

1. Qu est-ce que la conscience phonologique?

Didier Pietquin. Timbre et fréquence : fondamentale et harmoniques

GEP À LA DÉCOUVERTE DU MONDE PROFESSIONNEL. Troisième Découverte Professionnelle Module 3 heures - Collège

En tant que producteur de technologies applicatives, nous vous proposons un large panel de solutions vocales :

Une proposition de séquence relative à l étude des sons /an/, /on/ et de leurs graphies. Cadre général

MANUEL TBI - STARBOARD

Chapitre 18 : Transmettre et stocker de l information

Apprentissage Automatique

Communication parlée L2F01 TD 7 Phonétique acoustique (1) Jiayin GAO <jiayin.gao@univ-paris3.fr> 20 mars 2014

Outils permettant la diffusion de l information. Un point sur le droit numérique

Gestion de la Relation Client (GRC)

UE11 Phonétique appliquée

Leica Application Suite

INTRODUCTION A L ELECTRONIQUE NUMERIQUE ECHANTILLONNAGE ET QUANTIFICATION I. ARCHITECTURE DE L ELECRONIQUE NUMERIQUE

«Le Dolby Digital 5.1 et les tests en champ libre par ordinateur»

TPS 4 Objectifs du programme aide à la lecture et à l'écriture Les fonctions principales lecture à haute voix

Demande d admission au Centre pédagogique Lucien-Guilbault Secteur primaire

Décompresser, créer une archive au format «ZIP»

Tutoriels. 01 Utiliser Praat. 02 Transcrire sous Praat en utilisant les conventions VALIBEL. Sylviane Bachy. Rédaction octobre 2005

Etudier l influence de différents paramètres sur un phénomène physique Communiquer et argumenter en utilisant un vocabulaire scientifique adapté

Lire, dire et écrire en utilisant les cartes heuristiques. OBJECTIFS

Cours Informatique 1. Monsieur SADOUNI Salheddine

FctsAffines.nb 1. Mathématiques, 1-ère année Edition Fonctions affines

Indications pour une progression au CM1 et au CM2

Document d aide au suivi scolaire

Partie Agir : Défis du XXI ème siècle CHAP 20-ACT EXP Convertisseur Analogique Numérique (CAN)

Les techniques de multiplexage

ultisites S.A. module «services»

Pratiques et usages du web, la «culture internet» moderne

D'UN SITE INTERNET LES S D'UN SITE INTERNET PRATIQUE ET PERFORMANT PRATIQUE ET PERFORMANT

Big Data et Graphes : Quelques pistes de recherche

Les textos Slt koman sa C pa C?

B2i. LE B2i Brevet Informatique et Internet. Niveau : tous. 1 S'approprier un environnement informatique de travail. b2ico1.odt.

Le Raid c est quoi? Comment ca marche? Les différents modes RAID :

Quel outil numériques pour répondre à un besoin de communication dans un projet collectif?

N SIMON Anne-Catherine

Faculté des sciences de gestion et sciences économiques BASE DE DONNEES

Ordonner les étapes «Voitures en circulation»

EVOLUTIONS suite à mise à jour

L ORDINATEUR. Les composants. La carte mère. Le processeur. Fréquence

Éléments d'architecture des ordinateurs

Chapitre 2 Les ondes progressives périodiques

POUR ÉCRIRE UN MOT 1 : LOGICIEL DE SIMULATION LINGUISTIQUE

Ordonnance du DFJP sur les instruments de mesure audiométriques

Les Enseignants de l Ere Technologique - Tunisie. Niveau 1

Présentation de notre solution de formation en ligne

Abdenour Hacine-Gharbi. Sélection de paramètres acoustiques pertinents pour la reconnaissance de la parole

KeePass - Mise en œuvre et utilisation

3. SPÉCIFICATIONS DU LOGICIEL. de l'expression des besoins à la conception. Spécifications fonctionnelles Analyse fonctionnelle et méthodes

M1107 : Initiation à la mesure du signal. T_MesSig

Dan Istrate. Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier

Fiche de l'awt Qu'est-ce qu'un Intranet?

La médiatrice d un segment

Chaine de transmission

Explications des items d'obii pour la validation du B2I

TEXT MINING von 7

NewPoint IT Consulting BIG DATA WHITE PAPER. NewPoint Information Technology Consulting

Transmission d informations sur le réseau électrique

Rapidolect Les Productions de la Columelle ( ) Page 1

Outils informatiques de manipulation de la vidéo et du son : une introduction

Interface Homme-Machine 1

O b s e r v a t o i r e E V A P M. Taxonomie R. Gras - développée

TS 35 Numériser. Activité introductive - Exercice et démarche expérimentale en fin d activité Notions et contenus du programme de Terminale S

Enseigner les Lettres avec les TICE

Chapitre 5 Émetteurs et récepteurs sonores

Visio Kit. Mode d'emploi

OPTION SCIENCES BELLE-ISLE-EN-TERRE

B2i. Brevets Nouvelles Technologies. Brevet n 1. Brevet n 16. Ecole primaire de Boz Ec-Elementaire-Boz@ac-lyon.fr

Introduction à NetCDF

Master IAD Module PS. Reconnaissance de la parole (suite) Alignement temporel et Programmation dynamique. Gaël RICHARD Février 2008

Convention Beobank Online et Beobank Mobile

Présentation. Référenciel : textes officiels

Analyse des bruits de clavier d ordinateur

Avantic Software Présentation de solutions GED pour mobiles (Gestion Electronique de Documents)

La voix sur IP n'est pas un gadget, et présente de réels bénéfices pour l'entreprise.

Compétences souhaitées à la fin des trois cycles de l enseignement spécialisé (musique)

Chapitre 07 Le modèle relationnel des données

Caractéristiques des ondes

Usages pédagogiques des tablettes

Installer une imprimante réseau.

: un risque a chassé l autre

Intérêt du découpage en sous-bandes pour l analyse spectrale

Culture scientifique et technologique

Baccalauréat technologique

DÉMARRER LE PC SUR UNE CLÉ USB OU UN CD

Analyse hiérarchique de tâches (AHT)

UNE EXPERIENCE, EN COURS PREPARATOIRE, POUR FAIRE ORGANISER DE L INFORMATION EN TABLEAU

Annexe : La Programmation Informatique

Baromètre de conjoncture de la Banque Nationale de Belgique

Google fait alors son travail et vous propose une liste de plusieurs milliers de sites susceptibles de faire votre bonheur de consommateur.

Scénario n 24 : QUOI FAIRE AVEC MON BAC PRO TRANSPORT /LOGISTIQUE?

Transcription:

La reconnaissance vocale Mots-clefs : Reconnaissance vocale. Contexte du sujet : De plus en plus d appareils d utilisation courante (smartphones, ordinateurs ou plateformes téléphoniques) utilisent aujourd hui la reconnaissance vocale. Comment fonctionne-t-elle? PARTIE A : ANALYSE ET SYNTHESE DE DOCUMENTS SCIENTIFIQUES Document 1 : Reconnaissance vocale La reconnaissance vocale fait intervenir un processus complexe, permettant à une machine d'identifier des mots ou des phrases en vue d'exécuter un ordre, d'identifier une personne ou bien encore de transcrire la parole humaine en texte écrit. Elle peut être mise en oeuvre par l'identification de spectrogrammes : des représentations graphiques des fréquences sonores émises en fonction du temps. De plus en plus d'appareils d'utilisation courante utilisent aujourd'hui la reconnaissance vocale. La reconnaissance automatique de la parole (souvent improprement appelée reconnaissance vocale) est une technique informatique qui permet d'analyser la parole captée au moyen d'un microphone pour la transcrire sous la forme d'un texte exploitable par une machine. La reconnaissance de la parole, ainsi que la synthèse de la parole, I'identification du locuteur ou la vérification du locuteur, font partie des techniques de traitement de la parole. Ces techniques permettent notamment de réaliser des interfaces vocales c'est-à-dire des interfaces homme-machine (lhm) où une partie de I'interaction se fait à la voix. Parmi les nombreuses applications, on peut citer les applications de dictée vocale sur PC où la difficulté tient à la taille du vocabulaire et à la longueur des phrases, mais aussi les applications téléphoniques de type serveur vocal, où la difficulté tient plutôt à la nécessité de reconnaître n'importe quelle voix dans des conditions acoustiques variables et souvent bruyantes (téléphones mobiles dans des lieux publics). Extrait du site Internet Wikipédia. Document 2 : Techniques de la reconnaissance vocale (Extrait du manuel Bordas TS spécialité physique chimie) Pour identifier le langage parlé, deux techniques peuvent être employées en fonction de l'application utilisée. L'approche globale s'intéresse directement aux mots. Une image acoustique d'un certain nombre de mots est enregistrée dans une base et comparée à l'image acoustique du mot prononcé. Cette technique est efficace, mais le nombre de mots est limité à cause de la capacité de stockage et de traitement de la machine. L'approche analytique est basée sur la reconnaissance des phonèmes et syllabes. L'avantage est incomparable : tous les mots de la langue française peuvent être prononcés avec seulement 36 phonèmes. Pour pallier les différences d'accent, de timbre, ou de rythme de parole, on "entraîne" le système de reconnaissance en faisant lire au locuteur des phrases choisies. La plus grande difficulté est que la machine doit interpréter le sens du discours pour ne pas confondre deux phrases phonétiquement identiques. Au café de la Paix, grand-père, il se fait tard Oh! Qu'à fait de la pègre en péril ce fêtard? (Lucien Reymond) Document 3 : Principe de la reconnaissance vocale Voici les trois étapes nécessaires pour réaliser une reconnaissance vocale : 1. Le son est découpé en petites tranches et l ordinateur procède à une analyse fréquentielle de chacune d'elles suivant une méthode mathématique appelée décomposition de Fourier. Reconnaissance vocale Page 1 / 6 C. Grange-Reynas

2. Le résultat de la décomposition de Fourier de chaque tranche est analysé pour en extraire des segments élémentaires de parole. Un apprentissage de la voix de l'utilisateur est parfois nécessaire pour avoir un résultat efficace. 3. Enfin, l'ordinateur associe les segments élémentaires de parole, utilise un dictionnaire et le contexte pour reconstruire des mots et des phrases afin de trouver le discours le plus probable. Document 4 : (Extrait du manuel Hachette TS spécialité physique chimie) Reconnaissance vocale Page 2 / 6 C. Grange-Reynas

Document 5 : Exemples de spectrogrammes Les spectrogrammes sont employés pour identifier les sons. Dans le langage parlé, les sons sont constitués d'une multitude de fréquences et évoluent au cours du temps. Un spectrogramme permet de suivre l'évolution de la fréquence au cours du temps. Document 6 : Domaines de la reconnaissance vocale La reconnaissance vocale est une technologie relativement récente, qui séduit énormément les professionnels et le grand public par son aspect pratique, ludique et ergonomique. Les applications de cette technologie sont nombreuses : navigation sur un serveur vocal au téléphone, apprentissage d'une langue étrangère, commandes vocales dans les voitures, les téléphones ou bien encore dans les salles d'opérations chirurgicales, dictée vocale (écriture en directe d'un texte dicté), identification vocale dans les zones sécurisées ou bien dans le cadre d'une enquête judiciaire, etc. Le vieux rêve de la communication avec les machines en utilisant simplement la parole n'a jamais été aussi près d'être atteint. Fig 5 : Ce robot peut obéir à des ordres simples grâce à la reconnaissance vocale Reconnaissance vocale Page 3 / 6 C. Grange-Reynas

Document 7 (Extrait du manuel Hachette TS spécialité physique chimie) Reconnaissance vocale Page 4 / 6 C. Grange-Reynas

Extraire et exploiter des informations 1. Quelles sont les deux techniques utilisées pour la reconnaissance vocale? 2. Ces deux techniques décomposent-elles les phrases de la même façon? 3. Quels sont les avantages et inconvénients pour chacune d'entre elles? 4. Pourquoi dit-on souvent que le fonctionnement de certains systèmes de reconnaissance vocale s apparente à de l intelligence artificielle? 5. Dans les spectrogrammes des fig. 1 ; 2 ; 3 et 4, quelle grandeur est représentée en abscisse? En ordonnée? 6. Quelles sont les unités de ces grandeurs? 7. Associer à chaque application de la reconnaissance vocale citée dans le doc. 6 la technique de reconnaissance qui semble être la plus logiquement employée. 8. Les voix des personnes de sexe féminin sont souvent plus aiguës que celles des personnes de sexe masculin. Dans le doc. 5, les deux personnes qui ont été enregistrées étaient de sexes opposés et ont prononcé "envoyer" et "annuler". Quel est le mot prononcé sur la figure 3? Sur la figure 4? 9. Retrouver la paire de mots prononcée par chacun. Associer à la personne le sexe le plus probable. 10. Pourquoi dit-on que la reconnaissance vocale n'est pas qu'un problème d'informatique? 11. Pourquoi, malgré tous les progrès actuels, la reconnaissance vocale d'un texte parlé dans la langue naturelle n'est-elle pas fiable à 100 %? Ce qu il faut retenir : La reconnaissance vocale est un système de traitement du son qui analyse la voix humaine. Les premiers travaux sur la reconnaissance vocale ont commencé en 1950. Ce système utilise toutes les techniques d analyse du son et des signaux périodiques. Ses applications sont multiples : gestion des appareils d assistance humaine (notamment des fauteuils roulants) ; saisie de texte informatique dicté sur ordinateur ; contrôle d accès par reconnaissance d «empreinte» vocale ; contrôle complet d un équipement informatique (ordinateur domestique, smartphone, etc.). La reconnaissance vocale, domaine scientifique en plein essor, peut se décomposer en quatre étapes : 1. Le traitement acoustique, qui numérise le signal et le traite par analyse spectrale (appelée analyse de Fourier) ; 2. La décomposition du mot en phonèmes ; 3. L apprentissage automatique, qui compare des séquences enregistrées à une base de séquences connues ; 4. Le décodage, qui reconstitue le discours le plus probable en assemblant les séquences apprises précédemment. Reconnaissance vocale Page 5 / 6 C. Grange-Reynas

PARTIE B : RESOLUTION DE PROBLEMES SCIENTIFIQUES (Extrait du manuel Hachette TS spécialité physique chimie) Reconnaissance vocale Page 6 / 6 C. Grange-Reynas