Les reconnaissances de la parole

Dimension: px
Commencer à balayer dès la page:

Download "Les reconnaissances de la parole"

Transcription

1 Les reconnaissances de la parole Marie-José Caraty * C. Montacié ** * Université Paris Descartes - LIPADE 45, rue des Saints Pères Paris Marie-Jose.Caraty@ParisDescartes.fr ** STIH, Université Paris-Sorbonne, France Studia Informatica Universalis.

2 108 Studia Informatica Universalis. 1. La parole dans tous ses états La reconnaissance de la parole est l une des tâches pionnières de l Intelligence Artificielle (IA) consistant à reproduire la capacité d un être humain à extraire des informations de la parole produite par un autre être humain. Cette tâche, trop complexe pour être reproduite par un système informatique unique, a été subdivisée en plusieurs sous-problèmes en fonction du type d informations à extraire et à reconnaître. Les problématiques les plus étudiées sont la reconnaissance du locuteur, de son état émotionnel, de la langue employee et du langage parlé. Les recherches sur la résolution des ces tâches ont donné lieu, depuis une vingtaine d années, à des dizaines de milliers de publications, des centaines de bases de données de parole, des dizaines de campagnes internationales d évaluation. Les progrès ont été importants et ont permis le développement d applications importantes en communication hommemachine comme la dictée vocale ou les systèmes de dialogues finalisés des serveurs vocaux interactifs (SVI). Cependant de nombreuses recherches restent indispensables en raison de l ampleur du problème et de sa variabilité : 7 milliards de locuteurs, plus de 500 noms d émotions, près de 7000 langues et quelques centaines de milliers de mots par langue. D autres types d information restent pour l instant pratiquement inexploités comme l accent, l état physiologique, le niveau de stress ou de fatigue. La modélisation markovienne de la parole est un sujet de recherche partagé entre toutes ces problématiques. Ce modèle et ses dérivés comme les réseaux bayésiens ou les combinaisons de gaussiennes (GMM) permettent l intégration des informations acoustiques de la parole continue avec des informations symboliques représentant les informations transmises et à reconnaître. Des méthodes efficaces permettent d inférer ces modèles à partir de la parole, d estimer leurs paramètres et de proposer des méthodes de reconnaissance de complexité polynomiale.

3 Combinatorial Optimization in Practice Les caractéristiques individuelles et la reconnaissance du locuteur Les caractéristiques individuelles d un locuteur permettent à ses interlocuteurs de le reconnaître par sa voix [1]. Ces caractéristiques sont soit des traits acoustiques [2] reliés à la physiologie de l appareil phonatoire (géométrie et qualité des organes de phonation), soit des traits linguistiques reliés à l apprentissage du langage parlé comme les accents régionaux [3] ou sociaux [4]. Le premier système automatique de reconnaissance du locuteur date de 1963, mais ce n est que depuis une vingtaine d années que ce domaine a éveillé l intérêt d un nombre croissant de chercheurs, d industriels, de policiers et de juges [5]. L utilisation de mots-clés était indispensable dans les premières méthodes développées [6], mais la plupart des systèmes actuels sont indépendants du texte prononcé. Les techniques développées utilisent trois types d approches : statique, dynamique et linguistique. Les systèmes de reconnaissance du locuteur peuvent naturellement combiner plusieurs de ces approches. Les deux premières approches s appuient sur des informations purement acoustiques [7]. Elles se différencient par l utilisation ou non de paramètres représentant l évolution temporelle du signal vocal [8]. L approche linguistique est fondée sur l analyse du lexique employé et des variantes dialectales utilisées [9]. Les deux principales applications de la reconnaissance du locuteur sont : la vérification de l identité pour protéger l accès physique à des locaux sensibles ou l accès distant à des informations confidentielles et la vraisemblance de preuves en justice dans le cadre de la comparaison de voix de justiciables La langue et sa détection Près de 7000 langues sont référencées dans le monde [10] dont plus de 300 sont parlées par plus d un million de personnes. Chacune de ces langues a des caractéristiques phonologiques (ensemble des sons) [11], morphologiques (ensemble des mots), et prosodiques (position des accents et intonations dans les mots, valeur sémantique des accents) différentes. Elles appartiennent à plus de 100 familles de langues (sinothibétaine, indo-européenne, dravidien,...) [12] construites à partir de caractéristiques linguistiques communes. Les premières recherches

4 110 Studia Informatica Universalis. datent des années 1970, avec à un taux d identification de 62% pour des segments de parole de 90 secondes en sept langues [13]. La principale problématique a été de diminuer la durée des segments tout en augmentant le nombre de langues. Les recherches ont pu être grandement facilitées par la disponibilité de la base de l Oregon Graduate Institute (OGI) dédiée à l identification des langues et comportant des enregistrements de communications téléphoniques (voix spontanées) en 22 langues [14]. Deux approches sont étudiées pour cette problématique, l une est purement acoustique, l autre plus difficile à mettre en IJuvre est linguistique. L approche acoustique consiste à représenter une langue par les réalisations acoustiques de ses phones [15] et des règles phonotactiques. Cette approche donne de bons résultats si les langues ont un domaine acoustique nettement différencié, mais trouve rapidement ses limites quand le nombre de langues augmente. L approche linguistique est basée sur la reconnaissance de mots [16] ou de syllabes spécifiques [17] d une langue, l importance des ressources linguistiques à mettre en IJuvre (dictionnaire et modèle de langage pour chaque langue à reconnaître) rend cette approche plus difficile mais plus prometteuse que la précédente. L application principale de la détection automatique de la langue ou de la famille de langues est le routage automatique d appels téléphoniques vers la personne ou le système de reconnaissance de la parole susceptible de traiter la langue. D autres applications existent dans le domaine de la sécurité Le langage et la reconnaissance du langage parlé Depuis plus de ans et le passage de la langue des gestes au langage parlé [18], la parole est le moyen principal de communication entre les humains. Depuis près de 60 ans, la recherche en reconnaissance automatique du langage parlé est l un des enjeux majeurs de l intelligence artificielle. Sa problématique principale est l association d un signal biologique, bruité et d une grande variabilité spatiale et temporelle [19], aux structures symboliques du langage (phonétique, phonologique, lexical, morphologique, syntaxique, sémantique, pragmatique et rhétorique). Les recherches en reconnaissance du langage parlé consistent d une part à modéliser cette variabilité par des méthodes statistiques (e.g., modèles markoviens) et de recherche opéra-

5 Combinatorial Optimization in Practice 111 tionnelle (e.g., programmation dynamique) et d autre part de définir des processus de transduction entre les modèles du signal de parole et certaines structures de la langue. Les principales tâches associées à la reconnaissance du langage parlé sont le décodage acoustico-phonétique, la détection de mots-clés et la reconnaissance des mots de la parole continue. Le décodage acoustico-phonétique (DAP) consiste à extraire d une analyse du signal vocal, une hypothèse de treillis des phonèmes. Les meilleures performances obtenues sont de l ordre de 75% pour de la parole lue [20] et de 60% pour de la parole conversationnelle téléphonique [21]. La détection de mots-clés [22, 23], cherche à reconnaître et à localiser toutes les occurrences des mots d une liste de mots-clés dans un continuum de parole donné. Le taux de détection est donné en fonction du nombre de fausses alarmes par millier de mots-clés détectés et par heure de parole (fa/kw/h). Il est de 15% à 25% pour 5 fa/kw/h pour de la parole conversationnelle téléphonique [24]. La troisième tâche, la reconnaissance des mots en parole continue, consiste à reconnaître tous les mots d une élocution prononcée de manière continue, c est-à-dire sans pause artificielle entre les mots. Les premiers systèmes datent du début des années 90 [25]. L apprentissage statistique à grande échelle sur des milliers d heures de parole [26] et des centaines de millions de mots provenant de textes écrits et de transcriptions du langage parlé a permis d obtenir des lexiques de prononciation des mots ainsi que des modélisations stochastiques de la parole et du langage parlé. Ces ressources, utilisées pour diminuer l espace de recherche des suites de mots possibles, permettent d obtenir des algorithmes de décodage de complexité polynomiale. Les performances de reconnaissance sont de l ordre de 90% dans les meilleures conditions (voix lue avec une vitesse d élocution contrôlée, sans émotion et sans bruit). Les taux de reconnaissance chutent fortement quand ces conditions changent [19]. Dans tous les cas, les performances des systèmes de reconnaissance du langage parlé restent très éloignées des performances humaines [27] La parole émotionnelle et la reconnaissance de l émotion La réaction par le système limbique à un stimuli extérieur (e.g., situation de danger) provoque une réponse émotionnelle innée de l être humain par l envoi de signaux vers les systèmes moteurs et le système

6 112 Studia Informatica Universalis. nerveux central [28]. Ces signaux perturbent les commandes de l appareil phonatoire [29] et les processus cognitifs de production du langage parlé [30]. La parole émotionnelle est alors la vocalisation de la réponse émotionnelle. La parole émotionnelle peut également être apprise et produite volontairement par le locuteur sans stimuli extérieur [31]. Dans les deux cas, cette parole est porteuse d informations sur les émotions transmises par le locuteur, qu elles soient ressenties ou simulées. Ces informations perceptibles par un autre être humain constituent le message émotionnel [32]. Deux types de problématiques sont associés à la reconnaissance de ce message dans la parole : la représentation d une émotion et la détection des corrélats acoustiques et linguistiques associés à cette représentation. Selon les différentes théories émotionnelles, une émotion peut être représentée par une classe d émotions [33, 34] ou par un point dans un espace de dimension réduite [35]. Dans le cadre de la reconnaissance de l émotion, les deux types de représentation sont utilisés : émotions positives et négatives, agréables ou désagréables ou choix parmi une liste comme par exemple {colère, peur, tristesse, joie, dégoût et surprise}. Les premiers travaux de reconnaissance automatique de l émotion datent des années 80 [36]. Plus d une vingtaine de bases de données de parole émotionnelle, validées à l aide d un corpus d auditeurs, sont maintenant référencées [37]. Dans la littérature, les taux de reconnaissance varient de 50 à 75% pour une discrimination entre 4 à 6 émotions. De nombreux paramètres acoustiques et linguistiques sont étudiés comme la qualité de la parole, le timbre, la prosodie, l accentuation et l intonation des mots [38]. Les principales applications sont l amélioration des interfaces homme-machine par l ajout d une composante émotionnelle, la détection automatique de situations de catastrophes ou de comportements anormaux. 2. Modélisation markovienne Plusieurs facteurs expliquent le succès et l utilisation généralisée du cadre markovien [39] pour modéliser la parole : les propriétés mathématiques de convergence, le développement et la mise à disposition de grandes bases de données nécessaires à l estimation statistique, une architecture adéquate à l intégration de connaissances symboliques (linguistique, psychologique, physiologique,...) avec les descriptions

7 Combinatorial Optimization in Practice 113 numériques du continuum de parole (observations). Les premières recherches ont eu lieu au début des années 70 par J. K. Baker [40] et F. Jelinek [41] et cette modélisation est aujourd hui encore à la base des systèmes de l état de l art en reconnaissance de la parole. Dans le cadre markovien, le processus de décodage de la parole en une suite de symboles (identité du locuteur, langue parlée, phonèmes, mots, état émotionnel) utilise la règle de décision du maximum a posteriori [42] : où : w = arg max w P (w/x) = arg max w P (x/w)p (w) P (x) = arg max w P (x/w)p (w) (1) x est la séquence d observations représentant le continuum de parole, w est la suite de symboles décodés, P (x/w), la probabilité d observer la séquence d observations x pour un continuum de parole étiqueté avec la suite de symboles w,et P (w), la probabilité d un continuum de parole étiqueté avec la suite de symboles w Le modèle markovien présente l intérêt d un traitement global des niveaux acoustiques et symboliques pour le décodage et d un apprentissage indépendant de la modélisation du canal acoustique et de la modélisation du langage de symboles. Cependant la reconnaissance markovienne est coûteuse en temps de calcul et en mémoire dans le cas d un décodage optimal. Des méthodes d élagage permettent d établir un compromis entre les solutions algorithmiques (recherche et optimisation) et les contraintes matérielles (rapidité et mémoire) Modélisation du canal acoustique Un modèle de Markov caché permet de modéliser la séquence d observations associée à un symbole. Il est constitué de l association d une chaîne de Markov homogène et des fonctions de densité de probabilité des observations [43]. Une chaîne de Markov homogène est représentée par un automate d états finis probabiliste constitué d états et de

8 114 Studia Informatica Universalis. transitions entre états. A chacune des transitions est associée une fonction de densité de probabilité. Elles permettent de mesurer la probabilité conjointe d une séquence d observations associée à une séquence de transitions de l automate. La somme des probabilités conjointes sur l ensemble des séquences de transitions est la probabilité que ce modèle de Markov émette la séquence d observations. Il constitue le terme P (x/w) de l équation (1). La topologie du modèle de Markov (nombre des états de l automate et transitions autorisées entre ces états) est choisie a priori. Une des topologies usuelles, le modèle de Bakis [44], est un bon compromis entre le nombre de transitions et celui des états. Il comprend trois types de transitions : boucle sur le même état, transition vers l état suivant, saut d un état. Le nombre d états dépend de la taille moyenne des segments acoustiques associés au symbole. Il est en général de 3 dans le cas de segments phonétiques. Différents algorithmes [45, 46] optimaux et sous-optimaux permettent d estimer les paramètres d un modèle de Markov en fonction de données d apprentissage. Le processus de décodage d une séquence d observations consiste à choisir comme symbole celui correspondant à la machine de Markov de plus grande probabilité d émission Modélisation du langage de symboles Les modèles du langage de symboles permettent de calculer le terme P (w) de l équation (1) et contraint la suite des symboles décodés. Ces modèles de langage sont basés le plus souvent sur des n-grammes (i.e., probabilité d une suite de n symboles). Ils sont utilisés principalement dans la reconnaissance du langage parlé. Dans ce cadre, ils permettent de prendre en compte, le type d élocutions à reconnaître (lettres commerciales, diagnostics médicaux, textes journalistiques, conversations,...) et d éviter des suites de mots improbables. Ces modèles de langage sont estimés, à partir de corpus de textes écrits de très grande taille, par le compte des occurrences n- grammes dans les corpus et sont ainsi spécialisés dans le domaine des textes appris. Si l on prend l exemple du modèle de langage calculés par la société google [47] sur un ensemble de 95 millions de phrases en anglais extraites du Web. Avec un lexique de 13 millions de mots,

9 Combinatorial Optimization in Practice 115 il n y a que 314 millions de bigrammes (sur les 169x10 12 possibles) et 977 millions de trigrammes (sur les 4046x10 18 possibles). Même si ces nombres sont élevés, ils ne représentent qu une infime partie des n-grammes possibles. De manière à ne pas écarter une solution comprenant un n-gramme non-observé (probabilité d apparition nulle) dans les corpus d apprentissage de modèles de langage, on estime un compte non nul pour les n-grammes non-observés. Deux méthodes sont classiquement utilisées pour le calcul des n-grammes non-observés : la méthode par interpolation [48] ou la méthode du back off " [49, 50] Les ressources Les ressources présentées ici sont indispensables à la reconnaissance du langage parlé ; pour les autres reconnaissances, elles peuvent suivant la stratégie adoptée être nécessaires en tout ou partie. Pour la reconnaissance du langage parlé, le vocabulaire de reconnaissance est l ensemble des mots pouvant apparaître dans l hypothèse de décodage du système. Ce vocabulaire doit permettre de construire le réseau de décodage des mots qui est utilisé par le moteur de reconnaissance. Rappelons que dans le cas de la reconnaissance à grand vocabulaire, les unités de reconnaissance sont usuellement les phonèmes, et les modèles acoustiques sont les modèles de Markov cachés de ces unités. Le réseau de décodage est la description de l ensemble des mots possibles (vocabulaire) de l hypothèse du système ; chaque mot y est représenté comme la concaténation des modèles acoustiques des unités phonétiques le constituant. La connaissance du vocabulaire de reconnaissance est par conséquent indispensable dans sa version phonétisée pour construire ce réseau. La nature de l annotation des bases de données acoustiques utilisées pour l apprentissage des modèles acoustiques conduit à distinguer un autre lexique : le lexique d apprentissage qui doit couvrir le corpus d apprentissage ou plus exactement les textes lui correspondant. La meilleure adéquation des bases acoustiques au problème de cet apprentissage est leur étiquetage fin en phonèmes. S il existe des solutions pour parvenir à un apprentissage sans cet étiquetage, c est par une procédure itérative d obtention de l étiquetage fin mais avec peu d assurance sur sa qualité. Dans ce cas, les procédures font appel à la connaissance

10 116 Studia Informatica Universalis. même imparfaite des modèles acoustiques et pour chaque phrase d apprentissage elles permettent d aligner sa transcription phonétique sur le signal vocal correspondant ; les modèles acoustiques peuvent alors être réestimés. Ainsi, un lexique phonétisé (de qualité) couvrant les corpus d apprentissage est indispensable. Le vocabulaire de reconnaissance n est a priori pas le même que le lexique d apprentissage. Sans modèle prédictif de ce qui peut être dit, on choisit usuellement un vocabulaire de reconnaissance de taille fixe, composé des mots les plus fréquents observés pour le domaine. Lexique phonétisé Pour couvrir toute l étendue de la communication parlée, il serait évidemment souhaitable que le vocabulaire de reconnaissance couvre toute l expression de la langue. Les dictionnaires de la langue et les dictionnaires spécialisés forment la base d une telle ressource. Quelques ordres de grandeur : Larousse répertorie entrées dans son Lexis, entrées dans son dictionnaire des noms de famille et prénoms de France ; Le Robert répertorie entrées lexicales, entrées dans son dictionnaire des noms propres en histoire, géographie, arts, littérature, et sciences. On peut remarquer que seuls les dictionnaires de la langue incluent systématiquement, dans la structure des articles, la phonétique normative (décrite à partir de l Alphabet Phonétique International - API) et la caractérisation grammaticale du mot. Pour la suite, SAMPA (Speech Assessment Methods Phonetic Alphabet) est le code phonétique utilisé. Dans les dictionnaires, la phonétisation de référence privilégie les scwhas (" e " muet). ; par exemple, le mot "appeler" est phonétisé /a p l e/. Néanmoins, une variante de prononciation telle /a l e/ peut être observée avec le phonème /@/ bien présent dans le signal. Les phonétisations utilisées doivent prendre en compte la réalisation optionnelle du phonème. Le lexique doit également être étendu par l adjonction des flexions qui ne sont pas décrites in extenso dans le dictionnaire. Parmi ces flexions, les flexions en genre et en nombre, les flexions verbales en temps et en conjugaison, soit plus de formes lexicalement différentes. Les variantes phonétiques engendrées par les liaisons doivent été traitées, en moyenne 2,15 variantes phonétiques par

11 Combinatorial Optimization in Practice 117 mot du dictionnaire. Le lexique phonétisé est ainsi étendu à plus d un million de formes phonétiquement différentes. Les entités nommées (e.g., prénoms, noms, pays, villes, lieux "connus",...) sont à phonétiser. Plusieurs catégories dont les noms de famille, par leur nombre et leur caractère international, montrent l étendue du travail d acquisition et le problème de leur phonétisation [51]. En effet, il existe souvent au moins deux phonétisations issues de la prononciation, l une francisée et l autre résultant de la prononciation par un non-natif dans la langue d origine : par exemple, trois variantes phonétiques pour Maastricht [m a s t R i k], [m a s t R i t* ch] (où * symbolise la prononciation optionnelle) peuvent être retenues. La phonétisation des mots étrangers entrant dans la langue française présente le même ordre de difficulté. Corpus textuels pour l apprentissage des modèles linguistiques De larges corpus de texte sont nécessaires à l apprentissage des modèles statistiques de langage. La collecte de ces données vise à mieux modéliser le domaine de la reconnaissance. Des méthodes de collecte automatique à large échelle de pages Web [52] peuvent être utilisées pour maintenir un modèle de langage ; la collecte de données pour un nouveau domaine se résume alors à fournir les mots-clés adéquats au moteur de recherche. Les applications visées avec la parole lue ou préparée contrastent avec les applications du conversationnel où les thèmes changent constamment et où le style varie. Les modèles de langage doivent alors être adaptés aux thèmes (sources de données thématiques variées) et au style (prise en compte de l oral spontané et de sa transcription) [53]. Avant de calculer les modèles de langage, les textes doivent être normalisés. Un travail préliminaire est le nettoyage des textes en s affranchissant des balises de structuration (HTML, XML,...), en éliminant les caractères et signes invalides, en corrigeant dans la mesure du possible les erreurs (coquilles, accents,...) [52]. Il s agit également de normaliser les mots non-standards [54] qui n appartiennent pas au dictionnaire de la langue : i) les nombres (57, XIV, 2M,...), les dates, les devises (=C,,...) que l on transcrit à l écrit sous leur forme parlée,

12 118 Studia Informatica Universalis. ii) les abréviations pour lesquelles on définit des règles de réécriture (Mr en Monsieur, Mme en Madame, Me en Maître,...) et iii) les sigles que l on normalise suivant leur variante de prononciation en cas d acronyme (ONU ou O.N.U. réécrit -O N U et prononcés /o ai n y/, -ONU et prononcé /o n y/). En cas de prise en compte de l emphase d entités nommées à l évaluation, son traitement présente des difficultés de désambiguisation (mot ou entité nommée) lors de la décapitalisation des mots de débuts de phrase. Une autre difficulté concerne le signe point qui a un sens différent s il se trouve en fin de phrase, dans une abréviation ou dans un nombre. L utilisation des modèles de langage n-classes nécessite le taggage des corpus textuels, c est-à-dire l étiquetage des mots en classes. Ainsi, le vocabulaire de reconnaissance et le lexique de couverture des textes d apprentissage des modèles de langage doivent évidemment être taggés. Les classes considérées pour les modèles n-classes peuvent être de natures diverses : les classes peuvent être construites a priori comme par exemple les classes grammaticales ou automatiquement en regroupant les mots ayant le même comportement, c est-à-dire les mots qui se retrouvent toujours dans le même contexte. Pour un modèle n-classes grammatical, des corpus grammaticaux peuvent être taggés jusqu à 400 classes [55] Moteur de reconnaissance et graphe de symboles Le moteur de reconnaissance permet la recherche d une solution optimale ou sous-optimale de l équation (1). Plusieurs algorithmes de complexité polynomiale [56, 57] permettent d obtenir cette solution en une ou plusieurs passes synchrones et asynchrones. Cependant, la suite de symboles correspondant à la solution contient en général trop d erreurs pour être directement utilisable dans des traitements ultérieurs (e.g., correction grammaticale, traduction, résumé, veille). Pour résoudre ce problème, le moteur propose alors un ensemble de solutions représentées sous forme d un graphe de symboles [58].

13 Combinatorial Optimization in Practice 119 Dans le cas de l algorithme du One Pass [59] et d un graphe de symboles synchrones [60], le processus de décodage comprend plusieurs passes synchrones. La complexité de la première passe est en O(V n ) avec V la taille du vocabulaire et n l ordre choisi des n-grammes du modèle de langage utilisé. Cette première passe de décodage génère un graphe de symboles d une profondeur choisi V 1 (V 1 V ). Les autres passes servent à réorganiser ce graphe en utilisant des modèles de langage plus complexes. La i ème passe de décodage génère un graphe de symboles d une profondeur V i choisi (V i V i 1 V ). Sa complexité est en en O(V n i i 1 ) avec n i l ordre choisi des n-grammes du modèle de langage utilisé. L ensemble des passes de décodage a pour but de faire remonter peu à peu la bonne solution dans le graphe de symboles tout en contrôlant la complexité. 3. Evaluation et paradigme d évaluation L évaluation est au cœur des progrès dans tous les domaines de l ingénierie. Bien que les méthodologies d évaluation soient en constante évolution, leur succès est déjà tel que l évaluation pourrait être un domaine de " recherche propre ". Les compétitions se généralisent, elles sont déjà ouvertes à de nombreux domaines technologiques. Par exemple et en collaboration avec NIST (National Institute of Standards and Technology) [61], l ATP (Advanced Technology Program) [62] et récemment le TIP (Technology Innovation Plan) [63] financent et organisent des plans d évaluation dans l objectif d accélérer le développement de la recherche et de la technologie. Les domaines concernés sont aussi divers que l agriculture, la biotechnologie, la micro/nanoélectronique, les machines-outils, l automobile, les matériaux avancés, l information, la communication, la chimie, l énergie, l environnement,... Toutes ces plans ne peuvent être menés qu avec des méthodologies d évaluation adéquates Modes d évaluation Depuis la conception d un système et jusqu à son transfert technologique, l évaluation est présente. Si la méthodologie d évaluation va-

14 120 Studia Informatica Universalis. rie, elle est un moteur indéniable dans les phases de conception, de développement, de maintenance et d utilisation finale. L évaluation est " plurielle " ; en effet, différents modes d évaluation sont identifiés relativement à leurs buts. Il s agit principalement de l adéquation, du diagnostic, du quantitatif et du qualitatif. Evaluation d adéquation L adéquation dont il s agit est celle du système à la tâche assignée, avec la prise en compte de la qualité et du coût. Ce type d évaluation, couplé avec l identification des besoins potentiels des utilisateurs, est particulièrement intéressant dans l information aux " consommateurs ". Le but n est pas tant d identifier le " meilleur système ", que de donner une information comparative qui permette à l utilisateur de faire un choix éclairé du produit relativement à ses besoins et à ses contraintes. Evaluation de diagnostic C est ici un maillage de l espace des entrées possibles, qui permet de dresser un profil du comportement attendu du système. L une des difficultés est bien évidemment de construire une suite de tests représentative. Typiquement, les tests de programme par jeux d essai relèvent de l évaluation de diagnostic. Tout programmeur connaît bien les limites d une telle approche : les jeux d essai ne peuvent servir de preuve de programme, mais seulement de contre-exemples. Un autre exemple de ce mode d évaluation est le développement des compilateurs. C est à la suite d une évaluation de diagnostic intensive que la norme peut être créée et que les compilateurs peuvent être agréés en fonction de la qualité de leurs réponses aux tests de normalisation (benchmarks). Les tests de diagnostic permettent la maintenance d un système évolutif par des tests de régression sur les versions consécutives du système. Un dernier exemple concerne les systèmes d interaction Homme-Machine pour lesquels l information de diagnostic est utile : ce que " réussit " un système et ce qui lui reste " à acquérir " sont autant d informations importantes pour la conception et le développement de ces systèmes. Evaluation de performance quantitative Le triptique critère/mesure/méthode permet l évaluation de performance quantitative. Dans l exemple de la reconnaissance du langage

15 Combinatorial Optimization in Practice 121 parlé, où la problématique est de passer de la parole au texte, le critère est la " bonne " reconnaissance, la mesure usuelle est le taux d erreur en mots, et la méthode consiste à comparer l hypothèse de reconnaissance du système et la transcription de référence du signal-test acoustique (dans le " meilleur des cas ", faite par un expert humain). Ce mode d évaluation, adapté à la comparaison d implémentations, est utile pour le développement et l amélioration des systèmes. Pour une même tâche de reconnaissance, les tests contrastifs permettent d évaluer la contribution d un composant sur les performances globales du système. Evaluation de performance qualitative Cette évaluation vise une meilleure connaissance de ce qui est prédominant dans l évaluation quantitative du système. Comment et pourquoi le système fonctionne-t-il? L un des intérêts de cette évaluation est que pour un système très sophistiqué, cette connaissance est indispensable afin de simplifier ou d améliorer le système. On peut citer en exemple le projet d évaluation MultiKron de NIST pour les applications parallèles et distribuées. La principale préoccupation est alors d améliorer les applications ; l observation du système, des goulots d étranglement est une information qui peut conduire à ces améliorations. L instrumentation nécessaire à la capture de cette information ne doit cependant pas trop perturber le système sous peine de devenir non significative. La solution de NIST au problème a été la conception et le développement d une puce " espionne ". Cette puce permet de mesurer les performances des processeurs parallèles et des stations de travail sur des réseaux à haut débit, en enregistrant des événements comme par exemple les écrituresmémoire et les interruptions. Les mesures d évaluation ainsi obtenues ont permis aux chercheurs de mieux comprendre la source des goulots d étranglement et ainsi d améliorer les applications. A travers ces différents modes, on comprend tout l intérêt de l évaluation pour le cycle vie des systèmes, pour les intégrateurs et enfin pour les consommateurs. Si l évaluation n est pas une politique scientifique, elle est au moins un guide précieux pour la recherche.

16 122 Studia Informatica Universalis Paradigme d évaluation en reconnaissance vocale Le paradigme d évaluation a pour but d accélérer le développement de la recherche et de la technologie par des plans d évaluation, selon un principe qui peut être résumé par " tâche commune, données communes, évaluation commune ". Bien que l on retrouve ce paradigme dans bien des domaines, entre autres, celui de l ingénierie de la langue, c est dans sa mise en œuvre en reconnaissance vocale que nous présentons le principe du paradigme défini par NIST et utilisé dans les plans d évaluation internationaux. : 1) Diffusion d un challenge sur une tâche spécifiée. 2) Distribution aux participants des bases de données nécessaires au développement des modèles et des systèmes. 3) Test des systèmes participants sur des données communes en un temps limité. 4) Appel à une infrastructure pour la mesure et la comparaison des performances des systèmes. Les principes du paradigme d évaluation vont faire l objet d un développement pour en apprécier tout l intérêt. Tâche commune : Spécification de la tâche de reconnaissance Spécifier une tâche de reconnaissance, c est également fixer la complexité de la reconnaissance. De nombreux paramètres sont liés à la tâche de reconnaissance, leur spécification induit des facteurs de complexité qui ont une influence sur les performances " attendues " du système et sur les techniques à employer. Spécification de la dépendance du système aux locuteurs Pour une reconnaissance mono-locuteur (resp. multi-locuteurs), le(s) locuteur(s) de test est (resp. sont) le(s) même(s) que le(s) locuteur(s) d apprentissage. Pour une reconnaissance indépendante du locuteur, les locuteurs de test sont distincts des locuteurs d apprentissage. La complexité est ici croissante ; elle s explique par la grande variabilité du signal vocal dont on sait toute l importance pour un locuteur donné et qui s accroît bien évidemment pour une population de locuteurs. Les modèles acoustiques, appris sur une population, nécessitent des techniques

17 Combinatorial Optimization in Practice 123 d adaptation des modèles acoustiques (appris pour être indépendants du locuteur) au locuteur de test et ce quelque soit la reconnaissance de la parole considérée. Spécification de la nature du document audio traité Indépendamment de l environnement lors de l enregistrement audio, il existe une grande variété de documents audio. Ainsi, une grande différence existe entre la parole lue, préparée, actée, spontanée et conversationnelle. Les phénomènes de production sont très différents et ont une influence directe sur l acoustique et sur les performances de reconnaissance traitant l information linguistique ou para-linguistique. Relativement à la parole lue/préparée, la parole spontanée relève du langage naturel pour lequel le vocabulaire, la variété des expressions et des thèmes abordés sont bien plus importants, les modèles linguistiques sont alors plus difficiles à apprendre. Cette complexité est à considérer dans tous les cas où la reconnaissances utilise les modèles linguistiques. La parole spontanée est, de plus, sujette à des respirations, des hésitations, des erreurs de prononciation, des reprises, des inattendus structurels ; autant de spécificités difficiles à modéliser. Pour la parole conversationnelle, deux paramètres de complexité s ajoutent encore : le choix de l échelle d articulation allant de l hypo-articulation à l hyperarticulation et les recouvrements possibles des signaux de parole des protagonistes qui affectera toutes les reconnaissances. Spécification des conditions d enregistrement Lors de l enregistrement des données audio, l environnement peutêtre non bruité ou bruité. Les bruits peuvent être additifs ou convolutifs. Le microphone peut être connu ou inconnu. Cette complexité est croissante dans le sens où les techniques mises en œuvre doivent être robustes au bruit. Là encore, des techniques d adaptation au bruit peuvent s avérer nécessaires, ainsi que des primitives de pré-traitement du signal. Le canal de transmission typique pour la parole est le téléphone. Il est caractérisé par sa bande passante [ Hz] qui n est pas sans conséquence sur le signal vocal reçu ; le type de micro téléphonique ainsi que la qualité de la transmission (courte ou longue distance) sont deux autres facteurs de variabilité qui peuvent être responsables de distorsions et d altérations du signal. Si la parole téléphonique est tout

18 124 Studia Informatica Universalis. particulièrement la cible des plans d évaluation internationaux de la reconnaissance du locuteur, les conditions d enregistrements influent sur toutes les reconnaissances. Compte tenu du degré de liberté de la spécification de la tâche et de la complexité engendrée à la reconnaissance, toute comparaison de systèmes ne peut a priori être établie que sur une " tâche commune " de reconnaissance. Données communes : Corpus de développement et corpus de test Pour les besoins stricts de la méthodologie d évaluation, les " données communes " se résument à la distribution aux participants des corpus acoustiques de développement et de test. Les données de développement ont pour but de permettre l adaptation des systèmes à la tâche spécifiée pour le test. Le corpus de développement doit être représentatif du corpus de test. Par conséquent, les données doivent être homogènes aussi bien par leur nature (e.g., texte dont le test est issu) que par leur condition d enregistrement (e.g., matériel d enregistrement identique). Dans le cas d une reconnaissance indépendamment du locuteur, les locuteurs de développement et de test sont différents. Les données de développement sont antérieures aux données de test par leur date d enregistrement et, par exemple, par les textes dont elles proviennent. La contrainte pour le test est que les données n aient servi à aucun apprentissage et à aucun développement, les locuteurs étant évidemment différents. De plus, les données de développement et de test doivent être annotées afin de permettre l évaluation de performance des systèmes suivant la méthodologie retenue. L annotation des données de développement et de test est suivant la reconnaissance considérée i) le texte des corpus oraux (langage parlé), ii) l identité du locuteur par segment acoustique (locuteur), iii) la langue parlée par segment acoustique (langue), iv) la classe émotionnelle du segment acoustique (émotion). Dans les challenges internationaux, les données de test représentent quelques heures de parole. Evaluation commune : Evaluation de performance des systèmes Par " évaluation commune ", on entend outils d évaluation communs mis en œuvre, validés et utilisés par une infrastructure organisatrice des

19 Combinatorial Optimization in Practice 125 tests. Ce principe évite la duplication des efforts de mise en œuvre d une évaluation de performance. L évaluation de performance usuelle est de type " boîte noire " ; elle consiste à comparer l hypothèse de reconnaissance/classification du système et la transcription de référence, en termes d annotation, du signal-test acoustique. En reconnaissance du locuteur et en détection de la langue, les hypothèses de détection sont à valeurs booléennes. Dans ce cas, la mesure de performance est une variante de la courbe ROC (Relative Operating Characteristic) [64], la courbe DET (Detection Error Tradeoff) [65] avec en abscisse, le taux de fausse alarme et en ordonnée celui de mauvaise détection. La performance peut également être mesurée par le taux d égale erreur (EER, Equal Error Rate), point caractéristique de la courbe DET où le taux de fausse alarme et celui de mauvaise détection sont égaux. En reconnaissance du langage parlé, la mesure de performance usuelle est le taux d erreur en mots (WER, Word Error Rate) [66] défini par 100 fois le rapport du nombre de mots erronés de l hypothèse du système au nombre de mots de la référence (0% est le meilleur score de reconnaissance, le taux d erreur peut être supérieure à 100%). Les erreurs sont la substitution, l insertion et l omission de mot. L identification de ces erreurs résulte de l alignement des mots de l hypothèse et des mots de la référence par une variante de l algorithme de Wagner et Fischer habituellement utilisé pour la comparaison de chaînes de caractères. Une substitution a lieu lorsque les mots alignés diffèrent ; une insertion (resp. omission) a une occurrence lorsqu un mot de l hypothèse (resp. référence) n a pas de correspondant dans la référence (resp. hypothèse). Pour des langues, comme par exemple le Mandarin, la mesure de performance est le taux d erreur en caractères dont le principe est similaire à la mesure précédemment donnée, mais transposée au niveau du caractère. En reconnaissance de l émotion, le premier plan se limite à une évaluation des systèmes suivant leur performance de classification de segments acoustiques. Les systèmes y sont évalués par les mesures de rappel et de précision [67] usuelles en recherche d information. Pour une classe donnée, ayant N occurrences de segments-test et P le nombre de segments-test attribués à la classe lors du test,

20 126 Studia Informatica Universalis. i) le rappel est le rapport du nombre de segments de cette classe classés correctement et de N,, ii) la précision est le rapport du nombre de segments de cette classe classés correctement et de P. L autre mesure unificatrice utilisée est la F-mesure, moyenne harmonique du rappel et de la précision. 4. Performance des reconnaissances Pour conclure cette revue des reconnaissances de la parole, nous donnerons les performances des systèmes obtenues lors des plans d évaluation les plus récents. Ces plans suivent tous le paradigme d évaluation décrit au chapitre 3, la spécification de la tâche nous permettra de préciser la complexité de la reconnaissance et les résultats d évaluation nous permettront de situer les performances atteintes par les systèmes de l état de l art La reconnaissance du locuteur NIST 2008 Speaker Recognition Evaluation Plan (SRE08) - Les évaluations NIST sur la reconnaissance du locuteur ont commencé en 1997 et se déroulent maintenant tous les 2 ans. Depuis 1997, le paradigme d évaluation consiste en une série de tests de détection de locuteur sur une base de données commune divisée en données d apprentissage et en données de test. Un test de détection de locuteur consiste à tester l hypothèse Le segment-test x est-il prononcé par le locuteur y? en comparant le segment x aux données d apprentissage du locuteur y. Les résultats d un test doivent être une valeur de vraisemblance de cette hypothèse (comprise en 0 et 1) ainsi qu une valeur booléenne sur l acceptabilité de l hypothèse. Chaque décision doit être fondée uniquement sur les segments d apprentissage et de test prévus dans le plan d évaluation. Les mesures de performance associées à un ensemble de tests de détection sont la courbe DET (Detection Error Tradeoff) et le taux d égale erreur (EER - Equal Error Rate). Le plan d évaluation 2008 comporte plusieurs types de données de parole enregistrées en qualité téléphonique sur un à plusieurs canaux :

21 Combinatorial Optimization in Practice 127 parole conversationnelle et interviews (mélange de parole lue et de voix spontanée). 13 séries de test (1 obligatoire et 12 facultatives) sont définies dans le plan avec diverses combinaisons de sous-ensembles d apprentissage et de test. La série obligatoire de tests de détection du locuteur comprend locuteurs avec une durée moyenne d apprentissage de 3 minutes par locuteur et segments de test d une durée moyenne de 5 minutes. 46 sites ont participé à l évaluation SRE Les organisateurs ont analysé les résultats de cette série de tests de détection de locuteurs suivant 8 conditions [68] dépendant des caractéristiques des segments de test et d apprentissage. Le taux d égale erreur varie de 0.8%, dans le cas d interviews avec la même chaîne d acquisition à l apprentissage et au test, à 5%, dans le cas de voix spontanées téléphoniques et des chaînes d acquisition pouvant être différentes La détection de la langue NIST 2009 Language Recognition Evaluation Plan (LRE09) Les évaluations NIST sur la reconnaissance de la langue ont commencé en 2003, avec une phase exploratoire en 1996, et se déroulent tous les 2 ans en alternance avec les campagnes sur la reconnaissance du locuteur. Le paradigme d évaluation reprend celui utilisé en reconnaissance du locuteur. Il consiste en une série de tests de détection de la langue sur une base de données commune divisée en données d apprentissage et données de test. Un test de détection de la langue consiste à tester l hypothèse Le segment-test x appartient-il à la langue y? en comparant le segment x aux données d apprentissage de la langue y. Les résultats d un test doivent être une valeur de vraisemblance de cette hypothèse (comprise en 0 et 1) ainsi qu une valeur booléenne sur l acceptabilité de l hypothèse. Chaque décision doit être fondée uniquement sur les segments d apprentissage et de test prévus dans le plan d évaluation. Les mesures de performance associées à un ensemble de tests de détection sont la courbe DET (Detection Error Tradeoff) et le taux d égale erreur (EER - Equal Error Rate). Le plan d évaluation 2009 comporte 39 langues dont 23 utilisées à l apprentissage avec une durée moyenne d apprentissage d une heure et demi. Les données de parole proviennent de conversions téléphoniques

22 128 Studia Informatica Universalis. ou de la radio Voice of America. Le plan d évaluation définit plusieurs séries de test [69] : le test fermé (langues des segments-test appartenant aux 23 langues d apprentissage), le test ouvert (langues des segments-test appartenant aux 39 langues), huit paires de langues (cantonais/mandarin, portugais/espagnol, hindi/urdu, russe/ukrainien,...). Trois durées sont choisies pour les segments de tests : 3 secondes, 10 secondes et 30 secondes. 18 sites ont participé à l évaluation LRE Les taux d égale erreur pour le test ouvert varient de 2,7% pour 30 secondes de test à 12% pour 3 secondes de test. Les taux d égale erreur pour le test fermé varient de 1,5% pour 30 secondes de test à 9% pour 3 secondes de test. Pour 30 secondes de test, les résultats pour les tests de paires de langues varient de 0.20% pour la paire espagnol/portugais à 26% pour la paire hindi/urdu La reconnaissance du langage parlé NIST 2009 Rich Transcription Evaluation Plan (RT09) Les évaluations ARPA/DARPA/NIST sur la reconnaissance du langage parlé ont commencé en Les plans d évaluation peuvent inclure plusieurs tâches, leur historique montrent l évolution des tâches évaluées : , reconnaissance de la parole lue (lecture d articles de Wall Street Journal) , reconnaissance de la parole radio/télé-diffusée (journaux radio/télévisés) , reconnaissance de la parole conversationnelle téléphonique (thème donné) depuis 2002, reconnaissance de la parole conversationnelle en groupe (compte-rendu de réunion).les données de parole sont en langue anglaise, mises à part les extensions, faites en 2003 et 2004, en mandarin et en arabe pour la parole télédiffusée et la parole conversationnelle téléphonique. Les plans d évaluation RT (Rich Transcription Meeting Recognition) évaluent actuellement trois tâches : la transcription de la parole en texte (STT - Speech-To-Text), la localisation des temps de parole des locuteurs (SPKR Speaker) et une troisième tâche composite, l attribution du locuteur à la transcription de la parole au texte (SASTT Speaker Attributed to Speech-To-Text). Nous donnerons les performances pour STT. Les données collectées correspondent à l enregistrement de

23 Combinatorial Optimization in Practice réunions réunissant jusqu à 7 participants. Toutes les réunions ont lieu en langue anglaise, pour deux d entre elles, tous les participants sont non-natifs. Les salles de réunion ont un environnement de bruit ambiant et de réverbération. Les conditions d enregistrements sont multiples (multiples microphones distants - MDM, micro-casque - IHM). Les enregistrements sont segmentés en unité de temps. Chaque segment a un facteur de superposition (Fs) fonction du nombre de locuteurs intervenant dans le segment. Un facteur n indique que n locuteurs ont pris la parole durant le segment considéré, mais ne signifie pas obligatoirement que les n locuteurs parlent en même temps. Le calcul du WER est adapté au cas des superpositions de parole. La sortie du système comprend le flot de mots de la transcription avec leur localisation en temps, leur score de vraisemblance et leur information de type (e.g., lexical - non-lexical : respiration, rire, claquement de porte,...). Seules les entités lexicales sont considérées à l évaluation de performance. Les tests consistent en 3 heures d enregistrements extraits des données collectées avec les conditions d enregistrement IHM et MDM. L évaluation RT-SST 2009 réunit 3 participants (2 consortiums et 1 site). Le taux d erreur en mots [70] le plus bas i) est de 25% pour la condition IHM, ii) de 32% pour le test MDM avec Fs=1 ; iii) de 43% pour le test MDM avec Fs=4. Ces taux d erreur sont à comparer au taux d erreur humain d une transcription qui est de 2 à 4% La reconnaissance de l émotioninterspeech 2009 Challenge Emotion L objectif du premier plan d évaluation, Interspeech 2009 Emotion Challenge [71], est clairement la stricte comparabilité des systèmes en utilisant une base de données d émotion spontanée. Dans le bilan dressé par les organisateurs de la dernière décade de recherche, on peut noter la forte attente des chercheurs de bases d émotions spontanées (vs simulées), la complexité des tâches incomparable (reconnaissance/classification, choix des classes émotionnelles, indépendance au locuteur) et souvent la non productibilité des résultats publiés. Les organisateurs font également part de leur intention de mettre en libre accès la base utilisée pour ce premier challenge.

24 130 Studia Informatica Universalis. La base retenue pour l évaluation est FAU Aibo Emotion corpus [71, 72]. Le corpus correspond à l enregistrement d enfants âgés entre 10 et 13 ans en interaction avec Aibo, le chien robot de Sony. Un magicien d Oz contrôle le robot Aibo qui peut se montrer obéissant ou désobéissant aux commandes de l enfant provoquant alors chez lui une émotion spontanée. Les corpus ont été enregistrés pour une cinquantaine d enfants. Tous les corpus ont été étiquetés en classe d émotion au niveau du mot ( segments porteurs d émotion). Dans le test Open Performance Sub-Challenge, le problème posé, sous-problème de la reconnaissance, est la classification des segments de test en n-classes, i) un premier test considère 5-classes graduant l émotion du calme à la colère, ii) un deuxième test considère 2-classes, -l une relative au mécontentement de l enfant vis-à-vis du robot, -l autre représentant tous les autres états. 9 sites ont participé à l évaluation du Challenge Emotion 2009 Les meilleures performances estimées en termes de rappel des segments de test-reconnus sont de l ordre de 38% pour les 5-classes [73] et de 68% pour les 2-classes [74]. 5. Perspectives La reconnaissance de la parole est un domaine de recherche mature maîtrisant ses problématiques et ses paradigmes d évaluation. Les performances des systèmes de reconnaissances de la parole s améliorent comme le montrent les différentes évaluations. Cependant ces performances restent très éloignées de celles d un être humain ou plus modestement de celles acceptables dans un système généraliste de communication vocale homme-machine. Ce constat est la raison de la difficulté de progression des industries du vocal. Toutefois, une distinction est à faire entre les différentes reconnaissances de la parole en fonction du type de connaissances (linguistiques, paralinguistiques, ou extralinguistiques) [75] à modéliser. Les reconnaissances basées sur les connaissances linguistiques (langage parlé, langue) et paralinguistiques (niveau émotionnel) sont celles qui comportent la plus grande marge de progression. Celle-ci dépendra des progrès à moyen et à long terme dans la formalisation de ces connaissances et de l optimisation des architectures logicielles [76] les utilisant. Les reconnaissances de la parole utilisant principalement des connaissances extralinguistiques (in-

Apprentissage Automatique

Apprentissage Automatique Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs

Plus en détail

N 334 - SIMON Anne-Catherine

N 334 - SIMON Anne-Catherine N 334 - SIMON Anne-Catherine RÉALISATION D UN CDROM/DVD CONTENANT DES DONNÉES DU LANGAGE ORAL ORGANISÉES EN PARCOURS DIDACTIQUES D INITIATION LINGUISTIQUE A PARTIR DES BASES DE DONNÉES VALIBEL Introduction

Plus en détail

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com Intelligence Artificielle et Systèmes Multi-Agents Badr Benmammar bbm@badr-benmammar.com Plan La première partie : L intelligence artificielle (IA) Définition de l intelligence artificielle (IA) Domaines

Plus en détail

UE11 Phonétique appliquée

UE11 Phonétique appliquée UE11 Phonétique appliquée Christelle DODANE Permanence : mercredi de 11h15 à 12h15, H211 Tel. : 04-67-14-26-37 Courriel : christelle.dodane@univ-montp3.fr Bibliographie succinte 1. GUIMBRETIERE E., Phonétique

Plus en détail

Le modèle standard, SPE (1/8)

Le modèle standard, SPE (1/8) Le modèle standard, SPE (1/8) Rappel : notion de grammaire mentale modulaire Les composants de la grammaire : module phonologique, sémantique syntaxique Syntaxe première : elle orchestre la relation mentale

Plus en détail

Document d aide au suivi scolaire

Document d aide au suivi scolaire Document d aide au suivi scolaire Ecoles Famille Le lien Enfant D une école à l autre «Enfants du voyage et de familles non sédentaires» Nom :... Prénom(s) :... Date de naissance :... Ce document garde

Plus en détail

AXES DE RECHERCHE - DOMAINE D'INTERET MAJEUR LOGICIELS ET SYSTEMES COMPLEXES

AXES DE RECHERCHE - DOMAINE D'INTERET MAJEUR LOGICIELS ET SYSTEMES COMPLEXES 1 AXES DE RECHERCHE - DOMAINE D'INTERET MAJEUR LOGICIELS ET SYSTEMES COMPLEXES 2 Axes de recherche L activité du DIM LSC concerne la méthodologie de la conception et le développement de systèmes à forte

Plus en détail

La syllabe (1/5) Unité intuitive (différent du phonème) Constituant essentiel pour la phonologie au même titre que phonème et trait

La syllabe (1/5) Unité intuitive (différent du phonème) Constituant essentiel pour la phonologie au même titre que phonème et trait La syllabe (1/5) Unité intuitive (différent du phonème) Variation des structures syllabiques d une langue à une autre et dans une même langue (cf strict vs à : une seule syllabe mais des structures bien

Plus en détail

Dan Istrate. Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier

Dan Istrate. Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier Détection et reconnaissance des sons pour la surveillance médicale Dan Istrate le 16 décembre 2003 Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier Thèse mené dans le cadre d une collaboration

Plus en détail

DESCRIPTEURS NIVEAU A2 du Cadre européen commun de référence pour les langues

DESCRIPTEURS NIVEAU A2 du Cadre européen commun de référence pour les langues DESCRIPTEURS NIVEAU A2 du Cadre européen commun de référence pour les langues ACTIVITÉS DE COMMUNICATION LANGAGIÈRE ET STRATÉGIES Activités de production et stratégies PRODUCTION ORALE MONOLOGUE SUIVI

Plus en détail

MASTER LPL : LANGUE ET INFORMATIQUE (P)

MASTER LPL : LANGUE ET INFORMATIQUE (P) MASTER LPL : LANGUE ET INFORMATIQUE (P) RÉSUMÉ DE LA FORMATION Type de diplôme := Master Domaine : Arts, Lettres, Langues Mention : LITTERATURE, PHILOLOGIE, LINGUISTIQUE Spécialité : LANGUE ET INFORMATIQUE

Plus en détail

majuscu lettres accent voyelles paragraphe L orthographe verbe >>>, mémoire préfixe et son enseignement singulier usage écrire temps copier mot

majuscu lettres accent voyelles paragraphe L orthographe verbe >>>, mémoire préfixe et son enseignement singulier usage écrire temps copier mot majuscu conjugaison >>>, L orthographe singulier syllabe virgule mémoire lettres et son enseignement graphie suffixe usage accent ; écrire féminin temps voyelles mot point Renforcer l enseignement de l

Plus en détail

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique DOMAINE P3.C3.D1. Pratiquer une démarche scientifique et technologique, résoudre des

Plus en détail

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION Classe de terminale de la série Sciences et Technologie du Management et de la Gestion Préambule Présentation Les technologies de l information

Plus en détail

Modélisation aléatoire en fiabilité des logiciels

Modélisation aléatoire en fiabilité des logiciels collection Méthodes stochastiques appliquées dirigée par Nikolaos Limnios et Jacques Janssen La sûreté de fonctionnement des systèmes informatiques est aujourd hui un enjeu économique et sociétal majeur.

Plus en détail

Pourquoi l apprentissage?

Pourquoi l apprentissage? Pourquoi l apprentissage? Les SE sont basés sur la possibilité d extraire la connaissance d un expert sous forme de règles. Dépend fortement de la capacité à extraire et formaliser ces connaissances. Apprentissage

Plus en détail

1. Qu est-ce que la conscience phonologique?

1. Qu est-ce que la conscience phonologique? 1. Qu est-ce que la conscience phonologique? Définition La conscience phonologique est définie comme la connaissance consciente et explicite que les mots du langage sont formés d unités plus petites, à

Plus en détail

LIVRE BLANC Décembre 2014

LIVRE BLANC Décembre 2014 PARSING MATCHING EQUALITY SEARCH LIVRE BLANC Décembre 2014 Introduction L analyse des tendances du marché de l emploi correspond à l évidence à une nécessité, surtout en période de tension comme depuis

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme

Plus en détail

Introduction au datamining

Introduction au datamining Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des

Plus en détail

Efficace et ciblée : La surveillance des signaux de télévision numérique (2)

Efficace et ciblée : La surveillance des signaux de télévision numérique (2) Efficace et ciblée : La surveillance des signaux de télévision numérique (2) La première partie de cet article publié dans le numéro 192 décrit la méthode utilisée pour déterminer les points de surveillance

Plus en détail

Morphosyntaxe de l'interrogation en conversation spontanée : modélisation et évaluations

Morphosyntaxe de l'interrogation en conversation spontanée : modélisation et évaluations U Université dumaine Faculté des Lettres, Langues et Sciences humaines Morphosyntaxe de l'interrogation en conversation spontanée : modélisation et évaluations Carole Lailler 1 L interrogation : une modalité

Plus en détail

Programme scientifique Majeure INTELLIGENCE NUMERIQUE. Mentions Image et Réalité Virtuelle Intelligence Artificielle et Robotique

Programme scientifique Majeure INTELLIGENCE NUMERIQUE. Mentions Image et Réalité Virtuelle Intelligence Artificielle et Robotique É C O L E D I N G É N I E U R D E S T E C H N O L O G I E S D E L I N F O R M A T I O N E T D E L A C O M M U N I C A T I O N Programme scientifique Majeure INTELLIGENCE NUMERIQUE Langage Java Mentions

Plus en détail

PLAN D ÉTUDES. école fondamentale

PLAN D ÉTUDES. école fondamentale PLAN D ÉTUDES école fondamentale Nous Henri, Grand-Duc de Luxembourg, Duc de Nassau, Vu la loi du 6 février 2009 portant organisation de l enseignement fondamental; Notre Conseil d État entendu; Sur le

Plus en détail

Quels outils pour prévoir?

Quels outils pour prévoir? modeledition SA Quels outils pour prévoir? Les modèles de prévisions sont des outils irremplaçables pour la prise de décision. Pour cela les entreprises ont le choix entre Excel et les outils classiques

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane

Plus en détail

BABEL LEXIS : UN SYSTÈME ÉVOLUTIF PERMETTANT LA CRÉATION, LE STOCKAGE ET LA CONSULTATION D OBJETS HYPERMÉDIAS

BABEL LEXIS : UN SYSTÈME ÉVOLUTIF PERMETTANT LA CRÉATION, LE STOCKAGE ET LA CONSULTATION D OBJETS HYPERMÉDIAS Quatrième colloque hypermédias et apprentissages 275 BABEL LEXIS : UN SYSTÈME ÉVOLUTIF PERMETTANT LA CRÉATION, LE STOCKAGE ET LA CONSULTATION D OBJETS HYPERMÉDIAS Anne-Olivia LE CORNEC, Jean-Marc FARINONE,

Plus en détail

A la découverte du Traitement. des signaux audio METISS. Inria Rennes - Bretagne Atlantique

A la découverte du Traitement. des signaux audio METISS. Inria Rennes - Bretagne Atlantique A la découverte du Traitement des signaux audio METISS Inria Rennes - Bretagne Atlantique Les conférences scientifiques au Lycée Descartes Imagerie médicale et neuronavigation par Pierre Hellier Le respect

Plus en détail

NOM : Prénom : Date de naissance : Ecole : CM2 Palier 2

NOM : Prénom : Date de naissance : Ecole : CM2 Palier 2 NOM : Prénom : Date de naissance : Ecole : CM2 Palier 2 Résultats aux évaluations nationales CM2 Annexe 1 Résultats de l élève Compétence validée Lire / Ecrire / Vocabulaire / Grammaire / Orthographe /

Plus en détail

ISO/CEI 19770-1. Technologies de l information Gestion des actifs logiciels. Partie 1: Procédés et évaluation progressive de la conformité

ISO/CEI 19770-1. Technologies de l information Gestion des actifs logiciels. Partie 1: Procédés et évaluation progressive de la conformité NORME INTERNATIONALE ISO/CEI 19770-1 Deuxième édition 2012-06-15 Technologies de l information Gestion des actifs logiciels Partie 1: Procédés et évaluation progressive de la conformité Information technology

Plus en détail

Relation entre deux variables : estimation de la corrélation linéaire

Relation entre deux variables : estimation de la corrélation linéaire CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence

Plus en détail

Manuel d utilisation 26 juin 2011. 1 Tâche à effectuer : écrire un algorithme 2

Manuel d utilisation 26 juin 2011. 1 Tâche à effectuer : écrire un algorithme 2 éducalgo Manuel d utilisation 26 juin 2011 Table des matières 1 Tâche à effectuer : écrire un algorithme 2 2 Comment écrire un algorithme? 3 2.1 Avec quoi écrit-on? Avec les boutons d écriture........

Plus en détail

Application en classe de la progression des apprentissages en musique 1 er cycle du secondaire

Application en classe de la progression des apprentissages en musique 1 er cycle du secondaire Application en classe de la progression des apprentissages en musique 1 er cycle du secondaire Quelques définitions des termes utilisés Nommer : Désigner par un nom. Identifier : Déterminer la nature de

Plus en détail

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN Table des matières. Introduction....3 Mesures et incertitudes en sciences physiques

Plus en détail

4.2 Unités d enseignement du M1

4.2 Unités d enseignement du M1 88 CHAPITRE 4. DESCRIPTION DES UNITÉS D ENSEIGNEMENT 4.2 Unités d enseignement du M1 Tous les cours sont de 6 ECTS. Modélisation, optimisation et complexité des algorithmes (code RCP106) Objectif : Présenter

Plus en détail

Français langue étrangère Savoir-faire - Actes de paroles - Supports d apprentissage -Tâches

Français langue étrangère Savoir-faire - Actes de paroles - Supports d apprentissage -Tâches Niveau C1 Descripteur global Français langue étrangère Savoir-faire - Actes de paroles - Supports d apprentissage -Tâches La personne peut : comprendre en détail de longs discours et des échanges complexes

Plus en détail

Grandes lignes ASTRÉE. Logiciels critiques. Outils de certification classiques. Inspection manuelle. Definition. Test

Grandes lignes ASTRÉE. Logiciels critiques. Outils de certification classiques. Inspection manuelle. Definition. Test Grandes lignes Analyseur Statique de logiciels Temps RÉel Embarqués École Polytechnique École Normale Supérieure Mercredi 18 juillet 2005 1 Présentation d 2 Cadre théorique de l interprétation abstraite

Plus en détail

Objectif. Développer son efficacité personnelle par une meilleure communication avec soi et les autres

Objectif. Développer son efficacité personnelle par une meilleure communication avec soi et les autres Développement personnel La programmation neurolinguistique (P.N.L.) Objectif. Développer son efficacité personnelle par une meilleure communication avec soi et les autres. Historique et postulats de la

Plus en détail

Langue Française. Syllabus A1. Description globale du niveau A1 utilisateur élémentaire

Langue Française. Syllabus A1. Description globale du niveau A1 utilisateur élémentaire Langue Française Redatto da Dott.ssa Annie Roncin Syllabus A1 Description globale du niveau A1 utilisateur élémentaire L étudiant peut : -comprendre et utiliser des expressions familières et quotidiennes

Plus en détail

Transmission d informations sur le réseau électrique

Transmission d informations sur le réseau électrique Transmission d informations sur le réseau électrique Introduction Remarques Toutes les questions en italique devront être préparées par écrit avant la séance du TP. Les préparations seront ramassées en

Plus en détail

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc) 87 FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc) Dans le cadre de la réforme pédagogique et de l intérêt que porte le Ministère de l Éducation

Plus en détail

UML (Diagramme de classes) Unified Modeling Language

UML (Diagramme de classes) Unified Modeling Language UML (Diagramme de classes) Unified Modeling Language Sommaire Introduction Objectifs Diagramme de classes Classe (Nom, attribut, opération) Visibilité et portée des constituants d une classe Association

Plus en détail

Analyse dialectométrique des parlers berbères de Kabylie

Analyse dialectométrique des parlers berbères de Kabylie Saïd GUERRAB Analyse dialectométrique des parlers berbères de Kabylie Résumé de la thèse (pour affichage) Il est difficile de parler du berbère sans parler de la variation. Il y a d abord une variation

Plus en détail

L apprentissage automatique

L apprentissage automatique L apprentissage automatique L apprentissage automatique L'apprentissage automatique fait référence au développement, à l analyse et à l implémentation de méthodes qui permettent à une machine d évoluer

Plus en détail

Bienvenue à la formation

Bienvenue à la formation Bienvenue à la formation Environnement Alimentation Heure Ecriture Lecture Vie quotidienne Emotions Argent Informatique Poids et mesures Communication Orientation spatiale et temporelle Programme des cours

Plus en détail

Attestation de maîtrise des connaissances et compétences au cours moyen deuxième année

Attestation de maîtrise des connaissances et compétences au cours moyen deuxième année Attestation de maîtrise des connaissances et compétences au cours moyen deuxième année PALIER 2 CM2 La maîtrise de la langue française DIRE S'exprimer à l'oral comme à l'écrit dans un vocabulaire approprié

Plus en détail

sentée e et soutenue publiquement pour le Doctorat de l Universitl

sentée e et soutenue publiquement pour le Doctorat de l Universitl Du rôle des signaux faibles sur la reconfiguration des processus de la chaîne de valeur de l organisation : l exemple d une centrale d achats de la grande distribution française Thèse présent sentée e

Plus en détail

CAPTEURS - CHAINES DE MESURES

CAPTEURS - CHAINES DE MESURES CAPTEURS - CHAINES DE MESURES Pierre BONNET Pierre Bonnet Master GSI - Capteurs Chaînes de Mesures 1 Plan du Cours Propriétés générales des capteurs Notion de mesure Notion de capteur: principes, classes,

Plus en détail

Rapport d'analyse des besoins

Rapport d'analyse des besoins Projet ANR 2011 - BR4CP (Business Recommendation for Configurable products) Rapport d'analyse des besoins Janvier 2013 Rapport IRIT/RR--2013-17 FR Redacteur : 0. Lhomme Introduction...4 La configuration

Plus en détail

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3

Plus en détail

Algèbre 40 Analyse 26 14 Stat. 1 - IES : Probabilités discrètes et calcul intégral 29,5 6 Stat. 2 - IES : Probabilités générales 54 8 UE1-02 M-E-IS

Algèbre 40 Analyse 26 14 Stat. 1 - IES : Probabilités discrètes et calcul intégral 29,5 6 Stat. 2 - IES : Probabilités générales 54 8 UE1-02 M-E-IS 1er semestre UE1-01 E Algèbre 40 Analyse 26 14 Stat. 1 - IES : Probabilités discrètes et calcul intégral 29,5 6 Stat. 2 - IES : Probabilités générales 54 8 UE1-02 M-E-IS Introduction au système SAS 25,5

Plus en détail

ACTIVITÉS DE COMMUNICATION LANGAGIÈRE ET STRATÉGIES

ACTIVITÉS DE COMMUNICATION LANGAGIÈRE ET STRATÉGIES référence pour les langues ACTIVITÉS DE COMMUNICATION LANGAGIÈRE ET STRATÉGIES Activités de production et stratégies PRODUCTION ORALE GÉNÉRALE MONOLOGUE SUIVI : décrire l'expérience MONOLOGUE SUIVI : argumenter

Plus en détail

Déjeuner EIM 360 - Enterprise Information Management. Mardi 16 novembre 2010 Restaurant l Amourette Montreuil Thomas Dechilly CTO Sollan

Déjeuner EIM 360 - Enterprise Information Management. Mardi 16 novembre 2010 Restaurant l Amourette Montreuil Thomas Dechilly CTO Sollan Déjeuner EIM 360 - Enterprise Information Management Mardi 16 novembre 2010 Restaurant l Amourette Montreuil Thomas Dechilly CTO Sollan (Extract du livre blanc) Introduction... 2 Continuité des pratiques

Plus en détail

Livret personnel de compétences

Livret personnel de compétences Livret personnel de compétences Grilles de références pour l évaluation et la validation des compétences du socle commun au palier 2 Janvier 2011 MENJVA/DGESCO eduscol.education.fr/soclecommun LES GRILLES

Plus en détail

CRÉER, ROUTER ET GÉRER UNE NEWSLETTER, UN E-MAILING

CRÉER, ROUTER ET GÉRER UNE NEWSLETTER, UN E-MAILING CRÉER, ROUTER ET GÉRER UNE NEWSLETTER, UN E-MAILING Durée : 3J / 21H Formateur : Consultant expert en PAO et Web-marketing. Groupe de : 4 max Formation au web marketing Objectifs : Mettre en oeuvre des

Plus en détail

COMMENT REDIGER UN RAPPORT TECHNIQUE?

COMMENT REDIGER UN RAPPORT TECHNIQUE? COMMENT REDIGER UN RAPPORT TECHNIQUE? Christiaens Sébastien Université de Liège Département PROMETHEE Institut de Mécanique et de Génie Civil, Bât. B52 Chemin des Chevreuils, 1 B-4000 Liège, Belgique Janvier

Plus en détail

Rappels sur les suites - Algorithme

Rappels sur les suites - Algorithme DERNIÈRE IMPRESSION LE 14 septembre 2015 à 12:36 Rappels sur les suites - Algorithme Table des matières 1 Suite : généralités 2 1.1 Déition................................. 2 1.2 Exemples de suites............................

Plus en détail

FONDEMENTS MATHÉMATIQUES 12 E ANNÉE. Mathématiques financières

FONDEMENTS MATHÉMATIQUES 12 E ANNÉE. Mathématiques financières FONDEMENTS MATHÉMATIQUES 12 E ANNÉE Mathématiques financières A1. Résoudre des problèmes comportant des intérêts composés dans la prise de décisions financières. [C, L, RP, T, V] Résultat d apprentissage

Plus en détail

Quand le bâtiment va, tout va

Quand le bâtiment va, tout va Quand le bâtiment va, tout va Citation de Martin Nadeau en 1849 à l Assemblée législative de la France Martin Nadeau Ancien ouvrier maçon Député à l Assemblée législative Les sots font bâtir les maisons

Plus en détail

Étude de la performance des modèles acoustiques pour des voix de personnes âgées en vue de l adaptation des systèmes de RAP

Étude de la performance des modèles acoustiques pour des voix de personnes âgées en vue de l adaptation des systèmes de RAP Étude de la performance des modèles acoustiques pour des voix de personnes âgées en vue de l adaptation des systèmes de RAP Frédéric Aman, Michel Vacher, Solange Rossato, Remus Dugheanu, François Portet,

Plus en détail

Conception des systèmes répartis

Conception des systèmes répartis Conception des systèmes répartis Principes et concepts Gérard Padiou Département Informatique et Mathématiques appliquées ENSEEIHT Octobre 2012 Gérard Padiou Conception des systèmes répartis 1 / 37 plan

Plus en détail

Diapo 1. Objet de l atelier. Classe visée. Travail en co-disciplinarité (identité et origine académique des IEN)

Diapo 1. Objet de l atelier. Classe visée. Travail en co-disciplinarité (identité et origine académique des IEN) COMMENTAIRE Séminaire national Réforme de la série Gestion-administration Lyon 10 et 11 mai 2012 Vendredi matin Martine DECONINCK (IEN EG), Michèle SENDRE (IEN L), Isabelle VALLOT (IEN EG) Diapo 1. Objet

Plus en détail

Abdenour Hacine-Gharbi. Sélection de paramètres acoustiques pertinents pour la reconnaissance de la parole

Abdenour Hacine-Gharbi. Sélection de paramètres acoustiques pertinents pour la reconnaissance de la parole ÉCOLE DOCTORALE SCIENCES ET TECHNOLOGIES (ORLEANS) FACULTÉ de TECHNOLOGIE (Sétif) Laboratoire PRISME THÈSE EN COTUTELLE INTERNATIONALE présentée par : Abdenour Hacine-Gharbi soutenue le : 09 décembre 2012

Plus en détail

MÉTHODOLOGIE DE L ASSESSMENT CENTRE L INSTRUMENT LE PLUS ADÉQUAT POUR : DES SÉLECTIONS DE QUALITÉ DES CONSEILS DE DÉVELOPPEMENT FONDÉS

MÉTHODOLOGIE DE L ASSESSMENT CENTRE L INSTRUMENT LE PLUS ADÉQUAT POUR : DES SÉLECTIONS DE QUALITÉ DES CONSEILS DE DÉVELOPPEMENT FONDÉS MÉTHODOLOGIE DE L ASSESSMENT CENTRE L INSTRUMENT LE PLUS ADÉQUAT POUR : DES SÉLECTIONS DE QUALITÉ ET DES CONSEILS DE DÉVELOPPEMENT FONDÉS 1. Introduction Placer la «bonne personne au bon endroit» représente

Plus en détail

d évaluation Objectifs Processus d élaboration

d évaluation Objectifs Processus d élaboration Présentation du Programme pancanadien d évaluation Le Programme pancanadien d évaluation (PPCE) représente le plus récent engagement du Conseil des ministres de l Éducation du Canada (CMEC) pour renseigner

Plus en détail

Analyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57

Analyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57 Analyse de la vidéo Chapitre 4.1 - La modélisation pour le suivi d objet 10 mars 2015 Chapitre 4.1 - La modélisation d objet 1 / 57 La représentation d objets Plan de la présentation 1 La représentation

Plus en détail

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems

Plus en détail

JEAN-LUC VIRUÉGA. Traçabilité. Outils, méthodes et pratiques. Éditions d Organisation, 2005 ISBN : 2-7081-3260-1

JEAN-LUC VIRUÉGA. Traçabilité. Outils, méthodes et pratiques. Éditions d Organisation, 2005 ISBN : 2-7081-3260-1 JEAN-LUC VIRUÉGA Traçabilité Outils, méthodes et pratiques, 2005 ISBN : 2-7081-3260-1 2 à l assurance qualité Après la définition de la traçabilité dans la métrologie, on peut remarquer que le domaine

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

Cours d introduction à l informatique. Partie 2 : Comment écrire un algorithme? Qu est-ce qu une variable? Expressions et instructions

Cours d introduction à l informatique. Partie 2 : Comment écrire un algorithme? Qu est-ce qu une variable? Expressions et instructions Cours d introduction à l informatique Partie 2 : Comment écrire un algorithme? Qu est-ce qu une variable? Expressions et instructions Qu est-ce qu un Une recette de cuisine algorithme? Protocole expérimental

Plus en détail

Le chiffre est le signe, le nombre est la valeur.

Le chiffre est le signe, le nombre est la valeur. Extrait de cours de maths de 6e Chapitre 1 : Les nombres et les opérations I) Chiffre et nombre 1.1 La numération décimale En mathématique, un chiffre est un signe utilisé pour l'écriture des nombres.

Plus en détail

Principe et règles d audit

Principe et règles d audit CHAPITRE 2 Principe et règles d audit 2.1. Principe d audit Le principe et les règles d audit suivent logiquement l exposé précédent. D abord, comme dans toute branche de l activité d une entreprise, l

Plus en détail

S3CP. Socle commun de connaissances et de compétences professionnelles

S3CP. Socle commun de connaissances et de compétences professionnelles S3CP Socle commun de connaissances et de compétences professionnelles Référentiel Le présent socle décrit un ensemble de connaissances et compétences devant être apprécié dans un contexte professionnel.

Plus en détail

MATHÉMATIQUES. Les préalables pour l algèbre MAT-P020-1 DÉFINITION DU DOMAINE D EXAMEN

MATHÉMATIQUES. Les préalables pour l algèbre MAT-P020-1 DÉFINITION DU DOMAINE D EXAMEN MATHÉMATIQUES Les préalables pour l algèbre MAT-P020-1 DÉFINITION DU DOMAINE D EXAMEN Mars 2001 MATHÉMATIQUES Les préalables pour l algèbre MAT-P020-1 DÉFINITION DU DOMAINE D EXAMEN Mars 2001 Direction

Plus en détail

Réseaux grande distance

Réseaux grande distance Chapitre 5 Réseaux grande distance 5.1 Définition Les réseaux à grande distance (WAN) reposent sur une infrastructure très étendue, nécessitant des investissements très lourds. Contrairement aux réseaux

Plus en détail

questions/réponses sur les DYS

questions/réponses sur les DYS D Y S L E X I E, D Y S P H A S I E, D Y S P R A X I E, Les DYS, un handicap émergeant? La Dysphasie trouble du langage oral? La Dyspraxie, trouble de la coordination du geste? La Dyslexie, trouble du langage

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

Évaluation et implémentation des langages

Évaluation et implémentation des langages Évaluation et implémentation des langages Les langages de programmation et le processus de programmation Critères de conception et d évaluation des langages de programmation Les fondations de l implémentation

Plus en détail

Alphonse Carlier, Intelligence Économique et Knowledge Management, AFNOR Éditions, 2012.

Alphonse Carlier, Intelligence Économique et Knowledge Management, AFNOR Éditions, 2012. 1 Du même auteur chez le même éditeur Alphonse Carlier, Intelligence Économique et Knowledge Management, AFNOR Éditions, 2012. AFNOR 2013 Couverture : création AFNOR Éditions Crédit photo 2011 Fotolia

Plus en détail

I/ CONSEILS PRATIQUES

I/ CONSEILS PRATIQUES D abord, n oubliez pas que vous n êtes pas un enseignant isolé, mais que vous appartenez à une équipe. N hésitez jamais à demander des idées et des conseils aux autres collègues (linguistes et autres)

Plus en détail

Seconde Généralités sur les fonctions Exercices. Notion de fonction.

Seconde Généralités sur les fonctions Exercices. Notion de fonction. Seconde Généralités sur les fonctions Exercices Notion de fonction. Exercice. Une fonction définie par une formule. On considère la fonction f définie sur R par = x + x. a) Calculer les images de, 0 et

Plus en détail

basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB www.enseirb.fr/~legal Olivier Augereau Formation UML

basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB www.enseirb.fr/~legal Olivier Augereau Formation UML basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB www.enseirb.fr/~legal Olivier Augereau Formation UML http://olivier-augereau.com Sommaire Introduction I) Les bases II) Les diagrammes

Plus en détail

Convention de transcription CIEL-F

Convention de transcription CIEL-F Convention de transcription CIEL-F Version 4.4. 1 décembre 2010 Ces conventions sont inspirées de celles des groupes I, Freiburg et VALIBEL Principes généraux et logiciels utilisés pour la transcription

Plus en détail

Coup de Projecteur sur les Réseaux de Neurones

Coup de Projecteur sur les Réseaux de Neurones Coup de Projecteur sur les Réseaux de Neurones Les réseaux de neurones peuvent être utilisés pour des problèmes de prévision ou de classification. La représentation la plus populaire est le réseau multicouche

Plus en détail

Disparités entre les cantons dans tous les domaines examinés

Disparités entre les cantons dans tous les domaines examinés Office fédéral de la statistique Bundesamt für Statistik Ufficio federale di statistica Uffizi federal da statistica Swiss Federal Statistical Office EMBARGO: 02.05.2005, 11:00 COMMUNIQUÉ DE PRESSE MEDIENMITTEILUNG

Plus en détail

transformer en avantage compétitif en temps réel vos données Your business technologists. Powering progress

transformer en avantage compétitif en temps réel vos données Your business technologists. Powering progress transformer en temps réel vos données en avantage compétitif Your business technologists. Powering progress Transformer les données en savoir Les données sont au cœur de toute activité, mais seules elles

Plus en détail

Demande d admission au Centre pédagogique Lucien-Guilbault Secteur primaire

Demande d admission au Centre pédagogique Lucien-Guilbault Secteur primaire Date d envoi : Demande d admission au Centre pédagogique Lucien-Guilbault Secteur primaire QUESTIONNAIRE AU TITULAIRE Ce document doit être complété par le titulaire de classe et/ou par l orthopédagogue

Plus en détail

Synthèse «Le Plus Grand Produit»

Synthèse «Le Plus Grand Produit» Introduction et Objectifs Synthèse «Le Plus Grand Produit» Le document suivant est extrait d un ensemble de ressources plus vastes construites par un groupe de recherche INRP-IREM-IUFM-LEPS. La problématique

Plus en détail

Master Etudes françaises et francophones

Master Etudes françaises et francophones Master Etudes françaises et francophones 1. modèle scientifique et profilage des contenus de la filière / Présentation et spécificités de la filière Les études romanes à Leipzig sont considérées comme

Plus en détail

COR-E : un modèle pour la simulation d agents affectifs fondé sur la théorie COR

COR-E : un modèle pour la simulation d agents affectifs fondé sur la théorie COR COR-E : un modèle pour la simulation d agents affectifs fondé sur la théorie COR SABRINA CAMPANO DIRECTION: NICOLAS SABOURET ENCADREMENT : NICOLAS SABOURET, VINCENT CORRUBLE, ETIENNE DE SEVIN SOUTENANCE

Plus en détail

École : Maternelle. Livret de suivi de l élève. Nom : Prénom : Date de naissance : Année d entrée à l école maternelle :

École : Maternelle. Livret de suivi de l élève. Nom : Prénom : Date de naissance : Année d entrée à l école maternelle : École : Maternelle Livret de suivi de l élève Nom : Prénom : Date de naissance : Année d entrée à l école maternelle : Livret de suivi de l élève à l école maternelle Chaque compétence est évaluée selon

Plus en détail

Introduction à la méthodologie de la recherche

Introduction à la méthodologie de la recherche MASTER DE RECHERCHE Relations Économiques Internationales 2006-2007 Introduction à la méthodologie de la recherche geraldine.kutas@sciences-po.org Les Etapes de la Recherche Les étapes de la démarche Etape

Plus en détail

Cours 1 : La compilation

Cours 1 : La compilation /38 Interprétation des programmes Cours 1 : La compilation Yann Régis-Gianas yrg@pps.univ-paris-diderot.fr PPS - Université Denis Diderot Paris 7 2/38 Qu est-ce que la compilation? Vous avez tous déjà

Plus en détail

Rédiger et administrer un questionnaire

Rédiger et administrer un questionnaire Rédiger et administrer un questionnaire Ce document constitue une adaptation, en traduction libre, de deux brochures distinctes : l une produite par l American Statistical Association (Designing a Questionnaire),

Plus en détail

Fiche de synthèse sur la PNL (Programmation Neurolinguistique)

Fiche de synthèse sur la PNL (Programmation Neurolinguistique) 1 Fiche de synthèse sur la PNL (Programmation Neurolinguistique) La programmation neurolinguistique (PNL) fournit des outils de développement personnel et d amélioration de l efficacité relationnelle dans

Plus en détail

Tableau des contenus

Tableau des contenus Tableau des contenus Dossier 1 L image dans les relations amicales, sociales, professionnelles et amoureuses Dossier 2 Présenter quelqu un Je séduis. Parler de son rapport à l image. Caractériser des personnes

Plus en détail

Améliorer les performances du site par l'utilisation de techniques de Web Mining

Améliorer les performances du site par l'utilisation de techniques de Web Mining Améliorer les performances du site par l'utilisation de techniques de Web Mining CLUB SAS 2001 17/18 octobre 2001 Stéfan Galissie LINCOLN stefan.galissie@lincoln.fr contact@web-datamining.net 2001 Sommaire

Plus en détail

Architecture d'entreprise : Guide Pratique de l'architecture Logique

Architecture d'entreprise : Guide Pratique de l'architecture Logique Guides Pratiques Objecteering Architecture d'entreprise : Guide Pratique de l'architecture Logique Auteur : Version : 1.0 Copyright : Softeam Equipe Conseil Softeam Supervisée par Philippe Desfray Softeam

Plus en détail

A quels élèves profite l approche par les compétences de base? Etude de cas à Djibouti

A quels élèves profite l approche par les compétences de base? Etude de cas à Djibouti A quels élèves profite l approche par les compétences de base? Etude de cas à Djibouti Hamid Mohamed Aden, Directeur du CRIPEN, Djibouti Xavier Roegiers, Professeur à l Université de Louvain, Directeur

Plus en détail

Guide d Intégration PPM et ERP:

Guide d Intégration PPM et ERP: LIVRE BLANC Guide d Intégration PPM et ERP: Stratégies d intégration de logiciels dans les entreprises organisées par projet De: Neil Stolovitsky E-mail: sales@geniusinside.com Website: www.geniusinside.com

Plus en détail