Ministère de l Enseignement Supérieur et de la Recherche Scientifique

Dimension: px
Commencer à balayer dès la page:

Download "Ministère de l Enseignement Supérieur et de la Recherche Scientifique"

Transcription

1 Ministère de l Enseignement Supérieur et de la Recherche Scientifique Institut National de Formation en Informatique (I.N.I) Oued Smar Alger Direction de la Post Graduation et de la Recherche Thème : Inférence d identité dans le domaine forensique en utilisant un système de reconnaissance automatique du locuteur adapté au dialecte Algérien Mémoire présenté pour obtenir le grade de MAGISTER EN IFORMATIQUE Spécialité Informatique Industrielle (II) Par : Tounsi bilal Proposé par : Dr. Bessalah Hamid M r. Bengherabi Messaoud Jury: M r. Ait Aoudia Samy Maître de Conférence (INI) Président M r. Guessoum Abderrezak Professeur (Blida) Examinateur M r. Ait Ali Yahia Yasine Chargé de Cours (INI) Examinateur M r. Bessalah Hamid Maître de Recherche (CDTA) Directeur de Mémoire M r. Bengherabi Messaoud Chargé de Recherche (CDTA) Invité Année Universitaire : 2007/2008

2 Remerciements Je tiens à remercier tout particulièrement mes encadreurs de Mémoire, Monsieur Bessalah Hamid, Ministre de la post et des technologies des informations et de la télécommunication, et Monsieur Bengherabi Messaoud, Chargé de recherche au Centre du Développement des Technologies Avancées (CDTA), pour leurs aides et conseils qu ils m ont apportés tout au long de ce travail Je tiens également à remercier Mr Harizi Farid et Mlle Mezai Lamia pour son aide dans la correction du mémoire. Je tiens aussi à remercier les membres de mon jury pour avoir accepter de juger mon travail. Finalement, je tiens à remercier tout ceux qui ont contribué de près ou de loin à la finalisation de ce travail. ii

3 Résumé La reconnaissance automatique du locuteur est le processus qui détermine automatiquement l identité de celui qui parle en se basant sur ses caractéristiques vocales. Actuellement, ce type de système est largement utilisé dans plusieurs domaines, essentiellement, dans la sécurisation d accès à des sites protégés, pour faire des transactions bancaires, ou pour répondre aux besoins d un tribunal pour un crime ou un litige civil. Le développement fulgurant des moyens de communications vocales (Mobile, VoIP,..) a permet à un grand flux d informations de circuler à travers les différents supports de communication. Ces informations peuvent être très utiles pour résoudre des problèmes criminalistiques. En effet, on peut facilement capturer des traces vocales, qui peuvent être analysées au moyen d un système de reconnaissance automatique du locuteur, et par conséquent, aider le tribunal à prendre une décision. Le travail présenté dans ce mémoire porte essentiellement sur l identification automatique du locuteur dans le domaine criminalistique (Forensique) adapté au dialecte algérien. Malgré que cette étude concerne de plus le cas criminalistique, tous les autres types des systèmes RAL (Reconnaissance Automatique du Locuteur) ont été étudiés. La contribution majeure de ce travail se voit dans la construction d une base de données de locuteurs algériens. Cette dernière est le résultat d une collaboration entre le CDTA (Centre du Développement des Technologies Avancées) et la société espagnole AGNITIO. La base de données nous a permis d effectuer plusieurs tests d évaluation sur les différents systèmes RAL. En plus, elle peut être utilisée pour construire un modèle UBM (Universal Background Model), qui représente la distribution statistique de l espace des vecteurs acoustiques des locuteurs algériens. Les expériences réalisées montrent que le système d identification forensique du locuteur est très intéressant et peut aider énormément à résoudre des problèmes criminalistiques. En effet, nous avons eu des résultats très promoteurs dans plusieurs conditions différentes. Nous avons aussi remarqué que les conditions d enregistrement iii

4 et les supports de transmission ont une grande influence sur les performances d un système d identification forensique du locuteur. Mots clés : Reconnaissance automatique du locuteur RAL, Identification forensique, Approche Bayesienne, Modèle de mélange de gaussiennes GMM, Vecteurs acoustiques. iv

5 Sommaire Sommaire Remerciements... 1 Résumé... iii Introduction générale... 1 Contexte et Motivation... 1 L organisation du mémoire... 2 Partie I : Introduction à la reconaissance automatique du locuteur 1 Généralités sur l identification du locuteur en criminalistique L identification forensique du locuteur Les techniques utilisées dans l identification forensique du locuteur L identification auditive du locuteur L identification du locuteur par l inspection visuelle des spectrogrammes L identification automatique du locuteur en criminalistique L estimation de la puissance d une preuve par l approche Bayesienne Conclusion Etat de l art sur la reconnaissance automatique du locuteur La reconnaissance automatique du locuteur La vérification du locuteur L identification du locuteur Une comparaison entre l identification et la vérification automatique du locuteur Les paramètres acoustiques La modélisation des paramètres acoustiques Une comparaison entre l identification forensique du locuteur et la reconnaissance automatique du locuteur a) L ensemble de référence v

6 Sommaire b) L approche Bayesienne c) Contrôle des échantillons Conclusion L interprétation Bayesienne d une preuve scientifique L approche Bayesienne Les avantages de l approche Bayesienne Les inconvénients de l approche Bayesienne L approche Bayesienne appliquée aux systèmes d identification forensique du locuteur Les bases de données L évaluation d un système biométrique en science forensique L échelle verbale du rapport de vraisemblance Les méthodes d estimation de la preuve Conclusion Partie II : Mise en oeuvre d un système d identification forensique du locuteur 4 Prétraitement et extraction des paramètres acoustiques Extraction des vecteurs acoustiques Le prétraitement La préaccentuation L élimination du silence Le fenêtrage L extraction des paramètres Les paramètres calculés par la prédiction linéaire Les paramètres calculés par l analyse Mel cepstral Les dérives des paramètres acoustiques Post traitement Conclusion La modélisation des vecteurs acoustiques L estimation du modèle GMM par l algorithme EM La phase d apprentissage La phase de classification ou de décision L estimation du modèle GMM par l algorithme MAP Conclusion vi

7 Sommaire Partie III : Tests d évaluation et conclusions 6 Tests et résultats d évaluation La base de données L outil d évaluation Les résultats des tests d évaluation L évaluation du système d identification du locuteur L évaluation du système de vérification du locuteur L évaluation du système d identification criminalistique du locuteur Conclusions et perspectives Perspectives Références Site web vii

8 Liste des figures Figures Fig 1.1 : Exemple d un spectrogramme Fig 1.2 : Courbes de mesure de confiance Fig 2.1: Schéma d un système de vérification du locuteur Fig 2.2 : Schéma d un système d identification du locuteur Fig 2.3 : La quantification vectorielle [data] Fig 2.4 : Un modèle de Markov caché [wiki] Fig 2.5 : Exemple d un réseau de neurone à deux entrées et une sortie [wiki] Fig 2.6 : Exemple d un mélange de gaussiennes monodimensionnelle [wiki] Fig 3.1 : Exemple d un graphique de type TipetPlot Fig 3.2 : La méthode directe [ANIL, 05] Fig 3.3 : La méthode des scores [ANIL, 05] Fig 4.1 : Les étapes principales pour l extraction des paramètres Fig 4.2 : Les étapes de prétraitement Fig 4.3 : Le filtre de la préaccentuation Fig 4.4: Les étapes principales pour éliminer le silence du deuxième algorithme Fig 4.5 : Les différentes mesures utilisées pour éliminer le silence Fig 4.6 : Du signal s ( ) avec silence au signal x ( ) sans silence en utilisant la 1 n 1 n fonction VAD (n) Fig 4.7: Les étapes du fenêtrage Fig 4.8 : Le découpage en trames Fig 4.9: Un modèle du conduit vocal Fig 4.10: Les étapes de la prédiction linéaire Fig 4.11: Le modèle de production de parole avec les tubes acoustiques Fig 4.12 : Les étapes à suivre pour créer un cepstral réel viii

9 Liste des figures Fig 4.13 : La transformation du Hz en Mel Fig 4.14 : La répartition des filtres triangulaires sur les échelles Fréquentielle et Mel Fig 4.15 : Les étapes pour le calcul des MFCC Fig 4.16 : les étapes de post traitement Fig 5.1 : Illustration de nuages acoustiques représentants l identité d un locuteur Fig 5.2 : Illustration des classes acoustiques d un locuteur dans un espace à 2 dimensions Fig 5.3 : Approximation de la distribution d un paramètre acoustique par une combinaison de gaussiennes Fig 5.4 : Schéma de fonctionnement de l algorithme LBG Fig 5.5: L adaptation par le technique MAP Fig 6.1 : L organisation de la base de données Fig 6.2 : L outil d évaluation Fig 6.3 : Un exemple de représentation graphique donnée par l outil d évaluation Fig 6.4 : L évaluation du système d identification du locuteur Fig 6.5 : Courbe ROC Fixe Vs Fixe Fig 6.6 : Courbe ROC Microphone Vs Microphone Fig 6.7 : Courbe ROC Mobile Vs Mobile Fig 6.8 : Tippet plots Fixe Vs Fixe Fig 6.9 : Tippet plots Microphone Vs Microphone Fig 6.10 : Tippet plots Mobile Vs Mobile ix

10 Liste des tableaux Tableaux Tab 3.1 : Quelques descriptions verbales du rapport de vraisemblance [ROSE, 02] Tab 6.1 : L ensemble de tests d évaluation qui peuvent être effectués sur la base de données de dialecte Algérien Tab 6.2 : Tests effectués sur le système de vérification du locuteur Tab 6.3 : EER des différentes courbes ROC Tab 6.4: Les rapports de vraisemblance des hypothèses H 0 et H x

11 Liste des abréviations Abréviations DCT: Discret Cosine Transform. DTW: Dynamic Time Warping EER: Equal Error Rate. EM: Expectation Maximization. FA: False Acceptance. FBI: Federal Bureau of Investigations. FFT: Fast Fourrier Transform. FR: False Rejection. GMM: Gaussian Mixtures Models. HMM: Hidden Markov Model. LAR: Log Area Ratio. LBG: Linde, Buzo et Gray. LPCC: Linear Prediction Cepstral Coefficients. MAP: Maximum à posteriori. MFCC: Mel Frequencies Cepstral Coefficients. RC : Reflection Coefficients. RAL: Reconnaissance Automatique du Locuteur. ROC: Receiver Operating Characteristic UBM: Universal Background model. xi

12 Introduction générale Introduction générale 1. Contexte et Motivation Le besoin de faire identifier des locuteurs anonymes par leur voix a connu un grand développement au cours de ces dernières années. Plusieurs techniques ont été proposées pour faire cette tâche. Ces dernières peuvent être classées selon trois approches: l approche auditive, l approche semi automatique, et l approche automatique basée sur une interprétation bayesienne de la preuve. Le problème avec les deux premières approches réside dans le fait qu elles nécessitent toujours des interventions humaines pour identifier une personne. Cette intervention n est pas toujours facile à faire, en effet, nous avons des problèmes qui dépendent de la langue du discours, du nombre de locuteurs à identifier, et du temps nécessaire pour faire l identification d un locuteur. Heureusement, avec le développement de l informatique, des systèmes de reconnaissance automatique du locuteur sont apparus, et ont simplifié énormément la tâche de la reconnaissance du locuteur. L avantage des systèmes RAL est qu ils sont indépendants du texte, Indépendants de la langue du discours, et la reconnaissance du locuteur est totalement automatisée et ne nécessite aucune intervention humaine. L objectif principal de ce travail est d étudier et d évaluer un système d identification automatique du locuteur en criminalistique, en utilisant le modèle GMM (Gaussian Mixture Model), adapté au dialecte Algérien. Ce système est basé principalement sur l approche bayesienne. Cette approche nécessite la création de plusieurs bases de données pour permettre l estimation et l évaluation des modèles statistiques des locuteurs. Pour atteindre cet objectif, une base de données de 40 locuteurs a été construite au sein du CDTA (Centre de Développement des Technologies Avancées) et en coopération avec la société espagnole Agnitio, qui est un leader dans la Speech Technology et principalement dans la reconnaissance automatique du locuteur. Cette base de données a été utilisée pour construire un 1

13 Introduction générale modèle UBM (Universal Backgroud Model), qui est très intéressant pour la bonne estimation des modèles statistiques des locuteurs Algériens. 2. L organisation du mémoire Ce mémoire se compose de sept chapitres, organisés comme suit : Le Chapitre 1 présente des généralités sur l identification du locuteur en criminalistique. Le Chapitre 2 contient une présentation des différents systèmes de reconnaissance automatique du locuteur. Une comparaison entre les systèmes de vérification et d identification du locuteur d une part et le système d identification forensique du locuteur d une autre part, a été aussi présentée. Le Chapitre 3 décrit en détails l approche Bayesienne utilisée dans les systèmes d identification de n import qu elle discipline forensique. Dans le Chapitre 4, nous avons mentionné un ensemble de paramètres acoustiques utilisés dans les systèmes RAL. Le Chapitre 5 présente le modèle statistique le plus utilisé dans les systèmes de reconnaissance automatique du locuteur en mode indépendant du texte, à savoir, le modèle GMM (Gaussian Mixture Model). Le Chapitre 6 contient l ensemble des tests effectués et les résultats que nous avons obtenus. Le dernier chapitre conclue ce travail et met l accent sur quelques problèmes qui peuvent être traités par des futurs travaux. 2

14 Inférence d identité dans le domaine forensique en utilisant un système de reconnaissance automatique du locuteur adapté au dialecte Algérien Partie I : La reconaissance automatique du locuteur en criminalistique

15 Chapitre1 Généralités sur l identification du locuteur en criminalistique Généralités sur l identification du locuteur en criminalistique La science forensique est l utilisation des outils scientifiques pour répondre aux besoins d un tribunal pour un crime ou un litige civil [wiki]. Les principaux domaines utilisés dans la science forensique sont : la biologie, la chimie, et la médecine. Malgré la dominance de ces dernières, il est a mentionné qu il existe d autres disciplines utilisées telles que : la physique, l informatique, la géologie, et la psychologie [answers]. Par exemple, les paramètres biométriques traditionnels, tels que l ADN et l empreinte digitale, sont souvent utilisés dans plusieurs cas forensiques. La nature de preuve, trouvée dans la scène du crime ou collectée à partir d opérations d investigation, impose les méthodes ou les disciplines scientifiques nécessaires pour faire son étude. Dans ce mémoire, nous nous intéressons aux méthodes d identification d un enregistrement vocale. L analyse de la voix est utilisée, pour la première fois, durant la deuxième guère mondiale pour des buts d espionnage militaire. Son utilisation pour des investigations forensique remonte aux années 60s, elle repose sur le fait que chaque personne peut être identifiée à partir d un échantillon de sa voix. Un suspect peut laisser des enregistrements de sa voix sur le téléphone, le Voic , un répondeur ou dans un enregistreur caché, et par la suite, il peut être utilisé comme preuve [enotes]. Un système forensique - 3 -

16 Chapitre1 Généralités sur l identification du locuteur en criminalistique d identification du locuteur est basé, principalement, sur un système de reconnaissance du locuteur, avec la prise en compte de certaines conditions et contraintes qui dépendent de la nature de cette application. Les approches les plus utilisées dans la reconnaissance du locuteur sont l approche auditive, l approche auditive instrumentale et l approche automatique. L approche auditive est basée principalement sur l écoute d un enregistrement audio par des phonéticiens expérimentés. Les différences perçues dans les paroles sont utilisées pour estimer la mesure de similarité entre les voix. Bien que cette approche ne soit pas adéquate pour la reconnaissance du locuteur, elle est très utile pour déterminer son profil. En plus de ces différences, les locuteurs se différent entre eux par leurs rythme de paroles, par leurs intonations, et par leurs articulations. L approche auditive a plusieurs limites. Dans l analyse phonétique traditionnelle, elle est utilisée pour extraire quelques paramètres d intérêt qui sont par la suite utilisés par l approche auditive instrumentale [ANIL, 05]. L approche auditive instrumentale implique le mesurage acoustique de plusieurs paramètres tels que : La fréquence fondamentale, le taux d articulation, l énergie spectrale, les formants, etc. Les moyennes et les variances de ces paramètres sont comparées pour faire l identification d un locuteur. L utilisation des spectrogrammes, pour la reconnaissance du locuteur, peut être considérée comme une autre méthode de cette approche [Bolt et al, 73] [ANIL, 05]. Le développement fulgurant de l informatique a donné une grande contribution à la reconnaissance automatique du locuteur et a permit de faire des traitements très complexes. En effet, la grande capacité de calcul des ordinateurs a contribué à l apparition de ce type de systèmes. Dans un système de reconnaissance automatique du locuteur, les modèles statistiques des paramètres acoustiques de la voix du locuteur sont comparés avec les paramètres acoustiques extraits de l enregistrement audio en question

17 Chapitre1 Généralités sur l identification du locuteur en criminalistique Le degré de similarité entre les paramètres acoustiques extraits de l enregistrement en question (ou la trace), et ceux extrait d un enregistrement du suspect, représenté par son modèle statistique, est calculé pour évaluer la preuve [Dryg et al, 03]. Dans les systèmes forensiques de reconnaissance automatique du locuteur, la puissance d une telle preuve est donnée par la probabilité d observer les paramètres de la trace dans le modèle statistique de la voix du locuteur suspect et dans les modèles des voix d une population potentielle [ANIL, 05]. Les systèmes de reconnaissance automatique du locuteur ont connu un grand succès durant ces dernières années. Cela est dû aux types des paramètres acoustiques utilisés qui donnent une présentation meilleure et plus complète du conduit vocal par rapport aux paramètres traditionnels. Malheureusement, l utilisation d un tel système dans le domaine forensique reste très limitée. Ce déphasage peut être expliqué par le fait, de la difficulté d expliquer au jury la signification des paramètres acoustiques, par exemple : les coefficients cepstraux, d une part, et par le manque d une interprétation qui relie ces coefficients (coefficients cepstraux) aux propriétés linguistiques, auditives, ou articulatoires des voix traitées, d une autre part [Rose, 02]. 1.1 L identification forensique du locuteur L identification ou la reconnaissance forensique (criminalistique) du locuteur est une tâche très complexe et nécessite la compréhension de plusieurs disciplines scientifiques y compris, les linguistiques, l acoustique, le traitement de signal et les statistiques. Avec le développement fulgurant de la téléphonie et l utilisation de la voix humaine pour commettre des crimes, l identification des personnes par leur voix est devenue un domaine populaire et objet d étude de plusieurs centres de recherche dans le monde. D après [ROSE, 02], la définition de l identification forensique d un locuteur est comme suit : - 5 -

18 Chapitre1 Généralités sur l identification du locuteur en criminalistique «C est l avis des experts dans un processus légal pour répondre à la question suivante : est ce que un ou plusieurs enregistrements vocaux sont générés par le même locuteur ou non?» Il existe plusieurs techniques utilisées dans le domaine de la reconnaissance forensique du locuteur. Dans ce que suit, nous présentons ces différentes techniques. 1.2 Les techniques utilisées dans l identification forensique du locuteur Dans les dernières années, plusieurs études ont été faites sur l évolution historique de l identification forensique du locuteur. Plusieurs auteurs ont publié des livres qui couvrent quelques techniques utilisées par des phonéticiens, des linguistes et des experts de la voix. Les techniques utilisées dans l identification forensique du locuteur peuvent être résumées en trois classes : 1) l identification auditive, 2) l identification par la visualisation des spectrogrammes, et 3) l identification automatique du locuteur. Dans ce qui suit, nous donnons une brève description à chaque technique L identification auditive du locuteur L identification auditive est faite par l écoute d un ou de plusieurs enregistrements vocaux afin de pouvoir identifier la résultats sont possibles : source de ces voix. Dans cette technique, trois L auditeur n est pas familiarisé avec la voix traitée, dans ce cas la source de la voix est inconnue. La voix est reconnue par l auditeur, mais ce dernier, ne peut pas l associée à un locuteur. La voix est reconnue par l auditeur qui l associée à un locuteur

19 Chapitre1 Généralités sur l identification du locuteur en criminalistique L application de cette technique dans le domaine forensique est faite selon deux variantes, la reconnaissance naïve et la reconnaissance technique. L identification naïve est faite par des personnes non expertes, sans l utilisation d aucune technique. Dans le cas usuel, cette tâche est faite par des victimes ou par des témoins. Bien que ce type de reconnaissance puisse être d une valeur significative au tribunal, dans le cas où on ne dispose pas d un enregistrement vocal, la fiabilité et la performance de cette méthode dépend de plusieurs paramètres, y compris, le temps écoulé depuis que le crime soit commis, la duré dans laquelle la victime a entendu la voix du criminel, etc [NOLA, 97]. En plus, la capacité de reconnaître une personne par sa voix varie largement selon les conditions de l écoute, le nombre d expériences, le nombre des voix inconnues, etc. L autre variante de l identification auditive, à savoir, la reconnaissance technique, est faite par des experts phonétiques ou linguistiques. L analyse de la voix est faite par l utilisation des méthodes scientifiques qui permet, non seulement, d expliquer l avis de l expert, mais aussi de pouvoir analyser cet avis par d autres experts. Malgré que l opinion des experts est acceptée par des tribunaux de plusieurs payés, l identification forensique du locuteur basée uniquement sur «l approche auditive» n est pas acceptée par plusieurs experts dans ce domaine [MEHR, 06] L identification du locuteur par l inspection visuelle des spectrogrammes Dans cette technique, l examinateur commence le processus de comparaison en plaçant des pairs de spectrogrammes correspondants à la même phrase et les compare mot par mot. D après [TOSI, 79], les paramètres les plus utilisés dans ce type de comparaison sont, les moyennes des fréquences, les pentes des formants, les interformants, et la densité de la puissance nasale. L analyse spectrographique a été largement utilisée et acceptée dans les Etats Unies, des payés de l Europe, et d autre payés pendant les années 1960s et 1970s. Cependant, cette technique a été abandonnée dans quelques - 7 -

20 Chapitre1 Généralités sur l identification du locuteur en criminalistique payés tel que l Allemagne et les Etats Unies pour plusieurs raisons. Parmi ces raisons, nous pouvons citer : La supposition principale dans l analyse spectrographique est que les variabilités inter locuteur d un modèle spectrographique, pour des mêmes paroles, sont très grandes de celles d intra locuteur. Cette supposition n était pas évidente après l analyse spectrographique de plusieurs paroles des mêmes et des différents locuteurs [FREN, 94]. Il n est pas clair de signaler légalement une similarité ou une différence significative entre des spectrogrammes. En plus, la décision dépend principalement des compétences de l examinateur [KUNZ, 95]. L analyse spectrographique a donnée des performances moins que celles de l analyse auditive [KUNZ, 95] [NOLA, 83]. Pour ces raisons, plusieurs chercheurs ont pensé que le nom «empreinte vocale» est une appellation impropre en le comparant par «l empreinte digitale». La différence la plus significative est la rigidité de l empreinte digitale par rapport à la flexibilité des échantillons vocaux. De plus, la plus part des chercheurs pensent que l utilisation de l analyse spectrographique n est qu une transformation d une comparaison auditive en une comparaison visuelle. En résumé, l interprétation des spectrogrammes n est pas une technique adéquate pour un système d identification forensique du locuteur [MEHR, 06] L identification automatique du locuteur en criminalistique Deux méthodes ont été utilisées pour faire une identification automatique du locuteur en criminalistique, la première est basée sur une approche bayesienne, tandis que la deuxième est basée sur l utilisation d intervalle de confiance. Dans la section suivante, nous donnons une brève description des deux approches

21 Chapitre1 Généralités sur l identification du locuteur en criminalistique Fig 1.1 : Exemple d un spectrogramme. L identification forensique du locuteur par l approche Bayesienne Le théorème de Bayes est parmi les facteurs les plus importants dans l évolution historique des systèmes d identification forensique du locuteur. L utilisation des rapports de vraisemblances a aidé les experts à quantifier et interpréter la puissance d une preuve scientifique dans le domaine forensique. Comme il a été mentionné par [AITK, 95], dans la science forensique, l identité de la source d une preuve ne peut pas être connue avec certitude, et par conséquent, elle doit être inférée ou déduite. Le processus d inférence dans un contexte forensique, peut être vu comme étant un processus de réduction d une population initiale à un groupe restreint ou éventuellement à une seule personne [MEUW, 01]. Dans l approche bayesienne, le rapport de vraisemblance est le rapport entre deux probabilités conditionnelles, sous deux hypothèses concurrentes, d une même preuve. Les deux hypothèses sont les suivantes [ANIL, 07] : H 0 : Le suspect est la source de l enregistrement vocal. H 1 : L origine de l enregistrement vocal n est pas le locuteur suspect

22 Chapitre1 Généralités sur l identification du locuteur en criminalistique Il est à mentionner que le rapport de vraisemblance n est pas un test d une hypothèse sur un ensemble de données, mais plutôt, un moyen de comparaison de deux hypothèses compétitives. Par exemple, si nous avons un rapport de vraisemblance de 10, alors il est dix fois possible d avoir la preuve sous l hypothèse H 0 que sous l hypothèse H 1 [EVET, 95]. Parmi les raisons pour lesquelles l approche Bayesienne est adéquate pour l évaluation et l interprétation d une preuve forensique, [ROSE, 02] a cité: C est une théorie logique démontrée et ne contient aucun doute. Elle dirige le tribunal, les jurés et principalement les experts à considérer la probabilité conditionnelle de la preuve sous deux hypothèses concurrentes [AITK, 95]. Elle clarifie et sépare les rôles du juge et des experts forensiques. Elle assiste les experts dans l évaluation de la valeur d une preuve scientifique et la présenter sous forme d une vraisemblance. C est une très bonne méthode pour combiner des nouvelles preuves. Pour ces raisons, nous avons choisi cette approche pour être l objet d étude de ce mémoire. Elle sera étudiée en détails dans le troisième chapitre. L identification forensique du locuteur par intervalle de confiance Dans cette technique, une mesure de confiance est calculée pour supporter une des hypothèses H0 ou H1 définies plus haut. Les mesures de confiance sont utilisées pour décider de rejeter ou d accepter une hypothèse de reconnaissance. La prise de décision s appuie sur un test du rapport de vraisemblance. Cette technique est développée au sein du FBI (Federal Bureau of Investigation) par Nakazone en 2002 [NAKA, 01]

23 Chapitre1 Généralités sur l identification du locuteur en criminalistique Elle est très semblable à la première méthode car elles sont, toutes les deux, basées sur l utilisation des rapports de vraisemblances Les scores 0.04 Probabilité 0.02 Faux Score Vrai Score Test Score Probabilité de mesure de confiance P(Ht x) Courbe de confiance Test Score Valeur de confiance GMM Scores Fig 1.2 : Courbes de mesure de confiance 1.3 L estimation de la puissance d une preuve par l approche Bayesienne Identifier une personne par l analyse de sa voix est une tâche très difficile. Cela est dû à la variabilité des caractéristiques vocales, non seulement pour des locuteurs différents, mais aussi pour le locuteur à identifier. Dans la réalité, les caractéristiques vocales d un locuteur montrent des variations moins importantes pour le même locuteur par apport à une population potentielle, en comparant les mêmes caractéristiques vocales. Dans les systèmes forensique d identification automatique du locuteur, le problème principal réside dans la difficulté de trouver une formule de vraisemblance qui prend en

Master IAD Module PS. Reconnaissance de la parole (suite): Paramétrisation. Gaël RICHARD Février 2008

Master IAD Module PS. Reconnaissance de la parole (suite): Paramétrisation. Gaël RICHARD Février 2008 Master IAD Module PS Reconnaissance de la parole (suite): Paramétrisation Gaël RICHARD Février 2008 1 Reconnaissance de la parole Introduction Approches pour la reconnaissance vocale Paramétrisation Distances

Plus en détail

Apprentissage Automatique

Apprentissage Automatique Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs

Plus en détail

Calculatrice vocale basée sur les SVM

Calculatrice vocale basée sur les SVM Calculatrice vocale basée sur les SVM Zaïz Fouzi *, Djeffal Abdelhamid *, Babahenini MohamedChaouki*, Taleb Ahmed Abdelmalik**, * Laboratoire LESIA, Département d Informatique, Université Mohamed Kheider

Plus en détail

Reconnaissance de la parole par distance DTW Exemple d application pour la reconnaissance de chiffres isolés dans la langue arabe

Reconnaissance de la parole par distance DTW Exemple d application pour la reconnaissance de chiffres isolés dans la langue arabe Reconnaissance de la parole par distance DTW Exemple d application pour la reconnaissance de chiffres isolés dans la langue arabe Abderrahmane BENDAHMANE Laboratoire SIMPA Département d informatique Université

Plus en détail

Reconnaissance vocale

Reconnaissance vocale Reconnaissance vocale Définition : La reconnaissance vocale ou (Automatic Speech Recognition ASR) est une technologie de transcription d'un système «phonatoire organique»exploitable par une machine. La

Plus en détail

Master IAD Module PS. IV. Reconnaissance de la parole. Gaël RICHARD Février 2008

Master IAD Module PS. IV. Reconnaissance de la parole. Gaël RICHARD Février 2008 Master IAD Module PS IV. Reconnaissance de la parole Gaël RICHARD Février 2008 1 Contenu Introduction aux technologies vocales Production et Perception de la parole Modélisation articulatoire Synthèse

Plus en détail

Dan Istrate. Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier

Dan Istrate. Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier Détection et reconnaissance des sons pour la surveillance médicale Dan Istrate le 16 décembre 2003 Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier Thèse mené dans le cadre d une collaboration

Plus en détail

Coup de Projecteur sur les Réseaux de Neurones

Coup de Projecteur sur les Réseaux de Neurones Coup de Projecteur sur les Réseaux de Neurones Les réseaux de neurones peuvent être utilisés pour des problèmes de prévision ou de classification. La représentation la plus populaire est le réseau multicouche

Plus en détail

Traitement du signal pour la reconnaissance vocale. Cours 5: Traitement du signal et reconnaissance de forme

Traitement du signal pour la reconnaissance vocale. Cours 5: Traitement du signal et reconnaissance de forme Traitement du signal pour la reconnaissance vocale Cours 5: Traitement du signal et reconnaissance de forme Chaîne de Reconnaissance vocale Acquisition microphone Numérisation du signal Pré-traitement

Plus en détail

Application Forensique à la Reconnaissance Vocale du Locuteur

Application Forensique à la Reconnaissance Vocale du Locuteur Application Forensique à la Reconnaissance Vocale du Locuteur Ouassila Kenai, Mhania Guerti Laboratoire Signal et Communications, Ecole Nationale Polytechnique, Alger, Algérie wassi_ke@yahoo.fr, mhania.guerti@enp.edu.dz

Plus en détail

Sources d information : lexicale. Sources d information : phonotactique. Sources d information : prosodie (2/3) Sources d information : prosodie (1/3)

Sources d information : lexicale. Sources d information : phonotactique. Sources d information : prosodie (2/3) Sources d information : prosodie (1/3) Organisation de la présentation Reconnaissance automatique des langues RMITS 28 http://www.irit.fr/~jerome.farinas/rmits28/ Jérôme Farinas jerome.farinas@irit.fr Équipe SAMOVA (Structuration, Analyse et

Plus en détail

Un code-barre sur la tête?

Un code-barre sur la tête? Un code-barre sur la tête? Les nouvelles tendances des technologies de biométrie. Nouvelles technologies GISIC 2010 Photo Steven Puetzer Prof. Jean Hennebert Université de Fribourg HES-SO Jean Hennebert

Plus en détail

Un code-barre sur la tête?

Un code-barre sur la tête? Un code-barre sur la tête? Les nouvelles tendances des technologies d'identification, de la biométrie à l'internet des objets. Présentation au Groupement Industriel Fribourgeois, Décembre 08 Photo Steven

Plus en détail

Cours IFT6266, Exemple d application: Data-Mining

Cours IFT6266, Exemple d application: Data-Mining Cours IFT6266, Exemple d application: Data-Mining Voici un exemple du processus d application des algorithmes d apprentissage statistique dans un contexte d affaire, qu on appelle aussi data-mining. 1.

Plus en détail

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems

Plus en détail

Simulation d un système d assurance automobile

Simulation d un système d assurance automobile Simulation d un système d assurance automobile DESSOUT / PLESEL / DACHI Plan 1 Introduction... 2 Méthodes et outils utilisés... 2.1 Chaines de Markov... 2.2 Méthode de Monte Carlo... 2.3 Méthode de rejet...

Plus en détail

FACULTE DE MEDECINE D ANGERS. Polycopié de cours pour les 1 e et 2 e cycles des études médicales Préparation à l examen national classant

FACULTE DE MEDECINE D ANGERS. Polycopié de cours pour les 1 e et 2 e cycles des études médicales Préparation à l examen national classant FACULTE DE MEDECINE D ANGERS Polycopié de cours pour les 1 e et 2 e cycles des études médicales Préparation à l examen national classant Année scolaire 2007-2008 SANTE PUBLIQUE ET MEDECINE SOCIALE Responsable

Plus en détail

Jean-François Bonastre. jean-francois.bonastre@lia.univ-avignon.fr www.lia.univ-avignon.fr 08 Février 2006

Jean-François Bonastre. jean-francois.bonastre@lia.univ-avignon.fr www.lia.univ-avignon.fr 08 Février 2006 L authentification biométrique vocale Jean-François Bonastre jean-francois.bonastre@lia.univ-avignon.fr www.lia.univ-avignon.fr 08 Février 2006 L identification vocale dans le milieu judiciaire Une motivation

Plus en détail

Mesure agnostique de la qualité des images.

Mesure agnostique de la qualité des images. Mesure agnostique de la qualité des images. Application en biométrie Christophe Charrier Université de Caen Basse-Normandie GREYC, UMR CNRS 6072 Caen, France 8 avril, 2013 C. Charrier NR-IQA 1 / 34 Sommaire

Plus en détail

- Mobiliser les résultats sur le second degré dans le cadre de la résolution d un problème.

- Mobiliser les résultats sur le second degré dans le cadre de la résolution d un problème. Mathématiques - classe de 1ère des séries STI2D et STL. 1. Analyse On dote les élèves d outils mathématiques permettant de traiter des problèmes relevant de la modélisation de phénomènes continus ou discrets.

Plus en détail

Analyse de données longitudinales continues avec applications

Analyse de données longitudinales continues avec applications Université de Liège Département de Mathématique 29 Octobre 2002 Analyse de données longitudinales continues avec applications David MAGIS 1 Programme 1. Introduction 2. Exemples 3. Méthodes simples 4.

Plus en détail

Abdenour Hacine-Gharbi. Sélection de paramètres acoustiques pertinents pour la reconnaissance de la parole

Abdenour Hacine-Gharbi. Sélection de paramètres acoustiques pertinents pour la reconnaissance de la parole ÉCOLE DOCTORALE SCIENCES ET TECHNOLOGIES (ORLEANS) FACULTÉ de TECHNOLOGIE (Sétif) Laboratoire PRISME THÈSE EN COTUTELLE INTERNATIONALE présentée par : Abdenour Hacine-Gharbi soutenue le : 09 décembre 2012

Plus en détail

Master IAD Module PS. Reconnaissance de la parole (suite) Alignement temporel et Programmation dynamique. Gaël RICHARD Février 2008

Master IAD Module PS. Reconnaissance de la parole (suite) Alignement temporel et Programmation dynamique. Gaël RICHARD Février 2008 Master IAD Module PS Reconnaissance de la parole (suite) Alignement temporel et Programmation dynamique Gaël RICHARD Février 2008 1 Reconnaissance de la parole Introduction Approches pour la reconnaissance

Plus en détail

Table des matières. PREMIÈRE PARTIE Étapes initiales des études marketing 7

Table des matières. PREMIÈRE PARTIE Étapes initiales des études marketing 7 Table des matières Préface Public 1 Structure de l ouvrage 1 Caractéristiques de l ouvrage 3 Contenu 3 Pédagogie 4 Remarques sur l adaptation française 4 Ressources numériques 5 Biographie 6 PREMIÈRE PARTIE

Plus en détail

Introduction au datamining

Introduction au datamining Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des

Plus en détail

L authentification biométrique vocale

L authentification biométrique vocale L authentification biométrique vocale Jean-François Bonastre jean-francois.bonastre@lia.univ-avignon.fr www.lia.univ-avignon.fr 17 Mars 2005 Contexte A partir d un signal de parole, des informations de

Plus en détail

Regime Switching Model : une approche «pseudo» multivarie e

Regime Switching Model : une approche «pseudo» multivarie e Regime Switching Model : une approche «pseudo» multivarie e A. Zerrad 1, R&D, Nexialog Consulting, Juin 2015 azerrad@nexialog.com Les crises financières survenues dans les trente dernières années et les

Plus en détail

Modèles neuronaux pour la modélisation statistique de la langue

Modèles neuronaux pour la modélisation statistique de la langue Modèles neuronaux pour la modélisation statistique de la langue Introduction Les modèles de langage ont pour but de caractériser et d évaluer la qualité des énoncés en langue naturelle. Leur rôle est fondamentale

Plus en détail

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique DOMAINE P3.C3.D1. Pratiquer une démarche scientifique et technologique, résoudre des

Plus en détail

MATHÉMATIQUES CYCLE TERMINAL DE LA SÉRIE ÉCONOMIQUE ET SOCIALE ET DE LA SÉRIE LITTERAIRE CLASSE DE PREMIÈRE

MATHÉMATIQUES CYCLE TERMINAL DE LA SÉRIE ÉCONOMIQUE ET SOCIALE ET DE LA SÉRIE LITTERAIRE CLASSE DE PREMIÈRE Annexe MATHÉMATIQUES CYCLE TERMINAL DE LA SÉRIE ÉCONOMIQUE ET SOCIALE ET DE LA SÉRIE LITTERAIRE CLASSE DE PREMIÈRE L enseignement des mathématiques au collège et au lycée a pour but de donner à chaque

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

Programme de Première

Programme de Première BAC TECHNO STAV 66 I. Algèbre Programme de Première Objectif 1 - Effectuer de manière autonome des calculs numériques ou algébriques, résoudre des équations ou inéquations en vue de résoudre des problèmes

Plus en détail

Ingénierie d aide à la décision

Ingénierie d aide à la décision Ingénierie d aide à la décision Maria Malek 1 er septembre 2009 1 Objectifs et débouchés Nous proposons dans cette option deux grands axes pour l aide à la décision : 1. La recherche opérationnelle ; 2.

Plus en détail

Références. Compter les mots. Le langage comme donnée. Communication Langagière Ingénierie des langues et de la parole

Références. Compter les mots. Le langage comme donnée. Communication Langagière Ingénierie des langues et de la parole Communication Langagière Ingénierie des langues et de la parole 1. Introduction générale 2. Ingénierie des langues 2.1 Représentation et codage des textes 2.2 Théorie de l information et probabilités 2.3

Plus en détail

Analyse d images, vision par ordinateur. Partie 6: Segmentation d images. Segmentation? Segmentation?

Analyse d images, vision par ordinateur. Partie 6: Segmentation d images. Segmentation? Segmentation? Analyse d images, vision par ordinateur Traitement d images Segmentation : partitionner l image en ses différentes parties. Reconnaissance : étiqueter les différentes parties Partie 6: Segmentation d images

Plus en détail

Analyse d images en vidéosurveillance embarquée dans les véhicules de transport en commun

Analyse d images en vidéosurveillance embarquée dans les véhicules de transport en commun des s Analyse d images en vidéosurveillance embarquée dans les véhicules de transport en commun Sébastien Harasse thèse Cifre LIS INPG/Duhamel le 7 décembre 2006 1 Système de surveillance des s Enregistreur

Plus en détail

INF6304 Interfaces Intelligentes

INF6304 Interfaces Intelligentes INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie

Plus en détail

Informatique visuelle - Vision par ordinateur. Pré-traitement d images

Informatique visuelle - Vision par ordinateur. Pré-traitement d images Informatique visuelle - Vision par ordinateur Pré-traitement d images Elise Arnaud elise.arnaud@imag.fr cours inspiré par X. Descombes, J. Ros, A. Boucher, A. Manzanera, E. Boyer, M Black, V. Gouet-Brunet

Plus en détail

Discrétisation et génération de hiérarchies de concepts

Discrétisation et génération de hiérarchies de concepts Prétraitement des données 1 Pourquoi prétraiter les données? Nettoyage des données Intégration et transformation Réduction des données Discrétisation et génération de hiérarchies de g concepts Pourquoi

Plus en détail

Evaluation d un test diagnostique - Concordance

Evaluation d un test diagnostique - Concordance Evaluation d un test diagnostique - Concordance Michaël Genin Université de Lille 2 EA 2694 - Santé Publique : Epidémiologie et Qualité des soins michaelgenin@univ-lille2fr Plan 1 Introduction 2 Evaluation

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

I.2 Comment passer d un signal analogique en un signal numérique sans perdre de l information?

I.2 Comment passer d un signal analogique en un signal numérique sans perdre de l information? I- Chaîne d information I.1 Généralités Dans un ballon-sonde, on trouve des capteurs (température, luminosité, pression ) plus ou moins sophistiqués. Nous allons voir que pour un problème technique identique

Plus en détail

Les données manquantes en statistique

Les données manquantes en statistique Les données manquantes en statistique N. MEYER Laboratoire de Biostatistique -Faculté de Médecine Dép. Santé Publique CHU - STRASBOURG Séminaire de Statistique - 7 novembre 2006 Les données manquantes

Plus en détail

Programme de l enseignement obligatoire commun de mathématiques Cycle terminal de la série sciences et technologies du management et de la gestion

Programme de l enseignement obligatoire commun de mathématiques Cycle terminal de la série sciences et technologies du management et de la gestion Programme de l enseignement obligatoire commun de mathématiques Cycle terminal de la série sciences et technologies du management et de la gestion L enseignement des mathématiques au collège et au lycée

Plus en détail

Arbres binaires. Hélène Milhem. Institut de Mathématiques de Toulouse, INSA Toulouse, France IUP SID, 2011-2012

Arbres binaires. Hélène Milhem. Institut de Mathématiques de Toulouse, INSA Toulouse, France IUP SID, 2011-2012 Arbres binaires Hélène Milhem Institut de Mathématiques de Toulouse, INSA Toulouse, France IUP SID, 2011-2012 H. Milhem (IMT, INSA Toulouse) Arbres binaires IUP SID 2011-2012 1 / 35 PLAN Introduction Construction

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

Rapport Soutenance 1

Rapport Soutenance 1 Les Retrouvés EPITA Cycle préparatoire SPE 2018 Rapport Soutenance 1 Membres du groupe: Alexis yang(chef de projet) Emmanuel andriot Alexandre abita Marius tanawa Contents 1 Introduction 2 2 Prétraitement

Plus en détail

Analyse des données individuelles groupées

Analyse des données individuelles groupées Analyse des données individuelles groupées Analyse des Temps de Réponse Le modèle mixte linéaire (L2M) Y ij, j-ième observation continue de l individu i (i = 1,, N ; j =1,, n) et le vecteur des réponses

Plus en détail

LA VOIX ET L OREILLE HUMAINE APPLICATION À LA RECONNAISSANCE VOCALE

LA VOIX ET L OREILLE HUMAINE APPLICATION À LA RECONNAISSANCE VOCALE TS - Physique-Chimie - Spécialité Son et musique - Séance 1/9 Domaine d étude : émetteurs et récepteurs sonores Mots-clefs : voix, acoustique physiologique, reconnaissance vocale LA VOIX ET L OREILLE HUMAINE

Plus en détail

11. Evaluation de la qualité des essais

11. Evaluation de la qualité des essais 11. Evaluation de la qualité des essais L évaluation de la qualité méthodologique d un essai thérapeutique est une tâche difficile [117]. L essai thérapeutique contrôlé randomisé est considéré comme étant

Plus en détail

Bouchekif Abdesselam 11 mars 2012

Bouchekif Abdesselam 11 mars 2012 Expériences sur les données du répertoire de données de UCI avec une boîte à outils Bouchekif Abdesselam 11 mars 2012 Résumé Les dix dernières années ont été témoin de grands progrès réalisés dans le domaine

Plus en détail

Introduction au cours STA 102 Analyse des données : Méthodes explicatives

Introduction au cours STA 102 Analyse des données : Méthodes explicatives Analyse des données - Méthodes explicatives (STA102) Introduction au cours STA 102 Analyse des données : Méthodes explicatives Giorgio Russolillo giorgio.russolillo@cnam.fr Infos et support du cours Slide

Plus en détail

Principales caractéristiques de Mixmod

Principales caractéristiques de Mixmod Modèle de mélanges Principales caractéristiques de Mixmod Gérard Govaert et Gilles Celeux 24 octobre 2006 1 Plan Le modèledemélange Utilisations du modèle de mélange Les algorithmes de Mixmod Modèle de

Plus en détail

Que signifie la phrase suivante?

Que signifie la phrase suivante? SPE TS AE 1 : Reconnaissance vocale son et musique Emetteurs et récepteurs sonores La reconnaissance vocale est une technique permettant d'analyser une parole et de la retranscrire sous une forme exploitable

Plus en détail

Projet : Recherche de source d onde gravitationnelle (analyse de données Metropolis Hastings Markov Chain) 1

Projet : Recherche de source d onde gravitationnelle (analyse de données Metropolis Hastings Markov Chain) 1 Université Paris Diderot Physique L2 2014-2015 Simulations Numériques SN4 Projet : Recherche de source d onde gravitationnelle (analyse de données Metropolis Hastings Markov Chain) 1 Objectifs : Simuler

Plus en détail

2 Probabilités conditionnelles. Événements indépendants

2 Probabilités conditionnelles. Événements indépendants 2 Probabilités conditionnelles. Événements indépendants 2.1 Probabilité conditionnelle Soient A et B deux événements tels que P(B) > 0. Soit alors P(A B), la probabilité que A se réalise, B étant réalisé.

Plus en détail

Première STMG1 2014-2015 progression. - 1. Séquence : Proportion d une sous population dans une population.

Première STMG1 2014-2015 progression. - 1. Séquence : Proportion d une sous population dans une population. Première STMG1 2014-2015 progression. - 1 Table des matières Fil rouge. 3 Axes du programme. 3 Séquence : Proportion d une sous population dans une population. 3 Information chiffrée : connaître et exploiter

Plus en détail

Quantification Vectorielle

Quantification Vectorielle Quantification Vectorielle Marco Cagnazzo Département Traitement du Signal et des Images TELECOM ParisTech 14 Décembre 2012 M. Cagnazzo Quantification Vectorielle 1/65 Plan Introduction 1 Introduction

Plus en détail

PJE : Analyse de comportements avec Twitter Classification supervisée

PJE : Analyse de comportements avec Twitter Classification supervisée PJE : Analyse de comportements avec Twitter Classification supervisée Arnaud Liefooghe arnaud.liefooghe@univ-lille1.fr Master 1 Informatique PJE2 2015-16 B. Derbel L. Jourdan A. Liefooghe 1 2 Agenda Partie

Plus en détail

L essentiel sur les tests statistiques

L essentiel sur les tests statistiques L essentiel sur les tests statistiques 21 septembre 2014 2 Chapitre 1 Tests statistiques Nous considérerons deux exemples au long de ce chapitre. Abondance en C, G : On considère une séquence d ADN et

Plus en détail

Motivation : pourquoi exploration de données? Nous nous noyons dans les données, mais manquons cruellement de connaissances

Motivation : pourquoi exploration de données? Nous nous noyons dans les données, mais manquons cruellement de connaissances 1 Introduction Définition et motivations Tâches de data mining (fouille de données, exploration de données) Techniques et algorithmes Exemples et applications 1 Motivation : pourquoi exploration de données?

Plus en détail

DATA MINING 2 Réseaux de Neurones, Mélanges de classifieurs, SVM avancé

DATA MINING 2 Réseaux de Neurones, Mélanges de classifieurs, SVM avancé I. Réseau Artificiel de Neurones 1. Neurone 2. Type de réseaux Feedforward Couches successives Récurrents Boucles de rétroaction Exemples de choix pour la fonction : suivant une loi de probabilité Carte

Plus en détail

MÉTHODES ET STATISTIQUES POUR LIRE UN ARTICLE

MÉTHODES ET STATISTIQUES POUR LIRE UN ARTICLE MÉTHODES ET STATISTIQUES POUR LIRE UN ARTICLE Forum HH 05.02.2013 Ghislaine Gagnon Unité HPCI Qualitatif ou quantitatif? Les 2 méthodes peuvent être utilisées séparément ou en conjonction - le qualitatif

Plus en détail

Distributions bayésiennes nonparamétriques sur les matrices binaires triangulaires infinies : Applications aux modèles graphiques

Distributions bayésiennes nonparamétriques sur les matrices binaires triangulaires infinies : Applications aux modèles graphiques Distributions bayésiennes nonparamétriques sur les matrices binaires triangulaires infinies : Applications aux modèles graphiques Patrick Dallaire Université Laval Département d informatique et de génie

Plus en détail

Autour des nombres pseudo-aléatoires

Autour des nombres pseudo-aléatoires Lycée Chaptal PCSI-PC* Informatique générale pour l ingénieur Autour des nombres pseudo-aléatoires Introduction Produire des suites de nombres aléatoires est une nécessité dans de nombreux domaines de

Plus en détail

Estimation du Quantile conditionnel par les Réseaux de neurones à fonction radiale de base

Estimation du Quantile conditionnel par les Réseaux de neurones à fonction radiale de base Estimation du Quantile conditionnel par les Réseaux de neurones à fonction radiale de base M.A. Knefati 1 & A. Oulidi 2 & P.Chauvet 1 & M. Delecroix 3 1 LUNAM Université, Université Catholique de l Ouest,

Plus en détail

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com Intelligence Artificielle et Systèmes Multi-Agents Badr Benmammar bbm@badr-benmammar.com Plan La première partie : L intelligence artificielle (IA) Définition de l intelligence artificielle (IA) Domaines

Plus en détail

Modélisation prédictive et incertitudes. P. Pernot. Laboratoire de Chimie Physique, CNRS/U-PSUD, Orsay

Modélisation prédictive et incertitudes. P. Pernot. Laboratoire de Chimie Physique, CNRS/U-PSUD, Orsay Modélisation prédictive et incertitudes P. Pernot Laboratoire de Chimie Physique, CNRS/U-PSUD, Orsay Plan 1 Incertitudes des modèles empiriques 2 Identification et caractérisation des paramètres incertains

Plus en détail

CLASSES PRÉPARATOIRES AUX GRANDES ÉCOLES CATALOGUE DES COURS 2013 2015. Parcours ECS (voie scientifique)

CLASSES PRÉPARATOIRES AUX GRANDES ÉCOLES CATALOGUE DES COURS 2013 2015. Parcours ECS (voie scientifique) MINISTERE DE L EDUCATION NATIONALE, DE L ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE CLASSES PRÉPARATOIRES AUX GRANDES ÉCOLES CATALOGUE DES COURS 2013 2015 Parcours ECS (voie scientifique) Classe préparatoire

Plus en détail

MASTER SIS PRO : logique et sécurité DÉTECTION D INTRUSIONS. Odile PAPINI, LSIS. Université de Toulon et du Var. papini@univ-tln.

MASTER SIS PRO : logique et sécurité DÉTECTION D INTRUSIONS. Odile PAPINI, LSIS. Université de Toulon et du Var. papini@univ-tln. MASTER SIS PRO : logique et sécurité DÉTECTION D INTRUSIONS Odile PAPINI, LSIS. Université de Toulon et du Var. papini@univ-tln.fr Plan Introduction Généralités sur les systèmes de détection d intrusion

Plus en détail

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Baccalauréat ES/L Amérique du Sud 21 novembre 2013 Baccalauréat ES/L Amérique du Sud 21 novembre 2013 A. P. M. E. P. EXERCICE 1 Commun à tous les candidats 5 points Une entreprise informatique produit et vend des clés USB. La vente de ces clés est réalisée

Plus en détail

Pour pouvoir utiliser les mêmes liaisons que les autres données, sur le réseau du FAI, la voix est multiplexée :

Pour pouvoir utiliser les mêmes liaisons que les autres données, sur le réseau du FAI, la voix est multiplexée : 1. Les codecs Pour pouvoir utiliser les mêmes liaisons que les autres données, sur le réseau du FAI, la voix est multiplexée : Pour être ainsi transportée, sous forme de paquets, la voix doit être numérisée

Plus en détail

GPA759 RÉSEAUX DE NEURONES ET INTELLIGENCE ARTIFICIELLE Préalable(s) : Aucun PLAN DE COURS SESSION AUTOMNE 2013

GPA759 RÉSEAUX DE NEURONES ET INTELLIGENCE ARTIFICIELLE Préalable(s) : Aucun PLAN DE COURS SESSION AUTOMNE 2013 École de technologie supérieure Département de génie de la production automatisée Responsable(s) du cours : Crédits : Richard Lepage, ing., Ph.D. GPA759 RÉSEAUX DE NEURONES ET INTELLIGENCE ARTIFICIELLE

Plus en détail

L analyse d images regroupe plusieurs disciplines que l on classe en deux catégories :

L analyse d images regroupe plusieurs disciplines que l on classe en deux catégories : La vision nous permet de percevoir et d interpreter le monde qui nous entoure. La vision artificielle a pour but de reproduire certaines fonctionnalités de la vision humaine au travers de l analyse d images.

Plus en détail

Evaluation de la Reconnaissance de la Parole VoIP avec Dissimulation de Perte de Paquets

Evaluation de la Reconnaissance de la Parole VoIP avec Dissimulation de Perte de Paquets Evaluation de la Reconnaissance de la Parole VoIP avec Dissimulation de Perte de Paquets Adil Bakri 1, Abderrahmane Amrouche 2 1 Centre de Recherche Scientifique et Technique pour le Développement de Langue

Plus en détail

Table des matières. Avant propos. Chapitre I NOTIONS SUR LES SYSTEMES

Table des matières. Avant propos. Chapitre I NOTIONS SUR LES SYSTEMES Table des matières Avant propos Chapitre I NOTIONS SUR LES SYSTEMES 1. Systèmes linéaires 1 2. Systèmes stationnaires 1 3. Systèmes continus 2 4. Systèmes linéaires invariants dans le temps (LIT) 2 4.1

Plus en détail

Le traitement du signal

Le traitement du signal FICHE N 47 Le traitement du signal FFT, DFT ET IFT Jean-aptiste Joseph Fourier (1768-1830), né à uxerre, mathématicien et physicien français, auteur de la Théorie analytique de la chaleur (1822) : la transformée

Plus en détail

Laennext aspects techniques

Laennext aspects techniques Laennext aspects techniques 1 LAENNEXT : ASPECTS TECHNIQUES Résumé L'obstruction des voies respiratoires par des glaires provoque l'apparition de bruits spécifiques lors de la respiration, ces bruits sont

Plus en détail

Simulation simplifiée de la Cinétique de l antenne HUYGENS-PWA et Comparaison avec la modulation d amplitude du signal à 36 Hz

Simulation simplifiée de la Cinétique de l antenne HUYGENS-PWA et Comparaison avec la modulation d amplitude du signal à 36 Hz Simulation simplifiée de la Cinétique de l antenne HUYGENS-PWA et Comparaison avec la modulation d amplitude du signal à 36 Hz 1 Note interne LPCE-CETP, Version # 3, C. Béghin & D. Lagoutte, Octobre 2007

Plus en détail

INTERNATIONAL CHAIR IN MATHEMATICAL PHYSICS AND APPLICATIONS (ICMPA) UNESCO CHAIR IN MATHEMATICAL PHYSICS AND APPLICATIONS

INTERNATIONAL CHAIR IN MATHEMATICAL PHYSICS AND APPLICATIONS (ICMPA) UNESCO CHAIR IN MATHEMATICAL PHYSICS AND APPLICATIONS INTERNATIONAL CHAIR IN MATHEMATICAL PHYSICS AND APPLICATIONS (ICMPA) UNESCO CHAIR IN MATHEMATICAL PHYSICS AND APPLICATIONS established in 2006 at the University of Abomey-Calavi (Republic of Benin) UNITWIN/UNESCO

Plus en détail

Méthodes d apprentissage :

Méthodes d apprentissage : Méthodes d apprentissage : application au tri de complexes protéines-protéines Jérôme Azé Apprentissage: tâches Apprentissage non supervisé (Eisen, ) Apprentissage supervisé (arbres de décision, k-ppv,

Plus en détail

Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé

Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé EXERCICE 1 5 points Commun à tous les candidats 1. Réponse c : ln(10)+2 ln ( 10e 2) = ln(10)+ln ( e 2) = ln(10)+2 2. Réponse b : n 13 0,7 n 0,01

Plus en détail

Apprentissage par méthodes à noyaux en reconnaissance d images

Apprentissage par méthodes à noyaux en reconnaissance d images Apprentissage par méthodes à noyaux en reconnaissance d images Alberto Bietti Table des matières Introduction 2 1 Apprentissage par méthodes à noyaux 2 1.1 Position du problème et motivation..........................

Plus en détail

Analyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57

Analyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57 Analyse de la vidéo Chapitre 4.1 - La modélisation pour le suivi d objet 10 mars 2015 Chapitre 4.1 - La modélisation d objet 1 / 57 La représentation d objets Plan de la présentation 1 La représentation

Plus en détail

Glossaire Analyse en Composantes Principales (ACP) Analyse Factorielle des Correspondances (AFC) Apprentissage supervisé Apprentissage non supervisé

Glossaire Analyse en Composantes Principales (ACP) Analyse Factorielle des Correspondances (AFC) Apprentissage supervisé Apprentissage non supervisé Glossaire Analyse en Composantes Principales (ACP) : *méthode factorielle (Pearson 1901, Hotelling 1933) permettant de fournir un résumé descriptif (sous forme graphique le plus souvent) d une population

Plus en détail

Soutien illimité 7j/7 en maths: Coach, profs, exercices & annales, cours. Sujet de Bac 2013 Maths S Obligatoire & Spécialité - Liban

Soutien illimité 7j/7 en maths: Coach, profs, exercices & annales, cours. Sujet de Bac 2013 Maths S Obligatoire & Spécialité - Liban Sujet de Bac 2013 Maths S Obligatoire & Spécialité - Liban EXERCICE 1 : 4 Points Cet exercice est un questionnaire à choix multiples. Aucune justification n est demandée. Pour chacune des questions, une

Plus en détail

Résumé des communications des Intervenants

Résumé des communications des Intervenants Enseignements de la 1ere semaine (du 01 au 07 décembre 2014) I. Titre du cours : Introduction au calcul stochastique pour la finance Intervenante : Prof. M hamed EDDAHBI Dans le calcul différentiel dit

Plus en détail

INTRODUCTION À LA BIOMÉTRIE OCTOBRE 2011

INTRODUCTION À LA BIOMÉTRIE OCTOBRE 2011 INTRODUCTION À LA BIOMÉTRIE OCTOBRE 2011 Bibliographies http://www.clorenz.org/article-12579256.html (vidéo) http://www.cse.msu.edu/~jain/ http://www.cl.cam.ac.uk/~jgd1000/ http://face.nist.gov/frvt/frvt2006/frvt2006.htm

Plus en détail

Modélisation du comportement habituel de la personne en smarthome

Modélisation du comportement habituel de la personne en smarthome Modélisation du comportement habituel de la personne en smarthome Arnaud Paris, Selma Arbaoui, Nathalie Cislo, Adnen El-Amraoui, Nacim Ramdani Université d Orléans, INSA-CVL, Laboratoire PRISME 26 mai

Plus en détail

Quelques points de traitement du signal

Quelques points de traitement du signal Quelques points de traitement du signal Introduction: de la mesure au traitement Source(s) BRUIT BRUIT Système d acquisition Amplitude (Pa) Temps (s) Amplitude (Pa) Mesure Opérations mathématiques appliquées

Plus en détail

UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2013 2014 MATHS/STATS. 1 Généralités sur les tests statistiques 2

UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2013 2014 MATHS/STATS. 1 Généralités sur les tests statistiques 2 UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2013 2014 Master d économie Cours de M. Desgraupes MATHS/STATS Document 4 : Les tests statistiques 1 Généralités sur les tests

Plus en détail

Annexe 4 Programmes des classes préparatoires aux Grandes Ecoles

Annexe 4 Programmes des classes préparatoires aux Grandes Ecoles Annexe 4 Programmes des classes préparatoires aux Grandes Ecoles Filière : scientifique Voie : Biologie, chimie, physique et sciences de la Terre (BCPST) Discipline : Informatique Première et seconde années

Plus en détail

Master IAD Module PS. Reconnaissance de la parole (suite) Modèles de Markov et bases de données. Gaël RICHARD Février 2008

Master IAD Module PS. Reconnaissance de la parole (suite) Modèles de Markov et bases de données. Gaël RICHARD Février 2008 Master IAD Module PS Reconnaissance de la parole (suite) Modèles de Markov et bases de données Gaël RICHARD Février 2008 1 Reconnaissance de la parole Introduction Approches pour la reconnaissance vocale

Plus en détail

Transmission d informations sur le réseau électrique

Transmission d informations sur le réseau électrique Transmission d informations sur le réseau électrique Introduction Remarques Toutes les questions en italique devront être préparées par écrit avant la séance du TP. Les préparations seront ramassées en

Plus en détail

THESE. Rajae El Ouazzani

THESE. Rajae El Ouazzani Université Mohammed V - Souissi THESE pour obtenir le grade de : Docteur en Sciences Appliquées Spécialité : Informatique Préparée au sein de l UFR : Systèmes d Information Métiers, Multimédia et Mobile

Plus en détail

Support du cours de Probabilités IUT d Orléans, Département d informatique

Support du cours de Probabilités IUT d Orléans, Département d informatique Support du cours de Probabilités IUT d Orléans, Département d informatique Pierre Andreoletti IUT d Orléans Laboratoire MAPMO (Bât. de Mathématiques UFR Sciences) - Bureau 126 email: pierre.andreoletti@univ-orleans.fr

Plus en détail

NON-LINEARITE ET RESEAUX NEURONAUX

NON-LINEARITE ET RESEAUX NEURONAUX NON-LINEARITE ET RESEAUX NEURONAUX Vêlayoudom MARIMOUTOU Laboratoire d Analyse et de Recherche Economiques Université de Bordeaux IV Avenue. Leon Duguit, 33608 PESSAC, France tel. 05 56 84 85 77 e-mail

Plus en détail

Plan du cours. Intelligence Artificielle et Manipulation Symbolique de l Information. Induction de règles (rappels) L induction logique

Plan du cours. Intelligence Artificielle et Manipulation Symbolique de l Information. Induction de règles (rappels) L induction logique Intelligence Artificielle et Manipulation Symbolique de l Information Cours 0 mercredi 8 avril 205 Plan du cours Raisonner par induction l induction Induction par arbres de décision Christophe Marsala

Plus en détail

Thème 10 : Développer un concept et une architecture technique de produit

Thème 10 : Développer un concept et une architecture technique de produit Thème 10 : Développer un concept et une architecture technique de produit Serghei Floricel et Eduardo Miranda Si vous réfléchissez encore à un moyen technique pour réaliser un produit qui fonctionne et

Plus en détail