MAP 553 Apprentissage statistique

Dimension: px
Commencer à balayer dès la page:

Download "MAP 553 Apprentissage statistique"

Transcription

1 MAP 553 Apprentissage statistique Université Paris Sud et Ecole Polytechnique PC1 1/39

2 Apprentissage? 2/39

3 Apprentissage? L apprentissage au quotidien 1 filtres SPAM 2 Reconnaissance de chiffre: lecture automatique de codes postaux 3 Diagnostique médical: de cancers, alzheimer, diabète, etc 4 In silico chemometrics: recherche virtuelle de médicaments 5 Business analytics, Google ranking, web-data, etc spamsieve/ 3/39

4 Apprentissage? L apprentissage au quotidien 1 filtres SPAM 2 Reconnaissance de chiffre: lecture automatique de codes postaux 3 Diagnostique médical: de cancers, alzheimer, diabète, etc 4 In silico chemometrics: recherche virtuelle de médicaments 5 Business analytics, Google ranking, web-data, etc 3/39

5 Apprentissage? L apprentissage au quotidien 1 filtres SPAM 2 Reconnaissance de chiffre: lecture automatique de codes postaux 3 Diagnostique médical: de cancers, alzheimer, diabète, etc 4 In silico chemometrics: recherche virtuelle de médicaments 5 Business analytics, Google ranking, web-data, etc 3/39

6 Apprentissage? L apprentissage au quotidien 1 filtres SPAM 2 Reconnaissance de chiffre: lecture automatique de codes postaux 3 Diagnostique médical: de cancers, alzheimer, diabète, etc 4 In silico chemometrics: recherche virtuelle de médicaments 5 Business analytics, Google ranking, web-data, etc 3/39

7 Apprentissage? L apprentissage au quotidien 1 filtres SPAM 2 Reconnaissance de chiffre: lecture automatique de codes postaux 3 Diagnostique médical: de cancers, alzheimer, diabète, etc 4 In silico chemometrics: recherche virtuelle de médicaments 5 Business analytics, Google ranking, web-data, etc 3/39

8 Apprentissage? L apprentissage au quotidien 1 filtres SPAM 2 Reconnaissance de chiffre: lecture automatique de codes postaux 3 Diagnostique médical: de cancers, alzheimer, diabète, etc 4 In silico chemometrics: recherche virtuelle de médicaments 5 Business analytics, Google ranking, web-data, etc 3/39

9 Apprentissage? Les deux aspects de l apprentissage: aspect statistique aspect algorithmique 4/39

10 Le fléau de la dimension 5/39

11 Renversement de point de vue Cadre statistique classique: petit nombre p de paramètres grand nombre n d expériences on étudie le comportement asymptotique des estimateurs lorsque n (résultats type théorème central limite) 6/39

12 Renversement de point de vue Cadre statistique classique: petit nombre p de paramètres grand nombre n d expériences on étudie le comportement asymptotique des estimateurs lorsque n (résultats type théorème central limite) Données actuelles: inflation du nombre p de paramètres taille d échantillon reste réduite: n p ou n p = penser différemment les statistiques! (penser n ne convient plus) 6/39

13 Le fléau de la dimension: exemple 1 On observe X 1,..., X n [0, 1] p i.i.d. selon une densité f : [0, 1] p R inconnue. On cherche à estimer f. Une idée naturelle est de faire un histogramme avec disons des cases de 0.1 de côté. 7/39

14 Le fléau de la dimension: exemple 1 En dimension p = 1: Histogram of x Density Histogramme d un échantillon de n = 100 tirages d une loi beta. x 8/39

15 Le fléau de la dimension: exemple 1 On observe X 1,..., X n [0, 1] p i.i.d. selon une densité f : [0, 1] p R inconnue. On cherche à estimer f. Une idée naturelle est de faire un histogramme avec disons des cases de 0.1 de côté. Questions : 1 Pour avoir en moyenne 10 observations par cases, quelle taille doit avoir n (en fonction de p)? 2 Conclusion? Comment faire avec des échantillons plus petits? 9/39

16 Le fléau de la dimension: exemple 2 Echec des méthodes locales en régression. On observe Y 1,..., Y n R et X 1,..., X n R p avec Y i = f (X i ) + ε i, i = 1,..., n, où f est inconnue et les E[ε i ] = 0. ˆf (x) = Moyenne{Y i : X i B(x, r)} avec un r petit. on supposera les X i i.i.d. U(B(0, 1)) 1 Pour r < 1 montrer P( X i B(0, r)) = 1 (1 r p ) n. 2 Pour quelle valeur de r est-ce supérieur à 1/2? 3 Pour estimer f (0) avec au moins un point, quel est l ordre de grandeur du diamètre r minimal? Conclusion? 10/39

17 Le fléau de la dimension: exemple 2 r log(p) valeurs de r pour lesquelles (1 r p ) n = 1/2, cas n = /39

18 Le fléau de la dimension: exemple 3 Puces ADN: Modèle: log-intensité du spot (après normalisation) X i = θ i + ɛ i avec i.i.d. ε i N (0, 1) Déviation gaussienne à 5%: on a P [ (N (0, 1)) 2 > 3.84 ] 5% 12/39

19 Le fléau de la dimension: exemple 3 Puces ADN: Modèle: log-intensité du spot (après normalisation) X i = θ i + ɛ i avec i.i.d. ε i N (0, 1) Déviation gaussienne à 5%: on a P [ (N (0, 1)) 2 > 3.84 ] 5% Les valeurs X 2 i supérieures à 3.84 sont-elles significatives? 12/39

20 Le fléau de la dimension: exemple x Avec p = 1000 et θ i = 0 i (donc X 2 i = ε 2 i ). Niveaux représentés: 3.84 et 2 log p. z 13/39

21 Le fléau de la dimension: exemple 3 Combien de faux positifs? Supposons que p = 5000 et 4% des gènes sont positifs. Quel est le nombre moyen de faux positifs si on conserve tous les X 2 i > 3.84? Pourquoi un seuil à 2 log(p)? ( ) P max i=1,...,p ε2 i > t p t p α log p { 0 si α 2 1 si α < 2 Quel est le problème si p grand? 14/39

22 Le fléau de la dimension: pour aller plus loin Introduction to High-Dimensional Statistics. To appear. LectureNotes.pdf Jiashun Jin. Impossibility of successful classification when useful features are rare and weak. Proceedings of the National Academy of Sciences of the USA. 106 (22); pp /39

23 Réduction de dimension : ACP 16/39

24 Réduire la dimension Objectif: trouver un espace V de petite dimension tel que (simultanément) les observations X i R p soient proches de leur projection sur cet espace X[,3] X[,2] X[,1] Ex: dimension p = 3 : meilleur plan approximant. 17/39

25 Un exemple visuel : MNIST Base MNIST : 1100 chiffres scannés Figure : chaque image correspond à un vecteur dans R /39

26 Un exemple visuel : MNIST image originale image originale image originale image originale image projetée image projetée image projetée image projetée Figure : Projection des images sur un espace affine de dimension 10 donné par l ACP 19/39

27 Un exemple visuel : MNIST image 1 image MNIST moyenne image 1 recentrée image 1 projetée sur 10 axes Figure : Réduction de dimension d un facteur 25 par ACP 20/39

28 Réduire la dimension: exemple 2 Epreuve d heptathlon, jeux olympiques de Seoul, hurdles highjump shot run200m longjump javelin run800m Joyner-Kersee (USA) John (GDR) Behmer (GDR) Sablovskaite (URS) Choubenkova (URS) Schulz (GDR) Fleming (AUS) Greiner (USA) Lajbnerova (CZE) Bouraga (URS) Wijnsma (HOL) Dimitrova (BUL) Scheider (SWI) Braun (FRG) Ruotsalainen (FIN) Yuping (CHN) Hagger (GB) Brown (USA) Mulliner (GB) Hautenauve (BEL) Kytola (FIN) Geremias (BRA) Hui-Ing (TAI) Jeong-Mi (KOR) Launa (PNG) /39

29 ACP en action Résultat d une ACP sur les données d heptathlon PC highjump 11 run200m longjump hurdles run800m shot 5 javelin PC1 22/39

30 ACP : notations Epreuve d heptathlon, jeux olympiques de Seoul, [ tableau n p : X = X (v) i ] i = 1... n v = 1... p = [ X (1),..., X (p)] = X T 1. X T n p = 7 variables: 1 hurdles: results 100m hurdles. 2 highjump: results high jump. 3 shot: results shot. 4 run200m: results 200m race. 5 longjump: results long jump. 6 javelin: results javelin. 7 run800m: results 800m race. n = 25 athlètes. 23/39

31 Réduire la dimension But: représenter les obervations X i R p dans un espace de plus petite dimension avec le moins de perte d information possible. Ex: avec p = 2 variables: axes de projections (1er en rouge, 2nd en vert). 24/39

32 Réduire la dimension But: représenter les obervations X i R p dans un espace de plus petite dimension avec le moins de perte d information possible. X[,3] X[,2] X[,1] Ex: avec p = 3 variables: meilleur plan approximant. 25/39

33 Etape préliminaire Normalisation: étape préliminaire de normalisation des données: centrer: X (v) X (v) X (v) réduire: X (v) X (v) / var ( X (v)) (sauf si comparables) Dorénavant on supposera les données centrées. 26/39

34 ACP Objectif : Obtenir un espace vectoriel V de petite dimension tel que Proj V (X i ) X i pour i = 1,..., n. Questions : on notera Σ = 1 n XT X 1 Montrer que V d := argmin dim(v )=d = argmax dim(v )=d n X i Proj V (X i ) 2 i=1 n Proj V (X i ) 2 i=1 2 Par quels vecteurs V d est-il engendré? (commencer par d = 1) 3 Que vaut n i=1 Proj V d (X i ) 2? 27/39

35 ACP : définitions Axes principaux: a (1)... a (d) R p vecteurs propres orthonormés de Σ = 1 n XT X, ordonnés selon les valeurs propres décroissantes Composantes principales: c k = Xa (k) R n pour k = 1,..., d Remarques: c 1... c d R n : car c j, c k = n(a (j) ) T Σ a (k) = nλ k δ jk a (k) = 1 et c k 2 = nλ k c 1,..., c d R n vecteurs propres de XX T 28/39

36 ACP : projections Projection des individus: X i, a (k) = (c k ) i donc d Proj Vd (X i ) = (c k ) i a (k) k=1 Projection des variables: X (v), c k / c k 2 = (a (k) ) v donc d Proj <c1,...,c d >(X (v) ) = (a (k) ) v c k k=1 29/39

37 ACP: biplot PC highjump 11 run200m longjump hurdles run800m shot 5 javelin PC1 30/39

38 ACP : variance expliquée valeurs propres pour les données d heptathlon. acp Variances /39

39 Cercle des corrélations Cercle des corrélations: pour chaque variable v on définit le vecteur ρ (v) R d par On a ρ (v) k = cor(x (v), c k ) = X (v), c k X (v), k = 1,..., d. c k ρ (v) 2 = Proj <c 1,...,c d >(X (v) ) 2 X (v) 2 1. La norme de ρ (v) représente la qualité de la représentation de la variable v par les d premiers axes. 32/39

40 Cercle des corrélations : d = 2 PC longjump highjump shot javelin run200m hurdles run800m PC 1 Les variables sont bien expliquées par les deux premières composantes (proche du cercle) 33/39

41 ACP: exemple 3 Exemple: budget de l état français sur 24 années. Les variables: part du budget alloué à différents postes (en pourcentage du budget) PVP: Pouvoirs publics AGR: Agriculture CMI: Commerce et industrie TRA: Travail LOG: Logement EDU: Éducation ACS: Action sociale ANC: Ancien combattants DEF: Défense DET: Remboursement dette DIV: Divers donc p = 11 Observations: on a 24 observations pour chaque variable (n = 24) 34/39

42 ACP: exemple 3 valeurs propres valeurs propres /39

43 ACP: exemple 3 Projection sur les 2 premiers axes 36/39

44 ACP: exemple 3 Projection sur les 3 premiers axes 37/39

45 ACP: exemple 3 Cercle des corrélations Variables proches du cercle: bien expliquées par les deux premiers axes. 38/39

46 ACP : récapitulatif Axes principaux: a (1)... a (d) R p vecteurs propres orthonormés de Σ = 1 n XT X, Composantes principales: c 1... c d R n, avec c k = Xa (k) Projection des individus: Proj Vd (X i ) = d k=1 (c k) i a (k) Projection des variables: Proj <c1,...,c d >(X (v) ) = d k=1 (a(k) ) v c k Ratio de variance expliquée: par les d premières composantes λ λ d λ λ p. 39/39

Analyse en Composantes Principales

Analyse en Composantes Principales Analyse en posantes Principales Université Paris Sud et Ecole Polytechnique Analyse en posantes Principales 1/21 Réduction de dimension : ACP Analyse en posantes Principales 2/21 Réduire la dimension:

Plus en détail

Cours 2-3 Analyse des données multivariées

Cours 2-3 Analyse des données multivariées Cours 2-3 des données s Ismaël Castillo École des Ponts, 13 Novembre 2012 Plan 1 2 3 4 1. On s intéresse à un jeu de données multi-dimensionel, avec n individus observés et p variables d intérêt ( variables

Plus en détail

Cours de Statistiques

Cours de Statistiques Cours de Statistiques Romain Raveaux 1 1 Laboratoire L3I Université de La Rochelle romain.raveaux01 at univ-lr.fr Octobre 24-11, 2008 1 / 35 Sommaire 1 Quelques Rappels 2 numériques Relations entre deux

Plus en détail

Analyse en composantes principales

Analyse en composantes principales Analyse en composantes principales Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire LITIS Analyse en composantes principales p. 1/18 Introduction Objectifs Soit {x i } i=1,,l

Plus en détail

1 Complément sur la projection du nuage des individus

1 Complément sur la projection du nuage des individus TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent

Plus en détail

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

Outils Statistiques du Data Mining

Outils Statistiques du Data Mining Outils Statistiques du Data Mining Pr Roch Giorgi roch.giorgi@univ-amu.fr SESSTIM, Faculté de Médecine, Aix-Marseille Université, Marseille, France http://sesstim-orspaca.org http://optim-sesstim.univ-amu.fr

Plus en détail

Cours 5: Exemples d application www.enseeiht.fr/~gergaud/teaching

Cours 5: Exemples d application www.enseeiht.fr/~gergaud/teaching Cours 5: Exemples d application www.enseeiht.fr/~gergaud/teaching Joseph Gergaud 30 novembre 5 Exemples d application 1/ 25 1 Inertie Variables Individus Calculs 2 ACP Variables nominales supplémentaires

Plus en détail

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et

Plus en détail

DEFINITION et PROPRIETES des PRINCIPALES LOIS de PROBABILITES

DEFINITION et PROPRIETES des PRINCIPALES LOIS de PROBABILITES Université Paris1, Licence 00-003, Mme Pradel : Principales lois de Probabilité 1 DEFINITION et PROPRIETES des PRINCIPALES LOIS de PROBABILITES Notations Si la variable aléatoire X suit la loi L, onnoterax

Plus en détail

Introduction à l analyse des données. Analyse des Données (1) Exemple, ville et (in)sécurité. Exemple, ville et (in)sécurité

Introduction à l analyse des données. Analyse des Données (1) Exemple, ville et (in)sécurité. Exemple, ville et (in)sécurité Introduction à l analyse des données Analyse des Données () Le but de l analyse de données est de synthétiser, structurer l information contenue dans des données multidimensionnelles Deux groupes de méthodes

Plus en détail

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques

Plus en détail

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

Examen d accès - 28 Septembre 2012

Examen d accès - 28 Septembre 2012 Examen d accès - 28 Septembre 2012 Aucun document autorisé - Calculatrice fournie par le centre d examen Cet examen est un questionnaire à choix multiples constitué de 50 questions. Plusieurs réponses

Plus en détail

Analyse des données et Data Mining

Analyse des données et Data Mining Analyse des données et Data Mining Analyse en composantes principales utc sy09 1 Objectif des méthodes factorielles Visualiser, traiter des données multidimensionnelles Problème difficile Information apportée

Plus en détail

Méthodes de projection

Méthodes de projection Chapitre 11 Méthodes de projection Contenu 11.1 Analyse en composantes principales........ 138 11.1.1 L Analyse en Composantes Principales........ 139 11.1.2 La (grande) famille des ACP............. 151

Plus en détail

Chapitre 3 : INFERENCE

Chapitre 3 : INFERENCE Chapitre 3 : INFERENCE 3.1 L ÉCHANTILLONNAGE 3.1.1 Introduction 3.1.2 L échantillonnage aléatoire 3.1.3 Estimation ponctuelle 3.1.4 Distributions d échantillonnage 3.1.5 Intervalles de probabilité L échantillonnage

Plus en détail

Techniques d estimation : Maximum de Vraisemblance et Méthode des Moments Généralisée

Techniques d estimation : Maximum de Vraisemblance et Méthode des Moments Généralisée Techniques d estimation : Maximum de Vraisemblance et Méthode des Moments Généralisée Philippe Gagnepain Université Paris 1 Ecole d Economie de Paris Centre d économie de la Sorbonne-UG 4-Bureau 405 philippe.gagnepain@univ-paris1.fr

Plus en détail

Analyse en Composantes. Principales

Analyse en Composantes. Principales AgroParisTech Analyse en Composantes Principales C Duby, S Robin Table des matières Introduction 3 2 Tableau de données 4 3 Choix d une distance 6 4 Choix de l origine 7 5 Moments d inertie 9 5 Inertie

Plus en détail

Analyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57

Analyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57 Analyse de la vidéo Chapitre 4.1 - La modélisation pour le suivi d objet 10 mars 2015 Chapitre 4.1 - La modélisation d objet 1 / 57 La représentation d objets Plan de la présentation 1 La représentation

Plus en détail

Méthodes de placement multidimensionnelles. Fabrice Rossi Télécom ParisTech

Méthodes de placement multidimensionnelles. Fabrice Rossi Télécom ParisTech Méthodes de placement multidimensionnelles Fabrice Rossi Télécom ParisTech Plan Introduction Analyse en composantes principales Modèle Qualité et interprétation Autres méthodes 2 / 27 F. Rossi Plan Introduction

Plus en détail

Fouille de Données et Media Sociaux Cours 2 Master DAC Data Science UPMC - LIP6

Fouille de Données et Media Sociaux Cours 2 Master DAC Data Science UPMC - LIP6 Fouille de Données et Media Sociaux Cours 2 Master DAC Data Science UPMC - LIP6 Ludovic Denoyer 21 septembre 2015 Ludovic Denoyer () FDMS 21 septembre 2015 1 / 1 Contexte Observation La plupart des bonnes

Plus en détail

Apprentissage Automatique Numérique

Apprentissage Automatique Numérique Apprentissage Automatique Numérique Loïc BARRAULT Laboratoire d Informatique de l Université du Maine (LIUM) loic.barrault@lium.univ-lemans.fr 16 septembre 2015 1/42 Problème classique Automatique Autre

Plus en détail

L essentiel sur les tests statistiques

L essentiel sur les tests statistiques L essentiel sur les tests statistiques 21 septembre 2014 2 Chapitre 1 Tests statistiques Nous considérerons deux exemples au long de ce chapitre. Abondance en C, G : On considère une séquence d ADN et

Plus en détail

Discrétisation et génération de hiérarchies de concepts

Discrétisation et génération de hiérarchies de concepts Prétraitement des données 1 Pourquoi prétraiter les données? Nettoyage des données Intégration et transformation Réduction des données Discrétisation et génération de hiérarchies de g concepts Pourquoi

Plus en détail

Analyse de données longitudinales continues avec applications

Analyse de données longitudinales continues avec applications Université de Liège Département de Mathématique 29 Octobre 2002 Analyse de données longitudinales continues avec applications David MAGIS 1 Programme 1. Introduction 2. Exemples 3. Méthodes simples 4.

Plus en détail

11. Tests d hypothèses (partie 1/2)

11. Tests d hypothèses (partie 1/2) 11. Tests d hypothèses (partie 1/2) MTH2302D S. Le Digabel, École Polytechnique de Montréal H2015 (v1) MTH2302D: tests d hypothèses 1/30 Plan 1. Introduction 2. Hypothèses et erreurs 3. Tests d hypothèses

Plus en détail

MAP 574 Méthodes statistiques pour la biologie

MAP 574 Méthodes statistiques pour la biologie MAP 574 Méthodes statistiques pour la biologie CMAP, Ecole Polytechnique cours introductif à la statistique 1/103 Content 1 Modélisation: la démarche scientifique 2 Statistiques descriptives 3 Estimation

Plus en détail

How To Analyse Data from micro-array experiments: A Simple Tutorial

How To Analyse Data from micro-array experiments: A Simple Tutorial How To Analyse Data from micro-array experiments: A Simple Tutorial Serge Smidtas Supelec Source de données L analyse commence lorsque les MicroArray ont été scannées. Des images, des logiciels (Genepix,

Plus en détail

Arithmétique Algorithmique. http://www.math.univ-lyon1.fr/~roblot/ens.html

Arithmétique Algorithmique. http://www.math.univ-lyon1.fr/~roblot/ens.html Arithmétique Algorithmique http://www.math.univ-lyon1.fr/~roblot/ens.html Partie III Algorithmes classiques 1 Coût de la multiplication et de la division 2 Exponentiation rapide 3 Algorithme d Euclide

Plus en détail

HUITIEME PARTIE ANALYSE EN COMPSANTES PRINCIPALES

HUITIEME PARTIE ANALYSE EN COMPSANTES PRINCIPALES 105 HUITIEME PARTIE ANALYSE EN COMPSANTES PRINCIPALES 1. Introduction En statistiques il arrive fréquemment que les individus soient décrits par un grand nombre de caractères. : voitures décrites par leur

Plus en détail

COURS DE STATISTIQUES (24h)

COURS DE STATISTIQUES (24h) COURS DE STATISTIQUES (24h) Introduction Statistiques descriptives (4 h) Rappels de Probabilités (4 h) Echantillonnage(4 h) Estimation ponctuelle (6 h) Introduction aux tests (6 h) Qu est-ce que la statistique?

Plus en détail

Estimateur et Estimation Prof Franck Bonnetain Unité de méthodologie & de qualité de vie en cancérologie (EA3181) CHRU Besançon

Estimateur et Estimation Prof Franck Bonnetain Unité de méthodologie & de qualité de vie en cancérologie (EA3181) CHRU Besançon PACES - APEMK UE 4 Evaluation des méthodes d analyses appliquées aux sciences de la vie et de la santé Estimateur et Estimation Prof Franck Bonnetain Unité de méthodologie & de qualité de vie en cancérologie

Plus en détail

Initiation à la fouille de données et à l apprentissage automatiq

Initiation à la fouille de données et à l apprentissage automatiq Initiation à la fouille de données et à l apprentissage automatique 1 Laboratoire d Informatique Fondamentale de Marseille Université de Provence christophe.magnan@lif.univ-mrs.fr www.lif.univ-mrs.fr/

Plus en détail

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA

Plus en détail

2. Formalisation ... Or les variables sont indépendantes. Donc si

2. Formalisation ... Or les variables sont indépendantes. Donc si L'estimation 1. Concrètement... Dernièrement un quotidien affichait en première page : en 30 ans les françaises ont grandi de... je ne sais plus exactement, disons 7,1 cm. C'est peut-être un peu moins

Plus en détail

Master 1 Informatique Éléments de statistique inférentielle

Master 1 Informatique Éléments de statistique inférentielle Master 1 Informatique Éléments de statistique inférentielle Faicel Chamroukhi Maître de Conférences UTLN, LSIS UMR CNRS 7296 email: chamroukhi@univ-tln.fr web: chamroukhi.univ-tln.fr 2014/2015 Faicel Chamroukhi

Plus en détail

Introduction aux Support Vector Machines (SVM)

Introduction aux Support Vector Machines (SVM) Introduction aux Support Vector Machines (SVM) Olivier Bousquet Centre de Mathématiques Appliquées Ecole Polytechnique, Palaiseau Orsay, 15 Novembre 2001 But de l exposé 2 Présenter les SVM Encourager

Plus en détail

Cours 1: Introduction à l algorithmique

Cours 1: Introduction à l algorithmique 1 Cours 1: Introduction à l algorithmique Olivier Bournez bournez@lix.polytechnique.fr LIX, Ecole Polytechnique 2011-12 Algorithmique 2 Aujourd hui Calcul de x n Maximum Complexité d un problème Problème

Plus en détail

Sélection de variables groupées avec les forêts aléatoires. Application à l analyse des données fonctionnelles multivariées.

Sélection de variables groupées avec les forêts aléatoires. Application à l analyse des données fonctionnelles multivariées. Sélection de variables groupées avec les forêts aléatoires. Application à l analyse des données fonctionnelles multivariées. Baptiste Gregorutti 12, Bertrand Michel 2 & Philippe Saint Pierre 2 1 Safety

Plus en détail

Etude des propriétés empiriques du lasso par simulations

Etude des propriétés empiriques du lasso par simulations Etude des propriétés empiriques du lasso par simulations L objectif de ce TP est d étudier les propriétés empiriques du LASSO et de ses variantes à partir de données simulées. Un deuxième objectif est

Plus en détail

Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage

Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage Journées de Méthodologie Statistique Eric Lesage Crest-Ensai 25 janvier 2012 Introduction et contexte 2/27 1 Introduction

Plus en détail

Chapitre 2: Prévisions des ventes

Chapitre 2: Prévisions des ventes Chapitre 2: Prévisions des ventes AVIS IMPORTANT : Ces notes sont basées sur le livre de Steven Nahmias : Production et Operations Analysis, 4 ième édition, McGraw-Hill Irwin 200. Les figures sont issues

Plus en détail

IUT STID, LP Bio-informatique. Traitement de données «Biopuces» Devoir du 17 novembre 2011

IUT STID, LP Bio-informatique. Traitement de données «Biopuces» Devoir du 17 novembre 2011 Université de Perpignan IUT de Carcassonne Nathalie Villa-Vialaneix Année 2011/20112 IUT STID, LP Bio-informatique Traitement de données «Biopuces» Devoir du 17 novembre 2011 Consignes Les réponses sont

Plus en détail

Statistique (MATH-F-315, Cours #1)

Statistique (MATH-F-315, Cours #1) Statistique (MATH-F-315, Cours #1) Thomas Verdebout Université Libre de Bruxelles 2015 Plan de la partie Statistique du cours 1. Introduction. 2. Théorie de l estimation. 3. Tests d hypothèses et intervalles

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

Probabilités et statistiques dans le traitement de données expérimentales

Probabilités et statistiques dans le traitement de données expérimentales Probabilités et statistiques dans le traitement de données expérimentales S. LESECQ, B. RAISON IUT1, GEII 1 Module MC-M1 2009-2010 1 V Estimation de paramètres, tests d hypothèse, statistiques Module MC-M1

Plus en détail

Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining.

Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining. 2 jours : Mardi 15 et mercredi 16 novembre 2005 de 9 heures 30 à 17 heures 30 Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining. Madame, Monsieur, On parle

Plus en détail

SPLEX Statistiques pour la classification et fouille de données en

SPLEX Statistiques pour la classification et fouille de données en SPLEX Statistiques pour la classification et fouille de données en génomique Classification Linéaire Binaire CLB Pierre-Henri WUILLEMIN DEcision, Système Intelligent et Recherche opérationnelle LIP6 pierre-henri.wuillemin@lip6.fr

Plus en détail

Espaces vectoriels. par Pierre Veuillez

Espaces vectoriels. par Pierre Veuillez Espaces vectoriels par Pierre Veuillez 1 Objectifs : Disposer d un lieu où les opérations + et se comportent bien. Déterminer des bases (utilisation de la dimension) Représenter les vecteurs grace à leurs

Plus en détail

Examen Gestion d Actifs

Examen Gestion d Actifs ESILV 2012 D. Herlemont Gestion d actifs Examen Gestion d Actifs 2 pt 1. On considère un portefeuille investi dans n actifs risqués, normalement distribués d espérance en excès du taux sans risque µ =

Plus en détail

Extraction d informations stratégiques par Analyse en Composantes Principales

Extraction d informations stratégiques par Analyse en Composantes Principales Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 dousset@irit.fr 1 Introduction

Plus en détail

L analyse en composantes principales en pratique

L analyse en composantes principales en pratique L analyse en composantes principales en pratique Après avoir vu sa formalisation mathématique dans le module précédent, on s intéresse ici à l utilisation pratique de l ACP. 1 Objectifs L objectif de l

Plus en détail

Analyse en Composantes Principales

Analyse en Composantes Principales Analyse en Composantes Principales Anne B Dufour Octobre 2013 Anne B Dufour () Analyse en Composantes Principales Octobre 2013 1 / 36 Introduction Introduction Soit X un tableau contenant p variables mesurées

Plus en détail

Ch2 : Analyse en Composantes Principales (ACP)

Ch2 : Analyse en Composantes Principales (ACP) Ch2 : Analyse en Composantes Principales (ACP) A- Objectifs B- construction d un espace factoriel C- Les étapes d une ACP D- Interprétation E- Limites A- Objectifs On dispose d un tableau de données X.

Plus en détail

Jackknife et bootstrap comparés

Jackknife et bootstrap comparés Jackknife et bootstrap comparés Statistique linéaire θ(x 1,...,X n ) = c + n 1 n 1 α(x i) c constante, α fonction Exemples : X, 1 + n 1 Xi /n Jackknife et bootstrap comparés Statistique linéaire θ(x 1,...,X

Plus en détail

GOUTTE. Analyse Statistique des Données Cours 4. Master 2 EID. LUISS, Libera Università Internazionale degli Studi Sociali

GOUTTE. Analyse Statistique des Données Cours 4. Master 2 EID. LUISS, Libera Università Internazionale degli Studi Sociali LUISS, Libera Università Internazionale degli Studi Sociali Université Paris 13 Laboratoire Analyse, Géométrie et Applications UMR 7539 GOUTTE Analyse Statistique des Données Cours 4 Master 2 EID goutte@math.univ-paris13.fr

Plus en détail

PSY C3 Eléments de statistique

PSY C3 Eléments de statistique PSY C3 Eléments de statistique Responsables : Amandine Penel & Fabrice Guillaume Maîtres de conférence en Psychologie Cognitive penel@up.univ-mrs.fr guillaume@isc.cnrs.fr semaine du 4 Sept semaine du oct

Plus en détail

Chaîne d additions ATTENTION!

Chaîne d additions ATTENTION! Chaîne d additions Épreuve pratique d algorithmique et de programmation Concours commun des écoles normales supérieures Durée de l épreuve: 3 heures 30 minutes Juin 2012 ATTENTION! N oubliez en aucun cas

Plus en détail

Data Mining : la classification non supervisée

Data Mining : la classification non supervisée Data Mining : la classification non supervisée Clustering : une affaire de distance. Etude préliminaire. Valeurs discrètes. Soient les deux individus suivants correspondant à des séquences ADN : X = AGGGTGGC

Plus en détail

Statistiques et inférence topologique : de nouvelles méthodes pour l analyse des données

Statistiques et inférence topologique : de nouvelles méthodes pour l analyse des données Mathématiques en mouvement 2014 Statistiques et inférence topologique : de nouvelles méthodes pour l analyse des données Bertrand MICHEL (LSTA - Upmc & INRIA Saclay équipe GEOMETRICA ) Introduction Beaucoup

Plus en détail

Lois de probabilité. Anita Burgun

Lois de probabilité. Anita Burgun Lois de probabilité Anita Burgun Problème posé Le problème posé en statistique: On s intéresse à une population On extrait un échantillon On se demande quelle sera la composition de l échantillon (pourcentage

Plus en détail

ANALYSE de CAPACITÉ d'un PROCESSUS

ANALYSE de CAPACITÉ d'un PROCESSUS ANALYSE de CAPACITÉ d'un PROCESSUS ( aptitude d'un processus à satisfaire des exigences / spécifications) Définition Limites "naturelles" de variabilité Distinction entre 3 sortes de limites Étapes pour

Plus en détail

Cours 2 6 octobre. 2.1 Maximum de vraisemblance pour une loi Gaussienne multivariée

Cours 2 6 octobre. 2.1 Maximum de vraisemblance pour une loi Gaussienne multivariée Introduction aux modèles graphiques 2010/2011 Cours 2 6 octobre Enseignant: Francis Bach Scribe: Nicolas Cheifetz, Issam El Alaoui 2.1 Maximum de vraisemblance pour une loi Gaussienne multivariée Soit

Plus en détail

STA108 Enquêtes et sondages. Sondages àplusieurs degrés et par grappes

STA108 Enquêtes et sondages. Sondages àplusieurs degrés et par grappes STA108 Enquêtes et sondages Sondages àplusieurs degrés et par grappes Philippe Périé, novembre 2011 Sondages àplusieurs degrés et par grappes Introduction Sondages à plusieurs degrés Tirage des unités

Plus en détail

Traitement des données influentes dans le cas d un sondage à deux phases avec une application au traitement de la non-réponse

Traitement des données influentes dans le cas d un sondage à deux phases avec une application au traitement de la non-réponse Traitement des données influentes dans le cas d un sondage à deux phases avec une application au traitement de la non-réponse Jean-François Beaumont, Statistics Canada Cyril Favre Martinoz, Crest-Ensai

Plus en détail

Introduction au cours STA 102 Analyse des données : Méthodes explicatives

Introduction au cours STA 102 Analyse des données : Méthodes explicatives Analyse des données - Méthodes explicatives (STA102) Introduction au cours STA 102 Analyse des données : Méthodes explicatives Giorgio Russolillo giorgio.russolillo@cnam.fr Infos et support du cours Slide

Plus en détail

Partie I. Les données quantitatives

Partie I. Les données quantitatives Variables quantitatives : analyse en composantes principales Jean-Marc Lasgouttes https://whorocqinriafr/jean-marclasgouttes/ana-donnees/ Partie I Les données quantitatives Description de données quantitatives

Plus en détail

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I Roxane Duroux 1 Cadre de l étude Cette étude s inscrit dans le cadre de recherche de doses pour des essais cliniques

Plus en détail

PROBABILITES ET STATISTIQUE I&II

PROBABILITES ET STATISTIQUE I&II PROBABILITES ET STATISTIQUE I&II TABLE DES MATIERES CHAPITRE I - COMBINATOIRE ELEMENTAIRE I.1. Rappel des notations de la théorie des ensemble I.1.a. Ensembles et sous-ensembles I.1.b. Diagrammes (dits

Plus en détail

Eléments de statistique Introduction - Analyse de données exploratoire

Eléments de statistique Introduction - Analyse de données exploratoire Eléments de statistique Introduction - Louis Wehenkel Département d Electricité, Electronique et Informatique - Université de Liège B24/II.93 - L.Wehenkel@ulg.ac.be MATH0487-2 : 3BacIng, 3BacInf - 16/9/2014

Plus en détail

Méthodes Statistiques Appliquées à la Qualité et à la Gestion des Risques - Le Contrôle Statistique

Méthodes Statistiques Appliquées à la Qualité et à la Gestion des Risques - Le Contrôle Statistique Méthodes Statistiques Appliquées à la Qualité et à la Gestion des Risques - Le Contrôle Statistique Jean Gaudart Laboratoire d Enseignement et de Recherche sur le Traitement de l Information Médicale jean.gaudart@univmed.fr

Plus en détail

Principe de symétrisation pour la construction d un test adaptatif

Principe de symétrisation pour la construction d un test adaptatif Principe de symétrisation pour la construction d un test adaptatif Cécile Durot 1 & Yves Rozenholc 2 1 UFR SEGMI, Université Paris Ouest Nanterre La Défense, France, cecile.durot@gmail.com 2 Université

Plus en détail

UNIVERSITE PARIS 1 PANTHEON SORBONNE LICENCE DE SCIENCES ECONOMIQUES. STATISTIQUE APPLIQUEE F. Gardes / P. Sevestre. Fiche N 7.

UNIVERSITE PARIS 1 PANTHEON SORBONNE LICENCE DE SCIENCES ECONOMIQUES. STATISTIQUE APPLIQUEE F. Gardes / P. Sevestre. Fiche N 7. UNIVERSITE PARIS 1 PANTHEON SORBONNE LICENCE DE SCIENCES ECONOMIQUES STATISTIQUE APPLIQUEE F. Gardes / P. Sevestre Fiche N 7 (avec corrigé) L objet de ce TD est de vous initier à la démarche et à quelques

Plus en détail

VI. Tests non paramétriques sur un échantillon

VI. Tests non paramétriques sur un échantillon VI. Tests non paramétriques sur un échantillon Le modèle n est pas un modèle paramétrique «TESTS du CHI-DEUX» : VI.1. Test d ajustement à une loi donnée VI.. Test d indépendance de deux facteurs 96 Différentes

Plus en détail

L analyse Factorielle des correspondances. 1/ Préambule descriptif de l AFC

L analyse Factorielle des correspondances. 1/ Préambule descriptif de l AFC L analyse Factorielle des correspondances...2 1/ Préambule descriptif de l AFC...2 Exemples de types de données que l AFC peut aborder:...2 Quelques types de tableaux traités par l AFC...3 2/ Exercice

Plus en détail

Arbres binaires. Hélène Milhem. Institut de Mathématiques de Toulouse, INSA Toulouse, France IUP SID, 2011-2012

Arbres binaires. Hélène Milhem. Institut de Mathématiques de Toulouse, INSA Toulouse, France IUP SID, 2011-2012 Arbres binaires Hélène Milhem Institut de Mathématiques de Toulouse, INSA Toulouse, France IUP SID, 2011-2012 H. Milhem (IMT, INSA Toulouse) Arbres binaires IUP SID 2011-2012 1 / 35 PLAN Introduction Construction

Plus en détail

COMPORTEMENT ASYMPTOTIQUE D UNE FILE D ATTENTE À UN SERVEUR

COMPORTEMENT ASYMPTOTIQUE D UNE FILE D ATTENTE À UN SERVEUR Université Paris VII. Préparation à l Agrégation. (François Delarue) COMPORTEMENT ASYMPTOTIQUE D UNE FILE D ATTENTE À UN SERVEUR Ce texte vise à l étude du temps d attente d un client à la caisse d un

Plus en détail

Introduction à l analyse statistique et bioinformatique des puces à ADN

Introduction à l analyse statistique et bioinformatique des puces à ADN Formation INSERM 10 février 2004 Introduction à l analyse statistique et bioinformatique des puces à ADN Gaëlle Lelandais lelandais@biologie.ens.fr 1 Première Partie Analyse d une puce à ADN : Le recherche

Plus en détail

Analyse discriminante

Analyse discriminante Analyse discriminante Christine Decaestecker & Marco Saerens ULB & UCL LINF2275 1 Analyse Discriminante Particularités: 2 formes/utilisations complémentaires: méthode factorielle: description "géométrique"

Plus en détail

Université d Orléans - Maitrise Econométrie Econométrie des Variables Qualitatives

Université d Orléans - Maitrise Econométrie Econométrie des Variables Qualitatives Université d Orléans - Maitrise Econométrie Econométrie des Variables Qualitatives Examen Décembre 00. C. Hurlin Exercice 1 (15 points) : Politique de Dividendes On considère un problème de politique de

Plus en détail

SCI03 - Analyse de données expérimentales

SCI03 - Analyse de données expérimentales SCI03 - Analyse de données expérimentales Introduction à la statistique Thierry Denœux 1 1 Université de Technologie de Compiègne tél : 44 96 tdenoeux@hds.utc.fr Automne 2014 Qu est ce que la statistique?

Plus en détail

Quantification Scalaire et Prédictive

Quantification Scalaire et Prédictive Quantification Scalaire et Prédictive Marco Cagnazzo Département Traitement du Signal et des Images TELECOM ParisTech 7 Décembre 2012 M. Cagnazzo Quantification Scalaire et Prédictive 1/64 Plan Introduction

Plus en détail

Atelier d économétrie

Atelier d économétrie Atelier d économétrie Chapitre 4 : Le problème de la multicolinéarité : application sous SAS Vincent Bouvatier Université de Paris Ouest - Nanterre La Défense Bâtiment G, bureau 308A vbouvatier@u-paris10.fr

Plus en détail

Feuille d exercices 1

Feuille d exercices 1 Complexité Exercice 1 Démontrer que a) n 2 /2 O(n) b) 5n+3 = O(n) c) 30n+5 = O(n 2 ) d) 4n 3 +5n 2 +10 = O(n 3 ). Exercice 2 Donnez la complexité (en fonction de n) de l algorithme suivant. Vous donnerez

Plus en détail

Intérêt et limites des estimations sur petits domaines HID «Petits domaines», une opération inhabituelle :

Intérêt et limites des estimations sur petits domaines HID «Petits domaines», une opération inhabituelle : Intérêt et limites des estimations sur petits domaines HID «Petits domaines», une opération inhabituelle : a. Une opération de «production» b. Visant l ensemble des variables d une enquête c. Recherchant

Plus en détail

R i = a 0 +b 0 B i +ε i, R = Xβ +ε,

R i = a 0 +b 0 B i +ε i, R = Xβ +ε, Statistiques 2010-2011 TP sur le Modèle linéaire gaussien avec R 1 Les exercices Vous traiterez les exercices suivants avec le logiciel R. Exercice 1 Des photographies aériennes de champs d orge sont analysées

Plus en détail

Fonctions homographiques

Fonctions homographiques Fonctions homographiques On donne ci-dessous deux définitions des fonctions homographiques, et on montre que ces deux définitions sont équivalentes. On décrit la courbe représentative d une fonction homographique.

Plus en détail

Statistiques Descriptives à une dimension

Statistiques Descriptives à une dimension I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des

Plus en détail

Elma m l a ki i Haj a a j r a Alla a Tao a uf u i f q B ur u kkad a i i Sal a ma m n a e n e Be B n e a n b a d b en e b n i b i Il I ham

Elma m l a ki i Haj a a j r a Alla a Tao a uf u i f q B ur u kkad a i i Sal a ma m n a e n e Be B n e a n b a d b en e b n i b i Il I ham Exposé: la technique de simulation MONTE-CARLO Présenté par : Elmalki Hajar Bourkkadi Salmane Alla Taoufiq Benabdenbi Ilham Encadré par : Prof. Mohamed El Merouani Le plan Introduction Définition Approche

Plus en détail

Module Mixmod pour OpenTURNS

Module Mixmod pour OpenTURNS Module Mixmod pour OpenTURNS Régis LEBRUN EADS Innovation Works 23 septembre 2013 EADS IW 2013 (EADS Innovation Work) 23 septembre 2013 1 / 21 Outline Plan 1 OpenTURNS et propagation d incertitudes 2 Mixmod

Plus en détail

Rapport de Recherche. 1 Estimation fonctionnelle en temps continu. 1.1 Vitesses de convergence pour l estimateur à noyau. (D. Blanke - Mars 2008)

Rapport de Recherche. 1 Estimation fonctionnelle en temps continu. 1.1 Vitesses de convergence pour l estimateur à noyau. (D. Blanke - Mars 2008) Rapport de Recherche (D. Blanke - Mars 2008) L essentiel de mes activités de recherche porte sur l estimation fonctionnelle ou paramétrique pour des processus. L ensemble de ces travaux peut se diviser

Plus en détail

Contexte. Pour cela, elles doivent être très compliquées, c est-à-dire elles doivent être très différentes des fonctions simples,

Contexte. Pour cela, elles doivent être très compliquées, c est-à-dire elles doivent être très différentes des fonctions simples, Non-linéarité Contexte Pour permettre aux algorithmes de cryptographie d être sûrs, les fonctions booléennes qu ils utilisent ne doivent pas être inversées facilement. Pour cela, elles doivent être très

Plus en détail

Reconnaissance des formes

Reconnaissance des formes Reconnaissance des formes Discrimination A. Belaïd LORIA - Nancy Discrimination linéaire Notion d hyperplan Discrimination linéaire Principe Une forme x R d (vecteur forme) Rôle de la Trouver D : R d x

Plus en détail

Points fixes de fonctions à domaine fini

Points fixes de fonctions à domaine fini ÉCOLE POLYTECHNIQUE ÉCOLE NORMALE SUPÉRIEURE DE CACHAN ÉCOLE SUPÉRIEURE DE PHYSIQUE ET DE CHIMIE INDUSTRIELLES CONCOURS D ADMISSION 2013 FILIÈRE MP HORS SPÉCIALITÉ INFO FILIÈRE PC COMPOSITION D INFORMATIQUE

Plus en détail

THEORIE FINANCIERE Préparation à l'examen

THEORIE FINANCIERE Préparation à l'examen THEORIE FINANCIERE Préparation à l'examen N.B. : Il faut toujours justifier sa réponse. 1. Qu'est-ce que l'axiomatique de Von Neumann et Morgenstern? La représentation des préférences des investisseurs

Plus en détail

Mesure agnostique de la qualité des images.

Mesure agnostique de la qualité des images. Mesure agnostique de la qualité des images. Application en biométrie Christophe Charrier Université de Caen Basse-Normandie GREYC, UMR CNRS 6072 Caen, France 8 avril, 2013 C. Charrier NR-IQA 1 / 34 Sommaire

Plus en détail

Analyse de survie appliquée à la modélisation de la transmission des maladies infectieuses : mesurer l impact des interventions

Analyse de survie appliquée à la modélisation de la transmission des maladies infectieuses : mesurer l impact des interventions Analyse de survie appliquée à la modélisation de la transmission des maladies infectieuses : mesurer l impact des interventions Génia Babykina 1 & Simon Cauchemez 2 1 Université de Lille, Faculté Ingénierie

Plus en détail

INTRODUCTION AU DATA MINING

INTRODUCTION AU DATA MINING INTRODUCTION AU DATA MINING 6 séances de 3 heures mai-juin 2006 EPF - 4 ème année - Option Ingénierie d Affaires et de Projets Bertrand LIAUDET TP DE DATA MINING Le TP et le projet consisteront à mettre

Plus en détail

L ANALYSE DU RISQUE DE FAILLITE PAR LE BIAIS DES SYSTÈMES DE L INTELLIGENCE ARTIFICIELLE

L ANALYSE DU RISQUE DE FAILLITE PAR LE BIAIS DES SYSTÈMES DE L INTELLIGENCE ARTIFICIELLE L ANALYSE DU RISQUE DE FAILLITE PAR LE BIAIS DES SYSTÈMES DE L INTELLIGENCE ARTIFICIELLE Paul Pașcu, Assist Prof, PhD, Ștefan cel Mare University of Suceava Abstract: This article aims to present a number

Plus en détail