Cours 9! Introduction à la Reconnaissance des Formes (RdF)! Analyse de données, classification dʼimages!

Dimension: px
Commencer à balayer dès la page:

Download "Cours 9! Introduction à la Reconnaissance des Formes (RdF)! Analyse de données, classification dʼimages!"

Transcription

1 Bases du traitement des images BIMA Cours 9! Introduction à la Reconnaissance des Formes (RdF)! Analyse de données, classification dʼimages! Prof. Matthieu Cord! 1 Plan 1. Introduction, problématiques 2. visualisation des données 3. Analyse en Composantes Principales 4. Analyse Linéaire Discriminante 5. Outils d apprentissage 2

2 Classification 3 Visualisation : exemple de la base Iris! Méta-données : mesures en centimètres des variables suivantes : longueur et largeur du sépale, longueur et largeur du pétale pour trois espèces d'iris Iris setosa Iris versicolor Iris virginica 4

3 Données Iris X = 5,1 3,5 1,4 0,2 4,9 3 1,4 0,2 4,7 3,2 1,3 0,2 4,6 3,1 1,5 0,2 5 3,6 1,4 0,2 5,4 3,9 1,7 0,4 4,6 3,4 1,4 0,3 5 3,4 1,5 0,2 4,4 2,9 1,4 0,2 4,9 3,1 1,5 0,1 5,4 3,7 1,5 0,2 4,8 3,4 1,6 0,2 4,8 3 1,4 0,1 4,3 3 1,1 0,1 5,8 4 1,2 0,2 5,7 4,4 1,5 0,4 5,4 3,9 1,3 0,4 5,1 3,5 1,4 0,3 5,7 3,8 1,7 0,3 5,1 3,8 1,5 0,3 5,4 3,4 1,7 0,2 5,1 3,7 1,5 0,4 4,6 3,6 1 0,2 5,1 3,3 1,7 0,5 4,8 3,4 1,9 0, ,6 0,2 5 3,4 1,6 0,4 5,2 3,5 1,5 0,2 5,2 3,4 1,4 0,2 4,7 3,2 1,6 0,2 4,8 3,1 1,6 0,2 5,4 3,4 1,5 0,4 5,2 4,1 1,5 0,1 5,5 4,2 1,4 0,2 4,9 3,1 1,5 0,2 Y= 'setosa' 'setosa' 'setosa' 'setosa' 'setosa' 'setosa' 'setosa' 'setosa' 'setosa' 'virginica' 'virginica' 'virginica' 'virginica' 'virginica' 'virginica' 'virginica' 'virginica' Nombre de variables (d) = 4 Nombre de classes = 3 Nombre d individus (n) = 150 (50 / classe) 5 Visualisation des données! Statistique descriptive de base :! Moyenne, variance, médiane... 6

4 Visualisation des données Moyenne : 'S Length' 'S Width' 'P Length' 'P Width' 'setosa 5,006 3,428 1,462 0,246 'versicolor 5,936 2,77 4,26 1,326 'virginica 6,588 2,974 5,552 2,026 Ecart type : 'S Length' 'S Width' 'P Length' 'P Width' 'setosa 0,352 0,379 0,174 0,105 'versicolor 0,516 0,314 0,470 0,198 'virginica 0,636 0,322 0,552 0,275 7 Visualisation des données! Statistique descriptive de base :! Moyenne, variance, médiane...! Boxplot 8

5 Visualisation des données 9 Visualisation des données! Statistique descriptive simple :! Moyenne, variance, médiane...! Boxplot! Analyse croisée des variables 10

6 Visualisation des données 11 Visualisation des données! Statistique descriptive simple :! Moyenne, variance, médiane...! Boxplot! Analyse croisée des variables! Analyse en composantes principales! Indispensable quand le nombre de variables est très grand 12

7 Analyse en composantes principales! Analyse de la structure de la matrice variance-covariance c-à-d de la variabilité, dispersion des données. Au départ : d variables pour prendre en compte toute la variabilité des données Objectif de l ACP: décrire à l aide de q < d composantes un maximum de cette variabilité.! Ce qui permet :! une réduction des données à q nouveaux descripteurs! une visualisation des données à 2 ou 3 dimensions (si q = 2 ou 3)! une interprétation des données : liaisons inter-variables! Étape préliminaire souvent utilisée avant d autres analyses! 13 ACP : géométriquement C2 D2 C1 D1 Composantes : C 1,, C k,, C q C k = combinaison linéaire des variables d origine D 1,, D k,, D d p C =! a x k ik i i= 1 Coefficients a ik = < x i,c k > des x i à déterminer tq les C k : 2 à 2 non corrélées, de variance maximale, d importance décroissante. C k de variance maximale! les projections a ik sont les plus dispersées possible. 14

8 Projection de la variance Variance : Projection sur une droite de vecteur v : La variance des données projetées s écrit : 15 Projection de la variance 16

9 Maximisation de la variance projetée! La matrice! est la matrice variance-covariance! Cette matrice est symétrique définie positive! On recherche max de " v avec V unitaire :! On pose (fonction de Lagrange) :! Condition nécessaire :! D'où : 17 Maximisation de la variance projetée! On cherche (détail en TD) v tel que : où! est la matrice variance-covariance!! est symétrique définie positive donc décomposable dans une base de vecteurs propres orthonormée.! La variance vaut :! Solution ACP = projection des données sur le vecteur propre ayant la valeur propre! la plus élevée. 18

10 Résumé de l'acp 1. Centrage des données / variables X = 2. Calcul de la matrice de variance-covariance 3. Diagonalisation de! et classement par valeurs propres croissantes 4. Sélection des q premiers vecteurs propres C k (q # d) 5. Calcul des nouveaux vecteurs a i de var a ik = < x i,c k > de longueur q remplaçant les vecteurs x i 19 Résumé de l'acp! L ACP remplace les d variables de départ en q nouvelles composantes (q # d) C k! orthogonales 2 à 2 c-à-d cov(c k, C k ) = 0 (pour tout k $ k ),! de variances maximales telles que V(C1) % V(C2) % V(Cq)! Le nombre maximum de composantes principales q # d avec q < d dès que l une des variables d origine est une combinaison linéaire d autres! " mise en évidence de relations linéaires dans les données " les données occupent, en réalité, un sous-espace de dimensions réduites (q < d ) C'est à dire que le nombre maximum de composantes principales = dimension intrinsèque des données 20

11 Choix de q! q << d réduction de la dimension des données, obtention de données non corrélées! objectif : garder un maximum d information des données initiales ce qui correspond au % de variance expliquée! Variance conservée = q! Géométriquement : revient à projeter les données dans un sous-espace de dimension q, centré sur g, reprenant les q premiers axes principaux d allongement du nuage 21 Exemple d une base de visages : méthode EigenFace 25 images Image moyenne M. Turk and A. Pentland (1991). "Face recognition using eigenfaces". Proc. IEEE Conference on Computer Vision and Pattern Recognition:

12 25 premiers vecteurs propres (EigenFace) 23 EigenFace Réduction de la taille des vecteurs de la base Recherche d images similaires de visages dans la base plus rapide Dédiée recherche de visages si entrainée sur base de visages! A développer et tester en TD et TME 24

13 Conclusion sur l ACP! Méthode d analyse de données qui permet :! une réduction des données à q nouveaux descripteurs! une visualisation des données à 2 ou 3 dimensions! une interprétation des données : liaisons inter-variables! Étape intermédiaire souvent utilisée avant d autres analyses!! L ACP n est pas conçue pour prendre en compte la notion de classe! Exemple :! => Classification! LDA, SVM 26 Analyse Linéaire Discriminante (ALD ou LDA)! Objectif: mettre en évidence des différences entre les classes c- à-d entre les observations appartenant à des classes différentes! Description des liaisons entre la variable "classe" et les variables quantitatives: les q classes diffèrent-elles sur l'ensemble des variables numériques?! Méthode proche de l ACP : transformation linéaire des variables (changement de repère) mais en prenant en compte les classes des individus 27

14 Méthode! Déterminer des facteurs, combinaisons linéaires des variables descriptives d origine, qui prennent les valeurs les + proches possible pour des éléments de la même classe, et les + éloignées possible entre éléments de classes différentes. (= facteurs discriminants) 28 Méthode! Déterminer des facteurs, combinaisons linéaires des variables descriptives d origine, qui prennent des valeurs les + proches possible pour des éléments de la même classe, et les + éloignées possible entre éléments de classes différentes. (= facteurs discriminants) ACP 1 29

15 Méthode! Déterminer des facteurs, combinaisons linéaires des variables descriptives d origine, qui prennent des valeurs les + proches possible pour des éléments de la même classe, et les + éloignées possible entre éléments de classes différentes. (= facteurs discriminants) ALD 1 ACP 1 La projection des données sur le premier axe ALD a : Une variance intra-classe minimale Une variance inter-classe maximale 30 Quelques notations Données : Classes : X = { x1,, xn}, xi! Y = { y,, y }, y!" 1!" n d Centre de gravité = g 31

16 Décomposition de la variance totale 32 Décomposition de la variance totale 33

17 Projection de la variance 34 Optimisation! Donc! Axe correspondant à la séparation max entre les classes : axe dans le nuage de points (passant par l'origine) tel que les projections des points sur cet axe aient une variance inter-classe (variance des moyennes de classe) maximale. 35

18 Optimisation! Condition nécessaire :! D où :! Solution LDA = projection des données sur le vecteur propre de! 1 B ayant la valeur propre! la plus élevée. 36 Résumé de l ALD 1. Centrage des données / variables X = 2. Calcul de la matrice de variance-covariance 3. Calcul de la matrice de variance inter-classe 4. Diagonalisation de! 1 B et classement par valeurs propres croissantes 37

19 Classification par ALD! Comment affecter une classe à une nouvelle donnée?! Les facteurs discriminants donnent la meilleure représentation de la séparation des q centroïdes de classe (dans un espace orthonormé). => pour un individu x projeté dans l'espace des facteurs: attribuer la classe dont le centroïde est le plus proche (au sens de la distance euclidienne): => surfaces de séparation linéaires = hyperplans médians entre les centroïdes: 39 Classification sur IRIS par ALD 40

20 D autres méthodes d apprentissage! De nombreuses autres approches permettent de prendre en considérations ces cas «difficiles» :! Analyse discriminante quadratique! Mélange de modèles probabilistes (Gaussiennes)! Boosting! SVM! Conclusion :! ALD reste une méthode à la fois simple et rapide pour visualiser et classifier des données bien séparables. 42 SVM séparateur linéaire SVM (Séparateur à Vaste Marge/Support Vector Machine) est une technique de discrimination qui consiste à séparer des ensembles de points (ou classes) par un hyperplan maximisant la marge entre ces classes $ 1 2! min w # 2!" ' i yi ( w. x i + w0 ) & 1 % 0 Marge maximale Hyperplan valide w D(x) > 1 h( u) = sign( " = # i yi xi! u + n s i 1 b) Vecteurs de support 1 w Hyperplan D(x) = +1 D(x) < -1 optimal D(x) = -1 D(x) = 0!"#"$% 43

21 Compléments sur l apprentissage supervisé Données : Classes : X = { x,, x }, x!! Y = { y,, y }, y!" 1 1 n n i d Reconnaissance de forme : f d :!! " x! f ( x) Risque : n 1 R( f ) = " L( f ( xi ), yi ) + c! ( f ) n i= 1 Risque empirique Régularisation 44 Erreur d apprentissage! Lors d un apprentissage, il faut évaluer la performance du modèle f pour! Comparer différents modèles! Sélectionner les variables pertinentes! Avoir une idée de la probabilité de bien classer une nouvelle donnée (erreur de généralisation)! A bannir : entrainer et évaluer l'algo d'apprentissage sur le même ensemble de données! Erreur biaisée, car algo spécialisé sur ensemble d'entraînement 45

22 Exemple de sur-apprentissage Comment choisir le bon modèle? Première idée : séparation des données disponibles en 2 ensembles : Entraînement / Test Calcul de l'erreur de généralisation avec l'ensemble de test 46 Happy Curve Erreur Test Train f optimal f 1/Régularisation 47

23 Validation croisée (cross-validation)! Que faire si peu de données d apprentissage? " Validation croisée! Diviser les données disponibles en k groupes TEST TRAIN! Pour chaque groupe : apprentissage sur les autres et test sur lui! Erreur de généralisation = moyenne des erreurs de test 48

Reconnaissance d'objets routiers - Théorie

Reconnaissance d'objets routiers - Théorie Reconnaissance d'objets routiers - Théorie Perception pour la conduite automatisée A07 : Interaction Véhicule Environnement Aurélien Cord Aurelien.Cord@lcpc.fr 1 INTRODUCTION 2 1 Reconnaissance Définition

Plus en détail

Traitement de l image et du signal Partie TI

Traitement de l image et du signal Partie TI Traitement de l image et du signal Partie TI Emanuel Aldea http://hebergement.u-psud.fr/emi/453 Master Electronique, énergie électrique, automatique 1ère année Plan du cours Définition

Plus en détail

Analyse en composantes principales

Analyse en composantes principales Analyse en composantes principales Gilles Gasso, Stéphane Canu INSA Rouen - Département ASI Laboratoire LITIS 1 17 septembre 01 1. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles

Plus en détail

Introduction aux méthodes statistiques

Introduction aux méthodes statistiques 26 Février 2008 Christian CAPARIN christian.caparin@wanadoo.fr >>Introduction BUT DE LA PREENTATION Faire une présentation non théorique des méthodes statistiques utilisées en pratique Partir des problèmes

Plus en détail

L analyse en composantes principales

L analyse en composantes principales L analyse en composantes principales 1 La méthode 1 Les données, les objectifs de la méthode L Analyse en Composantes Principales (ACP) est la méthode adaptée à l exploration synthétique de l information

Plus en détail

Plan. Composantes d un système. Réduction de dimension. Sélection de caractéristiques. Apprentissage

Plan. Composantes d un système. Réduction de dimension. Sélection de caractéristiques. Apprentissage Analyse et codage des signaux de reconnaissance des formes Méthodes statistiques pour la réduction de dimension Techniques d apprentissage Mohamed CHETOUANI Mohamed.Chetouani@upmc.fr 2 Composantes d un

Plus en détail

Cours 4 : Traitement de données quantitatives multivariées - Introduction au partitionnement de données. Guénaël CABANES et Basarab MATEI

Cours 4 : Traitement de données quantitatives multivariées - Introduction au partitionnement de données. Guénaël CABANES et Basarab MATEI Cours 4 : Traitement de données quantitatives multivariées - Introduction au partitionnement de données Guénaël CABANES et Basarab MATEI Généralités Exemple Introduction Guénaël CABANES et Basarab MATEI

Plus en détail

Cours 9 Introduction à la Reconnaissance des Formes (RdF) Analyse de données, classification d images

Cours 9 Introduction à la Reconnaissance des Formes (RdF) Analyse de données, classification d images Bases du traitement des images BIMA Cours 9 Introduction à la Reconnaissance des Formes (RdF) Analyse de données, classification d images Prof. Matthieu Cord Plan 1. Introduction, problématiques 2. visualisation

Plus en détail

Laboratoire 2 Extraction des caractéristiques

Laboratoire 2 Extraction des caractéristiques Laboratoire 2 Extraction des caractéristiques L objectif de l extraction et de la sélection de caractéristiques est d identifier les caractéristiques importantes pour la discrimination entre classes. Aprés

Plus en détail

21/10/2011. Introduction. Apprentissage : Rappel. 1. SVM principe de fonctionnement général

21/10/2011. Introduction. Apprentissage : Rappel. 1. SVM principe de fonctionnement général SVM : Machines a Vecteurs de Support ou Separateurs a Vastes Marges 1. SVM principe de fonctionnement general 2. Fondements mathématiques 3. Cas non linéairement séparable Introduction SVM est une méthode

Plus en détail

Analyse en composantes principales

Analyse en composantes principales Analyse en composantes principales Alain RAKOTOMAMONJY - Gilles GASSO INSA Rouen -Département ASI Laboratoire LITIS 11 Février 2009 A. RAKOTOMAMONJY G. GASSO (INSA ASI) Analyse en composantes principales

Plus en détail

Support Vecteurs Machine

Support Vecteurs Machine Support Vecteurs Machine Hélène Milhem Institut de Mathématiques de Toulouse, INSA Toulouse, France IUP SID, 2011-2012 H. Milhem (IMT, INSA Toulouse) Support Vecteurs Machine IUP SID 2011-2012 1 / 20 Plan

Plus en détail

L Analyse en Composantes Principales

L Analyse en Composantes Principales L Analyse en Composantes Principales Table des matières 1 Introduction 1 2 Notations 2 3 Définitions 2 4 Projections sur un sous-espace 3 5 Axes principaux 4 6 Facteurs principaux 4 7 Composantes principales

Plus en détail

Expériences sur des données avec une boîte à outils (WEKA)

Expériences sur des données avec une boîte à outils (WEKA) Expériences sur des données avec une boîte à outils (WEKA) Projet DATA MANING Réalisé par :IKHIBI Fatima Ezzahra Soutenu par : Mr Antoine Cornuéjols Mr Yves Lechevallier Mr Edwin Diday Master II ISI Année

Plus en détail

Imagerie couleur Partie 2 : Réduction de l ensemble d attributs pour la classification d images

Imagerie couleur Partie 2 : Réduction de l ensemble d attributs pour la classification d images Imagerie couleur Partie 2 : Réduction de l ensemble d attributs pour la classification d images Alice POREBSKI Introduction 4,5h de cours Intérêt de réduire le nombre d attributs Les méthodes d extraction

Plus en détail

Analyse en Composantes Principales

Analyse en Composantes Principales Analyse en Composantes Principales Pr Roch Giorgi roch.giorgi@univ-amu.fr SESSTIM, Faculté de Médecine, Aix-Marseille Université, Marseille, France http://sesstim.univ-amu.fr/ Introduction (1) Étudier

Plus en détail

Chapitre 3 : Analyse en composante principale (ACP) () 1 / 59

Chapitre 3 : Analyse en composante principale (ACP) () 1 / 59 Chapitre 3 : Analyse en composante principale (ACP) () 1 / 59 I. Préambule L ACP propose, à partir d un tableau de données relatives à p variables quantitatives portant sur n unités (individus), des représentations

Plus en détail

L analyse multi variée

L analyse multi variée L analyse multi variée Ensemble de méthodes destinées à synthétiser l information - Méthodes descriptives Elles visent à structurer et à simplifier les données issues de plusieurs variables (ACP, AFC)

Plus en détail

Segmentation et Reconnaissance de Forme

Segmentation et Reconnaissance de Forme Analyse et Synthèse d'images James L. Crowley DESS Génie Informatique 1999/00 Séance 7 : 15 fevrier1900 Plan de la Séance : Segmentation et Reconnaissance de Forme Méthodes Statistique de la Reconnaissance

Plus en détail

Fondements de l Apprentissage Automatique

Fondements de l Apprentissage Automatique Fondements de l Apprentissage Automatique Réduction de la dimensionalité hadrien.glaude@univ-lille1.fr Université Lille 1 - CRIStAL (SequeL) - Thales Systèmes Aéroportés Master 1 Info 1/28 1 2 3 4 5 Réduction

Plus en détail

Statistiques COURS 2. Salle 125. L3 Géographie UE Méthodologie. Intervenants :

Statistiques COURS 2. Salle 125. L3 Géographie UE Méthodologie. Intervenants : L3 Géographie UE Méthodologie Statistiques COURS 2 Salle 125 Intervenants : Nadège Martiny & Julien Crétat UFR Sciences Humaines (Département de Géographie) UMR Centre de Recherches de Climatologie (CRC)

Plus en détail

Analyse de données. Version de Marc Dinh. Hervé Bertrand

Analyse de données. Version de Marc Dinh. Hervé Bertrand Analyse de données 2012 Version de Marc Dinh 11 février 2012 Hervé Bertrand 1 Sommaire 1 Objectif de l ADD 3 2 Type de données 4 3 Calcul matriciel et ADD 4 4 Approche géométrique : ellipsoïde d inertie

Plus en détail

L Analyse en Composantes Principales. A. Morineau

L Analyse en Composantes Principales. A. Morineau L Analyse en Composantes Principales A. Morineau - 2005 1 L ACP, qu est ce? L ACP, qu est ce? Principe géométrique de l ACP X(n,p) tableau de données A. Morineau - 2005 4 Principe géométrique de l ACP

Plus en détail

Chapitre 9. Analyse de la variance

Chapitre 9. Analyse de la variance 1 Chapitre 9. Analyse de la variance Dans ce chapitre nous étudions comment l analyse de la variance de Y permet de tester l égalité des moyennes conditionnelles de cette variable numérique dans les sous-populations

Plus en détail

Réduction de Dimension pour la Reconnaissance de Formes p.1/17

Réduction de Dimension pour la Reconnaissance de Formes p.1/17 Réduction de Dimension pour la Reconnaissance de Formes Charles BOUVEYRON LMC-IMAG & INRIA Rhône-Alpes Réduction de Dimension pour la Reconnaissance de Formes p.1/17 Plan de l exposé Cadre du travail :

Plus en détail

en sciences humaines, cette technique est utilisée pour cerner les résultats des enquêtes d opinion;

en sciences humaines, cette technique est utilisée pour cerner les résultats des enquêtes d opinion; Introduction L analyse des données est utilisée dès lors que les données se présentent en trop grand nombre pour être appréhendées par l esprit humain. De nombreux domaines ont recours à l analyse de données

Plus en détail

Séance 1: Analyse en composantes principales

Séance 1: Analyse en composantes principales Séance 1: Analyse en composantes principales Révisions Laboratoire de Statistique et Probabilités UMR 5583 CNRS-UPS www.lsp.ups-tlse.fr/gadat Première partie I Analyse en Composantes Principales Motivations

Plus en détail

Chapitre 9 ANALYSE EN COMPOSANTES PRINCIPALES

Chapitre 9 ANALYSE EN COMPOSANTES PRINCIPALES Chapitre 9 ANALYSE EN COMPOSANTES PRINCIPALES On consultera aussi le document «Introduction numérique à l analyse en composantes principales». 1 NATURE DES DONNÉES ET OBJECTIFS. 1.1 Nature des données.

Plus en détail

scilab à l École nationale des ponts et chaussées http://cermics.enpc.fr/scilab Analyse en composantes principales et apprentissage 6 juin 2007 (dernière date de mise à jour) Table des matières 1 Rappels

Plus en détail

Table des matières Statistique Descriptive pour Une Variable Étude Conjointe de Deux Variables Corrélation linéaire

Table des matières Statistique Descriptive pour Une Variable Étude Conjointe de Deux Variables Corrélation linéaire Statistiques 1 Table des matières 1 Statistique Descriptive pour Une Variable 3 1.1 Présentation...................................... 3 1.1.1 Étapes d une statistique............................ 3 1.1.

Plus en détail

Apprentissage non-supervisé. Réduction de dimensionalité. Modèles à variables latentes continues.

Apprentissage non-supervisé. Réduction de dimensionalité. Modèles à variables latentes continues. Département d'informatique et de recherche opérationnelle IFT3395/6390 Fondements de l apprentissage machine Apprentissage non-supervisé Réduction de dimensionalité. Modèles à variables latentes continues.

Plus en détail

CHAPITRE 9 ANALYSE CANONIQUE. Master 2ème Année Page 1

CHAPITRE 9 ANALYSE CANONIQUE. Master 2ème Année Page 1 CHAPITRE 9 ANALYSE CANONIQUE Master 2ème Année Page 1 Plan 1. Les données 2. Le principe de l'analyse canonique 3. Les représentations graphiques 4. Une application de l'ac 5. Les cas particuliers de l'ac

Plus en détail

Reconnaissance des formes

Reconnaissance des formes Reconnaissance des formes - Chapitre 2 - Analyse en composantes principales Objectifs Contexte : Chaque individu x i du tableau X est considéré comme un point d un espace vectoriel E de dimension p. L

Plus en détail

Analyse en composantes principales en météorologie & en mécanique des fluides

Analyse en composantes principales en météorologie & en mécanique des fluides Analyse en composantes principales en météorologie & en mécanique des fluides O.Pannekoucke Météo-France/ CNRS, CNRM/GAME, URA 357 ISAE Séminaire CPGE 9- Mai 0, oulouse Problématique : pourquoi chercher

Plus en détail

Sommaire. Préface Introduction... 5

Sommaire. Préface Introduction... 5 Sommaire Préface................................. 1 Introduction.............................. 5 I Matrices et Opérations Matricielles : Notions de Base..... 9 I.1 Note historique.........................

Plus en détail

Introduction. Analyse en composantes la matrice principalesdes. Premiers calculs. Exemple

Introduction. Analyse en composantes la matrice principalesdes. Premiers calculs. Exemple Introduction 19 janvier 2015 Dans la plupart des applications on observe un nombre p très grand de variables; L étude univariée et bivariée est une phase indispensable mais tout à fait insuffisante; Prendre

Plus en détail

Classification et reconnaissance de formes

Classification et reconnaissance de formes Classification et reconnaissance de formes Théorie Bayesienne de la décision Gilles Gasso 8 novembre 216 Gilles Gasso Classification et reconnaissance de formes 1 / 3 Plan 1 Introduction 2 Rappels : notions

Plus en détail

Statistiques descriptives

Statistiques descriptives En tant que science, les statistiques ne se limitent pas à une description empirique des propriétés numériques d un objet. Elles jouent un rôle bien plus important en proposant, à partir des données, des

Plus en détail

Plan du cours. Séries bivariées

Plan du cours. Séries bivariées Plan du cours 1. Introduction 2. Statistique descriptive séries univariées 3. Calcul des probabilités 4. Variables aléatoires et lois de probabilité 5. Arbres de décision 6. Statistique descriptive séries

Plus en détail

Analyse discriminante

Analyse discriminante Analyse discriminante Christine Decaestecker & Marco Saerens ULB & UCL LINF2275 1 Analyse Discriminante Particularités: 2 formes/utilisations complémentaires: méthode factorielle: description "géométrique"

Plus en détail

SY09 Rapport TP2 : Analyse factorielle d un tableau de distances, classification automatique

SY09 Rapport TP2 : Analyse factorielle d un tableau de distances, classification automatique UNIVERSITÉ DE TECHNOLOGIE DE COMPIÈGNE SY09 Rapport TP2 : Analyse factorielle d un tableau de distances, classification automatique CUNI Frédéric 21 avril 2015 Objectifs du TP : Le but de ce TP est l application

Plus en détail

C- Liaison entre deux variables statistiques

C- Liaison entre deux variables statistiques C- Liaison entre deux variables statistiques 1- liaison entre 2 variables quantitatives 2- liaison entre 1 variable quantitative et 1 variables qualitative 3- liaison entre 2 variables qualitatives 4-

Plus en détail

Analyse de données. Données bidimensionnelles. Jamal Atif Université Paris-Dauphine, Licence MIDO

Analyse de données. Données bidimensionnelles. Jamal Atif Université Paris-Dauphine, Licence MIDO Analyse de données Données bidimensionnelles Jamal Atif jamal.atif@dauphine.fr Université Paris-Dauphine, Licence MIDO 2014-2015 1 / 27 Jamal Atif Analyse de données Cet épisode Lien entre deux variables

Plus en détail

Les modèles statistiques de forme

Les modèles statistiques de forme Buts Les modèles statistiques de forme Vincent Luboz vincent.luboz@imag.fr Equipe GMCAO (http://www-timc.imag.fr/gmcao) Connaitre les différents modèles statistiques de forme. Comprendre la façon de les

Plus en détail

Introduction au traitement d images

Introduction au traitement d images Introduction au traitement d images Reconnaissance des formes Nicholas Journet 12 janvier 2011 Plan Segmentation seuillage s contours Codage contours Introduction à la reconnaissance des formes Calcul

Plus en détail

Méthodes de réduction de dimension

Méthodes de réduction de dimension 5MS04 - Analyse des données Master 2 spécialité Statistiques Université Pierre et Marie Curie Méthodes de réduction de dimension Bertrand MICHEL bertrand.michel@ec-nantes.fr Pourquoi réduire la dimension?

Plus en détail

Vocabulaire. Séries statistiques associées à un caractère discret. Classement des données. Effectifs cumulés. Représentation graphique

Vocabulaire. Séries statistiques associées à un caractère discret. Classement des données. Effectifs cumulés. Représentation graphique I Vocabulaire Population : c est l ensemble étudié. Individu : c est un élément de la population. Effectif total : c est le nombre total d individus. Caractère : c est la propriété étudiée. On distingue

Plus en détail

Méthodes d Apprentissage Avancées, SVM

Méthodes d Apprentissage Avancées, SVM Méthodes d Apprentissage Avancées, SVM JÉRÉMIE MARY équipe TAO LRI 30 janvier 2006 Plan 1 Introduction 2 Séparation linéaire 3 Optimisation Lagrangienne 4 Kernel powered 5 SVM regression 6 Pour finir Apprentissage

Plus en détail

Apprentissage Statistique

Apprentissage Statistique Université Paris 13 Institut Galilée M2 EID Année universitaire 2016 2017 Apprentissage Statistique 1. Ce document contient une liste des exercices et des problèmes qui avec les exercices du TD vous permettra

Plus en détail

Objectifs Reconnaissance de cibles > Application à la base de données MSTAR Utilisation de la méthode SVM (Support Vector Machines) > Définition d un

Objectifs Reconnaissance de cibles > Application à la base de données MSTAR Utilisation de la méthode SVM (Support Vector Machines) > Définition d un Application des SVM à la reconnaissance d objets dans des images SAR C. Tison, N. Pourthié, D. Deleflie Celine.tison@cnes.fr CNES DCT/SI/AR ORFEO - Journée Méthodologie 17 janvier 2007 1 Objectifs Reconnaissance

Plus en détail

Mathématiques Statistiques

Mathématiques Statistiques IUT de Mesures Physiques de Caen DUT 2ème année Mathématiques Statistiques Travaux Dirigés Feuille Sujet Statistiques descriptives : données univariées, échantillonnage, histogramme, diagramme de dispersion.

Plus en détail

IFT3390/6390 Fondements de l apprentissage machine

IFT3390/6390 Fondements de l apprentissage machine Département d'informatique et de recherche opérationnelle IFT3390/6390 Fondements de l apprentissage machine http://www.iro.umontreal.ca/~vincentp/ift3390 Sixième cours: Distribution Gaussienne multivariée.

Plus en détail

Au programme aujourd hui

Au programme aujourd hui Département d'informatique et de recherche opérationnelle IFT339/639 Fondements de l apprentissage machine http://www.iro.umontreal.ca/~vincentp/ift339 Sixième cours: Distribution Gaussienne multivariée.

Plus en détail

Cours 5. Les mesures de dispersion

Cours 5. Les mesures de dispersion Cours 5 Les mesures de dispersion Retour sur cours 4 Les mesures de dispersion Étendue Variance et écart-type Coefficient de variation Mesures de dispersion La fonction «compute» ou «calculer» 2 Tableaux

Plus en détail

Statistiques COURS 5. Salle 125. L3 Géographie UE Méthodologie. Intervenants : Année

Statistiques COURS 5. Salle 125. L3 Géographie UE Méthodologie. Intervenants : Année L3 Géographie UE Méthodologie Statistiques COURS 5 Salle 125 Intervenants : Nadège Martiny & Julien Crétat Année 2010-2011 2011 UFR Sciences Humaines (Département de Géographie) UMR Centre de Recherches

Plus en détail

Examen Intra IFT3390/6390

Examen Intra IFT3390/6390 Estimation de densité de probabilité paramétrique Gaussienne (25 pts) 1 Examen Intra IFT3390/6390 Mardi 20 février 2007 Durée: 1h50 Professeur: Pascal Vincent Prénom: Nom: Code permanent: IFT 3390 ou 6390?

Plus en détail

Statistiques en Scilab

Statistiques en Scilab Statistiques en Scilab Table des matières 1 Vocabulaire des statistiques 2 2 Statistique descriptive univariée 2 2.1 Modalités............................................... 2 2.2 Dénombrement............................................

Plus en détail

ANALYSE DE LA VARIANCE A UN FACTEUR

ANALYSE DE LA VARIANCE A UN FACTEUR ANALYSE DE LA VARIANCE A UN FACTEUR Quelques idées qui m ont parues intéressantes et exploitables pour l initiation à la statistique Roland Chiavassa 1 L analyse de la variance à un facteur 1.1 Introduction

Plus en détail

Mini-Glossaire de Statistique Descriptive - Jean VAILLANT

Mini-Glossaire de Statistique Descriptive - Jean VAILLANT Mini-Glossaire de Statistique Descriptive - Jean VAILLANT Amplitude d une classe (ou d un intervalle) : C est la longueur de l intervalle. L amplitude de la classe ]a i 1 ; a i ] est a i a i 1. Exemple

Plus en détail

Fouille de Données et Media Sociaux Cours 5 Projections non -linéaires UPMC - LIP6

Fouille de Données et Media Sociaux Cours 5 Projections non -linéaires UPMC - LIP6 Ludovic DenoyerMultiples citations de F. Rossi () FDMS 12 octobre 2015 1 / 1 Fouille de Données et Media Sociaux Cours 5 Projections non -linéaires UPMC - LIP6 Ludovic Denoyer Multiples citations de F.

Plus en détail

Fouille de Données et Media Sociaux Cours 5 Projections non -linéaires UPMC - LIP6

Fouille de Données et Media Sociaux Cours 5 Projections non -linéaires UPMC - LIP6 Ludovic DenoyerMultiples citations de F. Rossi () FDMS 10 octobre 2016 1 / 33 Fouille de Données et Media Sociaux Cours 5 Projections non -linéaires UPMC - LIP6 Ludovic Denoyer Multiples citations de F.

Plus en détail

L analyse en Composantes principales

L analyse en Composantes principales L analyse en Composantes principales Stéphane Canu stephane.canu@litislab.eu M8 - Principes du traitement de l information March 13, 2017 Plan 1 Nature des variables statistiques 2 Description mono variable

Plus en détail

I. Les indicateurs numériques

I. Les indicateurs numériques LES STATISTIQUES DESCRIPTIVES La description statistique consiste en un résumé numérique d une distribution statistique par des indicateurs numériques ou paramètres caractéristiques. Elle représente une

Plus en détail

Séries statistiques. Série statistique simple = ensemble de données relatives à une variable mesurée sur un échantillon ou une population d'éléments

Séries statistiques. Série statistique simple = ensemble de données relatives à une variable mesurée sur un échantillon ou une population d'éléments Statistiques IUP 2 Objet du cours Au cours du cours de Statistiques de 1e années, vous avez appris à maîtriser les deux volets du travail interprétatif du statisticien : Statistique descriptive Statistique

Plus en détail

Annexe précisant l article 7. Concours Ensai, spécialité «économie et gestion». Programme de l oral de mathématiques spécifique Ensai

Annexe précisant l article 7. Concours Ensai, spécialité «économie et gestion». Programme de l oral de mathématiques spécifique Ensai Annexe précisant l article 7 Concours Ensai, spécialité «économie et gestion». Programme de l oral de mathématiques spécifique Ensai 1. Nombres complexes Le plan complexe : affixe d un point ; parties

Plus en détail

STATISTIQUES DESCRIPTIVES

STATISTIQUES DESCRIPTIVES STATISTIQUES DESCRIPTIVES Formation Fondamentale Sommaire 1 Généralités 2 Statistiques descriptives à une variable Résumé quantitative Graphique Quantitative Résumé qualitative 3 Statistiques descriptives

Plus en détail

MÉTHODES DE CLASSIFICATIONS. UAG IESG STS LS6 BBB Biomathématiques Bruno Hérault 2012 Semestre 2

MÉTHODES DE CLASSIFICATIONS. UAG IESG STS LS6 BBB Biomathématiques Bruno Hérault 2012 Semestre 2 MÉTHODES DE CLASSIFICATIONS UAG IESG STS LS6 BBB Biomathématiques Bruno Hérault 2012 Semestre 2 Objectifs Partitionnement (Soit un ensemble X quelconque. Un ensemble P de sous-ensembles de X est une partition

Plus en détail

Chapitre VI : notions de statistiques appliquées aux mesures

Chapitre VI : notions de statistiques appliquées aux mesures Chapitre VI : notions de statistiques appliquées au mesures "Le mot statistique désigne à la fois un ensemble de données d'observations et l'activité qui consiste dans leur recueil, leur traitement et

Plus en détail

D. Chessel & A.B. Dufour - Biométrie et Biologie Evolutive - Université Lyon1. Fiche de Biostatistique. Exercices. D. Chessel & A.B. Dufour.

D. Chessel & A.B. Dufour - Biométrie et Biologie Evolutive - Université Lyon1. Fiche de Biostatistique. Exercices. D. Chessel & A.B. Dufour. Fiche de Biostatistique Exercices D. Chessel & A.B. Dufour Résumé La fiche donne des énoncés d'exercices d'algèbre et d'analyse des données. Quand une phrase commence par? décider si elle est vraie ou

Plus en détail

Introduction à l Analyse Des Données (ADD) B- Exemples C- Les données

Introduction à l Analyse Des Données (ADD) B- Exemples C- Les données Introduction à l Analyse Des Données (ADD) A- Les méthodes A- Les méthodes B- Exemples C- Les données A- Les méthodes Lors de toute étude statistique, il est nécessaire de décrire et explorer les données

Plus en détail

Éléments de statistique descriptive.

Éléments de statistique descriptive. Lycée Pierre de Fermat 2014-2015 BCPST 12 Cours de Statistique. Éléments de statistique descriptive. Une étude statistique porte sur une série de données (appelée série statistique). Ces données portent

Plus en détail

Analyse en composantes principales (ACP)

Analyse en composantes principales (ACP) Analyse en composantes principales (ACP) François Husson Laboratoire de mathématiques appliquées - Agrocampus Rennes husson@agrocampus-ouest.fr 1 / 35 Analyse en Composantes Principales (ACP) 1 Données

Plus en détail

Notions sur l analyse discriminante

Notions sur l analyse discriminante Notions sur l analyse discriminante Laurent Carraro, Anca Badea ENSM.SE Axe Méthodes Statistiques et Applications novembre 2007 1 Table des matières 1 Exemple : les iris de Fisher 3 1.1 Les problèmes posés.................................

Plus en détail

Notes cours : Analyse de données Statistique descriptive Enseignant : M. KECHICHED Rabah

Notes cours : Analyse de données Statistique descriptive Enseignant : M. KECHICHED Rabah Notes cours : Analyse de données Statistique descriptive Enseignant : M. KECHICHED Rabah Département : Sciences de la Terre et de l Univers Université 1. ANALYSE DE DONNEES STATISTIQUES 1. 1. Analyse monovariée

Plus en détail

(2ÈME ÉDITION) Antoine Cornuéjols et Laurent Miclet. Editions Eyrolles, 2009 Version du 9 décembre 2009

(2ÈME ÉDITION) Antoine Cornuéjols et Laurent Miclet. Editions Eyrolles, 2009 Version du 9 décembre 2009 i L APPRENTISSAGE ARTIFICIEL CONCEPTS ET ALGORITHMES. (2ÈME ÉDITION) Antoine Cornuéjols et Laurent Miclet Editions Eyrolles, 2009 Version du 9 décembre 2009 ii Table des matières Table des matières iii

Plus en détail

Statistiques. 1.2 Présentation des données et représentations graphiques

Statistiques. 1.2 Présentation des données et représentations graphiques Statistiques 1 Séries statistiques à une variable 1.1 Vocabulaire Une population est un ensemble d individus sur lesquels on étudie un caractère ou une variable, qui prend différentes valeurs ou modalités.

Plus en détail

Statistique et analyse des données

Statistique et analyse des données Statistique et analyse des données PABLO GONZALEZ VICENTE Recherche de la dimension de l espace latent en ACP Statistique et analyse des données, tome 11, n o 3 (1986), p. 19-29

Plus en détail

TP3 - Introduction à la classification supervisée

TP3 - Introduction à la classification supervisée TP3 - Introduction à la classification supervisée 1 Introduction et objectifs Ce TP a pour objectif de vous initier aux techniques de classification (apprentissage supervisé donc) sous Knime. Nous utiliserons

Plus en détail

Analyse en Composantes Principales

Analyse en Composantes Principales Analyse en Composantes Principales Position du problème : On a observé p variables sur n individus : protocole multivarié. On cherche à remplacer ces p variables par q nouvelles variables résumant au mieux

Plus en détail

La régression linéaire multiple

La régression linéaire multiple Plan La régression linéaire multiple - Chapitre V - Notes de cours Modélisation Statistique L3 MIASHS - Université de Bordeaux - Chapitre V - L3 MIASHS- La régression linéaire multiple 1/46 Plan Plan 1

Plus en détail

Chapitre 2. Séries statistiques à une variable.

Chapitre 2. Séries statistiques à une variable. Chapitre 2. Séries statistiques à une variable nicolas.chenavier@lmpa.univ-littoral.fr Cadre A partir de maintenant, on se limite au cas des variables quantitatives réelles. Les données considérées sont

Plus en détail

Analyse en Composantes Principales

Analyse en Composantes Principales Analyse en Composantes Principales Pr Roch Giorgi roch.giorgi@univ-amu.fr SESSTIM, Faculté de Médecine, Aix-Marseille Université, Marseille, France http://sesstim.univ-amu.fr Objectif Étudier simultanément

Plus en détail

CUEEP Département Mathématiques E903 Corrélation p1/12

CUEEP Département Mathématiques E903 Corrélation p1/12 La corrélation Pré requis Notion qualitative de corrélation par interprétation de nuage de points Ajustement linéaire par la méthode des moindres carrés Formalisme Droite de régression Dans la réalisation

Plus en détail

Statistique : Résumé de cours et méthodes

Statistique : Résumé de cours et méthodes Statistique : Résumé de cours et méthodes 1 Vocabulaire : Population : c est l ensemble étudié. Individu : c est un élément de la population. Effectif total : c est le nombre total d individus. Caractère

Plus en détail

Analyse de grands jeux de données : classification et analyses multivariées

Analyse de grands jeux de données : classification et analyses multivariées Analyse de grands jeux de données : classification et analyses multivariées M. Bailly-Bechet Université Nice Sophia Antipolis France 1 Introduction On a parfois affaire à de grands jeux de données. Ce

Plus en détail

Méthode des moindres carrés (least squares LS)

Méthode des moindres carrés (least squares LS) Méthode des moindres carrés (least squares LS) La méthode des moindres carrés (MC) est une alternative au filtrage de Wiener. Les filtres de Wiener sont déduits à partir de moyennes d ensemble alors que

Plus en détail

* L essentiel est déjà en vous. Traitement statistique des données appliqué à nos domaines de compétences

* L essentiel est déjà en vous. Traitement statistique des données appliqué à nos domaines de compétences 40 * L essentiel est déjà en vous. Traitement statistique des données appliqué à nos domaines de compétences 41 Savoir choisir le test statistique ou le modèle adapté à la question traitée, en comprenant

Plus en détail

Feuille de TD 1 MT 252 Année Espace euclidien

Feuille de TD 1 MT 252 Année Espace euclidien Feuille de TD 1 MT 252 Année 24-25 Espace euclidien Exercice 1 Parallélogramme. Soit (E,, ) un espace euclidien. On note la norme associée. a) Montrer que x, y E, x y 2 + x + y 2 = 2 ( x 2 + y 2 ). (1)

Plus en détail

Corrélation - Régression

Corrélation - Régression Corrélation - Régression Corrélation Mesure le degré de liaison entre deux variables quantitatives Pour qu il y ait série statistique, il faut qu au moins l une des deux variables soit aléatoire. Cas 1

Plus en détail

TP 2 : Modèle linéaire et ANOVA à 1 facteur Charlotte Baey 21 octobre 2016

TP 2 : Modèle linéaire et ANOVA à 1 facteur Charlotte Baey 21 octobre 2016 TP 2 : Modèle linéaire et ANOVA à 1 facteur Charlotte Baey 21 octobre 2016 Exercice 1 - théorème de Cochran et ANOVA à un facteur Dans cet exercice, on se propose d étudier le jeu de données sur les fleurs

Plus en détail

Sommaire. [«Statistiques générales pour utilisateurs», Jérôme Pagès] [Presses universitaires de Rennes, 2010,

Sommaire. [«Statistiques générales pour utilisateurs», Jérôme Pagès] [Presses universitaires de Rennes, 2010, Sommaire Introduction 1 1 Description d'une série de valeurs 3 1.1 Graphiques............................... 3 1.2 Indicateurs............................... 11 1.3 Centrage et réduction.........................

Plus en détail

Analyse des Correspondances Multiples (ACM)

Analyse des Correspondances Multiples (ACM) Analyse des Correspondances Multiples (ACM) Compléments Jérôme Pagès Laboratoire de mathématiques appliquées Agrocampus, Rennes. 1 Analyse des Correspondances Multiples (ACM) 1. Données, notations 1:16

Plus en détail

Chapitre 2: Analyse en Composante Principale

Chapitre 2: Analyse en Composante Principale Chapitre 2: Analyse en Composante Principale Mohamed Essaied Hamrita ISMAI, Université Kairouan. Tunisie mhamrita@gmail.com http://hamrita.e-monsite.com/ Février 2014 Plan du chapitre Inroduction Motivation

Plus en détail

I) Vocabulaire de la statistique

I) Vocabulaire de la statistique Statistique Probabilité (I) Statistiques descriptives STAT 1 Compétences Connaître le vocabulaire des statistiques Exemples 1 et 2 Savoir calculer des fréquences, des fréquences cumulées Exemples 3 et

Plus en détail

PROGRAMMATION LINEAIRE

PROGRAMMATION LINEAIRE PROGRAMMATION LINEAIRE Une entreprise a la faculté de fabriquer, sur une machine donnée travaillant 45 heures par semaine, trois types de produits différents P 1, P 2 et P 3. Une unité du produit P 1 laisse

Plus en détail

Analyse exploratoire des données

Analyse exploratoire des données Analyse exploratoire des données Christophe Lalanne lalanne@ciep.fr Centre international d études pédagogiques juillet 2007 C. Lalanne (CIEP) Analyse exploratoire des données juillet 2007 1 / 25 Organisation

Plus en détail

Chapitre 0. Comment caractériser l activité du statisticien? 12 I Le contexte II La démarche III Le modèle... 14

Chapitre 0. Comment caractériser l activité du statisticien? 12 I Le contexte II La démarche III Le modèle... 14 Statistique inférentielle Objectif du cours C e cours comprend l essentiel des notions de statistique mathématique, principalement paramétrique, avec une introduction au cas non-paramétrique. Les notions

Plus en détail

Classification avec recouvrement des classes : une extension des k-moyennes

Classification avec recouvrement des classes : une extension des k-moyennes Classification avec recouvrement des classes : une extension des k-moyennes Guillaume Cleuziou Laboratoire d Informatique Fondamentale d Orléans (LIFO) Université d Orléans 45067 ORLEANS Cedex 2 Guillaume.Cleuziou@univ-orleans.fr

Plus en détail

CHAPITRE 10 ANALYSE FACTORIELLE DES CORRESPONDANCES. Master 2ème Année Page 1

CHAPITRE 10 ANALYSE FACTORIELLE DES CORRESPONDANCES. Master 2ème Année Page 1 CHAPITRE 10 ANALYSE FACTORIELLE DES CORRESPONDANCES Master 2ème Année Page 1 Plan 1. Les données 2. L'AFC est une AC particulière 3. Les représentations graphiques 4. Les aides à l'interprétation 5. Une

Plus en détail

Séparer végétation et sédiments dans des données LiDAR par une approche multiéchelles

Séparer végétation et sédiments dans des données LiDAR par une approche multiéchelles Séparer végétation et sédiments dans des données LiDAR par une approche multiéchelles Nicolas Brodu¹, Dimitri Lague² ¹ : Institut Physique de Rennes ² : Géosciences Rennes GDR TransNat, Clermont-Ferrand,

Plus en détail