Notes du cours RFIDEC (5)

Save this PDF as:
 WORD  PNG  TXT  JPG

Dimension: px
Commencer à balayer dès la page:

Download "Notes du cours RFIDEC (5)"

Transcription

1 1

2 Notes du cours RFIDEC (5) Jean-Yves Jaffray 20 janvier Classification non-paramétrique : la méthode des k plus proches voisins 1.1 Introduction Lorsque nous avons fait des hypothèses probabilistes (statistique inférentielle) nous avons toujours supposé que la famille des lois dont sont susceptibles d être tirées les observations pouvait être décrite à l aide d un petit nombre de paramètres ; par exemple, la famille des lois normales à une dimension a deux paramètres, (m,σ). On se trouvait alors dans le domaine de la statistique paramétrique. A contrario, lorsqu on n a qu une idée très vague de la loi dont est tiré l échantillon, on se trouve dans le cadre de la statistique non-paramétrique. En classification à K classes, il est souvent naturel de supposer que les objets de deux classes distinctes sont tirés aléatoirement selon des lois différentes et ceux d une même classe C k selon la même loi, mais que l on ne sait pas de quelles lois il s agit. On se trouve alors en classification non-paramétrique. 1.2 Une approche non-paramétrique Estimation d une densité de probabilité Soit X une variable aléatoire vectorielle à d dimensions suivant une loi de densité p(x) continue en x ; soit V une boule de centre x ; on note p = P (X V ) la probabilité que X appartienne à V (p dépend donc de V ) et V le volume de V ; d après les propriétés de l intégrale, lim V 0 p V = lim P r(x V ) V 0 V = lim V 0 V p(x)dx V dx = p(x). Considérons alors un n-échantillon issu de X ; le nombre k de réalisations qui tombent dans le volume V est aléatoire et suit la loi binomiale B(n,p) (où p = P (X V )) : P ( k = k) = ( n k )pk (1 p) (n k),k = 0,,n 2

3 On sait que cette loi a pour espérance E( k) = np et donc que k n est un estimateur sans biais de p. Une estimation possible de p(x), d autant meilleure que le volume de V sera plus petit, est donc p(x) = k n V. En résumé, la densité de probabilité estimée en x est proportionnelle au nombre d observations qui sont dans un voisinage de taille fixée de x Application à la classification Considérons le problème de classification à K classes en apprentissage supervisé et supposons que l on ait une base d exemples contenant n objets de chacune des classes. Si le nouvel objet observé, qui est à classer, appartient à la classe j (j = 1,,K), la vraisemblance de x, c-à-d la densité de probabilité en x, p j (x), k j n V. vaut, approximativement Une règle de classement basée sur le principe du maximum de vraisemblance conduirait donc à attribuer à l objet la classe j = arg max k j j 1.3 La méthode des k plus proches voisins Cette méthode propose une variante du maximum de vraisemblance en jouant sur la dimension de la boule V ; elle prend V assez grande pour contenir exactement un nombre fixé k d exemples. Le nouvel objet observé x est attribué à la classe qui a le plus de représentants parmi ces k exemples. La méthode des k plus proches voisins (k P P V ) peut être utilisée en apprentissage supervisé : On donne une base d exemples fixe constituée de n objets de classes connues : les prototypes. Tout nouvel objet à classer, l est selon la règle des k P P V. En fait cette règle est surtout utilisée en apprentissage non-supervisé : L initialisation demande aussi une base d exemples constituée d objets de classes connues, le dictionnaire initial. Les nouveaux objets, à classer, le sont successivement selon la règle des k P P V. La différence est que dès qu un objet a été classé il est immédiatement intégré au dictionnaire. 3

4 Algorithme des k-ppv en apprentissage non-supervisé Entrée : x j, j = 1,,n + M. Initialisation Dictionnaire D 1 = {x 1,,x n }, m 1 Tant que m M Répéter Déterminer les k plus proches voisins de x n+m dans D m ; attribuer à x n+m la classe majoritaire m m + 1 Sortie : classification des x j, j = n + 1,,n + M Critique de la méthode des k P P V : Il y a beaucoup d arbitraire ; en particulier les classements dépendent de l ordre dans lequel les nouveaux objets arrivent. La valeur de k ne peut pas être prise très grande, sinon la méthode ne s appliquerait qu aux très grandes bases d objets ; or, si k est petit, la classification est très sensible au bruit (c-à-d qu une faible modification des objets pourrait modifier profondément les classements). 2 La quantification vectorielle 2.1 Introduction La quantification vectorielle, en abrégé VQ (V ector Quantization, en anglais), opère sur des objets pouvant prendre des valeurs très diverses, par exemple des vecteurs quelconques de R d +, et ramène chacun d eux à celui des objets d une liste restreinte (les prototypes) qui en est le plus proche. Dans un magasin de chaussures, on ne prend pas en compte la longueur exacte de votre pied, mais seulement votre pointure, qui en donne une idée approximative, chaque pointure correspondant idéalement à une longueur du pied précise. Cette simplification des données est fondamentale dans plusieurs domaines, dont la compression d images. La VQ est donc à la base une technique de regroupement mais peut aussi être considérée comme une méthode de classification, assimiler un objet à un prototype donné revenant à le ranger dans une classe donnée (associée à ce prototype). L utilisation la plus intéressante de la VQ est en apprentissage nonsupervisé et avec des prototypes qui ne sont pas fixes et vont évoluer au cours de l algorithme. Une phase d initialisation est cependant nécessaire pour choisir des prototypes initiaux. Une possibilité est d utiliser un algorithmeà seuil. 4

5 2.2 Algorithme à seuil Le nombre K de classes n est pas imposé a priori et est lui-même une sortie de l algorithme. On choisit une distance d(x,y) ; ce sera en général la distance euclidienne si l on est dans R d. On choisit ensuite un seuil, θ, c-à-d une distance minimale devant séparer tout couple de prototypes. La sélection d un dictionnaire de prototypes initiaux est alors opérée par l algorithme : Algorithme à seuil Entrée : X = {x j, j = 1,,n}. Seuil θ > 0 Initialisation Dictionnaire D 1 = {x 1 }, j 2 Tant que j n Répéter Si y D j 1, d(x j,y) θ Alors D j D j 1 Sinon D j D j 1 {x j } Sortie : un dictionnaire de prototypes D = D n de taille K = D 2.3 Algorithmes de K-moyenne Nous allons donner deux algorithmes, variantes l un de l autre, qui, partant de K prototypes initiaux, vont classer les une après les autres les objets de la base (règle de sélection) mais vont aussi modifier au passage les prototypes (règle d adaptation); l idée est que le prototype d une classe doit être un objet bien représentatif de cette classe, un objet moyen en quelque sorte, qu on appelle un centroïde ; un centroïde particulier souvent utilisé lorsque l on a affaire à des objets de R d est leur centre de gravité Algorithme de K-moyenne de type CL Dans l algorithme CL (initiales de C ompetitive Learning en anglais), seul compte pour le classement le critère de proximité du prototype. Cet algorithme est aussi connu sous d autres noms, dont algorithme d agrégation autour de centres mobiles. Algorithme de K-moyenne de type CL Entrée : K prototypes D = {y 1,,y K } ; X = {x j, j = 1,,n}. Initialisation j 1, n k = 1 ( 1 k K) Tant que j n Répéter k arg min 1 l K d(x j,y l ) Affecter x j à la classe C k (règle de sélection) y k y k + α(x j y k ) (règle d adaptation) n k n k + 1 Sortie : un regroupement en K classes et les prototypes de chaque classe (des centroïdes), D. Dans la règle d adaptation, α > 0 est une constante qui gère l intensité du 5

6 déplacement du prototype dans la direction du nouvel élément de la classe, x j. Il existe de nombreuses variantes de cette règle, en particulier, le déplacement peut être variable ; par exemple, on prend souvent : y k n k.y k +x j n k +1 ; les centroïdes sont alors exactement les centres de gravité des classes Algorithme de K-moyenne de type FSL Une difficulté avec les algorithmes de K-moyenne est qu il est possible que certains prototypes soient perdus - on dits aussi morts - c-à-d ne soient jamais sélectionnés, ce qui a pour inconvénient que les classes seront de tailles très inégales. L algorithme FSL (initiales de F requency S ensitive Learning en anglais) évite ce phénomène en pénalisant les prototypes trop utilisés (et donc en favorisant la sélection des autres). La règle de sélection n est plus basée sur la comparaison des distances d(x,y k ), mais sur celle des quantités u k d(x,y k ), où le poids u k est d autant plus élevé que la classe k a été choisie plus souvent ; par exemple, u k est incrémentée d une unité chaque fois que k est choisie. règle de sélection : k arg min 1 l K u l d(x j,y l ) Affecter x j à la classe C k La règle d adaptation est la même que dans l algorithme CL Algorithme de Linde-Buzo-Gray (LBG) L algorithme de Linde-Buzo-Gray (LBG) ne fait pas seulement évoluer les prototypes mais aussi leur nombre, par duplication. L intérêt de le faire est d accroître la précision et aussi d équilibrer les tailles des classes. Algorithme LBG Entrée : K prototypes D = {y 1,,y K }, centres de gravité des K ensembles de la partition de X = {x j, j = 1,,n}. Un vecteur z Tant que critère d arrêt non-satisfait Répéter Doubler le nombre de prototypes en remplaçant chaque prototype y par deux autres y + z et y z Affecter chaque exemple x j à la classe du nouveau prototype dont il est le plus proche Adapter les prototypes en les remplaçant par les centres de gravité de leurs classes. Sortie : un regroupement en K r classes et les prototypes de chaque classe (leurs centres de gravité). 6

Chapitre 19. Echantillonnage. Estimation

Chapitre 19. Echantillonnage. Estimation Chapitre 9. Echantillonnage. Estimation Ce chapitre ne peut en aucun cas être étudié si on n a pas d abord étudié le chapitre 6 sur la loi binomiale et le chapitre 8 sur la loi normale. Les différentes

Plus en détail

RFIDEC cours 3 : Intervalles de confiance, tests d hypothèses, loi du χ 2

RFIDEC cours 3 : Intervalles de confiance, tests d hypothèses, loi du χ 2 RFIDEC cours 3 : Intervalles de confiance, tests d hypothèses, loi du χ 2 Christophe Gonzales LIP6 Université Paris 6, France Plan du cours n 3 RFIDEC cours 3 : Intervalles de confiance, tests d hypothèses,

Plus en détail

STATISTIQUE ET PROBABILITÉS AU LYCÉE. (séries ES, S, STI2D, STL)

STATISTIQUE ET PROBABILITÉS AU LYCÉE. (séries ES, S, STI2D, STL) STATISTIQUE ET PROBABILITÉS AU LYCÉE (séries ES, S, STI2D, STL) Contexte de travail Des notions de statistique inférentielle introduites pour la première fois dans les programmes du secondaire. Ces notions

Plus en détail

UV Théorie de l Information. Quantification scalaire UNIFORME

UV Théorie de l Information. Quantification scalaire UNIFORME Cours n 7 : UV Théorie de l Information Compression de l information Codage de source avec distorsion : Quantification scalaire Quantification vectorielle Prediction linéaire 1 Quantification scalaire

Plus en détail

a + 2b b y 2z = 0 2x 3y 4z = 0 x + y + z = 0 { y = 2z

a + 2b b y 2z = 0 2x 3y 4z = 0 x + y + z = 0 { y = 2z Corrigé ECRICOME Eco 2008 par Pierre Veuillez EXERCICE A tout couple a, b) de deu réels, on associe la matrice M a, b) définie a + 2b b 2b M a, b) = 2b a b 4b b b a + 3b On désigne par E l ensemble des

Plus en détail

K-means, EM, Mélanges de Gaussiennes, Théorie des graphes 2010/2011. Cours 3 13 octobre

K-means, EM, Mélanges de Gaussiennes, Théorie des graphes 2010/2011. Cours 3 13 octobre K-means, EM, Mélanges de Gaussiennes, Théorie des graphes 2010/2011 Cours 3 13 octobre Enseignant: Francis Bach Scribe: Alexandre Boulc h, Bertrand Decoster Pour parler d estimation de paramêtres cachés,

Plus en détail

U. Paris Ouest, M1 - Cours de Modélisation Appliquée. Laurent Ferrara Février 2012

U. Paris Ouest, M1 - Cours de Modélisation Appliquée. Laurent Ferrara Février 2012 U. Paris Ouest, M1 - Cours de Modélisation Appliquée Introduction aux modèles statistiques Laurent Ferrara Février 20 U. Paris Ouest L. Ferrara, 2011- Plan de la présentation 1. Concepts 2. Modèles statistiques

Plus en détail

] sous certaines conditions pour et. On dispose donc en termes de probabilité du résultat suivant : ] avec une probabilité supérieure ou égale à 0,95

] sous certaines conditions pour et. On dispose donc en termes de probabilité du résultat suivant : ] avec une probabilité supérieure ou égale à 0,95 Echantillonnage I) Position du problème Dans une population on sait que le caractère C est présent avec la proportion ( on pourrait dire que la probabilité de choisir un individu ayant le caractère C est

Plus en détail

Variables aléatoires continues et loi normale

Variables aléatoires continues et loi normale Variables aléatoires continues et loi normale H. Hocquard HSE 2016-2017 Hervé Hocquard Variables aléatoires continues et loi normale 1/35 Variable alétoire continue Définition Une variable aléatoire est

Plus en détail

THÉORÈME DE MOIVRE-LAPLACE

THÉORÈME DE MOIVRE-LAPLACE Auteur : Christian Vassard THÉORÈME DE MOIVRE-LAPLACE TI-83 Premium CE Fichiers associés : Moivre_Laplace_eleve.pdf, ALB.8xp. Objectifs Comprendre au moyen de considérations graphiques le problème de l

Plus en détail

Corrigé du baccalauréat S Métropole 22 juin 2015

Corrigé du baccalauréat S Métropole 22 juin 2015 Corrigé du baccalauréat S Métropole juin 015 EXERCICE 1 6 POINTS Partie 1 A. P. M. E. P. 1. a. Soient c et d deux réels tels que 0 c < d. Par définition, P(c X d)= d c = e λd ( e λc) = e λc e λd. f (x)

Plus en détail

Segmentation et Reconnaissance de Forme

Segmentation et Reconnaissance de Forme Analyse et Synthèse d'images James L. Crowley DESS Génie Informatique 1999/00 Séance 7 : 15 fevrier1900 Plan de la Séance : Segmentation et Reconnaissance de Forme Méthodes Statistique de la Reconnaissance

Plus en détail

Chapitre 3. Modèles de tirage. 3.1 Introduction : Probabilités, modèles de tirages

Chapitre 3. Modèles de tirage. 3.1 Introduction : Probabilités, modèles de tirages Chapitre 3 Modèles de tirage 3.1 Introduction : Probabilités, modèles de tirages Ce chapitre présentera quelques exemples de calculs de probabilités. D un point de vue théorique la situation la plus simple

Plus en détail

CHAPITRE 1 - GÉNÉRALITÉS SUR LES TESTS - EXEMPLE DU TEST BINOMIAL -

CHAPITRE 1 - GÉNÉRALITÉS SUR LES TESTS - EXEMPLE DU TEST BINOMIAL - CHAPITRE 1 - GÉNÉRALITÉS SUR LES TESTS - EXEMPLE DU TEST BINOMIAL - 1 Qu est ce qu un test statistique? Supposons que l on souhaite mettre en évidence une propriété concernant une population P. On procède

Plus en détail

Ch 07 Probabilités. Exemple Reprendre l exemple précédent et définir la loi de probabilité de X.

Ch 07 Probabilités. Exemple Reprendre l exemple précédent et définir la loi de probabilité de X. Ch 07 Probabilités I VARIABLE ALEATOIRE ET LOI DE PROBABILITE I.1 - d une variable aléatoire On appelle variable aléatoire discrète toute application X de Ω dans IR. L ensemble des valeurs prises par X,

Plus en détail

Statistiques inférentielles

Statistiques inférentielles Chapitre 5 : Estimation ponctuelle Télécom Saint-Étienne 2015 Sommaire 1 Introduction 2 Estimateurs sans biais Estimateur convergent Erreur quadratique moyenne 3 Plan 1 Introduction 2 3 Introduction -

Plus en détail

Chapitre 5 : Lois Discrètes Usuelles

Chapitre 5 : Lois Discrètes Usuelles Chapitre 5 : Lois Discrètes Usuelles L2 Eco-Gestion, option AEM (L2 Eco-Gestion, option AEM) Chapitre 5 : Lois Discrètes Usuelles 1 / 25 Joseph Bertrand (1900) Comment oser parler des lois du hasard? Le

Plus en détail

Baccalauréat S Asie 16 juin 2015 Corrigé

Baccalauréat S Asie 16 juin 2015 Corrigé Baccalauréat S Asie 16 juin 015 Corrigé A. P. M. E. P. Exercice 1 5 points Commun à tous les candidats Partie A Un concurrent participe à un concours de tir à l arc, sur une cible circulaire. À chaque

Plus en détail

Introduction sur l inférence statistiques et théorie de l échantillonnage

Introduction sur l inférence statistiques et théorie de l échantillonnage Introduction sur l inférence statistiques et théorie de l échantillonnage February 8, 2015 Chapitre 3 February 8, 2015 1 / 15 Section Introduction sur l inférence statistique 1 Introduction sur l inférence

Plus en détail

Antilles Guyane Juin 2013

Antilles Guyane Juin 2013 Juin 0 / 5 Exercice. Les plans (AEC) et (IEC) sont confondus. J n appartient pas à (AEC). Réponse b.. = ( ). ( ) = ( ). ( ) =. + +. +. = ² = Réponse c. ( ;0 ;) (0 ; ;) sont vecteurs non colinéaires. Ce

Plus en détail

démonstrations exigibles au baccalauréat

démonstrations exigibles au baccalauréat démonstrations exigibles au baccalauréat fonction exponentielle (1/2) propriété : Il existe une unique fonction dérivable sur telle que ' = et (0) = 1 1 L'existence de la fonction est admise conformément

Plus en détail

France métropolitaine, Réunion Enseignement de spécialité. Corrigé

France métropolitaine, Réunion Enseignement de spécialité. Corrigé France métropolitaine, Réunion 2015. Enseignement de spécialité. Corrigé EXERCICE 1 Partie 1 1 a Soient c et d deux réels tels que 0 c < d. P(c X d = d b D après la question précédente, c f(x dx = d c

Plus en détail

Reconnaissance de forme: Rappels de probabilités et de statistiques

Reconnaissance de forme: Rappels de probabilités et de statistiques Reconnaissance de forme: Rappels de probabilités et de statistiques 1 er février 2010 Plan 1 Introduction : pourquoi des probabilités? 2 Notions de probabilités 3 Statistiques et estimation Introduction

Plus en détail

Chapitre 4: Notions sur les statistiques d ordre et les distributions d échantillonnage

Chapitre 4: Notions sur les statistiques d ordre et les distributions d échantillonnage Chapitre 4: Notions sur les statistiques d ordre et les distributions d échantillonnage Léonard Gallardo 1 Statistiques d ordre d un échantillon 1.1 Généralités On a vu dans le chapitre 2 pourquoi la notion

Plus en détail

Intervalles de confiance et tests portant sur la moyenne et la variance d une loi gaussienne

Intervalles de confiance et tests portant sur la moyenne et la variance d une loi gaussienne Master de mathématiques 011/01 Intervalles de confiance et tests portant sur la moyenne et la variance d une loi gaussienne Table des matières A Intervalle de confiance 1 B Intervalles de confiance et

Plus en détail

Baccalauréat S Métropole La Réunion 9 septembre 2015

Baccalauréat S Métropole La Réunion 9 septembre 2015 accalauréat S Métropole La Réunion 9 septembre 215 A. P. M. E. P. EXERCICE 1 Commun à tous les candidats 5 POINTS Cet exercice est un questionnaire à choix multiples. Pour chacune des questions, quatre

Plus en détail

COURS DE STATISTIQUE TD - FEUILLE N 2

COURS DE STATISTIQUE TD - FEUILLE N 2 Université Paris 1 Magistère d Economie - 1ère année COURS DE STATISTIQUE TD - FEUILLE N 2 Estimation ponctuelle et comparaison d estimateurs Exercice 1 On considère une variable aléatoire X de loi L,

Plus en détail

Chapitre 4 : Méthode des moindres carrés

Chapitre 4 : Méthode des moindres carrés Chapitre 4 : Méthode des moindres carrés Table des matières 1 Introduction 2 11 Généralités 2 12 Notion de modèle et de regression linéaire multiple 2 2 Critère des moindres carrés - formulation 2 21 Critère

Plus en détail

3 Variables aléatoires et distributions des probabilités

3 Variables aléatoires et distributions des probabilités 3 Variables aléatoires et distributions des probabilités 3.1 Variables aléatoires Après avoir réalisé une expérience, il arrive bien souvent qu on s intéresse plus à une fonction de résultat qu au résultat

Plus en détail

Intervalle de fluctuation Intervalle de confiance. Lequel utiliser? Pourquoi?

Intervalle de fluctuation Intervalle de confiance. Lequel utiliser? Pourquoi? Intervalle de fluctuation Intervalle de confiance Lequel utiliser? Pourquoi? 1 Des questions qui se posent Q1: Dans un pays, 10 % des plages étaient atteintes par des algues toxiques. On a modifié le processus

Plus en détail

Estimation et intervalle de confiance

Estimation et intervalle de confiance Estimation et intervalle de confiance S. Robin robin@agroparistech.fr AgroParisTech, dépt. MMIP 8 octobre 2007 A lire : Chapitre 3 Estimation de paramètre du livre Statistique Inférentielle, Daudin, R.,

Plus en détail

Apprentissage automatique Méthodes d échantillonnage - motivation

Apprentissage automatique Méthodes d échantillonnage - motivation Apprentissage automatique Méthodes d échantillonnage - motivation ÉCHANTILLONNAGE échantillonnage La plupart des algorithmes d apprentissage vus sont basés sur un modèle probabiliste un modèle probabiliste

Plus en détail

:"moins de 7" ; E 2. :"de 7 à 10" ; E 3 E 3

:moins de 7 ; E 2. :de 7 à 10 ; E 3 E 3 1.1 Rappels événements : gain X( ) : objets : expérience : 1. Lois discrètes deux dés les lancer, puis noter le total univers : Ω= {2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12} partition de Ω: E 1 :"moins de 7"

Plus en détail

Statistique (MATH-F-315, Cours #5)

Statistique (MATH-F-315, Cours #5) Statistique MATH-F-315, Cours #5) Thomas Verdebout Université Libre de Bruxelles 2015 Plan de la partie Statistique du cours 1 Introduction 2 Théorie de l estimation 3 Tests d hypothèses et intervalles

Plus en détail

Chapitre V. Chapitre V : Bases et dimension

Chapitre V. Chapitre V : Bases et dimension Chapitre V Chapitre V : Bases et dimension Introduction On avait vu au Chapitre IV qu une base pour un espace vectoriel V est une partie à la fois libre et génératrice de V. Les bases constituent un outils

Plus en détail

Ch. 5 : Echantillonnage, estimation

Ch. 5 : Echantillonnage, estimation U.P.S. I.U.T. A, Département d Informatique Année 2008-2009 Ch. 5 : Echantillonnage, estimation 1 Echantillonnage et suites de variables aléatoires. Un échantillon de taille n est une partie de n éléments

Plus en détail

Lycée Polyvalent de Taaone. Mathématiques Série S (Mars-2014) Durée : 4 heures

Lycée Polyvalent de Taaone. Mathématiques Série S (Mars-2014) Durée : 4 heures Mathématiques Série S (Mars-2014) Durée : 4 heures L usage de la calculatrice est autorisé Tout autre document est interdit Ce sujet s adresse aux élèves qui ont suivi la spécialité Mathématiques Il comporte

Plus en détail

Loi binomiale. Xavier Hallosserie. avril Lycée Blaise Pascal. Xavier Hallosserie (Lycée Blaise Pascal) Chapitre 13 avril / 30

Loi binomiale. Xavier Hallosserie. avril Lycée Blaise Pascal. Xavier Hallosserie (Lycée Blaise Pascal) Chapitre 13 avril / 30 Loi binomiale Xavier Hallosserie Lycée Blaise Pascal avril 2016 Xavier Hallosserie (Lycée Blaise Pascal) Chapitre 13 avril 2016 1 / 30 Sommaire 1. Épreuve et schéma de Bernoulli 1.1 Épreuve de Bernoulli

Plus en détail

Chapitre 5 ESTIMATION ET INTERVALLES DE CONFIANCE

Chapitre 5 ESTIMATION ET INTERVALLES DE CONFIANCE Thierry Foucart 1 http://foucart.thierry.free.fr Chapitre 5 ESTIMATION ET INTERVALLES DE CONFIANCE 1. DES PROBABILITÉS À LA STATISTIQUE. hypothèse intuitive élaborée à partir d expériences diverses : convergence

Plus en détail

Sondages à probabilités inégales. STA108 Enquêtes et sondages Octobre 2012 Philippe Périé

Sondages à probabilités inégales. STA108 Enquêtes et sondages Octobre 2012 Philippe Périé Sondages à probabilités inégales STA108 Enquêtes et sondages Octobre 2012 Philippe Périé 1 Sondages à probabilités inégales Les sondages aléatoires simples ne sont utilisés qu en l absence de toute autre

Plus en détail

Étude de cas. Myriam Maumy-Bertrand. 27 septembre IRMA, UMR 7501, Université de Strasbourg

Étude de cas. Myriam Maumy-Bertrand. 27 septembre IRMA, UMR 7501, Université de Strasbourg Étude de cas IRMA, UMR 7501, Université de Strasbourg 27 septembre 2013 Ce chapitre s appuie essentiellement sur le livre : 2 ème partie Théorie de l estimation Sommaire 1 Introduction 2 3 4 5 6 Le problème

Plus en détail

Tome 2 Les probabilités continues

Tome 2 Les probabilités continues Tome 2 Les probabilités continues Chapitre 10 Introduction aux probabilités continues Rappel Définition Une variable aléatoire est une fonction d un espace de probabilité Ω vers R, X : Ω R Si X peut prendre

Plus en détail

Lycée Polyvalent de Taaone. Mathématiques Série S (Mars-2014) Durée : 4 heures

Lycée Polyvalent de Taaone. Mathématiques Série S (Mars-2014) Durée : 4 heures Mathématiques Série S (Mars-2014) Durée : 4 heures L usage de la calculatrice est autorisé Tout autre document est interdit Ce sujet s adresse aux élèves qui n ont pas suivi la spécialité Mathématiques

Plus en détail

Cours 4 : Traitement de données quantitatives multivariées - Introduction au partitionnement de données. Guénaël CABANES et Basarab MATEI

Cours 4 : Traitement de données quantitatives multivariées - Introduction au partitionnement de données. Guénaël CABANES et Basarab MATEI Cours 4 : Traitement de données quantitatives multivariées - Introduction au partitionnement de données Guénaël CABANES et Basarab MATEI Généralités Exemple Introduction Guénaël CABANES et Basarab MATEI

Plus en détail

T STI SIN Loi normale 05/04/2013 Lycée Don Bosco

T STI SIN Loi normale 05/04/2013 Lycée Don Bosco A. Un peu d intuition, un peu de simulation Trois personnes choisissent chacune au hasard et indépendamment l une de l autre un nombre réel compris entre 0 et 1. On appelle I 1, I 2 et I 3 les nombres

Plus en détail

Codage et Compression de données. Codage et Compression de données

Codage et Compression de données. Codage et Compression de données Département R&T IUT Nice Côte d Azur Université de Nice - Sophia Antipolis Frédéric Payan (MCF UNS) Quantification scalaire Notions Principe de la quantification La quantification consiste à représenter

Plus en détail

Université de Franche-Comté - IREM. Un exemple de calcul de risques de première et de seconde espèces Séminaire IREM - Yves DUCEL - 21 juin 2013

Université de Franche-Comté - IREM. Un exemple de calcul de risques de première et de seconde espèces Séminaire IREM - Yves DUCEL - 21 juin 2013 Université de Franche-Comté - IREM Un exemple de calcul de risques de première et de seconde espèces Séminaire IREM - Yves DUCEL - 21 juin 2013 1 L expérience de la pièce de Buffon Illustrons cette démarche

Plus en détail

J.F.C. p. 1. Ceci est un premier jet et a besoin encore de relectures pour bien tenir la route. EDHEC 2014 EXERCICE 1. Φ ( x) + Φ ( x) ).

J.F.C. p. 1. Ceci est un premier jet et a besoin encore de relectures pour bien tenir la route. EDHEC 2014 EXERCICE 1. Φ ( x) + Φ ( x) ). 3-- 4 JFC p JF COSSUTTA jean-francoiscossutta@wanadoofr Ceci est un premier jet et a besoin encore de relectures pour bien tenir la route EDHEC 4 EXERCICE a U est une variable aléatoire réelle sur Ω, A,

Plus en détail

Présentation de l algorithme CART

Présentation de l algorithme CART 1/32 Présentation de l algorithme CART C. Tuleau-Malot 2/32 Plan 1 Contexte 2/32 Plan 1 Contexte 2 CART 2/32 Plan 1 Contexte 2 CART 3 Construction de l arbre maximal 2/32 Plan 1 Contexte 2 CART 3 Construction

Plus en détail

F 3 Reproduire cet arbre et placer les probabilités F 2 sur les branches.

F 3 Reproduire cet arbre et placer les probabilités F 2 sur les branches. Sujet Centres Étrangers 203 EXERCICE. [6 pts] Lois continues Un industriel fabrique des vannes électroniques destinées à des circuits hydrauliques. Les quatre parties A, B, C, D sont indépendantes. Partie

Plus en détail

Examen du cours d Apprentissage statistique

Examen du cours d Apprentissage statistique Examen du cours d Apprentissage statistique Enseignants : Francis Bach Olivier Catoni Rémi Lajugie Guillaume Obozinski Session de juin 2013 Les exercices qui suivent sont indépendants et peuvent donc être

Plus en détail

loi binomiale Table des matières

loi binomiale Table des matières loi binomiale Table des matières 1 loi binomiale 2 1.1 activités.............................................. 2 1.2 a retenir............................................. 4 1.3 exercices..............................................

Plus en détail

Projet 3 : Bibliothèque C pour la classification automatique d images binaires

Projet 3 : Bibliothèque C pour la classification automatique d images binaires Université du Sud Toulon - Var Langage C Licence 2 Sciences Pour l Ingénieur Année 2012-2013 Projet 3 : Bibliothèque C pour la classification automatique d images binaires par Faicel CHAMROUKHI Table des

Plus en détail

Statistique et Informatique (LI323) Cours 5

Statistique et Informatique (LI323) Cours 5 Statistique et Informatique (LI323) Cours 5 Nicolas Baskiotis nicolas.baskiotis@lip6.fr Université Pierre et Marie Curie (UPMC) Laboratoire d Informatique de Paris 6 (LIP6) auteurs: M.R. Amini, N. Usunier

Plus en détail

Statistique (MATH-F-315, Cours #2)

Statistique (MATH-F-315, Cours #2) Statistique (MATH-F-315, Cours #2) Thomas Verdebout Université Libre de Bruxelles 2015 Plan de la partie Statistique du cours 1. Introduction. 2. Théorie de l estimation. 3. Tests d hypothèses et intervalles

Plus en détail

Chapitre 5 ESTIMATION

Chapitre 5 ESTIMATION Statistique appliquée à la gestion et au marketing http://foucart.thierry.free.fr/statpc Chapitre 5 ESTIMATION La statistique inférentielle regroupe un ensemble de méthodes consistant à prendre en compte

Plus en détail

Cours 5: Inférences: Estimation, Echantillonnage et Tests

Cours 5: Inférences: Estimation, Echantillonnage et Tests Cours 5: Inférences:, Echantillonnage et Laboratoire de Mathématiques de Toulouse Université Paul Sabatier-IUT GEA Ponsan Module: Stat inférentielles Cours 5: Inférences:, Echantillonnage et 1 Les divers

Plus en détail

MTH 2301 Méthodes statistiques en ingénierie. Chapitre 6 - Distributions échantillonnales et estimation

MTH 2301 Méthodes statistiques en ingénierie. Chapitre 6 - Distributions échantillonnales et estimation Chapitre 6 - Distributions échantillonnales et estimation Lexique anglais - français Constats et terminologie statistique Distribution de la moyenne théorème central- limite Estimation : Intervalle de

Plus en détail

Estimation et Intervalle de Confiance

Estimation et Intervalle de Confiance Estimation et Intervalle de Confiance Jean-Jacques Daudin AgroParisTech October 26, 2011 Document disponible sur http://www.agroparistech.fr/mmip/tice/mathematiques/ J.J. Daudin () Estimation et Intervalle

Plus en détail

Corrigé du baccalauréat ES/L Amérique du Sud 25 novembre 2015

Corrigé du baccalauréat ES/L Amérique du Sud 25 novembre 2015 orrigé du baccalauréat ES/L Amérique du Sud 25 novembre 2015 EXERIE 1 ommun à tous les candidats 5 points Une étude est menée par une association de lutte contre la violence routière. Des observateurs,

Plus en détail

Le principe multiplicatif (notion 2)

Le principe multiplicatif (notion 2) L indépendance (notion 1) (source : académie d Aix-Marseille) Le programme est très clair à ce sujet : «La notion de probabilité conditionnelle est hors programme» Mais pour aborder la loi binomiale, il

Plus en détail

Notion de variable aléatoire réelle discrète

Notion de variable aléatoire réelle discrète Université de Picardie Jules Verne 011-01 UFR des Sciences Licence mention Mathématiques et mention Informatique parcours MIAGE - Semestre 3 Statistique et Probabilités otion de variable aléatoire réelle

Plus en détail

Métropole mai 2015 Exercice 1 10 points Partie A - Événements indépendants, probabilités conditionnelles Partie B - Loi binomiale 1.

Métropole mai 2015 Exercice 1 10 points Partie A - Événements indépendants, probabilités conditionnelles Partie B - Loi binomiale 1. Métropole mai 2015 Exercice 1 10 points Les trois parties de cet exercice sont indépendantes Le centre d approvisionnement d une chaîne de magasin spécialisée dans le jardinage et l animalerie vient de

Plus en détail

Impact du Programme de Base de Maintenance Préventive sur la Fiabilité : Quelques Applications EDF Récentes

Impact du Programme de Base de Maintenance Préventive sur la Fiabilité : Quelques Applications EDF Récentes Impact du Programme de Base de Maintenance Préventive sur la Fiabilité : Quelques Applications EDF Récentes Yannick Lefebvre, Marie-Agnès Garnero EDF R&D, département Management des Risques Industriels,

Plus en détail

Le sujet comporte 8 pages numérotées de 2 à 9. Il faut choisir et réaliser seulement trois des quatre exercices proposés EXERCICE I

Le sujet comporte 8 pages numérotées de 2 à 9. Il faut choisir et réaliser seulement trois des quatre exercices proposés EXERCICE I Le sujet comporte 8 pages numérotées de à 9 Il faut choisir et réaliser seulement trois des quatre exercices proposés EXERCICE I Donner les réponses à cet exercice dans le cadre prévu à la page 3 Une enquête

Plus en détail

TRAVAIL DE MATHEMATIQUES ECE 2. Faire pour le jour de la rentrée sur copie les exercices donnés en annexe

TRAVAIL DE MATHEMATIQUES ECE 2. Faire pour le jour de la rentrée sur copie les exercices donnés en annexe TRAVAIL DE MATHEMATIQUES ECE 2 Revoir les définitions, propriétés, théorèmes. de cours Retravailler les DS, TD, fiche d exercices à l aide des corrigés Faire pour le jour de la rentrée sur copie les exercices

Plus en détail

Chapitre III : Probabilités discrètes

Chapitre III : Probabilités discrètes Chapitre III : Probabilités discrètes Extrait du programme : I. Rappels a. Définitions Prop 1 : Une probabilité est toujours comprise entre 0 et 1. Prop 2 Si A est l événement certain, p(a) = 1. Si A est

Plus en détail

Tests non-paramétriques

Tests non-paramétriques Tests non-paramétriques Michaël Genin Université de Lille EA 694 - Santé Publique : Epidémiologie et Qualité des soins michaelgenin@univ-lillefr Plan 1 Introduction Comparaison de K = échantillons indépendants

Plus en détail

Lycée Saint-Exupéry BAC BLANC - Février Terminales S Epreuve de Mathématiques - Durée : 4 heures. CORRECTION

Lycée Saint-Exupéry BAC BLANC - Février Terminales S Epreuve de Mathématiques - Durée : 4 heures. CORRECTION Lycée Saint-Eupéry BAC BLANC - Février 06 - Terminales S Epreuve de Mathématiques - Durée : 4 heures. CORRECTION Eercice : commun à tous les candidats Partie A :. On a l arbre pondéré ci-contre : A 3,5

Plus en détail

Rappels de Statistique

Rappels de Statistique L2 S2 Eco-Gestion Université de Bordeaux 2014-2015 Rappels de Statistique Cette fiche rappelle et commente les résultats essentiels du cours de statistique de L2 S2. Chaque rappel est suivi d une courte

Plus en détail

Corrigé de l examen de mathématiques

Corrigé de l examen de mathématiques Collège notre Dame de Jamhour Juin 2014 Classe de première S Corrigé de l examen de mathématiques Exercice 1 1. a. admet pour vecteur directeur ; admet pour vecteur directeur Alors et sont orthogonales.

Plus en détail

TS Exemples de lois à densité : annales Corrigés

TS Exemples de lois à densité : annales Corrigés Année 1/14 TS Exemples de lois à densité : annales Corrigés Exercice 1 (Antilles Guyane - Juin 1) 1) A : 5 8 B : 21 2 C : 11 2 En effet, il y a 21 cartes qui sont "ni as, ni pique" 2) A : 1 En effet, on

Plus en détail

CHAPITRE VII. Plus courts chemins

CHAPITRE VII. Plus courts chemins CHAPITRE VII Plus courts chemins VII. VII.. Présentation du problème Graphes pondérés On s intéresse à des graphes qui sont pondérés et a priori orientés. Il y a donc un poids, un réel, sur chaque arc

Plus en détail

BACCALAURÉAT GÉNÉRAL. Session 2015 MATHÉMATIQUES. - Série ES - ENSEIGNEMENT DE SPÉCIALITÉ. Durée de l'épreuve : 3 heures Coefficient : 7

BACCALAURÉAT GÉNÉRAL. Session 2015 MATHÉMATIQUES. - Série ES - ENSEIGNEMENT DE SPÉCIALITÉ. Durée de l'épreuve : 3 heures Coefficient : 7 BACCALAURÉAT GÉNÉRAL Session 2015 MATHÉMATIQUES - Série ES - ENSEIGNEMENT DE SPÉCIALITÉ Durée de l'épreuve : 3 heures Coefficient : 7 Les calculatrices électroniques de poche sont autorisées, conformément

Plus en détail

Baccalauréat ES/L Liban 27 mai 2015

Baccalauréat ES/L Liban 27 mai 2015 Durée : 3 heures Baccalauréat ES/L Liban 27 mai 2015 A. P. M. E. P. Exercice 1 Commun à tous les candidats 4 points Pour chacune des situations suivantes, déterminer si elle est vraie ou faussent justifier

Plus en détail

Baccalauréat S Asie 19 juin 2014

Baccalauréat S Asie 19 juin 2014 Exercice 1 Commun à tous les candidats Baccalauréat S Asie 19 juin 214 4 points Cet exercice est un questionnaire à choix multiples comportant quatre questions indépendantes. Pour chaque question, une

Plus en détail

Chapitre 12 : Exercices BAC Terminale S, 2014, Lycée Lapérouse

Chapitre 12 : Exercices BAC Terminale S, 2014, Lycée Lapérouse Chapitre 12 : Exercices BAC Terminale S, 2014, Lycée Lapérouse Exercice 1. Calédonie 2011 Une grande entreprise dispose d un vaste réseau informatique. On observe le temps de fonctionnement normal séparant

Plus en détail

Receiving Operator Characteristic (ROC)

Receiving Operator Characteristic (ROC) Receiving Operator Characteristic (ROC) Xavier Dupré http://www.xavierdupre.fr/ 16 avril 2013 Résumé Ce document introduit la courbe ROC (Receiving Operator Characteristic) qui est communément utilisée

Plus en détail

Chapitre 3. Intervalles de confiance. 3.1 Principe général

Chapitre 3. Intervalles de confiance. 3.1 Principe général Chapitre 3 Intervalles de confiance Ce chapitre est consacré à la construction d intervalles contenant le paramètre inconnu supposé réel, avec un niveau de confiance fixé. Il contient essentiellement des

Plus en détail

Baccalauréat STL Biotechnologies 19 juin 2013 Antilles-Guyane correction

Baccalauréat STL Biotechnologies 19 juin 2013 Antilles-Guyane correction Baccalauréat STL Biotechnologies 19 juin 13 Antilles-Guyane correction EXERCICE 1 5 points Suite à un gros orage, la plage municipale de la commune d Aistéhel subit une pollution momentanée du fait du

Plus en détail

Variables continues usuelles

Variables continues usuelles Variables continues usuelles I) Variables uniformes 1.1 Densités Nous avons déjà rencontré ce type de variables. Définition 1 On dit que la variable suit une loi uniforme continue sur 0,1 si sa fonction

Plus en détail

NOM : PRENOM : Centre d écrit : N Inscription : Série S. Mercredi 14 mai Epreuves communes ENIT et Geipi Polytech

NOM : PRENOM : Centre d écrit : N Inscription : Série S. Mercredi 14 mai Epreuves communes ENIT et Geipi Polytech Ne rien inscrire dans ce cadre NOM : PRENOM : Centre d écrit : N Inscription : SUJET DE MATHÉMATIQUES Ne rien inscrire ci-dessous Série S Mercredi 14 mai 2014 Epreuves communes ENIT et Geipi Polytech Nous

Plus en détail

Baccalauréat S Nouvelle-Calédonie 17 novembre 2014 Corrigé

Baccalauréat S Nouvelle-Calédonie 17 novembre 2014 Corrigé Baccalauréat S Nouvelle-Calédonie 17 novembre 014 Corrigé A. P. M. E. P. Exercice 1 Commun à tous les candidats Une fabrique de desserts glacés dispose d une chaîne automatisée pour remplir des cônes de

Plus en détail

Terminale ES - Travailler en autonomie - Pondichéry Avril 2016

Terminale ES - Travailler en autonomie - Pondichéry Avril 2016 Terminale ES - Travailler en autonomie - Pondichéry Avril 216 Exercice 1 4 points Commun à tous les candidats Cet exercice est un QCM (questionnaire à choix multiples). Pour chacune des quatre questions

Plus en détail

Cours de sondages approfondis

Cours de sondages approfondis Cours de sondages approfondis 1ère séance : rappels Xavier d Haultfœuille 1 Introduction Objectif du cours : aborder quelques techniques récentes en sondages, et plus précisément : - en échantillonnage

Plus en détail

Corrigé du baccalauréat S Antilles-Guyane Septembre 2015

Corrigé du baccalauréat S Antilles-Guyane Septembre 2015 Corrigé du baccalauréat S Antilles-Guyane Septembre 5 EXERCICE Commun à tous les candidats 6 points Soit n un entier naturel non nul. On considère la fonction f n définie et dérivable sur l ensemble R

Plus en détail

Durée : 1 heure 30 Épreuves communes ENI GEIPI POLYTECH Série S 11 mai 2016

Durée : 1 heure 30 Épreuves communes ENI GEIPI POLYTECH Série S 11 mai 2016 Durée : 1 heure 30 Épreuves communes ENI GEIPI POLYTECH Série S 11 mai 2016 Nous vous conseillons de répartir équitablement les 3 heures d épreuves entre les sujets de mathématiques et de physique-chimie

Plus en détail

1 Tests d ajustement. 2 Tests d indépendance. 3 Application aux réseaux bayésiens. 4 Maximum de vraisemblance. d 2 valeur prise par D(n)

1 Tests d ajustement. 2 Tests d indépendance. 3 Application aux réseaux bayésiens. 4 Maximum de vraisemblance. d 2 valeur prise par D(n) Plan du cours n 4 RFIDEC cours 4 : Tests d ajustement, apprentissage de paramètres Christophe Gonzales LIP6 Université Paris 6, France 1 Tests d ajustement 2 Tests d indépendance 3 Application aux réseaux

Plus en détail

Classification non supervisée hiérarchique

Classification non supervisée hiérarchique 1/14 Classification non supervisée hiérarchique 5MS04 - Analyse des donnees Master 2 spécialité Statistiques Université Pierre et Marie Curie B. Michel 7 6 5 4 3 2 1 d e a b c 2/14 Introduction Données

Plus en détail

Sujets. Formulaire. mars Nouvelle-Calédonie. mai Amérique du nord. juin Antilles-Guyane. novembre Nouvelle-Calédonie

Sujets. Formulaire. mars Nouvelle-Calédonie. mai Amérique du nord. juin Antilles-Guyane. novembre Nouvelle-Calédonie PROAILITÉS Sujets mars 2012 mai 2012 juin 2012 novembre 2012 Nouvelle-Calédonie Amérique du nord Antilles-Guyane Nouvelle-Calédonie Formulaire PROAILITÉS 1 Nouvelle-Calédonie mars 2012. EXERCICE 2 On dispose

Plus en détail

Cours 4 : algorithmes de codage de source adaptatifs

Cours 4 : algorithmes de codage de source adaptatifs Cours 4 : algorithmes de codage de source adaptatifs 7 octobre 26 Théorie de l information Plan du cours 1. Motivation ; 2. Huffman adaptatif ; 3. Méthode de Gallager et Knuth ; 4. Méthode par dictionnaire

Plus en détail

1 Loi Uniforme. 2 Loi de Bernouilli. Mathématiques TD 3. Lois discrètes. Exercice 1)

1 Loi Uniforme. 2 Loi de Bernouilli. Mathématiques TD 3. Lois discrètes. Exercice 1) Université de Nice Sophia Antipolis Licence 3 et Master 1 Miage Mathématiques 2015 2016 TD 3 Lois discrètes 1 Loi Uniforme Exercice 1) 1. On jette une pièce équilibrée. On appelle X la variable aléatoire

Plus en détail

Correction du Baccalauréat S Centres étrangers 10 juin 2015

Correction du Baccalauréat S Centres étrangers 10 juin 2015 urée : 4 heures Correction du Baccalauréat S Centres étrangers 10 juin 015 A. P. M. E. P. Exercice 1 4 points Commun à tous les candidats Tous les résultats demandés dans cet exercice seront arrondis au

Plus en détail

Loi normale. I) Loi Normale N(0 ; 1) 1) Définition. 2) Théorème 1

Loi normale. I) Loi Normale N(0 ; 1) 1) Définition. 2) Théorème 1 Loi normale I) Loi Normale N(0 ; 1) 1) Définition Soit X une variable aléatoire à valeurs réelles. On dit qu elle suit la loi normale centrée réduite N(0 ; 1) si elle admet pour densité la fonction ϕ définie

Plus en détail

Baccalauréat S Centres étrangers 10 juin 2015

Baccalauréat S Centres étrangers 10 juin 2015 Corrigé Baccalauréat S Centres étrangers 10 juin 015 A. P. M. E. P. Exercice 1 Commun à tous les candidats 4 points Partie A 1. On a p = 0, 0 et n = 500. Un intervalle de fluctuation au seuil de 95 % est

Plus en détail

Vous traiterez les exercices suivants et les présenterez tous deux, dans l ordre de votre choix. Le temps de préparation est d une heure ; l

Vous traiterez les exercices suivants et les présenterez tous deux, dans l ordre de votre choix. Le temps de préparation est d une heure ; l Vous traiterez les exercices suivants et les présenterez tous deux, dans l ordre de votre choix. Le temps de préparation est d une heure ; l interrogation durera une demi-heure environ. Au début de l interrogation,

Plus en détail

Corrigé du baccalauréat S Liban 31 mai 2016

Corrigé du baccalauréat S Liban 31 mai 2016 Corrigé du baccalauréat S Liban 3 mai 6 Exercice points Commun à tous les candidats A. P. M. E. P.. a) Le triangle AI E est rectangle en I. Par le théorème de Pythagore, on en déduit E I = AE AI. D autre

Plus en détail

Partie A - Loi normale-

Partie A - Loi normale- Exercice 1 Les quatre parties de cet exercice peuvent être traitées de façon indépendantes. Une usine fabrique, en grandes quantité, des rondelles d acier pour la construction. Leur diamètre est exprimé

Plus en détail

des plans P 1 et P 2, a pour représentation paramétrique x = 4t 2

des plans P 1 et P 2, a pour représentation paramétrique x = 4t 2 Sujet Amérique du Nord 2013 EXERCICE 1. [5 pts] Géométrie On se place dans l espace muni d un repère orthonormé. On considère les points A(0 ; 4 ; 1), B(1 ; 3 ; 0), C(2 ; 1 ; 2) et D(7 ; 1 ; 4). 1. Démontrer

Plus en détail

Activité d'introduction des notions. Tireur d'élite?

Activité d'introduction des notions. Tireur d'élite? Activité d'introduction des notions. Tireur d'élite? 2) On suppose maintenant qu'il fait six tirs et on note Y le nombre de succès obtenus. (Y {0 ; 1 ;... ; 6}) Activité d'introduction des notions. Tireur

Plus en détail