Reconnaissance de forme: Rappels de probabilités et de statistiques

Documents pareils
Probabilités. I Petits rappels sur le vocabulaire des ensembles 2 I.1 Définitions... 2 I.2 Propriétés... 2

Exercices sur le chapitre «Probabilités»

TSTI 2D CH X : Exemples de lois à densité 1

Résolution d équations non linéaires

Programmes des classes préparatoires aux Grandes Ecoles

Economie de l incertain et de l information Partie 1 : Décision en incertain probabilisé Chapitre 1 : Introduction à l incertitude et théorie de

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

Probabilités sur un univers fini

Continuité en un point

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.

Moments des variables aléatoires réelles

Limites finies en un point

LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples.

Travaux dirigés d introduction aux Probabilités

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #12

Simulation de variables aléatoires

Théorème du point fixe - Théorème de l inversion locale

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Probabilité. Table des matières. 1 Loi de probabilité Conditions préalables Définitions Loi équirépartie...

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Licence MASS (Re-)Mise à niveau en Probabilités. Feuilles de 1 à 7

Couples de variables aléatoires discrètes

Correction du baccalauréat ES/L Métropole 20 juin 2014

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Calculs de probabilités conditionelles

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

Lois de probabilité. Anita Burgun

Capacité d un canal Second Théorème de Shannon. Théorie de l information 1/34

Probabilités sur un univers fini

Espérance conditionnelle

Probabilités III Introduction à l évaluation d options

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

Probabilités. Rappel : trois exemples. Exemple 2 : On dispose d un dé truqué. On sait que : p(1) = p(2) =1/6 ; p(3) = 1/3 p(4) = p(5) =1/12

Que faire lorsqu on considère plusieurs variables en même temps?

Qu est-ce qu une probabilité?

Coefficients binomiaux

3. Caractéristiques et fonctions d une v.a.

Texte Agrégation limitée par diffusion interne

CALCUL DES PROBABILITES

Calcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes.

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

P1 : Corrigés des exercices

Les indices à surplus constant

Méthodes de Simulation

Feuille d exercices 2 : Espaces probabilisés

Processus aléatoires avec application en finance

De même, le périmètre P d un cercle de rayon 1 vaut P = 2π (par définition de π). Mais, on peut démontrer (difficilement!) que

Attitude des ménages face au risque. M1 - Arnold Chassagnon, Université de Tours, PSE - Automne 2014

S initier aux probabilités simples «Question de chance!»

Exercices - Fonctions de plusieurs variables : corrigé. Pour commencer

I. Introduction. 1. Objectifs. 2. Les options. a. Présentation du problème.

Chapitre 2 Le problème de l unicité des solutions

Cours d Analyse. Fonctions de plusieurs variables

Introduction à la Statistique Inférentielle

Raisonnement probabiliste

Actuariat I ACT2121. septième séance. Arthur Charpentier. Automne charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free.

Image d un intervalle par une fonction continue

Théorie et Codage de l Information (IF01) exercices Paul Honeine Université de technologie de Troyes France

Exercices - Polynômes : corrigé. Opérations sur les polynômes

Cours de Tests paramétriques

I3, Probabilités 2014 Travaux Dirigés F BM F BM F BM F BM F B M F B M F B M F B M

Calcul fonctionnel holomorphe dans les algèbres de Banach

M2 IAD UE MODE Notes de cours (3)

Probabilités conditionnelles Loi binomiale

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

Probabilités. C. Charignon. I Cours 3

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

4. Martingales à temps discret

Le modèle de Black et Scholes

GEA II Introduction aux probabilités Poly. de révision. Lionel Darondeau

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Peut-on imiter le hasard?

3 Approximation de solutions d équations

Economie de l Incertain et des Incitations

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

LES GENERATEURS DE NOMBRES ALEATOIRES

Variables Aléatoires. Chapitre 2

Probabilités conditionnelles

Chapitre 3. Mesures stationnaires. et théorèmes de convergence

PROBABILITES ET STATISTIQUE I&II

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN

Probabilités Loi binomiale Exercices corrigés

Espaces probabilisés

Exo7. Probabilité conditionnelle. Exercices : Martine Quinio

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

3. Conditionnement P (B)

La classification automatique de données quantitatives

Calculs de probabilités avec la loi normale

Continuité et dérivabilité d une fonction

EI - EXERCICES DE PROBABILITES CORRIGES

Fonctions de plusieurs variables, intégrales multiples, et intégrales dépendant d un paramètre

Analyse en Composantes Principales

Loi binomiale Lois normales

S initier aux probabilités simples «Question de chance!»

CCP PSI Mathématiques 1 : un corrigé

FONCTIONS DE PLUSIEURS VARIABLES (Outils Mathématiques 4)

Chaînes de Markov au lycée

I. Polynômes de Tchebychev

Optimisation Discrète

Notion de fonction. Série 1 : Tableaux de données. Série 2 : Graphiques. Série 3 : Formules. Série 4 : Synthèse

Transcription:

Reconnaissance de forme: Rappels de probabilités et de statistiques 1 er février 2010

Plan 1 Introduction : pourquoi des probabilités? 2 Notions de probabilités 3 Statistiques et estimation

Introduction : pourquoi des probabilités? 1 Introduction : pourquoi des probabilités? Exemple... Une béquille quand l information est incomplète Une simplification du monde 2 Notions de probabilités 3 Statistiques et estimation

Introduction : pourquoi des probabilités? Exemple... Considérons une pièce de monnaie... on a une chance sur deux d avoir pile et une chance sur deux d avoir face... Signification??

Introduction : pourquoi des probabilités? Une béquille quand l information est incomplète En fait peut être que si je savais comment la pièce a été lancée, je pourrais savoir exactement si pile ou face. Pas d incertitude? Pas besoin de probabilités? Si! Introduction artificielle des probabilités pour quantifier quand même ce qu on ne sait pas mesurer.

Introduction : pourquoi des probabilités? Une simplification du monde Peut être que en fait la probabilité d avoir pile dépend des conditions de température et de pression... Dans ce cas je pourrais affiner mon modèle... Mais je n ai pas cette information... Alors j essaie de comprendre avec un modèle plus simple même si il ne correspond pas à la réalité.

Notions de probabilités 1 Introduction : pourquoi des probabilités? 2 Notions de probabilités Lien entre probabilité et intégration Notion d événement aléatoire Probabilité d un événement Variable aléatoire Définition Représentations : densité et fonction de répartition Les moments Les couples de variable aléatoire Dépendance et indépendance Formule de probabilité conditionnelle : Bayes Le produit scalaire : mesure de corrélation 3 Statistiques et estimation

Notions de probabilités Lien entre probabilité et intégration Dans un monde aléatoire, plusieurs choses sont possibles. Il est IMPOSSIBLE de dire dans la plupart des cas ce qui va se passer. Mais on peut dire quels sont les événements possibles et leur affecter une probabilité.

Notions de probabilités Lien entre probabilité et intégration Exemple : le jeu de cartes

Notions de probabilités Lien entre probabilité et intégration On tire une carte au hasard. Cela peut être :... une dame de pique... un as de trèfle... un as OU une dame... un coeur... Toutes ces possibilités sont des événements aléatoires On peut composer les événements entre eux (tout système d événement est stable par union, intersection, passage au complémentaire et à la limite).

Notions de probabilités Lien entre probabilité et intégration Dans un monde probabilisé, on ne sait pas ce qui va se passer mais on peut dire pour chaque événement si il va plus ou moins souvent se produire si on peut faire plusieur fois la même expérience. C est la notion de probabilité.

Notions de probabilités Lien entre probabilité et intégration On tire une carte au hasard de façon uniforme : Probabilités additives MAIS : P(DameOURoi) = P(Dame) + P(Roi) P(DameOUPique) = P(Dame) + P(Pique) P(DameETPique)

Notions de probabilités Lien entre probabilité et intégration Supposons maintenant que on rajoute 10 dames de pique dans notre jeu. Par ailleurs : P(DamedePique) = P(AsdePique) = On a effectué un changement de loi (on a modifié la probabilité des événements).

Notions de probabilités Variable aléatoire On reprend l exemple des cartes. On tire une carte c. Soit X(c) une fonction des événements qui vaut : 0 si la carte est entre 7 et 10 (petite carte) 1 si la carte est un valet, une dame ou un roi (carte moyenne) 2 si la carte est un as (bonne carte) On dit que X est une variable aléatoire.

Notions de probabilités Variable aléatoire De façon plus générale, on appelle variable aléatoire toute fonction réelle (ou dans R d ) des événements... Mais souvent on réécrit les événements en fonction de la variable aléatoire. En effet, on peut écrire les probabilités de chaque valeurs de la variable aléatoire, dont l image réciproque est un événement :

Notions de probabilités Variable aléatoire Si l espace des événements est discret (par exemple nombre de personne dans le groupe choisi) : Il suffit de connaître la probabilité de chaque événement élémentaire, les (p x ) x et on peut en déduire en sommant la probabilité de tous les événements. On peut définir la fonction de répartition comme : P(evennement < x) = p i i<x

Notions de probabilités Variable aléatoire Exemple de loi discrète : la loi de poisson P(evennement = x) = e λ λ k k!

Notions de probabilités Variable aléatoire FIGURE: Loi de poisson (distribution)

Notions de probabilités Variable aléatoire FIGURE: Loi de poisson (fonction de répartition)

Notions de probabilités Variable aléatoire Si l espace des événements est continu (par exemple la taille pour des individus) : Il faut connaître la densité de probabilité, c est à dire f(x) telle que : x F(x) = P(X < x) = f(x)dx On voit que f(x)dx est analogue aux p x. Par ailleurs, F est la fonction de répartition. Remarque : on peut utiliser la densite pour calculer la probabilité de tous les évènements.

Notions de probabilités Variable aléatoire Exemple de loi continue : la loi normale P(evenement = x) = 1 σ (x µ) 2 2π e σ 2

Notions de probabilités Variable aléatoire FIGURE: Loi normale (densité)

Notions de probabilités Variable aléatoire Espérance d une variable aléatoire : E(X) = p i x i = Intuition de valeur moyenne : Variance d une variable aléatoire : xf(x)dx V(X) = p i (x i EX) 2 = (x EX) 2 f(x)dx = EX 2 (EX) 2

Notions de probabilités Variable aléatoire Ces quantités sont des cas particulier de choses plus générales, les moments : Moment d ordre p : EX p

Notions de probabilités Les couples de variable aléatoire Soient X 1 et X 2 deux variables aléatoires. Comment modéliser des relations entre elles? Quelles genre de relations peut il y avoir?

Notions de probabilités Les couples de variable aléatoire Supposons que X 1 soit le poids et X 2 la taille d un individu. On peut supposer que si X 1 est grand, la probabilité que X 2 soit grand est grande aussi. Donc le fait de connaître X 1 nous donne des informations sur X 2... et réciproquement. Remarque : pas de notion de causalité

Notions de probabilités Les couples de variable aléatoire A l inverse, si X 1 est le premier jet d une pièce et X 2 le deuxième... la connaissance de l un ne renseigne pas sur l autre. Ces variables sont INDEPENDANTES. C est une notion très importante en statistiques : en effet, c est l indépendance et la répétition qui permettent l estimation (ou alors si dépendance il y a, cette dernière doit être controlée).

Notions de probabilités Les couples de variable aléatoire La notion de dépendance se retrouve bien sur en intégration. Deux évennements A et B sont : Indépendants si P(A B) = P(A)P(B) Dépendants sinon L indépendance signifie donc que on peut intégrer indépendamment.

Notions de probabilités Les couples de variable aléatoire On peut étendre cette propriété à deux variables aléatoires X 1 et X 2 : X 1 et X 2 sont indépendantes si A,B événements, P(X 1 A,X 2 B) = P X1,X 2 (A,B) = P X1 (A)P X2 (B) Dépendants sinon Il faut remarquer ici que les événements A et B peuvent être ou ne pas être sur le même espace, que les lois de X 1 et X 2 peuvent être différentes ou non, et que cela n a rien à voir avec la notion de dépendance qui vise uniquement à modéliser les liens entre X 1 et X 2.

Notions de probabilités Les couples de variable aléatoire Formules :

Notions de probabilités Les couples de variable aléatoire Si deux événements sont dépendants, on est intéressé à savoir comment la connaissance de la réalisation de l un des deux doit influencer notre appréhension de l autre. On veut conditionner. On note : P(A/B) c est à dire probabilité de A "sachant" B.

Notions de probabilités Les couples de variable aléatoire Si A et B sont deux événements, on aura toujours : P(A, B) = P(A B)P(B) Si A et B sont indépendants, P(A B) = P(A)

Notions de probabilités Les couples de variable aléatoire Formules :

Notions de probabilités Les couples de variable aléatoire En pratique il est très compliqué de vérifier si deux variables aléatoires sont dépendantes, et encore plus de quantifier cette dépendance. En effet cela demande de connaître la loi conditionnelle. Il faut trouver un outil pour mesurer la liaison entre deux variables qui, si il est moins précis, sera plus souple.

Notions de probabilités Les couples de variable aléatoire La racine carrée du moment d ordre 2 d une variable aléatoire EX 2, possède les propriétés d une norme. On peut définir le produit scalaire associé pour deux variables aléatoires évoluant dans le même espace : E(X 1 X 2 ) Cette quantité peut mesurer les relations entre X 1 et X 2. En effet : X 1 X 2 = E(X 1,X 2 ) = E(X 1 )E(X 2 ) ATTENTION : il n y a pas équivalence en général.

Notions de probabilités Les couples de variable aléatoire On peut définir covariance et corrélation :

Notions de probabilités Les couples de variable aléatoire En pratique on réalise les fameux tableaux croisés pour mesurer les dépendances entre variables aléatoires.

Statistiques et estimation 1 Introduction : pourquoi des probabilités? 2 Notions de probabilités 3 Statistiques et estimation Différence entre statistiques et probabilités Echantillon Estimation Théorèmes limites Loi des grands nombres Théorème central limite Vraisemblance Définition Maximum de vraisemblance Convergence Tests et intervalles de confiance Tests Intervalles de confiance

Statistiques et estimation Différence entre statistiques et probabilités Il est rare de rencontrer une variable aléatoire...... Mais courant de disposer d un échantillon. On espère que ce dernier est représentatif de la loi. Notion d indépendance : très importante pour disposer d évènements répétés.

Statistiques et estimation Différence entre statistiques et probabilités Echantillon représentatif?

Statistiques et estimation Différence entre statistiques et probabilités Les probabilités travaillent avec des variables aléatoires, et les statistiques avec des échantillons. Les probabilités s intéressent aux lois, les statistiques aux théorèmes limites. Les probabilités modélisent, les statistiques utilisent les probabilités pour estimer.

Statistiques et estimation Différence entre statistiques et probabilités Reprenons la pièce...... Et supposons qu un tricheur joue. On a envie de savoir dans quelle mesure il triche...... Donc quelle est la proportion moyenne de pile et de face. Pour cela il faut estimer cette quantité à l aide d un échantillon de plusieurs lancers. Si cet échantillon est "représentatif", on devrait pouvoir estimer cette valeur.

Statistiques et estimation Différence entre statistiques et probabilités Par exemple pour la pièce supposons que on observe 1 si la pièce est tombée sur face et 0 si elle est tombée sur pile. On observe plusieurs lancers : X 1,...,X N est notre échantillon. On suppose que nos lancers sont indépendants et que X i B(p). on veut estimer p. En fait, E(X i ) = p On peut estimer p par la moyenne empirique : 1 N X i

Statistiques et estimation Différence entre statistiques et probabilités On peut de même construire des estimateurs de tous les moments, notemment la variance :

Statistiques et estimation Différence entre statistiques et probabilités De façon plus générale, ont peut estimer l espérance de toute fonction de notre variable aléatoire si elle est suffisamment régulière et "pas trop grande".

Statistiques et estimation Différence entre statistiques et probabilités Mais qu est ce qu un échantillon représentatif?

Statistiques et estimation Théorèmes limites On dispose de beaucoup de variables aléatoires indépendantes de même loi, de carré intégrable. 1 N X i E(X)

Statistiques et estimation Théorèmes limites On dispose de beaucoup de variables aléatoires indépendantes de même loi, de carré intégrable. On note σ 2 la variance. N( 1 N X i EX) N(0,σ 2 ) La loi normale est une loi très importante...

Statistiques et estimation Théorèmes limites Le TCL permet de donner une vitesse de convergence, en N, pour la loi des grands nombres. Il permettra de construire des tests et des intervalles de confiance pour quantifier la précision de l estimation.

Statistiques et estimation Théorèmes limites On peut de même construire ces deux théorèmes pour toute transformation des observations suffisamment régulière et "pas trop grande" :

Statistiques et estimation Vraisemblance Lorsque l on est face à un phénomène dont le résultat est incertain, on a envie de le modéliser par une loi de probabilité. On dit d un modèle qu il est paramétrique si, au lieu de dire que nos observations suivent une loi précise, on dit qu elles peuvent suivre un ensemble de lois indexées par un ou des paramètres.

Statistiques et estimation Vraisemblance Exemple de la pièce :

Statistiques et estimation Vraisemblance L objectif est d estimer ce paramètre à l aide d un échantillon. Pour la pièce, on peut prendre la moyenne empirique, mais uniquement car le paramètre que l on veut estimer est également la moyenne de notre distribution. Que faire sans ce constat?

Statistiques et estimation Vraisemblance Dans un cas général, on définit ce que l on appelle la vraisemblance de notre modèle qui n est autre que la probabilité sous le modèle paramétré de notre échantillon : L(X 1 = x 1,...X N = x N ;p) = P p (X 1,...,X n ) Si nos variables sont indépendantes : L(X 1 = x 1,...X N = X N ;p) = P p (X i = x i ) i

Statistiques et estimation Vraisemblance Exemple de la pièce :

Statistiques et estimation Vraisemblance On veut choisir la valeur du paramètre qui est la plus "vraisemblable" pour l échantillon dont on dispose. Une approche logique consiste à maximiser cette probabilité suivant les paramètres. On fait le maximum de vraisemblance. En pratique on maximise la log-vraisemblance. Il y a des cas pour lesquels cette approche ne fournira pas de résultats...

Statistiques et estimation Vraisemblance Calcul du maximum de vraisemblance pour la pièce :

Statistiques et estimation Vraisemblance Cette technique se justifie intuitivement, encore faut il s assurer de la convergence de l estimateur obtenu... On peut envisager le démontrer à la main au cas par cas en calculant espérance et variance de l estimateur et en appliquant le TCL et la loi des grands nombres...

Statistiques et estimation Vraisemblance... Mais c est long. En fait si on considère tout estimateur du maximum de vraisembmance comme une fonction implicite de nos données, on peut comprendre pourquoi dans le cas général l estimateur va converger à l aide de la LGN et du TCL.

Statistiques et estimation Tests et intervalles de confiance Estimer, oui. Mais avec quelle précision? Questions que l on peut se poser : Cette hypothèse pour l estimateur est elle vraisemblable? Dans quel intervalle se trouve probablement la vraie valeur?

Statistiques et estimation Tests et intervalles de confiance Principe du test : On dispose d une hypothèse H 0. On veut tester voir si H 0 est probable ou pas du tout avec une précision donnée. Exemple : H 0 : la moyenne de cette loi normale est 0

Statistiques et estimation Tests et intervalles de confiance Vocabulaire : Erreur de type 1 : la probabilité de rejeter à tort l hypothèse nulle lorsqu elle est vraie. Erreur de type 2 : la possibilité d accepter à tort l hypothèse nulle lorsqu elle est fausse. Test classique : On fixe l erreur de première espèce au niveau α. Test asymétrique (on privilégie H 0 ). Remarque : Existence d autres types de tests notemment des tests bayesiens.

Statistiques et estimation Tests et intervalles de confiance FIGURE: Test d hypothèses

Statistiques et estimation Tests et intervalles de confiance Exemple : encore la pièce

Statistiques et estimation Tests et intervalles de confiance On estime un paramètre. C est une valeur précise. Intuitivement, la probabilité que le vrai paramètre vaille exactement le paramètre observé est nulle! On veut trouver un intervalle ou la probabilité que le vrai paramètre soit est grande.

Statistiques et estimation Tests et intervalles de confiance FIGURE: Intervalle de confiance

Statistiques et estimation Tests et intervalles de confiance Exemple : toujours la pièce