Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux 4 2013-2014

Documents pareils

Lois de probabilité. Anita Burgun

VI. Tests non paramétriques sur un échantillon

Tests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples.

TESTS D HYPOTHÈSE FONDÉS SUR LE χ².

Fluctuation d une fréquence selon les échantillons - Probabilités

1. Déterminer l ensemble U ( univers des possibles) et l ensemble E ( événement) pour les situations suivantes.

Estimation: intervalle de fluctuation et de confiance. Mars IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

Principe d un test statistique

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

Le chi carré. Le sommaire. Approche quantitative

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Chapitre 3 : INFERENCE

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

Analyse de la variance Comparaison de plusieurs moyennes

TESTS D'HYPOTHESES Etude d'un exemple

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

Calculs de probabilités conditionelles

Probabilités. I Petits rappels sur le vocabulaire des ensembles 2 I.1 Définitions... 2 I.2 Propriétés... 2

La nouvelle planification de l échantillonnage

Exercices supplémentaires sur l introduction générale à la notion de probabilité

Probabilités conditionnelles Loi binomiale

INF6304 Interfaces Intelligentes

Probabilités sur un univers fini

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Probabilités sur un univers fini

Estimation et tests statistiques, TD 5. Solutions

Item 169 : Évaluation thérapeutique et niveau de preuve

Raisonnement probabiliste

Chap 4. La fonction exponentielle Terminale S. Lemme : Si est une fonction dérivable sur R telle que : = et 0! = 1 alors ne s annule pas sur R.

Value at Risk. CNAM GFN 206 Gestion d actifs et des risques. Grégory Taillard. 27 février & 13 mars 20061

Il y a trois types principaux d analyse des résultats : l analyse descriptive, l analyse explicative et l analyse compréhensive.

Exemple On lance une pièce de monnaie trois fois de suite. Calculer la probabilité d obtenir exactement deux fois pile.

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Les probabilités. Guide pédagogique Le présent guide sert de complément à la série d émissions intitulée Les probabilités produite par TFO.

Table des matières. I Mise à niveau 11. Préface

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

Couples de variables aléatoires discrètes

Introduction à la statistique non paramétrique

Accès à l éducation postsecondaire : Comparaison entre l Ontario et d autres régions

Probabilités. Rappel : trois exemples. Exemple 2 : On dispose d un dé truqué. On sait que : p(1) = p(2) =1/6 ; p(3) = 1/3 p(4) = p(5) =1/12

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Chapitre 3. Les distributions à deux variables

T de Student Khi-deux Corrélation

Soutenance de stage Laboratoire des Signaux et Systèmes

Statistique : Résumé de cours et méthodes

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Etude des propriétés empiriques du lasso par simulations

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Document d orientation sur les allégations issues d essais de non-infériorité

Introduction à l approche bootstrap

Les probabilités. Chapitre 18. Tester ses connaissances

PROBABILITES ET STATISTIQUE I&II

LES GENERATEURS DE NOMBRES ALEATOIRES

Introduction au Calcul des Probabilités

Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.

TABLE DES MATIERES. C Exercices complémentaires 42

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

LES DECIMALES DE π BERNARD EGGER

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888

Probabilités conditionnelles Exercices corrigés

EVALUATION DE LA QUALITE DES SONDAGES EN LIGNE : CAS D UN SONDAGE D OPINION AU BURKINA FASO

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

S initier aux probabilités simples «Question de chance!»

Correction du baccalauréat ES/L Métropole 20 juin 2014

Limitations of the Playstation 3 for High Performance Cluster Computing

Précision d un résultat et calculs d incertitudes

Probabilités Loi binomiale Exercices corrigés

Université Paris 8 Introduction aux probabilités Licence Informatique Exercices Ph. Guillot. 1 Ensemble fondamental loi de probabilité

Variables Aléatoires. Chapitre 2

La simulation probabiliste avec Excel

TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options

Logiciel XLSTAT version rue Damrémont PARIS

Biostatistiques : Petits effectifs

Cours de Tests paramétriques

Nombres premiers. Comment reconnaître un nombre premier? Mais...

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring

USAGE DES RESEAUX SOCIAUX PAR LES APPRENANTS EN COTE D IVOIRE

La fumée de tabac secondaire (FTS) en Mauricie et au Centre-du- Québec, indicateurs du plan commun tirés de l ESCC de

Package TestsFaciles

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

Enquête auprès des parents

En 2014, comment mener à bien une enquête aléatoire en population générale par téléphone?

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Tout ce que vous n avez jamais voulu savoir sur le χ 2 sans jamais avoir eu envie de le demander

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Feuille d exercices 2 : Espaces probabilisés

LES FRANÇAIS ET LA COMPLEMENTAIRE SANTE

IFT3245. Simulation et modèles

Formation appliquée aux missions d'expertises sinistres PLAN DE FORMATION

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

Moments des variables aléatoires réelles

Programme des Nations Unies pour l'environnement

Guide de l utilisateur. Synchronisation de l Active Directory

Cours 9 : Plans à plusieurs facteurs

Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants)

Travaux dirigés d introduction aux Probabilités

Transcription:

Tests du χ 2 Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux 4 2013-2014 A. Lourme http://alexandrelourme.free.fr

Outline Comparaison de plusieurs échantillons Indépendance de deux variables qualitatives

Un exemple Le dé est-il truqué? On lance cent fois le même dé : face 1 2 3 4 5 6 effectif observé 7 18 26 15 18 16

Un exemple Le dé est-il truqué? On lance cent fois le même dé : face 1 2 3 4 5 6 effectif observé 7 18 26 15 18 16 Supposons que le dé n est pas truqué : face 1 2 3 4 5 6 effectif observé 7 18 26 15 18 16 fréquence observée 0, 07 0, 18 0, 26 0, 15 0, 18 0, 16 fréquence théorique 1/6 1/6 1/6 1/6 1/6 1/6 L écart entre fréquences théoriques et fréquences observées est dû seulement à l échantillonnage.

Un exemple Le dé est-il truqué? On lance cent fois le même dé : face 1 2 3 4 5 6 effectif observé 7 18 26 15 18 16 Supposons que le dé n est pas truqué : face 1 2 3 4 5 6 effectif observé 7 18 26 15 18 16 fréquence observée 0, 07 0, 18 0, 26 0, 15 0, 18 0, 16 fréquence théorique 1/6 1/6 1/6 1/6 1/6 1/6 L écart entre fréquences théoriques et fréquences observées est dû seulement à l échantillonnage. Comment mesurer l écart entre fréquences observées et théoriques?

Un exemple Le dé est-il truqué? On lance cent fois le même dé : face 1 2 3 4 5 6 effectif observé 7 18 26 15 18 16 Supposons que le dé n est pas truqué : face 1 2 3 4 5 6 effectif observé 7 18 26 15 18 16 fréquence observée 0, 07 0, 18 0, 26 0, 15 0, 18 0, 16 fréquence théorique 1/6 1/6 1/6 1/6 1/6 1/6 L écart entre fréquences théoriques et fréquences observées est dû seulement à l échantillonnage. Comment mesurer l écart entre fréquences observées et théoriques? En deçà/au delà de quel écart décide-t-on que le dé est truqué?

La théorie Loi multinomiale & test du χ 2 On considère r valeurs/classes/modalités v i (i = 1,...,r) ; chacune des n unités d un échantillon aléatoire est affectée à v i avec probabilité p i ( r i=1 p i = 1). a voir Saporta G., Probabilités Analyse de Données et Statistique (1990), Ed. TECHNIP, pp. 97-98

La théorie Loi multinomiale & test du χ 2 On considère r valeurs/classes/modalités v i (i = 1,...,r) ; chacune des n unités d un échantillon aléatoire est affectée à v i avec probabilité p i ( r i=1 p i = 1). Le nombre N i d unités affectées à v i ( r i=1 N i = n) est aléatoire et N = (N 1,...,N r) est distribué selon la loi multinomiale M(n;(p 1 ;...; p r)). a voir Saporta G., Probabilités Analyse de Données et Statistique (1990), Ed. TECHNIP, pp. 97-98

La théorie Loi multinomiale & test du χ 2 On considère r valeurs/classes/modalités v i (i = 1,...,r) ; chacune des n unités d un échantillon aléatoire est affectée à v i avec probabilité p i ( r i=1 p i = 1). Le nombre N i d unités affectées à v i ( r i=1 N i = n) est aléatoire et N = (N 1,...,N r) est distribué selon la loi multinomiale M(n;(p 1 ;...; p r)). valeur/classe/modalité v 1 v 2... v r effectif observé N 1 N 2... N r effectif théorique np 1 np 2... np r a voir Saporta G., Probabilités Analyse de Données et Statistique (1990), Ed. TECHNIP, pp. 97-98

La théorie Loi multinomiale & test du χ 2 On considère r valeurs/classes/modalités v i (i = 1,...,r) ; chacune des n unités d un échantillon aléatoire est affectée à v i avec probabilité p i ( r i=1 p i = 1). Le nombre N i d unités affectées à v i ( r i=1 N i = n) est aléatoire et N = (N 1,...,N r) est distribué selon la loi multinomiale M(n;(p 1 ;...; p r)). valeur/classe/modalité v 1 v 2... v r effectif observé N 1 N 2... N r effectif théorique np 1 np 2... np r On en déduit a : r D = (N i np i ) 2 /(np i ) L χ 2 r 1 (1) i=1 a voir Saporta G., Probabilités Analyse de Données et Statistique (1990), Ed. TECHNIP, pp. 97-98

La théorie Loi multinomiale & test du χ 2 On considère r valeurs/classes/modalités v i (i = 1,...,r) ; chacune des n unités d un échantillon aléatoire est affectée à v i avec probabilité p i ( r i=1 p i = 1). Le nombre N i d unités affectées à v i ( r i=1 N i = n) est aléatoire et N = (N 1,...,N r) est distribué selon la loi multinomiale M(n;(p 1 ;...; p r)). valeur/classe/modalité v 1 v 2... v r effectif observé N 1 N 2... N r effectif théorique np 1 np 2... np r On en déduit a : D = r (N i np i ) 2 /(np i ) L χ 2 r 1 (1) i=1 (1) permet de définir un test (asymptotique) du χ 2 comparant (p 1,...,p r) à une valeur de référence (p 0 1,...,p0 r ) ]0, 1[r : a voir Saporta G., Probabilités Analyse de Données et Statistique (1990), Ed. TECHNIP, pp. 97-98

La théorie Loi multinomiale & test du χ 2 On considère r valeurs/classes/modalités v i (i = 1,...,r) ; chacune des n unités d un échantillon aléatoire est affectée à v i avec probabilité p i ( r i=1 p i = 1). Le nombre N i d unités affectées à v i ( r i=1 N i = n) est aléatoire et N = (N 1,...,N r) est distribué selon la loi multinomiale M(n;(p 1 ;...; p r)). valeur/classe/modalité v 1 v 2... v r effectif observé N 1 N 2... N r effectif théorique np 1 np 2... np r On en déduit a : D = r (N i np i ) 2 /(np i ) L χ 2 r 1 (1) i=1 (1) permet de définir un test (asymptotique) du χ 2 comparant (p 1,...,p r) à une valeur de référence (p 0 1,...,p0 r ) ]0, 1[r : le test : H 0 : i, p i = p 0 i vs H 1 : i, p i p 0 i a voir Saporta G., Probabilités Analyse de Données et Statistique (1990), Ed. TECHNIP, pp. 97-98

La théorie Loi multinomiale & test du χ 2 On considère r valeurs/classes/modalités v i (i = 1,...,r) ; chacune des n unités d un échantillon aléatoire est affectée à v i avec probabilité p i ( r i=1 p i = 1). Le nombre N i d unités affectées à v i ( r i=1 N i = n) est aléatoire et N = (N 1,...,N r) est distribué selon la loi multinomiale M(n;(p 1 ;...; p r)). valeur/classe/modalité v 1 v 2... v r effectif observé N 1 N 2... N r effectif théorique np 1 np 2... np r On en déduit a : D = r (N i np i ) 2 /(np i ) L χ 2 r 1 (1) i=1 (1) permet de définir un test (asymptotique) du χ 2 comparant (p 1,...,p r) à une valeur de référence (p 0 1,...,p0 r ) ]0, 1[r : le test : H 0 : i, p i = p 0 i vs H 1 : i, p i p 0 i la statistique de test : D 0 = r i=1 (N i np 0 i )2 /(np 0 i ) ap χ2 r 1 sous H 0 a voir Saporta G., Probabilités Analyse de Données et Statistique (1990), Ed. TECHNIP, pp. 97-98

La théorie Loi multinomiale & test du χ 2 On considère r valeurs/classes/modalités v i (i = 1,...,r) ; chacune des n unités d un échantillon aléatoire est affectée à v i avec probabilité p i ( r i=1 p i = 1). Le nombre N i d unités affectées à v i ( r i=1 N i = n) est aléatoire et N = (N 1,...,N r) est distribué selon la loi multinomiale M(n;(p 1 ;...; p r)). valeur/classe/modalité v 1 v 2... v r effectif observé N 1 N 2... N r effectif théorique np 1 np 2... np r On en déduit a : D = r (N i np i ) 2 /(np i ) L χ 2 r 1 (1) i=1 (1) permet de définir un test (asymptotique) du χ 2 comparant (p 1,...,p r) à une valeur de référence (p 0 1,...,p0 r ) ]0, 1[r : le test : H 0 : i, p i = p 0 i vs H 1 : i, p i p 0 i la statistique de test : D 0 = r i=1 (N i np 0 i )2 /(np 0 i ) ap χ2 r 1 sous H 0 zone de rejet de H 0 au seuil α : D 0 > χ 2 r 1;1 α a voir Saporta G., Probabilités Analyse de Données et Statistique (1990), Ed. TECHNIP, pp. 97-98

Exercice 1. Le dé est-il truqué? face 1 2 3 4 5 6 effectif observé 7 18 26 15 18 16 FALSE) b sous R, le quantile χ 2 5;0,99 est donné par qchisq(0.99, 5, ncp = 0, lower.tail = TRUE, log.p =

Exercice 1. Le dé est-il truqué? face 1 2 3 4 5 6 effectif observé 7 18 26 15 18 16 effectif théorique 100/6 100/6 100/6 100/6 100/6 100/6 FALSE) b sous R, le quantile χ 2 5;0,99 est donné par qchisq(0.99, 5, ncp = 0, lower.tail = TRUE, log.p =

Exercice 1. Le dé est-il truqué? face 1 2 3 4 5 6 effectif observé 7 18 26 15 18 16 effectif théorique 100/6 100/6 100/6 100/6 100/6 100/6 avant de lancer le dé Chacun des 100 lancers (n = 100) fera apparaître l une des six faces (r = 6). N i : nbre aléatoire d apparitions de la face i au cours des 100 lancers. FALSE) b sous R, le quantile χ 2 5;0,99 est donné par qchisq(0.99, 5, ncp = 0, lower.tail = TRUE, log.p =

Exercice 1. Le dé est-il truqué? face 1 2 3 4 5 6 effectif observé 7 18 26 15 18 16 effectif théorique 100/6 100/6 100/6 100/6 100/6 100/6 avant de lancer le dé Chacun des 100 lancers (n = 100) fera apparaître l une des six faces (r = 6). N i : nbre aléatoire d apparitions de la face i au cours des 100 lancers. Si le dé est équilibré la probabilité p i d apparition de la face i est 1/6 pour tout i. FALSE) b sous R, le quantile χ 2 5;0,99 est donné par qchisq(0.99, 5, ncp = 0, lower.tail = TRUE, log.p =

Exercice 1. Le dé est-il truqué? face 1 2 3 4 5 6 effectif observé 7 18 26 15 18 16 effectif théorique 100/6 100/6 100/6 100/6 100/6 100/6 avant de lancer le dé Chacun des 100 lancers (n = 100) fera apparaître l une des six faces (r = 6). N i : nbre aléatoire d apparitions de la face i au cours des 100 lancers. Si le dé est équilibré la probabilité p i d apparition de la face i est 1/6 pour tout i. le test : H 0 : i, p i = 1/6 (dé équilibré) vs H 1 : i, p i 1/6 (dé truqué) FALSE) b sous R, le quantile χ 2 5;0,99 est donné par qchisq(0.99, 5, ncp = 0, lower.tail = TRUE, log.p =

Exercice 1. Le dé est-il truqué? face 1 2 3 4 5 6 effectif observé 7 18 26 15 18 16 effectif théorique 100/6 100/6 100/6 100/6 100/6 100/6 avant de lancer le dé Chacun des 100 lancers (n = 100) fera apparaître l une des six faces (r = 6). N i : nbre aléatoire d apparitions de la face i au cours des 100 lancers. Si le dé est équilibré la probabilité p i d apparition de la face i est 1/6 pour tout i. le test : H 0 : i, p i = 1/6 (dé équilibré) vs H 1 : i, p i 1/6 (dé truqué) la statistique de test : D 0 = 6 i=1 (N i 100/6) 2 /(100/6) ap χ 2 5 sous H 0 FALSE) b sous R, le quantile χ 2 5;0,99 est donné par qchisq(0.99, 5, ncp = 0, lower.tail = TRUE, log.p =

Exercice 1. Le dé est-il truqué? face 1 2 3 4 5 6 effectif observé 7 18 26 15 18 16 effectif théorique 100/6 100/6 100/6 100/6 100/6 100/6 avant de lancer le dé Chacun des 100 lancers (n = 100) fera apparaître l une des six faces (r = 6). N i : nbre aléatoire d apparitions de la face i au cours des 100 lancers. Si le dé est équilibré la probabilité p i d apparition de la face i est 1/6 pour tout i. le test : H 0 : i, p i = 1/6 (dé équilibré) vs H 1 : i, p i 1/6 (dé truqué) la statistique de test : D 0 = 6 i=1 (N i 100/6) 2 /(100/6) ap χ 2 5 sous H 0 si H 0 est vraie on a (environ) 1 chance sur 100 d observer : D 0 > χ 2 5;0,99 FALSE) b sous R, le quantile χ 2 5;0,99 est donné par qchisq(0.99, 5, ncp = 0, lower.tail = TRUE, log.p =

Exercice 1. Le dé est-il truqué? face 1 2 3 4 5 6 effectif observé 7 18 26 15 18 16 effectif théorique 100/6 100/6 100/6 100/6 100/6 100/6 avant de lancer le dé Chacun des 100 lancers (n = 100) fera apparaître l une des six faces (r = 6). N i : nbre aléatoire d apparitions de la face i au cours des 100 lancers. Si le dé est équilibré la probabilité p i d apparition de la face i est 1/6 pour tout i. le test : H 0 : i, p i = 1/6 (dé équilibré) vs H 1 : i, p i 1/6 (dé truqué) la statistique de test : D 0 = 6 i=1 (N i 100/6) 2 /(100/6) ap χ 2 5 sous H 0 si H 0 est vraie on a (environ) 1 chance sur 100 d observer : D 0 > χ 2 5;0,99 une fois le dé lancé FALSE) b sous R, le quantile χ 2 5;0,99 est donné par qchisq(0.99, 5, ncp = 0, lower.tail = TRUE, log.p =

Exercice 1. Le dé est-il truqué? face 1 2 3 4 5 6 effectif observé 7 18 26 15 18 16 effectif théorique 100/6 100/6 100/6 100/6 100/6 100/6 avant de lancer le dé Chacun des 100 lancers (n = 100) fera apparaître l une des six faces (r = 6). N i : nbre aléatoire d apparitions de la face i au cours des 100 lancers. Si le dé est équilibré la probabilité p i d apparition de la face i est 1/6 pour tout i. le test : H 0 : i, p i = 1/6 (dé équilibré) vs H 1 : i, p i 1/6 (dé truqué) la statistique de test : D 0 = 6 i=1 (N i 100/6) 2 /(100/6) ap χ 2 5 sous H 0 si H 0 est vraie on a (environ) 1 chance sur 100 d observer : D 0 > χ 2 5;0,99 une fois le dé lancé D 0 = (7 100/6) 2 /(100/6) + + (16 100/6) 2 /(100/6) 11 FALSE) b sous R, le quantile χ 2 5;0,99 est donné par qchisq(0.99, 5, ncp = 0, lower.tail = TRUE, log.p =

Exercice 1. Le dé est-il truqué? face 1 2 3 4 5 6 effectif observé 7 18 26 15 18 16 effectif théorique 100/6 100/6 100/6 100/6 100/6 100/6 avant de lancer le dé Chacun des 100 lancers (n = 100) fera apparaître l une des six faces (r = 6). N i : nbre aléatoire d apparitions de la face i au cours des 100 lancers. Si le dé est équilibré la probabilité p i d apparition de la face i est 1/6 pour tout i. le test : H 0 : i, p i = 1/6 (dé équilibré) vs H 1 : i, p i 1/6 (dé truqué) la statistique de test : D 0 = 6 i=1 (N i 100/6) 2 /(100/6) ap χ 2 5 sous H 0 si H 0 est vraie on a (environ) 1 chance sur 100 d observer : D 0 > χ 2 5;0,99 une fois le dé lancé D 0 = (7 100/6) 2 /(100/6) + + (16 100/6) 2 /(100/6) 11 < χ 2 5;0,99 15b FALSE) b sous R, le quantile χ 2 5;0,99 est donné par qchisq(0.99, 5, ncp = 0, lower.tail = TRUE, log.p =

Exercice 1. Le dé est-il truqué? face 1 2 3 4 5 6 effectif observé 7 18 26 15 18 16 effectif théorique 100/6 100/6 100/6 100/6 100/6 100/6 avant de lancer le dé Chacun des 100 lancers (n = 100) fera apparaître l une des six faces (r = 6). N i : nbre aléatoire d apparitions de la face i au cours des 100 lancers. Si le dé est équilibré la probabilité p i d apparition de la face i est 1/6 pour tout i. le test : H 0 : i, p i = 1/6 (dé équilibré) vs H 1 : i, p i 1/6 (dé truqué) la statistique de test : D 0 = 6 i=1 (N i 100/6) 2 /(100/6) ap χ 2 5 sous H 0 si H 0 est vraie on a (environ) 1 chance sur 100 d observer : D 0 > χ 2 5;0,99 une fois le dé lancé D 0 = (7 100/6) 2 /(100/6) + + (16 100/6) 2 /(100/6) 11 < χ 2 5;0,99 15b interprétation ou le dé est équilibré (H 0 vraie) : la valeur D 0 = 11 observée est l une des 99% inférieures à χ 2 5;0,99 ou bien le dé est truqué. FALSE) b sous R, le quantile χ 2 5;0,99 est donné par qchisq(0.99, 5, ncp = 0, lower.tail = TRUE, log.p =

Exercice 1. Le dé est-il truqué? face 1 2 3 4 5 6 effectif observé 7 18 26 15 18 16 effectif théorique 100/6 100/6 100/6 100/6 100/6 100/6 avant de lancer le dé Chacun des 100 lancers (n = 100) fera apparaître l une des six faces (r = 6). N i : nbre aléatoire d apparitions de la face i au cours des 100 lancers. Si le dé est équilibré la probabilité p i d apparition de la face i est 1/6 pour tout i. le test : H 0 : i, p i = 1/6 (dé équilibré) vs H 1 : i, p i 1/6 (dé truqué) la statistique de test : D 0 = 6 i=1 (N i 100/6) 2 /(100/6) ap χ 2 5 sous H 0 si H 0 est vraie on a (environ) 1 chance sur 100 d observer : D 0 > χ 2 5;0,99 une fois le dé lancé D 0 = (7 100/6) 2 /(100/6) + + (16 100/6) 2 /(100/6) 11 < χ 2 5;0,99 15b interprétation ou le dé est équilibré (H 0 vraie) : la valeur D 0 = 11 observée est l une des 99% inférieures à χ 2 5;0,99 ou bien le dé est truqué. décision FALSE) b sous R, le quantile χ 2 5;0,99 est donné par qchisq(0.99, 5, ncp = 0, lower.tail = TRUE, log.p =

Exercice 1. Le dé est-il truqué? face 1 2 3 4 5 6 effectif observé 7 18 26 15 18 16 effectif théorique 100/6 100/6 100/6 100/6 100/6 100/6 avant de lancer le dé Chacun des 100 lancers (n = 100) fera apparaître l une des six faces (r = 6). N i : nbre aléatoire d apparitions de la face i au cours des 100 lancers. Si le dé est équilibré la probabilité p i d apparition de la face i est 1/6 pour tout i. le test : H 0 : i, p i = 1/6 (dé équilibré) vs H 1 : i, p i 1/6 (dé truqué) la statistique de test : D 0 = 6 i=1 (N i 100/6) 2 /(100/6) ap χ 2 5 sous H 0 si H 0 est vraie on a (environ) 1 chance sur 100 d observer : D 0 > χ 2 5;0,99 une fois le dé lancé D 0 = (7 100/6) 2 /(100/6) + + (16 100/6) 2 /(100/6) 11 < χ 2 5;0,99 15b interprétation ou le dé est équilibré (H 0 vraie) : la valeur D 0 = 11 observée est l une des 99% inférieures à χ 2 5;0,99 ou bien le dé est truqué. décision Au seuil de 1% on ne rejette pas l hypothèse H 0 : le dé est équilibré. FALSE) b sous R, le quantile χ 2 5;0,99 est donné par qchisq(0.99, 5, ncp = 0, lower.tail = TRUE, log.p =

Exercice 2. Adéquation à une loi exponentielle durée de vie [0; 1000] ]1000; 2000] ]2000; 3000] ]3000; 4000] ]4000; 5000] ]5000; 6000] effectif observé 9 10 12 8 6 5 La durée de vie des ampoules provient-elle de E(1/1000)?

Exercice 2. Adéquation à une loi exponentielle durée de vie [0; 1000] ]1000; 2000] ]2000; 3000] ]3000; 4000] ]4000; 5000] ]5000; 6000] effectif observé 9 10 12 8 6 5 La durée de vie des ampoules provient-elle de E(1/1000)? Six classes (r = 6) ; on y répartit la durée de vie d un échantillon aléatoire de 50 ampoules (n = 50). N i : le nbre aléatoire d ampoules dans la classe i.

Exercice 2. Adéquation à une loi exponentielle durée de vie [0; 1000] ]1000; 2000] ]2000; 3000] ]3000; 4000] ]4000; 5000] ]5000; 6000] effectif observé 9 10 12 8 6 5 La durée de vie des ampoules provient-elle de E(1/1000)? Six classes (r = 6) ; on y répartit la durée de vie d un échantillon aléatoire de 50 ampoules (n = 50). N i : le nbre aléatoire d ampoules dans la classe i. Si la durée de vie des ampoules est distribuée selon E(1/1000), la probabilité p i qu une ampoule soit dans la classe i est : e i+1 e i.

Exercice 2. Adéquation à une loi exponentielle durée de vie [0; 1000] ]1000; 2000] ]2000; 3000] ]3000; 4000] ]4000; 5000] ]5000; 6000] effectif observé 9 10 12 8 6 5 effectif théorique 31, 6 11, 6 4, 3 1, 6 0, 6 0, 2 La durée de vie des ampoules provient-elle de E(1/1000)? Six classes (r = 6) ; on y répartit la durée de vie d un échantillon aléatoire de 50 ampoules (n = 50). N i : le nbre aléatoire d ampoules dans la classe i. Si la durée de vie des ampoules est distribuée selon E(1/1000), la probabilité p i qu une ampoule soit dans la classe i est : e i+1 e i.

Exercice 2. Adéquation à une loi exponentielle durée de vie [0; 1000] ]1000; 2000] ]2000; 3000] ]3000; 4000] ]4000; 5000] ]5000; 6000] effectif observé 9 10 12 8 6 5 effectif théorique 31, 6 11, 6 4, 3 1, 6 0, 6 0, 2 La durée de vie des ampoules provient-elle de E(1/1000)? Six classes (r = 6) ; on y répartit la durée de vie d un échantillon aléatoire de 50 ampoules (n = 50). N i : le nbre aléatoire d ampoules dans la classe i. Si la durée de vie des ampoules est distribuée selon E(1/1000), la probabilité p i qu une ampoule soit dans la classe i est : e i+1 e i. le test : H 0 : i, p i = e i+1 e i vs H 1 : i, p i e i+1 e i

Exercice 2. Adéquation à une loi exponentielle durée de vie [0; 1000] ]1000; 2000] ]2000; 3000] ]3000; 4000] ]4000; 5000] ]5000; 6000] effectif observé 9 10 12 8 6 5 effectif théorique 31, 6 11, 6 4, 3 1, 6 0, 6 0, 2 La durée de vie des ampoules provient-elle de E(1/1000)? Six classes (r = 6) ; on y répartit la durée de vie d un échantillon aléatoire de 50 ampoules (n = 50). N i : le nbre aléatoire d ampoules dans la classe i. Si la durée de vie des ampoules est distribuée selon E(1/1000), la probabilité p i qu une ampoule soit dans la classe i est : e i+1 e i. le test : H 0 : i, p i = e i+1 e i vs H 1 : i, p i e i+1 e i la statistique de test : D 0 = 6 i=1 (N i 50 (e i+1 e i )) 2 /(50 (e i+1 e i ))

Exercice 2. Adéquation à une loi exponentielle durée de vie [0; 1000] ]1000; 2000] ]2000; 3000] ]3000; 4000] ]4000; 5000] ]5000; 6000] effectif observé 9 10 12 8 6 5 effectif théorique 31, 6 11, 6 4, 3 1, 6 0, 6 0, 2 La durée de vie des ampoules provient-elle de E(1/1000)? Six classes (r = 6) ; on y répartit la durée de vie d un échantillon aléatoire de 50 ampoules (n = 50). N i : le nbre aléatoire d ampoules dans la classe i. Si la durée de vie des ampoules est distribuée selon E(1/1000), la probabilité p i qu une ampoule soit dans la classe i est : e i+1 e i. le test : H 0 : i, p i = e i+1 e i vs H 1 : i, p i e i+1 e i la statistique de test : D 0 = 6 i=1 (N i 50 (e i+1 e i )) 2 /(50 (e i+1 e i )) sous H 0 : D 0 ap χ 2 5

Exercice 2. Adéquation à une loi exponentielle durée de vie [0; 1000] ]1000; 2000] ]2000; 3000] ]3000; 4000] ]4000; 5000] ]5000; 6000] effectif observé 9 10 12 8 6 5 effectif théorique 31, 6 11, 6 4, 3 1, 6 0, 6 0, 2 La durée de vie des ampoules provient-elle de E(1/1000)? Six classes (r = 6) ; on y répartit la durée de vie d un échantillon aléatoire de 50 ampoules (n = 50). N i : le nbre aléatoire d ampoules dans la classe i. Si la durée de vie des ampoules est distribuée selon E(1/1000), la probabilité p i qu une ampoule soit dans la classe i est : e i+1 e i. le test : H 0 : i, p i = e i+1 e i vs H 1 : i, p i e i+1 e i la statistique de test : D 0 = 6 i=1 (N i 50 (e i+1 e i )) 2 /(50 (e i+1 e i )) sous H 0 : D 0 ap χ 2 5 zone de rejet de H 0 au seuil de 10% : D 0 > χ 2 5;0,90

Exercice 2. Adéquation à une loi exponentielle durée de vie [0; 1000] ]1000; 2000] ]2000; 3000] ]3000; 4000] ]4000; 5000] ]5000; 6000] effectif observé 9 10 12 8 6 5 effectif théorique 31, 6 11, 6 4, 3 1, 6 0, 6 0, 2 La durée de vie des ampoules provient-elle de E(1/1000)? Six classes (r = 6) ; on y répartit la durée de vie d un échantillon aléatoire de 50 ampoules (n = 50). N i : le nbre aléatoire d ampoules dans la classe i. Si la durée de vie des ampoules est distribuée selon E(1/1000), la probabilité p i qu une ampoule soit dans la classe i est : e i+1 e i. le test : H 0 : i, p i = e i+1 e i vs H 1 : i, p i e i+1 e i la statistique de test : D 0 = 6 i=1 (N i 50 (e i+1 e i )) 2 /(50 (e i+1 e i )) sous H 0 : D 0 ap χ 2 5 zone de rejet de H 0 au seuil de 10% : D 0 > χ 2 5;0,90 D 0 = (9 31, 6) 2 /31, 6 + + (5 0, 2) 2 /0, 2 = 215, 0

Exercice 2. Adéquation à une loi exponentielle durée de vie [0; 1000] ]1000; 2000] ]2000; 3000] ]3000; 4000] ]4000; 5000] ]5000; 6000] effectif observé 9 10 12 8 6 5 effectif théorique 31, 6 11, 6 4, 3 1, 6 0, 6 0, 2 La durée de vie des ampoules provient-elle de E(1/1000)? Six classes (r = 6) ; on y répartit la durée de vie d un échantillon aléatoire de 50 ampoules (n = 50). N i : le nbre aléatoire d ampoules dans la classe i. Si la durée de vie des ampoules est distribuée selon E(1/1000), la probabilité p i qu une ampoule soit dans la classe i est : e i+1 e i. le test : H 0 : i, p i = e i+1 e i vs H 1 : i, p i e i+1 e i la statistique de test : D 0 = 6 i=1 (N i 50 (e i+1 e i )) 2 /(50 (e i+1 e i )) sous H 0 : D 0 ap χ 2 5 zone de rejet de H 0 au seuil de 10% : D 0 > χ 2 5;0,90 D 0 = (9 31, 6) 2 /31, 6 + + (5 0, 2) 2 /0, 2 = 215, 0> χ 2 5;0,90 9, 2.

Exercice 2. Adéquation à une loi exponentielle durée de vie [0; 1000] ]1000; 2000] ]2000; 3000] ]3000; 4000] ]4000; 5000] ]5000; 6000] effectif observé 9 10 12 8 6 5 effectif théorique 31, 6 11, 6 4, 3 1, 6 0, 6 0, 2 La durée de vie des ampoules provient-elle de E(1/1000)? Six classes (r = 6) ; on y répartit la durée de vie d un échantillon aléatoire de 50 ampoules (n = 50). N i : le nbre aléatoire d ampoules dans la classe i. Si la durée de vie des ampoules est distribuée selon E(1/1000), la probabilité p i qu une ampoule soit dans la classe i est : e i+1 e i. le test : H 0 : i, p i = e i+1 e i vs H 1 : i, p i e i+1 e i la statistique de test : D 0 = 6 i=1 (N i 50 (e i+1 e i )) 2 /(50 (e i+1 e i )) sous H 0 : D 0 ap χ 2 5 zone de rejet de H 0 au seuil de 10% : D 0 > χ 2 5;0,90 D 0 = (9 31, 6) 2 /31, 6 + + (5 0, 2) 2 /0, 2 = 215, 0> χ 2 5;0,90 9, 2. Au seuil de 10% on rejette l hypothèse H 0 selon laquelle la durée de vie des ampoules est distribuée selon la loi exponentielle E(1/1000).

Comparaison de plusieurs échantillons Outline Comparaison de plusieurs échantillons Indépendance de deux variables qualitatives

Indépendance de deux variables qualitatives Outline Comparaison de plusieurs échantillons Indépendance de deux variables qualitatives

Indépendance de deux variables qualitatives Un exemple Sexe & couleur des yeux : deux variables indépendantes? Un échantillon de 100 français : sexe couleur des yeux vert bleu marron garçon 10 11 28 fille 7 18 26 Tableau 1. effectifs conjoints

Indépendance de deux variables qualitatives Un exemple Sexe & couleur des yeux : deux variables indépendantes? Un échantillon de 100 français : sexe couleur des yeux vert bleu marron total garçon 10 11 28 49 fille 7 18 26 51 total 17 29 54 100 Tableau 1. effectifs conjoints

Indépendance de deux variables qualitatives Un exemple Sexe & couleur des yeux : deux variables indépendantes? Un échantillon de 100 français : sexe couleur des yeux vert bleu marron total garçon 10 11 28 49 fille 7 18 26 51 total 17 29 54 100 Tableau 1. effectifs conjoints couleur des yeux vert bleu marron total garçon 0, 10 0, 11 0, 28 0, 49 sexe fille 0, 07 0, 18 0, 26 0, 51 total 0, 17 0, 29 0, 54 1 Tableau 2. fréquences conjointes observées

Indépendance de deux variables qualitatives Un exemple Sexe & couleur des yeux : deux variables indépendantes? Un échantillon de 100 français : sexe couleur des yeux vert bleu marron total garçon 10 11 28 49 fille 7 18 26 51 total 17 29 54 100 Tableau 1. effectifs conjoints couleur des yeux vert bleu marron total garçon 0, 10 0, 11 0, 28 0, 49 sexe fille 0, 07 0, 18 0, 26 0, 51 total 0, 17 0, 29 0, 54 1 Tableau 2. fréquences conjointes observées sexe couleur des yeux vert bleu marron total garçon 0, 0833 0, 1421 0, 2646 0, 49 fille 0, 0867 0, 1479 0, 2754 0, 51 total 0, 17 0, 29 0, 54 1 Tableau 3. fréquences conjointes théoriques

Indépendance de deux variables qualitatives Un exemple Sexe & couleur des yeux : deux variables indépendantes? Un échantillon de 100 français : sexe couleur des yeux vert bleu marron total garçon 10 11 28 49 fille 7 18 26 51 total 17 29 54 100 Tableau 1. effectifs conjoints couleur des yeux vert bleu marron total garçon 0, 10 0, 11 0, 28 0, 49 sexe fille 0, 07 0, 18 0, 26 0, 51 total 0, 17 0, 29 0, 54 1 Tableau 2. fréquences conjointes observées sexe couleur des yeux vert bleu marron total garçon 0, 0833 0, 1421 0, 2646 0, 49 fille 0, 0867 0, 1479 0, 2754 0, 51 total 0, 17 0, 29 0, 54 1 Tableau 3. fréquences conjointes théoriques Si les variables sont indépendantes l écart entre fréquences observées et fréquences théoriques tend à disparaître lorsque la taille de l échantillon augmente.

Indépendance de deux variables qualitatives La théorie Table de contingence & test du χ 2 U et V sont deux variables qualitatives ; chacune des n unités d un échantillon aléatoire prend une des r valeurs u 1,...,u r de U et une des s valeurs v 1,...,v s de V.

Indépendance de deux variables qualitatives La théorie Table de contingence & test du χ 2 U et V sont deux variables qualitatives ; chacune des n unités d un échantillon aléatoire prend une des r valeurs u 1,...,u r de U et une des s valeurs v 1,...,v s de V. U V v 1 v 2 v s total u 1 N 11 N 12... N 1s N 1 u 2 N 21 N 22... N 2s N 2.................. u r N r1 N r2... N rs N r total N 1 N 2 N s n

Indépendance de deux variables qualitatives La théorie Table de contingence & test du χ 2 U et V sont deux variables qualitatives ; chacune des n unités d un échantillon aléatoire prend une des r valeurs u 1,...,u r de U et une des s valeurs v 1,...,v s de V. U V v 1 v 2 v s total u 1 N 11 N 12... N 1s N 1 u 2 N 21 N 22... N 2s N 2.................. u r N r1 N r2... N rs N r total N 1 N 2 N s n N ij : nbre aléatoire d unités prenant les valeurs u i et v j N i = s j=1 N ij : nbre aléatoire d unités prenant la valeur u i N j = r i=1 N ij : nbre aléatoire d unités prenant la valeur v j

Indépendance de deux variables qualitatives La théorie Table de contingence & test du χ 2 U et V sont deux variables qualitatives ; chacune des n unités d un échantillon aléatoire prend une des r valeurs u 1,...,u r de U et une des s valeurs v 1,...,v s de V. U V v 1 v 2 v s total u 1 N 11 N 12... N 1s N 1 u 2 N 21 N 22... N 2s N 2.................. u r N r1 N r2... N rs N r total N 1 N 2 N s n N ij : nbre aléatoire d unités prenant les valeurs u i et v j N i = s j=1 N ij : nbre aléatoire d unités prenant la valeur u i N j = r i=1 N ij : nbre aléatoire d unités prenant la valeur v j le test : H 0 : U et V indépendantes vs H 1 : U et V non indépendantes

Indépendance de deux variables qualitatives La théorie Table de contingence & test du χ 2 U et V sont deux variables qualitatives ; chacune des n unités d un échantillon aléatoire prend une des r valeurs u 1,...,u r de U et une des s valeurs v 1,...,v s de V. U V v 1 v 2 v s total u 1 N 11 N 12... N 1s N 1 u 2 N 21 N 22... N 2s N 2.................. u r N r1 N r2... N rs N r total N 1 N 2 N s n N ij : nbre aléatoire d unités prenant les valeurs u i et v j N i = s j=1 N ij : nbre aléatoire d unités prenant la valeur u i N j = r i=1 N ij : nbre aléatoire d unités prenant la valeur v j le test : H 0 : U et V indépendantes vs H 1 : U et V non indépendantes la statistique de test : D = r i=1 sj=1 (N ij N i N j /n) 2/(Ni N j /n)

Indépendance de deux variables qualitatives La théorie Table de contingence & test du χ 2 U et V sont deux variables qualitatives ; chacune des n unités d un échantillon aléatoire prend une des r valeurs u 1,...,u r de U et une des s valeurs v 1,...,v s de V. U V v 1 v 2 v s total u 1 N 11 N 12... N 1s N 1 u 2 N 21 N 22... N 2s N 2.................. u r N r1 N r2... N rs N r total N 1 N 2 N s n N ij : nbre aléatoire d unités prenant les valeurs u i et v j N i = s j=1 N ij : nbre aléatoire d unités prenant la valeur u i N j = r i=1 N ij : nbre aléatoire d unités prenant la valeur v j le test : H 0 : U et V indépendantes vs H 1 : U et V non indépendantes la statistique de test : D = r i=1 sj=1 (N ij N i N j /n) 2/(Ni N j /n) sous H 0 : D ap χ 2 (r 1) (s 1)

Indépendance de deux variables qualitatives La théorie Table de contingence & test du χ 2 U et V sont deux variables qualitatives ; chacune des n unités d un échantillon aléatoire prend une des r valeurs u 1,...,u r de U et une des s valeurs v 1,...,v s de V. U V v 1 v 2 v s total u 1 N 11 N 12... N 1s N 1 u 2 N 21 N 22... N 2s N 2.................. u r N r1 N r2... N rs N r total N 1 N 2 N s n N ij : nbre aléatoire d unités prenant les valeurs u i et v j N i = s j=1 N ij : nbre aléatoire d unités prenant la valeur u i N j = r i=1 N ij : nbre aléatoire d unités prenant la valeur v j le test : H 0 : U et V indépendantes vs H 1 : U et V non indépendantes la statistique de test : D = r i=1 sj=1 (N ij N i N j /n) 2/(Ni N j /n) sous H 0 : D ap χ 2 (r 1) (s 1) zone de rejet de H 0 au seuil α : D > χ 2 (r 1) (s 1);1 α