Tests du χ 2 Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux 4 2013-2014 A. Lourme http://alexandrelourme.free.fr
Outline Comparaison de plusieurs échantillons Indépendance de deux variables qualitatives
Un exemple Le dé est-il truqué? On lance cent fois le même dé : face 1 2 3 4 5 6 effectif observé 7 18 26 15 18 16
Un exemple Le dé est-il truqué? On lance cent fois le même dé : face 1 2 3 4 5 6 effectif observé 7 18 26 15 18 16 Supposons que le dé n est pas truqué : face 1 2 3 4 5 6 effectif observé 7 18 26 15 18 16 fréquence observée 0, 07 0, 18 0, 26 0, 15 0, 18 0, 16 fréquence théorique 1/6 1/6 1/6 1/6 1/6 1/6 L écart entre fréquences théoriques et fréquences observées est dû seulement à l échantillonnage.
Un exemple Le dé est-il truqué? On lance cent fois le même dé : face 1 2 3 4 5 6 effectif observé 7 18 26 15 18 16 Supposons que le dé n est pas truqué : face 1 2 3 4 5 6 effectif observé 7 18 26 15 18 16 fréquence observée 0, 07 0, 18 0, 26 0, 15 0, 18 0, 16 fréquence théorique 1/6 1/6 1/6 1/6 1/6 1/6 L écart entre fréquences théoriques et fréquences observées est dû seulement à l échantillonnage. Comment mesurer l écart entre fréquences observées et théoriques?
Un exemple Le dé est-il truqué? On lance cent fois le même dé : face 1 2 3 4 5 6 effectif observé 7 18 26 15 18 16 Supposons que le dé n est pas truqué : face 1 2 3 4 5 6 effectif observé 7 18 26 15 18 16 fréquence observée 0, 07 0, 18 0, 26 0, 15 0, 18 0, 16 fréquence théorique 1/6 1/6 1/6 1/6 1/6 1/6 L écart entre fréquences théoriques et fréquences observées est dû seulement à l échantillonnage. Comment mesurer l écart entre fréquences observées et théoriques? En deçà/au delà de quel écart décide-t-on que le dé est truqué?
La théorie Loi multinomiale & test du χ 2 On considère r valeurs/classes/modalités v i (i = 1,...,r) ; chacune des n unités d un échantillon aléatoire est affectée à v i avec probabilité p i ( r i=1 p i = 1). a voir Saporta G., Probabilités Analyse de Données et Statistique (1990), Ed. TECHNIP, pp. 97-98
La théorie Loi multinomiale & test du χ 2 On considère r valeurs/classes/modalités v i (i = 1,...,r) ; chacune des n unités d un échantillon aléatoire est affectée à v i avec probabilité p i ( r i=1 p i = 1). Le nombre N i d unités affectées à v i ( r i=1 N i = n) est aléatoire et N = (N 1,...,N r) est distribué selon la loi multinomiale M(n;(p 1 ;...; p r)). a voir Saporta G., Probabilités Analyse de Données et Statistique (1990), Ed. TECHNIP, pp. 97-98
La théorie Loi multinomiale & test du χ 2 On considère r valeurs/classes/modalités v i (i = 1,...,r) ; chacune des n unités d un échantillon aléatoire est affectée à v i avec probabilité p i ( r i=1 p i = 1). Le nombre N i d unités affectées à v i ( r i=1 N i = n) est aléatoire et N = (N 1,...,N r) est distribué selon la loi multinomiale M(n;(p 1 ;...; p r)). valeur/classe/modalité v 1 v 2... v r effectif observé N 1 N 2... N r effectif théorique np 1 np 2... np r a voir Saporta G., Probabilités Analyse de Données et Statistique (1990), Ed. TECHNIP, pp. 97-98
La théorie Loi multinomiale & test du χ 2 On considère r valeurs/classes/modalités v i (i = 1,...,r) ; chacune des n unités d un échantillon aléatoire est affectée à v i avec probabilité p i ( r i=1 p i = 1). Le nombre N i d unités affectées à v i ( r i=1 N i = n) est aléatoire et N = (N 1,...,N r) est distribué selon la loi multinomiale M(n;(p 1 ;...; p r)). valeur/classe/modalité v 1 v 2... v r effectif observé N 1 N 2... N r effectif théorique np 1 np 2... np r On en déduit a : r D = (N i np i ) 2 /(np i ) L χ 2 r 1 (1) i=1 a voir Saporta G., Probabilités Analyse de Données et Statistique (1990), Ed. TECHNIP, pp. 97-98
La théorie Loi multinomiale & test du χ 2 On considère r valeurs/classes/modalités v i (i = 1,...,r) ; chacune des n unités d un échantillon aléatoire est affectée à v i avec probabilité p i ( r i=1 p i = 1). Le nombre N i d unités affectées à v i ( r i=1 N i = n) est aléatoire et N = (N 1,...,N r) est distribué selon la loi multinomiale M(n;(p 1 ;...; p r)). valeur/classe/modalité v 1 v 2... v r effectif observé N 1 N 2... N r effectif théorique np 1 np 2... np r On en déduit a : D = r (N i np i ) 2 /(np i ) L χ 2 r 1 (1) i=1 (1) permet de définir un test (asymptotique) du χ 2 comparant (p 1,...,p r) à une valeur de référence (p 0 1,...,p0 r ) ]0, 1[r : a voir Saporta G., Probabilités Analyse de Données et Statistique (1990), Ed. TECHNIP, pp. 97-98
La théorie Loi multinomiale & test du χ 2 On considère r valeurs/classes/modalités v i (i = 1,...,r) ; chacune des n unités d un échantillon aléatoire est affectée à v i avec probabilité p i ( r i=1 p i = 1). Le nombre N i d unités affectées à v i ( r i=1 N i = n) est aléatoire et N = (N 1,...,N r) est distribué selon la loi multinomiale M(n;(p 1 ;...; p r)). valeur/classe/modalité v 1 v 2... v r effectif observé N 1 N 2... N r effectif théorique np 1 np 2... np r On en déduit a : D = r (N i np i ) 2 /(np i ) L χ 2 r 1 (1) i=1 (1) permet de définir un test (asymptotique) du χ 2 comparant (p 1,...,p r) à une valeur de référence (p 0 1,...,p0 r ) ]0, 1[r : le test : H 0 : i, p i = p 0 i vs H 1 : i, p i p 0 i a voir Saporta G., Probabilités Analyse de Données et Statistique (1990), Ed. TECHNIP, pp. 97-98
La théorie Loi multinomiale & test du χ 2 On considère r valeurs/classes/modalités v i (i = 1,...,r) ; chacune des n unités d un échantillon aléatoire est affectée à v i avec probabilité p i ( r i=1 p i = 1). Le nombre N i d unités affectées à v i ( r i=1 N i = n) est aléatoire et N = (N 1,...,N r) est distribué selon la loi multinomiale M(n;(p 1 ;...; p r)). valeur/classe/modalité v 1 v 2... v r effectif observé N 1 N 2... N r effectif théorique np 1 np 2... np r On en déduit a : D = r (N i np i ) 2 /(np i ) L χ 2 r 1 (1) i=1 (1) permet de définir un test (asymptotique) du χ 2 comparant (p 1,...,p r) à une valeur de référence (p 0 1,...,p0 r ) ]0, 1[r : le test : H 0 : i, p i = p 0 i vs H 1 : i, p i p 0 i la statistique de test : D 0 = r i=1 (N i np 0 i )2 /(np 0 i ) ap χ2 r 1 sous H 0 a voir Saporta G., Probabilités Analyse de Données et Statistique (1990), Ed. TECHNIP, pp. 97-98
La théorie Loi multinomiale & test du χ 2 On considère r valeurs/classes/modalités v i (i = 1,...,r) ; chacune des n unités d un échantillon aléatoire est affectée à v i avec probabilité p i ( r i=1 p i = 1). Le nombre N i d unités affectées à v i ( r i=1 N i = n) est aléatoire et N = (N 1,...,N r) est distribué selon la loi multinomiale M(n;(p 1 ;...; p r)). valeur/classe/modalité v 1 v 2... v r effectif observé N 1 N 2... N r effectif théorique np 1 np 2... np r On en déduit a : D = r (N i np i ) 2 /(np i ) L χ 2 r 1 (1) i=1 (1) permet de définir un test (asymptotique) du χ 2 comparant (p 1,...,p r) à une valeur de référence (p 0 1,...,p0 r ) ]0, 1[r : le test : H 0 : i, p i = p 0 i vs H 1 : i, p i p 0 i la statistique de test : D 0 = r i=1 (N i np 0 i )2 /(np 0 i ) ap χ2 r 1 sous H 0 zone de rejet de H 0 au seuil α : D 0 > χ 2 r 1;1 α a voir Saporta G., Probabilités Analyse de Données et Statistique (1990), Ed. TECHNIP, pp. 97-98
Exercice 1. Le dé est-il truqué? face 1 2 3 4 5 6 effectif observé 7 18 26 15 18 16 FALSE) b sous R, le quantile χ 2 5;0,99 est donné par qchisq(0.99, 5, ncp = 0, lower.tail = TRUE, log.p =
Exercice 1. Le dé est-il truqué? face 1 2 3 4 5 6 effectif observé 7 18 26 15 18 16 effectif théorique 100/6 100/6 100/6 100/6 100/6 100/6 FALSE) b sous R, le quantile χ 2 5;0,99 est donné par qchisq(0.99, 5, ncp = 0, lower.tail = TRUE, log.p =
Exercice 1. Le dé est-il truqué? face 1 2 3 4 5 6 effectif observé 7 18 26 15 18 16 effectif théorique 100/6 100/6 100/6 100/6 100/6 100/6 avant de lancer le dé Chacun des 100 lancers (n = 100) fera apparaître l une des six faces (r = 6). N i : nbre aléatoire d apparitions de la face i au cours des 100 lancers. FALSE) b sous R, le quantile χ 2 5;0,99 est donné par qchisq(0.99, 5, ncp = 0, lower.tail = TRUE, log.p =
Exercice 1. Le dé est-il truqué? face 1 2 3 4 5 6 effectif observé 7 18 26 15 18 16 effectif théorique 100/6 100/6 100/6 100/6 100/6 100/6 avant de lancer le dé Chacun des 100 lancers (n = 100) fera apparaître l une des six faces (r = 6). N i : nbre aléatoire d apparitions de la face i au cours des 100 lancers. Si le dé est équilibré la probabilité p i d apparition de la face i est 1/6 pour tout i. FALSE) b sous R, le quantile χ 2 5;0,99 est donné par qchisq(0.99, 5, ncp = 0, lower.tail = TRUE, log.p =
Exercice 1. Le dé est-il truqué? face 1 2 3 4 5 6 effectif observé 7 18 26 15 18 16 effectif théorique 100/6 100/6 100/6 100/6 100/6 100/6 avant de lancer le dé Chacun des 100 lancers (n = 100) fera apparaître l une des six faces (r = 6). N i : nbre aléatoire d apparitions de la face i au cours des 100 lancers. Si le dé est équilibré la probabilité p i d apparition de la face i est 1/6 pour tout i. le test : H 0 : i, p i = 1/6 (dé équilibré) vs H 1 : i, p i 1/6 (dé truqué) FALSE) b sous R, le quantile χ 2 5;0,99 est donné par qchisq(0.99, 5, ncp = 0, lower.tail = TRUE, log.p =
Exercice 1. Le dé est-il truqué? face 1 2 3 4 5 6 effectif observé 7 18 26 15 18 16 effectif théorique 100/6 100/6 100/6 100/6 100/6 100/6 avant de lancer le dé Chacun des 100 lancers (n = 100) fera apparaître l une des six faces (r = 6). N i : nbre aléatoire d apparitions de la face i au cours des 100 lancers. Si le dé est équilibré la probabilité p i d apparition de la face i est 1/6 pour tout i. le test : H 0 : i, p i = 1/6 (dé équilibré) vs H 1 : i, p i 1/6 (dé truqué) la statistique de test : D 0 = 6 i=1 (N i 100/6) 2 /(100/6) ap χ 2 5 sous H 0 FALSE) b sous R, le quantile χ 2 5;0,99 est donné par qchisq(0.99, 5, ncp = 0, lower.tail = TRUE, log.p =
Exercice 1. Le dé est-il truqué? face 1 2 3 4 5 6 effectif observé 7 18 26 15 18 16 effectif théorique 100/6 100/6 100/6 100/6 100/6 100/6 avant de lancer le dé Chacun des 100 lancers (n = 100) fera apparaître l une des six faces (r = 6). N i : nbre aléatoire d apparitions de la face i au cours des 100 lancers. Si le dé est équilibré la probabilité p i d apparition de la face i est 1/6 pour tout i. le test : H 0 : i, p i = 1/6 (dé équilibré) vs H 1 : i, p i 1/6 (dé truqué) la statistique de test : D 0 = 6 i=1 (N i 100/6) 2 /(100/6) ap χ 2 5 sous H 0 si H 0 est vraie on a (environ) 1 chance sur 100 d observer : D 0 > χ 2 5;0,99 FALSE) b sous R, le quantile χ 2 5;0,99 est donné par qchisq(0.99, 5, ncp = 0, lower.tail = TRUE, log.p =
Exercice 1. Le dé est-il truqué? face 1 2 3 4 5 6 effectif observé 7 18 26 15 18 16 effectif théorique 100/6 100/6 100/6 100/6 100/6 100/6 avant de lancer le dé Chacun des 100 lancers (n = 100) fera apparaître l une des six faces (r = 6). N i : nbre aléatoire d apparitions de la face i au cours des 100 lancers. Si le dé est équilibré la probabilité p i d apparition de la face i est 1/6 pour tout i. le test : H 0 : i, p i = 1/6 (dé équilibré) vs H 1 : i, p i 1/6 (dé truqué) la statistique de test : D 0 = 6 i=1 (N i 100/6) 2 /(100/6) ap χ 2 5 sous H 0 si H 0 est vraie on a (environ) 1 chance sur 100 d observer : D 0 > χ 2 5;0,99 une fois le dé lancé FALSE) b sous R, le quantile χ 2 5;0,99 est donné par qchisq(0.99, 5, ncp = 0, lower.tail = TRUE, log.p =
Exercice 1. Le dé est-il truqué? face 1 2 3 4 5 6 effectif observé 7 18 26 15 18 16 effectif théorique 100/6 100/6 100/6 100/6 100/6 100/6 avant de lancer le dé Chacun des 100 lancers (n = 100) fera apparaître l une des six faces (r = 6). N i : nbre aléatoire d apparitions de la face i au cours des 100 lancers. Si le dé est équilibré la probabilité p i d apparition de la face i est 1/6 pour tout i. le test : H 0 : i, p i = 1/6 (dé équilibré) vs H 1 : i, p i 1/6 (dé truqué) la statistique de test : D 0 = 6 i=1 (N i 100/6) 2 /(100/6) ap χ 2 5 sous H 0 si H 0 est vraie on a (environ) 1 chance sur 100 d observer : D 0 > χ 2 5;0,99 une fois le dé lancé D 0 = (7 100/6) 2 /(100/6) + + (16 100/6) 2 /(100/6) 11 FALSE) b sous R, le quantile χ 2 5;0,99 est donné par qchisq(0.99, 5, ncp = 0, lower.tail = TRUE, log.p =
Exercice 1. Le dé est-il truqué? face 1 2 3 4 5 6 effectif observé 7 18 26 15 18 16 effectif théorique 100/6 100/6 100/6 100/6 100/6 100/6 avant de lancer le dé Chacun des 100 lancers (n = 100) fera apparaître l une des six faces (r = 6). N i : nbre aléatoire d apparitions de la face i au cours des 100 lancers. Si le dé est équilibré la probabilité p i d apparition de la face i est 1/6 pour tout i. le test : H 0 : i, p i = 1/6 (dé équilibré) vs H 1 : i, p i 1/6 (dé truqué) la statistique de test : D 0 = 6 i=1 (N i 100/6) 2 /(100/6) ap χ 2 5 sous H 0 si H 0 est vraie on a (environ) 1 chance sur 100 d observer : D 0 > χ 2 5;0,99 une fois le dé lancé D 0 = (7 100/6) 2 /(100/6) + + (16 100/6) 2 /(100/6) 11 < χ 2 5;0,99 15b FALSE) b sous R, le quantile χ 2 5;0,99 est donné par qchisq(0.99, 5, ncp = 0, lower.tail = TRUE, log.p =
Exercice 1. Le dé est-il truqué? face 1 2 3 4 5 6 effectif observé 7 18 26 15 18 16 effectif théorique 100/6 100/6 100/6 100/6 100/6 100/6 avant de lancer le dé Chacun des 100 lancers (n = 100) fera apparaître l une des six faces (r = 6). N i : nbre aléatoire d apparitions de la face i au cours des 100 lancers. Si le dé est équilibré la probabilité p i d apparition de la face i est 1/6 pour tout i. le test : H 0 : i, p i = 1/6 (dé équilibré) vs H 1 : i, p i 1/6 (dé truqué) la statistique de test : D 0 = 6 i=1 (N i 100/6) 2 /(100/6) ap χ 2 5 sous H 0 si H 0 est vraie on a (environ) 1 chance sur 100 d observer : D 0 > χ 2 5;0,99 une fois le dé lancé D 0 = (7 100/6) 2 /(100/6) + + (16 100/6) 2 /(100/6) 11 < χ 2 5;0,99 15b interprétation ou le dé est équilibré (H 0 vraie) : la valeur D 0 = 11 observée est l une des 99% inférieures à χ 2 5;0,99 ou bien le dé est truqué. FALSE) b sous R, le quantile χ 2 5;0,99 est donné par qchisq(0.99, 5, ncp = 0, lower.tail = TRUE, log.p =
Exercice 1. Le dé est-il truqué? face 1 2 3 4 5 6 effectif observé 7 18 26 15 18 16 effectif théorique 100/6 100/6 100/6 100/6 100/6 100/6 avant de lancer le dé Chacun des 100 lancers (n = 100) fera apparaître l une des six faces (r = 6). N i : nbre aléatoire d apparitions de la face i au cours des 100 lancers. Si le dé est équilibré la probabilité p i d apparition de la face i est 1/6 pour tout i. le test : H 0 : i, p i = 1/6 (dé équilibré) vs H 1 : i, p i 1/6 (dé truqué) la statistique de test : D 0 = 6 i=1 (N i 100/6) 2 /(100/6) ap χ 2 5 sous H 0 si H 0 est vraie on a (environ) 1 chance sur 100 d observer : D 0 > χ 2 5;0,99 une fois le dé lancé D 0 = (7 100/6) 2 /(100/6) + + (16 100/6) 2 /(100/6) 11 < χ 2 5;0,99 15b interprétation ou le dé est équilibré (H 0 vraie) : la valeur D 0 = 11 observée est l une des 99% inférieures à χ 2 5;0,99 ou bien le dé est truqué. décision FALSE) b sous R, le quantile χ 2 5;0,99 est donné par qchisq(0.99, 5, ncp = 0, lower.tail = TRUE, log.p =
Exercice 1. Le dé est-il truqué? face 1 2 3 4 5 6 effectif observé 7 18 26 15 18 16 effectif théorique 100/6 100/6 100/6 100/6 100/6 100/6 avant de lancer le dé Chacun des 100 lancers (n = 100) fera apparaître l une des six faces (r = 6). N i : nbre aléatoire d apparitions de la face i au cours des 100 lancers. Si le dé est équilibré la probabilité p i d apparition de la face i est 1/6 pour tout i. le test : H 0 : i, p i = 1/6 (dé équilibré) vs H 1 : i, p i 1/6 (dé truqué) la statistique de test : D 0 = 6 i=1 (N i 100/6) 2 /(100/6) ap χ 2 5 sous H 0 si H 0 est vraie on a (environ) 1 chance sur 100 d observer : D 0 > χ 2 5;0,99 une fois le dé lancé D 0 = (7 100/6) 2 /(100/6) + + (16 100/6) 2 /(100/6) 11 < χ 2 5;0,99 15b interprétation ou le dé est équilibré (H 0 vraie) : la valeur D 0 = 11 observée est l une des 99% inférieures à χ 2 5;0,99 ou bien le dé est truqué. décision Au seuil de 1% on ne rejette pas l hypothèse H 0 : le dé est équilibré. FALSE) b sous R, le quantile χ 2 5;0,99 est donné par qchisq(0.99, 5, ncp = 0, lower.tail = TRUE, log.p =
Exercice 2. Adéquation à une loi exponentielle durée de vie [0; 1000] ]1000; 2000] ]2000; 3000] ]3000; 4000] ]4000; 5000] ]5000; 6000] effectif observé 9 10 12 8 6 5 La durée de vie des ampoules provient-elle de E(1/1000)?
Exercice 2. Adéquation à une loi exponentielle durée de vie [0; 1000] ]1000; 2000] ]2000; 3000] ]3000; 4000] ]4000; 5000] ]5000; 6000] effectif observé 9 10 12 8 6 5 La durée de vie des ampoules provient-elle de E(1/1000)? Six classes (r = 6) ; on y répartit la durée de vie d un échantillon aléatoire de 50 ampoules (n = 50). N i : le nbre aléatoire d ampoules dans la classe i.
Exercice 2. Adéquation à une loi exponentielle durée de vie [0; 1000] ]1000; 2000] ]2000; 3000] ]3000; 4000] ]4000; 5000] ]5000; 6000] effectif observé 9 10 12 8 6 5 La durée de vie des ampoules provient-elle de E(1/1000)? Six classes (r = 6) ; on y répartit la durée de vie d un échantillon aléatoire de 50 ampoules (n = 50). N i : le nbre aléatoire d ampoules dans la classe i. Si la durée de vie des ampoules est distribuée selon E(1/1000), la probabilité p i qu une ampoule soit dans la classe i est : e i+1 e i.
Exercice 2. Adéquation à une loi exponentielle durée de vie [0; 1000] ]1000; 2000] ]2000; 3000] ]3000; 4000] ]4000; 5000] ]5000; 6000] effectif observé 9 10 12 8 6 5 effectif théorique 31, 6 11, 6 4, 3 1, 6 0, 6 0, 2 La durée de vie des ampoules provient-elle de E(1/1000)? Six classes (r = 6) ; on y répartit la durée de vie d un échantillon aléatoire de 50 ampoules (n = 50). N i : le nbre aléatoire d ampoules dans la classe i. Si la durée de vie des ampoules est distribuée selon E(1/1000), la probabilité p i qu une ampoule soit dans la classe i est : e i+1 e i.
Exercice 2. Adéquation à une loi exponentielle durée de vie [0; 1000] ]1000; 2000] ]2000; 3000] ]3000; 4000] ]4000; 5000] ]5000; 6000] effectif observé 9 10 12 8 6 5 effectif théorique 31, 6 11, 6 4, 3 1, 6 0, 6 0, 2 La durée de vie des ampoules provient-elle de E(1/1000)? Six classes (r = 6) ; on y répartit la durée de vie d un échantillon aléatoire de 50 ampoules (n = 50). N i : le nbre aléatoire d ampoules dans la classe i. Si la durée de vie des ampoules est distribuée selon E(1/1000), la probabilité p i qu une ampoule soit dans la classe i est : e i+1 e i. le test : H 0 : i, p i = e i+1 e i vs H 1 : i, p i e i+1 e i
Exercice 2. Adéquation à une loi exponentielle durée de vie [0; 1000] ]1000; 2000] ]2000; 3000] ]3000; 4000] ]4000; 5000] ]5000; 6000] effectif observé 9 10 12 8 6 5 effectif théorique 31, 6 11, 6 4, 3 1, 6 0, 6 0, 2 La durée de vie des ampoules provient-elle de E(1/1000)? Six classes (r = 6) ; on y répartit la durée de vie d un échantillon aléatoire de 50 ampoules (n = 50). N i : le nbre aléatoire d ampoules dans la classe i. Si la durée de vie des ampoules est distribuée selon E(1/1000), la probabilité p i qu une ampoule soit dans la classe i est : e i+1 e i. le test : H 0 : i, p i = e i+1 e i vs H 1 : i, p i e i+1 e i la statistique de test : D 0 = 6 i=1 (N i 50 (e i+1 e i )) 2 /(50 (e i+1 e i ))
Exercice 2. Adéquation à une loi exponentielle durée de vie [0; 1000] ]1000; 2000] ]2000; 3000] ]3000; 4000] ]4000; 5000] ]5000; 6000] effectif observé 9 10 12 8 6 5 effectif théorique 31, 6 11, 6 4, 3 1, 6 0, 6 0, 2 La durée de vie des ampoules provient-elle de E(1/1000)? Six classes (r = 6) ; on y répartit la durée de vie d un échantillon aléatoire de 50 ampoules (n = 50). N i : le nbre aléatoire d ampoules dans la classe i. Si la durée de vie des ampoules est distribuée selon E(1/1000), la probabilité p i qu une ampoule soit dans la classe i est : e i+1 e i. le test : H 0 : i, p i = e i+1 e i vs H 1 : i, p i e i+1 e i la statistique de test : D 0 = 6 i=1 (N i 50 (e i+1 e i )) 2 /(50 (e i+1 e i )) sous H 0 : D 0 ap χ 2 5
Exercice 2. Adéquation à une loi exponentielle durée de vie [0; 1000] ]1000; 2000] ]2000; 3000] ]3000; 4000] ]4000; 5000] ]5000; 6000] effectif observé 9 10 12 8 6 5 effectif théorique 31, 6 11, 6 4, 3 1, 6 0, 6 0, 2 La durée de vie des ampoules provient-elle de E(1/1000)? Six classes (r = 6) ; on y répartit la durée de vie d un échantillon aléatoire de 50 ampoules (n = 50). N i : le nbre aléatoire d ampoules dans la classe i. Si la durée de vie des ampoules est distribuée selon E(1/1000), la probabilité p i qu une ampoule soit dans la classe i est : e i+1 e i. le test : H 0 : i, p i = e i+1 e i vs H 1 : i, p i e i+1 e i la statistique de test : D 0 = 6 i=1 (N i 50 (e i+1 e i )) 2 /(50 (e i+1 e i )) sous H 0 : D 0 ap χ 2 5 zone de rejet de H 0 au seuil de 10% : D 0 > χ 2 5;0,90
Exercice 2. Adéquation à une loi exponentielle durée de vie [0; 1000] ]1000; 2000] ]2000; 3000] ]3000; 4000] ]4000; 5000] ]5000; 6000] effectif observé 9 10 12 8 6 5 effectif théorique 31, 6 11, 6 4, 3 1, 6 0, 6 0, 2 La durée de vie des ampoules provient-elle de E(1/1000)? Six classes (r = 6) ; on y répartit la durée de vie d un échantillon aléatoire de 50 ampoules (n = 50). N i : le nbre aléatoire d ampoules dans la classe i. Si la durée de vie des ampoules est distribuée selon E(1/1000), la probabilité p i qu une ampoule soit dans la classe i est : e i+1 e i. le test : H 0 : i, p i = e i+1 e i vs H 1 : i, p i e i+1 e i la statistique de test : D 0 = 6 i=1 (N i 50 (e i+1 e i )) 2 /(50 (e i+1 e i )) sous H 0 : D 0 ap χ 2 5 zone de rejet de H 0 au seuil de 10% : D 0 > χ 2 5;0,90 D 0 = (9 31, 6) 2 /31, 6 + + (5 0, 2) 2 /0, 2 = 215, 0
Exercice 2. Adéquation à une loi exponentielle durée de vie [0; 1000] ]1000; 2000] ]2000; 3000] ]3000; 4000] ]4000; 5000] ]5000; 6000] effectif observé 9 10 12 8 6 5 effectif théorique 31, 6 11, 6 4, 3 1, 6 0, 6 0, 2 La durée de vie des ampoules provient-elle de E(1/1000)? Six classes (r = 6) ; on y répartit la durée de vie d un échantillon aléatoire de 50 ampoules (n = 50). N i : le nbre aléatoire d ampoules dans la classe i. Si la durée de vie des ampoules est distribuée selon E(1/1000), la probabilité p i qu une ampoule soit dans la classe i est : e i+1 e i. le test : H 0 : i, p i = e i+1 e i vs H 1 : i, p i e i+1 e i la statistique de test : D 0 = 6 i=1 (N i 50 (e i+1 e i )) 2 /(50 (e i+1 e i )) sous H 0 : D 0 ap χ 2 5 zone de rejet de H 0 au seuil de 10% : D 0 > χ 2 5;0,90 D 0 = (9 31, 6) 2 /31, 6 + + (5 0, 2) 2 /0, 2 = 215, 0> χ 2 5;0,90 9, 2.
Exercice 2. Adéquation à une loi exponentielle durée de vie [0; 1000] ]1000; 2000] ]2000; 3000] ]3000; 4000] ]4000; 5000] ]5000; 6000] effectif observé 9 10 12 8 6 5 effectif théorique 31, 6 11, 6 4, 3 1, 6 0, 6 0, 2 La durée de vie des ampoules provient-elle de E(1/1000)? Six classes (r = 6) ; on y répartit la durée de vie d un échantillon aléatoire de 50 ampoules (n = 50). N i : le nbre aléatoire d ampoules dans la classe i. Si la durée de vie des ampoules est distribuée selon E(1/1000), la probabilité p i qu une ampoule soit dans la classe i est : e i+1 e i. le test : H 0 : i, p i = e i+1 e i vs H 1 : i, p i e i+1 e i la statistique de test : D 0 = 6 i=1 (N i 50 (e i+1 e i )) 2 /(50 (e i+1 e i )) sous H 0 : D 0 ap χ 2 5 zone de rejet de H 0 au seuil de 10% : D 0 > χ 2 5;0,90 D 0 = (9 31, 6) 2 /31, 6 + + (5 0, 2) 2 /0, 2 = 215, 0> χ 2 5;0,90 9, 2. Au seuil de 10% on rejette l hypothèse H 0 selon laquelle la durée de vie des ampoules est distribuée selon la loi exponentielle E(1/1000).
Comparaison de plusieurs échantillons Outline Comparaison de plusieurs échantillons Indépendance de deux variables qualitatives
Indépendance de deux variables qualitatives Outline Comparaison de plusieurs échantillons Indépendance de deux variables qualitatives
Indépendance de deux variables qualitatives Un exemple Sexe & couleur des yeux : deux variables indépendantes? Un échantillon de 100 français : sexe couleur des yeux vert bleu marron garçon 10 11 28 fille 7 18 26 Tableau 1. effectifs conjoints
Indépendance de deux variables qualitatives Un exemple Sexe & couleur des yeux : deux variables indépendantes? Un échantillon de 100 français : sexe couleur des yeux vert bleu marron total garçon 10 11 28 49 fille 7 18 26 51 total 17 29 54 100 Tableau 1. effectifs conjoints
Indépendance de deux variables qualitatives Un exemple Sexe & couleur des yeux : deux variables indépendantes? Un échantillon de 100 français : sexe couleur des yeux vert bleu marron total garçon 10 11 28 49 fille 7 18 26 51 total 17 29 54 100 Tableau 1. effectifs conjoints couleur des yeux vert bleu marron total garçon 0, 10 0, 11 0, 28 0, 49 sexe fille 0, 07 0, 18 0, 26 0, 51 total 0, 17 0, 29 0, 54 1 Tableau 2. fréquences conjointes observées
Indépendance de deux variables qualitatives Un exemple Sexe & couleur des yeux : deux variables indépendantes? Un échantillon de 100 français : sexe couleur des yeux vert bleu marron total garçon 10 11 28 49 fille 7 18 26 51 total 17 29 54 100 Tableau 1. effectifs conjoints couleur des yeux vert bleu marron total garçon 0, 10 0, 11 0, 28 0, 49 sexe fille 0, 07 0, 18 0, 26 0, 51 total 0, 17 0, 29 0, 54 1 Tableau 2. fréquences conjointes observées sexe couleur des yeux vert bleu marron total garçon 0, 0833 0, 1421 0, 2646 0, 49 fille 0, 0867 0, 1479 0, 2754 0, 51 total 0, 17 0, 29 0, 54 1 Tableau 3. fréquences conjointes théoriques
Indépendance de deux variables qualitatives Un exemple Sexe & couleur des yeux : deux variables indépendantes? Un échantillon de 100 français : sexe couleur des yeux vert bleu marron total garçon 10 11 28 49 fille 7 18 26 51 total 17 29 54 100 Tableau 1. effectifs conjoints couleur des yeux vert bleu marron total garçon 0, 10 0, 11 0, 28 0, 49 sexe fille 0, 07 0, 18 0, 26 0, 51 total 0, 17 0, 29 0, 54 1 Tableau 2. fréquences conjointes observées sexe couleur des yeux vert bleu marron total garçon 0, 0833 0, 1421 0, 2646 0, 49 fille 0, 0867 0, 1479 0, 2754 0, 51 total 0, 17 0, 29 0, 54 1 Tableau 3. fréquences conjointes théoriques Si les variables sont indépendantes l écart entre fréquences observées et fréquences théoriques tend à disparaître lorsque la taille de l échantillon augmente.
Indépendance de deux variables qualitatives La théorie Table de contingence & test du χ 2 U et V sont deux variables qualitatives ; chacune des n unités d un échantillon aléatoire prend une des r valeurs u 1,...,u r de U et une des s valeurs v 1,...,v s de V.
Indépendance de deux variables qualitatives La théorie Table de contingence & test du χ 2 U et V sont deux variables qualitatives ; chacune des n unités d un échantillon aléatoire prend une des r valeurs u 1,...,u r de U et une des s valeurs v 1,...,v s de V. U V v 1 v 2 v s total u 1 N 11 N 12... N 1s N 1 u 2 N 21 N 22... N 2s N 2.................. u r N r1 N r2... N rs N r total N 1 N 2 N s n
Indépendance de deux variables qualitatives La théorie Table de contingence & test du χ 2 U et V sont deux variables qualitatives ; chacune des n unités d un échantillon aléatoire prend une des r valeurs u 1,...,u r de U et une des s valeurs v 1,...,v s de V. U V v 1 v 2 v s total u 1 N 11 N 12... N 1s N 1 u 2 N 21 N 22... N 2s N 2.................. u r N r1 N r2... N rs N r total N 1 N 2 N s n N ij : nbre aléatoire d unités prenant les valeurs u i et v j N i = s j=1 N ij : nbre aléatoire d unités prenant la valeur u i N j = r i=1 N ij : nbre aléatoire d unités prenant la valeur v j
Indépendance de deux variables qualitatives La théorie Table de contingence & test du χ 2 U et V sont deux variables qualitatives ; chacune des n unités d un échantillon aléatoire prend une des r valeurs u 1,...,u r de U et une des s valeurs v 1,...,v s de V. U V v 1 v 2 v s total u 1 N 11 N 12... N 1s N 1 u 2 N 21 N 22... N 2s N 2.................. u r N r1 N r2... N rs N r total N 1 N 2 N s n N ij : nbre aléatoire d unités prenant les valeurs u i et v j N i = s j=1 N ij : nbre aléatoire d unités prenant la valeur u i N j = r i=1 N ij : nbre aléatoire d unités prenant la valeur v j le test : H 0 : U et V indépendantes vs H 1 : U et V non indépendantes
Indépendance de deux variables qualitatives La théorie Table de contingence & test du χ 2 U et V sont deux variables qualitatives ; chacune des n unités d un échantillon aléatoire prend une des r valeurs u 1,...,u r de U et une des s valeurs v 1,...,v s de V. U V v 1 v 2 v s total u 1 N 11 N 12... N 1s N 1 u 2 N 21 N 22... N 2s N 2.................. u r N r1 N r2... N rs N r total N 1 N 2 N s n N ij : nbre aléatoire d unités prenant les valeurs u i et v j N i = s j=1 N ij : nbre aléatoire d unités prenant la valeur u i N j = r i=1 N ij : nbre aléatoire d unités prenant la valeur v j le test : H 0 : U et V indépendantes vs H 1 : U et V non indépendantes la statistique de test : D = r i=1 sj=1 (N ij N i N j /n) 2/(Ni N j /n)
Indépendance de deux variables qualitatives La théorie Table de contingence & test du χ 2 U et V sont deux variables qualitatives ; chacune des n unités d un échantillon aléatoire prend une des r valeurs u 1,...,u r de U et une des s valeurs v 1,...,v s de V. U V v 1 v 2 v s total u 1 N 11 N 12... N 1s N 1 u 2 N 21 N 22... N 2s N 2.................. u r N r1 N r2... N rs N r total N 1 N 2 N s n N ij : nbre aléatoire d unités prenant les valeurs u i et v j N i = s j=1 N ij : nbre aléatoire d unités prenant la valeur u i N j = r i=1 N ij : nbre aléatoire d unités prenant la valeur v j le test : H 0 : U et V indépendantes vs H 1 : U et V non indépendantes la statistique de test : D = r i=1 sj=1 (N ij N i N j /n) 2/(Ni N j /n) sous H 0 : D ap χ 2 (r 1) (s 1)
Indépendance de deux variables qualitatives La théorie Table de contingence & test du χ 2 U et V sont deux variables qualitatives ; chacune des n unités d un échantillon aléatoire prend une des r valeurs u 1,...,u r de U et une des s valeurs v 1,...,v s de V. U V v 1 v 2 v s total u 1 N 11 N 12... N 1s N 1 u 2 N 21 N 22... N 2s N 2.................. u r N r1 N r2... N rs N r total N 1 N 2 N s n N ij : nbre aléatoire d unités prenant les valeurs u i et v j N i = s j=1 N ij : nbre aléatoire d unités prenant la valeur u i N j = r i=1 N ij : nbre aléatoire d unités prenant la valeur v j le test : H 0 : U et V indépendantes vs H 1 : U et V non indépendantes la statistique de test : D = r i=1 sj=1 (N ij N i N j /n) 2/(Ni N j /n) sous H 0 : D ap χ 2 (r 1) (s 1) zone de rejet de H 0 au seuil α : D > χ 2 (r 1) (s 1);1 α