Tests statistiques. M1 IMSV Etienne Birmelé
|
|
- Laure Lesage
- il y a 7 ans
- Total affichages :
Transcription
1 Tests statistiques M1 IMSV Etienne Birmelé
2 I. TESTS STATISTIQUES :PRINCIPE
3 Test Definition Un test statistique est une procédure de décision entre deux hypothèses concernant un ou plusieurs échantillons. Exemple : On considère deux séries de personnes soumises les unes à un médicament, les autres à un placebo. On mesure les tensions artérielles dans les deux groupes. Au vu des résultats, le médicament a-t-il un effet sur la tension?
4 Hypothèses Définition L hypothèse nulle notée H 0 est celle que l on considère vraie à priori. Le but du test est de décider si cet à priori est crédible. L hypothèse alternative notée H 1 est l hypothèse complémentaire de H 0. Exemple : Sous H 0, le médicament n a pas d influence, sous H 1 il en a une.
5 Hypothèses Définition L hypothèse nulle notée H 0 est celle que l on considère vraie à priori. Le but du test est de décider si cet à priori est crédible. L hypothèse alternative notée H 1 est l hypothèse complémentaire de H 0. Exemple : Sous H 0, le médicament n a pas d influence, sous H 1 il en a une. Attention Les deux hypothèses ne sont pas symétriques. H 1 est choisie uniquement par défaut si H 0 n est pas considérée comme crédible. Le choix de H 0 et de H 1 est en général imposé par le test qu on utilise et ne relève donc pas de l utilisateur.
6 Ecriture des hypothèses Soit µ 1 et µ 2 les moyennes de tension des deux populations correspondant à la prise de médicament ou de placebo. Une manière de démontrer que le médicament modifie la tension est de montrer que µ 2 est différent de µ 1. Les hypothèses deviennent alors { H 0 : les moyennes des deux populations sont égales } et { H 0 : les moyennes des deux populations sont différentes }. On l écrit succintement sous la forme : H 0 : µ 1 = µ 2 H 1 : µ 1 µ 2
7 Ecriture des hypothèses Question 1 La moyenne de la tension dans le premier groupe est de 13,4. La moyenne de la tension dans le second groupe est de 12,8. Le médicament est-il efficace?
8 Ecriture des hypothèses Question 1 La moyenne de la tension dans le premier groupe est de 13,4. La moyenne de la tension dans le second groupe est de 12,8. Le médicament est-il efficace? Question 2 (pour ceux qui ont répondu oui) Je lance six fois un dé, puis fais 50 pompes, puis relance six fois un dé. Ma première série de lancers vaut en moyenne 3,1. La seconde série vaut en moyenne 3,7. Les pompes m ont-elles rendues meilleur au lancer de dé?
9 Ecriture des hypothèses Question 1 La moyenne de la tension dans le premier groupe est de 13,4. La moyenne de la tension dans le second groupe est de 12,8. Le médicament est-il efficace? Question 2 (pour ceux qui ont répondu oui) Je lance six fois un dé, puis fais 50 pompes, puis relance six fois un dé. Ma première série de lancers vaut en moyenne 3,1. La seconde série vaut en moyenne 3,7. Les pompes m ont-elles rendues meilleur au lancer de dé? Réponse On n en sait rien à ce stade!
10 Ecriture des hypothèses Attention Les moyennes x 1 et x 2 des échantillons résultent d échantillonnages, et ne sont donc que des estimations de µ 1 et µ 2. Ce n est pas parce qu elles sont différentes que µ 1 et µ 2 le sont (et vice-versa, mais c est rare!). Comparer les moyennes des échantillons ne peut en aucun cas suffire!
11 Ecriture des hypothèses Attention Les moyennes x 1 et x 2 des échantillons résultent d échantillonnages, et ne sont donc que des estimations de µ 1 et µ 2. Ce n est pas parce qu elles sont différentes que µ 1 et µ 2 le sont (et vice-versa, mais c est rare!). Comparer les moyennes des échantillons ne peut en aucun cas suffire! Les signes =,, > et dans l écriture succinte des hypothèses ne correspondent pas à l égalité ou aux inégalités au sens mathématique du terme. Il s agit d une façon d écrire : H 0 : Il est crédible de penser que µ 1 = µ 2 H 1 : µ 1 est significativement différent de µ 2
12 Statistique La statistique de test S est une fonction qui résume l information sur l échantillon qu on veut tester. On la choisit de façon à pouvoir calculer sa loi sous H 0. S est une variable aléatoire, définie indépendemment des données observées. La valeur que prend cette variable aléatoire pour les données observées sera appelée statistique observée et notée S obs dans la suite. Suivant le type de statistique choisi, le test sera paramétrique ou non-paramétrique.
13 Région de rejet - Latéralité Définition La région de rejet est le sous-ensemble I de R tel qu on rejette H 0 si S obs appartient à I. Définir une procédure de test peut donc se faire en définissant 1. une statistique 2. une région de rejet pour cette statistique Exemple : Les test médicaux figurant sur une prise de sang, comme le taux de fer. H 0 : H 1 : La ferritine est entre 20 et 300µg/L La ferritine est trop haute ou trop basse
14 Région de rejet - Latéralité Définition La région de rejet est le sous-ensemble I de R tel qu on rejette H 0 si S obs appartient à I. La forme de la région de rejet définit la latéralité du test : test multilatéral : On veut rejetter H 0 si S obs est trop grand ou trop petit, sans à priori. La région de rejet est alors de la forme ], a] [b, + [. test unilatéral à droite : On veut rejetter H 0 seulement si S obs est trop grand. La région de rejet est alors de la forme [a, + [. test unilatéral à gauche : On veut rejetter H 0 seulement si S obs est trop petit. La région de rejet est alors de la forme ], b].
15 Exemples On considère toujours des médicaments réduisant la tension artérielle. Quelles sont les hypothèses pour répondre aux questions suivantes? Comparaison entre deux médicaments en vente Intérêt d un nouveau médicament plus cher que l existant. Intérêt d un nouveau médicament moins cher que l existant.
16 Exemples On considère toujours des médicaments réduisant la tension artérielle. Comparaison entre deux médicaments en vente H 0 : µ 1 = µ 2 H 1 : µ 1 µ 2 Intérêt d un nouveau médicament plus cher que l existant. H 0 : H 1 : µ new µ old µ new < µ old Intérêt d un nouveau médicament moins cher que l existant. H 0 : H 1 : µ new µ old µ new > µ old
17 Probabilité critique Définition La probabilité critique (ou p-valeur) est la probabilité, sous H 0, que la statistique soit au moins aussi éloignée de son espérance que la valeur observée. En d autres termes, c est la probabilité d observer quelque chose d au moins aussi surprenant que ce que l on observe. Si le test est unilatéral à droite, la probabilité critique est P(S > S obs ). S obs
18 Probabilité critique Définition La probabilité critique (ou p-valeur) est la probabilité, sous H 0, que la statistique soit au moins aussi éloignée de son espérance que la valeur observée. En d autres termes, c est la probabilité d observer quelque chose d au moins aussi surprenant que ce que l on observe. Si le test est unilatéral à gauche, la probabilité critique est P(S < S obs ). S obs
19 Probabilité critique Définition La probabilité critique (ou p-valeur) est la probabilité, sous H 0, que la statistique soit au moins aussi éloignée de son espérance que la valeur observée. En d autres termes, c est la probabilité d observer quelque chose d au moins aussi surprenant que ce que l on observe. Si le test est bilatéral et que la loi de la statistique est symétrique par rapport à 0, la probabilité critique est P( S > S obs ). S obs
20 Risque de première espèce ou confiance Définition Le risque de première espèce α est la probabilité sous H 0 de la région de rejet. En d autres termes, il s agit de la proabilité avec laquelle on accepte de décider H 1 si la vérité est H 0. α = P H0 (H 1) La quantité 1 α est la confiance du test. En d autres termes, une proportion α des situations dans lesquelles la vérité est H 0 verront une décision en faveur de H 1. α est la probabilité avec laquelle on accepte de se tromper quand la vérité est H 0
21 Autre manière de mener le test On peut comparer la p-valeur à α plutôt que S obs et la région de rejet. si la p-valeur est supérieure à α, il n est pas exceptionnel sous H 0 d observer la valeur effectivement observée. Par conséquent, H 0 est acceptée. si la p-valeur est inférieure à α, la valeur observée est jugée exceptionnelle sous H 0. On décide alors de rejeter H 0 et de valider H 1. Acceptation 5% S obs Seuil
22 Autre manière de mener le test On peut comparer la p-valeur à α plutôt que S obs et la région de rejet. si la p-valeur est supérieure à α, il n est pas exceptionnel sous H 0 d observer la valeur effectivement observée. Par conséquent, H 0 est acceptée. si la p-valeur est inférieure à α, la valeur observée est jugée exceptionnelle sous H 0. On décide alors de rejeter H 0 et de valider H 1. Rejet 5% Seuil S obs
23 Autre manière de mener le test On peut comparer la p-valeur à α plutôt que S obs et la région de rejet. si la p-valeur est supérieure à α, il n est pas exceptionnel sous H 0 d observer la valeur effectivement observée. Par conséquent, H 0 est acceptée. si la p-valeur est inférieure à α, la valeur observée est jugée exceptionnelle sous H 0. On décide alors de rejeter H 0 et de valider H 1. Avantage Cette méthode permet de se rendre compte à quel point on est sur de sa décision : la position de la p-valeur par rapport à α ne dépend pas de l échelle des données, contrairement à S obs et au(x) seuil(s) de la région de rejet. Exemple : Si on a fixé α = 0.05, une p-valeur de est clairement un rejet, alors qu une p-valeur de 0.03 est un rejet de peu qu il faudra nuancer au moment de l interprétation.
24 Risque de première espèce ou confiance Hormis dans des cas de tests multiples non abordés dans ce cours, α varie généralement entre 0, 01 et 0, 05. Dans le cas de variables continues, on peut choisir une valeur arbitraire de α et obtenir une région de rejet présentant exactement le risque α. Dans le cas de variables discrètes, le nombre de régions de rejet, et donc de risques, possibles est fini ou dénombrable. Dans ce cas, on fixe un risque, dit risque nominal, par exemple de 5%. On cherche alors la plus grande région ne dépassant pas ce risque, qui devient la région de rejet. Le véritable risque, dit risque réel, peut alors être recalculé.
25 Risque de deuxième espèce ou puissance Définition Le risque de deuxième espèce β est la probabilité d accepter H 0 alors que la vérité est H 1. β = P H1 (H 0) La quantité 1 β est la puissance du test. Décision Vérité H 0 H 1 H 0 1-α β H 1 α 1-β
26 Choix de α et β H 0 H 1 β α S
27 Choix de α et β H 0 H 1 β α S Si l échantillon reste inchangé, une diminution de α entraîne une augmentation de β et inversement. Autrement dit, si on décide de réduire le nombre de faux positifs, on augmente forcément le nombre de faux négatifs. La seule manière d améliorer les deux critères est d augmenter la taille de l échantillon.
28 Courbe de puissance Pour déterminer la puissance, il faut connaître la lois de S sous H 1, ce qui n est généralement pas le cas. On recourt alors à des courbes de puissance qui sont des courbes pour laquelle la puissance est calculée pour des valeurs données des paramètres du problème ou de la taille de l échantillon. On ne sait pas où se situe la situation réelle sur cette courbe mais on y lit la probabilité de détecter H 1 en fonction de son éloignement de H 0. Exemple : Courbe de puissance d un test de Student bilatéral sur 100 individus en fonction de mu[2] mu[1] (en supposant que σ 1 = σ 2 = 1)
29 Principe du test Les étapes d un test sont toujours réalisées dans l ordre suivant : 1) Choix du risque α 2) Choix du type de test et de sa latéralité si besoin 3) Calcul de la statistique de test 4) Calcul de la p-valeur 5) Conclusion En pratique, l utilisation d un logiciel type R permet de ne pas se soucier des partie 3) et 4). Par contre, les choix liées aux étapes 1) et 2) ainsi que l interprétation finale ne peuvent être faits par le logiciel.
30 Remarques sur les tests Le résultat d un test comprend toujours une dose d incertitude : ON NE SAIT JAMAIS SI ON A BIEN PRIS LA BONNE DECISION! La probabilité critique permet d avoir une vision plus fine que sa simple comparaison avec α. En effet, plus elle est petite, plus l évènement observé est surprenant sous H 0. Ainsi, pour α = 0.5, des probabilités critiques de 10 6 et de 0.35 impliquent le rejet de H 0 mais avec des degrés de certitude différent concernant la décision.
31 Tests paramétriques et non paramétriques Définition : test paramétrique Un test paramétrique est un test pour lequel on fait une hypothèse sur la forme des données sous H 0 (normale, Poisson,...). Les hypothèses du test concernant alors les paramètres gouvernant cette loi. Exemple : On suppose que la tension sous médicament suit une loi N (µ 1, σ 1) et celle sous placebo suit une loi N (µ 2, σ 2). S = σ x1 x2 1 n + 1 m H 0 : µ 1 = µ 2 H 1 : µ 1 µ 2 où σ = La loi de S sous H 0 est connue (loi de Student) (n 1) ˆσ (m 1) ˆσ 2 2 n + m 2
32 Tests paramétriques et non paramétriques Définition : test non-paramétrique Un test non paramétrique est un test ne nécessitant pas d hypothèse sur la forme des données. Les données sont alors remplacées par des statistiques ne dépendant pas des moyennes/variances des données initiales (tables de contingence, statistique d ordre...). Exemple : on classe les tensions de tous les individus par ordre croissant et on regarde comment sont classés les personnes sont médicaments. On obtient par exemple M M P M M P M P P M P P S est alors la somme des rangs des individus sous médicaments. On peut déterminer sa loi sous H 0.
33 Tests paramétriques et non paramétriques Lequel choisir? Les tests paramétriques, quand leur utilisation est justifiée, sont en général plus puissants que les tests non-paramétriques. Les tests paramétriques reposent cependant sur l hypothèse forte que l échantillon considéré est tiré suivant une distribution appartenant à une famille donnée. Il est possible de s en affranchir pour des échantillons suffisament grands en utilisant des théorèmes asymptotiques tels le TCL. Lese tests non-paramétriques sont cependant à préférer dans de nombreux cas pratiques pour lesquels les tests paramétriques ne peuvent être utilisés sans violer les postulats dont ils dépendent (notamment les échantillons trop petits). Les données sont parfois récupérés sous forme de rangs et non de données brutes. Seuls les tests non-paramétriques sont alors applicables.
34 Tests paramétriques et non paramétriques Efficacité relative asymptotique On fixe une confiance 1 α, une puissance 1 β. Soit H k une suite d hyptohèses alternatives (se rapprochant de H 0) et n 1k et n 2k les tailles d échantillons nécessaires pour que T 1 et T 2 aient la puissance β sous l hypothèse H. Sous certaines conditions de régularité, le quotient n 2k n 1k tend vers une constante, l ARE, quand k tend vers l infini. Un ARE de 2 signifie que pour détecter la même différence, il faut asymptotiquement des échantillons deux fois plus grands pour T 2 que pour T 1 pour obtenir la même puissance, impliquant que T 1 est plus efficace. Cette mesure est asymptotique mais en pratique, l efficacité pour des petits échantillons se révèle souvent proche de l efficacité asymptotique. Considérons l exemple où T 1 est le test du signe pour H 0 : m = 0 et T 2 le test t pour H 0 : µ = 0, dans le cas de distributions symétriques. On peut montrer que l ARE est inférieure est de 2 < 1 pour des distributions normales mais π supérieure à 1 pour d autres ditributions comme les double exponentielle ou les distributions de Laplace. Même en cas de validité des tests paramétriques, les tests non-paramétriques peuvent donc être concurrentiels, d autant plus que la puissance de calcul des ordianteurs actuels permet maintenant leur utilisation sur de grands échantillons.
35 II. TESTS DE COMPARAISON DE MEDIANES
36 I.1 Un échantillon : Test de Student
37 Test paramétrique d égalité de la moyenne avec une valeur prédéfinie : Test de Student Données Un échantillon x = (x 1,..., x n), une valeur µ 0 Question La moyenne µ de la population dont x est issu est-elle significativement différente de µ 0. Postulat La loi de la population est une loi normale ou x est suffisamment grand pour appliquer le TCL.
38 Test paramétrique d égalité de la moyenne : Test de Student Formulation H 0 : µ = µ 0 H 1 : µ µ 0 Ce test peut être mené de manière unilatérale. Statistique La statistique de Student est définie par t = ˆµ µ0 ˆσ/ n Sous H 0, t suit une loi de Student à n 1 degrés de liberté. Sous R t.test en utilisant les paramètres de µ 0. x pour l échantillon et mu pour la valeur
39 I.2 Un échantillon : Test du signe
40 Test non-paramétrique d égalité de la médiane avec une valeur prédéfinie : Test du signe Données Un échantillon x = (x 1,..., x n), une valeur m 0 Question La médiane m de la population dont x est issu est-elle significativement différente de m 0. Postulat Aucun
41 Test du signe Formulation H 0 : m = m 0 H 1 : m m 0 Ce test peut être mené de manière unilatérale. Statistique On associe un signe + aux valeurs supérieures à m 0 et un signe aux valeurs inférieures à m 0, et on note N + le nombre de +. Sous H 0, chaque valeur de l échantillon a une probabilité 1 d être supérieure à 2 m 0. N + suit donc une loi binimiale B(n, 1 ). 2
42 Test du signe Cas d égalité Il est possible que certaines valeurs de l échantillon soient égales à m 0. Plusieurs stratégies sont possibles, les principales étant a) d ignorer ces valeurs ; b) de les affecter par tirage au sort équiprobable ; c) de leur affecter le signe minoritaire afin d obtenir un test conservatif. Approximation normale Pour les grands échantillons (n>30), on peut utiliser la statistique Z = N n 1 2 n qui suit une loi normale centrée réduite. Une correction de continuité peut s avérer nécessaire dans ce cas.
43 Exemple Le nombre d observations de sanglier par an et par poste d observation a une médiane de 50 lorsque la population est normale. L échantillon suivant représente les observations de l année. A-t-il une médiane significativement différente de 50? > betes <- c(29,12,62,64,43,21,35,89,8,32,47,61) On applique un test du signe bilatéral à un niveau de 5% : > Npos <- sum(betes>50) > Nneg <- sum(betes<50) H 0 : m = 50 H 1 : m 50 Sous H 0, N + B(12, 0.5) et cette loi est symétrique. La p-valeur vaut donc 2P(N + 4) > 2* pbinom(4,12,.5,lower.tail=true) [1] On accepte H 0 : il n y pas de raison de penser que la population a un niveau anormal.
44 Exemple, suite On suppose maintenant que les données de cinquante postes d observations sont collectées et que 15 d entre eux ont donnée lieu à 50 observations ou plus. On applique toujours un test du signe bilatéral à un niveau de 5% : H 0 : m = 50 H 1 : m 50 Le nombre d observation nous permet de faire une approximation normale. > Zobs <- (15-25)/(sqrt(50)/2) > 2*pnorm(Zobs,0,1) [1] Cette fois, on rejette H 0 à un niveau de 5% : la population souffre d une anomalie.
45 Variantes Test d équiprobabilité de deux évènements La procédure est exactement la même, un des évènements correspondant au signe, l autre au signe +.
46 Variantes Test d équiprobabilité de deux évènements La procédure est exactement la même, un des évènements correspondant au signe, l autre au signe +. Test d un quantile Soit q α le quantile d ordre α de l échantillon et q une valeur fixée. On peut généraliser le test du signe au problème H 0 : H 1 : q α = q q α q Il suffit pour cela d assigner un signe aux valeurs inférieures à q, un signe + aux valeurs supérieures à q et de considérer le nombre de signe qui suit sous H 0 une loi binomiale B(n, q).
47 Variantes Test du signe pour une tendance : test de Cox et Stuart Tendance à la hausse ou à la baisse dans un échantillon d observations indépendantes ordonnées? H 0 : H 1 : Pas de tendance Tendance significative Dans le cas d un échantillon pair n = 2m, les différences (x m+1 x 1,..., x 2m x m) sont calculées et leur signe est gardé en mémoire. Pour n = 2m + 1, on procède de même en éliminant la valeur x m+1. Sous H 0, le nombre de signes suit une loi B(m, 1 2. Test unilatéral : hausse (ou baisse) uniquement. Moins puissant que les tests liés au modèle linéaire, mais sans postulat d évolution linéaire.
48 I.3 Un échantillon : Test des rangs signés de Wilcoxon
49 Statistique du rang Definition : rang Soit X un vecteur aléatoire. Le rang R i de la variable X i est l ordre de cette dernière quand on réordonne X par ordre croissant. Exemple : X = (15, 6, 23, 17, 8), R = (3, 1, 5, 4, 2) sous R La fonction rank donne l échantillon des rangs La fonction order donne la place dans l échantillon du minimum, puis de la deuxième plus petite valeur,... > x <- c(15,6,23,17,8) > rank(x) [1] > order(x) [1] > x[order(x)] [1]
50 Cas absolument continu Si la loi des X i est absolument continue, la probabilité d avoir des ex-aequos est nulle. Proposition Pour tout k, 1 i 1 <... < i k n et 1 j 1 <... < j k = n), P ( (R i1,..., R ik ) = (j 1,..., j k ) ) = (n k)! n! Proposition E(R i) = n+1 et VarR 2 i = n2 1 12
51 Cas des ex-aequo Definition : rang avec ex-aequos Soit X un vecteur aléatoire dont les coordonnées sont iid. Soit t le nombre de variables prenant la même valeur que X i. L ordre R i de X i est la moyenne arithmétique des ordres des t variables concernées quand on réordonne X par ordre croissant. Exemple : Pour X = (9, 7, 5, 7, 4, 5, 5), R = (7, 5.5, 3, 5.5, 1, 3, 3).
52 Cas des ex-aequo Definition : rang avec ex-aequos Soit X un vecteur aléatoire dont les coordonnées sont iid. Soit t le nombre de variables prenant la même valeur que X i. L ordre R i de X i est la moyenne arithmétique des ordres des t variables concernées quand on réordonne X par ordre croissant. Exemple : Pour X = (9, 7, 5, 7, 4, 5, 5), R = (7, 5.5, 3, 5.5, 1, 3, 3). Soit t l le nombre de valeurs ayant le l ime rang (dans l exemple, t 1 = 1, t 2 = 3, t 3 = 2, t 4 = 1) et T = l t 2 l (t l 1). Proposition E(R i) = n+1 et VarR 2 i = n2 1 E(T ) 12 12n
53 Test des rangs signés de Wilcoxon Données Un échantillon x = (x 1,..., x n), une valeur m 0 Question La médiane m de la population dont x est issu est-elle significativement différente de m 0? Postulat Le test nécessite de faire l hypothèse d une distribution symétrique. Ce postulat implique que médiane et moyenne sont confondues.
54 Test des rangs signés de Wilcoxon Formulation H 0 : m = m 0 H 1 : m m 0 Ce test peut être mené de manière unilatérale. Sous R Fonction wilcox.test
55 Test des rangs signés de Wilcoxon Statistique On pose D = X m 0 puis on calcule les rangs R du vecteurs D = ( D 1,..., D n. Les statistiques d interêt sont alors S + = i,d i >0 S = i,d i <0 Ri. Ri et Exemple : Si X t = (1, 5, 10, 12, 0, 8) et m 0 = 7, D t = ( 6, 2, 3, 5, 7, 1) et R t = (5, 2, 3, 4, 6, 1). Une autre manière de l écrire est de réordonner D suivant les valeurs absolues croissantes, c est-à-dire 1, 2, 3, 5, 6, 7. On obtient donc S + = = 8 et S = = 13.
56 Test des rangs signés de Wilcoxon On a toujours S + + S = n(n+1) 2, s intéresser à l une des variables suffit donc. Le test s écrit alors (dans le cas bilatéral) Proposition H 0 : ES + = ES n(n + 1) = 4 H 1 : ES + n(n + 1) 4 Sous l hypothèse H 0 et en supposant que de X est absolument continue (pas d ex-aequos), VarS + = n(n + 1)(2n + 1) 24 où c kn est le coefficient de t k dans n k=1 (1 + t k ). et P(S + = k = c kn 2 n )
57 Approximation pour les grands échantillons Dans le cas de grands échantillons (n > 20), l utilisation du TCL permet d utiliser la statistique Z = S + n(n+1) 4 n(n+1)(2n+1) 24 dont la loi peut être approchée par une loi normale centrée réduite.
58 Cas des ex-aequos d le nombre de valeurs égales à m 0 t l introduits précédemment Pour des grands échantillons, l approximation normale peut alors être utilisée en remplaçant la variance par n(n + 1)(2n + 1) 24 d(d + 1)(2d + 1) 24 l t 3 l t l 48
59 Exemple (P. Sprent) Reprenons l exemple du nombre d animaux observés, un total de 35 postes ayant été pris en compte
60 Exemple (P. Sprent) L échantillon modifié devient La statistique S + vaut alors 293, d = 1 et il y 7 paires d ex-aequo donc l tl 3 t l = La p-valeur est de H 0 est accepté.
61 I.4 Tests paramétriques pour deux échantillons : Fisher-Snedecor et Student
62 Test d égalité des variances : test de Fisher Hypothèses On dispose de deux échantillons d écart-types respectifs ˆσ 1 et ˆσ 2. On se demande s il est raisonnable de penser que les deux échantillons ont été tirés suivant des lois de même écart-type ou si ils sont significativement différents. H 0 : σ 1 = σ 2 H 1 : σ 1 σ 2 Statistique σ 1 2 F = ˆ σˆ 2 2 suit une loi de Fisher F n1,n 2 sous H 0. Latéralité - Région de rejet Les trois options énoncées au chapitre précédent sont possibles : rejet unilatéral à droite, à gauche ou bilatéral. Sous R var.test
63 Comparaison de la moyenne de deux échantillons : t-test ou test de Student Hypothèses On dispose de deux échantillons de moyennes respectives µ 1 et µ 2 et d écart-type respectifs σ 1 et σ 2. On se demande s il est raisonnable de penser que les deux échantillons ont été tirés suivant des lois de même espérance ou si leurs moyennes sont significativement différentes. H 0 : µ 1 = µ 2 H 1 : µ 1 µ 2
64 Comparaison de la moyenne de deux échantillons : t-test ou test de Student Statistique La valeur de la statistique peut prendre quatre expressions différentes suivants les critères suivants : appariement les échantillons sont appariés ou non. égalité des variances les variances sont significativement différentes (hétéroscédasticité) ou pas (homoscédasticité). Toutes ces statistiques reposent en fait sur le même principe qui est de dépendre essentiellement de la différence µ 1 µ 2, normalisée par une quantité permettant d obtenir une variable de loi de Student sous H 0. Par exemple, dans le cas d échantillons non appariés, de variance non significativement différentes, et de taille respectives n et m, t = σ µ1 µ2 1 n + 1 m où σ = (n 1) ˆσ (m 1) ˆσ 2 2 n + m 2
65 Comparaison de la moyenne de deux échantillons : t-test ou test de Student Latéralité - Région de rejet Les trois options énoncées au chapitre précédent sont possibles : rejet unilatéral à droite, à gauche ou bilatéral. Sous R t.test en utilisant les paramètres x et y pour les deux échantillons, alternative pour le latéralité, paired pour l appariement ou non des échantillons et var.equal pour l égalité des variances.
66 Exemple Pour n grand et p petit, la loi binômiale B(n, p) peut etre approximée par la loi de Poisson P(np). > x <- rbinom(100,100,.05) > y <- rpois(100,5) > var.test(x,y) F test to compare two variances data: x and y F = , num df = 99, denom df = 99, p-value = alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: sample estimates: ratio of variances >
67 Exemple Pour n grand et p petit, la loi binômiale B(n, p) peut etre approximée par la loi de Poisson P(np). > x <- rbinom(100,100,.05) > y <- rpois(100,5) > t.test(x,y,alternative="two.sided",paired=false,var.equal=true) Two Sample t-test data: x and y t = , df = 198, p-value = alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: sample estimates: mean of x mean of y
68 I.5 Test non-paramétrique pour deux échantillons : Test de Wilcoxon-Mann-Whitney
69 Appariement Deux échantillons x = (x 1,..., x n) et y = (y 1,..., y n) sont appariés si ils correspondent à des mesures prises sur les mêmes individus dans des conditions différentes. Tester l égalité de leurs médianes revient alors à considérer l échantillon des différences x y et à tester si la médiane de cet échantillon est bien nulle test du signe ou des rangs signés de Wilcoxon. On suppose par la suite que les deux échantillons sont non appariés.
70 Test de Wilcoxon-Mann-Whitney Données Deux échantillons x = (x 1,..., x n1 ) et y = (y 1,..., y n2 ). Question La médiane m 1 de la population dont x est issu est-elle significativement différente de la médiane m 2 de la population dont y est issu? Postulat Le test nécessite de faire l hypothèse que les distributions sont identiques à une translation près.
71 Test de Wilcoxon-Mann-Whitney Formulation H 0 : m 1 = m 2 H 1 : m 1 m 2 Ce test peut être mené de manière unilatérale. Sous R Fonction wilcox.test
72 Test de Wilcoxon-Mann-Whitney Statistique On ordonne l échantillon obtenu en concaténant les deux échantillons d interêt. On note S i la somme des rangs de l échantillon i. L idée est que sous H 0, S 1 et S 2 devraient être proche l un de l autre et de (n 1+n 2 )(n 1 +n 2 +1) 2. L approche de Wilcoxon considère S 1 ou S 2 comme statistique. Celle de Mann-Whitney considère l une des statistiques U i = S i n i (n i +1) 2. Les lois des S i et U i peuvent être calculées explicitement pour des n i petits et sont tabulées dans les logiciels de statistique.
73 Test de Wilcoxon-Mann-Whitney Exemple : x = (4, 6, 2), y = (1, 3, 8, 9) L appartenance aux échantillons dans l échantillon concaténé ordonné est (y, x, y, x, x, y, y). On a alors S x = = 11 et U x = = 5 U 1 peut être calculé en prenant chacune des valeurs de l échantillon 2 et en regardant combien de valeurs de l échantillon 1 lui sont supérieures, puis en sommant les résultats obtenus.
74 Approximation pour les grands échantillons Soit U = min(u 1, U 2). Pour n 1 et n 2 tous deux supérieurs à 20, il est raisonnable de considérer que Z = suit une loi normale centrée réduite. Cas d ex-aequos U n1n2 (n1 + n 2)(n 1 + n 2 + 1)/12 Les rangs des ex-aequos sont remplacés par leurs rangs moyens comme dans le chapitre précédent. Si le nombre d ex-aequos est très faible, ils peuvent être négligés. Sinon, il faut modifier l approximation pour les grands échantillons en retranchant au terme sous la racine du dénominateur la quantité (t 3 n 1n 2 l t l ) 12(n 1 + n 2)(n 1 + n 2 1)
75 Autre possibilité : généralisation du test du signe Soit m 0 la médiane de l échantillon concaténé. On dresse le tableau de variation Echantillon 1 Echantillon 2 > m 0 a 1 a 2 < m 0 n 1 a 1 n 2 a 2 et on applique un test d indépendance entre les variables Echantillon et Etre inférieur à m 0 (cf chapitres suivants). Avantage : pas de postulat Inconvénient : manque de puissance
76 I.6 Comparaison paramétrique de trois échantillons non appariés ou plus : ANOVA
77 ANOVA à un facteur Données k échantillons x 1 = (x 1,1,..., x 1,n1 ) et x k = (x k,1,..., x k,nk ). Question Les médianes µ 1,..., µ k des populations dont sont issues les échantillons sont-elles toutes égales? Postulat Les distributions sont normales de variances identiques.
78 ANOVA à un facteur Formulation H 0 : H 1 : µ 1 = µ 2 =... = µ k Au moins une moyenne diffère Sous R Fonction aov
79 ANOVA à un facteur Décomposition de la variance n p j (x ij x) 2 = j =1 i=1 p (x j x) 2 + j =1 n p j (x ij x j ) 2 (1) j =1 i=1 SCT = SCE + SCR (2) Carrés moyens : CMT = SCT SCE SCR, CME =, CMR =. n 1 p 1 n p Statistique F = CME. Souc H0, F suit une loi Fisher(p 1, n p). CMR
80 I.7 Comparaison non-paramétrique de trois échantillons non appariés ou plus : Test de Kruskal-Wallis
81 Test de Kruskal-Wallis Données k échantillons x 1 = (x 1,1,..., x 1,n1 ) et x k = (x k,1,..., x k,nk ). Question Les médianes m 1,..., m k des populations dont sont issues les échantillons sont-elles toutes égales? Postulat Les distributions sont identiques à des translations près.
82 Test de Kruskal-Wallis Formulation H 0 : H 1 : m 1 = m 2 =... = m k Au moins une médiane diffère Sous R Fonction kruskal.test
83 Test de Kruskal-Wallis Statistique x ij la j eme observation de l échantillon i et R ij son rang dans l union de tous les échantillons. n i la taille de l échantillon i et R i. = 1 i n i R ij. La statistique est F KW = = 12 n(n + 1) k i=1 12 n(n + 1) n i(r i. n + 1 ) 2 2 k i=1 R 2 i. n i 3(n + 1) F KW a une loi qui peut être calculée exactement pour les petits échantillons et qui suit asymptotiquement une loi du χ 2 à k 1 ddl pour de grands échantillons.
84 I.8 Comparaison de trois échantillons appariés ou plus : Test de Friedman
85 Test de Friedman Données k échantillons appariés x 1 = (x 1,1,..., x 1,n) et x k = (x k,1,..., x k,n ). Question Les médianes m 1,..., m k des populations dont sont issues les échantillons sont-elles toutes égales? Postulat Les distributions sont identiques à des translations près.
86 Test de Friedman Formulation H 0 : H 1 : m 1 = m 2 =... = m k Au moins une médiane diffère Sous R Fonction friedman.test
87 Test de Friedman Statistique X = ((x ij )) une matrice de taille k n contenant les observations. R ij le rang de x ij dans sa colonne, c est-à-dire parmi toutes les j eme observations. La statistique est S F = = 12n k(k + 1) 12 nk(k + 1) k (R i. k i=1 ) 2 k Ri. 2 3n(k + 1) i=1 S F a une loi qui peut être calculée exactement pour les petits échantillons et qui suit asymptotiquement une loi du χ 2 à k 1 ddl pour de grands échantillons.
88 III. COMPARER PLUSIEURS VARIABLES
89 Question On considère un couple de variables (X, Y ). Que peut-on dire de la façon dont X évolue suivant les valeurs de Y? Variable quantitative vs variable qualitative Cela revient à comparer les échantillons de valeurs de X correspondant aux différentes valeurs de Y. On utilise donc les tests du chapitre précédent pour comparer les moyennes/médianes.
90 III.3 Deux variables quantitatives : Tests de corrélation
91 Indépendance de deux variables qualitatives : test des coefficients de corrélation Corrélation de Pearson > x corr(x, y) = cov(x, y) s xs y [1] [7] > y [1] [7] > z [1] [8] > cor(x,y) [1] > cor(y,z) [1]
92 Indépendance de deux variables qualitatives : test des coefficients de corrélation Corrélation des rangs de Spearman ρ = corr(r(x), r(y)) où r(x) désigne l échantillon des rangs tiré de x. > rank(x) [1] > rank(y) [1] > rank(z) [1] > cor(x,y,method="spearman") [1] > cor(y,z,method="spearman") [1]
93 > rank(x) [1] > rank(y) [1] > rank(z) [1] > cor(x,y,method="kendall") [1] -0.2 > cor(y,z,method="kendall") [1] Indépendance de deux variables qualitatives : test des coefficients de corrélation Corrélation des rangs de Kendall Soit n c le nombre de concordances, c est-à-dire de paires (x i, y i) et (x j, y j ) telles que x i < x j et y i < y j ; Soit n d le nombre de discordances, c est-à-dire de paires (x i, y i) et (x j, y j ) telles que x i < x j et y i > y j ; Le coefficient de Kendall est alors τ = nc n d n(n 1)/2
94 Indépendance de deux variables qualitatives : test des coefficients de corrélation Interprétation Ces trois coefficients sont compris entre 1 et 1 et valent 0 pour des variables indépendantes. Une valeur significativement positive indique une corrélation positive (Y augmente quand X augmente). Une valeur significativement négative indique une corrélation négative (Y augmente quand X augmente).
95 Indépendance de deux variables qualitatives : test des coefficients de corrélation Formulation H 0 : corr(x, y) = 0 ou ρ = 0 ou τ = 0 H 1 : corr(x, y) 0 ou ρ 0 ou τ 0 Latéralité Le test peut être mené de façon unilatérale pour ne détecter qu une corrélation positive ou qu une corrélation négative. Sous R cor.test
96 Principe des tests Test de Pearson Sous H 0, à condition que le couple (X, Y ) suive une loi normale bivariée ou que l effectif soit suffisamment important, suit une loi du χ 2 à n 2 ddl, S = corr(x, y) 1 corr(x,y) 2 n 2 Tests non paramtrique Les lois correspondantes sont tabulées.
97 Exemple 1 (P. Sprent) 7 déclinaisons d un même produit ont été évalués par des panels de consommateurs français et allemands. Les rangs obtenus pour les 7 produits sont les suivants. On se demande s il y a une concardance entre les classements. F D Spearman : ρ = 0.57, p-valeur de 0.2. Kendall : 15 concardances, 6 discordances, τ = 0.48, p-valeur de 0.43.
98 Exemple 2 Le tableau suivant donne le taux d ensoleillement (en heures/an) et de pluviométrie (en mm/an) en dix villes situés sur un axe nord-sud. Peut-on parler d une tendance monotone de croissance de l ensoleillement le long de cet axe? De diminution de la pluviométrie? Lille Amiens Paris Auxerre Dijon Lyon Orange Marseille Bastia A Les tests de corrélation peuvent être une alternative plus puissante au test de Cox-Stuart pour la détection de tendance. On peut par exemple caractériser chaque ville par sa latitude.
99 Plus de deux variables Kendall a introduit un coefficient de concordance si il y a plus de deux variables. Il n est cependant plus possible de faire la différence entre concordance et discordance, mais seulement entre homogénéité et hétérogénéité. Pour k variables et des échantillons de taille n avec R ij désignant le rang de l individu i pour la variable j, ce coefficient vaut W = avec R i = sum j R ij. 12 k 2 n(n 2 1) n (R i i=1 k(n + 1) ) 2 2 k(n 1)W correspond à la statistique de Friedman et suit donc une loi du χ 2 à n 1 degrés de liberté.
100 Plus de deux variables Tester l indépendance de plus de trois variables revient en fait à faire un test de Friedman en changeant les hypothèses : H 0 : H 1 : Les variables sont indépendantes = les rangs sont distribuées au hasard Les variables ne sont pas indépendantes = il y a concordance entre les rangs
101 Exemple X 1 X 2 X 3 X La p-valeur de Friedman est de H 0 est donc très claiement accepté : en effet, les sommes des rangs par ligne sont très proches. Pourtant, on peut voir que X 1, X 3 et X 2, X 4 sont concordantes et de rangs respectifs inverses (ou presque). Cette situation est indétectable par un test de concordance.
102 III.2 Deux variables qualitatives : Tests de Fisher et du χ 2 d indépendance
103 Table de contingence X et Y sont qualitatives : pas de coefficient de corrélation possible Leur valeurs sont regroupées en respectivement r et s ensembles. Le tableau à r lignes et s colonnes contenant les effectifs est appelé table de contingence. Les sommes par lignes et colonnes donnent les effectifs marginaux. La somme globale donne l effectif total. Exemple : Guérison Non-guérison Traitement 7 3 Placebo 3 6
104 Sommes marginales fixées : le test exact de Fisher Formulation H 0 : H 1 : X et Y sont indépendantes X et Y ne sont pas indépendantes Postulats Les sommes marginales sont fixées.
105 Sommes marginales fixées : le test exact de Fisher Procédure Considérons l exemple d une table 2 2 avec une répartition a b c d. Fisher a établi des formules d énumération du nombre de répartition possible des a + b + c + d éléments de façon à ce que les sommes par ligne valent bien a + b et c + d et les sommes par colonnes a + c et b + d. Sous une hypothèse d équiprobabilité de ces répartitions, la probabilité de la table de contingence précédente est (a + b)!(a + c)!(b + c)!(b + d)! (a + b + c + d)!a!b!c!d! Ces formules peuvent être étendues à des tailles de tables plus grandes et sont calculables de manière efficace algorithmiquement.
106 Sommes marginales libres : le test du χ 2 d indépendance ou χ 2 de Pearson Dans le cas de grands échantillons, il n est plus nécessaire de supposer les sommes marginales fixées. Formulation H 0 : H 1 : X et Y sont indépendantes X et Y ne sont pas indépendantes Postulats L échantillon est grand.
107 Sommes marginales libres : le test du χ 2 d indépendance ou χ 2 de Pearson Procédure On note n ij l entrée de la table dans la cellule i j, n i la somme des effectifs de la ligne i et n j la somme des efectifs de lacolonne j. Sous hypothèse d indépendance, P(X I i, Y J j ) = P(X I i)p(y J j ) ce qui se traduit, si on remplace les probabilités par leurs estimateurs, par une égalité attendue entre n ij et e ij = n i n j, où N est l effectif total. N La statistique T = i,j (n ij e ij ) 2 = e ij i,j n 2 ij e ij N suit une loi du χ 2 à (r 1)(s 1) degrés de liberté sous H 0.
108 Exemple Des cultures cellulaires de souches différentes sont soumises à des rayonnements radioactifs et la proportion de cellules mortes est relevée. A B C D ray. α ray. β ray. γ temoin valeur de la statistique de 23.6 nombre de degrés de liberté de 9 p-valeur de Les souches réagissent différemment aux rayonnements.
109 Fisher ou χ 2? Asymptotiquement, ils sont équivalents en terme de puissance. Le test de Fisher est beaucoup plus couteux algorithmiquement : le test du χ 2 lui est généralement préféré, hormis dans le cas des tables 2 2 avec des effectifs assez réduits. Avoir des sommes marginales fixes (Fisher) est en général non conforme à l expérience. Dans un test médical Cas/Contrôles par exemple, le nombre de cas et de contrôles est fixé mais le nombre de patients répondant favorablement ne l est pas. Attention : la loi du χ 2 est une approximation, elle est donc d une validité douteuse quand les effectifs sont faibles.
110 IV. AUTRES TESTS
111 IV.1. Adéquation à une loi
112 Test du chi-deux d adéquation Formulation Soit (X 1,..., X n) un échantillon et F 0 une distribution donnée. On cherche à déterminer si l échantillon est tiré suivant F 0. Pour cela, on considère la fonction de répartition F n(t) = 1 n I Xi <t n i=1 H 0 : F n = F 0 H 1 : F n F 0 Postulats Pas de postulat particulier.
113 Test du chi-deux d adéquation Partition de l ensemble des valeurs possibles de X en un nombre fini d intervalles I 1,..., I k, I k = [a k 1, a k ]. Pour tout 1 i k : π i = F 0(a i) F 0(a i 1. Soit U i le nombre de mesures parmi n faisant partie de l intervale I i. U suit une loi multinomiale P(U 1 = m 1,..., U k = m k ) = n! m 1!... m k! πm π m k k Pris séparément, chaque U i suit une loi binomiale B(n, π i). Pour n suffisamment grand, le TCL implique que U i nπ i nπi suit une loi normale centrée réduite.
114 Test du chi-deux d adéquation Statistique X 2 n = k (U i nπ i) 2 i=1 Sous H 0, pour n assez grand, Xn 2 suit une loi du chi-deux à (k 1) degrés de liberté, notée χ 2 (k 1). Si X n est proche de 0, les effectifs observés (U i) sont proches des effectifs attendus (nπ i) et H 0 est accepté. Si X n est élevé, il existe des intervalles pour lequel la différence entre l observation et l attendu est grande, et H 0 est rejetée. La p-valeur du test est pv = 1 F χ 2 (Xn 2 ). (k 1) Remarque ; Cette loi est définie comme celle suivie par la somme des carrés de k 1 lois normales centrées réduites. Le passage à k 1 alors qu il y a k termes dans la sommation vient du fait que les U i ne sont pas indépendants puisque U i = n. nπ i
115 Exemple On a mesuré le poids de 25 barils de lessive censés faire 1kg, on se demande si ils suivent une loi normale d écart-type 25g comme prévu. Les poids en grammes sont les suivants : X = (947, 965, 970, 976, 978, 980, 986, 989, 996, 996, 997, 999, 1000, 1002, 1003, 1006, 1008, 1008, 1010, 1013, 1018, 1023, 1025, 1027, 1030) On découpe R en intervalle I 1 =], 980], I 2 =]980, 1000], I 3 =]1000, 1020], I 4 =]1020, + [. Les probabilités associées sous H 0 sont π 1 = 0.21, π 2 = 0.28, π 3 = 0.21, π 4 = Intervalle I 1 I 2 I 3 I 4 Attendu Observe La statistique associée vaut 4 et la p-valeur associée vaut 0.26 : H 0 est acceptée.
116 Remarques Si les intervalles sont choisis trop petits, les U i sont la plupart du temps égaux à 0 ou 1 et même pour n grand, l approximation asymptotique se révèle fausse. En pratique, on recommande de choisir les intervalles tels que nπ i 5. En fait, le test du chi-deux d adéquation teste la véracité de l hypothèse H 0 : π X i = π i, i où πi X est la probabilité sous la loi de X de tomber dans I i. C est donc une hypothèse moins forte que H 0 : il est possible que H 0 soit fausse mais que H 0 soit vraie. En décidant de rejeter H 0 si H 0 est fausse, on fait donc un choix conservatif. Dans le cas d une variable X qualitative, il est possible de mener ce test en ordonnant de façon arbitraire les valeurs possibles.
117 Autre exemple L équilibre de Hardy-Weinberg régit la répartition des allèles non-sexuels dans une population homogène avec union aléatoires et non-consanguines : si il est vérifié, P(AA) = p 2 A, P(Aa) = 2p A (1 p A ) et P(aa) = (1 p A ) 2 où p A est la fréquence de l allèle A dans la population. On veut tester si équilibre vrai avec p A = 0.2 et une population de taille n = 100. Genotype AA Aa aa Attendu Observe On obtient une statistique de χ 2 = (7 4)2 4 + (32 19) (74 64)2 64 = 9.09 et une p-valeur de L hypothèse H 0 est rejetée. Soit la fréquence de l allèle n est pas de 0.2, soit l équilibre de Hardy-Weinberg n est pas respecté.
118 Test de Kolmogorov-Smirnov Formulation Soit (X 1,..., X n) un échantillon et F 0 une distribution continue donnée. On cherche à déterminer si l échantillon est tiré suivant F 0. Pour cela, on considère la fonction de répartition n F n(t) = 1 n i=1 I Xi <t H 0 : F n = F 0 H 1 : F n F 0 Postulat La distribution candidate est continue.
119 Test de Kolmogorov-Smirnov Le principe est de choisir comme statistique une distance entre fonctions que l on applique à F n et F 0. Les choix possibles sont Kolmogorov-Smirnov Cramer-Von Mises Andersen-Darling ω 2 D n = sup t R F n(t) F 0(t) C n = (F n(t) F 0(t)) 2 df 0(t) A n = R R (F n(t) F 0(t)) 2 F 0(t)(1 F 0(t)) df0(t) Généralisation des 2 précédents. ωn 2 = (F n(t) F 0(t)) 2 ξ(f 0(t))dF 0(t) R avec ξ une fonction positive sur ]0, 1[. Les trois autres tests sont similaires à celui de Kolmogorov-Smirnov d un point de vue de l utilisation et de l interprétation mais techniquement plus compliqués.
120 Test de Kolmogorov-Smirnov Le maximum de la fonction F n F 0 est forcément pris sur l un des sauts de F n. Si X (i) correspond à la ieme valeur de l échantillon rangé par ordre croissant, déterminer la statistique D n revient donc à calculer i X n (i) et i 1 n X (i) pour tout i et à prendre le maximum de ces 2n valeurs. La loi sous H 0 de D n est calculée : exactement par des algorithmes pour n petit. par approximation asymptotique pour n grand : P( + nd n x) K (x) = 2 ( 1) k 1 e 2k 2 x 2 k=1 La p-valeur du test est donc obtenue par pv = 1 K ( nd n).
121 Test de Kolmogorov-Smirnov Les test de type Kolmogorov-Smirnov peut être rendu unilatéral : on teste si la distribution de l échantillon est globalement plus basse que la distribution de référence, auquel cas on s intéresse au fait que F n F 0 est positive et on choisit comme statistique max(f n(t) F 0(t)) ; ou à l inverse on teste si la distribution de l échantillon est globalement plus basse que la distribution de référence, auquel cas on s intéresse au fait que F n F 0 est négative et on choisit comme statistique max(f 0(t) F n(t)). Dans ce cas, K est remplacé par K définie par K (x) = 1 e x 2 l approximation asymptotique. dans
122 Exemple On a mesuré le poids de 20 barils de lessive censés faire 1kg, on se demande si suivent une loi normale d écart-type 25g comme prévu. Les poids en grammes sonts le suivants : X = (947, 965, 970, 976, 978, 986, 989, 996, 997, 1000, 1002, 1008, 1010, 1013, 1018, 1023, 1025, 1030) (3) On calcule D n, qui vaut La p-valeur asymptotique est 1 K ( ) = 0.97.
123 IV.2 Test d appartenance à une famille de lois
124 Test d appartenance à une famille de lois Le principe du test du χ 2 peut être généralisée pour tester l appartenance à une famille de loi, autrement dit savoir si F n appartient à une famille de fonctions de répartition F 0 = {F (x, θ) : θ Θ}. Le principe reste la même, y compris la statistique X 2 n (θ) = k i=1 (U i nπ i(θ)) 2 nπ i(θ) La seule différence étant qu il faut donner une valeur au paramètre θ à travers l utilisation d un estimateur ˆθ. Il y a plusieurs possibilités : 1. ˆθ = argminθ Θ X 2 n (θ) 2. ˆθ = k argminθ Θ i=1 dans ce cas. (U i nπ i (θ)) 2 U i. On parle de statistique du χ 2 modifié 3. ˆθ est l estimateur du maximum de vraisemblance pour la distribution multinomiale, c est-à-dire la valeur maximisant la log-vraisemblance l(θ) = k i=1 Ui ln πi(θ) + C.
125 Test d appartenance à une famille de lois Proposition Sous les conditions 1. 0 < π i(θ) < 1 pour tout i et tout θ ; 2. les π i(θ) sont de classe C 2 ; 3. la matrice des dérivées partielles [ dπ i (θ) θ j est de rang s ; ]1 i k,1 j s et pour chacun des estimateurs précédents, X 2 n (ˆθ) suit asymptotiquement une loi du χ 2 à k s 1 degrés de liberté. On peut donc appliquer le test du χ 2 comme précédemment, en otant autant de degrés de liberté que de dimensions dans Θ et en calculant la statistique à l aide d un des estimateurs cités plus haut.
126 Test de normalité : le test de Shapiro-Wilk On considère un vecteurx dont on se demande s il a été tiré suivant une loi normale. Droite de Henry Soit Φ la fonction de répartition de la loi normale centrée réduite. Si X N (µ, σ 2 ), P(X < x i) = Φ( xi µ ) σ En définissant t i = Φ 1 (P(X < x i), les points (x i, t i) devraient sont donc alignés si la loi est normale. Remarque : Cette méthode permet d estimer la moyenne et la variance de la loi si elle est bien normale.
127 Test de normalité : le test de Shapiro-Wilk Formulation H 0 : H 1 : La loi de l echantillon est normale La loi n est pas normale Principe Le test de Shapiro-Wilk consiste à considérer le rapport entre l estimation de la variance suivant la droite d Henry et l estimation de la variance par l estimateur habituel. W = ( n i=1 aixi)2 n i=1 (xi x)2 où les a i sont des constantes tabulées. Si la distribution est bien normale, ce rapport doit être proche de 1.
128 IV.3 Test du rapport de vraisemblance
129 Modèles emboîtés On considère deux modèles M 1 et M 2 pour décrire le même processus. M 1 est emboîté dans M 2 s il correspond à un cas particulier de M 2. Exemple : M 1 M 2 Y = α + βx + ɛ Y = α + βx + γz + δw + ɛ La question qui se pose est de savoir si la modèle M 2 décrit mieux les données que le modèle M 1
Introduction à la statistique non paramétrique
Introduction à la statistique non paramétrique Catherine MATIAS CNRS, Laboratoire Statistique & Génome, Évry http://stat.genopole.cnrs.fr/ cmatias Atelier SFDS 27/28 septembre 2012 Partie 2 : Tests non
Plus en détailTABLE DES MATIERES. C Exercices complémentaires 42
TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence
Plus en détaildistribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position
Arbre de NESI distribution quelconque Signe 1 échantillon distribution symétrique non gaussienne Wilcoxon gaussienne Student position appariés 1 échantillon sur la différence avec référence=0 2 échantillons
Plus en détailAnalyse de la variance Comparaison de plusieurs moyennes
Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction
Plus en détailLire ; Compter ; Tester... avec R
Lire ; Compter ; Tester... avec R Préparation des données / Analyse univariée / Analyse bivariée Christophe Genolini 2 Table des matières 1 Rappels théoriques 5 1.1 Vocabulaire....................................
Plus en détailBiostatistiques : Petits effectifs
Biostatistiques : Petits effectifs Master Recherche Biologie et Santé P. Devos DRCI CHRU de Lille EA2694 patrick.devos@univ-lille2.fr Plan Données Générales : Définition des statistiques Principe de l
Plus en détailCours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES
LES STATISTIQUES INFERENTIELLES (test de Student) L inférence statistique est la partie des statistiques qui, contrairement à la statistique descriptive, ne se contente pas de décrire des observations,
Plus en détailIntroduction aux Statistiques et à l utilisation du logiciel R
Introduction aux Statistiques et à l utilisation du logiciel R Christophe Lalanne Christophe Pallier 1 Introduction 2 Comparaisons de deux moyennes 2.1 Objet de l étude On a mesuré le temps de sommeil
Plus en détailBiostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke
www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3
Plus en détailStatistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année 2010-2011
Master 1 Biologie et technologie du végétal Année 010-011 Statistiques Rappels de cours et travaux dirigés (Seul ce document sera autorisé en examen) auteur : Jean-Marc Labatte jean-marc.labatte@univ-angers.fr
Plus en détailChapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens
Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques
Plus en détailLa problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites
La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur
Plus en détailTests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»
Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences
Plus en détailTests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision
Page n 1. Tests du χ 2 une des fonctions des statistiques est de proposer, à partir d observations d un phénomène aléatoire (ou modélisé comme tel) une estimation de la loi de ce phénomène. C est que nous
Plus en détailProbabilités III Introduction à l évaluation d options
Probabilités III Introduction à l évaluation d options Jacques Printems Promotion 2012 2013 1 Modèle à temps discret 2 Introduction aux modèles en temps continu Limite du modèle binomial lorsque N + Un
Plus en détailTests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE
Chapitre 5 UE4 : Biostatistiques Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.
Plus en détailBaccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé
Baccalauréat S ntilles-guyane 11 septembre 14 Corrigé EXERCICE 1 6 points Commun à tous les candidats Une entreprise de jouets en peluche souhaite commercialiser un nouveau produit et à cette fin, effectue
Plus en détailReprésentation d une distribution
5 Représentation d une distribution VARIABLE DISCRÈTE : FRÉQUENCES RELATIVES DES CLASSES Si dans un graphique représentant une distribution, on place en ordonnées le rapport des effectifs n i de chaque
Plus en détailProbabilités et Statistiques. Feuille 2 : variables aléatoires discrètes
IUT HSE Probabilités et Statistiques Feuille : variables aléatoires discrètes 1 Exercices Dénombrements Exercice 1. On souhaite ranger sur une étagère 4 livres de mathématiques (distincts), 6 livres de
Plus en détail1 Complément sur la projection du nuage des individus
TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent
Plus en détailTESTS D HYPOTHÈSE FONDÉS SUR LE χ². http://fr.wikipedia.org/wiki/eugénisme
TESTS D HYPOTHÈSE FONDÉS SUR LE χ² http://fr.wikipedia.org/wiki/eugénisme Logo du Second International Congress of Eugenics 1921. «Comme un arbre, l eugénisme tire ses constituants de nombreuses sources
Plus en détailEstimation et tests statistiques, TD 5. Solutions
ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études
Plus en détailStatistiques Descriptives à une dimension
I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des
Plus en détailPrécision d un résultat et calculs d incertitudes
Précision d un résultat et calculs d incertitudes PSI* 2012-2013 Lycée Chaptal 3 Table des matières Table des matières 1. Présentation d un résultat numérique................................ 4 1.1 Notations.........................................................
Plus en détailRelation entre deux variables : estimation de la corrélation linéaire
CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence
Plus en détailAnalyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I
Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I Roxane Duroux 1 Cadre de l étude Cette étude s inscrit dans le cadre de recherche de doses pour des essais cliniques
Plus en détailLES GENERATEURS DE NOMBRES ALEATOIRES
LES GENERATEURS DE NOMBRES ALEATOIRES 1 Ce travail a deux objectifs : ====================================================================== 1. Comprendre ce que font les générateurs de nombres aléatoires
Plus en détailComparaison de fonctions Développements limités. Chapitre 10
PCSI - 4/5 www.ericreynaud.fr Chapitre Points importants 3 Questions de cours 6 Eercices corrigés Plan du cours 4 Eercices types 7 Devoir maison 5 Eercices Chap Et s il ne fallait retenir que si points?
Plus en détailChapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE
UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction
Plus en détailChapitre 6 Test de comparaison de pourcentages χ². José LABARERE
UE4 : Biostatistiques Chapitre 6 Test de comparaison de pourcentages χ² José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Nature des variables
Plus en détailCalcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes.
1 Définitions, notations Calcul matriciel Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes. On utilise aussi la notation m n pour le
Plus en détailSouad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/
Recherche opérationnelle Les démonstrations et les exemples seront traités en cours Souad EL Bernoussi Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Table des matières 1 Programmation
Plus en détailPRIME D UNE OPTION D ACHAT OU DE VENTE
Université Paris VII - Agrégation de Mathématiques François Delarue) PRIME D UNE OPTION D ACHAT OU DE VENTE Ce texte vise à modéliser de façon simple l évolution d un actif financier à risque, et à introduire,
Plus en détailChapitre 3. Les distributions à deux variables
Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles
Plus en détailCours Fonctions de deux variables
Cours Fonctions de deux variables par Pierre Veuillez 1 Support théorique 1.1 Représentation Plan et espace : Grâce à un repère cartésien ( ) O, i, j du plan, les couples (x, y) de R 2 peuvent être représenté
Plus en détailLois de probabilité. Anita Burgun
Lois de probabilité Anita Burgun Problème posé Le problème posé en statistique: On s intéresse à une population On extrait un échantillon On se demande quelle sera la composition de l échantillon (pourcentage
Plus en détailTESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION
TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION Bruno Saussereau Laboratoire de Mathématiques de Besançon Université de Franche-Comté Travail en commun
Plus en détailPrincipe d un test statistique
Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre
Plus en détailMoments des variables aléatoires réelles
Chapter 6 Moments des variables aléatoires réelles Sommaire 6.1 Espérance des variables aléatoires réelles................................ 46 6.1.1 Définition et calcul........................................
Plus en détailFeuille d exercices 2 : Espaces probabilisés
Feuille d exercices 2 : Espaces probabilisés Cours de Licence 2 Année 07/08 1 Espaces de probabilité Exercice 1.1 (Une inégalité). Montrer que P (A B) min(p (A), P (B)) Exercice 1.2 (Alphabet). On a un
Plus en détailEXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG
Exploitations pédagogiques du tableur en STG Académie de Créteil 2006 1 EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG Commission inter-irem lycées techniques contact : dutarte@club-internet.fr La maquette
Plus en détailINTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES
INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine
Plus en détailLecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888
Lecture critique d article Rappels Bio statistiques Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888 Plan du cours Rappels fondamentaux Statistiques descriptives Notions de tests statistiques
Plus en détailProbabilité et Statistique pour le DEA de Biosciences. Avner Bar-Hen
Probabilité et Statistique pour le DEA de Biosciences Avner Bar-Hen Université Aix-Marseille III 2000 2001 Table des matières 1 Introduction 3 2 Introduction à l analyse statistique 5 1 Introduction.................................
Plus en détailTSTI 2D CH X : Exemples de lois à densité 1
TSTI 2D CH X : Exemples de lois à densité I Loi uniforme sur ab ; ) Introduction Dans cette activité, on s intéresse à la modélisation du tirage au hasard d un nombre réel de l intervalle [0 ;], chacun
Plus en détailProbabilités sur un univers fini
[http://mp.cpgedupuydelome.fr] édité le 7 août 204 Enoncés Probabilités sur un univers fini Evènements et langage ensembliste A quelle condition sur (a, b, c, d) ]0, [ 4 existe-t-il une probabilité P sur
Plus en détailAnalyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés
Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent
Plus en détailM2 IAD UE MODE Notes de cours (3)
M2 IAD UE MODE Notes de cours (3) Jean-Yves Jaffray Patrice Perny 16 mars 2006 ATTITUDE PAR RAPPORT AU RISQUE 1 Attitude par rapport au risque Nousn avons pas encore fait d hypothèse sur la structure de
Plus en détailUne introduction. Lionel RIOU FRANÇA. Septembre 2008
Une introduction INSERM U669 Septembre 2008 Sommaire 1 Effets Fixes Effets Aléatoires 2 Analyse Classique Effets aléatoires Efficacité homogène Efficacité hétérogène 3 Estimation du modèle Inférence 4
Plus en détailVI. Tests non paramétriques sur un échantillon
VI. Tests non paramétriques sur un échantillon Le modèle n est pas un modèle paramétrique «TESTS du CHI-DEUX» : VI.1. Test d ajustement à une loi donnée VI.. Test d indépendance de deux facteurs 96 Différentes
Plus en détailCONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un
Plus en détailFORMULAIRE DE STATISTIQUES
FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)
Plus en détailFeuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.
Université de Nantes Année 2013-2014 L3 Maths-Eco Feuille 6 : Tests Exercice 1 On cherche à connaître la température d ébullition µ, en degrés Celsius, d un certain liquide. On effectue 16 expériences
Plus en détail3 Approximation de solutions d équations
3 Approximation de solutions d équations Une équation scalaire a la forme générale f(x) =0où f est une fonction de IR dans IR. Un système de n équations à n inconnues peut aussi se mettre sous une telle
Plus en détailIntroduction à l approche bootstrap
Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?
Plus en détailCorrection du Baccalauréat S Amérique du Nord mai 2007
Correction du Baccalauréat S Amérique du Nord mai 7 EXERCICE points. Le plan (P) a une pour équation cartésienne : x+y z+ =. Les coordonnées de H vérifient cette équation donc H appartient à (P) et A n
Plus en détailDonnées longitudinales et modèles de survie
ANALYSE DU Données longitudinales et modèles de survie 5. Modèles de régression en temps discret André Berchtold Département des sciences économiques, Université de Genève Cours de Master ANALYSE DU Plan
Plus en détailCalcul élémentaire des probabilités
Myriam Maumy-Bertrand 1 et Thomas Delzant 1 1 IRMA, Université Louis Pasteur Strasbourg, France Licence 1ère Année 16-02-2006 Sommaire La loi de Poisson. Définition. Exemple. 1 La loi de Poisson. 2 3 4
Plus en détailComplément d information concernant la fiche de concordance
Sommaire SAMEDI 0 DÉCEMBRE 20 Vous trouverez dans ce dossier les documents correspondants à ce que nous allons travailler aujourd hui : La fiche de concordance pour le DAEU ; Page 2 Un rappel de cours
Plus en détailTexte Agrégation limitée par diffusion interne
Page n 1. Texte Agrégation limitée par diffusion interne 1 Le phénomène observé Un fût de déchets radioactifs est enterré secrètement dans le Cantal. Au bout de quelques années, il devient poreux et laisse
Plus en détailSimulation de variables aléatoires
Chapter 1 Simulation de variables aléatoires Références: [F] Fishman, A first course in Monte Carlo, chap 3. [B] Bouleau, Probabilités de l ingénieur, chap 4. [R] Rubinstein, Simulation and Monte Carlo
Plus en détailProbabilité. Table des matières. 1 Loi de probabilité 2 1.1 Conditions préalables... 2 1.2 Définitions... 2 1.3 Loi équirépartie...
1 Probabilité Table des matières 1 Loi de probabilité 2 1.1 Conditions préalables........................... 2 1.2 Définitions................................. 2 1.3 Loi équirépartie..............................
Plus en détailBaccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé
Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé A. P. M. E. P. Exercice 1 5 points 1. Réponse d. : 1 e Le coefficient directeur de la tangente est négatif et n est manifestement pas 2e
Plus en détailContinuité et dérivabilité d une fonction
DERNIÈRE IMPRESSIN LE 7 novembre 014 à 10:3 Continuité et dérivabilité d une fonction Table des matières 1 Continuité d une fonction 1.1 Limite finie en un point.......................... 1. Continuité
Plus en détailProgrammes des classes préparatoires aux Grandes Ecoles
Programmes des classes préparatoires aux Grandes Ecoles Filière : scientifique Voie : Biologie, chimie, physique et sciences de la Terre (BCPST) Discipline : Mathématiques Seconde année Préambule Programme
Plus en détailCalculs de probabilités conditionelles
Calculs de probabilités conditionelles Mathématiques Générales B Université de Genève Sylvain Sardy 20 mars 2008 1. Indépendance 1 Exemple : On lance deux pièces. Soit A l évènement la première est Pile
Plus en détailRaisonnement par récurrence Suites numériques
Chapitre 1 Raisonnement par récurrence Suites numériques Terminale S Ce que dit le programme : CONTENUS CAPACITÉS ATTENDUES COMMENTAIRES Raisonnement par récurrence. Limite finie ou infinie d une suite.
Plus en détailProbabilités conditionnelles Loi binomiale
Exercices 23 juillet 2014 Probabilités conditionnelles Loi binomiale Équiprobabilité et variable aléatoire Exercice 1 Une urne contient 5 boules indiscernables, 3 rouges et 2 vertes. On tire au hasard
Plus en détailExercices - Polynômes : corrigé. Opérations sur les polynômes
Opérations sur les polynômes Exercice 1 - Carré - L1/Math Sup - Si P = Q est le carré d un polynôme, alors Q est nécessairement de degré, et son coefficient dominant est égal à 1. On peut donc écrire Q(X)
Plus en détailCours d analyse numérique SMI-S4
ours d analyse numérique SMI-S4 Introduction L objet de l analyse numérique est de concevoir et d étudier des méthodes de résolution de certains problèmes mathématiques, en général issus de problèmes réels,
Plus en détailTable des matières. I Mise à niveau 11. Préface
Table des matières Préface v I Mise à niveau 11 1 Bases du calcul commercial 13 1.1 Alphabet grec...................................... 13 1.2 Symboles mathématiques............................... 14 1.3
Plus en détail1. Vocabulaire : Introduction au tableau élémentaire
L1-S1 Lire et caractériser l'information géographique - Le traitement statistique univarié Statistique : le terme statistique désigne à la fois : 1) l'ensemble des données numériques concernant une catégorie
Plus en détailLA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
Plus en détailTests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles
Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA
Plus en détailStatistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux 4 2013-2014
Tests du χ 2 Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux 4 2013-2014 A. Lourme http://alexandrelourme.free.fr Outline
Plus en détailLa classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
Plus en détailLimites finies en un point
8 Limites finies en un point Pour ce chapitre, sauf précision contraire, I désigne une partie non vide de R et f une fonction définie sur I et à valeurs réelles ou complees. Là encore, les fonctions usuelles,
Plus en détailRésolution d équations non linéaires
Analyse Numérique Résolution d équations non linéaires Said EL HAJJI et Touria GHEMIRES Université Mohammed V - Agdal. Faculté des Sciences Département de Mathématiques. Laboratoire de Mathématiques, Informatique
Plus en détailIntroduction à la Statistique Inférentielle
UNIVERSITE MOHAMMED V-AGDAL SCIENCES FACULTE DES DEPARTEMENT DE MATHEMATIQUES SMI semestre 4 : Probabilités - Statistique Introduction à la Statistique Inférentielle Prinemps 2013 0 INTRODUCTION La statistique
Plus en détailExemples d application
AgroParisTech Exemples d application du modèle linéaire E Lebarbier, S Robin Table des matières 1 Introduction 4 11 Avertissement 4 12 Notations 4 2 Régression linéaire simple 7 21 Présentation 7 211 Objectif
Plus en détailChapitre 2/ La fonction de consommation et la fonction d épargne
hapitre 2/ La fonction de consommation et la fonction d épargne I : La fonction de consommation keynésienne II : Validations et limites de la fonction de consommation keynésienne III : Le choix de consommation
Plus en détail(51) Int Cl.: H04L 29/06 (2006.01) G06F 21/55 (2013.01)
(19) TEPZZ 8 8 4_A_T (11) EP 2 838 241 A1 (12) DEMANDE DE BREVET EUROPEEN (43) Date de publication: 18.02.1 Bulletin 1/08 (1) Int Cl.: H04L 29/06 (06.01) G06F 21/ (13.01) (21) Numéro de dépôt: 141781.4
Plus en détailI. Polynômes de Tchebychev
Première épreuve CCP filière MP I. Polynômes de Tchebychev ( ) 1.a) Tout réel θ vérifie cos(nθ) = Re ((cos θ + i sin θ) n ) = Re Cn k (cos θ) n k i k (sin θ) k Or i k est réel quand k est pair et imaginaire
Plus en détailELEC2753 Electrotechnique examen du 11/06/2012
ELEC2753 Electrotechnique examen du 11/06/2012 Pour faciliter la correction et la surveillance, merci de répondre aux 3 questions sur des feuilles différentes et d'écrire immédiatement votre nom sur toutes
Plus en détailCours de Tests paramétriques
Cours de Tests paramétriques F. Muri-Majoube et P. Cénac 2006-2007 Licence Ce document est sous licence ALC TYPE 2. Le texte de cette licence est également consultable en ligne à l adresse http://www.librecours.org/cgi-bin/main?callback=licencetype2.
Plus en détailIII- Raisonnement par récurrence
III- Raisonnement par récurrence Les raisonnements en mathématiques se font en général par une suite de déductions, du style : si alors, ou mieux encore si c est possible, par une suite d équivalences,
Plus en détailEstimation: intervalle de fluctuation et de confiance. Mars 2012. IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison
Estimation: intervalle de fluctuation et de confiance Mars 2012 IREM: groupe Proba-Stat Estimation Term.1 Intervalle de fluctuation connu : probabilité p, taille de l échantillon n but : estimer une fréquence
Plus en détail1 Définition de la non stationnarité
Chapitre 2: La non stationnarité -Testsdedétection Quelques notes de cours (non exhaustives) 1 Définition de la non stationnarité La plupart des séries économiques sont non stationnaires, c est-à-direqueleprocessusquiles
Plus en détailUEO11 COURS/TD 1. nombres entiers et réels codés en mémoire centrale. Caractères alphabétiques et caractères spéciaux.
UEO11 COURS/TD 1 Contenu du semestre Cours et TDs sont intégrés L objectif de ce cours équivalent a 6h de cours, 10h de TD et 8h de TP est le suivant : - initiation à l algorithmique - notions de bases
Plus en détailBaccalauréat ES/L Amérique du Sud 21 novembre 2013
Baccalauréat ES/L Amérique du Sud 21 novembre 2013 A. P. M. E. P. EXERCICE 1 Commun à tous les candidats 5 points Une entreprise informatique produit et vend des clés USB. La vente de ces clés est réalisée
Plus en détailVariables Aléatoires. Chapitre 2
Chapitre 2 Variables Aléatoires Après avoir réalisé une expérience, on ne s intéresse bien souvent à une certaine fonction du résultat et non au résultat en lui-même. Lorsqu on regarde une portion d ADN,
Plus en détailINF6304 Interfaces Intelligentes
INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie
Plus en détail23. Interprétation clinique des mesures de l effet traitement
23. Interprétation clinique des mesures de l effet traitement 23.1. Critères de jugement binaires Plusieurs mesures (indices) sont utilisables pour quantifier l effet traitement lors de l utilisation d
Plus en détailThéorie et Codage de l Information (IF01) exercices 2013-2014. Paul Honeine Université de technologie de Troyes France
Théorie et Codage de l Information (IF01) exercices 2013-2014 Paul Honeine Université de technologie de Troyes France TD-1 Rappels de calculs de probabilités Exercice 1. On dispose d un jeu de 52 cartes
Plus en détailCours de méthodes de scoring
UNIVERSITE DE CARTHAGE ECOLE SUPERIEURE DE STATISTIQUE ET D ANALYSE DE L INFORMATION Cours de méthodes de scoring Préparé par Hassen MATHLOUTHI Année universitaire 2013-2014 Cours de méthodes de scoring-
Plus en détailExercices - Nombres complexes : corrigé. Formes algébriques et trigonométriques, module et argument
Formes algébriques et trigonométriques, module et argument Exercice - - L/Math Sup - On multiplie le dénominateur par sa quantité conjuguée, et on obtient : Z = 4 i 3 + i 3 i 3 = 4 i 3 + 3 = + i 3. Pour
Plus en détailMéthodes de quadrature. Polytech Paris-UPMC. - p. 1/48
Méthodes de Polytech Paris-UPMC - p. 1/48 Polynôme d interpolation de Preuve et polynôme de Calcul de l erreur d interpolation Étude de la formule d erreur Autres méthodes - p. 2/48 Polynôme d interpolation
Plus en détailDocument d orientation sur les allégations issues d essais de non-infériorité
Document d orientation sur les allégations issues d essais de non-infériorité Février 2013 1 Liste de contrôle des essais de non-infériorité N o Liste de contrôle (les clients peuvent se servir de cette
Plus en détailBaccalauréat ES Pondichéry 7 avril 2014 Corrigé
Baccalauréat ES Pondichéry 7 avril 204 Corrigé EXERCICE 4 points Commun à tous les candidats. Proposition fausse. La tangente T, passant par les points A et B d abscisses distinctes, a pour coefficient
Plus en détailBaccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé
Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé EXERCICE 1 5 points Commun à tous les candidats 1. Réponse c : ln(10)+2 ln ( 10e 2) = ln(10)+ln ( e 2) = ln(10)+2 2. Réponse b : n 13 0,7 n 0,01
Plus en détail