Tests statistiques. M1 IMSV Etienne Birmelé

Dimension: px
Commencer à balayer dès la page:

Download "Tests statistiques. M1 IMSV Etienne Birmelé"

Transcription

1 Tests statistiques M1 IMSV Etienne Birmelé

2 I. TESTS STATISTIQUES :PRINCIPE

3 Test Definition Un test statistique est une procédure de décision entre deux hypothèses concernant un ou plusieurs échantillons. Exemple : On considère deux séries de personnes soumises les unes à un médicament, les autres à un placebo. On mesure les tensions artérielles dans les deux groupes. Au vu des résultats, le médicament a-t-il un effet sur la tension?

4 Hypothèses Définition L hypothèse nulle notée H 0 est celle que l on considère vraie à priori. Le but du test est de décider si cet à priori est crédible. L hypothèse alternative notée H 1 est l hypothèse complémentaire de H 0. Exemple : Sous H 0, le médicament n a pas d influence, sous H 1 il en a une.

5 Hypothèses Définition L hypothèse nulle notée H 0 est celle que l on considère vraie à priori. Le but du test est de décider si cet à priori est crédible. L hypothèse alternative notée H 1 est l hypothèse complémentaire de H 0. Exemple : Sous H 0, le médicament n a pas d influence, sous H 1 il en a une. Attention Les deux hypothèses ne sont pas symétriques. H 1 est choisie uniquement par défaut si H 0 n est pas considérée comme crédible. Le choix de H 0 et de H 1 est en général imposé par le test qu on utilise et ne relève donc pas de l utilisateur.

6 Ecriture des hypothèses Soit µ 1 et µ 2 les moyennes de tension des deux populations correspondant à la prise de médicament ou de placebo. Une manière de démontrer que le médicament modifie la tension est de montrer que µ 2 est différent de µ 1. Les hypothèses deviennent alors { H 0 : les moyennes des deux populations sont égales } et { H 0 : les moyennes des deux populations sont différentes }. On l écrit succintement sous la forme : H 0 : µ 1 = µ 2 H 1 : µ 1 µ 2

7 Ecriture des hypothèses Question 1 La moyenne de la tension dans le premier groupe est de 13,4. La moyenne de la tension dans le second groupe est de 12,8. Le médicament est-il efficace?

8 Ecriture des hypothèses Question 1 La moyenne de la tension dans le premier groupe est de 13,4. La moyenne de la tension dans le second groupe est de 12,8. Le médicament est-il efficace? Question 2 (pour ceux qui ont répondu oui) Je lance six fois un dé, puis fais 50 pompes, puis relance six fois un dé. Ma première série de lancers vaut en moyenne 3,1. La seconde série vaut en moyenne 3,7. Les pompes m ont-elles rendues meilleur au lancer de dé?

9 Ecriture des hypothèses Question 1 La moyenne de la tension dans le premier groupe est de 13,4. La moyenne de la tension dans le second groupe est de 12,8. Le médicament est-il efficace? Question 2 (pour ceux qui ont répondu oui) Je lance six fois un dé, puis fais 50 pompes, puis relance six fois un dé. Ma première série de lancers vaut en moyenne 3,1. La seconde série vaut en moyenne 3,7. Les pompes m ont-elles rendues meilleur au lancer de dé? Réponse On n en sait rien à ce stade!

10 Ecriture des hypothèses Attention Les moyennes x 1 et x 2 des échantillons résultent d échantillonnages, et ne sont donc que des estimations de µ 1 et µ 2. Ce n est pas parce qu elles sont différentes que µ 1 et µ 2 le sont (et vice-versa, mais c est rare!). Comparer les moyennes des échantillons ne peut en aucun cas suffire!

11 Ecriture des hypothèses Attention Les moyennes x 1 et x 2 des échantillons résultent d échantillonnages, et ne sont donc que des estimations de µ 1 et µ 2. Ce n est pas parce qu elles sont différentes que µ 1 et µ 2 le sont (et vice-versa, mais c est rare!). Comparer les moyennes des échantillons ne peut en aucun cas suffire! Les signes =,, > et dans l écriture succinte des hypothèses ne correspondent pas à l égalité ou aux inégalités au sens mathématique du terme. Il s agit d une façon d écrire : H 0 : Il est crédible de penser que µ 1 = µ 2 H 1 : µ 1 est significativement différent de µ 2

12 Statistique La statistique de test S est une fonction qui résume l information sur l échantillon qu on veut tester. On la choisit de façon à pouvoir calculer sa loi sous H 0. S est une variable aléatoire, définie indépendemment des données observées. La valeur que prend cette variable aléatoire pour les données observées sera appelée statistique observée et notée S obs dans la suite. Suivant le type de statistique choisi, le test sera paramétrique ou non-paramétrique.

13 Région de rejet - Latéralité Définition La région de rejet est le sous-ensemble I de R tel qu on rejette H 0 si S obs appartient à I. Définir une procédure de test peut donc se faire en définissant 1. une statistique 2. une région de rejet pour cette statistique Exemple : Les test médicaux figurant sur une prise de sang, comme le taux de fer. H 0 : H 1 : La ferritine est entre 20 et 300µg/L La ferritine est trop haute ou trop basse

14 Région de rejet - Latéralité Définition La région de rejet est le sous-ensemble I de R tel qu on rejette H 0 si S obs appartient à I. La forme de la région de rejet définit la latéralité du test : test multilatéral : On veut rejetter H 0 si S obs est trop grand ou trop petit, sans à priori. La région de rejet est alors de la forme ], a] [b, + [. test unilatéral à droite : On veut rejetter H 0 seulement si S obs est trop grand. La région de rejet est alors de la forme [a, + [. test unilatéral à gauche : On veut rejetter H 0 seulement si S obs est trop petit. La région de rejet est alors de la forme ], b].

15 Exemples On considère toujours des médicaments réduisant la tension artérielle. Quelles sont les hypothèses pour répondre aux questions suivantes? Comparaison entre deux médicaments en vente Intérêt d un nouveau médicament plus cher que l existant. Intérêt d un nouveau médicament moins cher que l existant.

16 Exemples On considère toujours des médicaments réduisant la tension artérielle. Comparaison entre deux médicaments en vente H 0 : µ 1 = µ 2 H 1 : µ 1 µ 2 Intérêt d un nouveau médicament plus cher que l existant. H 0 : H 1 : µ new µ old µ new < µ old Intérêt d un nouveau médicament moins cher que l existant. H 0 : H 1 : µ new µ old µ new > µ old

17 Probabilité critique Définition La probabilité critique (ou p-valeur) est la probabilité, sous H 0, que la statistique soit au moins aussi éloignée de son espérance que la valeur observée. En d autres termes, c est la probabilité d observer quelque chose d au moins aussi surprenant que ce que l on observe. Si le test est unilatéral à droite, la probabilité critique est P(S > S obs ). S obs

18 Probabilité critique Définition La probabilité critique (ou p-valeur) est la probabilité, sous H 0, que la statistique soit au moins aussi éloignée de son espérance que la valeur observée. En d autres termes, c est la probabilité d observer quelque chose d au moins aussi surprenant que ce que l on observe. Si le test est unilatéral à gauche, la probabilité critique est P(S < S obs ). S obs

19 Probabilité critique Définition La probabilité critique (ou p-valeur) est la probabilité, sous H 0, que la statistique soit au moins aussi éloignée de son espérance que la valeur observée. En d autres termes, c est la probabilité d observer quelque chose d au moins aussi surprenant que ce que l on observe. Si le test est bilatéral et que la loi de la statistique est symétrique par rapport à 0, la probabilité critique est P( S > S obs ). S obs

20 Risque de première espèce ou confiance Définition Le risque de première espèce α est la probabilité sous H 0 de la région de rejet. En d autres termes, il s agit de la proabilité avec laquelle on accepte de décider H 1 si la vérité est H 0. α = P H0 (H 1) La quantité 1 α est la confiance du test. En d autres termes, une proportion α des situations dans lesquelles la vérité est H 0 verront une décision en faveur de H 1. α est la probabilité avec laquelle on accepte de se tromper quand la vérité est H 0

21 Autre manière de mener le test On peut comparer la p-valeur à α plutôt que S obs et la région de rejet. si la p-valeur est supérieure à α, il n est pas exceptionnel sous H 0 d observer la valeur effectivement observée. Par conséquent, H 0 est acceptée. si la p-valeur est inférieure à α, la valeur observée est jugée exceptionnelle sous H 0. On décide alors de rejeter H 0 et de valider H 1. Acceptation 5% S obs Seuil

22 Autre manière de mener le test On peut comparer la p-valeur à α plutôt que S obs et la région de rejet. si la p-valeur est supérieure à α, il n est pas exceptionnel sous H 0 d observer la valeur effectivement observée. Par conséquent, H 0 est acceptée. si la p-valeur est inférieure à α, la valeur observée est jugée exceptionnelle sous H 0. On décide alors de rejeter H 0 et de valider H 1. Rejet 5% Seuil S obs

23 Autre manière de mener le test On peut comparer la p-valeur à α plutôt que S obs et la région de rejet. si la p-valeur est supérieure à α, il n est pas exceptionnel sous H 0 d observer la valeur effectivement observée. Par conséquent, H 0 est acceptée. si la p-valeur est inférieure à α, la valeur observée est jugée exceptionnelle sous H 0. On décide alors de rejeter H 0 et de valider H 1. Avantage Cette méthode permet de se rendre compte à quel point on est sur de sa décision : la position de la p-valeur par rapport à α ne dépend pas de l échelle des données, contrairement à S obs et au(x) seuil(s) de la région de rejet. Exemple : Si on a fixé α = 0.05, une p-valeur de est clairement un rejet, alors qu une p-valeur de 0.03 est un rejet de peu qu il faudra nuancer au moment de l interprétation.

24 Risque de première espèce ou confiance Hormis dans des cas de tests multiples non abordés dans ce cours, α varie généralement entre 0, 01 et 0, 05. Dans le cas de variables continues, on peut choisir une valeur arbitraire de α et obtenir une région de rejet présentant exactement le risque α. Dans le cas de variables discrètes, le nombre de régions de rejet, et donc de risques, possibles est fini ou dénombrable. Dans ce cas, on fixe un risque, dit risque nominal, par exemple de 5%. On cherche alors la plus grande région ne dépassant pas ce risque, qui devient la région de rejet. Le véritable risque, dit risque réel, peut alors être recalculé.

25 Risque de deuxième espèce ou puissance Définition Le risque de deuxième espèce β est la probabilité d accepter H 0 alors que la vérité est H 1. β = P H1 (H 0) La quantité 1 β est la puissance du test. Décision Vérité H 0 H 1 H 0 1-α β H 1 α 1-β

26 Choix de α et β H 0 H 1 β α S

27 Choix de α et β H 0 H 1 β α S Si l échantillon reste inchangé, une diminution de α entraîne une augmentation de β et inversement. Autrement dit, si on décide de réduire le nombre de faux positifs, on augmente forcément le nombre de faux négatifs. La seule manière d améliorer les deux critères est d augmenter la taille de l échantillon.

28 Courbe de puissance Pour déterminer la puissance, il faut connaître la lois de S sous H 1, ce qui n est généralement pas le cas. On recourt alors à des courbes de puissance qui sont des courbes pour laquelle la puissance est calculée pour des valeurs données des paramètres du problème ou de la taille de l échantillon. On ne sait pas où se situe la situation réelle sur cette courbe mais on y lit la probabilité de détecter H 1 en fonction de son éloignement de H 0. Exemple : Courbe de puissance d un test de Student bilatéral sur 100 individus en fonction de mu[2] mu[1] (en supposant que σ 1 = σ 2 = 1)

29 Principe du test Les étapes d un test sont toujours réalisées dans l ordre suivant : 1) Choix du risque α 2) Choix du type de test et de sa latéralité si besoin 3) Calcul de la statistique de test 4) Calcul de la p-valeur 5) Conclusion En pratique, l utilisation d un logiciel type R permet de ne pas se soucier des partie 3) et 4). Par contre, les choix liées aux étapes 1) et 2) ainsi que l interprétation finale ne peuvent être faits par le logiciel.

30 Remarques sur les tests Le résultat d un test comprend toujours une dose d incertitude : ON NE SAIT JAMAIS SI ON A BIEN PRIS LA BONNE DECISION! La probabilité critique permet d avoir une vision plus fine que sa simple comparaison avec α. En effet, plus elle est petite, plus l évènement observé est surprenant sous H 0. Ainsi, pour α = 0.5, des probabilités critiques de 10 6 et de 0.35 impliquent le rejet de H 0 mais avec des degrés de certitude différent concernant la décision.

31 Tests paramétriques et non paramétriques Définition : test paramétrique Un test paramétrique est un test pour lequel on fait une hypothèse sur la forme des données sous H 0 (normale, Poisson,...). Les hypothèses du test concernant alors les paramètres gouvernant cette loi. Exemple : On suppose que la tension sous médicament suit une loi N (µ 1, σ 1) et celle sous placebo suit une loi N (µ 2, σ 2). S = σ x1 x2 1 n + 1 m H 0 : µ 1 = µ 2 H 1 : µ 1 µ 2 où σ = La loi de S sous H 0 est connue (loi de Student) (n 1) ˆσ (m 1) ˆσ 2 2 n + m 2

32 Tests paramétriques et non paramétriques Définition : test non-paramétrique Un test non paramétrique est un test ne nécessitant pas d hypothèse sur la forme des données. Les données sont alors remplacées par des statistiques ne dépendant pas des moyennes/variances des données initiales (tables de contingence, statistique d ordre...). Exemple : on classe les tensions de tous les individus par ordre croissant et on regarde comment sont classés les personnes sont médicaments. On obtient par exemple M M P M M P M P P M P P S est alors la somme des rangs des individus sous médicaments. On peut déterminer sa loi sous H 0.

33 Tests paramétriques et non paramétriques Lequel choisir? Les tests paramétriques, quand leur utilisation est justifiée, sont en général plus puissants que les tests non-paramétriques. Les tests paramétriques reposent cependant sur l hypothèse forte que l échantillon considéré est tiré suivant une distribution appartenant à une famille donnée. Il est possible de s en affranchir pour des échantillons suffisament grands en utilisant des théorèmes asymptotiques tels le TCL. Lese tests non-paramétriques sont cependant à préférer dans de nombreux cas pratiques pour lesquels les tests paramétriques ne peuvent être utilisés sans violer les postulats dont ils dépendent (notamment les échantillons trop petits). Les données sont parfois récupérés sous forme de rangs et non de données brutes. Seuls les tests non-paramétriques sont alors applicables.

34 Tests paramétriques et non paramétriques Efficacité relative asymptotique On fixe une confiance 1 α, une puissance 1 β. Soit H k une suite d hyptohèses alternatives (se rapprochant de H 0) et n 1k et n 2k les tailles d échantillons nécessaires pour que T 1 et T 2 aient la puissance β sous l hypothèse H. Sous certaines conditions de régularité, le quotient n 2k n 1k tend vers une constante, l ARE, quand k tend vers l infini. Un ARE de 2 signifie que pour détecter la même différence, il faut asymptotiquement des échantillons deux fois plus grands pour T 2 que pour T 1 pour obtenir la même puissance, impliquant que T 1 est plus efficace. Cette mesure est asymptotique mais en pratique, l efficacité pour des petits échantillons se révèle souvent proche de l efficacité asymptotique. Considérons l exemple où T 1 est le test du signe pour H 0 : m = 0 et T 2 le test t pour H 0 : µ = 0, dans le cas de distributions symétriques. On peut montrer que l ARE est inférieure est de 2 < 1 pour des distributions normales mais π supérieure à 1 pour d autres ditributions comme les double exponentielle ou les distributions de Laplace. Même en cas de validité des tests paramétriques, les tests non-paramétriques peuvent donc être concurrentiels, d autant plus que la puissance de calcul des ordianteurs actuels permet maintenant leur utilisation sur de grands échantillons.

35 II. TESTS DE COMPARAISON DE MEDIANES

36 I.1 Un échantillon : Test de Student

37 Test paramétrique d égalité de la moyenne avec une valeur prédéfinie : Test de Student Données Un échantillon x = (x 1,..., x n), une valeur µ 0 Question La moyenne µ de la population dont x est issu est-elle significativement différente de µ 0. Postulat La loi de la population est une loi normale ou x est suffisamment grand pour appliquer le TCL.

38 Test paramétrique d égalité de la moyenne : Test de Student Formulation H 0 : µ = µ 0 H 1 : µ µ 0 Ce test peut être mené de manière unilatérale. Statistique La statistique de Student est définie par t = ˆµ µ0 ˆσ/ n Sous H 0, t suit une loi de Student à n 1 degrés de liberté. Sous R t.test en utilisant les paramètres de µ 0. x pour l échantillon et mu pour la valeur

39 I.2 Un échantillon : Test du signe

40 Test non-paramétrique d égalité de la médiane avec une valeur prédéfinie : Test du signe Données Un échantillon x = (x 1,..., x n), une valeur m 0 Question La médiane m de la population dont x est issu est-elle significativement différente de m 0. Postulat Aucun

41 Test du signe Formulation H 0 : m = m 0 H 1 : m m 0 Ce test peut être mené de manière unilatérale. Statistique On associe un signe + aux valeurs supérieures à m 0 et un signe aux valeurs inférieures à m 0, et on note N + le nombre de +. Sous H 0, chaque valeur de l échantillon a une probabilité 1 d être supérieure à 2 m 0. N + suit donc une loi binimiale B(n, 1 ). 2

42 Test du signe Cas d égalité Il est possible que certaines valeurs de l échantillon soient égales à m 0. Plusieurs stratégies sont possibles, les principales étant a) d ignorer ces valeurs ; b) de les affecter par tirage au sort équiprobable ; c) de leur affecter le signe minoritaire afin d obtenir un test conservatif. Approximation normale Pour les grands échantillons (n>30), on peut utiliser la statistique Z = N n 1 2 n qui suit une loi normale centrée réduite. Une correction de continuité peut s avérer nécessaire dans ce cas.

43 Exemple Le nombre d observations de sanglier par an et par poste d observation a une médiane de 50 lorsque la population est normale. L échantillon suivant représente les observations de l année. A-t-il une médiane significativement différente de 50? > betes <- c(29,12,62,64,43,21,35,89,8,32,47,61) On applique un test du signe bilatéral à un niveau de 5% : > Npos <- sum(betes>50) > Nneg <- sum(betes<50) H 0 : m = 50 H 1 : m 50 Sous H 0, N + B(12, 0.5) et cette loi est symétrique. La p-valeur vaut donc 2P(N + 4) > 2* pbinom(4,12,.5,lower.tail=true) [1] On accepte H 0 : il n y pas de raison de penser que la population a un niveau anormal.

44 Exemple, suite On suppose maintenant que les données de cinquante postes d observations sont collectées et que 15 d entre eux ont donnée lieu à 50 observations ou plus. On applique toujours un test du signe bilatéral à un niveau de 5% : H 0 : m = 50 H 1 : m 50 Le nombre d observation nous permet de faire une approximation normale. > Zobs <- (15-25)/(sqrt(50)/2) > 2*pnorm(Zobs,0,1) [1] Cette fois, on rejette H 0 à un niveau de 5% : la population souffre d une anomalie.

45 Variantes Test d équiprobabilité de deux évènements La procédure est exactement la même, un des évènements correspondant au signe, l autre au signe +.

46 Variantes Test d équiprobabilité de deux évènements La procédure est exactement la même, un des évènements correspondant au signe, l autre au signe +. Test d un quantile Soit q α le quantile d ordre α de l échantillon et q une valeur fixée. On peut généraliser le test du signe au problème H 0 : H 1 : q α = q q α q Il suffit pour cela d assigner un signe aux valeurs inférieures à q, un signe + aux valeurs supérieures à q et de considérer le nombre de signe qui suit sous H 0 une loi binomiale B(n, q).

47 Variantes Test du signe pour une tendance : test de Cox et Stuart Tendance à la hausse ou à la baisse dans un échantillon d observations indépendantes ordonnées? H 0 : H 1 : Pas de tendance Tendance significative Dans le cas d un échantillon pair n = 2m, les différences (x m+1 x 1,..., x 2m x m) sont calculées et leur signe est gardé en mémoire. Pour n = 2m + 1, on procède de même en éliminant la valeur x m+1. Sous H 0, le nombre de signes suit une loi B(m, 1 2. Test unilatéral : hausse (ou baisse) uniquement. Moins puissant que les tests liés au modèle linéaire, mais sans postulat d évolution linéaire.

48 I.3 Un échantillon : Test des rangs signés de Wilcoxon

49 Statistique du rang Definition : rang Soit X un vecteur aléatoire. Le rang R i de la variable X i est l ordre de cette dernière quand on réordonne X par ordre croissant. Exemple : X = (15, 6, 23, 17, 8), R = (3, 1, 5, 4, 2) sous R La fonction rank donne l échantillon des rangs La fonction order donne la place dans l échantillon du minimum, puis de la deuxième plus petite valeur,... > x <- c(15,6,23,17,8) > rank(x) [1] > order(x) [1] > x[order(x)] [1]

50 Cas absolument continu Si la loi des X i est absolument continue, la probabilité d avoir des ex-aequos est nulle. Proposition Pour tout k, 1 i 1 <... < i k n et 1 j 1 <... < j k = n), P ( (R i1,..., R ik ) = (j 1,..., j k ) ) = (n k)! n! Proposition E(R i) = n+1 et VarR 2 i = n2 1 12

51 Cas des ex-aequo Definition : rang avec ex-aequos Soit X un vecteur aléatoire dont les coordonnées sont iid. Soit t le nombre de variables prenant la même valeur que X i. L ordre R i de X i est la moyenne arithmétique des ordres des t variables concernées quand on réordonne X par ordre croissant. Exemple : Pour X = (9, 7, 5, 7, 4, 5, 5), R = (7, 5.5, 3, 5.5, 1, 3, 3).

52 Cas des ex-aequo Definition : rang avec ex-aequos Soit X un vecteur aléatoire dont les coordonnées sont iid. Soit t le nombre de variables prenant la même valeur que X i. L ordre R i de X i est la moyenne arithmétique des ordres des t variables concernées quand on réordonne X par ordre croissant. Exemple : Pour X = (9, 7, 5, 7, 4, 5, 5), R = (7, 5.5, 3, 5.5, 1, 3, 3). Soit t l le nombre de valeurs ayant le l ime rang (dans l exemple, t 1 = 1, t 2 = 3, t 3 = 2, t 4 = 1) et T = l t 2 l (t l 1). Proposition E(R i) = n+1 et VarR 2 i = n2 1 E(T ) 12 12n

53 Test des rangs signés de Wilcoxon Données Un échantillon x = (x 1,..., x n), une valeur m 0 Question La médiane m de la population dont x est issu est-elle significativement différente de m 0? Postulat Le test nécessite de faire l hypothèse d une distribution symétrique. Ce postulat implique que médiane et moyenne sont confondues.

54 Test des rangs signés de Wilcoxon Formulation H 0 : m = m 0 H 1 : m m 0 Ce test peut être mené de manière unilatérale. Sous R Fonction wilcox.test

55 Test des rangs signés de Wilcoxon Statistique On pose D = X m 0 puis on calcule les rangs R du vecteurs D = ( D 1,..., D n. Les statistiques d interêt sont alors S + = i,d i >0 S = i,d i <0 Ri. Ri et Exemple : Si X t = (1, 5, 10, 12, 0, 8) et m 0 = 7, D t = ( 6, 2, 3, 5, 7, 1) et R t = (5, 2, 3, 4, 6, 1). Une autre manière de l écrire est de réordonner D suivant les valeurs absolues croissantes, c est-à-dire 1, 2, 3, 5, 6, 7. On obtient donc S + = = 8 et S = = 13.

56 Test des rangs signés de Wilcoxon On a toujours S + + S = n(n+1) 2, s intéresser à l une des variables suffit donc. Le test s écrit alors (dans le cas bilatéral) Proposition H 0 : ES + = ES n(n + 1) = 4 H 1 : ES + n(n + 1) 4 Sous l hypothèse H 0 et en supposant que de X est absolument continue (pas d ex-aequos), VarS + = n(n + 1)(2n + 1) 24 où c kn est le coefficient de t k dans n k=1 (1 + t k ). et P(S + = k = c kn 2 n )

57 Approximation pour les grands échantillons Dans le cas de grands échantillons (n > 20), l utilisation du TCL permet d utiliser la statistique Z = S + n(n+1) 4 n(n+1)(2n+1) 24 dont la loi peut être approchée par une loi normale centrée réduite.

58 Cas des ex-aequos d le nombre de valeurs égales à m 0 t l introduits précédemment Pour des grands échantillons, l approximation normale peut alors être utilisée en remplaçant la variance par n(n + 1)(2n + 1) 24 d(d + 1)(2d + 1) 24 l t 3 l t l 48

59 Exemple (P. Sprent) Reprenons l exemple du nombre d animaux observés, un total de 35 postes ayant été pris en compte

60 Exemple (P. Sprent) L échantillon modifié devient La statistique S + vaut alors 293, d = 1 et il y 7 paires d ex-aequo donc l tl 3 t l = La p-valeur est de H 0 est accepté.

61 I.4 Tests paramétriques pour deux échantillons : Fisher-Snedecor et Student

62 Test d égalité des variances : test de Fisher Hypothèses On dispose de deux échantillons d écart-types respectifs ˆσ 1 et ˆσ 2. On se demande s il est raisonnable de penser que les deux échantillons ont été tirés suivant des lois de même écart-type ou si ils sont significativement différents. H 0 : σ 1 = σ 2 H 1 : σ 1 σ 2 Statistique σ 1 2 F = ˆ σˆ 2 2 suit une loi de Fisher F n1,n 2 sous H 0. Latéralité - Région de rejet Les trois options énoncées au chapitre précédent sont possibles : rejet unilatéral à droite, à gauche ou bilatéral. Sous R var.test

63 Comparaison de la moyenne de deux échantillons : t-test ou test de Student Hypothèses On dispose de deux échantillons de moyennes respectives µ 1 et µ 2 et d écart-type respectifs σ 1 et σ 2. On se demande s il est raisonnable de penser que les deux échantillons ont été tirés suivant des lois de même espérance ou si leurs moyennes sont significativement différentes. H 0 : µ 1 = µ 2 H 1 : µ 1 µ 2

64 Comparaison de la moyenne de deux échantillons : t-test ou test de Student Statistique La valeur de la statistique peut prendre quatre expressions différentes suivants les critères suivants : appariement les échantillons sont appariés ou non. égalité des variances les variances sont significativement différentes (hétéroscédasticité) ou pas (homoscédasticité). Toutes ces statistiques reposent en fait sur le même principe qui est de dépendre essentiellement de la différence µ 1 µ 2, normalisée par une quantité permettant d obtenir une variable de loi de Student sous H 0. Par exemple, dans le cas d échantillons non appariés, de variance non significativement différentes, et de taille respectives n et m, t = σ µ1 µ2 1 n + 1 m où σ = (n 1) ˆσ (m 1) ˆσ 2 2 n + m 2

65 Comparaison de la moyenne de deux échantillons : t-test ou test de Student Latéralité - Région de rejet Les trois options énoncées au chapitre précédent sont possibles : rejet unilatéral à droite, à gauche ou bilatéral. Sous R t.test en utilisant les paramètres x et y pour les deux échantillons, alternative pour le latéralité, paired pour l appariement ou non des échantillons et var.equal pour l égalité des variances.

66 Exemple Pour n grand et p petit, la loi binômiale B(n, p) peut etre approximée par la loi de Poisson P(np). > x <- rbinom(100,100,.05) > y <- rpois(100,5) > var.test(x,y) F test to compare two variances data: x and y F = , num df = 99, denom df = 99, p-value = alternative hypothesis: true ratio of variances is not equal to 1 95 percent confidence interval: sample estimates: ratio of variances >

67 Exemple Pour n grand et p petit, la loi binômiale B(n, p) peut etre approximée par la loi de Poisson P(np). > x <- rbinom(100,100,.05) > y <- rpois(100,5) > t.test(x,y,alternative="two.sided",paired=false,var.equal=true) Two Sample t-test data: x and y t = , df = 198, p-value = alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: sample estimates: mean of x mean of y

68 I.5 Test non-paramétrique pour deux échantillons : Test de Wilcoxon-Mann-Whitney

69 Appariement Deux échantillons x = (x 1,..., x n) et y = (y 1,..., y n) sont appariés si ils correspondent à des mesures prises sur les mêmes individus dans des conditions différentes. Tester l égalité de leurs médianes revient alors à considérer l échantillon des différences x y et à tester si la médiane de cet échantillon est bien nulle test du signe ou des rangs signés de Wilcoxon. On suppose par la suite que les deux échantillons sont non appariés.

70 Test de Wilcoxon-Mann-Whitney Données Deux échantillons x = (x 1,..., x n1 ) et y = (y 1,..., y n2 ). Question La médiane m 1 de la population dont x est issu est-elle significativement différente de la médiane m 2 de la population dont y est issu? Postulat Le test nécessite de faire l hypothèse que les distributions sont identiques à une translation près.

71 Test de Wilcoxon-Mann-Whitney Formulation H 0 : m 1 = m 2 H 1 : m 1 m 2 Ce test peut être mené de manière unilatérale. Sous R Fonction wilcox.test

72 Test de Wilcoxon-Mann-Whitney Statistique On ordonne l échantillon obtenu en concaténant les deux échantillons d interêt. On note S i la somme des rangs de l échantillon i. L idée est que sous H 0, S 1 et S 2 devraient être proche l un de l autre et de (n 1+n 2 )(n 1 +n 2 +1) 2. L approche de Wilcoxon considère S 1 ou S 2 comme statistique. Celle de Mann-Whitney considère l une des statistiques U i = S i n i (n i +1) 2. Les lois des S i et U i peuvent être calculées explicitement pour des n i petits et sont tabulées dans les logiciels de statistique.

73 Test de Wilcoxon-Mann-Whitney Exemple : x = (4, 6, 2), y = (1, 3, 8, 9) L appartenance aux échantillons dans l échantillon concaténé ordonné est (y, x, y, x, x, y, y). On a alors S x = = 11 et U x = = 5 U 1 peut être calculé en prenant chacune des valeurs de l échantillon 2 et en regardant combien de valeurs de l échantillon 1 lui sont supérieures, puis en sommant les résultats obtenus.

74 Approximation pour les grands échantillons Soit U = min(u 1, U 2). Pour n 1 et n 2 tous deux supérieurs à 20, il est raisonnable de considérer que Z = suit une loi normale centrée réduite. Cas d ex-aequos U n1n2 (n1 + n 2)(n 1 + n 2 + 1)/12 Les rangs des ex-aequos sont remplacés par leurs rangs moyens comme dans le chapitre précédent. Si le nombre d ex-aequos est très faible, ils peuvent être négligés. Sinon, il faut modifier l approximation pour les grands échantillons en retranchant au terme sous la racine du dénominateur la quantité (t 3 n 1n 2 l t l ) 12(n 1 + n 2)(n 1 + n 2 1)

75 Autre possibilité : généralisation du test du signe Soit m 0 la médiane de l échantillon concaténé. On dresse le tableau de variation Echantillon 1 Echantillon 2 > m 0 a 1 a 2 < m 0 n 1 a 1 n 2 a 2 et on applique un test d indépendance entre les variables Echantillon et Etre inférieur à m 0 (cf chapitres suivants). Avantage : pas de postulat Inconvénient : manque de puissance

76 I.6 Comparaison paramétrique de trois échantillons non appariés ou plus : ANOVA

77 ANOVA à un facteur Données k échantillons x 1 = (x 1,1,..., x 1,n1 ) et x k = (x k,1,..., x k,nk ). Question Les médianes µ 1,..., µ k des populations dont sont issues les échantillons sont-elles toutes égales? Postulat Les distributions sont normales de variances identiques.

78 ANOVA à un facteur Formulation H 0 : H 1 : µ 1 = µ 2 =... = µ k Au moins une moyenne diffère Sous R Fonction aov

79 ANOVA à un facteur Décomposition de la variance n p j (x ij x) 2 = j =1 i=1 p (x j x) 2 + j =1 n p j (x ij x j ) 2 (1) j =1 i=1 SCT = SCE + SCR (2) Carrés moyens : CMT = SCT SCE SCR, CME =, CMR =. n 1 p 1 n p Statistique F = CME. Souc H0, F suit une loi Fisher(p 1, n p). CMR

80 I.7 Comparaison non-paramétrique de trois échantillons non appariés ou plus : Test de Kruskal-Wallis

81 Test de Kruskal-Wallis Données k échantillons x 1 = (x 1,1,..., x 1,n1 ) et x k = (x k,1,..., x k,nk ). Question Les médianes m 1,..., m k des populations dont sont issues les échantillons sont-elles toutes égales? Postulat Les distributions sont identiques à des translations près.

82 Test de Kruskal-Wallis Formulation H 0 : H 1 : m 1 = m 2 =... = m k Au moins une médiane diffère Sous R Fonction kruskal.test

83 Test de Kruskal-Wallis Statistique x ij la j eme observation de l échantillon i et R ij son rang dans l union de tous les échantillons. n i la taille de l échantillon i et R i. = 1 i n i R ij. La statistique est F KW = = 12 n(n + 1) k i=1 12 n(n + 1) n i(r i. n + 1 ) 2 2 k i=1 R 2 i. n i 3(n + 1) F KW a une loi qui peut être calculée exactement pour les petits échantillons et qui suit asymptotiquement une loi du χ 2 à k 1 ddl pour de grands échantillons.

84 I.8 Comparaison de trois échantillons appariés ou plus : Test de Friedman

85 Test de Friedman Données k échantillons appariés x 1 = (x 1,1,..., x 1,n) et x k = (x k,1,..., x k,n ). Question Les médianes m 1,..., m k des populations dont sont issues les échantillons sont-elles toutes égales? Postulat Les distributions sont identiques à des translations près.

86 Test de Friedman Formulation H 0 : H 1 : m 1 = m 2 =... = m k Au moins une médiane diffère Sous R Fonction friedman.test

87 Test de Friedman Statistique X = ((x ij )) une matrice de taille k n contenant les observations. R ij le rang de x ij dans sa colonne, c est-à-dire parmi toutes les j eme observations. La statistique est S F = = 12n k(k + 1) 12 nk(k + 1) k (R i. k i=1 ) 2 k Ri. 2 3n(k + 1) i=1 S F a une loi qui peut être calculée exactement pour les petits échantillons et qui suit asymptotiquement une loi du χ 2 à k 1 ddl pour de grands échantillons.

88 III. COMPARER PLUSIEURS VARIABLES

89 Question On considère un couple de variables (X, Y ). Que peut-on dire de la façon dont X évolue suivant les valeurs de Y? Variable quantitative vs variable qualitative Cela revient à comparer les échantillons de valeurs de X correspondant aux différentes valeurs de Y. On utilise donc les tests du chapitre précédent pour comparer les moyennes/médianes.

90 III.3 Deux variables quantitatives : Tests de corrélation

91 Indépendance de deux variables qualitatives : test des coefficients de corrélation Corrélation de Pearson > x corr(x, y) = cov(x, y) s xs y [1] [7] > y [1] [7] > z [1] [8] > cor(x,y) [1] > cor(y,z) [1]

92 Indépendance de deux variables qualitatives : test des coefficients de corrélation Corrélation des rangs de Spearman ρ = corr(r(x), r(y)) où r(x) désigne l échantillon des rangs tiré de x. > rank(x) [1] > rank(y) [1] > rank(z) [1] > cor(x,y,method="spearman") [1] > cor(y,z,method="spearman") [1]

93 > rank(x) [1] > rank(y) [1] > rank(z) [1] > cor(x,y,method="kendall") [1] -0.2 > cor(y,z,method="kendall") [1] Indépendance de deux variables qualitatives : test des coefficients de corrélation Corrélation des rangs de Kendall Soit n c le nombre de concordances, c est-à-dire de paires (x i, y i) et (x j, y j ) telles que x i < x j et y i < y j ; Soit n d le nombre de discordances, c est-à-dire de paires (x i, y i) et (x j, y j ) telles que x i < x j et y i > y j ; Le coefficient de Kendall est alors τ = nc n d n(n 1)/2

94 Indépendance de deux variables qualitatives : test des coefficients de corrélation Interprétation Ces trois coefficients sont compris entre 1 et 1 et valent 0 pour des variables indépendantes. Une valeur significativement positive indique une corrélation positive (Y augmente quand X augmente). Une valeur significativement négative indique une corrélation négative (Y augmente quand X augmente).

95 Indépendance de deux variables qualitatives : test des coefficients de corrélation Formulation H 0 : corr(x, y) = 0 ou ρ = 0 ou τ = 0 H 1 : corr(x, y) 0 ou ρ 0 ou τ 0 Latéralité Le test peut être mené de façon unilatérale pour ne détecter qu une corrélation positive ou qu une corrélation négative. Sous R cor.test

96 Principe des tests Test de Pearson Sous H 0, à condition que le couple (X, Y ) suive une loi normale bivariée ou que l effectif soit suffisamment important, suit une loi du χ 2 à n 2 ddl, S = corr(x, y) 1 corr(x,y) 2 n 2 Tests non paramtrique Les lois correspondantes sont tabulées.

97 Exemple 1 (P. Sprent) 7 déclinaisons d un même produit ont été évalués par des panels de consommateurs français et allemands. Les rangs obtenus pour les 7 produits sont les suivants. On se demande s il y a une concardance entre les classements. F D Spearman : ρ = 0.57, p-valeur de 0.2. Kendall : 15 concardances, 6 discordances, τ = 0.48, p-valeur de 0.43.

98 Exemple 2 Le tableau suivant donne le taux d ensoleillement (en heures/an) et de pluviométrie (en mm/an) en dix villes situés sur un axe nord-sud. Peut-on parler d une tendance monotone de croissance de l ensoleillement le long de cet axe? De diminution de la pluviométrie? Lille Amiens Paris Auxerre Dijon Lyon Orange Marseille Bastia A Les tests de corrélation peuvent être une alternative plus puissante au test de Cox-Stuart pour la détection de tendance. On peut par exemple caractériser chaque ville par sa latitude.

99 Plus de deux variables Kendall a introduit un coefficient de concordance si il y a plus de deux variables. Il n est cependant plus possible de faire la différence entre concordance et discordance, mais seulement entre homogénéité et hétérogénéité. Pour k variables et des échantillons de taille n avec R ij désignant le rang de l individu i pour la variable j, ce coefficient vaut W = avec R i = sum j R ij. 12 k 2 n(n 2 1) n (R i i=1 k(n + 1) ) 2 2 k(n 1)W correspond à la statistique de Friedman et suit donc une loi du χ 2 à n 1 degrés de liberté.

100 Plus de deux variables Tester l indépendance de plus de trois variables revient en fait à faire un test de Friedman en changeant les hypothèses : H 0 : H 1 : Les variables sont indépendantes = les rangs sont distribuées au hasard Les variables ne sont pas indépendantes = il y a concordance entre les rangs

101 Exemple X 1 X 2 X 3 X La p-valeur de Friedman est de H 0 est donc très claiement accepté : en effet, les sommes des rangs par ligne sont très proches. Pourtant, on peut voir que X 1, X 3 et X 2, X 4 sont concordantes et de rangs respectifs inverses (ou presque). Cette situation est indétectable par un test de concordance.

102 III.2 Deux variables qualitatives : Tests de Fisher et du χ 2 d indépendance

103 Table de contingence X et Y sont qualitatives : pas de coefficient de corrélation possible Leur valeurs sont regroupées en respectivement r et s ensembles. Le tableau à r lignes et s colonnes contenant les effectifs est appelé table de contingence. Les sommes par lignes et colonnes donnent les effectifs marginaux. La somme globale donne l effectif total. Exemple : Guérison Non-guérison Traitement 7 3 Placebo 3 6

104 Sommes marginales fixées : le test exact de Fisher Formulation H 0 : H 1 : X et Y sont indépendantes X et Y ne sont pas indépendantes Postulats Les sommes marginales sont fixées.

105 Sommes marginales fixées : le test exact de Fisher Procédure Considérons l exemple d une table 2 2 avec une répartition a b c d. Fisher a établi des formules d énumération du nombre de répartition possible des a + b + c + d éléments de façon à ce que les sommes par ligne valent bien a + b et c + d et les sommes par colonnes a + c et b + d. Sous une hypothèse d équiprobabilité de ces répartitions, la probabilité de la table de contingence précédente est (a + b)!(a + c)!(b + c)!(b + d)! (a + b + c + d)!a!b!c!d! Ces formules peuvent être étendues à des tailles de tables plus grandes et sont calculables de manière efficace algorithmiquement.

106 Sommes marginales libres : le test du χ 2 d indépendance ou χ 2 de Pearson Dans le cas de grands échantillons, il n est plus nécessaire de supposer les sommes marginales fixées. Formulation H 0 : H 1 : X et Y sont indépendantes X et Y ne sont pas indépendantes Postulats L échantillon est grand.

107 Sommes marginales libres : le test du χ 2 d indépendance ou χ 2 de Pearson Procédure On note n ij l entrée de la table dans la cellule i j, n i la somme des effectifs de la ligne i et n j la somme des efectifs de lacolonne j. Sous hypothèse d indépendance, P(X I i, Y J j ) = P(X I i)p(y J j ) ce qui se traduit, si on remplace les probabilités par leurs estimateurs, par une égalité attendue entre n ij et e ij = n i n j, où N est l effectif total. N La statistique T = i,j (n ij e ij ) 2 = e ij i,j n 2 ij e ij N suit une loi du χ 2 à (r 1)(s 1) degrés de liberté sous H 0.

108 Exemple Des cultures cellulaires de souches différentes sont soumises à des rayonnements radioactifs et la proportion de cellules mortes est relevée. A B C D ray. α ray. β ray. γ temoin valeur de la statistique de 23.6 nombre de degrés de liberté de 9 p-valeur de Les souches réagissent différemment aux rayonnements.

109 Fisher ou χ 2? Asymptotiquement, ils sont équivalents en terme de puissance. Le test de Fisher est beaucoup plus couteux algorithmiquement : le test du χ 2 lui est généralement préféré, hormis dans le cas des tables 2 2 avec des effectifs assez réduits. Avoir des sommes marginales fixes (Fisher) est en général non conforme à l expérience. Dans un test médical Cas/Contrôles par exemple, le nombre de cas et de contrôles est fixé mais le nombre de patients répondant favorablement ne l est pas. Attention : la loi du χ 2 est une approximation, elle est donc d une validité douteuse quand les effectifs sont faibles.

110 IV. AUTRES TESTS

111 IV.1. Adéquation à une loi

112 Test du chi-deux d adéquation Formulation Soit (X 1,..., X n) un échantillon et F 0 une distribution donnée. On cherche à déterminer si l échantillon est tiré suivant F 0. Pour cela, on considère la fonction de répartition F n(t) = 1 n I Xi <t n i=1 H 0 : F n = F 0 H 1 : F n F 0 Postulats Pas de postulat particulier.

113 Test du chi-deux d adéquation Partition de l ensemble des valeurs possibles de X en un nombre fini d intervalles I 1,..., I k, I k = [a k 1, a k ]. Pour tout 1 i k : π i = F 0(a i) F 0(a i 1. Soit U i le nombre de mesures parmi n faisant partie de l intervale I i. U suit une loi multinomiale P(U 1 = m 1,..., U k = m k ) = n! m 1!... m k! πm π m k k Pris séparément, chaque U i suit une loi binomiale B(n, π i). Pour n suffisamment grand, le TCL implique que U i nπ i nπi suit une loi normale centrée réduite.

114 Test du chi-deux d adéquation Statistique X 2 n = k (U i nπ i) 2 i=1 Sous H 0, pour n assez grand, Xn 2 suit une loi du chi-deux à (k 1) degrés de liberté, notée χ 2 (k 1). Si X n est proche de 0, les effectifs observés (U i) sont proches des effectifs attendus (nπ i) et H 0 est accepté. Si X n est élevé, il existe des intervalles pour lequel la différence entre l observation et l attendu est grande, et H 0 est rejetée. La p-valeur du test est pv = 1 F χ 2 (Xn 2 ). (k 1) Remarque ; Cette loi est définie comme celle suivie par la somme des carrés de k 1 lois normales centrées réduites. Le passage à k 1 alors qu il y a k termes dans la sommation vient du fait que les U i ne sont pas indépendants puisque U i = n. nπ i

115 Exemple On a mesuré le poids de 25 barils de lessive censés faire 1kg, on se demande si ils suivent une loi normale d écart-type 25g comme prévu. Les poids en grammes sont les suivants : X = (947, 965, 970, 976, 978, 980, 986, 989, 996, 996, 997, 999, 1000, 1002, 1003, 1006, 1008, 1008, 1010, 1013, 1018, 1023, 1025, 1027, 1030) On découpe R en intervalle I 1 =], 980], I 2 =]980, 1000], I 3 =]1000, 1020], I 4 =]1020, + [. Les probabilités associées sous H 0 sont π 1 = 0.21, π 2 = 0.28, π 3 = 0.21, π 4 = Intervalle I 1 I 2 I 3 I 4 Attendu Observe La statistique associée vaut 4 et la p-valeur associée vaut 0.26 : H 0 est acceptée.

116 Remarques Si les intervalles sont choisis trop petits, les U i sont la plupart du temps égaux à 0 ou 1 et même pour n grand, l approximation asymptotique se révèle fausse. En pratique, on recommande de choisir les intervalles tels que nπ i 5. En fait, le test du chi-deux d adéquation teste la véracité de l hypothèse H 0 : π X i = π i, i où πi X est la probabilité sous la loi de X de tomber dans I i. C est donc une hypothèse moins forte que H 0 : il est possible que H 0 soit fausse mais que H 0 soit vraie. En décidant de rejeter H 0 si H 0 est fausse, on fait donc un choix conservatif. Dans le cas d une variable X qualitative, il est possible de mener ce test en ordonnant de façon arbitraire les valeurs possibles.

117 Autre exemple L équilibre de Hardy-Weinberg régit la répartition des allèles non-sexuels dans une population homogène avec union aléatoires et non-consanguines : si il est vérifié, P(AA) = p 2 A, P(Aa) = 2p A (1 p A ) et P(aa) = (1 p A ) 2 où p A est la fréquence de l allèle A dans la population. On veut tester si équilibre vrai avec p A = 0.2 et une population de taille n = 100. Genotype AA Aa aa Attendu Observe On obtient une statistique de χ 2 = (7 4)2 4 + (32 19) (74 64)2 64 = 9.09 et une p-valeur de L hypothèse H 0 est rejetée. Soit la fréquence de l allèle n est pas de 0.2, soit l équilibre de Hardy-Weinberg n est pas respecté.

118 Test de Kolmogorov-Smirnov Formulation Soit (X 1,..., X n) un échantillon et F 0 une distribution continue donnée. On cherche à déterminer si l échantillon est tiré suivant F 0. Pour cela, on considère la fonction de répartition n F n(t) = 1 n i=1 I Xi <t H 0 : F n = F 0 H 1 : F n F 0 Postulat La distribution candidate est continue.

119 Test de Kolmogorov-Smirnov Le principe est de choisir comme statistique une distance entre fonctions que l on applique à F n et F 0. Les choix possibles sont Kolmogorov-Smirnov Cramer-Von Mises Andersen-Darling ω 2 D n = sup t R F n(t) F 0(t) C n = (F n(t) F 0(t)) 2 df 0(t) A n = R R (F n(t) F 0(t)) 2 F 0(t)(1 F 0(t)) df0(t) Généralisation des 2 précédents. ωn 2 = (F n(t) F 0(t)) 2 ξ(f 0(t))dF 0(t) R avec ξ une fonction positive sur ]0, 1[. Les trois autres tests sont similaires à celui de Kolmogorov-Smirnov d un point de vue de l utilisation et de l interprétation mais techniquement plus compliqués.

120 Test de Kolmogorov-Smirnov Le maximum de la fonction F n F 0 est forcément pris sur l un des sauts de F n. Si X (i) correspond à la ieme valeur de l échantillon rangé par ordre croissant, déterminer la statistique D n revient donc à calculer i X n (i) et i 1 n X (i) pour tout i et à prendre le maximum de ces 2n valeurs. La loi sous H 0 de D n est calculée : exactement par des algorithmes pour n petit. par approximation asymptotique pour n grand : P( + nd n x) K (x) = 2 ( 1) k 1 e 2k 2 x 2 k=1 La p-valeur du test est donc obtenue par pv = 1 K ( nd n).

121 Test de Kolmogorov-Smirnov Les test de type Kolmogorov-Smirnov peut être rendu unilatéral : on teste si la distribution de l échantillon est globalement plus basse que la distribution de référence, auquel cas on s intéresse au fait que F n F 0 est positive et on choisit comme statistique max(f n(t) F 0(t)) ; ou à l inverse on teste si la distribution de l échantillon est globalement plus basse que la distribution de référence, auquel cas on s intéresse au fait que F n F 0 est négative et on choisit comme statistique max(f 0(t) F n(t)). Dans ce cas, K est remplacé par K définie par K (x) = 1 e x 2 l approximation asymptotique. dans

122 Exemple On a mesuré le poids de 20 barils de lessive censés faire 1kg, on se demande si suivent une loi normale d écart-type 25g comme prévu. Les poids en grammes sonts le suivants : X = (947, 965, 970, 976, 978, 986, 989, 996, 997, 1000, 1002, 1008, 1010, 1013, 1018, 1023, 1025, 1030) (3) On calcule D n, qui vaut La p-valeur asymptotique est 1 K ( ) = 0.97.

123 IV.2 Test d appartenance à une famille de lois

124 Test d appartenance à une famille de lois Le principe du test du χ 2 peut être généralisée pour tester l appartenance à une famille de loi, autrement dit savoir si F n appartient à une famille de fonctions de répartition F 0 = {F (x, θ) : θ Θ}. Le principe reste la même, y compris la statistique X 2 n (θ) = k i=1 (U i nπ i(θ)) 2 nπ i(θ) La seule différence étant qu il faut donner une valeur au paramètre θ à travers l utilisation d un estimateur ˆθ. Il y a plusieurs possibilités : 1. ˆθ = argminθ Θ X 2 n (θ) 2. ˆθ = k argminθ Θ i=1 dans ce cas. (U i nπ i (θ)) 2 U i. On parle de statistique du χ 2 modifié 3. ˆθ est l estimateur du maximum de vraisemblance pour la distribution multinomiale, c est-à-dire la valeur maximisant la log-vraisemblance l(θ) = k i=1 Ui ln πi(θ) + C.

125 Test d appartenance à une famille de lois Proposition Sous les conditions 1. 0 < π i(θ) < 1 pour tout i et tout θ ; 2. les π i(θ) sont de classe C 2 ; 3. la matrice des dérivées partielles [ dπ i (θ) θ j est de rang s ; ]1 i k,1 j s et pour chacun des estimateurs précédents, X 2 n (ˆθ) suit asymptotiquement une loi du χ 2 à k s 1 degrés de liberté. On peut donc appliquer le test du χ 2 comme précédemment, en otant autant de degrés de liberté que de dimensions dans Θ et en calculant la statistique à l aide d un des estimateurs cités plus haut.

126 Test de normalité : le test de Shapiro-Wilk On considère un vecteurx dont on se demande s il a été tiré suivant une loi normale. Droite de Henry Soit Φ la fonction de répartition de la loi normale centrée réduite. Si X N (µ, σ 2 ), P(X < x i) = Φ( xi µ ) σ En définissant t i = Φ 1 (P(X < x i), les points (x i, t i) devraient sont donc alignés si la loi est normale. Remarque : Cette méthode permet d estimer la moyenne et la variance de la loi si elle est bien normale.

127 Test de normalité : le test de Shapiro-Wilk Formulation H 0 : H 1 : La loi de l echantillon est normale La loi n est pas normale Principe Le test de Shapiro-Wilk consiste à considérer le rapport entre l estimation de la variance suivant la droite d Henry et l estimation de la variance par l estimateur habituel. W = ( n i=1 aixi)2 n i=1 (xi x)2 où les a i sont des constantes tabulées. Si la distribution est bien normale, ce rapport doit être proche de 1.

128 IV.3 Test du rapport de vraisemblance

129 Modèles emboîtés On considère deux modèles M 1 et M 2 pour décrire le même processus. M 1 est emboîté dans M 2 s il correspond à un cas particulier de M 2. Exemple : M 1 M 2 Y = α + βx + ɛ Y = α + βx + γz + δw + ɛ La question qui se pose est de savoir si la modèle M 2 décrit mieux les données que le modèle M 1

Introduction à la statistique non paramétrique

Introduction à la statistique non paramétrique Introduction à la statistique non paramétrique Catherine MATIAS CNRS, Laboratoire Statistique & Génome, Évry http://stat.genopole.cnrs.fr/ cmatias Atelier SFDS 27/28 septembre 2012 Partie 2 : Tests non

Plus en détail

TABLE DES MATIERES. C Exercices complémentaires 42

TABLE DES MATIERES. C Exercices complémentaires 42 TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence

Plus en détail

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position Arbre de NESI distribution quelconque Signe 1 échantillon distribution symétrique non gaussienne Wilcoxon gaussienne Student position appariés 1 échantillon sur la différence avec référence=0 2 échantillons

Plus en détail

Analyse de la variance Comparaison de plusieurs moyennes

Analyse de la variance Comparaison de plusieurs moyennes Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction

Plus en détail

Lire ; Compter ; Tester... avec R

Lire ; Compter ; Tester... avec R Lire ; Compter ; Tester... avec R Préparation des données / Analyse univariée / Analyse bivariée Christophe Genolini 2 Table des matières 1 Rappels théoriques 5 1.1 Vocabulaire....................................

Plus en détail

Biostatistiques : Petits effectifs

Biostatistiques : Petits effectifs Biostatistiques : Petits effectifs Master Recherche Biologie et Santé P. Devos DRCI CHRU de Lille EA2694 patrick.devos@univ-lille2.fr Plan Données Générales : Définition des statistiques Principe de l

Plus en détail

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES LES STATISTIQUES INFERENTIELLES (test de Student) L inférence statistique est la partie des statistiques qui, contrairement à la statistique descriptive, ne se contente pas de décrire des observations,

Plus en détail

Introduction aux Statistiques et à l utilisation du logiciel R

Introduction aux Statistiques et à l utilisation du logiciel R Introduction aux Statistiques et à l utilisation du logiciel R Christophe Lalanne Christophe Pallier 1 Introduction 2 Comparaisons de deux moyennes 2.1 Objet de l étude On a mesuré le temps de sommeil

Plus en détail

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3

Plus en détail

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année 2010-2011

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année 2010-2011 Master 1 Biologie et technologie du végétal Année 010-011 Statistiques Rappels de cours et travaux dirigés (Seul ce document sera autorisé en examen) auteur : Jean-Marc Labatte jean-marc.labatte@univ-angers.fr

Plus en détail

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques

Plus en détail

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur

Plus en détail

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences

Plus en détail

Tests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision

Tests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision Page n 1. Tests du χ 2 une des fonctions des statistiques est de proposer, à partir d observations d un phénomène aléatoire (ou modélisé comme tel) une estimation de la loi de ce phénomène. C est que nous

Plus en détail

Probabilités III Introduction à l évaluation d options

Probabilités III Introduction à l évaluation d options Probabilités III Introduction à l évaluation d options Jacques Printems Promotion 2012 2013 1 Modèle à temps discret 2 Introduction aux modèles en temps continu Limite du modèle binomial lorsque N + Un

Plus en détail

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Chapitre 5 UE4 : Biostatistiques Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.

Plus en détail

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé Baccalauréat S ntilles-guyane 11 septembre 14 Corrigé EXERCICE 1 6 points Commun à tous les candidats Une entreprise de jouets en peluche souhaite commercialiser un nouveau produit et à cette fin, effectue

Plus en détail

Représentation d une distribution

Représentation d une distribution 5 Représentation d une distribution VARIABLE DISCRÈTE : FRÉQUENCES RELATIVES DES CLASSES Si dans un graphique représentant une distribution, on place en ordonnées le rapport des effectifs n i de chaque

Plus en détail

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes IUT HSE Probabilités et Statistiques Feuille : variables aléatoires discrètes 1 Exercices Dénombrements Exercice 1. On souhaite ranger sur une étagère 4 livres de mathématiques (distincts), 6 livres de

Plus en détail

1 Complément sur la projection du nuage des individus

1 Complément sur la projection du nuage des individus TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent

Plus en détail

TESTS D HYPOTHÈSE FONDÉS SUR LE χ². http://fr.wikipedia.org/wiki/eugénisme

TESTS D HYPOTHÈSE FONDÉS SUR LE χ². http://fr.wikipedia.org/wiki/eugénisme TESTS D HYPOTHÈSE FONDÉS SUR LE χ² http://fr.wikipedia.org/wiki/eugénisme Logo du Second International Congress of Eugenics 1921. «Comme un arbre, l eugénisme tire ses constituants de nombreuses sources

Plus en détail

Estimation et tests statistiques, TD 5. Solutions

Estimation et tests statistiques, TD 5. Solutions ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études

Plus en détail

Statistiques Descriptives à une dimension

Statistiques Descriptives à une dimension I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des

Plus en détail

Précision d un résultat et calculs d incertitudes

Précision d un résultat et calculs d incertitudes Précision d un résultat et calculs d incertitudes PSI* 2012-2013 Lycée Chaptal 3 Table des matières Table des matières 1. Présentation d un résultat numérique................................ 4 1.1 Notations.........................................................

Plus en détail

Relation entre deux variables : estimation de la corrélation linéaire

Relation entre deux variables : estimation de la corrélation linéaire CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence

Plus en détail

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I Roxane Duroux 1 Cadre de l étude Cette étude s inscrit dans le cadre de recherche de doses pour des essais cliniques

Plus en détail

LES GENERATEURS DE NOMBRES ALEATOIRES

LES GENERATEURS DE NOMBRES ALEATOIRES LES GENERATEURS DE NOMBRES ALEATOIRES 1 Ce travail a deux objectifs : ====================================================================== 1. Comprendre ce que font les générateurs de nombres aléatoires

Plus en détail

Comparaison de fonctions Développements limités. Chapitre 10

Comparaison de fonctions Développements limités. Chapitre 10 PCSI - 4/5 www.ericreynaud.fr Chapitre Points importants 3 Questions de cours 6 Eercices corrigés Plan du cours 4 Eercices types 7 Devoir maison 5 Eercices Chap Et s il ne fallait retenir que si points?

Plus en détail

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction

Plus en détail

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE UE4 : Biostatistiques Chapitre 6 Test de comparaison de pourcentages χ² José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Nature des variables

Plus en détail

Calcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes.

Calcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes. 1 Définitions, notations Calcul matriciel Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes. On utilise aussi la notation m n pour le

Plus en détail

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Recherche opérationnelle Les démonstrations et les exemples seront traités en cours Souad EL Bernoussi Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Table des matières 1 Programmation

Plus en détail

PRIME D UNE OPTION D ACHAT OU DE VENTE

PRIME D UNE OPTION D ACHAT OU DE VENTE Université Paris VII - Agrégation de Mathématiques François Delarue) PRIME D UNE OPTION D ACHAT OU DE VENTE Ce texte vise à modéliser de façon simple l évolution d un actif financier à risque, et à introduire,

Plus en détail

Chapitre 3. Les distributions à deux variables

Chapitre 3. Les distributions à deux variables Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles

Plus en détail

Cours Fonctions de deux variables

Cours Fonctions de deux variables Cours Fonctions de deux variables par Pierre Veuillez 1 Support théorique 1.1 Représentation Plan et espace : Grâce à un repère cartésien ( ) O, i, j du plan, les couples (x, y) de R 2 peuvent être représenté

Plus en détail

Lois de probabilité. Anita Burgun

Lois de probabilité. Anita Burgun Lois de probabilité Anita Burgun Problème posé Le problème posé en statistique: On s intéresse à une population On extrait un échantillon On se demande quelle sera la composition de l échantillon (pourcentage

Plus en détail

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION Bruno Saussereau Laboratoire de Mathématiques de Besançon Université de Franche-Comté Travail en commun

Plus en détail

Principe d un test statistique

Principe d un test statistique Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre

Plus en détail

Moments des variables aléatoires réelles

Moments des variables aléatoires réelles Chapter 6 Moments des variables aléatoires réelles Sommaire 6.1 Espérance des variables aléatoires réelles................................ 46 6.1.1 Définition et calcul........................................

Plus en détail

Feuille d exercices 2 : Espaces probabilisés

Feuille d exercices 2 : Espaces probabilisés Feuille d exercices 2 : Espaces probabilisés Cours de Licence 2 Année 07/08 1 Espaces de probabilité Exercice 1.1 (Une inégalité). Montrer que P (A B) min(p (A), P (B)) Exercice 1.2 (Alphabet). On a un

Plus en détail

EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG

EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG Exploitations pédagogiques du tableur en STG Académie de Créteil 2006 1 EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG Commission inter-irem lycées techniques contact : dutarte@club-internet.fr La maquette

Plus en détail

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine

Plus en détail

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888 Lecture critique d article Rappels Bio statistiques Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888 Plan du cours Rappels fondamentaux Statistiques descriptives Notions de tests statistiques

Plus en détail

Probabilité et Statistique pour le DEA de Biosciences. Avner Bar-Hen

Probabilité et Statistique pour le DEA de Biosciences. Avner Bar-Hen Probabilité et Statistique pour le DEA de Biosciences Avner Bar-Hen Université Aix-Marseille III 2000 2001 Table des matières 1 Introduction 3 2 Introduction à l analyse statistique 5 1 Introduction.................................

Plus en détail

TSTI 2D CH X : Exemples de lois à densité 1

TSTI 2D CH X : Exemples de lois à densité 1 TSTI 2D CH X : Exemples de lois à densité I Loi uniforme sur ab ; ) Introduction Dans cette activité, on s intéresse à la modélisation du tirage au hasard d un nombre réel de l intervalle [0 ;], chacun

Plus en détail

Probabilités sur un univers fini

Probabilités sur un univers fini [http://mp.cpgedupuydelome.fr] édité le 7 août 204 Enoncés Probabilités sur un univers fini Evènements et langage ensembliste A quelle condition sur (a, b, c, d) ]0, [ 4 existe-t-il une probabilité P sur

Plus en détail

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent

Plus en détail

M2 IAD UE MODE Notes de cours (3)

M2 IAD UE MODE Notes de cours (3) M2 IAD UE MODE Notes de cours (3) Jean-Yves Jaffray Patrice Perny 16 mars 2006 ATTITUDE PAR RAPPORT AU RISQUE 1 Attitude par rapport au risque Nousn avons pas encore fait d hypothèse sur la structure de

Plus en détail

Une introduction. Lionel RIOU FRANÇA. Septembre 2008

Une introduction. Lionel RIOU FRANÇA. Septembre 2008 Une introduction INSERM U669 Septembre 2008 Sommaire 1 Effets Fixes Effets Aléatoires 2 Analyse Classique Effets aléatoires Efficacité homogène Efficacité hétérogène 3 Estimation du modèle Inférence 4

Plus en détail

VI. Tests non paramétriques sur un échantillon

VI. Tests non paramétriques sur un échantillon VI. Tests non paramétriques sur un échantillon Le modèle n est pas un modèle paramétrique «TESTS du CHI-DEUX» : VI.1. Test d ajustement à une loi donnée VI.. Test d indépendance de deux facteurs 96 Différentes

Plus en détail

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

FORMULAIRE DE STATISTIQUES

FORMULAIRE DE STATISTIQUES FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)

Plus en détail

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre. Université de Nantes Année 2013-2014 L3 Maths-Eco Feuille 6 : Tests Exercice 1 On cherche à connaître la température d ébullition µ, en degrés Celsius, d un certain liquide. On effectue 16 expériences

Plus en détail

3 Approximation de solutions d équations

3 Approximation de solutions d équations 3 Approximation de solutions d équations Une équation scalaire a la forme générale f(x) =0où f est une fonction de IR dans IR. Un système de n équations à n inconnues peut aussi se mettre sous une telle

Plus en détail

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

Correction du Baccalauréat S Amérique du Nord mai 2007

Correction du Baccalauréat S Amérique du Nord mai 2007 Correction du Baccalauréat S Amérique du Nord mai 7 EXERCICE points. Le plan (P) a une pour équation cartésienne : x+y z+ =. Les coordonnées de H vérifient cette équation donc H appartient à (P) et A n

Plus en détail

Données longitudinales et modèles de survie

Données longitudinales et modèles de survie ANALYSE DU Données longitudinales et modèles de survie 5. Modèles de régression en temps discret André Berchtold Département des sciences économiques, Université de Genève Cours de Master ANALYSE DU Plan

Plus en détail

Calcul élémentaire des probabilités

Calcul élémentaire des probabilités Myriam Maumy-Bertrand 1 et Thomas Delzant 1 1 IRMA, Université Louis Pasteur Strasbourg, France Licence 1ère Année 16-02-2006 Sommaire La loi de Poisson. Définition. Exemple. 1 La loi de Poisson. 2 3 4

Plus en détail

Complément d information concernant la fiche de concordance

Complément d information concernant la fiche de concordance Sommaire SAMEDI 0 DÉCEMBRE 20 Vous trouverez dans ce dossier les documents correspondants à ce que nous allons travailler aujourd hui : La fiche de concordance pour le DAEU ; Page 2 Un rappel de cours

Plus en détail

Texte Agrégation limitée par diffusion interne

Texte Agrégation limitée par diffusion interne Page n 1. Texte Agrégation limitée par diffusion interne 1 Le phénomène observé Un fût de déchets radioactifs est enterré secrètement dans le Cantal. Au bout de quelques années, il devient poreux et laisse

Plus en détail

Simulation de variables aléatoires

Simulation de variables aléatoires Chapter 1 Simulation de variables aléatoires Références: [F] Fishman, A first course in Monte Carlo, chap 3. [B] Bouleau, Probabilités de l ingénieur, chap 4. [R] Rubinstein, Simulation and Monte Carlo

Plus en détail

Probabilité. Table des matières. 1 Loi de probabilité 2 1.1 Conditions préalables... 2 1.2 Définitions... 2 1.3 Loi équirépartie...

Probabilité. Table des matières. 1 Loi de probabilité 2 1.1 Conditions préalables... 2 1.2 Définitions... 2 1.3 Loi équirépartie... 1 Probabilité Table des matières 1 Loi de probabilité 2 1.1 Conditions préalables........................... 2 1.2 Définitions................................. 2 1.3 Loi équirépartie..............................

Plus en détail

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé A. P. M. E. P. Exercice 1 5 points 1. Réponse d. : 1 e Le coefficient directeur de la tangente est négatif et n est manifestement pas 2e

Plus en détail

Continuité et dérivabilité d une fonction

Continuité et dérivabilité d une fonction DERNIÈRE IMPRESSIN LE 7 novembre 014 à 10:3 Continuité et dérivabilité d une fonction Table des matières 1 Continuité d une fonction 1.1 Limite finie en un point.......................... 1. Continuité

Plus en détail

Programmes des classes préparatoires aux Grandes Ecoles

Programmes des classes préparatoires aux Grandes Ecoles Programmes des classes préparatoires aux Grandes Ecoles Filière : scientifique Voie : Biologie, chimie, physique et sciences de la Terre (BCPST) Discipline : Mathématiques Seconde année Préambule Programme

Plus en détail

Calculs de probabilités conditionelles

Calculs de probabilités conditionelles Calculs de probabilités conditionelles Mathématiques Générales B Université de Genève Sylvain Sardy 20 mars 2008 1. Indépendance 1 Exemple : On lance deux pièces. Soit A l évènement la première est Pile

Plus en détail

Raisonnement par récurrence Suites numériques

Raisonnement par récurrence Suites numériques Chapitre 1 Raisonnement par récurrence Suites numériques Terminale S Ce que dit le programme : CONTENUS CAPACITÉS ATTENDUES COMMENTAIRES Raisonnement par récurrence. Limite finie ou infinie d une suite.

Plus en détail

Probabilités conditionnelles Loi binomiale

Probabilités conditionnelles Loi binomiale Exercices 23 juillet 2014 Probabilités conditionnelles Loi binomiale Équiprobabilité et variable aléatoire Exercice 1 Une urne contient 5 boules indiscernables, 3 rouges et 2 vertes. On tire au hasard

Plus en détail

Exercices - Polynômes : corrigé. Opérations sur les polynômes

Exercices - Polynômes : corrigé. Opérations sur les polynômes Opérations sur les polynômes Exercice 1 - Carré - L1/Math Sup - Si P = Q est le carré d un polynôme, alors Q est nécessairement de degré, et son coefficient dominant est égal à 1. On peut donc écrire Q(X)

Plus en détail

Cours d analyse numérique SMI-S4

Cours d analyse numérique SMI-S4 ours d analyse numérique SMI-S4 Introduction L objet de l analyse numérique est de concevoir et d étudier des méthodes de résolution de certains problèmes mathématiques, en général issus de problèmes réels,

Plus en détail

Table des matières. I Mise à niveau 11. Préface

Table des matières. I Mise à niveau 11. Préface Table des matières Préface v I Mise à niveau 11 1 Bases du calcul commercial 13 1.1 Alphabet grec...................................... 13 1.2 Symboles mathématiques............................... 14 1.3

Plus en détail

1. Vocabulaire : Introduction au tableau élémentaire

1. Vocabulaire : Introduction au tableau élémentaire L1-S1 Lire et caractériser l'information géographique - Le traitement statistique univarié Statistique : le terme statistique désigne à la fois : 1) l'ensemble des données numériques concernant une catégorie

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA

Plus en détail

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux 4 2013-2014

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux 4 2013-2014 Tests du χ 2 Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux 4 2013-2014 A. Lourme http://alexandrelourme.free.fr Outline

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

Limites finies en un point

Limites finies en un point 8 Limites finies en un point Pour ce chapitre, sauf précision contraire, I désigne une partie non vide de R et f une fonction définie sur I et à valeurs réelles ou complees. Là encore, les fonctions usuelles,

Plus en détail

Résolution d équations non linéaires

Résolution d équations non linéaires Analyse Numérique Résolution d équations non linéaires Said EL HAJJI et Touria GHEMIRES Université Mohammed V - Agdal. Faculté des Sciences Département de Mathématiques. Laboratoire de Mathématiques, Informatique

Plus en détail

Introduction à la Statistique Inférentielle

Introduction à la Statistique Inférentielle UNIVERSITE MOHAMMED V-AGDAL SCIENCES FACULTE DES DEPARTEMENT DE MATHEMATIQUES SMI semestre 4 : Probabilités - Statistique Introduction à la Statistique Inférentielle Prinemps 2013 0 INTRODUCTION La statistique

Plus en détail

Exemples d application

Exemples d application AgroParisTech Exemples d application du modèle linéaire E Lebarbier, S Robin Table des matières 1 Introduction 4 11 Avertissement 4 12 Notations 4 2 Régression linéaire simple 7 21 Présentation 7 211 Objectif

Plus en détail

Chapitre 2/ La fonction de consommation et la fonction d épargne

Chapitre 2/ La fonction de consommation et la fonction d épargne hapitre 2/ La fonction de consommation et la fonction d épargne I : La fonction de consommation keynésienne II : Validations et limites de la fonction de consommation keynésienne III : Le choix de consommation

Plus en détail

(51) Int Cl.: H04L 29/06 (2006.01) G06F 21/55 (2013.01)

(51) Int Cl.: H04L 29/06 (2006.01) G06F 21/55 (2013.01) (19) TEPZZ 8 8 4_A_T (11) EP 2 838 241 A1 (12) DEMANDE DE BREVET EUROPEEN (43) Date de publication: 18.02.1 Bulletin 1/08 (1) Int Cl.: H04L 29/06 (06.01) G06F 21/ (13.01) (21) Numéro de dépôt: 141781.4

Plus en détail

I. Polynômes de Tchebychev

I. Polynômes de Tchebychev Première épreuve CCP filière MP I. Polynômes de Tchebychev ( ) 1.a) Tout réel θ vérifie cos(nθ) = Re ((cos θ + i sin θ) n ) = Re Cn k (cos θ) n k i k (sin θ) k Or i k est réel quand k est pair et imaginaire

Plus en détail

ELEC2753 Electrotechnique examen du 11/06/2012

ELEC2753 Electrotechnique examen du 11/06/2012 ELEC2753 Electrotechnique examen du 11/06/2012 Pour faciliter la correction et la surveillance, merci de répondre aux 3 questions sur des feuilles différentes et d'écrire immédiatement votre nom sur toutes

Plus en détail

Cours de Tests paramétriques

Cours de Tests paramétriques Cours de Tests paramétriques F. Muri-Majoube et P. Cénac 2006-2007 Licence Ce document est sous licence ALC TYPE 2. Le texte de cette licence est également consultable en ligne à l adresse http://www.librecours.org/cgi-bin/main?callback=licencetype2.

Plus en détail

III- Raisonnement par récurrence

III- Raisonnement par récurrence III- Raisonnement par récurrence Les raisonnements en mathématiques se font en général par une suite de déductions, du style : si alors, ou mieux encore si c est possible, par une suite d équivalences,

Plus en détail

Estimation: intervalle de fluctuation et de confiance. Mars 2012. IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

Estimation: intervalle de fluctuation et de confiance. Mars 2012. IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison Estimation: intervalle de fluctuation et de confiance Mars 2012 IREM: groupe Proba-Stat Estimation Term.1 Intervalle de fluctuation connu : probabilité p, taille de l échantillon n but : estimer une fréquence

Plus en détail

1 Définition de la non stationnarité

1 Définition de la non stationnarité Chapitre 2: La non stationnarité -Testsdedétection Quelques notes de cours (non exhaustives) 1 Définition de la non stationnarité La plupart des séries économiques sont non stationnaires, c est-à-direqueleprocessusquiles

Plus en détail

UEO11 COURS/TD 1. nombres entiers et réels codés en mémoire centrale. Caractères alphabétiques et caractères spéciaux.

UEO11 COURS/TD 1. nombres entiers et réels codés en mémoire centrale. Caractères alphabétiques et caractères spéciaux. UEO11 COURS/TD 1 Contenu du semestre Cours et TDs sont intégrés L objectif de ce cours équivalent a 6h de cours, 10h de TD et 8h de TP est le suivant : - initiation à l algorithmique - notions de bases

Plus en détail

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Baccalauréat ES/L Amérique du Sud 21 novembre 2013 Baccalauréat ES/L Amérique du Sud 21 novembre 2013 A. P. M. E. P. EXERCICE 1 Commun à tous les candidats 5 points Une entreprise informatique produit et vend des clés USB. La vente de ces clés est réalisée

Plus en détail

Variables Aléatoires. Chapitre 2

Variables Aléatoires. Chapitre 2 Chapitre 2 Variables Aléatoires Après avoir réalisé une expérience, on ne s intéresse bien souvent à une certaine fonction du résultat et non au résultat en lui-même. Lorsqu on regarde une portion d ADN,

Plus en détail

INF6304 Interfaces Intelligentes

INF6304 Interfaces Intelligentes INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie

Plus en détail

23. Interprétation clinique des mesures de l effet traitement

23. Interprétation clinique des mesures de l effet traitement 23. Interprétation clinique des mesures de l effet traitement 23.1. Critères de jugement binaires Plusieurs mesures (indices) sont utilisables pour quantifier l effet traitement lors de l utilisation d

Plus en détail

Théorie et Codage de l Information (IF01) exercices 2013-2014. Paul Honeine Université de technologie de Troyes France

Théorie et Codage de l Information (IF01) exercices 2013-2014. Paul Honeine Université de technologie de Troyes France Théorie et Codage de l Information (IF01) exercices 2013-2014 Paul Honeine Université de technologie de Troyes France TD-1 Rappels de calculs de probabilités Exercice 1. On dispose d un jeu de 52 cartes

Plus en détail

Cours de méthodes de scoring

Cours de méthodes de scoring UNIVERSITE DE CARTHAGE ECOLE SUPERIEURE DE STATISTIQUE ET D ANALYSE DE L INFORMATION Cours de méthodes de scoring Préparé par Hassen MATHLOUTHI Année universitaire 2013-2014 Cours de méthodes de scoring-

Plus en détail

Exercices - Nombres complexes : corrigé. Formes algébriques et trigonométriques, module et argument

Exercices - Nombres complexes : corrigé. Formes algébriques et trigonométriques, module et argument Formes algébriques et trigonométriques, module et argument Exercice - - L/Math Sup - On multiplie le dénominateur par sa quantité conjuguée, et on obtient : Z = 4 i 3 + i 3 i 3 = 4 i 3 + 3 = + i 3. Pour

Plus en détail

Méthodes de quadrature. Polytech Paris-UPMC. - p. 1/48

Méthodes de quadrature. Polytech Paris-UPMC. - p. 1/48 Méthodes de Polytech Paris-UPMC - p. 1/48 Polynôme d interpolation de Preuve et polynôme de Calcul de l erreur d interpolation Étude de la formule d erreur Autres méthodes - p. 2/48 Polynôme d interpolation

Plus en détail

Document d orientation sur les allégations issues d essais de non-infériorité

Document d orientation sur les allégations issues d essais de non-infériorité Document d orientation sur les allégations issues d essais de non-infériorité Février 2013 1 Liste de contrôle des essais de non-infériorité N o Liste de contrôle (les clients peuvent se servir de cette

Plus en détail

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé Baccalauréat ES Pondichéry 7 avril 204 Corrigé EXERCICE 4 points Commun à tous les candidats. Proposition fausse. La tangente T, passant par les points A et B d abscisses distinctes, a pour coefficient

Plus en détail

Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé

Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé EXERCICE 1 5 points Commun à tous les candidats 1. Réponse c : ln(10)+2 ln ( 10e 2) = ln(10)+ln ( e 2) = ln(10)+2 2. Réponse b : n 13 0,7 n 0,01

Plus en détail