Statistiques non paramétriques : Comparaison de proportions, de distributions et autres tests

Dimension: px
Commencer à balayer dès la page:

Download "Statistiques non paramétriques : Comparaison de proportions, de distributions et autres tests"

Transcription

1 1 / 58 Statistiques non paramétriques : Comparaison de proportions, de distributions et autres tests M-A Dronne

2 2 / 58 Introduction Tests non paramétriques Comparaisons de proportions Comparaison d une proportion à une proportion de référence Test binomial exact Comparaison de 2 proportions Test du Chi-deux d homogénéité Test exact de Fisher Comparaison de plus de 2 proportions Test du Chi-deux d homogénéité

3 3 / 58 Introduction Tests non paramétriques Comparaisons de distributions Comparaison d une distribution à une distribution de référence Test du Chi-deux de conformité Test de Kolmogorov-Smirnov Tests de normalité Test de Shapiro-Wilk Test de Lilliefors Autres tests (test de Anderson-Darling, test d Agostino) Comparaison de deux distributions Test du Chi-deux d homogénéité Test de Kolmogorov-Smirnov Comparaison de plus de deux distributions Test du Chi-deux d homogénéité

4 Introduction Tests non paramétriques Liaison/indépendance de 2 variables qualitatives Test du Chi-deux d homogénéité Test du Chi-deux d indépendance Liaison/indépendance de 2 variables quantitatives Test du coefficient de corrélation de Spearman (cf cours sur la corrélation) Tests sur données binaires En présence de 2 conditions Test de MacNemar En présence de plus de 2 conditions Test Q de Cochran 4 / 58

5 5 / 58 Introduction Plan du cours Tests du Chi-deux Test de Kolmogorov-Smirnov Tests de normalité (test de Shapiro et test de Lilliefors) Tests sur variables binaires : Test de MacNemar Test de Cochran

6 6 / 58 Tests du χ 2 Vocabulaire et notation Chi-deux = Chi 2 = Khi-deux = Khi 2 = χ 2 Test du χ 2 de Pearson 3 types de tests 1. Test de conformité (= d ajustement) d une loi de probabilité parente à une loi de probabilité de référence cas univarié 2. Test d homogénéité de plusieurs distributions cas bivarié (1 v.a. + 1 variable contrôlée) 3. Test d indépendance entre 2 v.a. cas bivarié (2 v.a.)

7 Test de conformité du χ 2 Exemple Problème Une étude portant sur 300 jeunes adultes de 18 à 25 ans vise à déterminer la distribution du nombre de partenaires sexuels durant une année donnée. Les résultats sont les suivants : Nb de partenaires Effectif Question En langage courant Peut-on admettre que le nombre de partenaires sexuels par individu suit une loi de Poisson? En langage "statistique" La distribution de la variable étudiée est-elle différente de la distribution d une loi de Poisson au risque 5 %? 7 / 58

8 Test de conformité du χ 2 Question statistique Variable X : 1 variable qui peut être qualitative ou quantitative (discrète ou continue) Hypothèses statistiques Soit (x i, p i ) la loi de probabilité suivie par X et (x i, p 0i ) la loi de probabilité théorique : H 0 : conformité de la loi de X à la loi théorique H 0 : p i = p 0i i {1,..., I} H 1 : non conformité de la loi de X à la loi théorique H 1 : i {1,..., I} tq p i p 0i 8 / 58

9 9 / 58 Test de conformité du χ 2 Question statistique Exemples de lois théoriques Loi uniforme : p 0i = 1 I i {1,..., I} Loi binomiale B(n 0, p 0 ) : p 0i = C x i n 0 p x i 0 (1 p 0) n 0 x i Si p 0 inconnu, on l estime par f 0 Loi de Poisson P(λ 0 ) : p 0i = e λ 0 λx i 0 x i! Si λ 0 inconnu, on l estime par m x Loi normale N (µ 0, σ 0 ) : ( ) ( ) xi+1 µ p 0i = P(x i X x i+1 ) = F 0 σ 0 F xi µ 0 σ 0 Si µ 0 et σ 0 inconnus, on les estime par m x et s x

10 10 / 58 Test de conformité du χ 2 Données Remarque Les effectifs des observations sont recensés dans un tableau de contingence Tableau de contingence sur les données Valeurs : x i x 1 x 2... x I Total Effectifs observés : o i o 1 o 2... o I n Calcul des effectifs théoriques sous H 0 c i = n p 0i i {1,..., I} Valeurs : x i x 1 x 2... x I Total Effectifs théoriques : c i c 1 c 2... c I n = i c i

11 11 / 58 Test de conformité du χ 2 Conditions d application Conditions à respecter Il faut que c i 5 i {1,..., I} Les observations doivent être indépendantes : n = i o i Remarque Si certains c i < 5, il faut regrouper les classes contigües

12 12 / 58 Test de conformité du χ 2 Statistique de test Formule, loi et valeur Variable d intérêt : O i (effectif observé) Statistique de test : Z = χ 2 = I (O i c i ) 2 i=1 c i Loi suivie sous H 0 : Z χ 2 avec ν = (I r 1) ddl r : nombre de paramètres (de la loi théorique) estimés Valeur calculée : z c = χ 2 c = I i=1 (o i c i ) 2 c i = I i=1 ( ) oi 2 n c i avec I : nombre de classes, c i = np 0i et n = I i=1 c i

13 13 / 58 Test de conformité du χ 2 Confrontation et conclusion Méthodes (cf. cours précédents) Confrontation Comparaison de la valeur de la statistique de test χ 2 c avec la valeur seuil χ 2 s lue dans la table du Chi-deux Position de χ 2 c par rapport à l intervalle d acceptation I a Comparaison de la p-value avec la valeur α Conclusion Conclusion en langage statistique et en langage courant (au risque α)

14 14 / 58 Test de conformité du χ 2 Confrontation et conclusion Remarque sur la valeur seuil Test du χ 2 équivalent à un test unilatéral Table du χ 2 : table unilatérale α table = α χ 2 s = χ 2 (α,ν) I a = [0; χ 2 (α,ν) [ Décision statistique Si χ 2 c < χ 2 (α,ν) : non rejet de H 0 au risque α Si χ 2 c χ 2 (α,ν) : rejet de H 0 au risque α

15 15 / 58 Test de conformité du χ 2 Correction de continuité Remarque Quand on effectue une approximation d une loi discrète par une loi continue, on peut réduire l erreur de l approximation en faisant une correction de continuité. Dans le cas d une approximation de la loi binomiale par la loi du Chi-deux (via la loi normale), on peut utiliser la correction de continuité de Yates : z c = χ 2 c = χ 2 Yates = I ( o i c i 0.5) 2 c i i=1 Cette correction diminue le χ 2 c et augmente donc la p-value.

16 16 / 58 Test de conformité du χ 2 Correction de continuité Remarque (suite) La correction de continuité de Yates a pour objectif d empêcher une surestimation de la significativité d un test lors de petits effectifs mais, inversement, elle risque d empêcher de détecter un effet quand il existe. Elle est utilisée surtout dans le cas où l effectif total est peu important Elle peut être ajoutée sur R par l option correct = TRUE

17 17 / 58 Test de conformité du χ 2 Logiciel R Commande R Fonction chisq.test(ef_obs,p=c(prop_theo)) Remarques Sous R, les valeurs théoriques doivent être données sous forme des proportions attendues alors que les valeurs observées doivent être données sous forme d effectifs Si un des effectifs théoriques est < 5, le message suivant apparait sur R : "l approximation du Chi-2 est peut-être incorrecte" regroupement de classe ou test exact de Fisher

18 18 / 58 Test de conformité du χ 2 Résultats de l exemple Résultats Chi-squared test for given probabilities data: c(47, 132, 73, 30, 12, 6) X-squared = , df = 5, p-value = Interprétation p-value < 0.05 rejet de H 0 au risque 5% La distribution du nombre de partenaires sexuels pendant l année considérée chez les ans est significativement différente d une loi de Poisson de paramètre 1.5 au risque 5%

19 Test d homogénéité du χ 2 Exemple Problème Afin d étudier l effet d un médicament A sur une maladie M, 2 groupes sont constitués (groupe contrôle et groupe traité). Le nombre de patients malades de la maladie M est recensé dans chaque groupe : Groupe traité : sur 300 patients ayant le médicament A, 84 ont contracté la maladie M Groupe contrôle : sur 200 patients sous placebo, 72 ont contracté la maladie M Question Est-ce que le médicament A a un effet sur la maladie M? La répartition des malades est-elle significativement différente dans les 2 populations au risque 5 %? Les proportions de malades sont-elles significativement différentes dans les 2 populations au risque 5%? 19 / 58

20 20 / 58 Test d homogénéité du χ 2 Question statistique Variables 2 variables : X : variable aléatoire (qualitative, quantitative discrète ou discrétisée) avec J réalisations possibles Y : variable contrôlée avec I valeurs fixées Hypothèses statistiques Soit p ij = P(X = x j Y = y i ) Soit p i. = P(Y = y i ) et p.j = P(X = x j ) H 0 : p ij = p i. p.j i {1,..., I} et j {1,..., J} H 1 : i {1,..., I} et j {1,..., J} tq p ij p i. p.j

21 21 / 58 Test d homogénéité du χ 2 Question statistique et données Remarques sur les hypothèses statistiques H 0 : homogénéité des distributions de X suivant les valeurs de Y H 1 : hétérogénéité des distributions de X suivant les valeurs de Y Tableau de contingence sur les données Valeurs x 1... x j... x J Totaux y 1 o o 1j... o 1J L y i o i1... o ij... o ij L i y I o I1... o Ij... o IJ L I Totaux S 1... S j... S J n

22 22 / 58 Test d homogénéité du χ 2 Données et conditions d application Calcul des effectifs théoriques sous H 0 Effectifs calculés : c ij = L i S j n i {1,..., I} et j {1,..., J} Conditions à respecter Il faut que c ij 5 i {1,..., I} et j {1,..., J} Les observations doivent être indépendantes : I J n = i=1 i=j o ij Remarque Si certains c ij < 5, il faut regrouper les classes contigües

23 23 / 58 Test d homogénéité du χ 2 Statistique de test Formule, loi et valeur Variable d intérêt : O ij (effectif observé) Statistique de test : Z = χ 2 = I J (O ij c ij ) 2 i=1 j=1 c ij Loi suivie sous H 0 : Z χ 2 avec ν = (I 1)(J 1) ddl Valeur calculée : I z c = χ 2 c = J i=1 j=1 (o ij c ij ) 2 c ij = I i=1 j=1 avec I : nb de lignes, J : nb de colonnes et n = ( ) J o 2 ij n c ij I J i=1 j=1 c ij

24 24 / 58 Test d homogénéité du χ 2 Correction de continuité Remarque Comme dans le cas du test de conformité du Chi-deux, on peut utiliser la correction de continuité de Yates. Recommandations de Cochran : Si n < 20 : test exact de Fisher Si 20 n < 40 et si les effectifs théoriques sont > 5 : test du Chi-deux avec la correction de Yates Si n 40 et si les proportions ne sont voisines ni de 0 ni de 1 : test classique du Chi-deux Sur R, option correct = TRUE

25 25 / 58 Test d homogénéité du χ 2 Logiciel R Commandes R Constitution des listes de valeurs : essai = c(84,216) et controle = c(72,128) Constitution du tableau : table= rbind(controle,essai) Réalisation du test : Fonction prop.test Fonction chisq.test Remarques Si le test est significatif, il est possible de faire des comparaisons de proportions 2 à 2 Les effectifs théoriques sont donnés par la commande chisq.test(...)$expected

26 26 / 58 Test d homogénéité du χ 2 Logiciel R Résultats avec prop.test 2-sample test for equality of proportions with continuity correction data: table X-squared = , df = 1, p-value = alternative hypothesis: two.sided 95 percent confidence interval: sample estimates: prop 1 prop Résultats avec chisq.test Pearson s Chi-squared test with Yates continuity correction data: table X-squared = , df = 1, p-value =

27 27 / 58 Test d homogénéité du χ 2 Logiciel R Remarque Quand X et Y ont chacune deux valeurs possibles (tableau 2 2), il est équivalent de faire un test d homogénéité du χ 2 et de faire un test bilatéral de comparaison de 2 proportions. z c = u c avec (u c ) 2 = χ 2 c et (u s ) 2 = χ 2 s Interprétation des résultats p-value > 0.05 non rejet de H 0 au risque 5% Les distributions ne sont pas significativement hétérogènes au risque 5% les distributions sont indépendantes du groupe au risque 5% la molécule A n a pas d effet significatif sur la maladie M au risque 5%

28 Test d indépendance du χ 2 Exemple Problème Dans un service de médecine légale, une étude a été réalisée pour établir l âge au décès à partir de l observation de l extrémité sternale de la 4 ème côte de personnes décédées. Un des critères utilisés est la forme de la dépression articulaire (cavité) qui peut prendre 6 modalités. Les données observées sur 500 patients sont les suivantes : Eff.obs < âge [30; 50[ [50; 70[ > Question Existe-t-il une liaison significative entre la forme de la cavité et l âge de la personne décédée au risque 5 %? 28 / 58

29 Test d indépendance du χ 2 Question statistique Variables 2 variables (qualitatives, quantitatives discrètes ou discrétisées) : X : v.a. avec J réalisations possibles Y : v.a. avec I réalisations possibles Hypothèses statistiques (idem test d homogénéité) Soit p ij = P(X = x j...y = y i ) Soit p i. = P(Y = y i ) et p.j = P(X = x j ) H 0 : p ij = p i. p.j i {1,..., I} et j {1,..., J} H 1 : i {1,..., I} et j {1,..., J} tq p ij p i. p.j 29 / 58

30 30 / 58 Test d indépendance du χ 2 Question statistique Remarques sur les hypothèses statistiques H 0 : indépendance de X et Y H 1 : liaison entre X et Y Etapes suivantes Tableau de contingence Calcul des effectifs théoriques Conditions à respecter Statistique de test (formule et calcul) Confrontation et conclusion Correction de continuité idem test d homogénéité

31 Test d indépendance du χ 2 Logiciel R Commande R fonction chisq.test Remarques Si le test est significatif, il est possible de faire des comparaisons 2 à 2 pour savoir quelle(s) classe(s) est(sont) à l origine de la liaison Les effectifs théoriques sont donnés par la commande chisq.test(...)$expected 31 / 58

32 32 / 58 Tests d homogénéité et d indépendance du χ 2 Remarque Test de liaison/indépendance Liaison entre 2 variables qualitatives Variable aléatoire + variable contrôlée test du χ 2 d homogénéité 2 variables aléatoires test du χ 2 d indépendance Liaison (linéaire) entre 2 variables quantitatives Variable aléatoire + variable contrôlée Régression (test de la pente nulle ou test de Fisher) 2 variables aléatoires Corrélation (test de non corrélation)

33 33 / 58 Tests complémentaires aux tests du χ 2 Remarque Si les effectifs théoriques ne sont pas tous supérieurs à 5 (malgré les regroupements possibles de classe), on peut utiliser : Le test de Fisher (tableau 2 2) Le nombre de paires (NP) (tableau > 2 2) Si les n blocs (groupes) sont ordonnés, on peut utiliser la statistique de tendance (permet de faire un test "unilatéral") (tableau 2 n)

34 34 / 58 Test de Fisher Tableau de contingence Groupe 1 Groupe 2 Totaux Présence du facteur F a b M Absence du facteur F c d N M Totaux N 1 N 2 N Hypothèses statistiques H 0 : équirépartition des M individus avec le facteur F entre les deux groupes (i.e. indépendance) H 1 : non indépendance

35 Test de Fisher Probabilité Sous H 0, la loi suivie est une loi hypergéométrique H(N, M, N 1 ) p = P(a, b, c, d) = M!(N M)!N 1!N 2! a!b!c!d!n! p représente la p-value et est ensuite comparé à α Remarque On peut faire un test unilatéral avec le test de Fisher (contrairement au test du χ 2 ) Commande R Fonction fisher.test Pour faire un test unilatéral : option alternative = "greater" par exemple 35 / 58

36 36 / 58 Statistique de tendance Exemple de tableau de contingence Les groupes (blocs) sont ordonnés : Groupe 1 Groupe 2 Groupe 3 Valeurs [0; 100[ [100; 200[ [200; 300[ Totaux Présence de F Y 1 Y 2 Y 3 M Absence de F N M Totaux K 1 K 2 K 3 N Hypothèses statistiques H 0 : indépendance H 1 : probabilité de présence du facteur F augmente avec la valeur de la grandeur étudiée

37 Test de Kolmogorov-Smirnov Utilisations Comparaison de 2 distributions Comparaison d une distribution à une distribution théorique bien définie 37 / 58

38 Test de Kolmogorov-Smirnov Test de conformité à une distribution de référence Variable 1 variable X quantitative (continue ou discrète) Hypothèses statistiques H 0 : X suit une loi bien définie (normale, Poisson,...) H 1 : X ne suit pas la loi considérée Logiciel R Fonction ks.test Exemple : comparaison de la distribution de X à la loi normale N (13; 3) : ks.test(x,"pnorm",mean=13,sd=3) 38 / 58

39 39 / 58 Test de Kolmogorov-Smirnov Test de conformité à une distribution de référence Kolmogorov-Smirnov et χ 2 Utilisation du test d ajustement du χ 2 = test du conformité du χ 2 ) : nombre important de données paramètres estimés de la loi Utilisation du test de Kolmogorov-Smirnov : petit nombre de données paramètres connus de la loi

40 40 / 58 Tests spécifiques de normalité Tests possibles Principaux tests : Test de Shapiro-Wilk Test de Lilliefors (variante du test de Kolmogorov-Smirnov) Autres tests : Test de Anderson-Darling (variante du test de Kolmogorov-Smirnov) Test de D Agostino (basé sur les coefficients d asymétrie et d aplatissement) tests non paramétriques

41 41 / 58 Tests spécifiques de normalité Test de Shapiro-Wilk Hypothèses statistiques H 0 : X suit une loi normale H1 : X ne suit pas une loi normale Statistique du test coefficient de détermination entre la série des quantiles générés à partir de la loi normale et les quantiles empiriques obtenus à partir des données Test particulièrement puissant pour les petits effectifs (n < 50) Très utilisé dans les logiciels de statistique Commande R : shapiro.test

42 42 / 58 Tests spécifiques de normalité Test de Lilliefors Hypothèses statistiques H 0 : X suit une loi normale de paramètres inconnus (à estimer) H1 : X ne suit pas une loi normale Variante du test de Kolmogorov-Smirnov Test sensible à la différence de la distribution empirique avec la loi théorique aux alentours de la partie centrale de la distribution mais moins performant lorsque la différence porte sur les queues de distribution Test moins utilisé que le test de Shapiro-Wilk Commande R : lillie.test dans le package nortest

43 43 / 58 Autres tests non paramétriques Tests sur des variables binaires Test de McNemar Test de Cochran

44 Test de McNemar Contexte Soit une variable qualitative binaire observée sur un échantillon de n individus dans deux conditions différentes. On se demande si la condition a eu un effet c est-à-dire s il y a une différence entre les deux situations. Variables 1 variable binaire (2 modalités) : S (succès) et E (échec) 1 variable qualitative à 2 modalités : "condition 1" et "condition 2" Hypothèses H 0 : même proportion de succès sous les 2 conditions (pas d effet de la condition) H 1 : proportion de succès différente selon la condition (effet de la condition) 44 / 58

45 45 / 58 Test de McNemar Exemple de données 2 séries appariées : Condition 1 Condition 2 Individu 1 E S Individu 2 S S Individu n S E Tableau de contingence 2x2 Succès Echec (condition 1) (condition 1) Succès (condition 2) N SS N SE Echec (condition 2) N ES N EE

46 46 / 58 Test de McNemar Statistique de test Calcul de la statistique de test : χ 2 c = (N ES N SE ) 2 (N ES + N SE ) Si (N ES + N SE ) est suffisamment grand ( 25), la loi suivie est la loi "classique" du χ 2 à 1 ddl Il est possible d ajouter la correction de Yates Si (N ES + N SE ) < 25, on peut utiliser le test binomial exact Commande R Fonction mcnemar.test

47 47 / 58 Test de McNemar Remarques Le test de McNemar revient à faire un test de comparaison de 2 proportions dans le cas d échantillons appariés. Le test équivalent pour comparer 2 proportions dans le cas d échantillons indépendants est le test de Fisher ou le test du Chi-deux d homogénéité Le test équivalent dans le cas d une variable quantitative (non binaire) est le test des rangs signés de Wilcoxon

48 Test de Cochran Contexte Test de McNemar généralisé à plus de 2 conditions Variables 1 variable binaire (2 modalités) : S (succès) et E (échec) 1 variable qualitative à k modalités : "condition 1",..., "condition k" Hypothèses H 0 : même proportion de succès sous les k conditions (pas d effet de la condition) H 1 : proportion de succès différente selon la condition (effet de la condition) 48 / 58

49 49 / 58 Test de Cochran Exemple de données k séries appariées : Condition 1... Condition k Individu 1 E... S Individu 2 S... S Individu n S... E

50 50 / 58 Test de Cochran Tableau complété avec les effectifs de succès Condition 1... Condition k Nb de succès Individu 1 E... S L 1 Individu 2 S... S L Individu n S... E L n Nb de succès C 1... C k Statistique de test (k 1) Q = [ k ( k k ) ] 2 j=1 C2 j j=1 C j k n i=1 L i n i=1 L2 i

51 Test de Cochran Remarque Si n est suffisamment grand, Q suit une loi du Chi-deux à (k-1) ddl Commande R Fonction cochran.qtest du package RVAideMemoire Si le test est "significatif", la fonction réalise automatiquement toutes les comparaisons 2 à 2 possibles par le test des signes de Wilcoxon. 51 / 58

52 52 / 58 Test de Cochran Remarques Le test Q de Cochran revient à faire un test de comparaison de plus de 2 proportions dans le cas d échantillons appariés. Le test équivalent pour comparer plusieurs proportions dans le cas d échantillons indépendants est le test du Chi-deux d homogénéité Le test équivalent dans le cas d une variable quantitative (non binaire) est le test de Friedman

53 53 / 58 Autres tests non paramétriques Exemples Test de Fligner-Killeen test de comparaison de variances de plusieurs séries de données Test de Wald test d auto-corrélation Autres tests...

54 54 / 58 Reconnaissance de tests Exemple 1 Vous souhaitez tester l association entre un marqueur génétique spécifique et la maladie de Crohn. Pour ce marqueur, vous savez que la fréquence q de l allèle "a" est égale à 0.2 et que la fréquence p de l allèle "A" est égale à 0.8. Vous constituez deux échantillons : Groupe 1 : 100 individus atteints de la maladie de Crohn : 18[aa] + 26[Aa] + 56[AA] Groupe 2 : 169 individus témoins non atteints : 2[aa] + 30[Aa] + 137[AA] Dans un 1er temps, vous voulez vérifier que l équilibre de Hardy-Weinberg est bien vérifié chez les témoins, c est-à-dire que les fréquences des génotypes ne sont pas significativement différentes des fréquences suivantes : f (AA) = p 2, f (aa) = q 2 et f (Aa) = 2pq Dans un 2ème temps, vous souhaitez répondre à la question de l étude. Indiquez les tests statistiques à effectuer

55 Reconnaissance de tests Exemple 2 A la fin du 1 er semestre de licence L2, les étudiants ont passé chacun un examen de mathématiques fin novembre (examen 1) et un examen de mathématiques en janvier (examen 2). L objectif est de savoir si les proportions de réussite sont les mêmes à ces deux examens. Pour cela, les résultats de 15 étudiants ont été recensés dans le tableau suivant (R = reçu / C = collé). Numéro d étudiant Examen 1 R R C R C C C Examen 2 C R C C C R R Numéro d étudiant Examen 1 R R R C R C R R Examen 2 R C R C C R R R Indiquez le test à effectuer 55 / 58

56 Reconnaissance de tests Exemple 3 Vous souhaitez étudier l effet de l exercice physique sur la dépression. Pour cela, vous réunissez un échantillon représentatif de 60 personnes dépressives. De façon aléatoire, vous affectez chaque individu à un des 3 groupes suivant : "pas d exercice physique", "20 min de jogging par jour" et "60 min de jogging par jour". A la fin du mois, vous interrogez les 30 personnes et vous leur demandez de juger leur état dépressif sur une échelle de 5 états allant de extrêmement déprimé à pas du tout déprimé. Indiquez le test à effectuer 56 / 58

57 57 / 58 Reconnaissance de tests Exemple 4 Vous souhaitez étudier les préférences des consommateurs français à propos de 4 variétés de pommes de terre : Ratte, Charlotte, Bintje et Monalisa. Dans un 1er temps, vous recrutez un échantillon de 30 individus, représentatif de la population française. Chaque individu goûte successivement les 4 variétés et les note de A (variété préférée) à F (variété la moins appréciée). L ordre de présentation des différentes variétés est tirée au sort pour chaque individu. Indiquez le test à effectuer. Dans un 2ème temps, vous souhaitez savoir si la variété préférée est liée à l âge du consommateur. Pour cela, vous faites goûter les 4 variétés à 200 personnes selon le protocole décrit précédemment. Les consommateurs sont répartis en 4 classes d âges : < 20 ans, [20-40[, [40-60[ et 60 ans. Pour chaque personne, vous notez la variété préférée. Indiquez le test à effectuer.

58 58 / 58 Reconnaissance de tests Réponses Exercice 1 Question 1 : test du chi-deux de conformité Question 2 : test du chi-deux d homogénéité Exercice 2 : test de MacNemar Exercice 3 : test de Kruskal-Wallis Exercice 4 Question 1 : test de Friedman Question 2 : test du chi-deux d indépendance / d homogénéité

TABLE DES MATIERES. C Exercices complémentaires 42

TABLE DES MATIERES. C Exercices complémentaires 42 TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence

Plus en détail

Introduction à la statistique non paramétrique

Introduction à la statistique non paramétrique Introduction à la statistique non paramétrique Catherine MATIAS CNRS, Laboratoire Statistique & Génome, Évry http://stat.genopole.cnrs.fr/ cmatias Atelier SFDS 27/28 septembre 2012 Partie 2 : Tests non

Plus en détail

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE UE4 : Biostatistiques Chapitre 6 Test de comparaison de pourcentages χ² José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Nature des variables

Plus en détail

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes IUT HSE Probabilités et Statistiques Feuille : variables aléatoires discrètes 1 Exercices Dénombrements Exercice 1. On souhaite ranger sur une étagère 4 livres de mathématiques (distincts), 6 livres de

Plus en détail

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position Arbre de NESI distribution quelconque Signe 1 échantillon distribution symétrique non gaussienne Wilcoxon gaussienne Student position appariés 1 échantillon sur la différence avec référence=0 2 échantillons

Plus en détail

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année 2010-2011

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année 2010-2011 Master 1 Biologie et technologie du végétal Année 010-011 Statistiques Rappels de cours et travaux dirigés (Seul ce document sera autorisé en examen) auteur : Jean-Marc Labatte jean-marc.labatte@univ-angers.fr

Plus en détail

Biostatistiques : Petits effectifs

Biostatistiques : Petits effectifs Biostatistiques : Petits effectifs Master Recherche Biologie et Santé P. Devos DRCI CHRU de Lille EA2694 patrick.devos@univ-lille2.fr Plan Données Générales : Définition des statistiques Principe de l

Plus en détail

VI. Tests non paramétriques sur un échantillon

VI. Tests non paramétriques sur un échantillon VI. Tests non paramétriques sur un échantillon Le modèle n est pas un modèle paramétrique «TESTS du CHI-DEUX» : VI.1. Test d ajustement à une loi donnée VI.. Test d indépendance de deux facteurs 96 Différentes

Plus en détail

Lire ; Compter ; Tester... avec R

Lire ; Compter ; Tester... avec R Lire ; Compter ; Tester... avec R Préparation des données / Analyse univariée / Analyse bivariée Christophe Genolini 2 Table des matières 1 Rappels théoriques 5 1.1 Vocabulaire....................................

Plus en détail

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES LES STATISTIQUES INFERENTIELLES (test de Student) L inférence statistique est la partie des statistiques qui, contrairement à la statistique descriptive, ne se contente pas de décrire des observations,

Plus en détail

TESTS D HYPOTHÈSE FONDÉS SUR LE χ². http://fr.wikipedia.org/wiki/eugénisme

TESTS D HYPOTHÈSE FONDÉS SUR LE χ². http://fr.wikipedia.org/wiki/eugénisme TESTS D HYPOTHÈSE FONDÉS SUR LE χ² http://fr.wikipedia.org/wiki/eugénisme Logo du Second International Congress of Eugenics 1921. «Comme un arbre, l eugénisme tire ses constituants de nombreuses sources

Plus en détail

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences

Plus en détail

Lois de probabilité. Anita Burgun

Lois de probabilité. Anita Burgun Lois de probabilité Anita Burgun Problème posé Le problème posé en statistique: On s intéresse à une population On extrait un échantillon On se demande quelle sera la composition de l échantillon (pourcentage

Plus en détail

Estimation et tests statistiques, TD 5. Solutions

Estimation et tests statistiques, TD 5. Solutions ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études

Plus en détail

Variables Aléatoires. Chapitre 2

Variables Aléatoires. Chapitre 2 Chapitre 2 Variables Aléatoires Après avoir réalisé une expérience, on ne s intéresse bien souvent à une certaine fonction du résultat et non au résultat en lui-même. Lorsqu on regarde une portion d ADN,

Plus en détail

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Chapitre 5 UE4 : Biostatistiques Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.

Plus en détail

Relation entre deux variables : estimation de la corrélation linéaire

Relation entre deux variables : estimation de la corrélation linéaire CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence

Plus en détail

Analyse de la variance Comparaison de plusieurs moyennes

Analyse de la variance Comparaison de plusieurs moyennes Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction

Plus en détail

LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples.

LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples. LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples. Pré-requis : Probabilités : définition, calculs et probabilités conditionnelles ; Notion de variables aléatoires, et propriétés associées : espérance,

Plus en détail

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent

Plus en détail

Calcul élémentaire des probabilités

Calcul élémentaire des probabilités Myriam Maumy-Bertrand 1 et Thomas Delzant 1 1 IRMA, Université Louis Pasteur Strasbourg, France Licence 1ère Année 16-02-2006 Sommaire La loi de Poisson. Définition. Exemple. 1 La loi de Poisson. 2 3 4

Plus en détail

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction

Plus en détail

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur

Plus en détail

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats Pierre Dagnelie TABLE DES MATIÈRES 2012 Presses agronomiques de Gembloux pressesagro.gembloux@ulg.ac.be www.pressesagro.be

Plus en détail

(51) Int Cl.: H04L 29/06 (2006.01) G06F 21/55 (2013.01)

(51) Int Cl.: H04L 29/06 (2006.01) G06F 21/55 (2013.01) (19) TEPZZ 8 8 4_A_T (11) EP 2 838 241 A1 (12) DEMANDE DE BREVET EUROPEEN (43) Date de publication: 18.02.1 Bulletin 1/08 (1) Int Cl.: H04L 29/06 (06.01) G06F 21/ (13.01) (21) Numéro de dépôt: 141781.4

Plus en détail

Que faire lorsqu on considère plusieurs variables en même temps?

Que faire lorsqu on considère plusieurs variables en même temps? Chapitre 3 Que faire lorsqu on considère plusieurs variables en même temps? On va la plupart du temps se limiter à l étude de couple de variables aléatoires, on peut bien sûr étendre les notions introduites

Plus en détail

Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants)

Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants) CIVILITE-SES.doc - 1 - Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants) 1 PRÉSENTATION DU DOSSIER CIVILITE On s intéresse

Plus en détail

COMPARAISON DE LOGICIELS TESTANT L INDEPENDANCE DE VARIABLES BINAIRES

COMPARAISON DE LOGICIELS TESTANT L INDEPENDANCE DE VARIABLES BINAIRES J. sci. pharm. biol., Vol.9, n - 00, pp. 9-0 EDUCI 00 9 VALLEE POLNEAU S.* DIAINE C. COMPARAISON DE LOGICIELS TESTANT L INDEPENDANCE DE VARIABLES BINAIRES Notre étude visait à comparer les résultats obtenus

Plus en détail

«Cours Statistique et logiciel R»

«Cours Statistique et logiciel R» «Cours Statistique et logiciel R» Rémy Drouilhet (1), Adeline Leclercq-Samson (1), Frédérique Letué (1), Laurence Viry (2) (1) Laboratoire Jean Kuntzmann, Dép. Probabilites et Statistique, (2) Laboratoire

Plus en détail

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques

Plus en détail

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888 Lecture critique d article Rappels Bio statistiques Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888 Plan du cours Rappels fondamentaux Statistiques descriptives Notions de tests statistiques

Plus en détail

Introduction aux Statistiques et à l utilisation du logiciel R

Introduction aux Statistiques et à l utilisation du logiciel R Introduction aux Statistiques et à l utilisation du logiciel R Christophe Lalanne Christophe Pallier 1 Introduction 2 Comparaisons de deux moyennes 2.1 Objet de l étude On a mesuré le temps de sommeil

Plus en détail

FORMULAIRE DE STATISTIQUES

FORMULAIRE DE STATISTIQUES FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)

Plus en détail

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

Excel Avancé. Plan. Outils de résolution. Interactivité dans les feuilles. Outils de simulation. La valeur cible Le solveur

Excel Avancé. Plan. Outils de résolution. Interactivité dans les feuilles. Outils de simulation. La valeur cible Le solveur Excel Avancé Plan Outils de résolution La valeur cible Le solveur Interactivité dans les feuilles Fonctions de recherche (ex: RechercheV) Utilisation de la barre d outils «Formulaires» Outils de simulation

Plus en détail

Amphi 3: Espaces complets - Applications linéaires continues

Amphi 3: Espaces complets - Applications linéaires continues Amphi 3: Espaces complets - Applications linéaires continues Département de Mathématiques École polytechnique Remise en forme mathématique 2013 Suite de Cauchy Soit (X, d) un espace métrique. Une suite

Plus en détail

Probabilités sur un univers fini

Probabilités sur un univers fini [http://mp.cpgedupuydelome.fr] édité le 7 août 204 Enoncés Probabilités sur un univers fini Evènements et langage ensembliste A quelle condition sur (a, b, c, d) ]0, [ 4 existe-t-il une probabilité P sur

Plus en détail

Programmes des classes préparatoires aux Grandes Ecoles

Programmes des classes préparatoires aux Grandes Ecoles Programmes des classes préparatoires aux Grandes Ecoles Filière : scientifique Voie : Biologie, chimie, physique et sciences de la Terre (BCPST) Discipline : Mathématiques Seconde année Préambule Programme

Plus en détail

Annexe commune aux séries ES, L et S : boîtes et quantiles

Annexe commune aux séries ES, L et S : boîtes et quantiles Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans

Plus en détail

Simulation de variables aléatoires

Simulation de variables aléatoires Chapter 1 Simulation de variables aléatoires Références: [F] Fishman, A first course in Monte Carlo, chap 3. [B] Bouleau, Probabilités de l ingénieur, chap 4. [R] Rubinstein, Simulation and Monte Carlo

Plus en détail

Moments des variables aléatoires réelles

Moments des variables aléatoires réelles Chapter 6 Moments des variables aléatoires réelles Sommaire 6.1 Espérance des variables aléatoires réelles................................ 46 6.1.1 Définition et calcul........................................

Plus en détail

Capacité d un canal Second Théorème de Shannon. Théorie de l information 1/34

Capacité d un canal Second Théorème de Shannon. Théorie de l information 1/34 Capacité d un canal Second Théorème de Shannon Théorie de l information 1/34 Plan du cours 1. Canaux discrets sans mémoire, exemples ; 2. Capacité ; 3. Canaux symétriques ; 4. Codage de canal ; 5. Second

Plus en détail

4. Martingales à temps discret

4. Martingales à temps discret Martingales à temps discret 25 4. Martingales à temps discret 4.1. Généralités. On fixe un espace de probabilités filtré (Ω, (F n ) n, F, IP ). On pose que F contient ses ensembles négligeables mais les

Plus en détail

SAS ENTERPRISE MINER POUR L'ACTUAIRE

SAS ENTERPRISE MINER POUR L'ACTUAIRE SAS ENTERPRISE MINER POUR L'ACTUAIRE Conférence de l Association des Actuaires I.A.R.D. 07 JUIN 2013 Sylvain Tremblay Spécialiste en formation statistique SAS Canada AGENDA Survol d Enterprise Miner de

Plus en détail

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I Roxane Duroux 1 Cadre de l étude Cette étude s inscrit dans le cadre de recherche de doses pour des essais cliniques

Plus en détail

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT Ces exercices portent sur les items 2, 3 et 5 du programme d informatique des classes préparatoires,

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

Loi binomiale Lois normales

Loi binomiale Lois normales Loi binomiale Lois normales Christophe ROSSIGNOL Année scolaire 204/205 Table des matières Rappels sur la loi binomiale 2. Loi de Bernoulli............................................ 2.2 Schéma de Bernoulli

Plus en détail

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

Principe d un test statistique

Principe d un test statistique Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre

Plus en détail

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux 4 2013-2014

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux 4 2013-2014 Tests du χ 2 Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux 4 2013-2014 A. Lourme http://alexandrelourme.free.fr Outline

Plus en détail

Introduction à la Statistique Inférentielle

Introduction à la Statistique Inférentielle UNIVERSITE MOHAMMED V-AGDAL SCIENCES FACULTE DES DEPARTEMENT DE MATHEMATIQUES SMI semestre 4 : Probabilités - Statistique Introduction à la Statistique Inférentielle Prinemps 2013 0 INTRODUCTION La statistique

Plus en détail

Probabilités. C. Charignon. I Cours 3

Probabilités. C. Charignon. I Cours 3 Probabilités C. Charignon Table des matières I Cours 3 1 Dénombrements 3 1.1 Cardinal.................................................. 3 1.1.1 Définition............................................. 3

Plus en détail

Probabilité et Statistique pour le DEA de Biosciences. Avner Bar-Hen

Probabilité et Statistique pour le DEA de Biosciences. Avner Bar-Hen Probabilité et Statistique pour le DEA de Biosciences Avner Bar-Hen Université Aix-Marseille III 2000 2001 Table des matières 1 Introduction 3 2 Introduction à l analyse statistique 5 1 Introduction.................................

Plus en détail

Chapitre 3. Les distributions à deux variables

Chapitre 3. Les distributions à deux variables Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles

Plus en détail

Probabilités III Introduction à l évaluation d options

Probabilités III Introduction à l évaluation d options Probabilités III Introduction à l évaluation d options Jacques Printems Promotion 2012 2013 1 Modèle à temps discret 2 Introduction aux modèles en temps continu Limite du modèle binomial lorsque N + Un

Plus en détail

Bases : Probabilités, Estimation et Tests.

Bases : Probabilités, Estimation et Tests. Université René Descartes LMD Sciences de la Vie et de la Santé UFR Biomédicale, M1 de Santé Publique 45 rue des Saints-Père, 75 006 Paris Spécialité Biostatistique M1 COURS de BIOSTATISTIQUE I Bases :

Plus en détail

LES GENERATEURS DE NOMBRES ALEATOIRES

LES GENERATEURS DE NOMBRES ALEATOIRES LES GENERATEURS DE NOMBRES ALEATOIRES 1 Ce travail a deux objectifs : ====================================================================== 1. Comprendre ce que font les générateurs de nombres aléatoires

Plus en détail

La nouvelle planification de l échantillonnage

La nouvelle planification de l échantillonnage La nouvelle planification de l échantillonnage Pierre-Arnaud Pendoli Division Sondages Plan de la présentation Rappel sur le Recensement de la population (RP) en continu Description de la base de sondage

Plus en détail

Cours de méthodes de scoring

Cours de méthodes de scoring UNIVERSITE DE CARTHAGE ECOLE SUPERIEURE DE STATISTIQUE ET D ANALYSE DE L INFORMATION Cours de méthodes de scoring Préparé par Hassen MATHLOUTHI Année universitaire 2013-2014 Cours de méthodes de scoring-

Plus en détail

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI 1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage

Plus en détail

Équivalence et Non-infériorité

Équivalence et Non-infériorité Équivalence et Non-infériorité Éléments d Introduction Lionel RIOU FRANÇA INSERM U669 Mars 2009 Essais cliniques de supériorité Exemple d Introduction Données tirées de Brinkhaus B et al. Arch Intern Med.

Plus en détail

Une introduction. Lionel RIOU FRANÇA. Septembre 2008

Une introduction. Lionel RIOU FRANÇA. Septembre 2008 Une introduction INSERM U669 Septembre 2008 Sommaire 1 Effets Fixes Effets Aléatoires 2 Analyse Classique Effets aléatoires Efficacité homogène Efficacité hétérogène 3 Estimation du modèle Inférence 4

Plus en détail

Feuille d exercices 2 : Espaces probabilisés

Feuille d exercices 2 : Espaces probabilisés Feuille d exercices 2 : Espaces probabilisés Cours de Licence 2 Année 07/08 1 Espaces de probabilité Exercice 1.1 (Une inégalité). Montrer que P (A B) min(p (A), P (B)) Exercice 1.2 (Alphabet). On a un

Plus en détail

Mémoire d Actuariat Tarification de la branche d assurance des accidents du travail Aymeric Souleau aymeric.souleau@axa.com 3 Septembre 2010 Plan 1 Introduction Les accidents du travail L assurance des

Plus en détail

Calculs de probabilités conditionelles

Calculs de probabilités conditionelles Calculs de probabilités conditionelles Mathématiques Générales B Université de Genève Sylvain Sardy 20 mars 2008 1. Indépendance 1 Exemple : On lance deux pièces. Soit A l évènement la première est Pile

Plus en détail

T de Student Khi-deux Corrélation

T de Student Khi-deux Corrélation Les tests d inférence statistiques permettent d estimer le risque d inférer un résultat d un échantillon à une population et de décider si on «prend le risque» (si 0.05 ou 5 %) Une différence de moyennes

Plus en détail

Un exemple de régression logistique sous

Un exemple de régression logistique sous Fiche TD avec le logiciel : tdr341 Un exemple de régression logistique sous A.B. Dufour & A. Viallefont Etude de l apparition ou non d une maladie cardiaque des coronaires 1 Présentation des données Les

Plus en détail

TSTI 2D CH X : Exemples de lois à densité 1

TSTI 2D CH X : Exemples de lois à densité 1 TSTI 2D CH X : Exemples de lois à densité I Loi uniforme sur ab ; ) Introduction Dans cette activité, on s intéresse à la modélisation du tirage au hasard d un nombre réel de l intervalle [0 ;], chacun

Plus en détail

23. Interprétation clinique des mesures de l effet traitement

23. Interprétation clinique des mesures de l effet traitement 23. Interprétation clinique des mesures de l effet traitement 23.1. Critères de jugement binaires Plusieurs mesures (indices) sont utilisables pour quantifier l effet traitement lors de l utilisation d

Plus en détail

Cours d initiation à la programmation en C++ Johann Cuenin

Cours d initiation à la programmation en C++ Johann Cuenin Cours d initiation à la programmation en C++ Johann Cuenin 11 octobre 2014 2 Table des matières 1 Introduction 5 2 Bases de la programmation en C++ 7 3 Les types composés 9 3.1 Les tableaux.............................

Plus en détail

Estimation: intervalle de fluctuation et de confiance. Mars 2012. IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

Estimation: intervalle de fluctuation et de confiance. Mars 2012. IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison Estimation: intervalle de fluctuation et de confiance Mars 2012 IREM: groupe Proba-Stat Estimation Term.1 Intervalle de fluctuation connu : probabilité p, taille de l échantillon n but : estimer une fréquence

Plus en détail

Exemples d application

Exemples d application AgroParisTech Exemples d application du modèle linéaire E Lebarbier, S Robin Table des matières 1 Introduction 4 11 Avertissement 4 12 Notations 4 2 Régression linéaire simple 7 21 Présentation 7 211 Objectif

Plus en détail

Chapitre 3 : INFERENCE

Chapitre 3 : INFERENCE Chapitre 3 : INFERENCE 3.1 L ÉCHANTILLONNAGE 3.1.1 Introduction 3.1.2 L échantillonnage aléatoire 3.1.3 Estimation ponctuelle 3.1.4 Distributions d échantillonnage 3.1.5 Intervalles de probabilité L échantillonnage

Plus en détail

Localisation des fonctions

Localisation des fonctions MODALISA 7 Localisation des fonctions Vous trouverez dans ce document la position des principales fonctions ventilées selon l organisation de Modalisa en onglets. Sommaire A. Fonctions communes à tous

Plus en détail

Représentation d une distribution

Représentation d une distribution 5 Représentation d une distribution VARIABLE DISCRÈTE : FRÉQUENCES RELATIVES DES CLASSES Si dans un graphique représentant une distribution, on place en ordonnées le rapport des effectifs n i de chaque

Plus en détail

Modèles à Événements Discrets. Réseaux de Petri Stochastiques

Modèles à Événements Discrets. Réseaux de Petri Stochastiques Modèles à Événements Discrets Réseaux de Petri Stochastiques Table des matières 1 Chaînes de Markov Définition formelle Idée générale Discrete Time Markov Chains Continuous Time Markov Chains Propriétés

Plus en détail

Chapitre 5 : Flot maximal dans un graphe

Chapitre 5 : Flot maximal dans un graphe Graphes et RO TELECOM Nancy A Chapitre 5 : Flot maximal dans un graphe J.-F. Scheid 1 Plan du chapitre I. Définitions 1 Graphe Graphe valué 3 Représentation d un graphe (matrice d incidence, matrice d

Plus en détail

TP N 57. Déploiement et renouvellement d une constellation de satellites

TP N 57. Déploiement et renouvellement d une constellation de satellites TP N 57 Déploiement et renouvellement d une constellation de satellites L objet de ce TP est d optimiser la stratégie de déploiement et de renouvellement d une constellation de satellites ainsi que les

Plus en détail

Limitations of the Playstation 3 for High Performance Cluster Computing

Limitations of the Playstation 3 for High Performance Cluster Computing Introduction Plan Limitations of the Playstation 3 for High Performance Cluster Computing July 2007 Introduction Plan Introduction Intérêts de la PS3 : rapide et puissante bon marché L utiliser pour faire

Plus en détail

Couples de variables aléatoires discrètes

Couples de variables aléatoires discrètes Couples de variables aléatoires discrètes ECE Lycée Carnot mai Dans ce dernier chapitre de probabilités de l'année, nous allons introduire l'étude de couples de variables aléatoires, c'est-à-dire l'étude

Plus en détail

1. Vocabulaire : Introduction au tableau élémentaire

1. Vocabulaire : Introduction au tableau élémentaire L1-S1 Lire et caractériser l'information géographique - Le traitement statistique univarié Statistique : le terme statistique désigne à la fois : 1) l'ensemble des données numériques concernant une catégorie

Plus en détail

STATISTIQUES. UE Modélisation pour la biologie

STATISTIQUES. UE Modélisation pour la biologie STATISTIQUES UE Modélisation pour la biologie 2011 Cadre Général n individus: 1, 2,..., n Y variable à expliquer : Y = (y 1, y 2,..., y n ), y i R Modèle: Y = Xθ + ε X matrice du plan d expériences θ paramètres

Plus en détail

Probabilités et statistique. Benjamin JOURDAIN

Probabilités et statistique. Benjamin JOURDAIN Probabilités et statistique Benjamin JOURDAIN 11 septembre 2013 2 i ii À Anne Préface Ce livre est issu du polycopié du cours de probabilités et statistique de première année de l École des Ponts ParisTech

Plus en détail

Tests statistiques et régressions logistiques sous R, avec prise en compte des plans d échantillonnage complexes

Tests statistiques et régressions logistiques sous R, avec prise en compte des plans d échantillonnage complexes , avec prise en compte des plans d échantillonnage complexes par Joseph LARMARANGE version du 29 mars 2007 Ce cours a été développé pour une formation niveau M2 et Doctorat des étudiants du laboratoire

Plus en détail

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3

Plus en détail

MODELE A CORRECTION D ERREUR ET APPLICATIONS

MODELE A CORRECTION D ERREUR ET APPLICATIONS MODELE A CORRECTION D ERREUR ET APPLICATIONS Hélène HAMISULTANE Bibliographie : Bourbonnais R. (2000), Econométrie, DUNOD. Lardic S. et Mignon V. (2002), Econométrie des Séries Temporelles Macroéconomiques

Plus en détail

LES MODELES DE SCORE

LES MODELES DE SCORE LES MODELES DE SCORE Stéphane TUFFERY CONFERENCE GENDER DIRECTIVE 31 mai 2012 31/05/2012 ActuariaCnam Conférence Gender Directive Stéphane Tufféry 1 Plan Le scoring et ses applications L élaboration d

Plus en détail

Probabilités sur un univers fini

Probabilités sur un univers fini [http://mp.cpgedupuydelome.fr] édité le 10 août 2015 Enoncés 1 Proailités sur un univers fini Evènements et langage ensemliste A quelle condition sur (a,, c, d) ]0, 1[ 4 existe-t-il une proailité P sur

Plus en détail

Enjeux mathématiques et Statistiques du Big Data

Enjeux mathématiques et Statistiques du Big Data Enjeux mathématiques et Statistiques du Big Data Mathilde Mougeot LPMA/Université Paris Diderot, mathilde.mougeot@univ-paris-diderot.fr Mathématique en Mouvements, Paris, IHP, 6 Juin 2015 M. Mougeot (Paris

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

Statistiques Descriptives à une dimension

Statistiques Descriptives à une dimension I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des

Plus en détail

Données longitudinales et modèles de survie

Données longitudinales et modèles de survie ANALYSE DU Données longitudinales et modèles de survie 5. Modèles de régression en temps discret André Berchtold Département des sciences économiques, Université de Genève Cours de Master ANALYSE DU Plan

Plus en détail

DMP1 DSFT des Interfaces DMP des LPS Annexe : complément de spécification sur l impression des documents à remettre au patient

DMP1 DSFT des Interfaces DMP des LPS Annexe : complément de spécification sur l impression des documents à remettre au patient DMP1 DSFT des Interfaces DMP des LPS Annexe : complément de spécification sur l impression des documents à remettre au patient Identification du document Référence Date de dernière mise à jour 30/06/11

Plus en détail

Le modèle de Black et Scholes

Le modèle de Black et Scholes Le modèle de Black et Scholes Alexandre Popier février 21 1 Introduction : exemple très simple de modèle financier On considère un marché avec une seule action cotée, sur une période donnée T. Dans un

Plus en détail

Chaînes de Markov au lycée

Chaînes de Markov au lycée Journées APMEP Metz Atelier P1-32 du dimanche 28 octobre 2012 Louis-Marie BONNEVAL Chaînes de Markov au lycée Andreï Markov (1856-1922) , série S Problème 1 Bonus et malus en assurance automobile Un contrat

Plus en détail

Qu est-ce qu une probabilité?

Qu est-ce qu une probabilité? Chapitre 1 Qu est-ce qu une probabilité? 1 Modéliser une expérience dont on ne peut prédire le résultat 1.1 Ensemble fondamental d une expérience aléatoire Une expérience aléatoire est une expérience dont

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA Soutenance de doctorat, sous la direction de Pr. Bilodeau, M. et Pr. Ducharme, G. Université de Montréal et Université

Plus en détail

Évaluation de la régression bornée

Évaluation de la régression bornée Thierry Foucart UMR 6086, Université de Poitiers, S P 2 M I, bd 3 téléport 2 BP 179, 86960 Futuroscope, Cedex FRANCE Résumé. le modèle linéaire est très fréquemment utilisé en statistique et particulièrement

Plus en détail