Statistiques non paramétriques Comparaison de "moyennes"

Dimension: px
Commencer à balayer dès la page:

Download "Statistiques non paramétriques Comparaison de "moyennes""

Transcription

1 1 / 47 Statistiques non paramétriques Comparaison de "moyennes" M-A Dronne

2 Introduction Rappels Contrairement aux tests paramétriques, les tests non paramétriques ne nécessitent pas l estimation des paramètres (moyenne et écart-type) des populations. Ils ne dépendent donc pas de la nature des distributions des variables étudiées. En anglais, ils sont dits "distribution-free". Contexte d utilisation Ces tests sont utilisés quand les conditions d application des tests paramétriques classiques ne sont pas vérifiées : Ecart à la normalité Hétéroscédasticité (= hétérogénéité des variances = non égalité des variances) 2 / 47

3 3 / 47 Introduction Principe général On remplace les valeurs observées par leur rang de classement. On utilise ce rang pour étudier le classement relatif de ces valeurs les unes par rapport aux autres (au lieu d examiner les valeurs elles-mêmes ou leur moyenne et écart-type). Remarques Ces tests s appliquent aussi bien à des variables continues qu à des variables discrètes. Ces tests peuvent être utilisés même en présence de valeurs extrêmes.

4 4 / 47 Introduction Caractéristiques Ils sont moins puissants que les tests paramétriques. il est plus difficile de mettre en évidence une différence significative (ex : effet d un traitement). Inversement, ils sont plus robustes. quand on met en évidence une différence significative, on a peu de risque de se tromper.

5 5 / 47 Plan du cours Tests non paramétriques Comparaison de médianes (langage courant : comparaison de moyennes) Comparaison de 2 médianes, échantillons indépendants Test de Wilcoxon / Mann-Whitney Comparaison de 2 médianes, échantillons appariés Test des rangs signés de Wilcoxon Comparaison de plus de 2 médianes, échantillons indépendants Test de Kruskal-Wallis Comparaison de plus de 2 médianes, échantillons appariés Test de Friedman Autres tests non paramétriques

6 Test de Wilcoxon / Mann-Whitney Objectif Comparaison des médianes de deux populations dans le cas d échantillons indépendants. Autres noms du test Test des (sommes des) rangs Test de Wilcoxon / test de Mann-Whitney Données Population 1 Echantillon 1 Données : x 1,..., x n1 Taille : n 1 Population 2 Echantillon 2 Données : y 1,..., y n2 Taille : n 2 6 / 47

7 7 / 47 Test de Wilcoxon / Mann-Whitney Tests paramétriques "équivalents" Selon les cas : test utilisant la loi normale ou la loi de Student. Rappels Pour comparer les moyennes de 2 populations dans le cas échantillons indépendants : Cas 1 : Si n 1 30 et n 2 30 loi normale Cas 2 : Si n 1 < 30 et/ou n 2 < 30 Si X 1 N (µ 1, σ 1 ) et X 2 N (µ 2, σ 2 ) Si σ 2 1 = σ2 2 (homoscédasticité) : test de Student Si σ 2 1 σ 2 2 (hétéroscédasticité) : test de Student avec correction de Welch Si X 1 N (µ 1, σ 1 ) et/ou X 2 N (µ 2, σ 2 ) : test de Wilcoxon / Mann-Whitney

8 Test de Wilcoxon / Mann-Whitney Exemple Problème Un essai est mené afin d étudier l effet d un nouveau traitement pour une maladie rare. Cet essai fait intervenir 10 patients : 6 d entre eux reçoivent le nouveau traitement (traitement A) et les 4 autres reçoivent le traitement précédemment utilisé (traitement B). Les durées de vie (en années) des patients après leur admission dans l étude sont ensuite recensées. Question La survie avec les traitements A et B est-elle la même chez les patients atteints de cette maladie? La médiane du temps de survie des patients avec le traitement A est-elle significativement différente de celle avec le traitement B, au risque α? 8 / 47

9 9 / 47 Test de Wilcoxon / Mann-Whitney Question statistique Variables 2 variables : X 1 et X 2 variables quantitatives (continues ou discrètes) Hypothèses statistiques H 0 : égalité des médianes des 2 populations H 0 : Me 1 = Me 2 H 1 bilatéral : non égalité des médianes des 2 populations H 1 : Me 1 Me 2 Remarque : il est aussi possible de faire un test unilatéral (droit ou gauche)

10 10 / 47 Test de Wilcoxon / Mann-Whitney Choix du test Tests préliminaires Normalité des données? Visualisation des données Test de normalité (Shapiro-Wilk) Homoscédascticité? Test de comparaison de variances (Fisher) Choix du test En l absence de normalité utilisation du test non paramétrique de Wilcoxon / Mann-Whitney

11 11 / 47 Test de Wilcoxon / Mann-Whitney Statistique de test Mann-Whitney : valeur de la statistique de test u c 1. On rassemble les valeurs des deux échantillons et on les classe par ordre croissant. 2. On affecte un rang à chacune de ces valeurs (rang 1 à (n 1 + n 2 )). 3. En cas d ex-aequo, on affecte à chaque ex-aequo un rang égal à la moyenne des rangs occupés par ces ex-aequo (ex : s il y a 2 ex-aequo en 4 ème et 5 ème position, on attribue à ces deux valeurs le rang 4,5).

12 12 / 47 Test de Wilcoxon / Mann-Whitney Statistique de test Mann-Whitney : valeur de la statistique de test u c (suite) 1. On calcule les sommes suivantes : Somme des rangs des valeurs de l échantillon 1 : r1 Somme des rangs des valeurs de l échantillon 2 : r2 2. On calcule u 1 et u 2 : u 1 = n 1 n 2 + n 1(n 1 + 1) r 1 et u 2 = n 1 n 2 + n 2(n 2 + 1) On vérifie que : u 1 + u 2 = n 1 n 2 4. On prend : u c = min(u 1, u 2 ) r 2 Lecture de la valeur seuil u s La table de Mann-Whitney donne la valeur de u sα telle que P(U u sα ) = α (sens inverse de la table de l écart-réduit) On lit u s5% pour les valeurs n 1 et n 2 et pour α = 5%.

13 13 / 47 Test de Wilcoxon / Mann-Whitney Confrontation et conclusion Décision statistique et conclusion On compare u c et u s5% : Si u c u s5% : rejet de H 0 au risque 5% il existe une différence significative entre les deux médianes au risque 5%. Si u c > u s5% : non rejet de H 0 au risque 5% il n existe pas de différence significative entre les deux médianes au risque 5%. Remarque : attention au sens des inégalités! Remarque Le test de Mann-Whitney est équivalent au test de Wilcoxon W = U + n(n+1) 2

14 14 / 47 Test de Wilcoxon / Mann-Whitney Approximation normale Remarque Si n 1 et n 2 sont assez grands (n 1 20 et n 2 20), U suit approximativement la loi normale N(µ, σ) sous H0 avec : µ = n 1n 2 2 et σ = n1 n 2 (n 1 + n 2 + 1) La variable centrée réduite correspondante est alors : ɛ = U µ σ On détermine ensuite la valeur calculée de cette statistique de test et on compare cette valeur avec la valeur seuil lue dans la table de la loi normale. 12

15 15 / 47 Test de Wilcoxon / Mann-Whitney Logiciel R Commande R > wilcox.test(valeurs, alternative= two.sided, conf.level=.95, exact=true, correct=false) Remarque sur la p-value Si exact=false, la p-value est calculée avec l approximation normale (sinon, la p-value est calculée sans approximation) Si correct=true, la p-value est calculée avec une correction de continuité (sinon, la p-value est calculée sans correction de continuité) Si rien n est précisé (paramètres par défaut), la p-value est calculée sans approximation pour des échantillons de moins de 50 valeurs sans ex-aequo et avec l approximation normale et une correction de continuité dans les autres cas

16 Test de Wilcoxon / Mann-Whitney Exemple Résultats sur R Wilcoxon rank sum test data: valeurs by facteur W = 19, p-value = alternative hypothesis: true location shift is not equal to 0 Remarque sur le W calculé le W de Wilcoxon donné ici est égal au nombre de toutes les paires (x 1i, x 2j ) pour lesquelles x 2j x 1i. Conclusion p value = 0.13 > 0.05 non rejet de H 0 au risque 5% pas de différence significative entre les médianes des espérances de vie des patients avec les médicaments A et B au risque 5% 16 / 47

17 Test des rangs signés de Wilcoxon Objectif Comparaison des médianes de deux populations dans le cas d échantillons dépendants (= séries appariées). Autres noms du test Test des rangs signés / test de Wilcoxon Test des rangs par paires Données Population 1 Echantillon 1 Données : x 1,..., x n Taille : n Population 2 Echantillon 2 Données : y 1,..., y n Taille : n 17 / 47

18 18 / 47 Test des rangs signés de Wilcoxon Test paramétrique "équivalent" Selon les cas : test utilisant la loi normale ou la loi de Student. Rappels Pour comparer les moyennes de 2 populations dans le cas de séries appariées : Cas 1 : Si n 30 : loi normale Cas 2 : Si n < 30 Si D = (X Y ) N (µ D, σ D ) : test de Student Si D = (X Y ) N (µ D, σ D ) : test des rangs signés de Wilcoxon

19 Test des rangs signés de Wilcoxon Exemple Problème Un nouveau médicament C est développé et testé préalablement sur un petit nombre de personnes (10) ayant un taux de cholestérol total trop élevé. Le taux de cholestérol total de ces 10 personnes est mesuré avant et après administration de ce médicament. Question Le médicament C a t-il un effet sur le cholestérol total des patients? La médiane du taux de cholestérol total des patients après administration du médicament C est-elle significativement différente de celle avant prise de ce médicament, au risque α? 19 / 47

20 Test des rangs signés de Wilcoxon Question statistique et tests préliminaires Variable X D = X 1 X 2 : 1 variable quantitative (continue ou discrète) Hypothèses statistiques H 0 : égalité des médianes des 2 populations H 0 : Me D = 0 H 1 bilatéral : non égalité des médianes des 2 populations H 1 : Me D 0 Remarque : il est aussi possible de faire un test unilatéral (gauche ou droit) 20 / 47

21 Test des rangs signés de Wilcoxon Choix du test Tests préliminaires Normalité des données? Visualisation des données Test de normalité (Shapiro-Wilk) Choix du test En l absence de normalité utilisation du test non paramétrique des rangs signés de Wilcoxon 21 / 47

22 Test des rangs signés de Wilcoxon Statistique de test Valeur de la statistique de test w c 1. On calcule les différences entre les valeurs appariées. 2. On compte le nombre de différences non nulles : N 3. On classe ces N différences (en valeur absolue!) par ordre croissant. 4. On affecte à chaque différence son rang dans ce classement. 5. En cas d ex-aequo, on prend un rang qui est la moyenne des rangs occupés par ces ex-aequo. 6. On calcule les sommes suivantes : Somme des rangs des différences positives : w+ Somme des rangs des différences négatives : w N(N + 1) 7. On vérifie que : w + + w = 2 8. On prend : w c = min(w +, w ) 22 / 47

23 Test des rangs signés de Wilcoxon Confrontation et conclusion Lecture de la valeur seuil w s La table de Wilcoxon donne la valeur de w sα telle que P(W w sα ) = α (même sens que table de Mann-Whitney) On lit w s5% pour la valeur N et pour α = 5%. Décision statistique et conclusion On compare w c et w s : Si w c w s5% : rejet de H 0 au risque 5% il existe une différence significative entre les deux médianes au risque 5%. Si w c > w s5% : non rejet de H 0 au risque 5% il n existe pas de différence significative entre les deux médianes au risque 5%. Remarque : attention au sens des inégalités! 23 / 47

24 24 / 47 Test des rangs signés de Wilcoxon Approximation normale Remarque Si N est assez grand (N > 25), W suit approximativement la loi normale N(µ, σ) sous H0 avec : µ = N(N + 1) 2 et σ = N(N + 1)(2N + 1) La variable centrée réduite correspondante est alors : ɛ = W µ σ On détermine ensuite la valeur calculée de cette statistique de test et on compare cette valeur avec la valeur seuil lue dans la table de la loi normale. 24

25 25 / 47 Test des rangs signé de Wilcoxon Logiciel R Commande R > wilcox.test(valeurs, alternative= two.sided, conf.level=.95, paired=true) Remarque sur la p-value Utilisation des options exact et correct de la même façon que précédemment. Le calcul de la p-value se fait donc selon un des cas suivants : Sans approximation Avec une approximation normale Avec une approximation normale et correction de continuité

26 26 / 47 Test des rangs signé de Wilcoxon Exemple Résultats sur R Wilcoxon signed rank test with continuity correction data: valeurs V = 27, p-value = alternative hypothesis: true location shift is not equal to 0 Conclusion p value = 0.23 > 0.05 non rejet de H 0 au risque 5% pas de différence significative entre les médianes des taux de cholestérol des patients avant et après administration du médicament C au risque 5%

27 27 / 47 Test des rangs signés de Wilcoxon Remarques Remarque Si on veut faire une comparaison d une moyenne à une moyenne de référence dans un cas non paramétrique (petit échantillon et/ou absence de normalité des données), on utilise également le test des rangs signés de Wilcoxon (voire le test des signes de Wilcoxon)

28 28 / 47 Test de Kruskal-Wallis Objectif Comparaison des médianes de k populations dans le cas d échantillons indépendants (avec k > 2). Exemple Comparaison des médianes de 3 populations (k = 3). Données Population 1 Echantillon 1 x 1,..., x n1 Taille : n 1 Population 2 Echantillon 2 y 1,..., y n2 Taille : n 2 Population 3 Echantillon 3 z 1,..., z n3 Taille : n 3

29 29 / 47 Test de Kruskal-Wallis Test paramétrique "équivalent" ANOVA (Analysis of Variance) à 1 facteur. Conditions d application du test Normalité Homoscédasticité Indépendance des distributions Loi utilisée : loi de Fisher Snédécor (F)

30 Test de Kruskal-Wallis Exemple Problème Dans un laboratoire, 3 équipes travaillent sur le dosage plasmatique d une protéine chez le rongeur en utilisant 3 méthodes différentes (T 1, T 2 et T 3 ). Ces équipes mesurent les concentrations de cette protéine sur 6 rongeurs, 5 rongeurs et 6 rongeurs respectivement. Question Le dosage de la protéine est-il le même avec les 3 méthodes T 1, T 2 et T 3? La médiane de la concentration de protéine est-elle significativement différente selon la méthode utilisée (T 1, T 2 et T 3 ), au risque α? 30 / 47

31 31 / 47 Test de Kruskal-Wallis Question statistique Variables 3 variables : X 1, X 2 et X 3 variables quantitatives (continues ou discrètes) Hypothèses statistiques H 0 : égalité des médianes des populations : Me 1 = Me 2 = Me 3 H 1 (toujours bilatéral) : non égalité d au moins 2 médianes des populations : (i, j) tq Me i Me j

32 32 / 47 Test de Kruskal-Wallis Tests préliminaires et statistique de test Tests préliminaires Normalité des données? Visualisation des données Test de normalité (Shapiro-Wilk) Homoscédascticité? Test de comparaison de variances (Bartlett ou Levene) Valeur de la statistique de test h c 1. On rassemble les valeurs des trois échantillons et on classe ces valeurs par ordre croissant. 2. On affecte un rang à chaque valeur (rang 1 à (n 1 + n 2 + n 3 )). 3. En cas d ex-aequo, on prend un rang qui est la moyenne des rangs occupés par ces ex-aequo.

33 33 / 47 Test de Kruskal-Wallis Statistique de test Valeur de la statistique de test h c (suite) 1. On calcule les sommes suivantes : Somme des rangs des valeurs de l échantillon 1 : r1 Somme des rangs des valeurs de l échantillon 2 : r 2 Somme des rangs des valeurs de l échantillon 3 : r 3 2. On calcule h c : ( ) 12 k r 2 h c = n(n + 1) j 3 (n + 1) n j avec n = n 1 + n 2 + n 3 j=1 Lecture de la valeur seuil h s La table de Kruskal-Wallis donne la valeur de h sα telle que P(H h sα ) = α Pour les valeurs n 1, n 2 et n 3 et pour α = 5%, on lit h s5%

34 34 / 47 Test de Kruskal-Wallis Confrontation et conclusion Décision statistique et conclusion On compare h c et h s : Si h c h s5% : non rejet de H 0 au risque 5% il n existe pas de différence significative entre les médianes au risque 5%. Si h c > h s5% : rejet de H 0 au risque 5% il existe une différence significative entre les médianes au risque 5%. Remarque Lorsque les effectifs (n 1, n 2,..., n k ) sont tous 5, on peut utiliser le test du Chi-deux à (k 1) ddl (k étant le nombre de groupes)

35 Test de Kruskal-Wallis Logiciel R et exemple Commande R > kruskal.test(valeurs) Résultats sur R Kruskal-Wallis rank sum test data: valeurs by facteur Kruskal-Wallis chi-squared = , df = 2, p-value = Conclusion p value = 0.19 > 0.05 non rejet de H 0 au risque 5% pas de différence significative entre les médianes des concentrations de protéine avec les 3 méthodes T 1, T 2 et T 3 au risque 5% pas d effet significatif de la méthode de dosage sur la concentration en protéine au risque 5% 35 / 47

36 36 / 47 Test de Kruskal-Wallis Remarque Comparaisons 2 à 2 Si le test est significatif (p c < 0.05) : Conclusion : au moins 2 médianes sont significativement différentes Tests supplémentaires : tests spécifiques de comparaison de médianes 2 à 2

37 Test de Friedman Objectif Comparaison des médianes de k populations dans le cas d échantillons appariés (avec k > 2). Exemple Comparaison des médianes de 3 populations (k = 3). Données Population 1 Echantillon 1 x 1,..., x n1 Taille : n Population 2 Echantillon 2 y 1,..., y n2 Taille : n Population 3 Echantillon 3 z 1,..., z n3 Taille : n 37 / 47

38 38 / 47 Test de Friedman Test paramétrique "équivalent" ANOVA (Analysis of Variance) à 2 facteurs. Conditions d application du test Normalité Homoscédasticité Indépendance des distributions Loi utilisée : loi de Fisher Snédécor (F)

39 Test de Friedman Exemple Problème Afin d étudier l effet de la dose d un médicament sur la concentration plasmatique en un métabolite particulier P, on administre à 7 patients 3 doses différentes (D 1, D 2 et D 3 ) de ce médicament sur 3 jours de la semaine et on mesure la concentration de P après chacune administration. Question La concentration en métabolite P est-elle différente selon la dose administrée? La médiane de la concentration de P est-elle significativement différente selon la dose administrée (D 1, D 2 et D 3 ), au risque α? 39 / 47

40 40 / 47 Test de Friedman Question statistique Variables 3 variables : X 1, X 2 et X 3 Variables quantitatives (continues ou discrètes) Hypothèses statistiques H 0 : égalité des médianes des populations : Me 1 = Me 2 = Me 3 les 3 échantillons viennent de la même population H 1 (toujours bilatéral) : non égalité d au moins 2 médianes des populations (i, j) tq Me i Me j les 3 échantillons ne viennent pas de la même population

41 41 / 47 Test de Friedman Tests préliminaires et statistique de test Test préliminaire : normalité des données? Visualisation des données Test de normalité (Shapiro-Wilk) Valeur de la statistique de test Q c 1. On met en colonne les k groupes (ou catégories) à comparer et en ligne les n individus (ou blocs d individus). 2. On affecte un rang aux valeurs dans chaque ligne (rang 1 à k). 3. En cas d ex-aequo, on prend un rang qui est la moyenne des rangs occupés par ces ex-aequo. 4. On calcule la somme des rangs de chaque colonne (R j pour j 1,..., k)

42 Test de Friedman Statistique de test Valeur de la statistique de test Q c (suite) 1. En l absence d ex-aequo : Q c = 12 nk(k + 1) k j=1 ( ) Rj 2 3n(k + 1) n : nombre de lignes k : nombre de colonnes (groupes à comparer) 2. En présence d ex-aequo (pas au programme) : Qc = 1 Q c (d 3 ij d ij ) nk(k 2 1) Lecture de la valeur seuil Q s La table de Friedman donne la valeur de Q sα telle que P(Q Q sα ) = α Pour les valeurs k et n et pour α = 5%, on lit Q s5% 42 / 47

43 43 / 47 Test de Friedman Confrontation et conclusion Décision statistique et conclusion On compare Q c et Q s : Si Q c Q s5% : non rejet de H 0 au risque 5% il n existe pas de différence significative entre les médianes au risque 5%. Si Q c > Q s5% : rejet de H 0 au risque 5% il existe une différence significative entre les médianes au risque 5%. Remarque Lorsque k et n sont assez grands (k > 4 et n > 15), on peut utiliser le test du Chi-deux à (k 1) ddl (k : nombre de groupes)

44 Test de Friedman Logiciel R et exemple Commande R > friedman.test(valeurs) Résultats sur R Friedman rank sum test data: valeurs Friedman chi-squared = 8, df = 2, p-value = Conclusion p value = < 0.05 rejet de H 0 au risque 5% différence significative entre au moins deux médianes de concentrations en métabolites selon la dose administrée au risque 5% effet significatif de la dose sur la concentration en métabolite au risque 5%. 44 / 47

45 45 / 47 Test de Friedman Remarque Comparaisons 2 à 2 Si le test est significatif (p c < 0.05) : Conclusion : au moins 2 médianes sont significativement différentes Tests supplémentaires : tests spécifiques de comparaison de médianes 2 à 2

46 46 / 47 Plan du cours Tests non paramétriques Comparaison de médianes (langage courant : comparaison de moyennes) Comparaison de 2 médianes, échantillons indépendants Test de Wilcoxon / Mann-Whitney Comparaison de 2 médianes, échantillons appariés Test des rangs signés de Wilcoxon Comparaison de plus de 2 médianes, échantillons indépendants Test de Kruskal-Wallis Comparaison de plus de 2 médianes, échantillons appariés Test de Friedman Autres tests non paramétriques

47 47 / 47 Autres tests non paramétriques Exemples Tests du χ 2 Comparaison d une distribution à une distribution de référence Comparaison de 2 distributions ou de 2 proportions Etude de l indépendance de deux variables Test de corrélation (des rangs) de Spearman étude de la corrélation entre deux variables (quantitatives) Test de Kolmogorov-Smirnov, test de Lilliefors,... Etude de la normalité Test de Fligner-Kileen,... Comparaison de variances

TABLE DES MATIERES. C Exercices complémentaires 42

TABLE DES MATIERES. C Exercices complémentaires 42 TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence

Plus en détail

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES LES STATISTIQUES INFERENTIELLES (test de Student) L inférence statistique est la partie des statistiques qui, contrairement à la statistique descriptive, ne se contente pas de décrire des observations,

Plus en détail

Introduction à la statistique non paramétrique

Introduction à la statistique non paramétrique Introduction à la statistique non paramétrique Catherine MATIAS CNRS, Laboratoire Statistique & Génome, Évry http://stat.genopole.cnrs.fr/ cmatias Atelier SFDS 27/28 septembre 2012 Partie 2 : Tests non

Plus en détail

Lire ; Compter ; Tester... avec R

Lire ; Compter ; Tester... avec R Lire ; Compter ; Tester... avec R Préparation des données / Analyse univariée / Analyse bivariée Christophe Genolini 2 Table des matières 1 Rappels théoriques 5 1.1 Vocabulaire....................................

Plus en détail

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position Arbre de NESI distribution quelconque Signe 1 échantillon distribution symétrique non gaussienne Wilcoxon gaussienne Student position appariés 1 échantillon sur la différence avec référence=0 2 échantillons

Plus en détail

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Chapitre 5 UE4 : Biostatistiques Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.

Plus en détail

Analyse de la variance Comparaison de plusieurs moyennes

Analyse de la variance Comparaison de plusieurs moyennes Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction

Plus en détail

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences

Plus en détail

Biostatistiques : Petits effectifs

Biostatistiques : Petits effectifs Biostatistiques : Petits effectifs Master Recherche Biologie et Santé P. Devos DRCI CHRU de Lille EA2694 patrick.devos@univ-lille2.fr Plan Données Générales : Définition des statistiques Principe de l

Plus en détail

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année 2010-2011

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année 2010-2011 Master 1 Biologie et technologie du végétal Année 010-011 Statistiques Rappels de cours et travaux dirigés (Seul ce document sera autorisé en examen) auteur : Jean-Marc Labatte jean-marc.labatte@univ-angers.fr

Plus en détail

Introduction aux Statistiques et à l utilisation du logiciel R

Introduction aux Statistiques et à l utilisation du logiciel R Introduction aux Statistiques et à l utilisation du logiciel R Christophe Lalanne Christophe Pallier 1 Introduction 2 Comparaisons de deux moyennes 2.1 Objet de l étude On a mesuré le temps de sommeil

Plus en détail

Relation entre deux variables : estimation de la corrélation linéaire

Relation entre deux variables : estimation de la corrélation linéaire CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence

Plus en détail

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888 Lecture critique d article Rappels Bio statistiques Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888 Plan du cours Rappels fondamentaux Statistiques descriptives Notions de tests statistiques

Plus en détail

Principe d un test statistique

Principe d un test statistique Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre

Plus en détail

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

Nouveau Barème W.B.F. de points de victoire 4 à 48 donnes

Nouveau Barème W.B.F. de points de victoire 4 à 48 donnes Nouveau Barème W.B.F. de points de victoire 4 à 48 donnes Pages 4 à 48 barèmes 4 à 48 donnes Condensé en une page: Page 2 barèmes 4 à 32 ( nombre pair de donnes ) Page 3 Tous les autres barèmes ( PV de

Plus en détail

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction

Plus en détail

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE UE4 : Biostatistiques Chapitre 6 Test de comparaison de pourcentages χ² José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Nature des variables

Plus en détail

Estimation et tests statistiques, TD 5. Solutions

Estimation et tests statistiques, TD 5. Solutions ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études

Plus en détail

Bases : Probabilités, Estimation et Tests.

Bases : Probabilités, Estimation et Tests. Université René Descartes LMD Sciences de la Vie et de la Santé UFR Biomédicale, M1 de Santé Publique 45 rue des Saints-Père, 75 006 Paris Spécialité Biostatistique M1 COURS de BIOSTATISTIQUE I Bases :

Plus en détail

Cours 9 : Plans à plusieurs facteurs

Cours 9 : Plans à plusieurs facteurs Cours 9 : Plans à plusieurs facteurs Table des matières Section 1. Diviser pour regner, rassembler pour saisir... 3 Section 2. Définitions et notations... 3 2.1. Définitions... 3 2.2. Notations... 4 Section

Plus en détail

Probabilité et Statistique pour le DEA de Biosciences. Avner Bar-Hen

Probabilité et Statistique pour le DEA de Biosciences. Avner Bar-Hen Probabilité et Statistique pour le DEA de Biosciences Avner Bar-Hen Université Aix-Marseille III 2000 2001 Table des matières 1 Introduction 3 2 Introduction à l analyse statistique 5 1 Introduction.................................

Plus en détail

Statistiques Descriptives à une dimension

Statistiques Descriptives à une dimension I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des

Plus en détail

Localisation des fonctions

Localisation des fonctions MODALISA 7 Localisation des fonctions Vous trouverez dans ce document la position des principales fonctions ventilées selon l organisation de Modalisa en onglets. Sommaire A. Fonctions communes à tous

Plus en détail

Cours de Tests paramétriques

Cours de Tests paramétriques Cours de Tests paramétriques F. Muri-Majoube et P. Cénac 2006-2007 Licence Ce document est sous licence ALC TYPE 2. Le texte de cette licence est également consultable en ligne à l adresse http://www.librecours.org/cgi-bin/main?callback=licencetype2.

Plus en détail

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3

Plus en détail

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent

Plus en détail

Étude des flux d individus et des modalités de recrutement chez Formica rufa

Étude des flux d individus et des modalités de recrutement chez Formica rufa Étude des flux d individus et des modalités de recrutement chez Formica rufa Bruno Labelle Théophile Olivier Karl Lesiourd Charles Thevenin 07 Avril 2012 1 Sommaire Remerciements I) Introduction p3 Intérêt

Plus en détail

Didacticiel - Études de cas. Description de quelques fonctions du logiciel PSPP, comparaison des résultats avec ceux de Tanagra, R et OpenStat.

Didacticiel - Études de cas. Description de quelques fonctions du logiciel PSPP, comparaison des résultats avec ceux de Tanagra, R et OpenStat. 1 Objectif Description de quelques fonctions du logiciel PSPP, comparaison des résultats avec ceux de Tanagra, R et OpenStat. Tout le monde l aura compris, je passe énormément de temps à analyser les logiciels

Plus en détail

VI. Tests non paramétriques sur un échantillon

VI. Tests non paramétriques sur un échantillon VI. Tests non paramétriques sur un échantillon Le modèle n est pas un modèle paramétrique «TESTS du CHI-DEUX» : VI.1. Test d ajustement à une loi donnée VI.. Test d indépendance de deux facteurs 96 Différentes

Plus en détail

Unity Real Time 2.0 Service Pack 2 update

Unity Real Time 2.0 Service Pack 2 update Unity Real Time 2.0 Service Pack 2 update Configuration des Objectifs Analytiques La nouvelle version permet, en un écran, de configurer un lot, un panel ou un instrument. Le menu est accessible au moyen

Plus en détail

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION Bruno Saussereau Laboratoire de Mathématiques de Besançon Université de Franche-Comté Travail en commun

Plus en détail

Un exemple de régression logistique sous

Un exemple de régression logistique sous Fiche TD avec le logiciel : tdr341 Un exemple de régression logistique sous A.B. Dufour & A. Viallefont Etude de l apparition ou non d une maladie cardiaque des coronaires 1 Présentation des données Les

Plus en détail

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur

Plus en détail

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

La survie nette actuelle à long terme Qualités de sept méthodes d estimation La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg

Plus en détail

Package TestsFaciles

Package TestsFaciles Package TestsFaciles March 26, 2007 Type Package Title Facilite le calcul d intervalles de confiance et de tests de comparaison avec prise en compte du plan d échantillonnage. Version 1.0 Date 2007-03-26

Plus en détail

Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9

Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9 Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9 L analyse de variance à un facteur permet de vérifier, moyennant certaines hypothèses, si un facteur (un critère de classification,

Plus en détail

Statistique : Résumé de cours et méthodes

Statistique : Résumé de cours et méthodes Statistique : Résumé de cours et méthodes 1 Vocabulaire : Population : c est l ensemble étudié. Individu : c est un élément de la population. Effectif total : c est le nombre total d individus. Caractère

Plus en détail

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence

Plus en détail

1 Définition de la non stationnarité

1 Définition de la non stationnarité Chapitre 2: La non stationnarité -Testsdedétection Quelques notes de cours (non exhaustives) 1 Définition de la non stationnarité La plupart des séries économiques sont non stationnaires, c est-à-direqueleprocessusquiles

Plus en détail

Séries Statistiques Simples

Séries Statistiques Simples 1. Collecte et Représentation de l Information 1.1 Définitions 1.2 Tableaux statistiques 1.3 Graphiques 2. Séries statistiques simples 2.1 Moyenne arithmétique 2.2 Mode & Classe modale 2.3 Effectifs &

Plus en détail

Une introduction. Lionel RIOU FRANÇA. Septembre 2008

Une introduction. Lionel RIOU FRANÇA. Septembre 2008 Une introduction INSERM U669 Septembre 2008 Sommaire 1 Effets Fixes Effets Aléatoires 2 Analyse Classique Effets aléatoires Efficacité homogène Efficacité hétérogène 3 Estimation du modèle Inférence 4

Plus en détail

TESTS D HYPOTHÈSE FONDÉS SUR LE χ². http://fr.wikipedia.org/wiki/eugénisme

TESTS D HYPOTHÈSE FONDÉS SUR LE χ². http://fr.wikipedia.org/wiki/eugénisme TESTS D HYPOTHÈSE FONDÉS SUR LE χ² http://fr.wikipedia.org/wiki/eugénisme Logo du Second International Congress of Eugenics 1921. «Comme un arbre, l eugénisme tire ses constituants de nombreuses sources

Plus en détail

MODELE A CORRECTION D ERREUR ET APPLICATIONS

MODELE A CORRECTION D ERREUR ET APPLICATIONS MODELE A CORRECTION D ERREUR ET APPLICATIONS Hélène HAMISULTANE Bibliographie : Bourbonnais R. (2000), Econométrie, DUNOD. Lardic S. et Mignon V. (2002), Econométrie des Séries Temporelles Macroéconomiques

Plus en détail

Chapitre 3. Les distributions à deux variables

Chapitre 3. Les distributions à deux variables Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles

Plus en détail

Exemples d application

Exemples d application AgroParisTech Exemples d application du modèle linéaire E Lebarbier, S Robin Table des matières 1 Introduction 4 11 Avertissement 4 12 Notations 4 2 Régression linéaire simple 7 21 Présentation 7 211 Objectif

Plus en détail

LES MODELES DE SCORE

LES MODELES DE SCORE LES MODELES DE SCORE Stéphane TUFFERY CONFERENCE GENDER DIRECTIVE 31 mai 2012 31/05/2012 ActuariaCnam Conférence Gender Directive Stéphane Tufféry 1 Plan Le scoring et ses applications L élaboration d

Plus en détail

Données longitudinales et modèles de survie

Données longitudinales et modèles de survie ANALYSE DU Données longitudinales et modèles de survie 5. Modèles de régression en temps discret André Berchtold Département des sciences économiques, Université de Genève Cours de Master ANALYSE DU Plan

Plus en détail

Evaluation générale de la qualité des données par âge et sexe

Evaluation générale de la qualité des données par âge et sexe Analyse démographique pour la prise des décisions. Tendances, et inégalités de mortalité et de fécondité en Afrique francophone : les outils en ligne de l UNFPA / UIESP pour l'estimation démographique.

Plus en détail

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes IUT HSE Probabilités et Statistiques Feuille : variables aléatoires discrètes 1 Exercices Dénombrements Exercice 1. On souhaite ranger sur une étagère 4 livres de mathématiques (distincts), 6 livres de

Plus en détail

Modèles pour données répétées

Modèles pour données répétées Résumé Les données répétées, ou données longitudinales, constituent un domaine à la fois important et assez particulier de la statistique. On entend par données répétées des données telles que, pour chaque

Plus en détail

Langage SQL : créer et interroger une base

Langage SQL : créer et interroger une base Langage SQL : créer et interroger une base Dans ce chapitre, nous revenons sur les principales requêtes de création de table et d accès aux données. Nous verrons aussi quelques fonctions d agrégation (MAX,

Plus en détail

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux 4 2013-2014

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux 4 2013-2014 Tests du χ 2 Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux 4 2013-2014 A. Lourme http://alexandrelourme.free.fr Outline

Plus en détail

DMP1 DSFT des Interfaces DMP des LPS Annexe : complément de spécification sur l impression des documents à remettre au patient

DMP1 DSFT des Interfaces DMP des LPS Annexe : complément de spécification sur l impression des documents à remettre au patient DMP1 DSFT des Interfaces DMP des LPS Annexe : complément de spécification sur l impression des documents à remettre au patient Identification du document Référence Date de dernière mise à jour 30/06/11

Plus en détail

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques

Plus en détail

1/24. I passer d un problème exprimé en français à la réalisation d un. I expressions arithmétiques. I structures de contrôle (tests, boucles)

1/24. I passer d un problème exprimé en français à la réalisation d un. I expressions arithmétiques. I structures de contrôle (tests, boucles) 1/4 Objectif de ce cours /4 Objectifs de ce cours Introduction au langage C - Cours Girardot/Roelens Septembre 013 Du problème au programme I passer d un problème exprimé en français à la réalisation d

Plus en détail

T de Student Khi-deux Corrélation

T de Student Khi-deux Corrélation Les tests d inférence statistiques permettent d estimer le risque d inférer un résultat d un échantillon à une population et de décider si on «prend le risque» (si 0.05 ou 5 %) Une différence de moyennes

Plus en détail

FORMULAIRE DE STATISTIQUES

FORMULAIRE DE STATISTIQUES FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)

Plus en détail

Essai Inter-groupe : FFCD UNICANCER FRENCH - GERCOR

Essai Inter-groupe : FFCD UNICANCER FRENCH - GERCOR CLIMAT - PRODIGE 30 Etude de phase III randomisée évaluant l Intérêt de la colectomie première chez les patients porteurs d un cancer colique asymptomatique avec métastases hépatiques synchrones non résécables

Plus en détail

23. Interprétation clinique des mesures de l effet traitement

23. Interprétation clinique des mesures de l effet traitement 23. Interprétation clinique des mesures de l effet traitement 23.1. Critères de jugement binaires Plusieurs mesures (indices) sont utilisables pour quantifier l effet traitement lors de l utilisation d

Plus en détail

Leçon N 4 : Statistiques à deux variables

Leçon N 4 : Statistiques à deux variables Leçon N 4 : Statistiques à deux variables En premier lieu, il te faut relire les cours de première sur les statistiques à une variable, il y a tout un langage à se remémorer : étude d un échantillon d

Plus en détail

L'évaluation par les pairs dans un MOOC. Quelle fiabilité et quelle légitimité? Rémi Bachelet Ecole Centrale de Lille 24 novembre 2014, Université

L'évaluation par les pairs dans un MOOC. Quelle fiabilité et quelle légitimité? Rémi Bachelet Ecole Centrale de Lille 24 novembre 2014, Université L'évaluation par les pairs dans un MOOC. Quelle fiabilité et quelle légitimité? Rémi Bachelet Ecole Centrale de Lille 24 novembre 2014, Université Paris-Est séminaire annuel IDEA Les diapos seront tweetées

Plus en détail

Exo7. Calculs de déterminants. Fiche corrigée par Arnaud Bodin. Exercice 1 Calculer les déterminants des matrices suivantes : Exercice 2.

Exo7. Calculs de déterminants. Fiche corrigée par Arnaud Bodin. Exercice 1 Calculer les déterminants des matrices suivantes : Exercice 2. Eo7 Calculs de déterminants Fiche corrigée par Arnaud Bodin Eercice Calculer les déterminants des matrices suivantes : Correction Vidéo ( ) 0 6 7 3 4 5 8 4 5 6 0 3 4 5 5 6 7 0 3 5 4 3 0 3 0 0 3 0 0 0 3

Plus en détail

Corrélation entre deux classements. ρ Le coefficient de rang de Spearman

Corrélation entre deux classements. ρ Le coefficient de rang de Spearman Corrélation entre deux classements Cas: échelle ordinale On peut utilisé le Rhô ρ Le coefficient de rang de Spearman Cours réalisé par Benjamin Putois Novembre 2008 bputois@gmail.com Indice statistique

Plus en détail

Introduction à la Statistique Inférentielle

Introduction à la Statistique Inférentielle UNIVERSITE MOHAMMED V-AGDAL SCIENCES FACULTE DES DEPARTEMENT DE MATHEMATIQUES SMI semestre 4 : Probabilités - Statistique Introduction à la Statistique Inférentielle Prinemps 2013 0 INTRODUCTION La statistique

Plus en détail

2010 Minitab, Inc. Tous droits réservés. Version 16.1.0 Minitab, le logo Minitab, Quality Companion by Minitab et Quality Trainer by Minitab sont des

2010 Minitab, Inc. Tous droits réservés. Version 16.1.0 Minitab, le logo Minitab, Quality Companion by Minitab et Quality Trainer by Minitab sont des 2010 Minitab, Inc. Tous droits réservés. Version 16.1.0 Minitab, le logo Minitab, Quality Companion by Minitab et Quality Trainer by Minitab sont des marques déposées de Minitab, Inc. aux Etats-Unis et

Plus en détail

quelques Repères pour Doctorants

quelques Repères pour Doctorants Gilles HUNAULT 2005 quelques Repères en STATISTIQUES pour Doctorants Université d Angers c gilles.hunault@univ-angers.fr http ://www.info.univ-angers.fr/pub/gh/ 3 Le principe consistant à ne pouvoir affirmer

Plus en détail

Tests statistiques et régressions logistiques sous R, avec prise en compte des plans d échantillonnage complexes

Tests statistiques et régressions logistiques sous R, avec prise en compte des plans d échantillonnage complexes , avec prise en compte des plans d échantillonnage complexes par Joseph LARMARANGE version du 29 mars 2007 Ce cours a été développé pour une formation niveau M2 et Doctorat des étudiants du laboratoire

Plus en détail

COMPARAISON DE LOGICIELS TESTANT L INDEPENDANCE DE VARIABLES BINAIRES

COMPARAISON DE LOGICIELS TESTANT L INDEPENDANCE DE VARIABLES BINAIRES J. sci. pharm. biol., Vol.9, n - 00, pp. 9-0 EDUCI 00 9 VALLEE POLNEAU S.* DIAINE C. COMPARAISON DE LOGICIELS TESTANT L INDEPENDANCE DE VARIABLES BINAIRES Notre étude visait à comparer les résultats obtenus

Plus en détail

La nouvelle planification de l échantillonnage

La nouvelle planification de l échantillonnage La nouvelle planification de l échantillonnage Pierre-Arnaud Pendoli Division Sondages Plan de la présentation Rappel sur le Recensement de la population (RP) en continu Description de la base de sondage

Plus en détail

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI 1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage

Plus en détail

Encryptions, compression et partitionnement des données

Encryptions, compression et partitionnement des données Encryptions, compression et partitionnement des données Version 1.0 Grégory CASANOVA 2 Compression, encryption et partitionnement des données Sommaire 1 Introduction... 3 2 Encryption transparente des

Plus en détail

Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015 Exercices M1 SES 214-215 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 215 Les exemples numériques présentés dans ce document d exercices ont été traités sur le logiciel R, téléchargeable par

Plus en détail

Document d orientation sur les allégations issues d essais de non-infériorité

Document d orientation sur les allégations issues d essais de non-infériorité Document d orientation sur les allégations issues d essais de non-infériorité Février 2013 1 Liste de contrôle des essais de non-infériorité N o Liste de contrôle (les clients peuvent se servir de cette

Plus en détail

Université du Québec à Chicoutimi. Département d informatique et de mathématique. Plan de cours. Titre : Élément de programmation.

Université du Québec à Chicoutimi. Département d informatique et de mathématique. Plan de cours. Titre : Élément de programmation. Université du Québec à Chicoutimi Département d informatique et de mathématique Plan de cours Titre : Élément de programmation Sigle : 8inf 119 Session : Automne 2001 Professeur : Patrice Guérin Local

Plus en détail

3. Caractéristiques et fonctions d une v.a.

3. Caractéristiques et fonctions d une v.a. 3. Caractéristiques et fonctions d une v.a. MTH2302D S. Le Digabel, École Polytechnique de Montréal H2015 (v2) MTH2302D: fonctions d une v.a. 1/32 Plan 1. Caractéristiques d une distribution 2. Fonctions

Plus en détail

Algorithmique et Programmation, IMA

Algorithmique et Programmation, IMA Algorithmique et Programmation, IMA Cours 2 : C Premier Niveau / Algorithmique Université Lille 1 - Polytech Lille Notations, identificateurs Variables et Types de base Expressions Constantes Instructions

Plus en détail

Exemple PLS avec SAS

Exemple PLS avec SAS Exemple PLS avec SAS This example, from Umetrics (1995), demonstrates different ways to examine a PLS model. The data come from the field of drug discovery. New drugs are developed from chemicals that

Plus en détail

Comparaison de populations

Comparaison de populations Ricco Rakotomalala Comparaison de populations Tests paramétriques Version 1.2 Université Lumière Lyon 2 Page: 1 job: Comp_Pop_Tests_Parametriques macro: svmono.cls date/time: 11-Jun-2013/6:32 Page: 2 job:

Plus en détail

Table des matières. I Mise à niveau 11. Préface

Table des matières. I Mise à niveau 11. Préface Table des matières Préface v I Mise à niveau 11 1 Bases du calcul commercial 13 1.1 Alphabet grec...................................... 13 1.2 Symboles mathématiques............................... 14 1.3

Plus en détail

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Recherche opérationnelle Les démonstrations et les exemples seront traités en cours Souad EL Bernoussi Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Table des matières 1 Programmation

Plus en détail

GUIDE PRATIQUE DE L INDEXEUR : LES PRINCIPES DE L INDEXATION COLLABORATIVE

GUIDE PRATIQUE DE L INDEXEUR : LES PRINCIPES DE L INDEXATION COLLABORATIVE GUIDE PRATIQUE DE L INDEXEUR : LES PRINCIPES DE L INDEXATION COLLABORATIVE Qu est-ce que l indexation ou annotation- collaborative? Ce procédé permet aux internautes de participer directement à l indexation

Plus en détail

Compter à Babylone. L écriture des nombres

Compter à Babylone. L écriture des nombres Compter à Babylone d après l article de Christine Proust «Le calcul sexagésimal en Mésopotamie : enseignement dans les écoles de scribes» disponible sur http://www.dma.ens.fr/culturemath/ Les mathématiciens

Plus en détail

Comment créer un nouveau compte? 1/2- Pour le consommateur

Comment créer un nouveau compte? 1/2- Pour le consommateur Comment créer un nouveau compte? 1/2- Pour le consommateur Cette procédure va vous permettre de créer un compte. Tous les logiciels Photo & Book que vous allez créer, que ce soit pour un consommateur ou

Plus en détail

Lois de probabilité. Anita Burgun

Lois de probabilité. Anita Burgun Lois de probabilité Anita Burgun Problème posé Le problème posé en statistique: On s intéresse à une population On extrait un échantillon On se demande quelle sera la composition de l échantillon (pourcentage

Plus en détail

Chapitre 5 : Flot maximal dans un graphe

Chapitre 5 : Flot maximal dans un graphe Graphes et RO TELECOM Nancy A Chapitre 5 : Flot maximal dans un graphe J.-F. Scheid 1 Plan du chapitre I. Définitions 1 Graphe Graphe valué 3 Représentation d un graphe (matrice d incidence, matrice d

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

SAS de base : gestion des données et procédures élémentaires

SAS de base : gestion des données et procédures élémentaires 1 SAS de base : gestion des données et procédures élémentaires SAS de base : gestion des données et procédures élémentaires Résumé Description des commandes (module SAS de base) les plus utiles de l étape

Plus en détail

TD d économétrie appliquée : Introduction à STATA

TD d économétrie appliquée : Introduction à STATA Ecole normale supérieure (ENS) Département d économie TD d économétrie appliquée : Introduction à STATA Marianne Tenand marianne.tenand@ens.fr OBJECTIFS DU TD Découvrir le logiciel d économétrie STATA,

Plus en détail

Probabilités sur un univers fini

Probabilités sur un univers fini [http://mp.cpgedupuydelome.fr] édité le 7 août 204 Enoncés Probabilités sur un univers fini Evènements et langage ensembliste A quelle condition sur (a, b, c, d) ]0, [ 4 existe-t-il une probabilité P sur

Plus en détail

FONCTION DE DEMANDE : REVENU ET PRIX

FONCTION DE DEMANDE : REVENU ET PRIX FONCTION DE DEMANDE : REVENU ET PRIX 1. L effet d une variation du revenu. Les lois d Engel a. Conditions du raisonnement : prix et goûts inchangés, variation du revenu (statique comparative) b. Partie

Plus en détail

Application sur le Dispositif en Blocs Complètement Randomisés

Application sur le Dispositif en Blocs Complètement Randomisés Roger Vumilia. KIZUNGU Directeur de l Expérimentation Agricole à l INERA Professeur Associé Faculté des Sciences Agronomiques Université de Kinshasa Utilisation des Logiciels de base dans la Recherche

Plus en détail

ESSEC Cours Wealth management

ESSEC Cours Wealth management ESSEC Cours Wealth management Séance 9 Gestion de patrimoine : théories économiques et études empiriques François Longin 1 www.longin.fr Plan de la séance 9 Epargne et patrimoine des ménages Analyse macroéconomique

Plus en détail

Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants)

Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants) CIVILITE-SES.doc - 1 - Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants) 1 PRÉSENTATION DU DOSSIER CIVILITE On s intéresse

Plus en détail

Techniques d interaction dans la visualisation de l information Séminaire DIVA

Techniques d interaction dans la visualisation de l information Séminaire DIVA Techniques d interaction dans la visualisation de l information Séminaire DIVA Zingg Luca, luca.zingg@unifr.ch 13 février 2007 Résumé Le but de cet article est d avoir une vision globale des techniques

Plus en détail

Un laboratoire d auto-immunité paperless : mythe ou réalité? L.Lutteri Laboratoire d auto-immunité Service de Chimie Clinique CHU Liège

Un laboratoire d auto-immunité paperless : mythe ou réalité? L.Lutteri Laboratoire d auto-immunité Service de Chimie Clinique CHU Liège Un laboratoire d auto-immunité paperless : mythe ou réalité? L.Lutteri Laboratoire d auto-immunité Service de Chimie Clinique CHU Liège Immunofluorescence Dépistage Aspect Titre Cellules Hep 2: Connectivites

Plus en détail

Équivalence et Non-infériorité

Équivalence et Non-infériorité Équivalence et Non-infériorité Éléments d Introduction Lionel RIOU FRANÇA INSERM U669 Mars 2009 Essais cliniques de supériorité Exemple d Introduction Données tirées de Brinkhaus B et al. Arch Intern Med.

Plus en détail

Modèles Estimés sur Données de Panel

Modèles Estimés sur Données de Panel Modèles Estimés sur Données de Panel Introduction Il est fréquent en économétrie qu on ait à composer avec des données à deux dimensions : - une dimension chronologique - une dimension spatiale Par exemple,

Plus en détail

Le risque Idiosyncrasique

Le risque Idiosyncrasique Le risque Idiosyncrasique -Pierre CADESTIN -Magali DRIGHES -Raphael MINATO -Mathieu SELLES 1 Introduction Risque idiosyncrasique : risque non pris en compte dans le risque de marché (indépendant des phénomènes

Plus en détail

BIOSTATISTIQUES AVANCEES PLAN. Quelques références. Master Biologie Intégrative 1 ère année

BIOSTATISTIQUES AVANCEES PLAN. Quelques références. Master Biologie Intégrative 1 ère année Master Biologie Intégrative 1 ère année 1 BIOSTATISTIQUES AVANCEES Yves Desdevises! Observatoire Océanologique de Banyuls-sur-Mer (www.obs-banyuls.fr)! 04 68 88 73 13! desdevises@obs-banyuls.fr! http://desdevises.free.fr

Plus en détail