Biostatistiques : Petits effectifs

Dimension: px
Commencer à balayer dès la page:

Download "Biostatistiques : Petits effectifs"

Transcription

1 Biostatistiques : Petits effectifs Master Recherche Biologie et Santé P. Devos DRCI CHRU de Lille EA2694

2 Plan Données Générales : Définition des statistiques Principe de l échantillonnage Principe du test statistique Tailles d échantillons Analyse descriptive / Test de Normalité. Petits échantillons : Petits / Grands échantillons. Comparaison de deux ou plusieurs échantillons. Tests non-paramétriques Mesure de l'association entre plusieurs variables.

3 La Statistique et les Biostatistiques La STATISTIQUE : discipline traitant du recueil (plans d expérience, sondages, ), du traitement et de l interprétation de données caractérisées par une grande variabilité. Partie des mathématiques appliquées, utilisant la théorie des probabilités. Beaucoup de domaines d applications Sondages : enquêtes d opinion Industrie : contrôle de qualité Marketing : scoring, profil de consommateurs Médecine : épidémiologie, recherche clinique.. Statistiques appliquées à la Médecine = BIOSTATISTIQUES Données spécifiques : variabilité inter et intra, données interprétées, Méthodes spécifiques : survie, courbes ROC, plans d expérience

4 Méthodologie statistique Employer bien sûr la "bonne" procédure statistique pendant l analyse!!! MAIS cela ne suffit pas Choisir le bon type d étude Choisir le bon plan d expérience Choisir les bons critères de jugement Définir les variables recueillies Qualité des données recueillies Avant l étude!!! Analyse statistique rigoureuse (tests, modèles, ) Bonne interprétation des résultats Fin d étude

5 L Échantillonnage

6 L inférence statistique On désire étudier une population P Principe : On tire un échantillon E de taille n issu de P On analyse les caractéristiques de E On généralise à P Attention!! E doit être un échantillon représentatif de P (même probabilité pour chaque individu de se retrouver dans E) E doit être de taille suffisamment élevée pour pouvoir extrapoler les résultats Définir très précisément la population que l on désire étudier!!

7 Les fluctuations d échantillonnage Quand on tire aléatoirement un échantillon, on a des fluctuations. Exemple : on s intéresse aux 10 premiers étudiants entrant dans l amphi. On comptabilise 7 femmes et 3 hommes. Peut-on en déduire que 70% des étudiants qui assisteront au cours sont des femmes? NON!!! On considère que dans la population totale, les proportions d hommes et de femmes sont les mêmes P(H)=P(F)=1/2 Soit X le nombre de femmes parmi les 10 étudiants. On peut montrer que X suit une loi binomiale de taille 10 et de paramètre 0.5 et calculer la probabilité d observer 0,1,2,,10 femmes P(X=k)

8 Les prendre en compte Comment prendre en compte les fluctuations d échantillonnage? 1) En vérifiant que l échantillon est représentatif (tests d adéquation par exemple) 2) En donnant la marge d erreur que l on commet en raisonnant sur un échantillon (Intervalles de confiance) 3) En maîtrisant les risques d erreurs (puissance dans le cas de comparaisons)

9 Principe du test statistique

10 Le test statistique Un travail de recherche est bâti pour répondre à une question Le test statistique est basé sur 3 principes généraux : Le test statistique sert à répondre à une question Le test statistique est un test d hypothèse : à la question on associe une hypothèse (H0) Le test statistique ne peut conclure de manière certaine : preuve expérimentale donc il faut prendre un risque (première espèce) Conclusion fondée sur un test statistique Principe du test statistique

11 Principe du test statistique Question : une pièce de monnaie est-elle pipée? Étape 1 : on cherche à prouver qu elle est pipée Étape 2 : confrontation expérimentale : on jette 50 fois la pièce. Étape 3 : test d hypothèse Si pièce non pipée : P(Face)=P(Pile)=1/2 Choix de l hypothèse à tester notée H0 : :«la pièce de monnaie n est pas pipée» Soit X : nombre de «Pile» (ou Face) Si H0 est vraie, la loi de X est connue (binomiale) P(X=k)= C p (1 p) k k N-k N

12 Principe du test statistique : Notion de risque Si H0 vraie, toutes les configurations sont possibles, y compris P(0P)=(0,5) !! P (X=k) k

13 Principe du test statistique : Notion de risque Il faut décider : on choisit un risque raisonnable = 5% On partage l ensemble des possibilités en 2 zones, selon le risque 5% : 18P 25P 32P 0P Compatible H0 = 95% 50P Très improbable sous H0 = 5% de chance =REJET DE H0 Limites de la zone compatible avec H0 se déterminent grâce au calcul des probabilités. Ici 18-32

14 Principe du test statistique : Règle de décision Zone compatible avec H0 = probabilité de 95% de se produire si H0 vraie Zone de rejet de H0 = probabilité de 5% de se produire si H0 est vraie!!! (risque) Règle de décision : on fixe a priori la règle suivante : - Si le résultat de l expérience se trouve dans la zone compatible avec H0 (exemple 22P), on ne décide rien («non significatif») - Si il se situe dans le zone «rejet de H0» on déclare H0 FAUSSE, donc on déclare H1 vraie, mais au risque 5%. - Exemple : 15P, on décide que la pièce est truquée Risque de première espèce = Probabilité de rejeter H0 à tort = 5%

15 Notion de Puissance d un test Décision Vérité H0 H1 Compatible H0 β Rejet de H0 = on décide H1 α 1-β α = Proba (décider H1 / H0 est vraie) = risque de première espèce β = Proba ( décider «compatible avec H0» / H1 est vraie) = risque de deuxième espèce Puissance = 1-β = Proba ( décider H1 / H1 est vraie) α = Risque d'affirmer qu'il y a une différence significative alors qu'elle n'existe pas réellement. β = Risque d'affirmer qu'il n'y a pas de différence significative alors qu'elle existe réellement. Puissance = Probabilité de détecter une différence si elle existe réellement

16 Notion de puissance d un test Puissance dépend de la différence mais aussi de la variabilité Puissance dépend du risque de première espèce α, mais inutile en pratique car α fixé à 5% Puissance = F(,N,DS) En pratique, on estime et DS et on déduit N

17 En pratique Dépend du plan d expérience : Nombre de groupes Indépendant / Apparié (patient propre témoin) Dépend du critère de jugement principal Numérique Binaire Survie Des 2 risques : α : risque de première espèce : généralement 5% β : risque de seconde espèce : inférieur à 20%

18 Application : Taille des échantillons Comparaison de 2 moyennes (groupes indépendants) n = 2 2( + ) = 1 α 1 β z z σ ² σ ² K ² ² Test bilatéral Test unilatéral Alpha Beta Zalpha Zbéta K Alpha Beta Zalpha Zbéta K (Formules approchées)

19 Exemple Différence attendue ( ) : 5mm de mercure Ecart-type (DS): 10 mm Risque de première espèce (α ): 5% Puissance (1-β ): 90% N 10 = 21.01* = ( par groupe ) Puissance Nombre de Patients par Groupe

20 Application : Taille des échantillons Comparaison de 2 fréquences (groupes indépendants) n P (1 P ) + P (1 P ) P (1 P ) + P (1 P ) = ( + ) = K A A B B z z 2 A A B B 1 α 1 β ( PA PB )² ( PA PB )² Test bilatéral Test unilatéral Alpha Beta Z1 Z2 K Alpha Beta Z1 Z2 K (Formules approchées)

21 Exemple P A = 0.1, P B = 0.2 Risque de première espèce (α ): 5% Puissance (1-β ): 90% N = 10.51* 25 = 263 ( par groupe ) Puissance Effectif par Groupe

22 Puissance d un test et Taille d échantillon Comparaison de deux antihypertenseurs avec : : 5mm de mercure Ecart-type (DS): 10 mm Risque de première espèce (α ): 5% 1- β = 0.9 N1=N2=86 L étude a été réalisée sans calcul de puissance préalable sur 2 groupes de 30 sujets. Puissance = 1-β = 0.48!!! Ne pas confondre : Conditions d application du test et Puissance du test

23 Traitement statistique des données

24 Méthodes Statistiques : définitions générales INDIVIDU : «Objet» sur lequel un ou plusieurs caractères peuvent être observés. POPULATION : Ensemble des individus pris en considération. VARIABLE : peut être qualitative (attribut) ou quantitative (numérique). DISCRETES (Nombre limité de valeurs) QUANTITATIVES CONTINUES (prend ses valeurs dans un intervalle VARIABLES BINAIRES ( Présent / Absent ) QUALITATIVES NOMINALES (SEXE, Couleur des Yeux, CSP, ) ORDINALES = SCORE (Notion d ordre)

25 Les méthodes statistiques Univariée (moyenne, DS, ) Descriptive Multivariée (ACP, ) La statistique Univariée (tests, ) Inférentielle Multivariée (modèles, )

26 La Statistique Descriptive BUTS : Contrôle de qualité des données, descriptifs simples (moyennes, ). Synthétiser, résumer, structurer l'information contenue dans les données. Mettre en évidence des propriétés de l'échantillon. Suggérer des hypothèses. Analyses univariées : moyennes, histogramme, box-plot, fréquences, Analyses multivariées =Analyse des Données. Permet de traiter des données multidimensionnelles. Principales méthodes multivariées: Méthodes de classification : déterminer des sous-groupes homogènes Méthodes factorielles : réduire le nombre de variables par construction d'axes synthétiques (ACP, AFC, ACM,...), mais aussi sous-groupes d individus 2 classes de méthodes souvent complémentaires Cours N 2

27 La Statistique Inférentielle Univariée BUT : Valider ou infirmer des hypothèses a priori ou formulées après une phase exploratoire. Utilisation de tests statistiques se référant à des modèles probabilistes. EXEMPLES : Comparaison de moyennes (test T, Wilcoxon, ) ANOVA (+ + +!!!) / Modèle mixte Comparaison de fréquences (Khi², Fisher exact) Tests de lois (Shapiro-wilk, Kolmogorov-Smirnov)...

28 STATISTIQUE DESCRIPTIVE UNIVARIEE

29 Analyse descriptive univariée 3 Objectifs : Contrôle des données : Fréquences et Box-plots Calcul des statistiques descriptives : moyenne,. Présentation des résultats : Moyenne et Déviation standard ou Médiane et Quartiles Fréquence avec Intervalle de confiance

30 Paramètres statistiques de base Moyenne : x = 1 n n i= 1 x i Variance estimée: n 1 = n 1 s² x x i= 1 ( i ) 2 Déviation standard : racine carrée de la variance Min, Max, Médiane, Quartiles, Centiles

31 Le Box-Plot ( Boîte à Moustaches ) X max 0 1,5 (Q3-Q1) Q3 Médiane + II=Q3-Q1 0 : valeur comprise entre 1.5 et 3 interquartiles * : valeur supérieure à 3 interquartiles Q1 1,5 (Q3-Q1) X min

32 Représentations graphiques VARIABLES DISCRETES Femme 45% Homme 55% Homme Femme VARIABLES CONTINUES VARIABLES QUALITATIVES

33 Distribution d un paramètre (loi) Différentes formes observables D e n s i t y X Modélisation de la distribution : Hypothèse de loi

34 Tests de Normalité Hypothèses de normalité requise pour test T, ANOVA régression, Intervalles de confiance (valeurs normales) SHAPIRO-WILK ( N< 50 ) KOLMOGOROV-SMIRNOV ( N> 50 )

35 Présentation des résultats Toujours rappeler la population étudiée, les patients inclus ou exclus, Préciser les méthodes statistiques utilisées Faire des tableaux de synthèse Utiliser des graphiques Existence de recommandations ( ) Suivre scrupuleusement les guidelines si article scientifique!!!

36 Présentation des résultats Utilisation de la moyenne si distribution symétrique, de la médiane si distribution asymétrique médiane moyenne Pas de moyenne sans déviation standard Pas de médiane sans quartiles Pas de fréquence sans Intervalle de confiance

37 Intervalles de confiance à 95% d un paramètre numérique : si X suit une loi normale x ± 1.96 DS d une moyenne : quelque soit la loi de X, si n > 30 x ± 1.96 n DS d une fréquence si np, nq > 10 p ± 1.96 p(1 - n p)

38 Normalité d un paramètre

39 La droite de Henry Normalité : très important car condition de nombreux tests Méthode graphique qui permet de vérifier la normalité d une distribution Soit X, une variable aléatoire N(m,σ²) φ : ]-,+ [ [0,1] x φ (x) = P(X<x) Exemple : p On définit la fonction réciproque : φ -1 : [0,1] ]-,+ [ p φ -1 (p) z p z

40 En pratique 1 Ri Soit (X1,..., Xn) un échantillon issu de X, R1,..., Rn les rangs associés, Yi = φ n + 1 Si X suit une loi normale, alors les points (Xi,Yi) sont alignés Cas particulier des diagrammes P-P R 2 = Droite de pente 1/σ coupant l axe des abscisses en m.

41 Le test de Shapiro-Wilk Test implémenté dans de nombreux logiciels et utilisé pour des petits échantillons Basé sur le calcul des différences symétriques : d1 = Xn - X1 d2 = Xn-1 - X dk = Xn-k+1 - Xk On obtient k=n/2 ou k=(n-1)/2 différences selon la parité de n Puis on calcule : b k n = aid, i S² = ( x ) 2 i x i= 1 i= 1 puis W = b² S ² Les a i sont des coefficients dépendants de i et n Utilisation d une table qui permet de conclure.

42 Exemple Xi di ai ai*di = = = = = = = k b = a d = i= 1 n i= 1 i i ( ) 2 S² = x x = i W = H0 : le paramètre suit une loi normale Lecture de la table : α = 0.05 n = 15 C(α,n) = W > C(α,n) On ne rejette pas H0

43 Comparaisons de groupes

44 Comparaisons de groupes Dépend du type de variable : Qualitatitives : Khi² ou Fisher Exact Quantitatives Comparaison Quantitatives 2 approches: Tests paramétriques : Student par exemple Paramétrique = on fait une hypothèse sur la loi du paramètre on compare des moyennes : interprétation facile Hypothèse forte : normalité!!! Tests non paramétriques : Basé sur des rangs On compare des distributions : interprétation délicate Mais pas d hypothèse de loi mais conditions d application

45 Comparaisons de fréquence : le test du Khi² EXEMPLE : On veut savoir s il existe une relation de cause à effet entre un pneumococque et le décès. On dispose d un échantillon se résumant ainsi : V (vivant) D (décés) Pneumocoque G Autre G N=417 La mortalité est-elle plus élevée chez les pneumocoques? Soit H0 : Les 2 caractères sont indépendants Calcul des effectifs théoriques Tij=( Li * Cj) / N (tous supérieurs à 5) 1 degré de liberté Calcul de D² = 8,11 on rejette l indépendance

46 χ² d Indépendance : généralisation On souhaite savoir si deux paramètres A et B sont indépendants On construit le tableau de contingence croisant A et B Sous l hypothèse d indépendance, Calcul de : D² p k = i= 1 j= 1 Degrés de liberté : ν = (k-1) * (p-1) A 1 A 2... A j... A k B 1 O O1k L1 B 2 O O2k L B i Oij Li B p Op Opk Lp C1 C2... Cj... Ck N ( Tij Oij) Tij Tij ² Cj * Li = N Attention à Tij < 5 Utilisation de la table pour déterminer une valeur limite z Conclusion du test : si D² > z alors rejet de H0, donc il existe une liaison entre les caractères A et B

47 Cas particuliers : Fisher exact Test pouvant remplacer le χ² dans le cas d effectifs théoriques inférieurs à 5. Basé sur la combinatoire Valide quelque soient les effectifs théoriques Valide quelque soit le nombre de lignes et de colonnes Attention, temps de calcul prohibitif si le nombre de cases du tableau est élevé

48 Cas particuliers : Khi² apparié 2 Modalités 3 Modalités a c b d a b c L1 d e f L2 g h i L3 χ ( b c) ² ² = si b+c 10 χ b + c Approximation par la loi normale χ² à 1 ddl ( b c ) 1 ² ² = si b+c <10 b + c Test exact χ ² = C1 C2 C3 f + h c + g b + d * 1 1 * 2 2 * b + d c + g b + d f + h c + g f + h 2* * + * + * ( C L ) + ( C L ) + ( C L ) χ² à 2 ddl Test de Mac Nemar FLEISS : Statistical methods for rates and proportions

49 Comparaisons de moyennes

50 Tests paramétriques Chaque fois que possible, utiliser des tests paramétriques car plus faciles à interpréter et utilisent l information totale (pas de perte d information) et donc a priori plus puissants. Attention : des conditions à vérifier : Normalité de la distribution (population totale ou par sous-groupe) L équilibre des groupes (même effectif dans chaque groupe) L égalité des variances (test de Fisher ou de Levene) En fonction de la compatibilité avec certaines de ces conditions, possibilité d utiliser un test paramétrique

51 Comparaison de 2 groupes X ~ N(m,σ)? OUI NON N1, N2 > 30? OUI Égalité des Variances? NON OUI Loi symétrique? NON OUI NON Test de Student Approximation de Satterthwaite Test de Student Wilcoxon (non-paramétrique)

52 Comparaison de k groupes Paramétrique : ANOVA (pas au programme) Non paramétrique : test de Kruskal-Wallis H0 : les moyennes (ANOVA) ou les distributions (KW) sont les mêmes dans les k groupes Cas 1 : on ne rejette pas H0 Pas de différence STOP Cas 2 : on rejette H0 Où sont les différences? Post-hocs Post-hocs : comparaisons multiples (par exemple, comparaison des groupes 2 à 2)

53 Le modèle linéaire Permet de modéliser de nombreux plans d expérience, simples ou complexes, en indépendant ou apparié, à un ou plusieurs facteurs. Hypothèse préalable de normalité sur «l erreur» (les résidus) En fait, comme tout modèle linéaire, validation a posteriori : Analyse des résidus Analyse des individus influents

54 Tests non-paramétriques

55 Définition - Impact Utilisé en général sur de petits échantillons (taille inférieure à 30 individus). Pas de statistiques en dessous de 8 par groupe Attention : les théorèmes statistiques (Th Central limite, par exemple) ne s appliquent plus Nécessité de disposer de tests spécifiques Interprétation plus compliquée : on ne compare pas des moyennes. Problème de l estimation : Dans les statistiques standard : moyenne, déviation standard Dans les modèles

56 Tests non-paramétriques «Distribution-free» tests : tests ne faisant aucune hypothèse a priori sur la distribution des variables analysées (pas d hypothèse de normalité). Généralement basés sur l analyse des rangs. soit (X1, X2,, Xn) n valeurs numériques d une même variable RANG(X i ) : Position de la valeur X i dans la série classée par ordre croissant Problèmes : On obtient une nouvelle variable Rx qui varie de 1 à n Attention aux ex-aequo (individus ayant la même valeur Xi) On «gomme» les différences Tests moins puissants

57 Le test de Wilcoxon ou Mann-Withney Utilisé pour comparer les distributions de 2 groupes indépendants H0 : F a (X) <> F b (X) (les fonctions de répartition sont différentes) On classe les observations par ordre croissant et on calcule la somme des rangs dans chaque groupe. On obtient une variable de décision qui suit une N(0,1) si au moins 8 individus dans chaque groupe X Si distribution identiques, alors mélange parfait entre le groupe A (ronds rouges) et le groupe B (triangles verts). Dans ce cas, les sommes des rangs sont identiques (ou proches) dans les 2 groupes

58 Le test de Wilcoxon Soit n et m les effectifs des groupe 1 et 2, Wx la somme des rangs du groupe A (ou B) Sous H0 : «les distributions sont identiques», on peut calculer E(Wx) et V(Wx) E( Wx) = n( n + m + 1) 2 et V ( Wx) = nm( n + m + 1) 12 Si n et m > 8, alors Z = Wx E( Wx) V ( Wx) suit une loi N(0,1) (Formules valides sans ex-aequo)

59 Le test de Kruskal-Wallis Utilisé pour comparer les distributions de plus de 2 groupes indépendants H0 : les distributions (fonctions de répartition) sont égales Basé sur la différence de la moyenne des rangs dans chaque groupe à la moyenne des rangs sur la population globale Si Ni 5, on obtient une variable de décision H qui suit un χ² à k-1 ddl 2 1 R (N+1) = k H i - N 2 S i= 1 ni 4 (Formule sans ex-aequo) ( N, effectif total, Ni effectif par groupe et Ri somme des rangs du groupe i )

60 Kruskal-Wallis : différences 2 à 2? Exemple : 3 groupes G1, G2 et G3 Test global significatif On aimerait comparer G1/G2, G2/G3 et G1/G3 : 3 tests post-hoc!!! Attention : Nécessité d une correction du risque α 2 options possibles : Option 1 : Utiliser les procédures implémentées dans certains logiciels (SAS, SPSS, ) et qui permettent une correction : Procédure de Dwass-Steel Procédure de Conover-Inman Option 2 : on effectue 3 tests de Wilcoxon au risque α/3

61 La méthode de Conover On transforme la variable X en variable R en calculant les rangs (en faisant attention aux ex-aequo). On réalise une ANOVA «normale» sur la variable R (en utilisant les corrections du risque a telles que Bonferroni ou Tukey) Méthode simple mais pas forcément optimale (simulations) et qui a été critiquée (préservation du risque alpha et puissance) Rank Transformations as a Bridge Between Parametric and Nonparametric Statistics, W. J. Conover and Ronald L. Iman - The American Statistician - Vol. 35, No. 3 (Aug., 1981), pp

62 Quelques exemples

63 Exemple 1 : comparaison de 2 groupes Comparaison du BMI dans 2 groupes N1 N2 N3 N4 N5 N6 N7 N8 N9 N10 N11 N12 Gr Gr Question 1 : le BMI suit-il une loi normale dans cet échantillon? Test de Shapiro-Wilk : W=0.978 et p = On ne rejette pas H0 Le BMI suit une loi normale!

64 Exemple 1 : comparaison de 2 groupes Utilisation d un test paramétrique : le test de Student Égalité des Variances? Test de Fisher (ou Levene) F=1.56, p= Cas 1 : Variances égales Cas 2 : Variances inégales Test de Student sur variances poolées Test de Student avec corr Satterthwaite T = DF = 20 p < T = DF = p <

65 Exemple 1 : comparaison de 2 groupes Si le BMI n avait pas suivi une loi normale, alors utilisation du test de Wilcoxon. Somme des Rangs du Groupe 1 : 85.5 Somme des Rangs du Groupe 2 : Z = p = Les distributions du BMI sont statistiquement différentes dans les 2 groupes.

66 Exemple 2 : le test de Kruskal-Wallis 3 groupes de 10 individus Réponse cotée de 0 à 20 N1 N2 N3 N4 N5 N6 N7 N8 N9 N10 Somme Ri Gr Gr Gr Test de KW : Khi² = DDL = 2 P <

67 Kruskal-Wallis : différences 2 à 2? 2 options possibles : Option 1 : correction disponible dans le logiciel On aimerait comparer G1/G2, G2/G3 et G1/G3 : 3 tests post-hoc!!! Attention à la correction du risque α!! Option 2 : on effectue 3 tests de Wilcoxon au risque α/3 G1-G2 : p= G2-G3 : p= G1-G3 : p= < G1#G2, G1#G3 et G2#G3

68 Méthode de Conover On transforme la variable en rang On réalise l ANOVA sur les rangs Si rejet de H0, comparaisons post-hoc Test global : p < Tests post-hocs significatifs Mêmes conclusions qu avec le test de Kruskal-Wallis

69 Exemple 2 : Modèle linéaire Et si la loi était normale??? Test de Shapiro-Wilk p=0.3541! La distribution suit une loi normale Utilisation du modèle linéaire Test de l effet global Vérification de l influence et des résidus Si modèle OK et effet global significatif, alors calcul des tests post-hoc

70 Exemple 2 : Modèle linéaire Résidus aléatoires et normalement distribués Residual Obs Number 2 individus ayant une Distance de Cook (influence) supérieure à 4/n mais inférieure à 1. Vérification du modèle sans les 2 individus Cook's D Obs Number Modèle paramétrique parfaitement valide!!!

71 1 groupe Mesures répétées

72 2 mesures Problématique : même paramètre X mesuré 2 fois sur le même individu : Mesure Avant / Après traitement par exemple. Plusieurs méthodes possibles Cas 1 : X suit une loi normale Test paramétrique Test T apparié Cas 2 : X ne suit pas une loi normale Tests non paramétriques Test des signes Wilcoxon apparié

73 Test de Student pour données appariés On suppose que le paramètre X suit une loi normale, X mesuré 2 fois : X1 et X2 H0 : m1=m2 On calcule, pour chaque individu, la différence d, puis la moyenne et la déviation standard de la différence. alors t = d σ d n suit une loi de Student à n-1 ddl

74 Le test des signes On dispose de n différences Soit K le nombre de différences positives (ou négatives) Sous H0 : m1=m2, il y a une chance sur 2 qu une différence soit positive On peut établir la loi de K qui suit une loi binomiale K ~ B(n,1/2)

75 Le test de Wilcoxon pour données appariées On dispose de n différences en valeur absolue On ordonne par ordre croissant et on calcule les rangs Soit Wx la somme des rangs des différences positives Sous H0 : les distributions sont identiques, on peut calculer E(Wx) et V(Wx) E( Wx) = n( n + 1) 4 et V ( Wx) = n( n + 1)(2n + 1) 24 Si n > 10, alors Z = Wx E( Wx) V ( Wx) suit une loi N(0,1) (Formules valides sans ex-aequo)

76 Exemple 10 vins notés par 2 experts Num X1 X2 D Ri Moyenne Différence de notation? 1) Normalité? OUI : D suit une loi normale 2) Utilisation du T apparié m d =9 t=3.60 σ d =7.90 ddl=9 n=10 p= Très significatif!

77 Exemple Si la loi n avait pas été normale, utilisation de tests non paramétriques 1) Test des signes : K=2 différences négatives - K suit une B(10,1/2) p 2 k 10 C10 ( 0.5) en unilatéral, en bilatéral NS!! k = 0 = = 2) Wilcoxon apparié : Wx=50.5 (sommes des rangs des diff >0) n( n + 1) E( Wx) = = n( n + 1)(2n + 1) 10*11* 21 V ( Wx) = = = Wx E( Wx) Z = = = p=0.019 V ( Wx) 96.25?

78 3 mesures ou plus Problématique : même paramètre X mesuré k fois sur le même individu : Test de plusieurs traitements / Mesures répétées dans le temps. Plusieurs méthodes possibles Cas 1 : X suit une loi normale Paramétrique Modèle linéaire Cas 2 : X ne suit pas une loi normale Test non paramétriques Test de Friedman

79 Le test de Friedman Un échantillon de n individus, k mesures répétées On calcule le rang de chaque variable pour chaque individu Test basé sur la dispersion des rangs moyens de chaque mesure Q k 2 n k + Ri + i = k( k 1) = 2 (Formule valide sans ex-aequo) Q suit une loi de Khi² à k-1 ddl

80 Exemple 10 souris Hormone mesurée à M0, M6, M12 Obs X1 X2 X Rangs Obs R1 R2 R Q=16.8 Suit un Khi² à 2 ddl p= Très significatif!! Problème des tests post-hocs : pas simple!!! Alternative : Wilcoxon appariés 2 à 2 avec correction du risque α

81 Associations entre paramètres

82 Le coefficient de Corrélation : Introduction Utilisé pour étudier la liaison (ou l indépendance) entre 2 paramètres numériques. EXEMPLES : Rapport entre la taille et le poids Rapport entre un prix de vente et une superficie Interaction entre des paramètres biologiques etc... On considère donc un couple de variables (X,Y) N couples (Xi,Yi), réalisations du couple de variables aléatoires (X,Y)

83 Le coefficient théorique Soit (X,Y) un couple de variables aléatoires Le coefficient de corrélation linéaire entre X et Y est défini par : COV(X,Y) E(XY)-E(X)E(Y) ρ = = σ σ σ σ X Y X Y REMARQUES : ρ est toujours compris entre -1 et 1 Si X et Y sont indépendantes, alors E(XY)=E(X)E(Y) et donc ρ = 0 S il existe une relation fonctionnelle du type Y=aX+b entre X et Y, alors ρ = 1

84 Le coefficient observé On dispose d un échantillon de taille N (N>30) (X1,...,Xi,...Xn) et (Y1,...,Yi,...Yn) On définit le coefficient de corrélation de BRAVAIS-PEARSON par : 1 n (xi-x)(yi-y) n 1 n n r = et 2 avec S x = (xi-x) S (yi-y) SxSy n y = 1 n 1 De même que pour le coefficient théorique : r est compris entre -1 et 1 r = 0 : pas de liaison r proche de 1 : liaison fonctionnelle ATTENTION : absence de liaison n est pas équivalent à indépendance

85 Du bon usage de r!!! r mesure le caractère LINEAIRE d une liaison Usage réservé à des nuages de points où les points sont répartis de part et d autre d une tendance R est très sensible aux individus extrêmes. Attention aux valeurs aberrantes. Utilité de la représentation graphique.

86 Le coefficient de corrélation de Spearman Soient (X1,...,Xi,...Xn) et (Y1,...,Yi,...Yn), (R1,...,Ri,...Rn) et (S1,...,Si,...Sn) les rangs associés. Le coefficient de corrélation de Spearman calculé entre (X1,...,Xi,...Xn) et (Y1,...,Yi,...Yn) est égal au coefficient de corrélation de Pearson calculé entre (R1,...,Ri,...Rn) et (S1,...,Si,...Sn). Utilisé en non paramétrique si N<30

87 Exemple 2 paramètres numériques mesurés chez 10 patients Y X Mesure de l association : calcul du coefficient de Spearman R=0.973 p<0.0001

88 Des questions??? Alain Duhamel Pôle de Santé Publique - Patrick Devos Délégation à la Recherche - Julia Salleron Pôle de Santé Publique Possibilité de RDV le Mardi AM ou Jeudi AM (ou autre si nécessaire) Contact : Mme Brigitte Bonneau Pôle de Santé Publique

UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2013 2014 MATHS/STATS. 1 Généralités sur les tests statistiques 2

UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2013 2014 MATHS/STATS. 1 Généralités sur les tests statistiques 2 UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2013 2014 Master d économie Cours de M. Desgraupes MATHS/STATS Document 4 : Les tests statistiques 1 Généralités sur les tests

Plus en détail

TABLE DES MATIERES. C Exercices complémentaires 42

TABLE DES MATIERES. C Exercices complémentaires 42 TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence

Plus en détail

L essentiel sur les tests statistiques

L essentiel sur les tests statistiques L essentiel sur les tests statistiques 21 septembre 2014 2 Chapitre 1 Tests statistiques Nous considérerons deux exemples au long de ce chapitre. Abondance en C, G : On considère une séquence d ADN et

Plus en détail

Outils méthodologiques et astuces pour la thèse de médecine Les statistiques, comment faire?

Outils méthodologiques et astuces pour la thèse de médecine Les statistiques, comment faire? Outils méthodologiques et astuces pour la thèse de médecine Les statistiques, comment faire? Cyril Ferdynus, USM, CHU RECUEIL DE DONNEES Recueil hors ligne Epidata (http://www.epiconcept.fr/html/epidata.html)

Plus en détail

Module 2 29 Décembre 2009 Intervenant: Dhuin STATISTIQUES

Module 2 29 Décembre 2009 Intervenant: Dhuin STATISTIQUES STATISTIQUES I. Séries statistiques simples... 1 A. Définitions... 1 1. Population... 1 2. Caractère statistique... 1 B. Séries classées / représentations graphiques.... 2 1. Séries classées... 2 2. Représentations

Plus en détail

Table des matières. PREMIÈRE PARTIE Étapes initiales des études marketing 7

Table des matières. PREMIÈRE PARTIE Étapes initiales des études marketing 7 Table des matières Préface Public 1 Structure de l ouvrage 1 Caractéristiques de l ouvrage 3 Contenu 3 Pédagogie 4 Remarques sur l adaptation française 4 Ressources numériques 5 Biographie 6 PREMIÈRE PARTIE

Plus en détail

Principe d un test statistique

Principe d un test statistique Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre

Plus en détail

3. COMPARAISON DE PLUS DE DEUX GROUPES

3. COMPARAISON DE PLUS DE DEUX GROUPES 3. COMPARAISON DE PLUS DE DEUX GROUPES La comparaison de moyennes de plus de deux échantillons se fait généralement par une analyse de variance (ANOVA) L analyse de variance suppose l homogénéité des variances

Plus en détail

Analyse Statistique pour Le Traitement d Enquêtes

Analyse Statistique pour Le Traitement d Enquêtes DAT 104, année 2004-2005 p. 1/90 Analyse Statistique pour Le Traitement d Enquêtes Mastère Développement Agricole Tropical Stéphanie Laffont & Vivien ROSSI UMR ENSAM-INRA Analyse des systèmes et Biométrie

Plus en détail

Analyse des données «Hamburgers» à l aide de SPSS (v2, janvier 2011) Auteur : André Berchtold

Analyse des données «Hamburgers» à l aide de SPSS (v2, janvier 2011) Auteur : André Berchtold Analyse des données «Hamburgers» à l aide de SPSS (v2, janvier 2011) Auteur : André Berchtold Le site web «The Fast Food Explorer» (www.fatcalories.com) propose des données relatives à la composition des

Plus en détail

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction

Plus en détail

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE UE4 : Biostatistiques Chapitre 6 Test de comparaison de pourcentages χ² José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Nature des variables

Plus en détail

Chacune des valeurs d une variable en est une modalité particulière.

Chacune des valeurs d une variable en est une modalité particulière. Psychologie générale Jean Paschoud STATISTIQUE Sommaire Rôle de la statistique Variables Échelles de mesure Résumer, décrire Comparer Rôle de la statistique La statistique est avant tout un outil permettant

Plus en détail

COURS DE STATISTIQUES (24h)

COURS DE STATISTIQUES (24h) COURS DE STATISTIQUES (24h) Introduction Statistiques descriptives (4 h) Rappels de Probabilités (4 h) Echantillonnage(4 h) Estimation ponctuelle (6 h) Introduction aux tests (6 h) Qu est-ce que la statistique?

Plus en détail

Eléments de statistique Introduction - Analyse de données exploratoire

Eléments de statistique Introduction - Analyse de données exploratoire Eléments de statistique Introduction - Louis Wehenkel Département d Electricité, Electronique et Informatique - Université de Liège B24/II.93 - L.Wehenkel@ulg.ac.be MATH0487-2 : 3BacIng, 3BacInf - 16/9/2014

Plus en détail

MASTER «Sciences de la Vie et de la Santé» Mention «Santé Publique»

MASTER «Sciences de la Vie et de la Santé» Mention «Santé Publique» M1_presentation_generale_4juil05.doc 1/11 MASTER «Sciences de la Vie et de la Santé» Mention «Santé Publique» La mention s articule autour de 6 spécialités : Recherche en éthique : Pr Christian HERVE (herve@necker.fr)

Plus en détail

Probabilités et Statistiques. Chapitre 1 : Statistique descriptive

Probabilités et Statistiques. Chapitre 1 : Statistique descriptive U.P.S. I.U.T. A, Département d Informatique Année 2008-2009 Probabilités et Statistiques Emmanuel PAUL Chapitre 1 : Statistique descriptive 1 Objectifs des statistiques. Il s agit d étudier un ou plusieurs

Plus en détail

Les statistiques descriptives et les intervalles de confiance

Les statistiques descriptives et les intervalles de confiance Les statistiques et les intervalles de Yohann.Foucher@univ-nantes.fr Equipe d Accueil 4275 "Biostatistique, recherche clinique et mesures subjectives en santé", Université de Nantes Master 2 - Cours #2

Plus en détail

Conditions d application des méthodes statistiques paramétriques :

Conditions d application des méthodes statistiques paramétriques : Conditions d application des méthodes statistiques paramétriques : applications sur ordinateur GLELE KAKAÏ R., SODJINOU E., FONTON N. Cotonou, Décembre 006 Conditions d application des méthodes statistiques

Plus en détail

STATISTIQUES. Cours I : Test d hypothèses. Télécom Physique Strasbourg Module 2101. Fabrice Heitz. Octobre 2014

STATISTIQUES. Cours I : Test d hypothèses. Télécom Physique Strasbourg Module 2101. Fabrice Heitz. Octobre 2014 Télécom Physique Strasbourg Module 2101 STATISTIQUES Cours I : Test d hypothèses Fabrice Heitz Octobre 2014 Fabrice Heitz (Télécom PS) Statistiques 2014 1 / 75 Cours I TESTS D HYPOTHÈSES Fabrice Heitz

Plus en détail

Programme des épreuves des concours externes de recrutement des personnels techniques et administratifs de recherche et de formation

Programme des épreuves des concours externes de recrutement des personnels techniques et administratifs de recherche et de formation Programme des épreuves des concours externes de recrutement des personnels E1 RECRUTEMENT DES ASSISTANTS INGENIEURS DE RECHERCHE ET DE FORMATION...2 E1.1 Gestionnaire de base de données...2 E1.2 Développeur

Plus en détail

INTRODUCTION A LA RECHERCHE QUANTITATIVE

INTRODUCTION A LA RECHERCHE QUANTITATIVE INTRODUCTION A LA RECHERCHE QUANTITATIVE Deuxième partie : de la base de données aux résultats Juin 2010 Julien Gelly, Caroline Huas, Josselin Le Bel Plan 2 1. Introduction 2. Saisie des données : Epi

Plus en détail

Résumé du cours [POLS1221] Analyse de données quantitatives

Résumé du cours [POLS1221] Analyse de données quantitatives Résumé du cours [POLS1221] Analyse de données quantitatives Year 2006-2007 1/58 PLAN DU COURS Les parties sont indépendantes, l ordre est indifférent! 1 Rappel variables et autre 2 Analyses uni -variées

Plus en détail

Chapitre 3 RÉGRESSION ET CORRÉLATION

Chapitre 3 RÉGRESSION ET CORRÉLATION Statistique appliquée à la gestion et au marketing http://foucart.thierry.free.fr/statpc Chapitre 3 RÉGRESSION ET CORRÉLATION La corrélation est une notion couramment utilisée dans toutes les applications

Plus en détail

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES LES STATISTIQUES INFERENTIELLES (test de Student) L inférence statistique est la partie des statistiques qui, contrairement à la statistique descriptive, ne se contente pas de décrire des observations,

Plus en détail

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

La survie nette actuelle à long terme Qualités de sept méthodes d estimation La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg

Plus en détail

Relation entre deux variables : estimation de la corrélation linéaire

Relation entre deux variables : estimation de la corrélation linéaire CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence

Plus en détail

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p. STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,

Plus en détail

Analyse de données et méthodes numériques

Analyse de données et méthodes numériques Analyse de données et méthodes numériques Analyse de données: Que faire avec un résultat? Comment le décrire? Comment l analyser? Quels sont les «modèles» mathématiques associés? Analyse de données et

Plus en détail

Estimation et tests statistiques, TD 5. Solutions

Estimation et tests statistiques, TD 5. Solutions ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études

Plus en détail

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence

Plus en détail

Lois de probabilité. Anita Burgun

Lois de probabilité. Anita Burgun Lois de probabilité Anita Burgun Problème posé Le problème posé en statistique: On s intéresse à une population On extrait un échantillon On se demande quelle sera la composition de l échantillon (pourcentage

Plus en détail

Savoir Faire Excel Niveau 2. 5 novembre 2007 Naomi Yamaguchi naomi.yamaguchi@univ-paris3.fr

Savoir Faire Excel Niveau 2. 5 novembre 2007 Naomi Yamaguchi naomi.yamaguchi@univ-paris3.fr Savoir Faire Excel Niveau 2 5 novembre 2007 Naomi Yamaguchi naomi.yamaguchi@univ-paris3.fr Ce qu on sait faire Entrer et recopier des données numériques Les fonctions de base (somme, moyenne, nb, si) Faire

Plus en détail

GUIDE D AIDE STATISTIQUE A LA PREPARATION DE LA THESE

GUIDE D AIDE STATISTIQUE A LA PREPARATION DE LA THESE Département Universitaire de Recherche et d Enseignement en Médecine Générale GUIDE D AIDE STATISTIQUE A LA PREPARATION DE LA THESE Enseignants : Esther GUERY, Julien LE BRETON, Emilie FERRAT, Jacques

Plus en détail

SCI03 - Analyse de données expérimentales

SCI03 - Analyse de données expérimentales SCI03 - Analyse de données expérimentales Introduction à la statistique Thierry Denœux 1 1 Université de Technologie de Compiègne tél : 44 96 tdenoeux@hds.utc.fr Automne 2014 Qu est ce que la statistique?

Plus en détail

MÉTHODES ET STATISTIQUES POUR LIRE UN ARTICLE

MÉTHODES ET STATISTIQUES POUR LIRE UN ARTICLE MÉTHODES ET STATISTIQUES POUR LIRE UN ARTICLE Forum HH 05.02.2013 Ghislaine Gagnon Unité HPCI Qualitatif ou quantitatif? Les 2 méthodes peuvent être utilisées séparément ou en conjonction - le qualitatif

Plus en détail

Aide - mémoire de statistique appliquée à la biologie

Aide - mémoire de statistique appliquée à la biologie Aide - mémoire de statistique appliquée à la biologie Construire son étude et analyser les résultats à l aide du logiciel R Maxime HERVE 3 ème version 2011 (1 ère version 2010) Avant-propos Lors de mon

Plus en détail

Cours (8) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012. Test du Khi 2

Cours (8) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012. Test du Khi 2 Test du Khi 2 Le test du Khi 2 (khi deux ou khi carré) fournit une méthode pour déterminer la nature d'une répartition, qui peut être continue ou discrète. Domaine d application du test : Données qualitatives

Plus en détail

Statistiques Descriptives à une dimension

Statistiques Descriptives à une dimension I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des

Plus en détail

Mémoire de n d'étude: Etudes statistiques. Mémoire de n d'étude: Etudes statistiques. Nicolas Sutton-Charani. Université Montpellier 1 1/31

Mémoire de n d'étude: Etudes statistiques. Mémoire de n d'étude: Etudes statistiques. Nicolas Sutton-Charani. Université Montpellier 1 1/31 1/31 Mémoire de n d'étude: Etudes statistiques Nicolas Sutton-Charani Université Montpellier 1 Plan Rappels de cours La base La Statistique Types des variables Outils mathématiques Statistiques descriptives

Plus en détail

Introduction à l'analyse statistique des données

Introduction à l'analyse statistique des données INTRODUCTION À L'ANALYSE STATISTIQUE DES DONNÉES CONCEPTS DE BASE Un certain nombre de concepts, préalables indispensables à la compréhension des analyses présentées, sont définis ici. De même pour quelques

Plus en détail

Introduction aux Statistiques et à l utilisation du logiciel R

Introduction aux Statistiques et à l utilisation du logiciel R Introduction aux Statistiques et à l utilisation du logiciel R Christophe Lalanne Christophe Pallier 1 Introduction 2 Comparaisons de deux moyennes 2.1 Objet de l étude On a mesuré le temps de sommeil

Plus en détail

Analyse de la variance

Analyse de la variance M2 Statistiques et Econométrie Fanny MEYER Morgane CADRAN Margaux GAILLARD Plan du cours I. Introduction II. Analyse de la variance à un facteur III. Analyse de la variance à deux facteurs IV. Analyse

Plus en détail

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences

Plus en détail

Décrire les données. Chapitre 2

Décrire les données. Chapitre 2 Chapitre 2 Décrire les données La description des données est une étape importante de la démarche d analyse. Beaucoup d enquêtes se limitent à cette étape, qui donne un premier niveau de lecture des résultats

Plus en détail

Annexe commune aux séries ES, L et S : boîtes et quantiles

Annexe commune aux séries ES, L et S : boîtes et quantiles Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans

Plus en détail

Chapitre 4 NOTIONS DE PROBABILITÉS

Chapitre 4 NOTIONS DE PROBABILITÉS Statistique appliquée à la gestion et au marketing http://foucart.thierry.free.fr/statpc Chapitre 4 NOTIONS DE PROBABILITÉS Les chapitres précédents donnent des méthodes graphiques et numériques pour caractériser

Plus en détail

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

Ch.12 : Loi binomiale

Ch.12 : Loi binomiale 4 e - programme 2007 - mathématiques ch.12 - cours Page 1 sur 5 1 RÉPÉTITION D'EXPÉRIENCES INDÉPENDANTES Lancer plusieurs fois un dé et noter les résultats successifs. Ch.12 : Loi binomiale Prélever des

Plus en détail

Analyse de la variance Comparaison de plusieurs moyennes

Analyse de la variance Comparaison de plusieurs moyennes Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction

Plus en détail

MATHÉMATIQUES CYCLE TERMINAL DE LA SÉRIE ÉCONOMIQUE ET SOCIALE ET DE LA SÉRIE LITTERAIRE CLASSE DE PREMIÈRE

MATHÉMATIQUES CYCLE TERMINAL DE LA SÉRIE ÉCONOMIQUE ET SOCIALE ET DE LA SÉRIE LITTERAIRE CLASSE DE PREMIÈRE Annexe MATHÉMATIQUES CYCLE TERMINAL DE LA SÉRIE ÉCONOMIQUE ET SOCIALE ET DE LA SÉRIE LITTERAIRE CLASSE DE PREMIÈRE L enseignement des mathématiques au collège et au lycée a pour but de donner à chaque

Plus en détail

DEFINITION et PROPRIETES des PRINCIPALES LOIS de PROBABILITES

DEFINITION et PROPRIETES des PRINCIPALES LOIS de PROBABILITES Université Paris1, Licence 00-003, Mme Pradel : Principales lois de Probabilité 1 DEFINITION et PROPRIETES des PRINCIPALES LOIS de PROBABILITES Notations Si la variable aléatoire X suit la loi L, onnoterax

Plus en détail

Séance 8 : Régression Logistique

Séance 8 : Régression Logistique Séance 8 : Régression Logistique Sommaire Proc LOGISTIC : Régression logistique... 2 Exemple commenté : Achat en (t+1) à partir du sexe et du chiffre d affaires de la période précédente. 4 La régression

Plus en détail

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888 Lecture critique d article Rappels Bio statistiques Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888 Plan du cours Rappels fondamentaux Statistiques descriptives Notions de tests statistiques

Plus en détail

Statistique Descriptive Élémentaire

Statistique Descriptive Élémentaire Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Élémentaire (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219 Université Paul Sabatier

Plus en détail

Probabilités. I- Expérience aléatoire, espace probabilisé : ShotGun. 1- Définitions :

Probabilités. I- Expérience aléatoire, espace probabilisé : ShotGun. 1- Définitions : Probabilités I- Expérience aléatoire, espace probabilisé : 1- Définitions : Ω : Ensemble dont les points w sont les résultats possibles de l expérience Des évènements A parties de Ω appartiennent à A une

Plus en détail

VI. Tests non paramétriques sur un échantillon

VI. Tests non paramétriques sur un échantillon VI. Tests non paramétriques sur un échantillon Le modèle n est pas un modèle paramétrique «TESTS du CHI-DEUX» : VI.1. Test d ajustement à une loi donnée VI.. Test d indépendance de deux facteurs 96 Différentes

Plus en détail

Analyses dans les essais thérapeutiques :

Analyses dans les essais thérapeutiques : 6ème Université d été Recherche et Evaluation en Cancérologie Analyses dans les essais thérapeutiques : analyses intermédiaires, finale et cross-over. M. Bouziani (Oran) 1 Laboratoire de biostatistique

Plus en détail

Introduction à Rcommander

Introduction à Rcommander Introduction à Rcommander Pauline Scherdel Septembre 2014 Table des matières 1 Introduction à Rcmdr sous R 2 2 Interagir avec R 3 3 Installer et charger le package Rcmdr sous R 3 4 Importation des données

Plus en détail

Le regroupement de valeurs continues, ARRONDIR... Notion de discrétisation : groupes ou intervalles de valeurs. Exemple : Glycémie normale :

Le regroupement de valeurs continues, ARRONDIR... Notion de discrétisation : groupes ou intervalles de valeurs. Exemple : Glycémie normale : Variables : samedi 14 novembre 2009 12:54 1. Quelques Exemples : C'est une caractéristique ou un facteur susceptible de prendre des valeurs différentes selon les individus. Exemples : o Couleur des cheveux

Plus en détail

Chapitre VI Échantillonages et simulations

Chapitre VI Échantillonages et simulations Chapitre VI Commentaires : Récursivement, les commentaires ne sont pas à l attention des élèves.. Fluctuation d échantillonnage Définition : En statistiques, un échantillon de taille n est la liste des

Plus en détail

Loi normale ou loi de Laplace-Gauss

Loi normale ou loi de Laplace-Gauss LivreSansTitre1.book Page 44 Mardi, 22. juin 2010 10:40 10 Loi normale ou loi de Laplace-Gauss I. Définition de la loi normale II. Tables de la loi normale centrée réduite S il y avait une seule loi de

Plus en détail

T de Student Khi-deux Corrélation

T de Student Khi-deux Corrélation Les tests d inférence statistiques permettent d estimer le risque d inférer un résultat d un échantillon à une population et de décider si on «prend le risque» (si 0.05 ou 5 %) Une différence de moyennes

Plus en détail

STATISTIQUE THÉORIQUE ET APPLIQUÉE COMPLÉMENTS : LOGICIEL R. Pierre Dagnelie. www.dagnelie.be

STATISTIQUE THÉORIQUE ET APPLIQUÉE COMPLÉMENTS : LOGICIEL R. Pierre Dagnelie. www.dagnelie.be STATISTIQUE THÉORIQUE ET APPLIQUÉE COMPLÉMENTS : LOGICIEL R Pierre Dagnelie www.dagnelie.be 2012 INTRODUCTION 2 Introduction Ce document présente une liste de commandes ou fonctions relatives au logiciel

Plus en détail

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier Statistiques Appliquées à l Expérimentation en Sciences Humaines Christophe Lalanne, Sébastien Georges, Christophe Pallier Table des matières 1 Méthodologie expérimentale et recueil des données 6 1.1 Introduction.......................................

Plus en détail

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,

Plus en détail

Cours 2 : Rappels de Statistique descriptive. A- Introduction B- Statistique descriptive unidimensionnelle C- Statistique descriptive bidimensionnelle

Cours 2 : Rappels de Statistique descriptive. A- Introduction B- Statistique descriptive unidimensionnelle C- Statistique descriptive bidimensionnelle Cours 2 : Rappels de Statistique descriptive A- Introduction B- Statistique descriptive unidimensionnelle C- Statistique descriptive bidimensionnelle A- Introduction A- Introduction Rappel : Série statistique

Plus en détail

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre : Terminale STSS 2 012 2 013 Pourcentages Synthèse 1) Définition : Calculer t % d'un nombre, c'est multiplier ce nombre par t 100. 2) Exemples de calcul : a) Calcul d un pourcentage : Un article coûtant

Plus en détail

Statistique Descriptive I (M1102)

Statistique Descriptive I (M1102) Illustration du cours de Statistique Descriptive I (M1102) Année scolaire 2013/2014 Université de Perpignan Via Domitia, IUT STatistique et Informatique Décisionnelle (STID) Table des matières 1 Généralités

Plus en détail

Licence Pro Amélioration Végétale

Licence Pro Amélioration Végétale Analyse de données Licence Pro Amélioration Végétale Marc Bailly-Bechet Université Claude Bernard Lyon I France marc.bailly-bechet@univ-lyon1.fr 1 marc.bailly-bechet@univ-lyon1.fr Analyse de données Des

Plus en détail

ANALYSE : OUTIL D ANALYSE DE DONNEES POUR LES SCIENCES HUAMINES MANUEL DE L UTILISATEUR : PRISE EN MAIN

ANALYSE : OUTIL D ANALYSE DE DONNEES POUR LES SCIENCES HUAMINES MANUEL DE L UTILISATEUR : PRISE EN MAIN Pôle Informatique de Recherche et d Enseignement en Histoire ANALYSE : OUTIL D ANALYSE DE DONNEES POUR LES SCIENCES HUAMINES MANUEL DE L UTILISATEUR : PRISE EN MAIN A. PREMIER PAS 1. INTEGRATION DU TABLEAU

Plus en détail

Aide-mémoire de statistique appliquée à la biologie

Aide-mémoire de statistique appliquée à la biologie Maxime HERVÉ Aide-mémoire de statistique appliquée à la biologie Construire son étude et analyser les résultats à l aide du logiciel R Version 5(2) (2014) AVANT-PROPOS Les phénomènes biologiques ont cela

Plus en détail

Feuille de TP N 3 : Modèle log-linéaire - Travail guidé. 1 Cancers : modèle log-linéaire à deux facteurs croisés

Feuille de TP N 3 : Modèle log-linéaire - Travail guidé. 1 Cancers : modèle log-linéaire à deux facteurs croisés M1 MLG Année 2012 2013 Feuille de TP N 3 : Modèle log-linéaire - Travail guidé 1 Cancers : modèle log-linéaire à deux facteurs croisés Ce premier exercice reprend l exercice 1 de la feuille de TD n 3.

Plus en détail

Quelques notions de base de statistiques appliquées. à la biologie

Quelques notions de base de statistiques appliquées. à la biologie Quelques notions de base de statistiques appliquées à la biologie Etienne Roux Master Biologie cellulaire et physiopathologie UE initiation à la communication scientifique Laboratoire de Physiologie Cellulaire

Plus en détail

La gestion des ventes.

La gestion des ventes. I. La prévision des ventes. A. Principe. La gestion des ventes. Elle consiste à déterminer les ventes futures à la fois en quantité et en valeur en tenant compte des tendances et contraintes imposées à

Plus en détail

Lot Quality Assurance Sampling. Elise Naoufal EVARISQ 15 septembre 2011

Lot Quality Assurance Sampling. Elise Naoufal EVARISQ 15 septembre 2011 Lot Quality Assurance Sampling LQAS Elise Naoufal EVARISQ 15 septembre 2011 1 LQAS Une question d efficacité? LQAS et santé Méthode et Fondements théoriques Détermination du couple (n,d n,d) Conclusion

Plus en détail

Marketing quantitatif M2-MASS

Marketing quantitatif M2-MASS Marketing quantitatif M2-MASS Francois.Kauffmann@unicaen.fr UCBN 2 décembre 2012 Francois.Kauffmann@unicaen.fr UCBN Marketing quantitatif M2-MASS 2 décembre 2012 1 / 61 Première partie I Analyse Analyse

Plus en détail

L analyse de variance à un critère de classification (ANOVA)

L analyse de variance à un critère de classification (ANOVA) Bio 041 L analyse de variance à un critère de classification (ANOVA) Pierre Legendre & Daniel Borcard, Université de Montréal Référence: Scherrer (007), section 14.1.1.1 et 14.1. 1 - Introduction Objectif:

Plus en détail

Cours de mathématiques Terminale STMG

Cours de mathématiques Terminale STMG Cours de mathématiques Terminale STMG Chapitre 1 Information chiffrée...3 I Proportions...3 II Taux d'évolution...3 a) Détermination d'un taux d'évolution...3 b) Appliquer un taux d'évolution...4 III Taux

Plus en détail

ASI (L2) : TP3 Calculs probabilistes avec Excel et Rstat

ASI (L2) : TP3 Calculs probabilistes avec Excel et Rstat ASI (L2) : TP3 Calculs probabilistes avec Excel et Rstat Objectifs du TP : Savoir utiliser Excel et Rstat pour calculer des moyennes pondérées, des variances pondérées et savoir faire des approximations

Plus en détail

1. Vocabulaire : Introduction au tableau élémentaire

1. Vocabulaire : Introduction au tableau élémentaire L1-S1 Lire et caractériser l'information géographique - Le traitement statistique univarié Statistique : le terme statistique désigne à la fois : 1) l'ensemble des données numériques concernant une catégorie

Plus en détail

MÉTHODES DE CLASSIFICATION

MÉTHODES DE CLASSIFICATION MÉTHODES DE CLASSIFICATION Pierre-Louis GONZALEZ MÉTHODES DE CLASSIFICATION Objet Opérer des regroupements en classes homogènes d un ensemble d individus. Données Les données se présentent en général sous

Plus en détail

Rapport sur la formation «Méthodes d analyses quantitatives pour la psychologie» (du 24/10 au 27/10/2011, Oran, Algérie)

Rapport sur la formation «Méthodes d analyses quantitatives pour la psychologie» (du 24/10 au 27/10/2011, Oran, Algérie) Rapport sur la formation «Méthodes d analyses quantitatives pour la psychologie» (du 24/10 au 27/10/2011, Oran, Algérie) Introduction Dans le cadre du projet Européen Tempus 159287-2009 «Développement

Plus en détail

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent

Plus en détail

Statistique pour psychologues

Statistique pour psychologues P S Y C H O S U P Statistique pour psychologues Cours et exercices Nicolas Guéguen 3 e édition entièrement revue et actualisée Série «Cours et exercices» dirigée par Alain Lieury G. Besançon et al., Manuel

Plus en détail

Introduction à l analyse quantitative

Introduction à l analyse quantitative Introduction à l analyse quantitative Vue d ensemble du webinaire Le webinaire sera enregistré. Les diapositives et tous les autres documents seront envoyés aux participants après la séance. La séance

Plus en détail

Chapitre 1 LE TEST DU KHI-DEUX

Chapitre 1 LE TEST DU KHI-DEUX Chapitre LE TEST DU KHI-DEUX I. Présentation de la statistique khi - carré ( χ²) Une somme de ν carré de variables indépendantes normalement distribuées de moyenne 0 et de variance suit une loi normale

Plus en détail

IBM SPSS Statistics Base 20

IBM SPSS Statistics Base 20 IBM SPSS Statistics Base 20 Remarque : Avant d utiliser ces informations et le produit qu elles concernent, lisez les informations générales sous Remarques sur p. 316. Cette version s applique à IBM SPSS

Plus en détail

Cours de Probabilités et statistiques L1 2011-2012 Maths-PC-SVT

Cours de Probabilités et statistiques L1 2011-2012 Maths-PC-SVT Cours de Probabilités et statistiques L1 2011-2012 Maths-PC-SVT Université d Avignon Fichier dispo sur http://fredericnaud.perso.sfr.fr/ Une étude statistique dans la population montre que le Q.I. est

Plus en détail

UE ADP1 Durée de l'épreuve : 1 heure 30 mn. Aucun document n'est autorisé. Seule la calculette (sans sa documentation) est autorisée.

UE ADP1 Durée de l'épreuve : 1 heure 30 mn. Aucun document n'est autorisé. Seule la calculette (sans sa documentation) est autorisée. Université René Descartes- Paris V Licence de Psychologie Année L1, Semestre S1-2005 /2006 Page 1/5 UE ADP1 Durée de l'épreuve : 1 heure 30 mn. Aucun document n'est autorisé. Seule la calculette (sans

Plus en détail

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur

Plus en détail

Eléments de Statistique. Jean VAILLANT

Eléments de Statistique. Jean VAILLANT Eléments de Statistique Jean VAILLANT Septembre 2010 2 Table des matières 1 Initiation à la théorie de l échantillonnage 5 1.1 Notions de base en échantillonnage............... 5 1.1.1 Population, individu

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

Cours 7 : Exemples. I- Régression linéaire simple II- Analyse de variance à 1 facteur III- Tests statistiques

Cours 7 : Exemples. I- Régression linéaire simple II- Analyse de variance à 1 facteur III- Tests statistiques Cours 7 : Exemples I- Régression linéaire simple II- Analyse de variance à 1 facteur III- Tests statistiques Exemple 1 : On cherche à expliquer les variations de y par celles d une fonction linéaire de

Plus en détail

FORMULAIRE DE STATISTIQUES

FORMULAIRE DE STATISTIQUES FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)

Plus en détail

L'APPROCHE EXPERIMENTALE EN RECHERCHE: introduction aux statistiques.

L'APPROCHE EXPERIMENTALE EN RECHERCHE: introduction aux statistiques. L'APPROCHE EXPERIMENTALE EN RECHERCHE: introduction aux statistiques 1 BUTS DU COURS : se familiariser avec le vocabulaire statistique o variable dépendante, variable indépendante o statistique descriptive,

Plus en détail

Chapitre 9 ANALYSE MULTIDIMENSIONNELLE

Chapitre 9 ANALYSE MULTIDIMENSIONNELLE Statistique appliquée à la gestion et au marketing http://foucart.thierry.free.fr/statpc Chapitre 9 ANALYSE MULTIDIMENSIONNELLE L analyse des données multidimensionnelles regroupe un ensemble de méthodes

Plus en détail

PROBABILITÉS STATISTIQUES

PROBABILITÉS STATISTIQUES PROBABILITÉS ET STATISTIQUES Probabilités et Statistiques PAES 0-03 L FOUCA Sommaire Chapitre Statistique descriptive 4 La statistique et les statistiques 4 Généralités sur les distributions statistiques

Plus en détail