Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888

Dimension: px
Commencer à balayer dès la page:

Download "Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888"

Transcription

1 Lecture critique d article Rappels Bio statistiques Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888

2

3 Plan du cours Rappels fondamentaux Statistiques descriptives Notions de tests statistiques Algorithme de décision Quelques tests Test T de student χ2 Corrélation régressions linéaire et Logistique Survie : Kaplan Meier et Log Rank

4 Introduction Laméthodestatistiqueapourbutde: dégager certaines propriétés d'un ensemble de mesures(ou d'observations) ou de décrire cet ensemble(appelé population).

5

6 Introduction

7 Introduction

8

9 Introduction

10 Introduction

11

12 L échantillon Un bon échantillon = image réduite de la population. L échantillon doit être «représentatif» de la population étudiée Dans le cas contraire, on dit que l'échantillon est biaisé. Le choix de l'échantillon, le recueil des données nécessaires à l'étude la partie fondamentale, la plus longue, de l'étude.

13 Statistiques descriptives

14 Statistiques descriptives Le but : décrire un ensemble d'observations à l'aide de quelques éléments caractéristiques. Entraine généralement une perte d information Méthode statistiques descriptives dépendent de la nature des variables

15 Variables Caractéristique ou facteur susceptible de prendre une valeur différente selon les individus étudiés Différents types de variables Quantitatives Qualitatives

16 Variables qualitatives Non mesurables Revient à définir des catégories ou classes exclusives correspondant aux différentes modalités du caractère observé, puis à déterminer à quelle classe appartient chaque individu. On dénombre les effectifs appartenant à chacune des classes Exemples: le sexe, la couleur des yeux, l'efficacité ou la non efficacité d'un traitement, la nature des cellules d'un tissu, le groupe sanguin,... 3 types Variables qualitatives ordinales Variables qualitatives nominales Variables qualitatives binaires

17 Variables quantitatives Caractérisées par des valeurs numériques Exploitable arithmétiquement Variables quantitatives continues Prennent n importe quelles valeurs numériques dans l intervalle d observation Appartient à l ensemble des réels : toutes les valeurs sont possibles Poids 56,3 kg Taille 1,72 m Cholestérol 2,22 g/l Attention au nombre de décimale Très utilisées en médecine La précision est limitée par l instrument de mesure

18 Variables quantitatives discrètes Variables numériques discontinues. En général valeurs entières Souvent à un dénombrement Rechute d une maladie 3 rechute par an Rappel de vaccin 4 injections Dentition 32 dents Variables temporelles Variables quantitatives particulières utilisant les unités de temps Analyse de survie

19

20 Caractérisation des données qualitatives et ordinales unidimensionnelles Fréquence absolue et tableau des effectifs Fréquences relatives Fréquences cumulées (relatives et absolues) Diagramme "camembert" Diagramme en bâtons et mode

21 Fréquence absolue et tableau des effectifs La fréquence absolue est le nombre d'individus par classe. Ce dénombrement donne lieu à une représentation des données sous forme de tableau.

22 Sur les classes ainsi formées, seules les opérations suivantes sont permises: réaliser des classes disjointes à partir d'une seule classe, regrouper certaines classes. La seule relation qui puisse être utilisée sur ces données est la relation d'appartenance à une même classe.

23 Fréquences relatives Les fréquences relatives sont, pour chaque classe, le rapport de son effectif au nombre total d'individus de la série des mesures. N La somme des fréquences relatives est égale à 1. f i = n i Parfois, les résultats sont exprimés en pourcentage, chacune des fréquences relatives étant multipliée par 100 et arrondies à l'unité

24 On peut représenter les effectifs absolus ou relatifs des classes par des secteurs de cercle dont la surface est proportionnelle à l'effectif. Le diagramme "camembert" est bien adapté à la représentation des données qualitatives"pures". Yeux Marron Vert Bleu Noir Effectif

25 Diagramme en bâtons Pour les données ordinales on peut également représenter les fréquences absolues, relatives ou cumulées par un diagramme en bâtons. Exemple: échantillon de 500 cancéreux dont on a noté le stade.

26 Caractérisation des données qualitatives à deux dimensions Les modalités de deux variables qualitatives permettent de constituer des classes exclusives auxquelles sont affectées chaque observation. Les classes exclusives sont représentées sous la forme d'un tableau appelé tableau de contingence.

27 Caractérisation des données quantitatives à une dimension Rappel: les variables quantitatives peuvent être de deux types: variables discontinues (ou discrètes) et variables continues. Dans le cas des variables discontinues, il est possible de représenter les données par un diagramme en bâtons, comme dans le cas de données ordinales. Dans tous les cas, on peut diviser l'intervalle de variation de la variable en un certain nombre de classe et l'on dénombre toutes les mesures à l'intérieur de chaque classe.

28 Histogramme Construction: on porte sur l'axe des abscisses les extrémités de chaque classe pour chacune d'elles on construit un rectangle dont la base est le segment limité aux extrémités de la classe et la surface est proportionnelle à l'effectif de la classe. effectif an

29 Histogramme Pour les variables quantitatives Il faut le plus souvent regrouper en classe Intervalle : 1 ans Intervalle : 5 ans Intervalle : 10 ans

30 Les graphiques Les tableau représentent les données exactes Les graphique font ressortir une vision synthétique Recommandation dans un articles : Figures numérotées en chiffre arabe Numérotation correspond à l ordre d appel dans le texte Toute figure est appelée dans le texte Pas de 3 d ni de camembert Éviter les superpositions de graphe Pas de colorisation abusive Simple Légendé (titre, axes, unités) Honnête

31 Mesures en statistiques

32 Paramètres 2 types : Paramètres de POSITION Médiane Quartiles, déciles, percentiles Mode Moyenne Fréquences relatives Fréquence Paramètres de Dispersion Extrêmes (Minimum, Maximum) Entendue (Range) Intervalle interquartile Variance Écart type Coefficient de variation DISPERSION POSITION

33 Moyenne Moyenne La moyenne s'exprime dans les mêmes unités que les valeurs observées. Indicateur de tendance centrale servant à résumer une série de données d une variable quantitative Fréquence M x X

34 Médiane Est la valeur qui partage la série des individus en 2 groupes d effectifs égaux. La médiane est moins influencée que la moyenne arithmétique par les valeurs extrêmes de la variable. La moitié des sujets présentent une valeur inférieure à la médiane. L autre moitié une valeur supérieure à la médiane.

35 Quartiles Sont les 3 valeurs qui partagent la distribution en 4 25% 25% 25% 25%

36 1 er quartile : sépare 25% des valeurs les plus faibles et 75% des valeurs les plus élevés 25% 75%

37 3 ème quartile : sépare 75% des valeurs les plus faibles et 25% des valeurs les plus élevés 75% 25%

38 Le deuxième quartile sépare 50 % des valeurs les plus faible de 50% des valeurs les plus élevées 2 ème quartile Médiane! 50 % 50 %

39 Dispersion

40 Dispersion Min Max : Très sensible aux valeurs extrêmes Permet de détecter les erreurs Étendue : Valeur Max Valeur min Espace interquartiles Qi = Q3 Q1 contient 50% des valeurs de la série

41 Écart type : D une population D un échantillon Écart type = même grandeur que la moyenne. m±s

42

43 0.8 C ^ f rel A B Des changements pour les valeurs de la moyenne et la variance entraînent des changements dans la forme et la position de la distribution normale. A. µ = 4, σ = 1 B. µ = 8, σ = 1 C. µ = 8, σ = Y

44 σσ POINT D INFLEXION DE LA COURBE σ

45 Box Plot x

46 Un distribution peut donc être résumé par : Un paramètre de position Un paramètre de dispersion

47 les résultats d'une étude, réalisée sur un échantillon représentatif de nourrissons masculins, ont donné une estimation de la taille moyenne de 60,2 cm avec un intervalle de confiance à 95 % de [59,2-61,2]. Il y aurait donc 95 chances sur cent pour que la taille moyenne des nourrissons masculins Français de 3 mois soit comprise entre 59,2 et 61,2 cm.

48 Principes des tests statistiques

49 Introduction (1) Le test statistique est l outil de la comparaison Lorsqu on effectue une comparaison entre deux ou plusieurs séries de données, on observe toujours une différence, plus ou moins grande entre les paramètres mesurés Le but du test : si la différence observée est simplement due au hasard (fluctuations d échantillonnage) ou si au contraire la différence observée est bien réelle

50 Condition d utilisation d un test (1) Il doit être réalisé dans le cadre d une réflexion scientifique C est une démarche dans laquelle des hypothèses sont bâties à partir de faits antérieurs observés Ensuite ces hypothèses sont testées A partir des résultats des tests, les hypothèses sont soit rejetées soit acceptées Puis de nouvelles hypothèses sont bâties Les résultats d un test n ont de valeur que si ils sont inscrits dans cette démarche

51 Condition d utilisation d un test (2) Ex : On veut comparer la taille des individus qui passent le samedi après midi sur les trottoirs droites et gauches de la rue de la liberté à Rennes On pourrait effectivement trouver une différence, même significative Mais elle n aurait aucun sens La démarche qui consisterait à rechercher à POSTERIORI une explication à ce phénomène serait absurde

52 Conditions d applications (4) Parallèlement, il existe 2 familles de tests : Les tests paramétriques qui comparent les paramètres entres eux, nécessitant certaines conditions sur la distribution de la variable Les tests non paramétriques ou de rang, qui comparent des distributions, sans hypothèse particulière sur la distribution de la variable étudiée

53 Conditions d applications (5) Il existe également deux types de test : Les comparaisons entre des séries d individus Les tests de liaisons entre 2 variables

54 Principe du test de comparaison (1) On a deux situation : 1. Comparer un échantillon observé à une population de référence : On se demande si la distribution de la population dont est issu l échantillon est identique à la distribution théorique, ou bien si elle est différente Population inconnue Population de référence échantillon

55 Principe du test de comparaison (2) 2. Comparer deux ou plusieurs échantillons entres eux : On se demande si les distributions des populations dont sont issus les échantillons sont identiques ou différentes. Population 1 Population 2 Échantillon 1 Échantillon 2

56 Principe du test de comparaison (3) Dans les deux situations, l objet du test est de comparer les 2 populations Le principe du test est de regarder : si la différences observées est due au hasard ou au contraire, cette différence est telle qu il est peu probable de l observer par hasard

57 Étapes d un test de comparaison 1. Établir l hypothèse nulle 2. Proposer une hypothèse alternative 3. Choisir le test et vérifier ses conditions d application 4. Calcul du test 5. Les risques d erreur 6. Interprétation finale d un test de comparaison

58 Établir l hypothèse nulle (H 0 ) l hypothèse a priori : les paramètres ou les distributions des populations dont sont issus les échantillons sont identiques.

59 Hypothèse alternative H 1 (1) l hypothèse H1 sera retenue au cas où les résultats du tests aboutiraient à rejeter H 0

60 Hypothèse alternative H 1 (2) Selon le type du problème posé, on propose une H 1 alternative bilatérale ou unilatérale. H 1 bilatérale : lorsqu on ne cherche pas à connaître le sens de la différence. On se contente de postuler que les 2 paramètres ou les deux distributions sont différents. Paramètre Population 1 Paramètre Population 2

61 Hypothèse alternative H 1 (3) H 1 unilatérale : si l on s intéresse à un sens particulier de l inégalité de 2 paramètres tel que paramètre 1> paramètre 2 paramètre 1< paramètre 2 Paramètre Population 1 Paramètre Population 2 Paramètre Population 2 Paramètre Population 1

62 Exercice (1) On veut comparer la fréquence du palu dans deux régions d Afrique. P 1 et P 2 les fréquences des individus infectés dans ces deux régions : Poser l hypothèse nulle H 0 Poser l hypothèse alternative H 1

63 Exercice (2) H 0 : P 1 = P 2 : les deux fréquences sont identiques H 1 : P 1 P 2 : les deux fréquences sont différentes Il s agit d une hypothèse alternative bilatérale car on ignore a priori dans quelle région la fréquence du palu est la plus élevée.

64 Exercice (3) On désire tester un vaccin contre le palu en comparant la survenue de palu entre un groupe vacciné et un groupe témoin non vacciné. P 1et P 2le pourcentage des individus infectés dans chacune des deux populations représentés par les deux groupes. Poser H 0 et H 1

65 Exercice (4) H 0 : P 1 = P 2 :Le vaccin n a aucune efficacité H 1 : P 1 < P 2 : La fréquence des individus infectés dans le groupe vacciné est inférieure à la fréquence dans le groupe non vacciné. H 1 unilatérale car on s intéresse dans ce cas exclusivement aux effets bénéfiques attendus du vaccin.

66 Calcul du test de comparaison (1) Un fois les hypothèses clairement posées, on applique le test. Les tests consistent à : Calculer une quantité mathématique uoqui exprime l écart entre les paramètres ou les distributions. À confronter uoà un modèle de distribution théorique U. A regarder si uoest une valeur probable ou improbable de de U (que l on borne en fonction du risque α)

67 Résultats d un test de comparaison (2) α =α 1 +α 2 α 1 α 2 u1 u2 test On ne rejette pas Ho

68 Résultats d un test de comparaison (3) α =α 1 +α 2 α 1 α 2 u1 u2 On ne rejette pas Ho

69 Résultats d un test de comparaison (4) α =α 1 +α 2 α 1 α 2 u1 u2 On ne rejette pas Ho

70 Résultats d un test de comparaison (5) 2. u 0 est extérieure à l intervalle des valeurs limite [u 1 -u 2 ] : Il est encore possible que ce résultat soit lié à une simple fluctuation d échantillonnage (il reste α chances que ce soit vrai) On décide de ne pas tenir compte de cette faible probabilité On rejette H 0 et on accepte H 1 d une différence réelle entre les paramètres et les distributions étudiés On dit que cette différence est significative

71 Résultats d un test de comparaison (6) α =α 1 +α 2 α 1 α 2 u1 u2 On rejette Ho

72 1. Risque α : Choix des risques d erreur (1) En rejetant H 0 on prend un risque : la probabilité αd observer des valeurs rares de la variable U, si H 0 est vrai Risque de se tromper en rejetant H 0, si par malheur H 0 était vraie. 0 0 C est le risque d affirmer une différence alors qu elle n existe pas. Risque α ou risque de première espèce α= probabilité de rejeter H 0, si H 0 est vraie. αest fixé a priori. Sa valeur est universellement admise à 5%

73 2. Risque β Choix des risques d erreur (2) Risque de ne pas rejeter H 0 alors que H 1 était vrai. Ceci arrive lorsqu il existe bel et bien uendifférence entre paramètres étudiés mais la valeur observée u se situe néanmoins dans l intervalle 95% des valeurs probables de U. Risque β: risque de deuxième espèce β= probabilité de ne pas rejeter H 0, si H 1 est vraie β est appelé manque de puissance. 1-βest appelé puissance d un test = la capacité de rejeter H 0 si celle-ci est effectivement fausse La puissance d un test est liée à l effectif des échantillon. Plus la taille augmente, plus la puissance augmente et le risque β diminue.

74 Interprétation finale du test de comparaison (1) Hypothèse nulle n est pas rejetée : Rien ne permet d affirmer que les paramètres ou les distributions comparés sont différents. On n affirme jamais qu une hypothèse nulle est vraie car : Elle aurait peut-être pu être rejetée si la puissance du test était élevée Il existe de nombreuses raisons pour que les distributions mesurées soient identiques bien que les populations soient complètement distinctes (biais).

75 Interprétation finale du test de comparaison (2) On rejette H 0 : On accepte donc H 1 : H 1 bilatérale: les distribution ou paramètres sont différents. H 1 unilatérale: l un des paramètres est inférieur (ou supérieur) à l autre. On s intéresse au sens de la différence. Et donc qu à une extrémité de la distribution U. Le risque de se tromper est αdivisé par 2 (et donc deux fois moindre que la hypothèse bilatérale.)

76 Interprétation finale du test de comparaison (3) Degré de signification : Le risque αest fixé a priori (et le plus souvent à 5%) Lorsque le calcul de u 0 montre que le seuil U α a été franchi, on rejette H 0 avec un risque égal à α. On peut aller plus loin et préciser le risque pris ou la force de notre conviction à rejeter H 0 C est le degré de signification p, a posteriori. On dit que la différence observée est significative au risque p

77 Interprétation finale du test de comparaison (4)

78 Principes des tests de liaison (1) On teste l existence d une liaison entre deux variables X et Y d un échantillon : Vérifier qu il existe une relation d ordre statistique entre ces variables 2 variables sont liées : variation de l une entraîne la variation de l autre Variabilité biologique : fluctuations dans les mesures des variables : pour une valeur de X, on peut observer plusieurs valeurs de Y et inversement Difficile d utiliser un tableau ou un graphique pour étudier cette liaison

79 Principes des tests de liaison (2) On suppose que la liaison étudiée suit un modèle mathématique théorique: Test : vérifier si la relation observée se rapproche suffisamment du modèle théorique H 0 : il n existe pas d adéquation avec le modèle proposé H 1 : adéquation avec le modèle proposé Si on rejette H 0 on accepte H 1 il existe une relation statistique significative entre les 2 variables Une relation statistique, en aucun cas une relation de causalité

80 Exercice 1 Posez H 0 et H 1 dans les situations suivantes: Comparaison de 2 traitement nouveaux A et B Comparaison de 4 traitements A, B, C et D Comparaison d un traitement A versus placebo Variation de la hauteur des arbres en fonction de leur altitude

81 Réponses Comparaison de 2 traitement nouveaux A et B H 0 : les deux traitements sont équivalents H 1 bilatérale : les deux traitement ont une efficacité différente Comparaison de 4 traitements ABC et D H 0 : les 4 traitement sont équivalents. H1 bilatérale : au moins l un des traitements a une efficacité différente des autres. Comparaison d un traitement A versus placebo H 0 : le traitement A et le placebo sont équivalent H1 unilatérale: Le traitement A a une activité supérieure au placebo Variation de la hauteur des arbres en fonction de leur altitude H 0 : il n existe aucune liaison entre la hauteur des arbre et l altitude H1 unilatérale : il existe une liaison négative entre la hauteur des arbres et leur altitude.

82 Exercice 2 Vous participez à la mise au point d un traitement supposé efficace sur une maladie mortelle, mais dangereux en cas d utilisation erronée. L efficacité du produit est testée sur des groupes d animaux malades et sains. Vous choisissez αde : 10, 5 ou 1%?

83 Réponse 1% : il faut avoir le moindre risque de conclure à tort à une efficacité qui n existerait pas.

84 Exercice 3 Vous participez à la mise au point d un vaccin potentiellement efficace dans la prévention d une maladie grave, et par ailleurs n ayant pas d effet secondaires. L efficacité est testée en comparant un échantillon de sujets vaccinés par le nouveau vaccin et un échantillon vacciné par un vaccin placebo. Vous choisissez de diminuer prioritairement? α β puissance taille des échantillons

85 Réponses βest le risque à diminuer en priorité. Il ne faudrait pas passer à côté d une efficacité réelle du vaccin. On choisira un risque βfaible. Un tel choix entraîne automatiquement une augmentation Un tel choix entraîne automatiquement une augmentation de la puissance (1-β) et donc de la taille des échantillons

86 Comment choisir un test???

87 Série appariées χ2 de Mc Nemar Qualitatif Séries indépendants 2 groupes Effectif theo>5 χ2 de Pearson χ2 de Yates Test de Fisher Séries indépendants k groupes Effectif theo>5 χ2 de Pearson χ2 de Yates Test de Fisher 1 groupe de sujet 2 mesures répétées n>30 10<n<30 Ecart réduit apparié Test de Student apparié Critère de jugement Hypothèses vérifiées 2 groupes n1 et n2>30 Test Ecart réduit 10<n1 et n2 <30 Test de Student k groupes ANOVA Quantitatif Hypothèses Normalité, égalité des variances 1 groupe 2 mesures répétées Petits effectifs Test de Wilcoxon Hypothèses non vérifiées 2 groupes Petits effectifs Test de Mann et Whitney k groupes Petits effectifs Test de Kruskallet Wallis

88 Liaison entre 2 caractères quantitatifs Hypothèses vérifiées normalité égalité des variances Vérifiée 1 échantillon n couples (x,y) Comparaison à 0 de la pente de la droite de régression liant Y à X Coefficient de corrélation Pearson et son test Non vérifiés 1 échantillon n couples (x,y) Petits effectifs Coefficient de corrélation de Spearman et son test

89 Test du χ 2

90 Test du χ 2 Formulation équivalente : Test du chi-deux, du chi-carré, du χ 2 Pearson Ils servent à étudier la relation entre 2 variables qualitatives : Liens entre survenue d une maladie (M+,M-) et sexe (M,F) Catégorie socioprofessionnelles et département bretons % des prématurés en France versus Angleterre

91 Tableau de contingence χ ² s applique à des effectifs regroupés sur un tableau de contingence Un tableau comportant des effectifs observés (O ij ) dans ces cases et les totaux de chaque ligne et de chaque colonne dans ses marges Classes de la B 1 B 2 B j Total variable A A 1 O 11 O 12 t 1 A 2 O 21 t 2 A i O ij t i Total n 1 n 2 n j N

92 Comparaison de 2 pourcentages (5)

93 Interprétation du test de χ 2 (α= 5%) Condition d application : Les effectifs théoriques doivent être supérieurs ou égaux à 5 H 1 bilatérale : Si χ 2 o est inférieur à χ 2 5% on ne rejette pas H 0. : pas de lien entre les 2 variables, ou pas de différence entre les % Si χ 2 o est supérieur à χ 2 5% on rejette H 0 : il existe un lien significatif Si χ o est supérieur à χ 5% on rejette H 0 : il existe un lien significatif entre les 2 variables, ou différence significative entre les %. On cherche alors p.

94 Exercice

95

96

97 Comparaison de 2 pourcentages (1) Exemple de problème : Des patients atteints de la même maladie ont été traités par deux traitements différents. Parmi les 70 qui ont reçu le traitement A, 22 (31,4%) ont guéri. Parmi les 50 qui ont reçu le traitement B, 25 (soit 50%) ont guéri. Le taux de guérison est il différent entre les deux traitement?

98 Test de T

99 Exercice : 1 échantillon / population Dans un échantillon de 18 sujets suspects d être atteints de trypanosomiase,on mesure la quantité de protéines dans le liquide céphalorachidien. On trouve dans ce groupe une protéinorachie moyenne de 460 mg/l avec un écart type de 280 mg/l. Dans la population générale, la protéinorachieest en moyenne de 300 mg/l. On se demande si ce groupe de sujet présente une protéinorachie différente de normale? Formulez les hypothèses H 0 et H 1 Quel test utilisez-vous? Justifiez la réponse Que concluez vous?

100 Réponse H 0 : la protéinorachiedes sujets atteints de drépanocytose ne diffère pas de celle de la population générale H 1 : la protéinorachiedes sujets atteints de drépanocytose est différente de celle de la population n < 30 : Test de T Condition d application : on suppose que la protéinorachieest distribuée normalement chez les sujets atteints de drépanocytose to>t5%: on rejette H 0 la protéinorachiedes sujets atteints de drépanocytose est significativement différente de celle de la population p < 0,03

101 Exercice 2 : comparaison de 2 échantillons independants On a mesuré un marqueur biologique chez 2 séries de sujets, l une composée de sujets sains, l autre de sujets atteints d hépatite alcoolique. L étude a trouvé les résultats suivants: Effectif (n) Moyenne du marqueur (g/l) Ecart type Sujets sains 15 1,6 0,19 Sujets alcooliques 12 1,4 0,21 On veut comparer les 2 populations. Formuler les hypothèses Quel test choisissez vous? Quelles en sont les conditions d application? Que concluez vous?

102 Exercice (2) H 0 : la valeur moyenne du marqueur est identique dans les 2 populations H 1 : la valeur moyenne du marqueur est différente chez les sujets atteints d hépatite alcoolique n < 30 : test de T Condition d application : on suppose que : le marqueur se distribue normalement dans les 2 populations Les variances des 2 populations sont égales Calcul du test = on rejette H0 Les malades atteints d hépatite alcoolique présentent une valeur du marqueur significativement différente de celle des sujets sains p < 0,02

103 Exercice (1) On désire étudier l effet d une nouvelle stratégie de traitement du diabète sur la glycémie. On dose la glycémie chez 15 sujets avant le début du nouveau protocole (série A) et 3 mois après (série B) : A 2,47 3,09 2,14 2,47 3,06 2,72 2,29 1,90 2,34 2,75 2,67 2,80 2,51 2,23 2,20 B 2,30 2,96 2,23 2,34 2,84 2,59 2,15 1,88 2,32 2,65 2,68 2,58 2,43 2,02 2,17 Le nouveau protocole est-il efficace? Formuler les hypothèses Quel test choisissez vous? Quelles en sont les conditions d application? Que concluez vous?

104 Réponse Comparaison de moyennes sur séries appariées : H 0 : les glycémies sont identiques avant et après le nouveau protocole H 1 : la glycémie est abaissée grâce au nouveau protocole n < 30 : test de T Condition d application : la différence de glycémie avant et après le traitement est distribuée de façon normale Calculs : on rejette H 0 La glycémie est abaissée significativement après administration de la nouvelle stratégie p < 0,0005

105 Corrélation et Régression linéaire

106 Représentation graphique Etudier le lien entre 2 variables quantitatives : scatter ou nuage de points Représenter les couples de valeurs (x,y) 1 individu : Mr Dupont 1,85 m et 74 kg

107 Correlation et régression La régression permet d étudier l association entre deux variables quantitatives, en étudiant les variations de l une en fonction des valeurs de l autre. Le coefficient de corrélation est une mesure d association entre deux variables quantitatives faisant jouer des rôles symétriques aux valeurs. On cherche à savoir simplement s il existe une liaison entre ces deux variables et à quantifier l intensité de la liaison

108 Interprétation de ρ ρ>0 ρ<0 ρ=0

109 Propriété de ρ ρest toujours compris entre -1 et 1 ρpermet de mesurer la FORCE DE L ASSOCIATION entre X et Y. Plus ρest proche de +1 ou de -1, plus l association est forte

110 Si X et Y sont indépendantes alors ρ=0 L inverse n est pas vrai : Si ρ~0, les variables peuvent soient être indépendantes mais aussi être liées (mais non linéairement) On peut seulement affirmer que les variables X et Y ne sont pas liées linéairement

111 Test du r Rappel : r concerne les variables d un échantillon Le calcul de r peut être sujet à fluctuation. Tester r, c est tenter d affirmer ou pas que sa valeur est statistiquement significative et ce avec un risque maîtrisé (p<0,05) Même mécanisme que pour les autres test : hypothèses sur la population Ho = Hypothèse nulle : ρ=0 H1 = Hypothèse alternative : ρ=0 (test bilateral)

112 Les observation pour chaque variable doivent être indépendantes les unes des autres. Ex : comparaison des données Y en fonction du temps X Les données de la veille ne sont pas indépendantes des données du lendemain. Il ya auto-correlation nécessite d autres techniques d analyse. Attention au facteur tiers : biais de confusion

113 Régression linéaire

114 Exemple Terme (semaine) Poids moyen de naissance (grammes) , ,73 Termes de naissances (X) et les poids de naissance (Y) d une POPULATION de nouveau né , , , , , , , , , , , , , , ,81

115 Exemple Le poids moyen varie en fonction du terme il y a une liaison entre le terme et le poids de naissance La courbe de régression est celle qui joint les points successifs La FONCTION de REGRESSION est la fonction qui permet de décrire mathématiquement cette courbe

116 Cas de la régression linéaire En pratique, on ne recherche pas la forme exacte de la courbe. On se contente le plus souvent d une droite. La fonction f est alors linéaire et d équation : f ( x) = E( Y / x) yˆ = α + βx = α + βx

117 La droite de régression permettant de mieux représenter les points est : ŷ= α+ βx Sans êtrestrictementlinéaire, la liaison entre le termeet le poids peut être représentée par une droite. On estimeαet β On teste si βest significativement different de 0

118 Comment interpréter βet α ŷ= -3115, ,30 x Estimation de β= 162,30 (p=0,003) augmentation moyennedu poidsde naissance quand le terme augmente d une semaine Augmentation MOYENNE Les poids de 2 bébés nés à 1 semaine d intervalle diffèrent EN MOYENNE de 162,30 g Elle n est à considérer que sur la période considérée α n a pas d interprétation concrète. au poids moyens des nouveau nés ayant un terme = 0 semaine

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences

Plus en détail

Principe d un test statistique

Principe d un test statistique Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre

Plus en détail

Statistiques descriptives (1/2)

Statistiques descriptives (1/2) Statistiques descriptives (1/2) Anita Burgun 2011-2012 http://www.med.univ-rennes1.fr Introduction! Statistique: méthode scientifique qui consiste à réunir des données chiffrées sur des ensembles d individus

Plus en détail

L essentiel sur les tests statistiques

L essentiel sur les tests statistiques L essentiel sur les tests statistiques 21 septembre 2014 2 Chapitre 1 Tests statistiques Nous considérerons deux exemples au long de ce chapitre. Abondance en C, G : On considère une séquence d ADN et

Plus en détail

Chacune des valeurs d une variable en est une modalité particulière.

Chacune des valeurs d une variable en est une modalité particulière. Psychologie générale Jean Paschoud STATISTIQUE Sommaire Rôle de la statistique Variables Échelles de mesure Résumer, décrire Comparer Rôle de la statistique La statistique est avant tout un outil permettant

Plus en détail

Compléments de statistiques

Compléments de statistiques 2 e cycle EM2 & 3 LCA Complément de statistique. Compléments de statistiques Analyse de données de survie Analyse univariée D. Neveu compléments statistiques EM2 EM3 : 2006-2007 2 Objectifs pédagogiques

Plus en détail

Module 2 29 Décembre 2009 Intervenant: Dhuin STATISTIQUES

Module 2 29 Décembre 2009 Intervenant: Dhuin STATISTIQUES STATISTIQUES I. Séries statistiques simples... 1 A. Définitions... 1 1. Population... 1 2. Caractère statistique... 1 B. Séries classées / représentations graphiques.... 2 1. Séries classées... 2 2. Représentations

Plus en détail

INTRODUCTION A LA RECHERCHE QUANTITATIVE

INTRODUCTION A LA RECHERCHE QUANTITATIVE INTRODUCTION A LA RECHERCHE QUANTITATIVE Deuxième partie : de la base de données aux résultats Juin 2010 Julien Gelly, Caroline Huas, Josselin Le Bel Plan 2 1. Introduction 2. Saisie des données : Epi

Plus en détail

Le regroupement de valeurs continues, ARRONDIR... Notion de discrétisation : groupes ou intervalles de valeurs. Exemple : Glycémie normale :

Le regroupement de valeurs continues, ARRONDIR... Notion de discrétisation : groupes ou intervalles de valeurs. Exemple : Glycémie normale : Variables : samedi 14 novembre 2009 12:54 1. Quelques Exemples : C'est une caractéristique ou un facteur susceptible de prendre des valeurs différentes selon les individus. Exemples : o Couleur des cheveux

Plus en détail

UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2013 2014 MATHS/STATS. 1 Généralités sur les tests statistiques 2

UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2013 2014 MATHS/STATS. 1 Généralités sur les tests statistiques 2 UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2013 2014 Master d économie Cours de M. Desgraupes MATHS/STATS Document 4 : Les tests statistiques 1 Généralités sur les tests

Plus en détail

Statistiques Descriptives à une dimension

Statistiques Descriptives à une dimension I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des

Plus en détail

GUIDE D AIDE STATISTIQUE A LA PREPARATION DE LA THESE

GUIDE D AIDE STATISTIQUE A LA PREPARATION DE LA THESE Département Universitaire de Recherche et d Enseignement en Médecine Générale GUIDE D AIDE STATISTIQUE A LA PREPARATION DE LA THESE Enseignants : Esther GUERY, Julien LE BRETON, Emilie FERRAT, Jacques

Plus en détail

12 ANALYSER DES DONNEES DE SURVIE. Introduction aux méthodes d analyse de la survie

12 ANALYSER DES DONNEES DE SURVIE. Introduction aux méthodes d analyse de la survie 12 ANALYSER DES DONNEES DE SURVIE Merci à Nadine Bossard et à Pascal Roy pour la rédaction de la partie statistique de ce chapitre. Introduction aux méthodes d analyse de la survie Nous allons nous intéresser

Plus en détail

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction

Plus en détail

Outils méthodologiques et astuces pour la thèse de médecine Les statistiques, comment faire?

Outils méthodologiques et astuces pour la thèse de médecine Les statistiques, comment faire? Outils méthodologiques et astuces pour la thèse de médecine Les statistiques, comment faire? Cyril Ferdynus, USM, CHU RECUEIL DE DONNEES Recueil hors ligne Epidata (http://www.epiconcept.fr/html/epidata.html)

Plus en détail

Analyse de données et méthodes numériques

Analyse de données et méthodes numériques Analyse de données et méthodes numériques Analyse de données: Que faire avec un résultat? Comment le décrire? Comment l analyser? Quels sont les «modèles» mathématiques associés? Analyse de données et

Plus en détail

STATISTIQUES I) UN PEU DE VOCABULAIRE

STATISTIQUES I) UN PEU DE VOCABULAIRE STATISTIQUES I) UN PEU DE VOCABULAIRE Toute étude statistique s'appuie sur des données. Dans le cas ou ces données sont numériques (99% des cas), on distingue les données discrètes (qui prennent un nombre

Plus en détail

Probabilités et Statistiques. Chapitre 1 : Statistique descriptive

Probabilités et Statistiques. Chapitre 1 : Statistique descriptive U.P.S. I.U.T. A, Département d Informatique Année 2008-2009 Probabilités et Statistiques Emmanuel PAUL Chapitre 1 : Statistique descriptive 1 Objectifs des statistiques. Il s agit d étudier un ou plusieurs

Plus en détail

Annexe commune aux séries ES, L et S : boîtes et quantiles

Annexe commune aux séries ES, L et S : boîtes et quantiles Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans

Plus en détail

1. Vocabulaire : Introduction au tableau élémentaire

1. Vocabulaire : Introduction au tableau élémentaire L1-S1 Lire et caractériser l'information géographique - Le traitement statistique univarié Statistique : le terme statistique désigne à la fois : 1) l'ensemble des données numériques concernant une catégorie

Plus en détail

Analyse des données «Hamburgers» à l aide de SPSS (v2, janvier 2011) Auteur : André Berchtold

Analyse des données «Hamburgers» à l aide de SPSS (v2, janvier 2011) Auteur : André Berchtold Analyse des données «Hamburgers» à l aide de SPSS (v2, janvier 2011) Auteur : André Berchtold Le site web «The Fast Food Explorer» (www.fatcalories.com) propose des données relatives à la composition des

Plus en détail

STATISTIQUES. Cours I : Test d hypothèses. Télécom Physique Strasbourg Module 2101. Fabrice Heitz. Octobre 2014

STATISTIQUES. Cours I : Test d hypothèses. Télécom Physique Strasbourg Module 2101. Fabrice Heitz. Octobre 2014 Télécom Physique Strasbourg Module 2101 STATISTIQUES Cours I : Test d hypothèses Fabrice Heitz Octobre 2014 Fabrice Heitz (Télécom PS) Statistiques 2014 1 / 75 Cours I TESTS D HYPOTHÈSES Fabrice Heitz

Plus en détail

MÉTHODES ET STATISTIQUES POUR LIRE UN ARTICLE

MÉTHODES ET STATISTIQUES POUR LIRE UN ARTICLE MÉTHODES ET STATISTIQUES POUR LIRE UN ARTICLE Forum HH 05.02.2013 Ghislaine Gagnon Unité HPCI Qualitatif ou quantitatif? Les 2 méthodes peuvent être utilisées séparément ou en conjonction - le qualitatif

Plus en détail

Chapitre 3. Les distributions à deux variables

Chapitre 3. Les distributions à deux variables Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles

Plus en détail

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

La survie nette actuelle à long terme Qualités de sept méthodes d estimation La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg

Plus en détail

Statistique : Résumé de cours et méthodes

Statistique : Résumé de cours et méthodes Statistique : Résumé de cours et méthodes 1 Vocabulaire : Population : c est l ensemble étudié. Individu : c est un élément de la population. Effectif total : c est le nombre total d individus. Caractère

Plus en détail

Cours 9 Une variable numérique : distribution et répartition

Cours 9 Une variable numérique : distribution et répartition Cours 9 Une variable numérique : distribution et répartition Lorsqu'une variable est qualitative et l'autre numérique, il est courant que la première identie des sous-populations (sexe, catégories socio-économiques,

Plus en détail

Programme de Première

Programme de Première BAC TECHNO STAV 66 I. Algèbre Programme de Première Objectif 1 - Effectuer de manière autonome des calculs numériques ou algébriques, résoudre des équations ou inéquations en vue de résoudre des problèmes

Plus en détail

PROBABILITÉS STATISTIQUES

PROBABILITÉS STATISTIQUES PROBABILITÉS ET STATISTIQUES Probabilités et Statistiques PAES 0-03 L FOUCA Sommaire Chapitre Statistique descriptive 4 La statistique et les statistiques 4 Généralités sur les distributions statistiques

Plus en détail

Relation entre deux variables : estimation de la corrélation linéaire

Relation entre deux variables : estimation de la corrélation linéaire CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence

Plus en détail

Les statistiques pour les «Nuls» en 2008. Professeur Sylvie Naveau Hôpital Antoine Béclère Clamart

Les statistiques pour les «Nuls» en 2008. Professeur Sylvie Naveau Hôpital Antoine Béclère Clamart Les statistiques pour les «Nuls» en 2008 Professeur Sylvie Naveau Hôpital Antoine Béclère Clamart L auteur déclare n avoir aucun conflit d intérêt Chen MS Ann Surg 2006;243:321-328 Critéres d inclusion

Plus en détail

MATHÉMATIQUES CYCLE TERMINAL DE LA SÉRIE ÉCONOMIQUE ET SOCIALE ET DE LA SÉRIE LITTERAIRE CLASSE DE PREMIÈRE

MATHÉMATIQUES CYCLE TERMINAL DE LA SÉRIE ÉCONOMIQUE ET SOCIALE ET DE LA SÉRIE LITTERAIRE CLASSE DE PREMIÈRE Annexe MATHÉMATIQUES CYCLE TERMINAL DE LA SÉRIE ÉCONOMIQUE ET SOCIALE ET DE LA SÉRIE LITTERAIRE CLASSE DE PREMIÈRE L enseignement des mathématiques au collège et au lycée a pour but de donner à chaque

Plus en détail

Cours (8) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012. Test du Khi 2

Cours (8) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012. Test du Khi 2 Test du Khi 2 Le test du Khi 2 (khi deux ou khi carré) fournit une méthode pour déterminer la nature d'une répartition, qui peut être continue ou discrète. Domaine d application du test : Données qualitatives

Plus en détail

Programme de l enseignement obligatoire commun de mathématiques Cycle terminal de la série sciences et technologies du management et de la gestion

Programme de l enseignement obligatoire commun de mathématiques Cycle terminal de la série sciences et technologies du management et de la gestion Programme de l enseignement obligatoire commun de mathématiques Cycle terminal de la série sciences et technologies du management et de la gestion L enseignement des mathématiques au collège et au lycée

Plus en détail

Analyse de survie : comment gérer les données censurées?

Analyse de survie : comment gérer les données censurées? Mémento biostatistique Analyse de survie : comment gérer les données censurées? Méthode de Kaplan-Meier C. Alberti 1, J.-F. Timsit 2, S. Chevret 3 1 Centre d Epidémiologie Clinique, Hôpital Robert Debré,

Plus en détail

Loi normale ou loi de Laplace-Gauss

Loi normale ou loi de Laplace-Gauss LivreSansTitre1.book Page 44 Mardi, 22. juin 2010 10:40 10 Loi normale ou loi de Laplace-Gauss I. Définition de la loi normale II. Tables de la loi normale centrée réduite S il y avait une seule loi de

Plus en détail

TABLEAU 5 Nombre moyen (et écarts types) de mots produits selon le niveau scolaire et les trois conditions de révision

TABLEAU 5 Nombre moyen (et écarts types) de mots produits selon le niveau scolaire et les trois conditions de révision Dans ce tableau, si le chercheur ne s intéresse pas aux notes item par item mais simplement à la note globale, alors il conservera seulement les première et dernière colonnes et calculera des statistiques

Plus en détail

Les statistiques descriptives et les intervalles de confiance

Les statistiques descriptives et les intervalles de confiance Les statistiques et les intervalles de Yohann.Foucher@univ-nantes.fr Equipe d Accueil 4275 "Biostatistique, recherche clinique et mesures subjectives en santé", Université de Nantes Master 2 - Cours #2

Plus en détail

L'APPROCHE EXPERIMENTALE EN RECHERCHE: introduction aux statistiques.

L'APPROCHE EXPERIMENTALE EN RECHERCHE: introduction aux statistiques. L'APPROCHE EXPERIMENTALE EN RECHERCHE: introduction aux statistiques 1 BUTS DU COURS : se familiariser avec le vocabulaire statistique o variable dépendante, variable indépendante o statistique descriptive,

Plus en détail

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence

Plus en détail

MASTER «Sciences de la Vie et de la Santé» Mention «Santé Publique»

MASTER «Sciences de la Vie et de la Santé» Mention «Santé Publique» M1_presentation_generale_4juil05.doc 1/11 MASTER «Sciences de la Vie et de la Santé» Mention «Santé Publique» La mention s articule autour de 6 spécialités : Recherche en éthique : Pr Christian HERVE (herve@necker.fr)

Plus en détail

Activité 1 : échantillonnage

Activité 1 : échantillonnage Activité échantillonnage, intervalle de fluctuation, prise de décision (à partir d un même thème) Les trois activités qui suivent s inspirent du document «ressources pour la classe de première générale

Plus en détail

STATISTIQUES. I. Un peu de vocabulaire. II. Representations graphiques. 1. Diagramme circulaire

STATISTIQUES. I. Un peu de vocabulaire. II. Representations graphiques. 1. Diagramme circulaire STATISTIQUES I. Un peu de vocabulaire Toute étude statistique s'appuie sur des données. Dans le cas où ces données sont numériques, on distingue les données discrètes (qui prennent un nombre fini de valeurs

Plus en détail

- Mobiliser les résultats sur le second degré dans le cadre de la résolution d un problème.

- Mobiliser les résultats sur le second degré dans le cadre de la résolution d un problème. Mathématiques - classe de 1ère des séries STI2D et STL. 1. Analyse On dote les élèves d outils mathématiques permettant de traiter des problèmes relevant de la modélisation de phénomènes continus ou discrets.

Plus en détail

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE UE4 : Biostatistiques Chapitre 6 Test de comparaison de pourcentages χ² José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Nature des variables

Plus en détail

Analyse Statistique pour Le Traitement d Enquêtes

Analyse Statistique pour Le Traitement d Enquêtes DAT 104, année 2004-2005 p. 1/90 Analyse Statistique pour Le Traitement d Enquêtes Mastère Développement Agricole Tropical Stéphanie Laffont & Vivien ROSSI UMR ENSAM-INRA Analyse des systèmes et Biométrie

Plus en détail

Comparaison entre un groupe expérimental et un groupe témoin (Corrigé) /30

Comparaison entre un groupe expérimental et un groupe témoin (Corrigé) /30 Comparaison entre un groupe expérimental et un groupe témoin (Corrigé) /30 I1 Connaissances préalables : Buts spécifiques : Outils nécessaires: Consignes générales : Test t de comparaison de moyennes pour

Plus en détail

Résumé du cours [POLS1221] Analyse de données quantitatives

Résumé du cours [POLS1221] Analyse de données quantitatives Résumé du cours [POLS1221] Analyse de données quantitatives Year 2006-2007 1/58 PLAN DU COURS Les parties sont indépendantes, l ordre est indifférent! 1 Rappel variables et autre 2 Analyses uni -variées

Plus en détail

16. Comment introduire les valeurs prises par la variable SPORT pour les 30 premiers sujets introduits dans L2?

16. Comment introduire les valeurs prises par la variable SPORT pour les 30 premiers sujets introduits dans L2? T.P. 5 partie 1 Variable ordinale Calcul manuel de quantiles Utilisation des fonctions intégrées de la TI-84 Utilisation du programme D1 (Corrigé pour 30 cas) V. Prise en compte de 30 cas (pour éviter

Plus en détail

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Chapitre 5 UE4 : Biostatistiques Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.

Plus en détail

Examen d accès - 28 Septembre 2012

Examen d accès - 28 Septembre 2012 Examen d accès - 28 Septembre 2012 Aucun document autorisé - Calculatrice fournie par le centre d examen Cet examen est un questionnaire à choix multiples constitué de 50 questions. Plusieurs réponses

Plus en détail

2010 My Maths Space Page 1/6

2010 My Maths Space Page 1/6 A. Des statistiques aux probabilités 1. Statistiques descriptives, analyse de données. Vocabulaire des statistiques : Population : c'est l'ensemble étudié. Individu : c'est un élément de la population.

Plus en détail

STATISTIQUES À UNE VARIABLE

STATISTIQUES À UNE VARIABLE STATISTIQUES À UNE VARIABLE Table des matières I Méthodes de représentation 2 I.1 Vocabulaire.............................................. 2 I.2 Tableaux...............................................

Plus en détail

Statistique Descriptive I (M1102)

Statistique Descriptive I (M1102) Illustration du cours de Statistique Descriptive I (M1102) Année scolaire 2013/2014 Université de Perpignan Via Domitia, IUT STatistique et Informatique Décisionnelle (STID) Table des matières 1 Généralités

Plus en détail

METHODOLOGIE GENERALE DE LA RECHERCHE EPIDEMIOLOGIQUE : LES ENQUETES EPIDEMIOLOGIQUES

METHODOLOGIE GENERALE DE LA RECHERCHE EPIDEMIOLOGIQUE : LES ENQUETES EPIDEMIOLOGIQUES Enseignement du Deuxième Cycle des Etudes Médicales Faculté de Médecine de Toulouse Purpan et Toulouse Rangueil Module I «Apprentissage de l exercice médical» Coordonnateurs Pr Alain Grand Pr Daniel Rougé

Plus en détail

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES LES STATISTIQUES INFERENTIELLES (test de Student) L inférence statistique est la partie des statistiques qui, contrairement à la statistique descriptive, ne se contente pas de décrire des observations,

Plus en détail

Analyse de la variance

Analyse de la variance M2 Statistiques et Econométrie Fanny MEYER Morgane CADRAN Margaux GAILLARD Plan du cours I. Introduction II. Analyse de la variance à un facteur III. Analyse de la variance à deux facteurs IV. Analyse

Plus en détail

Statistique Descriptive Élémentaire

Statistique Descriptive Élémentaire Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Élémentaire (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219 Université Paul Sabatier

Plus en détail

Item 169 : Évaluation thérapeutique et niveau de preuve

Item 169 : Évaluation thérapeutique et niveau de preuve Item 169 : Évaluation thérapeutique et niveau de preuve COFER, Collège Français des Enseignants en Rhumatologie Date de création du document 2010-2011 Table des matières ENC :...3 SPECIFIQUE :...3 I Différentes

Plus en détail

Chapitre 3 RÉGRESSION ET CORRÉLATION

Chapitre 3 RÉGRESSION ET CORRÉLATION Statistique appliquée à la gestion et au marketing http://foucart.thierry.free.fr/statpc Chapitre 3 RÉGRESSION ET CORRÉLATION La corrélation est une notion couramment utilisée dans toutes les applications

Plus en détail

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre : Terminale STSS 2 012 2 013 Pourcentages Synthèse 1) Définition : Calculer t % d'un nombre, c'est multiplier ce nombre par t 100. 2) Exemples de calcul : a) Calcul d un pourcentage : Un article coûtant

Plus en détail

UE ADP1 Durée de l'épreuve : 1 heure 30 mn. Aucun document n'est autorisé. Seule la calculette (sans sa documentation) est autorisée.

UE ADP1 Durée de l'épreuve : 1 heure 30 mn. Aucun document n'est autorisé. Seule la calculette (sans sa documentation) est autorisée. Université René Descartes- Paris V Licence de Psychologie Année L1, Semestre S1-2005 /2006 Page 1/5 UE ADP1 Durée de l'épreuve : 1 heure 30 mn. Aucun document n'est autorisé. Seule la calculette (sans

Plus en détail

Principe d un test statistique

Principe d un test statistique Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2008/2009 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre

Plus en détail

Université Jinan Faculté de Gestion Tripoli - Liban. Statistiques. Examen Préparatoire. Version 1

Université Jinan Faculté de Gestion Tripoli - Liban. Statistiques. Examen Préparatoire. Version 1 Université Jinan Faculté de Gestion Tripoli - Liban Statistiques Examen Préparatoire Version 1 2011-2010 Statistiques Université de Jinan Faculté de Gestion Table des matières 1 Analyse statistique d'une

Plus en détail

Introduction à l'analyse statistique des données

Introduction à l'analyse statistique des données INTRODUCTION À L'ANALYSE STATISTIQUE DES DONNÉES CONCEPTS DE BASE Un certain nombre de concepts, préalables indispensables à la compréhension des analyses présentées, sont définis ici. De même pour quelques

Plus en détail

Document d orientation sur les allégations issues d essais de non-infériorité

Document d orientation sur les allégations issues d essais de non-infériorité Document d orientation sur les allégations issues d essais de non-infériorité Février 2013 1 Liste de contrôle des essais de non-infériorité N o Liste de contrôle (les clients peuvent se servir de cette

Plus en détail

La gestion des ventes.

La gestion des ventes. I. La prévision des ventes. A. Principe. La gestion des ventes. Elle consiste à déterminer les ventes futures à la fois en quantité et en valeur en tenant compte des tendances et contraintes imposées à

Plus en détail

Conditions d application des méthodes statistiques paramétriques :

Conditions d application des méthodes statistiques paramétriques : Conditions d application des méthodes statistiques paramétriques : applications sur ordinateur GLELE KAKAÏ R., SODJINOU E., FONTON N. Cotonou, Décembre 006 Conditions d application des méthodes statistiques

Plus en détail

Christophe Fournier. Clinique de Thuys. Aunége - Christophe Fournier

Christophe Fournier. Clinique de Thuys. Aunége - Christophe Fournier Christophe Fournier Clinique de Thuys Aunége - Christophe Fournier 2 Table des matières Information sur l'échantillon 3 Structure de l'échantillon...4 Point méthodologique 6 Point méthodologique...7 Représentativité

Plus en détail

Chapitre 2 Les graphiques

Chapitre 2 Les graphiques Chapitre Les graphiques. Généralités C est la partie des statistiques la moins souvent oubliée dans l enseignement secondaire car elle mobilise la notion de proportionnalité sous ses différentes formes.

Plus en détail

C3 : Manipulations statistiques

C3 : Manipulations statistiques C3 : Manipulations statistiques Dorat Rémi 1- Génération de valeurs aléatoires p 2 2- Statistiques descriptives p 3 3- Tests statistiques p 8 4- Régression linéaire p 8 Manipulations statistiques 1 1-

Plus en détail

Cours 2 : Rappels de Statistique descriptive. A- Introduction B- Statistique descriptive unidimensionnelle C- Statistique descriptive bidimensionnelle

Cours 2 : Rappels de Statistique descriptive. A- Introduction B- Statistique descriptive unidimensionnelle C- Statistique descriptive bidimensionnelle Cours 2 : Rappels de Statistique descriptive A- Introduction B- Statistique descriptive unidimensionnelle C- Statistique descriptive bidimensionnelle A- Introduction A- Introduction Rappel : Série statistique

Plus en détail

TABLE DES MATIERES. C Exercices complémentaires 42

TABLE DES MATIERES. C Exercices complémentaires 42 TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence

Plus en détail

Analyse de la variance Comparaison de plusieurs moyennes

Analyse de la variance Comparaison de plusieurs moyennes Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction

Plus en détail

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent

Plus en détail

STA240 : Tests statistiques

STA240 : Tests statistiques STA240 : Tests statistiques 1 Règle de décision, seuil et p-valeur Dans un test, l hypothèse nulle H 0 est celle dont on choisit de maîtriser la probabilité de rejet à tort. C est celle à laquelle on tient

Plus en détail

ANALYSE : OUTIL D ANALYSE DE DONNEES POUR LES SCIENCES HUAMINES MANUEL DE L UTILISATEUR : PRISE EN MAIN

ANALYSE : OUTIL D ANALYSE DE DONNEES POUR LES SCIENCES HUAMINES MANUEL DE L UTILISATEUR : PRISE EN MAIN Pôle Informatique de Recherche et d Enseignement en Histoire ANALYSE : OUTIL D ANALYSE DE DONNEES POUR LES SCIENCES HUAMINES MANUEL DE L UTILISATEUR : PRISE EN MAIN A. PREMIER PAS 1. INTEGRATION DU TABLEAU

Plus en détail

1ES Février 2013 Corrigé

1ES Février 2013 Corrigé 1ES Février 213 Corrigé Exercice 1 Le tableau ci-dessous renseigne sur les besoins en eau dans le monde : Population mondiale (Milliards d habitants) Volume moyen par habitant ( ) 195 2,5 4 1 197 3,6 5

Plus en détail

Analyses dans les essais thérapeutiques :

Analyses dans les essais thérapeutiques : 6ème Université d été Recherche et Evaluation en Cancérologie Analyses dans les essais thérapeutiques : analyses intermédiaires, finale et cross-over. M. Bouziani (Oran) 1 Laboratoire de biostatistique

Plus en détail

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

A l'intention des collègues dont les élèves vont tester le sujet "prospectif" de bac ES.

A l'intention des collègues dont les élèves vont tester le sujet prospectif de bac ES. A l'intention des collègues dont les élèves vont tester le sujet "prospectif" de bac ES. Le sujet proposé s'inscrit dans le cadre du texte d'orientation ci-joint. L'exercice I est du type "compréhension

Plus en détail

FACULTE DE MEDECINE D ANGERS. Polycopié de cours pour les 1 e et 2 e cycles des études médicales Préparation à l examen national classant

FACULTE DE MEDECINE D ANGERS. Polycopié de cours pour les 1 e et 2 e cycles des études médicales Préparation à l examen national classant FACULTE DE MEDECINE D ANGERS Polycopié de cours pour les 1 e et 2 e cycles des études médicales Préparation à l examen national classant Année scolaire 2007-2008 SANTE PUBLIQUE ET MEDECINE SOCIALE Responsable

Plus en détail

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,

Plus en détail

Terminale STMG Lycée Jean Vilar 2013/2014. Terminale STMG. O. Lader

Terminale STMG Lycée Jean Vilar 2013/2014. Terminale STMG. O. Lader Terminale STMG O. Lader Table des matières 1 Information chiffrée (4s) 4 1.1 Taux d évolution....................................... 6 1.2 indices............................................. 6 1.3 Racine

Plus en détail

Introduction au cours STA 102 Analyse des données : Méthodes explicatives

Introduction au cours STA 102 Analyse des données : Méthodes explicatives Analyse des données - Méthodes explicatives (STA102) Introduction au cours STA 102 Analyse des données : Méthodes explicatives Giorgio Russolillo giorgio.russolillo@cnam.fr Infos et support du cours Slide

Plus en détail

Simulation Examen de Statistique Approfondie II **Corrigé **

Simulation Examen de Statistique Approfondie II **Corrigé ** Simulation Examen de Statistique Approfondie II **Corrigé ** Ces quatre exercices sont issus du livre d exercices de François Husson et de Jérôme Pagès intitulé Statistiques générales pour utilisateurs,

Plus en détail

1S DS 4 Durée :?mn. 2. La courbe ci-dessous est la représentation graphique de la fonction g, définie sur I = [ 1; 3].

1S DS 4 Durée :?mn. 2. La courbe ci-dessous est la représentation graphique de la fonction g, définie sur I = [ 1; 3]. 1S DS 4 Durée :?mn Exercice 1 ( 5 points ) Les trois questions sont indépendantes. 1. Soit f la fonction définie par f(x) = 3 x. a) Donner son ensemble de définition. Il faut 3 x 0 3 x donc D f =] ; 3]

Plus en détail

Séries Statistiques Simples

Séries Statistiques Simples 1. Collecte et Représentation de l Information 1.1 Définitions 1.2 Tableaux statistiques 1.3 Graphiques 2. Séries statistiques simples 2.1 Moyenne arithmétique 2.2 Mode & Classe modale 2.3 Effectifs &

Plus en détail

1 e S - programme 2011 mathématiques ch.4 cahier élève Page 1 sur 14 Ch.4 : Statistiques

1 e S - programme 2011 mathématiques ch.4 cahier élève Page 1 sur 14 Ch.4 : Statistiques 1 e S - programme 2011 mathématiques ch4 cahier élève Page 1 sur 14 Ch4 : Statistiques Exercice n A page 286 : Calculer une médiane et une moyenne Déterminer la médiane et la moyenne de chacune des deux

Plus en détail

Mémoire de n d'étude: Etudes statistiques. Mémoire de n d'étude: Etudes statistiques. Nicolas Sutton-Charani. Université Montpellier 1 1/31

Mémoire de n d'étude: Etudes statistiques. Mémoire de n d'étude: Etudes statistiques. Nicolas Sutton-Charani. Université Montpellier 1 1/31 1/31 Mémoire de n d'étude: Etudes statistiques Nicolas Sutton-Charani Université Montpellier 1 Plan Rappels de cours La base La Statistique Types des variables Outils mathématiques Statistiques descriptives

Plus en détail

La régression logistique. Par Sonia NEJI et Anne-Hélène JIGOREL

La régression logistique. Par Sonia NEJI et Anne-Hélène JIGOREL La régression logistique Par Sonia NEJI et Anne-Hélène JIGOREL Introduction La régression logistique s applique au cas où: Y est qualitative à 2 modalités Xk qualitatives ou quantitatives Le plus souvent

Plus en détail

Cours de mathématiques

Cours de mathématiques Cours de mathématiques Thomas Rey classe de première ES ii Table des matières 1 Les pourcentages 1 1.1 Variation en pourcentage............................... 1 1.1.1 Calcul d une variation............................

Plus en détail

Méthodes Statistiques Appliquées à la Qualité et à la Gestion des Risques - Le Contrôle Statistique

Méthodes Statistiques Appliquées à la Qualité et à la Gestion des Risques - Le Contrôle Statistique Méthodes Statistiques Appliquées à la Qualité et à la Gestion des Risques - Le Contrôle Statistique Jean Gaudart Laboratoire d Enseignement et de Recherche sur le Traitement de l Information Médicale jean.gaudart@univmed.fr

Plus en détail

Cahier de textes Page 1 sur 9. Cahier de textes

Cahier de textes Page 1 sur 9. Cahier de textes Cahier de textes Page 1 sur 9 Cahier de textes Jeudi 04/09/2014 9h-12h et 13h30-16h30 : Cours sur la logique : - Conjonction, disjonction, implication, équivalence - Quelques formules. - Quantificateurs

Plus en détail

Baccalauréat SMS 2008 L intégrale de juin à septembre 2008

Baccalauréat SMS 2008 L intégrale de juin à septembre 2008 Baccalauréat SMS 2008 L intégrale de juin à septembre 2008 Métropole juin 2008..................................... 3 La Réunion 18 juin 2008................................. 6 Polynésie juin 2008......................................

Plus en détail

Outils statistiques. Notes de cours.

Outils statistiques. Notes de cours. 1 Outils statistiques Notes de cours. Clotilde Fermanian Françoise Lucas Année 2010 2011 L2-L3 Université Paris 12 Val de Marne. 2 Avertissement : Ce texte constitue des notes qui couvrent ce qui a été

Plus en détail

23. Interprétation clinique des mesures de l effet traitement

23. Interprétation clinique des mesures de l effet traitement 23. Interprétation clinique des mesures de l effet traitement 23.1. Critères de jugement binaires Plusieurs mesures (indices) sont utilisables pour quantifier l effet traitement lors de l utilisation d

Plus en détail

Quelques notions de base de statistiques appliquées. à la biologie

Quelques notions de base de statistiques appliquées. à la biologie Quelques notions de base de statistiques appliquées à la biologie Etienne Roux Master Biologie cellulaire et physiopathologie UE initiation à la communication scientifique Laboratoire de Physiologie Cellulaire

Plus en détail

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p. STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,

Plus en détail

Décrire les données. Chapitre 2

Décrire les données. Chapitre 2 Chapitre 2 Décrire les données La description des données est une étape importante de la démarche d analyse. Beaucoup d enquêtes se limitent à cette étape, qui donne un premier niveau de lecture des résultats

Plus en détail