Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888
|
|
|
- Benjamin Lecompte
- il y a 10 ans
- Total affichages :
Transcription
1 Lecture critique d article Rappels Bio statistiques Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888
2
3 Plan du cours Rappels fondamentaux Statistiques descriptives Notions de tests statistiques Algorithme de décision Quelques tests Test T de student χ2 Corrélation régressions linéaire et Logistique Survie : Kaplan Meier et Log Rank
4 Introduction Laméthodestatistiqueapourbutde: dégager certaines propriétés d'un ensemble de mesures(ou d'observations) ou de décrire cet ensemble(appelé population).
5
6 Introduction
7 Introduction
8
9 Introduction
10 Introduction
11
12 L échantillon Un bon échantillon = image réduite de la population. L échantillon doit être «représentatif» de la population étudiée Dans le cas contraire, on dit que l'échantillon est biaisé. Le choix de l'échantillon, le recueil des données nécessaires à l'étude la partie fondamentale, la plus longue, de l'étude.
13 Statistiques descriptives
14 Statistiques descriptives Le but : décrire un ensemble d'observations à l'aide de quelques éléments caractéristiques. Entraine généralement une perte d information Méthode statistiques descriptives dépendent de la nature des variables
15 Variables Caractéristique ou facteur susceptible de prendre une valeur différente selon les individus étudiés Différents types de variables Quantitatives Qualitatives
16 Variables qualitatives Non mesurables Revient à définir des catégories ou classes exclusives correspondant aux différentes modalités du caractère observé, puis à déterminer à quelle classe appartient chaque individu. On dénombre les effectifs appartenant à chacune des classes Exemples: le sexe, la couleur des yeux, l'efficacité ou la non efficacité d'un traitement, la nature des cellules d'un tissu, le groupe sanguin,... 3 types Variables qualitatives ordinales Variables qualitatives nominales Variables qualitatives binaires
17 Variables quantitatives Caractérisées par des valeurs numériques Exploitable arithmétiquement Variables quantitatives continues Prennent n importe quelles valeurs numériques dans l intervalle d observation Appartient à l ensemble des réels : toutes les valeurs sont possibles Poids 56,3 kg Taille 1,72 m Cholestérol 2,22 g/l Attention au nombre de décimale Très utilisées en médecine La précision est limitée par l instrument de mesure
18 Variables quantitatives discrètes Variables numériques discontinues. En général valeurs entières Souvent à un dénombrement Rechute d une maladie 3 rechute par an Rappel de vaccin 4 injections Dentition 32 dents Variables temporelles Variables quantitatives particulières utilisant les unités de temps Analyse de survie
19
20 Caractérisation des données qualitatives et ordinales unidimensionnelles Fréquence absolue et tableau des effectifs Fréquences relatives Fréquences cumulées (relatives et absolues) Diagramme "camembert" Diagramme en bâtons et mode
21 Fréquence absolue et tableau des effectifs La fréquence absolue est le nombre d'individus par classe. Ce dénombrement donne lieu à une représentation des données sous forme de tableau.
22 Sur les classes ainsi formées, seules les opérations suivantes sont permises: réaliser des classes disjointes à partir d'une seule classe, regrouper certaines classes. La seule relation qui puisse être utilisée sur ces données est la relation d'appartenance à une même classe.
23 Fréquences relatives Les fréquences relatives sont, pour chaque classe, le rapport de son effectif au nombre total d'individus de la série des mesures. N La somme des fréquences relatives est égale à 1. f i = n i Parfois, les résultats sont exprimés en pourcentage, chacune des fréquences relatives étant multipliée par 100 et arrondies à l'unité
24 On peut représenter les effectifs absolus ou relatifs des classes par des secteurs de cercle dont la surface est proportionnelle à l'effectif. Le diagramme "camembert" est bien adapté à la représentation des données qualitatives"pures". Yeux Marron Vert Bleu Noir Effectif
25 Diagramme en bâtons Pour les données ordinales on peut également représenter les fréquences absolues, relatives ou cumulées par un diagramme en bâtons. Exemple: échantillon de 500 cancéreux dont on a noté le stade.
26 Caractérisation des données qualitatives à deux dimensions Les modalités de deux variables qualitatives permettent de constituer des classes exclusives auxquelles sont affectées chaque observation. Les classes exclusives sont représentées sous la forme d'un tableau appelé tableau de contingence.
27 Caractérisation des données quantitatives à une dimension Rappel: les variables quantitatives peuvent être de deux types: variables discontinues (ou discrètes) et variables continues. Dans le cas des variables discontinues, il est possible de représenter les données par un diagramme en bâtons, comme dans le cas de données ordinales. Dans tous les cas, on peut diviser l'intervalle de variation de la variable en un certain nombre de classe et l'on dénombre toutes les mesures à l'intérieur de chaque classe.
28 Histogramme Construction: on porte sur l'axe des abscisses les extrémités de chaque classe pour chacune d'elles on construit un rectangle dont la base est le segment limité aux extrémités de la classe et la surface est proportionnelle à l'effectif de la classe. effectif an
29 Histogramme Pour les variables quantitatives Il faut le plus souvent regrouper en classe Intervalle : 1 ans Intervalle : 5 ans Intervalle : 10 ans
30 Les graphiques Les tableau représentent les données exactes Les graphique font ressortir une vision synthétique Recommandation dans un articles : Figures numérotées en chiffre arabe Numérotation correspond à l ordre d appel dans le texte Toute figure est appelée dans le texte Pas de 3 d ni de camembert Éviter les superpositions de graphe Pas de colorisation abusive Simple Légendé (titre, axes, unités) Honnête
31 Mesures en statistiques
32 Paramètres 2 types : Paramètres de POSITION Médiane Quartiles, déciles, percentiles Mode Moyenne Fréquences relatives Fréquence Paramètres de Dispersion Extrêmes (Minimum, Maximum) Entendue (Range) Intervalle interquartile Variance Écart type Coefficient de variation DISPERSION POSITION
33 Moyenne Moyenne La moyenne s'exprime dans les mêmes unités que les valeurs observées. Indicateur de tendance centrale servant à résumer une série de données d une variable quantitative Fréquence M x X
34 Médiane Est la valeur qui partage la série des individus en 2 groupes d effectifs égaux. La médiane est moins influencée que la moyenne arithmétique par les valeurs extrêmes de la variable. La moitié des sujets présentent une valeur inférieure à la médiane. L autre moitié une valeur supérieure à la médiane.
35 Quartiles Sont les 3 valeurs qui partagent la distribution en 4 25% 25% 25% 25%
36 1 er quartile : sépare 25% des valeurs les plus faibles et 75% des valeurs les plus élevés 25% 75%
37 3 ème quartile : sépare 75% des valeurs les plus faibles et 25% des valeurs les plus élevés 75% 25%
38 Le deuxième quartile sépare 50 % des valeurs les plus faible de 50% des valeurs les plus élevées 2 ème quartile Médiane! 50 % 50 %
39 Dispersion
40 Dispersion Min Max : Très sensible aux valeurs extrêmes Permet de détecter les erreurs Étendue : Valeur Max Valeur min Espace interquartiles Qi = Q3 Q1 contient 50% des valeurs de la série
41 Écart type : D une population D un échantillon Écart type = même grandeur que la moyenne. m±s
42
43 0.8 C ^ f rel A B Des changements pour les valeurs de la moyenne et la variance entraînent des changements dans la forme et la position de la distribution normale. A. µ = 4, σ = 1 B. µ = 8, σ = 1 C. µ = 8, σ = Y
44 σσ POINT D INFLEXION DE LA COURBE σ
45 Box Plot x
46 Un distribution peut donc être résumé par : Un paramètre de position Un paramètre de dispersion
47 les résultats d'une étude, réalisée sur un échantillon représentatif de nourrissons masculins, ont donné une estimation de la taille moyenne de 60,2 cm avec un intervalle de confiance à 95 % de [59,2-61,2]. Il y aurait donc 95 chances sur cent pour que la taille moyenne des nourrissons masculins Français de 3 mois soit comprise entre 59,2 et 61,2 cm.
48 Principes des tests statistiques
49 Introduction (1) Le test statistique est l outil de la comparaison Lorsqu on effectue une comparaison entre deux ou plusieurs séries de données, on observe toujours une différence, plus ou moins grande entre les paramètres mesurés Le but du test : si la différence observée est simplement due au hasard (fluctuations d échantillonnage) ou si au contraire la différence observée est bien réelle
50 Condition d utilisation d un test (1) Il doit être réalisé dans le cadre d une réflexion scientifique C est une démarche dans laquelle des hypothèses sont bâties à partir de faits antérieurs observés Ensuite ces hypothèses sont testées A partir des résultats des tests, les hypothèses sont soit rejetées soit acceptées Puis de nouvelles hypothèses sont bâties Les résultats d un test n ont de valeur que si ils sont inscrits dans cette démarche
51 Condition d utilisation d un test (2) Ex : On veut comparer la taille des individus qui passent le samedi après midi sur les trottoirs droites et gauches de la rue de la liberté à Rennes On pourrait effectivement trouver une différence, même significative Mais elle n aurait aucun sens La démarche qui consisterait à rechercher à POSTERIORI une explication à ce phénomène serait absurde
52 Conditions d applications (4) Parallèlement, il existe 2 familles de tests : Les tests paramétriques qui comparent les paramètres entres eux, nécessitant certaines conditions sur la distribution de la variable Les tests non paramétriques ou de rang, qui comparent des distributions, sans hypothèse particulière sur la distribution de la variable étudiée
53 Conditions d applications (5) Il existe également deux types de test : Les comparaisons entre des séries d individus Les tests de liaisons entre 2 variables
54 Principe du test de comparaison (1) On a deux situation : 1. Comparer un échantillon observé à une population de référence : On se demande si la distribution de la population dont est issu l échantillon est identique à la distribution théorique, ou bien si elle est différente Population inconnue Population de référence échantillon
55 Principe du test de comparaison (2) 2. Comparer deux ou plusieurs échantillons entres eux : On se demande si les distributions des populations dont sont issus les échantillons sont identiques ou différentes. Population 1 Population 2 Échantillon 1 Échantillon 2
56 Principe du test de comparaison (3) Dans les deux situations, l objet du test est de comparer les 2 populations Le principe du test est de regarder : si la différences observées est due au hasard ou au contraire, cette différence est telle qu il est peu probable de l observer par hasard
57 Étapes d un test de comparaison 1. Établir l hypothèse nulle 2. Proposer une hypothèse alternative 3. Choisir le test et vérifier ses conditions d application 4. Calcul du test 5. Les risques d erreur 6. Interprétation finale d un test de comparaison
58 Établir l hypothèse nulle (H 0 ) l hypothèse a priori : les paramètres ou les distributions des populations dont sont issus les échantillons sont identiques.
59 Hypothèse alternative H 1 (1) l hypothèse H1 sera retenue au cas où les résultats du tests aboutiraient à rejeter H 0
60 Hypothèse alternative H 1 (2) Selon le type du problème posé, on propose une H 1 alternative bilatérale ou unilatérale. H 1 bilatérale : lorsqu on ne cherche pas à connaître le sens de la différence. On se contente de postuler que les 2 paramètres ou les deux distributions sont différents. Paramètre Population 1 Paramètre Population 2
61 Hypothèse alternative H 1 (3) H 1 unilatérale : si l on s intéresse à un sens particulier de l inégalité de 2 paramètres tel que paramètre 1> paramètre 2 paramètre 1< paramètre 2 Paramètre Population 1 Paramètre Population 2 Paramètre Population 2 Paramètre Population 1
62 Exercice (1) On veut comparer la fréquence du palu dans deux régions d Afrique. P 1 et P 2 les fréquences des individus infectés dans ces deux régions : Poser l hypothèse nulle H 0 Poser l hypothèse alternative H 1
63 Exercice (2) H 0 : P 1 = P 2 : les deux fréquences sont identiques H 1 : P 1 P 2 : les deux fréquences sont différentes Il s agit d une hypothèse alternative bilatérale car on ignore a priori dans quelle région la fréquence du palu est la plus élevée.
64 Exercice (3) On désire tester un vaccin contre le palu en comparant la survenue de palu entre un groupe vacciné et un groupe témoin non vacciné. P 1et P 2le pourcentage des individus infectés dans chacune des deux populations représentés par les deux groupes. Poser H 0 et H 1
65 Exercice (4) H 0 : P 1 = P 2 :Le vaccin n a aucune efficacité H 1 : P 1 < P 2 : La fréquence des individus infectés dans le groupe vacciné est inférieure à la fréquence dans le groupe non vacciné. H 1 unilatérale car on s intéresse dans ce cas exclusivement aux effets bénéfiques attendus du vaccin.
66 Calcul du test de comparaison (1) Un fois les hypothèses clairement posées, on applique le test. Les tests consistent à : Calculer une quantité mathématique uoqui exprime l écart entre les paramètres ou les distributions. À confronter uoà un modèle de distribution théorique U. A regarder si uoest une valeur probable ou improbable de de U (que l on borne en fonction du risque α)
67 Résultats d un test de comparaison (2) α =α 1 +α 2 α 1 α 2 u1 u2 test On ne rejette pas Ho
68 Résultats d un test de comparaison (3) α =α 1 +α 2 α 1 α 2 u1 u2 On ne rejette pas Ho
69 Résultats d un test de comparaison (4) α =α 1 +α 2 α 1 α 2 u1 u2 On ne rejette pas Ho
70 Résultats d un test de comparaison (5) 2. u 0 est extérieure à l intervalle des valeurs limite [u 1 -u 2 ] : Il est encore possible que ce résultat soit lié à une simple fluctuation d échantillonnage (il reste α chances que ce soit vrai) On décide de ne pas tenir compte de cette faible probabilité On rejette H 0 et on accepte H 1 d une différence réelle entre les paramètres et les distributions étudiés On dit que cette différence est significative
71 Résultats d un test de comparaison (6) α =α 1 +α 2 α 1 α 2 u1 u2 On rejette Ho
72 1. Risque α : Choix des risques d erreur (1) En rejetant H 0 on prend un risque : la probabilité αd observer des valeurs rares de la variable U, si H 0 est vrai Risque de se tromper en rejetant H 0, si par malheur H 0 était vraie. 0 0 C est le risque d affirmer une différence alors qu elle n existe pas. Risque α ou risque de première espèce α= probabilité de rejeter H 0, si H 0 est vraie. αest fixé a priori. Sa valeur est universellement admise à 5%
73 2. Risque β Choix des risques d erreur (2) Risque de ne pas rejeter H 0 alors que H 1 était vrai. Ceci arrive lorsqu il existe bel et bien uendifférence entre paramètres étudiés mais la valeur observée u se situe néanmoins dans l intervalle 95% des valeurs probables de U. Risque β: risque de deuxième espèce β= probabilité de ne pas rejeter H 0, si H 1 est vraie β est appelé manque de puissance. 1-βest appelé puissance d un test = la capacité de rejeter H 0 si celle-ci est effectivement fausse La puissance d un test est liée à l effectif des échantillon. Plus la taille augmente, plus la puissance augmente et le risque β diminue.
74 Interprétation finale du test de comparaison (1) Hypothèse nulle n est pas rejetée : Rien ne permet d affirmer que les paramètres ou les distributions comparés sont différents. On n affirme jamais qu une hypothèse nulle est vraie car : Elle aurait peut-être pu être rejetée si la puissance du test était élevée Il existe de nombreuses raisons pour que les distributions mesurées soient identiques bien que les populations soient complètement distinctes (biais).
75 Interprétation finale du test de comparaison (2) On rejette H 0 : On accepte donc H 1 : H 1 bilatérale: les distribution ou paramètres sont différents. H 1 unilatérale: l un des paramètres est inférieur (ou supérieur) à l autre. On s intéresse au sens de la différence. Et donc qu à une extrémité de la distribution U. Le risque de se tromper est αdivisé par 2 (et donc deux fois moindre que la hypothèse bilatérale.)
76 Interprétation finale du test de comparaison (3) Degré de signification : Le risque αest fixé a priori (et le plus souvent à 5%) Lorsque le calcul de u 0 montre que le seuil U α a été franchi, on rejette H 0 avec un risque égal à α. On peut aller plus loin et préciser le risque pris ou la force de notre conviction à rejeter H 0 C est le degré de signification p, a posteriori. On dit que la différence observée est significative au risque p
77 Interprétation finale du test de comparaison (4)
78 Principes des tests de liaison (1) On teste l existence d une liaison entre deux variables X et Y d un échantillon : Vérifier qu il existe une relation d ordre statistique entre ces variables 2 variables sont liées : variation de l une entraîne la variation de l autre Variabilité biologique : fluctuations dans les mesures des variables : pour une valeur de X, on peut observer plusieurs valeurs de Y et inversement Difficile d utiliser un tableau ou un graphique pour étudier cette liaison
79 Principes des tests de liaison (2) On suppose que la liaison étudiée suit un modèle mathématique théorique: Test : vérifier si la relation observée se rapproche suffisamment du modèle théorique H 0 : il n existe pas d adéquation avec le modèle proposé H 1 : adéquation avec le modèle proposé Si on rejette H 0 on accepte H 1 il existe une relation statistique significative entre les 2 variables Une relation statistique, en aucun cas une relation de causalité
80 Exercice 1 Posez H 0 et H 1 dans les situations suivantes: Comparaison de 2 traitement nouveaux A et B Comparaison de 4 traitements A, B, C et D Comparaison d un traitement A versus placebo Variation de la hauteur des arbres en fonction de leur altitude
81 Réponses Comparaison de 2 traitement nouveaux A et B H 0 : les deux traitements sont équivalents H 1 bilatérale : les deux traitement ont une efficacité différente Comparaison de 4 traitements ABC et D H 0 : les 4 traitement sont équivalents. H1 bilatérale : au moins l un des traitements a une efficacité différente des autres. Comparaison d un traitement A versus placebo H 0 : le traitement A et le placebo sont équivalent H1 unilatérale: Le traitement A a une activité supérieure au placebo Variation de la hauteur des arbres en fonction de leur altitude H 0 : il n existe aucune liaison entre la hauteur des arbre et l altitude H1 unilatérale : il existe une liaison négative entre la hauteur des arbres et leur altitude.
82 Exercice 2 Vous participez à la mise au point d un traitement supposé efficace sur une maladie mortelle, mais dangereux en cas d utilisation erronée. L efficacité du produit est testée sur des groupes d animaux malades et sains. Vous choisissez αde : 10, 5 ou 1%?
83 Réponse 1% : il faut avoir le moindre risque de conclure à tort à une efficacité qui n existerait pas.
84 Exercice 3 Vous participez à la mise au point d un vaccin potentiellement efficace dans la prévention d une maladie grave, et par ailleurs n ayant pas d effet secondaires. L efficacité est testée en comparant un échantillon de sujets vaccinés par le nouveau vaccin et un échantillon vacciné par un vaccin placebo. Vous choisissez de diminuer prioritairement? α β puissance taille des échantillons
85 Réponses βest le risque à diminuer en priorité. Il ne faudrait pas passer à côté d une efficacité réelle du vaccin. On choisira un risque βfaible. Un tel choix entraîne automatiquement une augmentation Un tel choix entraîne automatiquement une augmentation de la puissance (1-β) et donc de la taille des échantillons
86 Comment choisir un test???
87 Série appariées χ2 de Mc Nemar Qualitatif Séries indépendants 2 groupes Effectif theo>5 χ2 de Pearson χ2 de Yates Test de Fisher Séries indépendants k groupes Effectif theo>5 χ2 de Pearson χ2 de Yates Test de Fisher 1 groupe de sujet 2 mesures répétées n>30 10<n<30 Ecart réduit apparié Test de Student apparié Critère de jugement Hypothèses vérifiées 2 groupes n1 et n2>30 Test Ecart réduit 10<n1 et n2 <30 Test de Student k groupes ANOVA Quantitatif Hypothèses Normalité, égalité des variances 1 groupe 2 mesures répétées Petits effectifs Test de Wilcoxon Hypothèses non vérifiées 2 groupes Petits effectifs Test de Mann et Whitney k groupes Petits effectifs Test de Kruskallet Wallis
88 Liaison entre 2 caractères quantitatifs Hypothèses vérifiées normalité égalité des variances Vérifiée 1 échantillon n couples (x,y) Comparaison à 0 de la pente de la droite de régression liant Y à X Coefficient de corrélation Pearson et son test Non vérifiés 1 échantillon n couples (x,y) Petits effectifs Coefficient de corrélation de Spearman et son test
89 Test du χ 2
90 Test du χ 2 Formulation équivalente : Test du chi-deux, du chi-carré, du χ 2 Pearson Ils servent à étudier la relation entre 2 variables qualitatives : Liens entre survenue d une maladie (M+,M-) et sexe (M,F) Catégorie socioprofessionnelles et département bretons % des prématurés en France versus Angleterre
91 Tableau de contingence χ ² s applique à des effectifs regroupés sur un tableau de contingence Un tableau comportant des effectifs observés (O ij ) dans ces cases et les totaux de chaque ligne et de chaque colonne dans ses marges Classes de la B 1 B 2 B j Total variable A A 1 O 11 O 12 t 1 A 2 O 21 t 2 A i O ij t i Total n 1 n 2 n j N
92 Comparaison de 2 pourcentages (5)
93 Interprétation du test de χ 2 (α= 5%) Condition d application : Les effectifs théoriques doivent être supérieurs ou égaux à 5 H 1 bilatérale : Si χ 2 o est inférieur à χ 2 5% on ne rejette pas H 0. : pas de lien entre les 2 variables, ou pas de différence entre les % Si χ 2 o est supérieur à χ 2 5% on rejette H 0 : il existe un lien significatif Si χ o est supérieur à χ 5% on rejette H 0 : il existe un lien significatif entre les 2 variables, ou différence significative entre les %. On cherche alors p.
94 Exercice
95
96
97 Comparaison de 2 pourcentages (1) Exemple de problème : Des patients atteints de la même maladie ont été traités par deux traitements différents. Parmi les 70 qui ont reçu le traitement A, 22 (31,4%) ont guéri. Parmi les 50 qui ont reçu le traitement B, 25 (soit 50%) ont guéri. Le taux de guérison est il différent entre les deux traitement?
98 Test de T
99 Exercice : 1 échantillon / population Dans un échantillon de 18 sujets suspects d être atteints de trypanosomiase,on mesure la quantité de protéines dans le liquide céphalorachidien. On trouve dans ce groupe une protéinorachie moyenne de 460 mg/l avec un écart type de 280 mg/l. Dans la population générale, la protéinorachieest en moyenne de 300 mg/l. On se demande si ce groupe de sujet présente une protéinorachie différente de normale? Formulez les hypothèses H 0 et H 1 Quel test utilisez-vous? Justifiez la réponse Que concluez vous?
100 Réponse H 0 : la protéinorachiedes sujets atteints de drépanocytose ne diffère pas de celle de la population générale H 1 : la protéinorachiedes sujets atteints de drépanocytose est différente de celle de la population n < 30 : Test de T Condition d application : on suppose que la protéinorachieest distribuée normalement chez les sujets atteints de drépanocytose to>t5%: on rejette H 0 la protéinorachiedes sujets atteints de drépanocytose est significativement différente de celle de la population p < 0,03
101 Exercice 2 : comparaison de 2 échantillons independants On a mesuré un marqueur biologique chez 2 séries de sujets, l une composée de sujets sains, l autre de sujets atteints d hépatite alcoolique. L étude a trouvé les résultats suivants: Effectif (n) Moyenne du marqueur (g/l) Ecart type Sujets sains 15 1,6 0,19 Sujets alcooliques 12 1,4 0,21 On veut comparer les 2 populations. Formuler les hypothèses Quel test choisissez vous? Quelles en sont les conditions d application? Que concluez vous?
102 Exercice (2) H 0 : la valeur moyenne du marqueur est identique dans les 2 populations H 1 : la valeur moyenne du marqueur est différente chez les sujets atteints d hépatite alcoolique n < 30 : test de T Condition d application : on suppose que : le marqueur se distribue normalement dans les 2 populations Les variances des 2 populations sont égales Calcul du test = on rejette H0 Les malades atteints d hépatite alcoolique présentent une valeur du marqueur significativement différente de celle des sujets sains p < 0,02
103 Exercice (1) On désire étudier l effet d une nouvelle stratégie de traitement du diabète sur la glycémie. On dose la glycémie chez 15 sujets avant le début du nouveau protocole (série A) et 3 mois après (série B) : A 2,47 3,09 2,14 2,47 3,06 2,72 2,29 1,90 2,34 2,75 2,67 2,80 2,51 2,23 2,20 B 2,30 2,96 2,23 2,34 2,84 2,59 2,15 1,88 2,32 2,65 2,68 2,58 2,43 2,02 2,17 Le nouveau protocole est-il efficace? Formuler les hypothèses Quel test choisissez vous? Quelles en sont les conditions d application? Que concluez vous?
104 Réponse Comparaison de moyennes sur séries appariées : H 0 : les glycémies sont identiques avant et après le nouveau protocole H 1 : la glycémie est abaissée grâce au nouveau protocole n < 30 : test de T Condition d application : la différence de glycémie avant et après le traitement est distribuée de façon normale Calculs : on rejette H 0 La glycémie est abaissée significativement après administration de la nouvelle stratégie p < 0,0005
105 Corrélation et Régression linéaire
106 Représentation graphique Etudier le lien entre 2 variables quantitatives : scatter ou nuage de points Représenter les couples de valeurs (x,y) 1 individu : Mr Dupont 1,85 m et 74 kg
107 Correlation et régression La régression permet d étudier l association entre deux variables quantitatives, en étudiant les variations de l une en fonction des valeurs de l autre. Le coefficient de corrélation est une mesure d association entre deux variables quantitatives faisant jouer des rôles symétriques aux valeurs. On cherche à savoir simplement s il existe une liaison entre ces deux variables et à quantifier l intensité de la liaison
108 Interprétation de ρ ρ>0 ρ<0 ρ=0
109 Propriété de ρ ρest toujours compris entre -1 et 1 ρpermet de mesurer la FORCE DE L ASSOCIATION entre X et Y. Plus ρest proche de +1 ou de -1, plus l association est forte
110 Si X et Y sont indépendantes alors ρ=0 L inverse n est pas vrai : Si ρ~0, les variables peuvent soient être indépendantes mais aussi être liées (mais non linéairement) On peut seulement affirmer que les variables X et Y ne sont pas liées linéairement
111 Test du r Rappel : r concerne les variables d un échantillon Le calcul de r peut être sujet à fluctuation. Tester r, c est tenter d affirmer ou pas que sa valeur est statistiquement significative et ce avec un risque maîtrisé (p<0,05) Même mécanisme que pour les autres test : hypothèses sur la population Ho = Hypothèse nulle : ρ=0 H1 = Hypothèse alternative : ρ=0 (test bilateral)
112 Les observation pour chaque variable doivent être indépendantes les unes des autres. Ex : comparaison des données Y en fonction du temps X Les données de la veille ne sont pas indépendantes des données du lendemain. Il ya auto-correlation nécessite d autres techniques d analyse. Attention au facteur tiers : biais de confusion
113 Régression linéaire
114 Exemple Terme (semaine) Poids moyen de naissance (grammes) , ,73 Termes de naissances (X) et les poids de naissance (Y) d une POPULATION de nouveau né , , , , , , , , , , , , , , ,81
115 Exemple Le poids moyen varie en fonction du terme il y a une liaison entre le terme et le poids de naissance La courbe de régression est celle qui joint les points successifs La FONCTION de REGRESSION est la fonction qui permet de décrire mathématiquement cette courbe
116 Cas de la régression linéaire En pratique, on ne recherche pas la forme exacte de la courbe. On se contente le plus souvent d une droite. La fonction f est alors linéaire et d équation : f ( x) = E( Y / x) yˆ = α + βx = α + βx
117 La droite de régression permettant de mieux représenter les points est : ŷ= α+ βx Sans êtrestrictementlinéaire, la liaison entre le termeet le poids peut être représentée par une droite. On estimeαet β On teste si βest significativement different de 0
118 Comment interpréter βet α ŷ= -3115, ,30 x Estimation de β= 162,30 (p=0,003) augmentation moyennedu poidsde naissance quand le terme augmente d une semaine Augmentation MOYENNE Les poids de 2 bébés nés à 1 semaine d intervalle diffèrent EN MOYENNE de 162,30 g Elle n est à considérer que sur la période considérée α n a pas d interprétation concrète. au poids moyens des nouveau nés ayant un terme = 0 semaine
119 Régression linéaire multiple Y=β 1 X 1 + β 2 X β n X n + α Y = variables dépendantes Xn covariables ou variables explicatives Taille définitive (cm) = 0,881xT 0,198xP 1,597xAO + 0,403xTP + 3,958 T : taille actuelle, P: actuel, AO= âge osseux, TP= moytaille parents Montre que la taille définitive dépend de différents facteurs Montre le poids relatif des facteurs Taille actuelle >5 cm taille définitive = 0,881x5cm = 4,4cm Chaque coefficient β est testé (par rapport à 0) Exprimé soit avec le p soit avec intervalle de confiance : IC AO [-1,3;3] Si l IC inclut 0 alors pas significatif
120 Régression logistique Idem régression linéaire Variable dépendante : qualitative binaire Ex : survenue ou pas d une HTA LogitprobaHTA=0,068xtabac + 0,7xOb+0,9xRonf Les Co-variables sont qualitatives ou quantitatives Les expβ odd ratio. : OR Ronf = exp(0,9) = 2,5 les β sont testés (p ou IC) : pas de significatif si contient 1
121 Introduction à l analyse de survie
122 Etude de survie Principe : S intéresser à la survenue d un événement décès au cours du temps Prendre en compte les données incomplètes ou censurées. Champs d application Description de la survie d un groupe de sujet Comparaison de la survie de 2 ou plusieurs groupes dans un but Pronostique Ou d intervention (traitement, programme sanitaire, etc ) L évènement peut être toute variable d état de nature binaire
123 Exemple d origines et d évènements
124 En pratique clinique La description des évènements est rarement exhaustive. Il est rare de comptabiliser tous les décès Observations complètes Observations incomplètes
125 Définitions pour l analyse de survie Date d origine Date de début de prise en compte du suivi des observations Essai thérapeutique : par ex date du tirage au sort Etude pronostique : date du diagnostic Date des dernières nouvelles Date à laquelle les derniers renseignements concernant l état du sujet ont été colligés Etat aux dernières nouvelles État caractérisé par une variable binaire : par ex : vivant ou décédé.
126 Définitions pour l analyse de survie Date de point : Choix d une date au-delà de laquelle on ne tiendra pas compte de l état Recul : Délai écoulé entre la date d origine et la date de point Temps de participation Calculé à partir de la date d origine et de la date des dernières nouvelles ou de la date de point
127 Date d origine Date des dernières nouvelles Date de point Temps de participation temps Recul
128 Définitions pour l analyse de survie Perdu de vue : Sujet dont on ne connaît pas l état à la date de point Exclu vivant : Sujet vivant à la date de point
129 Définitions pour l analyse de survie Les dates permettent de calculer la durée du suivi pour chaque sujet ou le temps de participation à l'étude. On distingue deux situations : le décès est survenu au cours du suivi, c'est-à-dire avant la date de point (ou date de fin de suivi). La durée de suivi est calculée entre la date d'origine et la date du décès. le décès n'est pas observé au cours du suivi sa durée est alors censurée. Deux cas se présentent alors
130 Exclus-vivants soit le sujet n'est pas décédé à la date de point. Il est dit exclu-vivant. Sa durée de suivi est égale à la différence entre la date de point et la date d'origine. Mais, cela ne signifie pas qu'il est exclu de l'étude. Au contraire, on enrichit l'analyse Date d origine Date de point temps Temps de participation
131 Perdus de vue soit le sujet est perdu de vue. Il ne vient plus aux visites de surveillance. Sa durée de suivi est égale à la différence entre la date des dernières nouvelles et la date d'origine. Les perdus de vue requièrent une analyse attentive car il faut s'assurer que le mécanisme par lequel ils sont perdus de vue est indépendant du phénomène étudié, sinon un biais est introduit dans l'analyse. Date d origine Date des dernières nouvelles Date de point Temps de participation?
132 Estimation non paramétrique de Kaplan Meier Principe de l estimation Être encore en vie après un instant t, c est : Être en vie juste avant t Et ne pas mourir au temps t
133 Représentation graphique : courbe de survie Sujet n 1 DCD S(3)=0,9
134 Intervalle de confiance de l estimateur de kaplanmeier Représentation graphique des intervalles de confiance
135 Médiane de survie Définie comme le temps auquel la fonction de survie estimée vaut 0,5.
136
137
138
139 Comparaison des courbes de survie Données du problèmes : Étude de population présentant le syndrome d Alport. Événement étudié : survenue d une insuffisance rénale terminale Ex : Comparer les courbes de non survenue de l'insuffisance rénale terminale chez les hommes par rapport aux femmes issus de familles différentes.
140 Comparaison des courbes de survie
141 Le test du Log Rank Comment vérifier si cette différence entre les 2 groupes est significative au seuil de 5 %? La méthode statistique la plus employée est le test du logrank consiste à comparer le nombre d'événements observés, ici l'insuffisance rénale terminale, au nombre d'événements attendus, Si le test est significatif, les 2 courbes sont significativement différentes
142 Limites de l interprétation Chirurgie Chimiothérapie Courbes qui se croisent Dans ce cas, les risques s'inversent pour chaque groupe à un moment donné. Le test du logrankn'est plus approprié. Par exemple si, dans un groupe, la mortalité postopératoires est précoce après la chirurgie d'un cancer mais qu'elle se stabilise ultérieurement et si la mortalité initiale est modérée après chimiothérapie mais qu'elle est importante ultérieurement, la décision médicale peut en être modifiée. Un nouveau protocole peut permettre de préciser ces profils de mortalité différentielle.
143 Limites de l interprétation des courbes de survie Des interprétations erronées liées à la lecture de la partie droite d'une courbe de survie. Il est habituel qu'une courbe s'aplanisse après un certain délai lorsque la survenue des événements est moins fréquente. Il n'est pas judicieux d'interpréter cet aplanissement comme porteur de sens sauf si le nombre de sujets encore à risque reste encore important. A l'inverse, si la dernière donnée est un décès, la courbe de survie plonge vers l'axe des abscisses. Ceci ne signifie pas qu'aucun sujet ne survivrait au delà de ce temps de suivi.
144 Méthode actuarielle Même principe que KM Utile lorsque les effectifs sont importants Les taux sont évalués à intervalle régulier fixés a priori (par exemple tous les mois, ou tous les ans ) ACTUARIELLE KAPLAN MEIER
Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»
Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences
Principe d un test statistique
Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre
Statistiques Descriptives à une dimension
I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des
1. Vocabulaire : Introduction au tableau élémentaire
L1-S1 Lire et caractériser l'information géographique - Le traitement statistique univarié Statistique : le terme statistique désigne à la fois : 1) l'ensemble des données numériques concernant une catégorie
Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS
Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence
Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE
UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction
Chapitre 3. Les distributions à deux variables
Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles
Statistique : Résumé de cours et méthodes
Statistique : Résumé de cours et méthodes 1 Vocabulaire : Population : c est l ensemble étudié. Individu : c est un élément de la population. Effectif total : c est le nombre total d individus. Caractère
La survie nette actuelle à long terme Qualités de sept méthodes d estimation
La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg
Annexe commune aux séries ES, L et S : boîtes et quantiles
Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans
Statistique Descriptive Élémentaire
Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Élémentaire (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219 Université Paul Sabatier
METHODOLOGIE GENERALE DE LA RECHERCHE EPIDEMIOLOGIQUE : LES ENQUETES EPIDEMIOLOGIQUES
Enseignement du Deuxième Cycle des Etudes Médicales Faculté de Médecine de Toulouse Purpan et Toulouse Rangueil Module I «Apprentissage de l exercice médical» Coordonnateurs Pr Alain Grand Pr Daniel Rougé
Relation entre deux variables : estimation de la corrélation linéaire
CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence
Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE
Chapitre 5 UE4 : Biostatistiques Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.
Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES
LES STATISTIQUES INFERENTIELLES (test de Student) L inférence statistique est la partie des statistiques qui, contrairement à la statistique descriptive, ne se contente pas de décrire des observations,
Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE
UE4 : Biostatistiques Chapitre 6 Test de comparaison de pourcentages χ² José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Nature des variables
Item 169 : Évaluation thérapeutique et niveau de preuve
Item 169 : Évaluation thérapeutique et niveau de preuve COFER, Collège Français des Enseignants en Rhumatologie Date de création du document 2010-2011 Table des matières ENC :...3 SPECIFIQUE :...3 I Différentes
Séries Statistiques Simples
1. Collecte et Représentation de l Information 1.1 Définitions 1.2 Tableaux statistiques 1.3 Graphiques 2. Séries statistiques simples 2.1 Moyenne arithmétique 2.2 Mode & Classe modale 2.3 Effectifs &
t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :
Terminale STSS 2 012 2 013 Pourcentages Synthèse 1) Définition : Calculer t % d'un nombre, c'est multiplier ce nombre par t 100. 2) Exemples de calcul : a) Calcul d un pourcentage : Un article coûtant
Introduction à l approche bootstrap
Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?
UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES
Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,
TABLE DES MATIERES. C Exercices complémentaires 42
TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence
Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés
Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour [email protected] Une grande partie des illustrations viennent
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
Analyse de la variance Comparaison de plusieurs moyennes
Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction
Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke
www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3
TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.
STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,
Document d orientation sur les allégations issues d essais de non-infériorité
Document d orientation sur les allégations issues d essais de non-infériorité Février 2013 1 Liste de contrôle des essais de non-infériorité N o Liste de contrôle (les clients peuvent se servir de cette
Table des matières. I Mise à niveau 11. Préface
Table des matières Préface v I Mise à niveau 11 1 Bases du calcul commercial 13 1.1 Alphabet grec...................................... 13 1.2 Symboles mathématiques............................... 14 1.3
Biostatistiques : Petits effectifs
Biostatistiques : Petits effectifs Master Recherche Biologie et Santé P. Devos DRCI CHRU de Lille EA2694 [email protected] Plan Données Générales : Définition des statistiques Principe de l
23. Interprétation clinique des mesures de l effet traitement
23. Interprétation clinique des mesures de l effet traitement 23.1. Critères de jugement binaires Plusieurs mesures (indices) sont utilisables pour quantifier l effet traitement lors de l utilisation d
CAPTEURS - CHAINES DE MESURES
CAPTEURS - CHAINES DE MESURES Pierre BONNET Pierre Bonnet Master GSI - Capteurs Chaînes de Mesures 1 Plan du Cours Propriétés générales des capteurs Notion de mesure Notion de capteur: principes, classes,
Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier
Statistiques Appliquées à l Expérimentation en Sciences Humaines Christophe Lalanne, Sébastien Georges, Christophe Pallier Table des matières 1 Méthodologie expérimentale et recueil des données 6 1.1 Introduction.......................................
Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.
ANALYSE 5 points Exercice 1 : Léonie souhaite acheter un lecteur MP3. Le prix affiché (49 ) dépasse largement la somme dont elle dispose. Elle décide donc d économiser régulièrement. Elle a relevé qu elle
Aide-mémoire de statistique appliquée à la biologie
Maxime HERVÉ Aide-mémoire de statistique appliquée à la biologie Construire son étude et analyser les résultats à l aide du logiciel R Version 5(2) (2014) AVANT-PROPOS Les phénomènes biologiques ont cela
Représentation d une distribution
5 Représentation d une distribution VARIABLE DISCRÈTE : FRÉQUENCES RELATIVES DES CLASSES Si dans un graphique représentant une distribution, on place en ordonnées le rapport des effectifs n i de chaque
Docteur José LABARERE
UE7 - Santé Société Humanité Risques sanitaires Chapitre 3 : Epidémiologie étiologique Docteur José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.
Baccalauréat ES Pondichéry 7 avril 2014 Corrigé
Baccalauréat ES Pondichéry 7 avril 204 Corrigé EXERCICE 4 points Commun à tous les candidats. Proposition fausse. La tangente T, passant par les points A et B d abscisses distinctes, a pour coefficient
MATHÉMATIQUES. Mat-4104
MATHÉMATIQUES Pré-test D Mat-404 Questionnaire e pas écrire sur le questionnaire Préparé par : M. GHELLACHE Mai 009 Questionnaire Page / 0 Exercice ) En justifiant votre réponse, dites quel type d étude
Statistiques 0,14 0,11
Statistiques Rappels de vocabulaire : "Je suis pêcheur et je désire avoir des informations sur la taille des truites d'une rivière. Je décide de mesurer les truites obtenues au cours des trois dernières
VI. Tests non paramétriques sur un échantillon
VI. Tests non paramétriques sur un échantillon Le modèle n est pas un modèle paramétrique «TESTS du CHI-DEUX» : VI.1. Test d ajustement à une loi donnée VI.. Test d indépendance de deux facteurs 96 Différentes
Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN
Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN Table des matières. Introduction....3 Mesures et incertitudes en sciences physiques
Réseau SCEREN. Ce document a été numérisé par le CRDP de Bordeaux pour la. Base Nationale des Sujets d Examens de l enseignement professionnel.
Ce document a été numérisé par le CRDP de Bordeaux pour la Base Nationale des Sujets d Examens de l enseignement professionnel. Campagne 2013 Ce fichier numérique ne peut être reproduit, représenté, adapté
Leçon N 4 : Statistiques à deux variables
Leçon N 4 : Statistiques à deux variables En premier lieu, il te faut relire les cours de première sur les statistiques à une variable, il y a tout un langage à se remémorer : étude d un échantillon d
T de Student Khi-deux Corrélation
Les tests d inférence statistiques permettent d estimer le risque d inférer un résultat d un échantillon à une population et de décider si on «prend le risque» (si 0.05 ou 5 %) Une différence de moyennes
Traitement des données avec Microsoft EXCEL 2010
Traitement des données avec Microsoft EXCEL 2010 Vincent Jalby Septembre 2012 1 Saisie des données Les données collectées sont saisies dans une feuille Excel. Chaque ligne correspond à une observation
TSTI 2D CH X : Exemples de lois à densité 1
TSTI 2D CH X : Exemples de lois à densité I Loi uniforme sur ab ; ) Introduction Dans cette activité, on s intéresse à la modélisation du tirage au hasard d un nombre réel de l intervalle [0 ;], chacun
Précision d un résultat et calculs d incertitudes
Précision d un résultat et calculs d incertitudes PSI* 2012-2013 Lycée Chaptal 3 Table des matières Table des matières 1. Présentation d un résultat numérique................................ 4 1.1 Notations.........................................................
FORMULAIRE DE STATISTIQUES
FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)
Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1
UN GROUPE D INDIVIDUS Un groupe d individus décrit par une variable qualitative binaire DÉCRIT PAR UNE VARIABLE QUALITATIVE BINAIRE ANALYSER UN SOUS-GROUPE COMPARER UN SOUS-GROUPE À UNE RÉFÉRENCE Mots-clés
Classe de première L
Classe de première L Orientations générales Pour bon nombre d élèves qui s orientent en série L, la classe de première sera une fin d étude en mathématiques au lycée. On a donc voulu ici assurer à tous
Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.
Université de Nantes Année 2013-2014 L3 Maths-Eco Feuille 6 : Tests Exercice 1 On cherche à connaître la température d ébullition µ, en degrés Celsius, d un certain liquide. On effectue 16 expériences
Terminale STMG Lycée Jean Vilar 2014/2015. Terminale STMG. O. Lader
Terminale STMG O. Lader Table des matières Interrogation 1 : Indice et taux d évolution........................... 2 Devoir maison 1 : Taux d évolution................................ 4 Devoir maison 1
Introduction aux Statistiques et à l utilisation du logiciel R
Introduction aux Statistiques et à l utilisation du logiciel R Christophe Lalanne Christophe Pallier 1 Introduction 2 Comparaisons de deux moyennes 2.1 Objet de l étude On a mesuré le temps de sommeil
Études épidémiologiques analytiques et biais
Master 1 «Conception, évaluation et gestion des essais thérapeutiques» Études épidémiologiques analytiques et biais Roxane Schaub Médecin de santé publique Octobre 2013 1 Objectifs pédagogiques Connaitre
LE ROLE DES INCITATIONS MONETAIRES DANS LA DEMANDE DE SOINS : UNE EVALUATION EMPIRIQUE.
LE ROLE DES INCITATIONS MONETAIRES DANS LA DEMANDE DE SOINS : UNE EVALUATION EMPIRIQUE. Synthèse des travaux réalisés 1. Problématique La question D7 du plan d exécution du Programme National de Recherches
Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie
Partie I : Séries statistiques descriptives univariées (SSDU) A Introduction Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie et tous sont organisés selon le même
Les devoirs en Première STMG
Les devoirs en Première STMG O. Lader Table des matières Devoir sur table 1 : Proportions et inclusions....................... 2 Devoir sur table 1 : Proportions et inclusions (corrigé)..................
Leçon 5. Systèmes de gestion à recomplétement périodique et stock de sécurité
CANEGE Leçon 5 Systèmes de gestion à recomplétement périodique et stock Objectif : A l'issue de la leçon l'étudiant doit être capable : dans le cadre des calendriers d approvisionnement à recomplètement
Cours de Tests paramétriques
Cours de Tests paramétriques F. Muri-Majoube et P. Cénac 2006-2007 Licence Ce document est sous licence ALC TYPE 2. Le texte de cette licence est également consultable en ligne à l adresse http://www.librecours.org/cgi-bin/main?callback=licencetype2.
Pratique de l analyse de données SPSS appliqué à l enquête «Identités et Capital social en Wallonie»
Centre de recherche en démographie et sociétés UCL/IACCHOS/DEMO Pratique de l analyse de données SPSS appliqué à l enquête «Identités et Capital social en Wallonie» 1 2 3+ analyses univariées Type de variables
Probabilités sur un univers fini
[http://mp.cpgedupuydelome.fr] édité le 7 août 204 Enoncés Probabilités sur un univers fini Evènements et langage ensembliste A quelle condition sur (a, b, c, d) ]0, [ 4 existe-t-il une probabilité P sur
Le Data Mining au service du Scoring ou notation statistique des emprunteurs!
France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative
Lire ; Compter ; Tester... avec R
Lire ; Compter ; Tester... avec R Préparation des données / Analyse univariée / Analyse bivariée Christophe Genolini 2 Table des matières 1 Rappels théoriques 5 1.1 Vocabulaire....................................
EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG
Exploitations pédagogiques du tableur en STG Académie de Créteil 2006 1 EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG Commission inter-irem lycées techniques contact : [email protected] La maquette
La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites
La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur
Statistiques - Cours. 1. Gén éralités. 2. Statistique descriptive univari ée. 3. Statistique descriptive bivariée. 4. Régression orthogonale dans R².
Statistiques - Cours Page 1 L I C E N C E S c i e n t i f i q u e Cours Henri IMMEDIATO S t a t i s t i q u e s 1 Gén éralités Statistique descriptive univari ée 1 Repr é s e n t a t i o n g r a p h i
Probabilité et Statistique pour le DEA de Biosciences. Avner Bar-Hen
Probabilité et Statistique pour le DEA de Biosciences Avner Bar-Hen Université Aix-Marseille III 2000 2001 Table des matières 1 Introduction 3 2 Introduction à l analyse statistique 5 1 Introduction.................................
SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique
SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique DOMAINE P3.C3.D1. Pratiquer une démarche scientifique et technologique, résoudre des
Chapitre 2 Le problème de l unicité des solutions
Université Joseph Fourier UE MAT 127 Mathématiques année 2011-2012 Chapitre 2 Le problème de l unicité des solutions Ce que nous verrons dans ce chapitre : un exemple d équation différentielle y = f(y)
MESURE ET PRECISION. Il est clair que si le voltmètre mesure bien la tension U aux bornes de R, l ampèremètre, lui, mesure. R mes. mes. .
MESURE ET PRECISIO La détermination de la valeur d une grandeur G à partir des mesures expérimentales de grandeurs a et b dont elle dépend n a vraiment de sens que si elle est accompagnée de la précision
FPSTAT 2 í La dçecision statistique. 1. Introduction ça l'infçerence. 1
INTRODUCTION ça L'INFçERENCE STATISTIQUE 1. Introduction 2. Notion de variable alçeatoire íprçesentation ívariables alçeatoires discrçetes ívariables alçeatoires continues 3. Reprçesentations d'une distribution
Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux 4 2013-2014
Tests du χ 2 Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux 4 2013-2014 A. Lourme http://alexandrelourme.free.fr Outline
Données longitudinales et modèles de survie
ANALYSE DU Données longitudinales et modèles de survie 5. Modèles de régression en temps discret André Berchtold Département des sciences économiques, Université de Genève Cours de Master ANALYSE DU Plan
Ressources pour le lycée général et technologique
éduscol Ressources pour le lycée général et technologique Ressources pour la classe de terminale générale et technologique Exercices de mathématiques Classes de terminale S, ES, STI2D, STMG Ces documents
Baccalauréat ES/L Amérique du Sud 21 novembre 2013
Baccalauréat ES/L Amérique du Sud 21 novembre 2013 A. P. M. E. P. EXERCICE 1 Commun à tous les candidats 5 points Une entreprise informatique produit et vend des clés USB. La vente de ces clés est réalisée
Evaluation de critères res de substitution de la survie globale dans les cancers bronchiques localement avancés
Evaluation de critères res de substitution de la survie globale dans les cancers bronchiques localement avancés Evaluations de la survie sans progression et du contrôle locoregional comme critère de substitution
3. Caractéristiques et fonctions d une v.a.
3. Caractéristiques et fonctions d une v.a. MTH2302D S. Le Digabel, École Polytechnique de Montréal H2015 (v2) MTH2302D: fonctions d une v.a. 1/32 Plan 1. Caractéristiques d une distribution 2. Fonctions
Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.
Promotion X 004 COURS D ANALYSE DES STRUCTURES MÉCANIQUES PAR LA MÉTHODE DES ELEMENTS FINIS (MEC 568) contrôle non classant (7 mars 007, heures) Documents autorisés : polycopié ; documents et notes de
IBM SPSS Statistics Base 20
IBM SPSS Statistics Base 20 Remarque : Avant d utiliser ces informations et le produit qu elles concernent, lisez les informations générales sous Remarques sur p. 316. Cette version s applique à IBM SPSS
SERIE 1 Statistique descriptive - Graphiques
Exercices de math ECG J.P. 2 ème A & B SERIE Statistique descriptive - Graphiques Collecte de l'information, dépouillement de l'information et vocabulaire La collecte de l information peut être : directe:
Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007
Vision industrielle et télédétection - Détection d ellipses Guillaume Martinez 17 décembre 2007 1 Table des matières 1 Le projet 3 1.1 Objectif................................ 3 1.2 Les choix techniques.........................
Essai Inter-groupe : FFCD UNICANCER FRENCH - GERCOR
CLIMAT - PRODIGE 30 Etude de phase III randomisée évaluant l Intérêt de la colectomie première chez les patients porteurs d un cancer colique asymptomatique avec métastases hépatiques synchrones non résécables
Le don de moelle osseuse :
DON DE MOELLE OSSEUSE Le don de moelle osseuse : se décider aujourd hui, s engager pour longtemps LA MOELLE OSSEUSE ET SA GREFFE La moelle osseuse C est le tissu mou dans le centre du corps des os qui
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un
Analyse et interprétation des données
8 Analyse et interprétation des données Les données de l enquête peuvent être utilisées pour différents types d analyses aussi bien au niveau national qu au niveau international. Ce chapitre explique comment
BACCALAURÉAT GÉNÉRAL SESSION 2012 OBLIGATOIRE MATHÉMATIQUES. Série S. Durée de l épreuve : 4 heures Coefficient : 7 ENSEIGNEMENT OBLIGATOIRE
BACCALAURÉAT GÉNÉRAL SESSION 2012 MATHÉMATIQUES Série S Durée de l épreuve : 4 heures Coefficient : 7 ENSEIGNEMENT OBLIGATOIRE Les calculatrices électroniques de poche sont autorisées, conformément à la
Régression linéaire. Nicolas Turenne INRA [email protected]
Régression linéaire Nicolas Turenne INRA [email protected] 2005 Plan Régression linéaire simple Régression multiple Compréhension de la sortie de la régression Coefficient de détermination R
First Line and Maintenance in Nonsquamous NSCLC: What Do the Data Tell Us?
Dr Jean-Charles Soria : Bonjour et bienvenue dans ce programme. Je suis Jean Charles Soria, Professeur de Médecine et Directeur du programme de développement précoce des médicaments à l université Paris
SINE QUA NON. Découverte et Prise en main du logiciel Utilisation de bases
SINE QUA NON Découverte et Prise en main du logiciel Utilisation de bases Sine qua non est un logiciel «traceur de courbes planes» mais il possède aussi bien d autres fonctionnalités que nous verrons tout
Collecter des informations statistiques
Collecter des informations statistiques FICHE MÉTHODE A I Les caractéristiques essentielles d un tableau statistique La statistique a un vocabulaire spécifique. L objet du tableau (la variable) s appelle
LE RÔLE DE LA STATISTIQUE DANS UN PROCESSUS DE PRISE DE DÉCISION
LE RÔLE DE LA STATISTIQUE DANS UN PROCESSUS DE PRISE DE DÉCISION Sylvie Gervais Service des enseignements généraux École de technologie supérieure ([email protected]) Le laboratoire des condensateurs
Evaluation de la variabilité d'un système de mesure
Evaluation de la variabilité d'un système de mesure Exemple 1: Diamètres des injecteurs de carburant Problème Un fabricant d'injecteurs de carburant installe un nouveau système de mesure numérique. Les
Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI
1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage
INTRODUCTION A L ELECTRONIQUE NUMERIQUE ECHANTILLONNAGE ET QUANTIFICATION I. ARCHITECTURE DE L ELECRONIQUE NUMERIQUE
INTRODUCTION A L ELECTRONIQUE NUMERIQUE ECHANTILLONNAGE ET QUANTIFICATION I. ARCHITECTURE DE L ELECRONIQUE NUMERIQUE Le schéma synoptique ci-dessous décrit les différentes étapes du traitement numérique
Statistique descriptive. Fabrice MAZEROLLE Professeur de sciences économiques Université Paul Cézanne. Notes de cours
Statistique descriptive Fabrice MAZEROLLE Professeur de sciences économiques Université Paul Cézanne Notes de cours Dernière mise à jour le mercredi 25 février 2009 1 ère année de Licence Aix & Marseille
Estimation et tests statistiques, TD 5. Solutions
ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études
INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES
INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine
Exercices supplémentaires sur l introduction générale à la notion de probabilité 2009-2010
Exercices supplémentaires sur l introduction générale à la notion de probabilité 2009-2010 Exercices fortement conseillés : 6, 10 et 14 1) Un groupe d étudiants est formé de 20 étudiants de première année
TESTS D'HYPOTHESES Etude d'un exemple
TESTS D'HYPOTHESES Etude d'un exemple Un examinateur doit faire passer une épreuve type QCM à des étudiants. Ce QCM est constitué de 20 questions indépendantes. Pour chaque question, il y a trois réponses
