PROBABILITÉS STATISTIQUES

Save this PDF as:
 WORD  PNG  TXT  JPG

Dimension: px
Commencer à balayer dès la page:

Download "PROBABILITÉS STATISTIQUES"

Transcription

1 PROBABILITÉS ET STATISTIQUES Probabilités et Statistiques PAES 0-03 L FOUCA

2 Sommaire Chapitre Statistique descriptive 4 La statistique et les statistiques 4 Généralités sur les distributions statistiques 4. Population et échantillon. Variables statistiques.. Variables quantitatives.. Variables qualitatives ou catégorielles. 3 Distribution statistique d une variable 5 3. Données brutes 3. Suites ordonnées 3.3 Distribution d effectifs. 3.4 Intervalles de classe - bornes - centre de classe 3.5 Représentation des données 4 Indices de Position Indices de dispersion Indices de position (moyenne, médiane, mode) 4. Indices de dispersion (étendue, valeurs extrêmes, quantiles, variance, écart-type) 5 Somme de deux variables 0 Chapitre Principales distributions de probabilité 3 otion de variable aléatoire 3 Loi de probabilité d une variable aléatoire discrète 3. Loi Binomiale ou distribution de Bernoulli 3. Loi de Poisson : 4 3 Loi de probabilité d une variable aléatoire continue 4 3. Loi de Laplace Gauss (ou loi normale) Définition de la loi normale 3.. Courbe représentative de la densité de probabilité 3..3 Loi normale centrée réduite 3..4 Table de l écart réduit 3..5 Importance de la loi normale 3. Lois dérivées de la loi normale Loi du chi-deux 3.. Loi de Student Chapitre 3 : Probabilités conditionnelles. Indépendance entre évènements. Théorème de Bayes. 9 Généralités 9 Les éventualités résultant d une expérience: Propriétés élémentaires des probabilités Probabilités conditionnelles 9 3 Indépendance en Probabilité 0 4 Théorème de Bayes 0 Chapitre 4 Fluctuation d échantillonnage Population des Echantillons issus d une population d individu Fluctuations d échantillonnage d une moyenne 3 Fluctuations d échantillonnage d une proportion Chapitre 5 Estimation par intervalle de confiance ²5 Généralités 5 Estimation ponctuelle 5 Estimation par intervalle de confiance. 6. Variable quantitative estimation d une moyenne par intervalle de confiance. Variable qualitative estimation d une fréquence par intervalle de confiance 3 Précision d un intervalle de confiance 7 4 ombre de sujets nécessaire 7 Chapitre 6 : Comparaison d une caractéristique observée à une caractéristique théorique 9 Etapes d un test statistique - grands échantillons: 9 Risque de première, risque de deuxième espèce, puissance d un test statistique 30 Chapitre 7. Comparaison de deux variances 3 Test de Fisher 3 Table de Fisher 33 Chapitre 8 Comparaison entre deux caractéristiques observées 34 Comparaison de deux moyennes observées 34. Cas des échantillons indépendants. Cas des échantillons appariés Probabilités et Statistiques PAES 0-03 L FOUCA

3 3 Comparaison de deux fréquences observées 38. Cas des échantillons indépendants. Cas des échantillons appariés Chapitre 9 Le test de chi-deux 39 Le chi-deux d indépendance 39 Le chi-deux d ajustement 4 3 Table de chi-deux 4 Chapitre 0 Tests non paramétriques 45 Principes des tests non paramétriques 45 Tests non paramétriques avec échantillons indépendants 45 3 Table de U - pour le test de Mann et Whitney 47 4 Tests non paramétriques avec échantillons appariés 47 Références 48 Probabilités et Statistiques PAES 0-03 L FOUCA

4 4 Chapitre Statistique Descriptive. La statistique et les statistiques La statistique est une «méthode de raisonnement permettant d interpréter le genre de données très particulières, qu on rencontre notamment dans les sciences de la vie, dont le caractère essentiel est la variabilité «D. Schwartz». Les statistiques ensemble des données relatives à un groupe d individus ou d unités. La statistique descriptive est la phase de la statistique qui se limite à décrire ou analyser une population donnée, sans tirer de conclusion pour une population plus grande.. Généralités sur les distributions statistiques La statistique descriptive va nous permettre d étudier un certain nombre d objets par le terme de série ou ensemble statistique. Il existe grands types de séries statistiques : la population et l échantillon... Population et échantillon Population : ensemble de tous les individus qui relèvent d une définition donnée. La population est plus ou moins vaste, selon sa définition (parfois, des milliers de sujets). Echantillon = fraction de la population Pour avoir des renseignements sur la population à partir de l échantillon extrait : l échantillon doit être représentatif. L échantillon est représentatif si sa taille est suffisamment grande et si il est extrait au hasard de la population (tirage au sort).. Variables statistiques Une variable statistique est une caractéristique p La variable peut être quantitative ou catégorielle... Variables quantitatives : sont des variables mesurables : poids, taille, âge. Elles sont souvent accompagnées d une unité de mesure (ex : poids = 50 kg). On distingue sous catégories : * Variables continues qui peuvent prendre un nombre infini de valeur dans un intervalle donné (ex : taille, pression artérielle diastolique). * Variables discrètes : ne peuvent prendre qu un nombre fini de valeur : ex : nombre d enfants d une famille. On transforme souvent une variable continue en variable discrète : c est la discrétisation ou groupement par classe... Variables qualitatives ou catégorielles. Ce sont des variables non mesurables. Elles ont un certain nombre de catégories ou modalités. Une variable catégorielle à catégories est dite dichotomique ou (binaire). Ex la variable fumeurs (fumeurs-non fumeurs) est une variable catégorielle à deux catégories. En présence de plusieurs catégories, on distingue : Les variables ordinales : elles peuvent bénéficier d un classement ordonné ou d un ordre naturel. Probabilités et Statistiques PAES 0-03 L FOUCA

5 5 Ex : l intensité de douleur : nulle, légère, intense, insupportable. La transformation d une variable catégorielle ordinale en variable catégorielle dichotomique est possible. Ex pour la douleur : pas de douleur / douleur. Les variables nominales : Il n existe pas d ordre naturel. Chaque classe désigne une catégorie (elle la nomme). Par exemple, pour la couleur des yeux : noir / marron / vert /bleu. 3 Distribution statistique d une variable 3. Données brutes : données rassemblées sans se soucier d un ordre quelconque. 3. Suites ordonnées : les données sont rangées par ordre fixe (croissant ou décroissant). Considérons la valeur x i, elle se rencontre n i fois n i est appelé effectif f i = n i /n est appelé fréquence ou pourcentage (* 00) Valeur effectif fréquence de la variable x n f x i n i f i x p n P f p n n est l effectif total de l échantillon 3.3. Distribution d effectifs. Après avoir ordonné les données, on découpe l étendue en classes (ou catégories) et on dénombre toutes les mesures qui tombent à l intérieur d une même classe. A chaque classe on associe l effectif (et la fréquence). Ex : Répartition d un dosage chez l enfant de moins de 6 ans : Valeur du dosage effectif > 0 - <0 6 > 0 - <30 6 > 30 - <40 4 > 40 - <50 6 Total Intervalles de classe - bornes - centre de classe Les classes sont d étendues égales (en général). La borne inférieure comprise, borne supérieure exclue. Considérons la classe 0-30 du tableau -Cette classe définit tous les enfants dont le dosage est compris entre 0 et 30. -La borne inférieure est 0, la borne supérieure est L intervalle de classe est fermé : > 0 - <30 ou encore [0-30[ Dans un intervalle de classe ouvert, une des bornes n existe pas. Ex valeur du dosage >50 -Le centre de classe est défini comme la moyenne des bornes de la classe : Pour la classe le centre de classe est 35. Dans une distribution en classes, lors du calcul de la moyenne ou de la variance, chaque élément d une classe a la valeur du centre de classe : on suppose donc que les 4 enfants de la classe ont une valeur du dosage égale à Représentation des données Probabilités et Statistiques PAES 0-03 L FOUCA

6 6 Elle dépend du type de la variable étudiée. Il existe des formes de présentation différentes pour les variables quantitatives et catégorielles. Le tableau Le tableau est utilisable quelle que soit la nature des données. Il permet de présenter de façon complète et précise les données Distribution de l âge de 80 hommes suivis dans un service de Diabétologie. Age (ans) Effectif s Fréquence (%) , , , , , , , , , , , 5 0 0, , , , , , , , ,0 =80 La fréquence ou effectif relatif d une classe ou de la valeur d un caractère quantitatif est le rapport entre l effectif de cette classe et l effectif total de l ensemble des classes. En général, elle est exprimée en % Ex classe [40 45[ ans: 6 %. On peut aussi représenter cette distribution de l âge en classes. Age (ans) Effectifs Fréquence (%) Fréquence cumulée (%) [40 45[ [45 50[ [50 55[ [55 60[ La fréquence cumulée d une classe correspond à l ensemble des éléments inférieurs à la borne supérieure de cette classe. Pour la classe [45 50[la fréquence cumulée est 46% (6% + 30%). On a 00% à la borne supérieure de la dernière classe. Quelques principes : Par convention, le titre du tableau figure au dessus du tableau. Il doit être informatif. Dans un bandeau de titre, on indique la nature des informations, avec un trait plein au dessus et au dessous du bandeau. Les chiffres sont alignés par colonne et le même nombre de décimale est donné. Le graphique Probabilités et Statistiques PAES 0-03 L FOUCA

7 7 Par convention, le titre d un graphique figure au-dessous du graphique.. Pour une variable quantitative continue, L histogramme : est un graphique où l axe des abscisses représente les valeurs de la variable, regroupées en classes, et l ordonnée représente l effectif ou la fréquence de chacune des classes. Effectif ou fréquence L aire d un rectangle est proportionnelle à l effectif ou à la fréquence de la classe Age (ans) Figure : Distribution de l âge Chez 80 hommes. Le polygone de fréquence : est la courbe obtenue en joignant les points dont les abscisses sont les centres de classes et les ordonnées les effectifs -Le choix de l échelle doit être correct -L axe des abscisses couvre toute l étendue des données présentées. Dans notre exemple, 40 à 60 ans. -Il n y a pas d espace entre la base des différents rectangles en abscisse (variable continue). Pour une variable catégorielle. Le diagramme à barres. Permet de donner la fréquence (ou le nombre) de chaque catégorie Un espace est laissé entre chaque barre. Effectifs Figure : Description de l intensité de la douleur chez 05 enfants drépanocytaires Figure : Description de la douleur chez des enfants drépanocytaires. Représentation à l aide d un diagramme en secteurs Le diagramme en secteurs dit en «camembert Donne la répartition d une variable qualitative. Il est souvent moins informatif qu un tableau. Probabilités et Statistiques PAES 0-03 L FOUCA

8 8 4. Indices de Position Indices de dispersion. Ils permettent de présenter de manière synthétique les données observées dans l échantillon. 4.. Indices de position 4.. Moyenne arithmétique (ou moyenne) Pour une variable quantitative la moyenne permet de résumer les valeurs obtenues sur un échantillon Définition La moyenne est un paramètre de position. La moyenne est obtenue en faisant la somme des valeurs divisée par le nombre de valeurs (noté ici ). -Soit une série de n mesures x, x..x n d une variable quantitative X. La somme est notée n xi (somme de toutes les valeurs, de la première à la dernière) i n xi x x.. xn La moyenne est désignée par X = soit X = i n ( on remarque que xi =. X ) i Ex : Si on considère l âge en années de 7 étudiants : 0, 7, 3, 9, 6,8. On a : x = 0, x = 7, x 3 = 3, x 4 = 9. x 5 = 6, x 6 = 8 La somme = 3 ans et la moyenne = 8,83 ans. -Considérons un échantillon divisé en k classes de valeurs centrales y j : k n j y j j X = n j étant l effectif de la jième classe n j Si chaque élément de l échantillon a la même chance d être tiré : PJ = probabilité que (X = y J), on obtient l espérance mathématique X = k j Propriétés de la moyenne y jp J On peut réaliser un changement d origine et/ou d échelle pour simplifier les calculs Changement d origine : (méthode de la moyenne provisoire) Soit la variable X = X x 0 On démontre que X ' = X x 0 X = X ' + x 0 On a intérêt à choisir x 0 de manière à obtenir une simplification des calculs et donc des valeurs très petites de X. Il faut choisir de préférence le mode. Changement d échelle : Probabilités et Statistiques PAES 0-03 L FOUCA

9 9 X = X h X X ' = h X = h X ' Changement d origine et Changement d échelle X x0 X x0 X = X ' = X = h X ' + x 0 h h Autre propriété : la somme algébrique des écarts à la moyenne est nulle. 4.. La médiane La médiane est la valeur centrale de la distribution, qui divise l échantillon en deux moitiés de taille égale (même effectif). L une à toutes les valeurs supérieures à la médiane, l autre a toutes les valeurs qui lui sont inférieures. - Si le nombre d observations est impair, la médiane est la valeur correspondant à l observation située au milieu, celle située au (n ) ème rang. (3 ème rang pour l exemple ci-dessous). Ex des étudiants de la salle IL faut d abord classer toutes les observations par ordre croissant. Pour 0, 7, 3, 9, 6, on observe après classement 6, 7, 9, 0, 3 La médiane est 9 ans - Si n est un nombre pair, on considère que la médiane est à mi-chemin entre les deux valeurs du milieu. 6, 7, 9, 0, 3, 4 médiane = (9 + 0)/ = 9, 5 ans Le Mode (ou valeur dominante) C est la valeur de la variable la plus souvent rencontrée. Dans la distribution d une variable, le mode peut ne pas exister ou ne pas être unique X = (,, 5,, 4,, 5) a pour mode X = (, 3, 5,, 4, 7) pas de mode X = (, 7, 5,, 5, 8, 9) a pour mode et 5. On parle de distribution bimodale. Sur un plan graphique, le mode est la valeur de x sur l axe des abscisses dont l ordonnée est la plus grande. Si les données sont rangées par classes, la classe modale est celle dont l effectif est le plus élevé. 4. Indices de dispersion : 4.. Valeurs extrêmes : la plus petite et la plus grande des valeurs Ex de l âge avec les valeurs suivantes : 6, 7, 9, 0, 3, 4 ans La plus petite valeur est 6 (minimum), la plus grande est 4 (maximum). L étendue est 6 4 ans = 8 ans. 4.. Etendue : L étendue d une série correspond à la différence entre les valeurs extrêmes Les quantiles : quartiles, déciles, percentiles. Les quartiles : valeurs qui partagent la série ordonnées en 4 groupes de même effectif. On détermine des quartiles pour des échantillons importants. Ces quartiles se répartissent en : Probabilités et Statistiques PAES 0-03 L FOUCA

10 0 -Premier quartile : valeur de la série qui a 5% (n/4) de la distribution au dessous et 75% au dessus. -Deuxième quartile, correspond à la médiane qui a 50% (n/) au dessous et 50% au dessus. -Troisième quartile, valeur de la série qui a 75% (3n/4) de la distribution au dessous et 5% au dessus. Déciles : partagent la distribution en 0 parties égales Centiles: partagent la distribution en 00 parties égales 4..4 Variance Définition de la variance La variance est égale à la somme des carrés des écarts à la moyenne divisée par l effectif total. Si x = (x, x, x n ) La variance est notée var (x), σ, ou s pour l échantillon. n x X s (X) = i n x X i La variance a l unité de la variable au carré: si x est par exemple une longueur exprimée en cm, la variance est exprimée en cm Si on développe le numérateur, on obtient i n x X x i On peut écrire la formule de la variance sous la forme suivante. xi s (X) = T T / avec T = x et T i = x c est la formule la plus utile pour i i i effectuer des calculs. Propriétés de la variance Changement d origine : un changement d origine ne modifie pas la variance X = X x 0 On démontre que s ' ( X ) = s (X) s (X) = s ' ( X ) Changement d échelle : X X = s ' s ( X ) ( X ) = s (X) = h. s ' ( X ) h h Changement d origine et Changement d échelle : ' X x0 X = s ' s ( X ) ( X ) = s (X) = h. s ' ( X ) h h 4..5 L écart-type Si l on souhaite exprimer la dispersion avec une même unité que la variable elle-même, Il faut considérer l écart type = racine carré de la variance. s(x) = var X s(x) = s X 5. Somme de variables Pour la moyenne Soit Y et Z deux variables quantitatives (ou plus généralement variables aléatoires) et soit X = Y + Z On démontre que X Y Z Probabilités et Statistiques PAES 0-03 L FOUCA

11 L espérance d une somme algébrique de variables aléatoires est la somme algébrique des espérances de ces variables. IL en résulte que : s (X) = i En développant, on trouve s (X) = y Y z y i Z Y i i i z i Z y i Y z i Z cov Y, Z s (Y + Z) = s (Y ) + s ( Z) + cov (Y, Z) La relation entre les variances se simplifie si les variables Y et Z résultent de tirages indépendants dans une population. Mais La covariance de deux variables aléatoires indépendantes est nulle. Cov (Y, Z) = 0 et donc s (Y + Z) = s (Y ) + s ( Z) Remarque si X = Y Z De la même façon : X Y Z s (Y - Z) = s (Y ) + s ( Z) - cov (Y, Z) et on retrouve si Y et Z sont indépendants s (Y - Z) = s (Y ) + s ( Z) Exercice On dose une enzyme chez 00 individus normaux avec les résultats suivants (les dosages sont exprimés en unités arbitraires :U) Classe Effectif [ 4 à 6 U [ 5 [ 6 à 8 U [ 40 [ 8 à 0 U [ 0 [0 à U[ 0 [ à 4 U[ 5 (Pour les classes : borne inférieure comprise, borne supérieure exclue). - Quelle est la classe modale de cette distribution? Donner sa définition.. On admet que X est le centre de classe. Après un changement d origine : Y = X 9, on obtient : - la somme des valeurs de Y n i y i = la somme des carrés des valeurs de Y n i y i = 680 Calculer la moyenne et la variance du taux de cette enzyme..3 Quels sont les pourcentages de sujets ayant : a) une valeur inférieure à 8 b) une valeur supérieure ou égale à 0.4 Tracer l histogramme correspondant à cette distribution Corrigé. : Classe modale 6 à 8 Sa définition : c est la classe des valeurs de cette variable la plus souvent rencontrée (ou encore ayant l effectif le plus élevé).. : Calcul de la moyenne et de l écart-type i y i Y z i Z Probabilités et Statistiques PAES 0-03 L FOUCA

12 effectif n i Y i n i Y i 4 à 6 U 5 6 à 8 U 40 8 à 0 U 0 0 à U 0 à 4 U 5 =00 T = -40 T =680 =00, T = -40, T =680 - Y = X x 0 mx = my + x 0 niyi - my = -,4 U mx = -,4 + 9 m x = 7,6 U - s y = T T s y = 4,84 s y = s x s x= 4,84 U.3 pourcentage de sujets ayant a) une valeur inférieure à 8 = 65 /00 = 0,65 soit 65% b) une valeur supérieure ou égale à 0 = 5 /00 = 0,5 soit 5% Probabilités et Statistiques PAES 0-03 L FOUCA

13 3 Chapitre Principales distributions de probabilité En général, on ne connaît pas les distributions des variables que l on étudie dans une population et on essaie de rattacher ces distributions à certaines lois théoriques qui constituent des modèles.. otion de variable aléatoire On peut caractériser une variable aléatoire X par la donnée complète de la distribution de probabilité. Soit E un ensemble d évènements pour lesquels on a défini une distribution de probabilité. On appelle variable aléatoire X une fonction numérique définie sur cet ensemble E Une variable aléatoire traduit une situation liée au hasard. Par convention on écrit : En majuscules la variable En minuscules la valeur déterminée que prend la variable (la réalisation de la variable) La variable peut-être discontinue (ou discrète) ou continue. La variable x est dite discontinue si elle ne peut prendre que certaines valeurs x, x, x i..x n. On parle aussi de variable discrète. On peut associer à chaque valeur de x i une probabilité p i telle que : pi= Pr (X=x i ). Les lois principales sont : - la loi binomiale - la loi de Poisson Une variable est dite continue si elle peut prendre toutes les valeurs sur un certain intervalle fini ou infini. La principale loi de probabilité est la loi de Laplace-Gauss dite encore loi ormale.. Loi de probabilité d une variable aléatoire discrète. Loi Binomiale ou distribution de Bernoulli Soit une variable aléatoire ayant valeurs possibles et 0 (événement et son contraire) Exemples : succès / échec Boules noires / boules blanches dans une urne. La variable prend la valeur avec une probabilité p et la valeur 0 avec la probabilité q (q = p) Elle suit la loi de Bernouilli. On parle de variable de Bernoulli de paramètre p. Sa moyenne vaut p et sa variance p ( p) = pq La variable binomiale est la somme de n variables de Bernoulli indépendantes. Considérons une suite de n épreuves de Bernoulli identiques et indépendantes. Appelons k le nombre de réalisations de l événement A (nombre de succès ou nombre de boules noires) au cours de n épreuves. k est une réalisation d une variable K qui peut prendre les valeurs 0,,.n (intervalle fini). La loi binomiale dépend de paramètres p et n. Formule de la loi Binomiale : Probabilités et Statistiques PAES 0-03 L FOUCA

14 4 Pour une variable aléatoire X suivant une loi binomiale de paramètres p et n k k n k P (X = k) : C. p. q avec C k n = nombre de combinaison de n «objets» pris k par k ; n n! C k n = k!( n k)! Rappel : Le nombre n! se lit "factorielle n". Exemple : 5! La variable binomiale a pour moyenne la somme des moyennes (n.p) et comme variance la somme des variances (n.p.q) Moyenne : E (X) = n.p Variance : Var (X) = n.p.q et écart-type (X) = n. p. q Si l on exprime les résultats en pourcentage observé p o p o p Var p o pq / n. Loi de Poisson : = k/n La loi de Poisson s applique aux évènements «rares», p est très petit. Définition : lorsqu une variable aléatoire X suit une loi de Poisson, ses valeurs possibles sont 0,,, 3 k La probabilité p k d observer la valeur k est donnée par la formule : a a k k! P (X = k) = e a étant le paramètre de la loi de Poisson Moyenne E (X) = Var (X) = a C est donc une loi discontinue qui ne dépend que d un seul paramètre a. On appelle aussi la loi de Poisson la loi des petites probabilités De nombreux phénomènes suivent une loi de Poisson. Elle permet de représenter la survenue d évènements qui se produisent au hasard dans le temps ou dans l espace. Exemple : en pharmacovigilance, la loi de Poisson permet d estimer la fréquence des évènements adverses à partir des rares cas signalés. Exemple : le nombre d éléments (bactéries, hématies etc.) d une solution très diluée observée dans le champ d un appareil appelé hématimètre. Cet appareil comporte un certain nombre de carrés et on compte le nombre d éléments par carré. Si la préparation est homogène, la distribution observée doit suivre une loi de Poisson. Dans le cas contraire, la préparation n est pas homogène. 3. Loi de probabilité d une variable aléatoire continue 3. Loi de Laplace Gauss (ou loi normale) 3.. Définition de la loi normale Soit une variable continue X pouvant prendre toutes les valeurs de à La loi normale est définie par sa densité de probabilité s écrit : ( x f (x) = ) e (formule à ne pas retenir) e est la base des logarithmes népériens. µ désigne l espérance (la moyenne) et est la variance de la variable aléatoire X Probabilités et Statistiques PAES 0-03 L FOUCA

15 5 L écart-type = racine carrée Si X obéit à une loi normale de moyenne et d écart-type, on note en abrégé X est (, ) 3.. Courbe représentative de la densité de probabilité La courbe représentative de la densité de probabilité est souvent appelée «courbe en cloche» Elle est symétrique par rapport à l abscisse pour f(x) La moyenne est et est en même temps la médiane et le mode L écart-type est. On montre que est la distance entre l axe de la courbe et le point d inflexion de la courbe Loi normale centrée réduite Une loi normale est complètement définie par la structure de sa fonction de densité et les données de son espérance et de son écart-type. Il y a autant de variables X normales que de couples de nombres et. Cas particulier = 0 et = alors, f (x) = On a alors affaire à la loi normale réduite. ( x) Désignons la variable réduite par le symbole U (elle est parfois nommée ε). On montre qu on peut passer d une variable normale quelconque X à une variable réduite U par un changement de variable linéaire de la forme : X = + U Soit U = X Propriétés de la loi normale réduite La moyenne E(U) = 0, la variance Var (U) = U = (0,) C est la variable normale centrée réduite (encore appelée variable réduite) ; La densité de probabilité de la Loi normale centrée réduite est (u) f (u) = e La courbe de cette loi normale centrée réduite u = x e -u 0 +u Probabilités et Statistiques PAES 0-03 L FOUCA

16 6 Règle : Pour obtenir une variable normale réduite U à partir d une variable normale X de moyenne et d écart-type, il suffit de lui retrancher sa moyenne et de la diviser par son écarttype. U = X. Toute question posée sur X sera transformée en question posée sur U. On déduit facilement la probabilité pour qu'une variable suivant une loi normale quelconque X(μ, σ) de moyenne μ et d'écart-type σ, soit comprise dans un intervalle donné [x, x ] : x Pr (x < X <x ) = Pr ( x < U < ) 3..4 Table de l écart réduit P (u) est associée à cette loi normale : elle donne pour chaque valeur de U la probabilité que U soit à l extérieur de l intervalle (-u ; +u) P (u) = Pr (U < -u ou U > u) Ou = Pr ( U > u) P (u) -u 0 +u P (u) P(u) P(u) est représenté par la zone hachurée. On en déduit que P(u) = Pr (-u U u) ou On utilisera souvent en statistique les relations suivantes avec un seuil 5 % Pr ( U >,96) = 0,05 Pr (-,96 U,96) = 0,05 = 0,95 On peut lire la table à partir de P(u) ou à partir de U : La valeur de P(u) est obtenue par addition des nombres inscrits en ligne et en colonne. A leur intersection est lue la valeur de U Ex pour α = 0,05, la valeur U est lue à l intersection de la ligne indicée par 0,00 et de la colonne indicée par 0,05 (est alors 0,00 + 0,05) U =,96. U = P(u) =0,3 P(u) = 0,68 U = 0,68 ( ) 3 P(u) =0,50 P(u) = 0,50 U = P(u) =0,3 P(u) = 0,68 U =,96 ( ) P(u) =0,05 P(u) = 0,95 Quelques probabilités : a) Pr (u) = Pr (U > u) P(u) Pr (u) = b) Pr (u) = Pr (U < u) P(u) Pr (u) = - Probabilités et Statistiques PAES 0-03 L FOUCA

17 7 c) Pr 3 (u) = (0 < U < u) Pr 3 (u) = P(u) (ou encore 0,5 P(u) ) d) Pr 4 (u) = (U < 0) ou Pr 4 (u) = (U > 0) Pr 4 (u) = 0, Importance de la loi normale -L importance de la loi normale vient du théorème fondamental énoncé ci-dessous. La moyenne d un échantillon extrait d une population quelconque est distribuée selon une loi pratiquement normale quand la taille de l échantillon est suffisamment grande. -Autres raisons de l importance de cette loi normale : - La loi normale est la loi limite de la loi binomiale et de la loi de Poisson En pratique, l approximation est valable quand : np et n ( p) > 0 pour la loi binomiale np = a > 0 pour la loi de Poisson Remarque : la loi de Poisson qui devient normale garde sa propriété essentielle Moyenne E (X) = Var (X) - Si des variables sont gaussiennes, il en est de même de leur somme et de leur différence. - Souvent une transformation simple conduit à une distribution normale. On peut écrire X = log Y. X est alors distribuée normalement. 3.. Lois dérivées de la loi normale 3.. Loi du chi-deux Définition de la loi de chi-deux Soit U U.U V, n variables aléatoires indépendantes distribuées chacune selon une loi normale centrée réduite (c est-à-dire de moyenne 0 et d écart-type ), la somme des carrés de ces variables aléatoires définit une nouvelle variable aléatoire, notée U + U +.U V Cette nouvelle variable suit une loi de à v degré de liberté (ddl). La variable aléatoire à ddl correspond donc au carré d une loi normale centrée réduite La table de la loi de donne la valeur de telle que p = Pr ( n fonction du nombre de ddl. Pour le test de : voir chapitre Loi de Student Soit X une variable aléatoire distribuée selon une loi normale de moyenne µ et de variance σ. Soit X, X,.X n, un échantillon de taille n. Soit m et s les estimations de µ et σ. La quantité t m t suit une loi de probabilité de Student à n- ddl. s n La table de Student donne la probabilité p telle que p= Pr t > t α, pour n- ddl Pour le test de Student / : voir chapitre 6. Remarquons que quand n > 30, t suit approximativement une loi normale réduite U car m est distribué normalement et s ne s écarte pas trop de σ. Probabilités et Statistiques PAES 0-03 L FOUCA

18 8 Exercices Exercice. Soit une variable aléatoire X distribuée selon une loi normale centrée réduite Quelle est la valeur de la limite y pour que les expressions suivantes soient vérifiées? a) Pr (x > y) = 0,70 b) Pr (x > y) = 0,40 Exercice. Dans une population, on admet que la valeur X du taux de cholestérol sanguin obéit à une loi normale de moyenne =, g/l et d écart-type = 0,5 g/l.. De quel type de variable s agit-il?. - Quelles sont les probabilités pour qu un sujet tiré au hasard ait un taux de cholestérol a) supérieur à,g/l b) compris entre,g/l et,7g/l Corrigé exercice X est une variable aléatoire distribuée selon une loi normale centrée réduite La valeur de la limite y pour que les expressions suivantes soient vérifiées a)pr (x > y) = 0,70 y < 0 - = 0,70 0, 60 y = - 0,54 b)pr (x > y) = 0,40 = 0,40 0, 80 y = 0,53 Corrigé exercice. Le taux de cholestérol sanguin est une variable quantitative. - X est (, ) avec =, g/l et = 0,5 g/l. Y = x Y est (0, ) a) Calcul de la probabilité pour que x >,g/l Pr (x >,) = Pr (Y >,, ) Pr (x >,) = Pr (Y > - ) 0,5 Y = 0, 05 La probabilité recherchée est - = 0,05 = 0,97 p = 0,97 b) Calcul de la probabilité pour que, < x <,7 g/l Pr (,7 < x < 3,) = Pr (,, < Y <,7, ) 0,5 0,5 Pr (- < Y < ) Y = 0, 05 pour Y = 0, 3 La probabilité recherchée est : - - = ,6 p = 0,8 Probabilités et Statistiques PAES 0-03 L FOUCA

19 9 Chapitre 3 PROBABILITÉS CODITIOELLES IDÉPEDACE ETRE ÉVEEMETS - THÉORÈME DE BAYES.. Généralités On appelle évènements élémentaires, l ensemble des éventualités possibles résultant d une expérience ou d une observation. Exemple : en jetant un dé, les événements élémentaires sont constitués par l apparition de l une des 6 faces. L évènement est un sous-ensemble A d un ensemble E (constitué par toutes les éventualités possibles). Les éventualités résultant d une expérience: Evènement certain : se produit à coup sûr. Sa liste comprend tous les évènements élémentaires. Il est identique à E. Evènement impossible, ne se produit pas Evènement contraire : Si l on s intéresse à un évènement A, deux éventualités sont possibles A et son complémentaire A, A A E Si l on s intéresse à deux évènements A et B -L évènement {A ou B} se réalise si se produit un évènement élémentaire appartenant à A ou à B ou les deux : A B -L évènement {A et B} est réalisé si A et B se produisent les deux à la fois. On note A B -A et B sont incompatibles A et B ne peuvent se produire en même temps. On parle de sousensemble disjoint : A B = Propriétés élémentaires des probabilités - La probabilité de tout évènement associé à une épreuve est un nombre compris entre 0 et. - La probabilité de l évènement certain est égale à (00%). Pr (E) = Pr( ) = 0 -Si la réalisation de A entraîne celle de B on écrit A B -Si deux évènements A et B sont incompatibles (ou disjoints) l évènement {A ou B} est égale à la somme des probabilités de A et de B. Pr( A B) = Pr A Pr B -Si A et B sont deux évènements quelconques, on a Pr ( A B) Pr A Pr B Pr( A B) -Si A est le complémentaire de A., Pr( A ) Pr( A.) A B =, la probabilité de. Probabilités conditionnelles Dans un ensemble E des évènements possibles, considérons deux évènements A et B. A est le complémentaire de A B est le complémentaire de B Il est possible de calculer la probabilité de l évènement A si l évènement B s est déjà produit. Il s agit d une probabilité conditionnelle Pr( A B) Pr (A si B) ou Pr A sachant B ou Pr (A B) Pr (A B) = Pr( B) Soit le rapport de Pr ( A et B) sur Pr (B) Probabilités et Statistiques PAES 0-03 L FOUCA

20 0 Cette formule est valide si Pr(B) > 0 : B n est pas un évènement impossible. Réversibilité de la formule (A et B) est le même évènement que (B et A) ; Ils correspondent tous les deux à l ensemble des évènements appartenant à la fois à A et à B. On peut écrire de manière équivalente Pr (A B) = Pr (A).Pr (B A) Pr (A B) = Pr (B A) Au total : Pr (A). Pr (B A) = Pr (B). Pr (A B) Pr (B A) = Pr (B). Pr (A B) 3. Indépendance en Probabilité On dit que deux évènements A et B sont indépendants si la connaissance de l un ne modifie pas la probabilité de l autre. Alors si A et B sont indépendants, Pr (A) = Pr (A B). La réalisation de B n a aucune influence sur celle de A Pr (B) = Pr (B A) La réalisation de A n a aucune influence sur celle de B. Selon la probabilité conditionnelle Pr (A B) = Pr (A). Pr (B A) Pr (A B) = Pr (A). Pr (B) 4. Théorème de Bayes On s intéresse à la modification des probabilités d évènements suite à la connaissance des faits. Il s agit d exprimer Pr (A B), probabilités de A à posteriori (connaissant B) en fonction de probabilité de A à priori. Pr( A B) Pr (A B) = Pr( B) En changeant la formulation du numérateur Pr( B A).Pr( A) Pr (A B) = Pr( B) En général, on ne connait pas B. On peut l exprimer en fonction de A Pr (B) = Pr (A B) + Pr ( A B) Les évènements (A B) et ( A B) sont incompatibles. La probabilité d avoir l un et l autre est la somme des probabilités. Pr (B) = Pr (B A). Pr (A) + Pr (B A ). Pr ( A ). Le théorème de Bayes Pr (A B) = Pr( A B) Pr( B) Pr( B A).Pr( A) Pr( B A).Pr( A) Pr( B A).Pr( A) Exercices Exercice Considérons évènements : A : tirer une face paire au jeu de dés B : tirer un multiple de 3. Donner les valeurs des proabilités suivantes : Pr(A), Pr(B) et Pr (A B) Exercice Soixante pout cent des individus atteints d une maladie (M) sont des femmes. Elles proviennent d une population ou il y a 50% de femmes et 50% d hommes. Dans cette population, la fréquence de la maladie est de %. Quelle est la fréquence de la maladie chez les femmes. Probabilités et Statistiques PAES 0-03 L FOUCA

21 Corrigés exercice : Tirer une face paire et tirer un multiple de 3 sont deux évènements indépendants en probabilité. 3 Pr (A) = Pr (B) = 6 6 Pr (A B) = probabilité de tirer une face paire multiple de 3 (c est à la dire la face 6) = 6 On trouve un résultat identique avec le calcul de Pr (A B) = Pr (A). Pr (B) = exercice En fonction des probabilités conditionnelles, on peut écrire Pr (F). Pr (M F) = Pr (M). Pr (F M) Pr (F M)= 0,60 Pr (F) = 0,50 Pr (M) = 0,0 Pr( F M ).Pr( M ) La fréquence de la maladie chez les femmes. Pr (M F)= Pr( F) 0,60.0,0 Pr (M F)= La fréquence de la maladie chez les femmes. Pr (M F) =,4% 0,50 Probabilités et Statistiques PAES 0-03 L FOUCA

22 Chapitre 4 Fluctuation d échantillonnage Population des Echantillons issus d une population d individu A partir d une population P, on peut extraire de multiples façons des échantillons E. Le tirage au sort d échantillons successifs E, E E I conduit le plus souvent à des valeurs différentes des quantités f (fréquence), m (moyenne), s (variance). Les caractéristiques fournies ne sont pas les caractéristiques exactes. Elles s en écartent plus ou moins selon le hasard de l échantillonnage. On dit qu elles ont des fluctuations d échantillonnage. Le calcul d un intervalle de fluctuation est donc une autre manière de représenter la dispersion d une variable.. Fluctuations d échantillonnage d une moyenne Soit X une variable quantitative de moyenne et d écart-type dans une population P. En considérant différents échantillons de même effectif tirés de P, on observe des moyennes m, m,.m n Ces moyennes subissent une fluctuation d échantillonnage (induite par le hasard). On démontre que : La moyenne de ces moyennes observées vaut La variance de ces moyennes vaut et l écart-type Intervalle de Pari d une moyenne (ou intervalle de fluctuation) au risque. La moyenne m observée dans un échantillon tiré au sort est susceptible de se trouver dans un intervalle [ + U ] avec une probabilité ( - ) Pour une moyenne observée obéissant à une loi normale, Si > 30 (condition de validité) Ou Si X est (, ) dans P, les moyennes observées dans les échantillons d effectifs tirés au hasard suivent une distribution normale (, L intervalle de pari au risque m [ + U ) ] (U valeur de l écart-réduit correspondant à ) * Grand échantillon pour variable quantitative : si > 30 3 Fluctuations d échantillonnage d une proportion Soit Y une variable qualitative Y ayant pour fréquence (ou proportion) P pour un caractère donné dans une population P Probabilités et Statistiques PAES 0-03 L FOUCA

23 3 Considérons différents échantillons de même effectif tirés au sort. Les fréquences «observées» f subissent une fluctuation d échantillonnage (induite par le hasard ) On démontre que - la moyenne des fréquences f, moy (f) = P P.Q - La variance des fréquences var (f) = avec Q = - P Les fréquences observées dans les échantillons d effectifs tirés au hasard suivent une distribution normale (P, P ).Q Intervalle de Pari d une proportion (ou intervalle de fluctuation), au risque. On ne peut définir un intervalle de pari pour un risque qui lui est associé (risque d erreur consenti). La fréquence observée est susceptible de se trouver dans un intervalle défini par un écart autour de P. Conditions d application Si.P et Q > 5 P.Q Ip au risque : f [ P + U ] avec Q = P. ** Grand échantillon pour variable qualitative :.P et Q > 5 (ou > 0 pour certains auteurs). Dans le domaine médical, les paramètres étudiés suivent souvent (de manière approchée) une loi normale Ainsi on peut démontrer, qu une moyenne ou une fréquence observée suivent approximativement une loi normale dès que la taille de l échantillon est assez grande. Ce résultat est approché lorsque l effectif de l échantillon est «grand» est exact si la distribution de la variable X est elle même normale. Exercice Dans une population, la fréquence d un facteur est de %. On tire au hasard un échantillon de 00 sujets. Calculer l intervalle de pari à 95% et à 99% de la fréquence de ce facteur Corrigé P = 0, et n=00 Les conditions d applications sont vérifiées pour le calcul de l intervalle de pari d un pourcentage puisque : np = et q = 88 sont > 5 L intervalle de fluctuation à 95% ( = 0,05 U =,96) f 0, +,96 0, + 0,064 Ip95% [0,06 0,8] 0,* 0, L intervalle de fluctuation à 99% ( = 0,0 U =,576) 0, +,576 Ip99% [0,04 0,0] 0,* 0, , + 0,084 Probabilités et Statistiques PAES 0-03 L FOUCA

24 4 Exercice Dans une population, le poids de naissance des nouveau-nés a une moyenne = 3300g et une variance = g. Considérons des échantillons de 400 nouveaux nés tirés au sort dans cette population. Calculer l intervalle de pari à 95% et à 99% de la moyenne du poids de naissance. > 30. Intervalle de fluctuation (pari) à 95% de la moyenne m des poids de naissance observés sur ces échantillons est , m [35 ; 3349] g. Intervalle de fluctuation (pari) à 99% , m [336 ; 3364] g Probabilités et Statistiques PAES 0-03 L FOUCA

25 5 Chapitre 5 Estimation Intervalle de confiance Généralités : Lorsque l on étudie une caractéristique dans une population, il est souvent nécessaire d étudier cette caractéristique dans un groupe de sujets (échantillon) avant de généraliser les résultats à la population. L estimation est la théorie qui permet cette généralisation de l échantillon à la population. Ex : On souhaite évaluer la prévalence (fréquence) de l hypertension artérielle (HTA) dans un département d outre mer. La population de ce département est trop vaste On sélectionne un échantillon représentatif (tiré au sort) de cette population. On décrit sur cet échantillon la prévalence de l HTA. Puis, on cherche à estimer la prévalence de l HTA dans la population. On distingue types d estimation : l estimation ponctuelle qui fournit une valeur que l on souhaite la plus proche possible de la vraie valeur du paramètre l estimation par intervalle qui donne un intervalle, appelé intervalle de confiance, qui a une probabilité fixée à priori de contenir la vraie valeur du paramètre.. Estimation ponctuelle Définitions et notations L estimation consiste à attribuer une valeur au paramètre étudié à partir des observations faites sur l échantillon. Cette valeur numérique = estimation Il est préférable, de noter différemment la valeur vraie (valeur théorique) du paramètre dans la population, et la valeur estimée sur un échantillon. Les notations des estimations des paramètres les plus couramment utilisées : Paramètre Valeur théorique Estimation sur un échantillon Fréquence P p o ou f Moyenne m Variance s Estimateur, définition La formule ou procédure mathématique utilisée pour «estimer» s appelle l estimateur Biais d un estimateur Le biais d un estimateur est évalué par la différence entre les estimations d un paramètre obtenues sur des échantillons successifs et la vraie valeur du paramètre. Les qualités d un estimateur dépendent de la formule utilisée pour le calculer et de la façon dont a été choisi l échantillon. Les échantillons représentatifs de la population (en pratique, tirés au sort) permettent d éviter la plupart des erreurs dues au choix de l échantillon. Probabilités et Statistiques PAES 0-03 L FOUCA

26 6 Pour qu un estimateur convienne, il faut vérifier qu il présente qualités principales : absence de biais et variance faible. Estimateur sans biais : un estimateur sans biais donne en moyenne la bonne valeur du paramètre. Une variance faible indique que les estimations sont peu dispersées et qu il y a donc peu d écarts entre les valeurs issues de échantillons distincts L absence de biais signifie que les estimations obtenues sur des échantillons successifs ne s écartent pas de la vraie valeur de manière systématique. Un estimateur est donc d autant meilleur qu il est sans biais et a une variance minimum. Estimateur de la fréquence, de la moyenne et de la variance d une variable. La moyenne des fréquences observées f sur des échantillons tirés au sort était égale à la fréquence P théorique dans la population de la variable qualitative étudiée E (f) = P f estime P La moyenne des moyennes observées m sur des échantillons tirés au sort était égale à la moyenne théorique dans la population de la variable quantitative étudiée E (m) = m estime La fréquence et la moyenne observées (sur des échantillons tirés au sort) sont des estimateurs sans biais des moyennes et fréquences théoriques. La variance Soit E un échantillon, d effectif, correctement extrait de P. On s intéresse à une variable quantitative X dans cette population. Soit la variance théorique et inconnue d une variable quantitative X dans une population P. m et s étant respectivement la moyenne et la variance de X observées dans l échantillon E. x s i m (X) = i On démontre que s est un estimateur biaisé pour. L estimateur de comprend un facteur (et non ) Estimation par intervalle de confiance. Soit P une population dans laquelle la variable quantitative X a une moyenne inconnue (ou la variable qualitative Y a une fréquence théorique p inconnue). L intervalle de confiance d un paramètre inconnu est l intervalle dans lequel le paramètre inconnu qu on cherche à estimer a une probabilité ( - α) de se trouver et α de ne pas se trouver.. Variable quantitative estimation d une moyenne par intervalle de confiance (Ic) Cas des grands échantillons ( > 30) La condition de validité ( > 30) doit être pour appliquer la formule de l intervalle de confiance. Probabilités et Statistiques PAES 0-03 L FOUCA

27 7 La moyenne m suit une loi normale de moyenne et d écart-type m est (, m U = est (0, ) s Ic de au seuil α : + Uα ] Cas des petits échantillons ( < 30) Calcul de l intervalle de confiance dans le cas où la variable étudiée X est normale Dans ce cas m est (, ) Ic de au seuil α [ m + tα s ] tα est donné par la table de Student à ( ) degrés de liberté. ). Variable qualitative estimation d une fréquence par intervalle de confiance Cas des grands échantillons (p et q > 5) Les conditions de validité du calcul sont vérifiées à postériori aux bornes de l intervalle de confiance f est (p, p.q ) on estime p.q par f ( f ) U = f p est (0, ) f ( f ) Ic de p au seuil α [f + Cas des petits échantillons (p et q < 5) f ( f ) ] L intervalle de confiance est donné par des tables spéciales : abaques 3. Précision d un intervalle de confiance Pour un risque α donné, la précision du renseignement est donnée par l intervalle de confiance. Elle d autant plus grande que l intervalle est petit. s Uα. est la précision de l estimation de la moyenne. Uα. f ( f ) est la précision de l estimation du pourcentage. 4. ombre de sujets nécessaire En bio statistique, la question suivante est souvent posée : Combien faut-il de sujets, pour répondre à une question, dans une étude. Il est possible de déterminer le nombre minimum de sujets nécessaire pour un sondage, à condition : -de fixer i (la précision désirée) et -de connaître P. P étant inconnu, on peut utiliser une valeur approximative par ex f obtenue au préalable sur un petit échantillon. Probabilités et Statistiques PAES 0-03 L FOUCA

28 8 Si on veut obtenir une précision fixée à l avance, c'est-à-dire un intervalle de confiance déterminé par ± i, on doit avoir, pour un risque α donné i = Uα. f ( f ) U f ( et donc n = i f ) Exercice Dans une population P, on s intéresse au taux de cholestérol sanguin (g/l). On tire au hasard un échantillon de 3 femmes. La moyenne et l écart-type du taux de cholestérol de l échantillon sont égal à, et 0,5. Calculer l intervalle de confiance à 99% pour le taux moyen de cholestérol de la population totale des femmes. Corrigé de l exercice Taux de cholestérol sanguin en g/l = variable quantitative est grand > 30 Ic à 99% = 0,0 U =,57 s 0,5 m + U, +,57 3 [,96 ;,44] g/l Ic 99%, +,57 0,09 Exercice Dans un centre anti-cancéreux, on examine après tirage au sort un échantillon de 00 femmes pour lesquelles on suspecte un cancer utérin. En fait 5% de ces femmes présentent un cancer utérin. Quel est l intervalle de confiance au risque 5 % de la fréquence du K utérin dans la population féminine suspecte reçue au centre anti-cancéreux. Corrigé de l exercice L Ic au risque 5% de la fréquence du cancer utérin dans la population féminine suspecte au centre anticancéreux. =00 f =0,5. On suppose que l échantillon est grand. Les conditions d application (npi, nqi, nps, nqs > 5 seront vérifiées à portériori). 0,5 0,75 P [0,5+ ] Ic 95% P [0,6 ; 0,34] 00 Les conditions vérifiées : npi, nqi, nps, nqs > 5 Probabilités et Statistiques PAES 0-03 L FOUCA

29 9 Chapitre 6 Comparaison d une caractéristique observée à une caractéristique théorique. Les tests statistiques. La question posée dans le cas d une moyenne, dans le cas d une moyenne : la moyenne observée m diffère t elle de moyenne théorique (connue)? L échantillon E est-il représentatif de P? En fait, on veut savoir si la différence observée est attribuable aux fluctuations d échantillonnage ou si elle correspond à une différence réelle. Le test statistique permet de répondre à cette question. Il est basé sur l estimation de l écart-réduit.. Etapes d un test statistique - grands échantillons:. Les hypothèses nulle et alternative H 0 : hypothèse nulle : E est représentatif de P La moyenne observée ne diffère pas de la moyenne théorique La fréquence observée ne diffère pas de la fréquence théorique H : hypothèse alternative : E n est pas représentatif de P. La statistique du test statistique Après vérification des conditions de validité du test. Si l effectif de l échantillon E est grand, ce paramètre U obéit sous H 0 à une loi connue U = m est (0,) Puisque que > 30 Ou U = avec m = moyenne de x dans l échantillon = moyenne de x dans la population écart-type dans la population = taille de l échantillon ( est grand > 30) f p est (0,) p( p) Avec f = fréquence de x dans l échantillon p = fréquence de x dans la population = taille de l échantillon ( est grand p et (-p) > 5).3 Définir le seuil : seuil de signification ou risque de première espèce. Généralement on choisit = 0,05.4 Définir la zone de rejet de H 0 (zone hachurée) Au risque choisi, correspond un intervalle [-U + U ] ou le paramètre a - de chance de se trouver. La zone de rejet comprend parties ainsi, au seuil = 0,05 -,96 0 +,96 Probabilités et Statistiques PAES 0-03 L FOUCA

30 30.5 Calculer le paramètre (valeur numérique de la statistique) On calcule le paramètre en fonction des données du problème..6 Décision - Si X tombe dans la zone de rejet, on rejette H 0 avec un risque d erreur < = risque de première espèce -Si X ne tombe pas dans la zone de rejet, je ne rejette pas H 0 si on accepte H 0, cette décision est associée à un risque de deuxième espèce. Risque de première et deuxième espèces, puissance d un test statistique a) = risque de première espèce. Risque d erreur, est le risque de rejeter l hypothèse nulle alors qu en fait elle est exacte. b) = risque de deuxième espèce ou manque de puissance, est le risque de ne pas rejeter l hypothèse nulle alors qu en fait elle est fausse. C est la probabilité de ne pas mettre en évidence une différence qui existe réellement. Les risques et, sont antagonistes. Si l on choisit un risque très petit, on ne peut le plus souvent rejeter H 0. On choisit le plus souvent un risque de 5%. Ce risque fixé est appelé seuil de signification, c) - :puissance du test. C est la probabilité de mettre en évidence une différence qui existe réellement. Synthèse Réalité Décision On ne rejette pas H 0 Rejet de H 0 H 0 vraie - H 0 fausse - Probabilités et Statistiques PAES 0-03 L FOUCA

31 3 Exemples Exercice On suppose que la moyenne de la taille normale des nouveaux -nés à terme est 50cm et l écart-type 3. Sur un échantillon de 50 nouveaux nés représentatifs des prématurés (enfant nés avant terme) on observe une moyenne de taille égale à 45 cm. La différence est-elle significative? C est à dire peut-on affirmer que les prématurés naissent plus petits que les nouveaux nés à terme? Corrigé de l exercice Dans la population P, 50 cm et 3 cm. Pour l échantillon m= 45 cm Il s agit de comparer une moyenne observée à une moyenne théorique.. Hypothèse nulle Ho Il n y a pas de différence significative entre la taille des prématurés et celle des nouveaux nés à terme Sous l hypothèse nulle Ho étant > 30. m U = qui est (0, ) 3 Le seuil = 0,05 (dans la table de l écart-réduit, = 0,05 U =,96. 4 La zone de rejet (hachurée) -,96 0 +,96 5) Calcul de la valeur numérique de U U cal = = = -, ) Décision U calculé tombe dans la zone de rejet. Je rejette H0 avec un risque de première espèce 0,05et même à 0-4. Il y a une différence significative entre les moyennes La taille des prématurés est significativement plus petite que celle des nouveaux nés à terme. Exercice Sur les enfants nés de 968 à 973, on a compté 5300 filles. On demande si la proportion de filles est compatible avec l hypothèse d équiprobabilité d une fille et d un garçon au risque %? Corrigé de l exercice On utilise le test de comparaison d une fréquence observée à une fréquence théorique p = 0,5 ) L hypothèse nulle : équiprobabilité des naissances d une fille ou d un garçon. ) Sous H0 f p np et n(-p) > 5 U = p et (-p) > 5) p( p) n 3) Seuil = 0,0 U =,567 4) Zone de rejet hachurée -,57 0 +,57 5) calcul de U 0,53 0,50 Ucal = = 6 0,50*0, ) je rejette H 0 avec un risque de ère espèce = 0,0 (et même < 0-8 ) Il n y a pas d équiprobabilité de naissance d une fille ou d un garçon. Probabilités et Statistiques PAES 0-03 L FOUCA

Support du cours de Probabilités IUT d Orléans, Département d informatique

Support du cours de Probabilités IUT d Orléans, Département d informatique Support du cours de Probabilités IUT d Orléans, Département d informatique Pierre Andreoletti IUT d Orléans Laboratoire MAPMO (Bât. de Mathématiques UFR Sciences) - Bureau 126 email: pierre.andreoletti@univ-orleans.fr

Plus en détail

Loi normale ou loi de Laplace-Gauss

Loi normale ou loi de Laplace-Gauss LivreSansTitre1.book Page 44 Mardi, 22. juin 2010 10:40 10 Loi normale ou loi de Laplace-Gauss I. Définition de la loi normale II. Tables de la loi normale centrée réduite S il y avait une seule loi de

Plus en détail

DEFINITION et PROPRIETES des PRINCIPALES LOIS de PROBABILITES

DEFINITION et PROPRIETES des PRINCIPALES LOIS de PROBABILITES Université Paris1, Licence 00-003, Mme Pradel : Principales lois de Probabilité 1 DEFINITION et PROPRIETES des PRINCIPALES LOIS de PROBABILITES Notations Si la variable aléatoire X suit la loi L, onnoterax

Plus en détail

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre : Terminale STSS 2 012 2 013 Pourcentages Synthèse 1) Définition : Calculer t % d'un nombre, c'est multiplier ce nombre par t 100. 2) Exemples de calcul : a) Calcul d un pourcentage : Un article coûtant

Plus en détail

Statistiques Descriptives à une dimension

Statistiques Descriptives à une dimension I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des

Plus en détail

Examen d accès - 1 Octobre 2009

Examen d accès - 1 Octobre 2009 Examen d accès - 1 Octobre 2009 Aucun document autorisé - Calculatrice fournie par le centre d examen Ce examen est un questionnaire à choix multiples constitué de 50 questions. Plusieurs réponses sont

Plus en détail

Probabilité conditionnelle et indépendance. Couples de variables aléatoires. Exemples

Probabilité conditionnelle et indépendance. Couples de variables aléatoires. Exemples 36 Probabilité conditionnelle et indépendance. Couples de variables aléatoires. Exemples (Ω, B, P est un espace probabilisé. 36.1 Définition et propriétés des probabilités conditionnelles Définition 36.1

Plus en détail

L essentiel sur les tests statistiques

L essentiel sur les tests statistiques L essentiel sur les tests statistiques 21 septembre 2014 2 Chapitre 1 Tests statistiques Nous considérerons deux exemples au long de ce chapitre. Abondance en C, G : On considère une séquence d ADN et

Plus en détail

Chapitre 4 NOTIONS DE PROBABILITÉS

Chapitre 4 NOTIONS DE PROBABILITÉS Statistique appliquée à la gestion et au marketing http://foucart.thierry.free.fr/statpc Chapitre 4 NOTIONS DE PROBABILITÉS Les chapitres précédents donnent des méthodes graphiques et numériques pour caractériser

Plus en détail

Annexe commune aux séries ES, L et S : boîtes et quantiles

Annexe commune aux séries ES, L et S : boîtes et quantiles Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans

Plus en détail

Activité 1 : échantillonnage

Activité 1 : échantillonnage Activité échantillonnage, intervalle de fluctuation, prise de décision (à partir d un même thème) Les trois activités qui suivent s inspirent du document «ressources pour la classe de première générale

Plus en détail

Chacune des valeurs d une variable en est une modalité particulière.

Chacune des valeurs d une variable en est une modalité particulière. Psychologie générale Jean Paschoud STATISTIQUE Sommaire Rôle de la statistique Variables Échelles de mesure Résumer, décrire Comparer Rôle de la statistique La statistique est avant tout un outil permettant

Plus en détail

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences

Plus en détail

Lois de probabilité. Anita Burgun

Lois de probabilité. Anita Burgun Lois de probabilité Anita Burgun Problème posé Le problème posé en statistique: On s intéresse à une population On extrait un échantillon On se demande quelle sera la composition de l échantillon (pourcentage

Plus en détail

Statistique : Résumé de cours et méthodes

Statistique : Résumé de cours et méthodes Statistique : Résumé de cours et méthodes 1 Vocabulaire : Population : c est l ensemble étudié. Individu : c est un élément de la population. Effectif total : c est le nombre total d individus. Caractère

Plus en détail

Lois de probabilité 3/3. Anita Burgun

Lois de probabilité 3/3. Anita Burgun Lois de probabilité 3/3 Anita Burgun Contenu des cours Loi binomiale Loi hypergéométrique Loi de Poisson Loi normale Loi du Chi2 Loi de Student Loi normale VA continue X Densité de probabilité de X" Loi

Plus en détail

STATISTIQUES À UNE VARIABLE

STATISTIQUES À UNE VARIABLE STATISTIQUES À UNE VARIABLE Table des matières I Méthodes de représentation 2 I.1 Vocabulaire.............................................. 2 I.2 Tableaux...............................................

Plus en détail

Les statistiques descriptives et les intervalles de confiance

Les statistiques descriptives et les intervalles de confiance Les statistiques et les intervalles de Yohann.Foucher@univ-nantes.fr Equipe d Accueil 4275 "Biostatistique, recherche clinique et mesures subjectives en santé", Université de Nantes Master 2 - Cours #2

Plus en détail

Chapitre IV : Couples de variables aléatoires discrètes

Chapitre IV : Couples de variables aléatoires discrètes UNIVERSITÉ DE CERG Année 0-03 UFR Économie & Gestion Licence d Économie et Gestion MATH0 : Probabilités Chapitre IV : Couples de variables aléatoires discrètes Généralités Définition Soit (Ω, P(Ω), P)

Plus en détail

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes IUT HSE Probabilités et Statistiques Feuille : variables aléatoires discrètes 1 Exercices Dénombrements Exercice 1. On souhaite ranger sur une étagère 4 livres de mathématiques (distincts), 6 livres de

Plus en détail

STATISTIQUES A UNE VARIABLE EXERCICES CORRIGES

STATISTIQUES A UNE VARIABLE EXERCICES CORRIGES STATISTIQUES A UNE VARIALE EXERCICES CORRIGES Exercice n Les élèves d une classe ont obtenu les notes suivantes lors d un devoir : Note 4 5 8 0 4 5 8 0 Effectif 4 7 6 4 ) Déterminer l étendue et le mode

Plus en détail

Cours 1: lois discrétes classiques en probabilités

Cours 1: lois discrétes classiques en probabilités Cours 1: lois discrétes classiques en probabilités Laboratoire de Mathématiques de Toulouse Université Paul Sabatier-IUT GEA Ponsan Module: Stat inférentielles Définition Quelques exemples loi d une v.a

Plus en détail

Devoir Surveillé n 5 BTS 2009 groupement B

Devoir Surveillé n 5 BTS 2009 groupement B EXERCICE 1 (12 points) Devoir Surveillé n 5 BTS 2009 groupement B Les trois parties de cet exercice peuvent être traitées de façon indépendante. A. Résolution d une équation différentielle On considère

Plus en détail

9. Distributions d échantillonnage

9. Distributions d échantillonnage 9. Distributions d échantillonnage MTH2302D S. Le Digabel, École Polytechnique de Montréal H2015 (v3) MTH2302D: distributions d échantillonnage 1/46 Plan 1. Échantillons aléatoires 2. Statistiques et distributions

Plus en détail

STATISTIQUES. I. Un peu de vocabulaire. II. Representations graphiques. 1. Diagramme circulaire

STATISTIQUES. I. Un peu de vocabulaire. II. Representations graphiques. 1. Diagramme circulaire STATISTIQUES I. Un peu de vocabulaire Toute étude statistique s'appuie sur des données. Dans le cas où ces données sont numériques, on distingue les données discrètes (qui prennent un nombre fini de valeurs

Plus en détail

Analyse de données et méthodes numériques

Analyse de données et méthodes numériques Analyse de données et méthodes numériques Analyse de données: Que faire avec un résultat? Comment le décrire? Comment l analyser? Quels sont les «modèles» mathématiques associés? Analyse de données et

Plus en détail

ASI (L2) : TP3 Calculs probabilistes avec Excel et Rstat

ASI (L2) : TP3 Calculs probabilistes avec Excel et Rstat ASI (L2) : TP3 Calculs probabilistes avec Excel et Rstat Objectifs du TP : Savoir utiliser Excel et Rstat pour calculer des moyennes pondérées, des variances pondérées et savoir faire des approximations

Plus en détail

Loi binomiale Lois normales

Loi binomiale Lois normales Loi binomiale Lois normales Christophe ROSSIGNOL Année scolaire 204/205 Table des matières Rappels sur la loi binomiale 2. Loi de Bernoulli............................................ 2.2 Schéma de Bernoulli

Plus en détail

Chapitre VI Échantillonages et simulations

Chapitre VI Échantillonages et simulations Chapitre VI Commentaires : Récursivement, les commentaires ne sont pas à l attention des élèves.. Fluctuation d échantillonnage Définition : En statistiques, un échantillon de taille n est la liste des

Plus en détail

Statistiques descriptives (1/2)

Statistiques descriptives (1/2) Statistiques descriptives (1/2) Anita Burgun 2011-2012 http://www.med.univ-rennes1.fr Introduction! Statistique: méthode scientifique qui consiste à réunir des données chiffrées sur des ensembles d individus

Plus en détail

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,

Plus en détail

2010 My Maths Space Page 1/6

2010 My Maths Space Page 1/6 A. Des statistiques aux probabilités 1. Statistiques descriptives, analyse de données. Vocabulaire des statistiques : Population : c'est l'ensemble étudié. Individu : c'est un élément de la population.

Plus en détail

UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2013 2014 MATHS/STATS. 1 Généralités sur les tests statistiques 2

UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2013 2014 MATHS/STATS. 1 Généralités sur les tests statistiques 2 UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2013 2014 Master d économie Cours de M. Desgraupes MATHS/STATS Document 4 : Les tests statistiques 1 Généralités sur les tests

Plus en détail

Cours (8) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012. Test du Khi 2

Cours (8) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012. Test du Khi 2 Test du Khi 2 Le test du Khi 2 (khi deux ou khi carré) fournit une méthode pour déterminer la nature d'une répartition, qui peut être continue ou discrète. Domaine d application du test : Données qualitatives

Plus en détail

Probabilités sur un univers fini

Probabilités sur un univers fini [http://mp.cpgedupuydelome.fr] édité le 7 août 204 Enoncés Probabilités sur un univers fini Evènements et langage ensembliste A quelle condition sur (a, b, c, d) ]0, [ 4 existe-t-il une probabilité P sur

Plus en détail

Exercices : Probabilités

Exercices : Probabilités Exercices : Probabilités Partie : Probabilités Exercice Dans un univers, on donne deux événements et incompatibles tels que =0, et =0,7. Calculer,, et. Exercice Un dé (à faces) est truqué de la façon suivante

Plus en détail

Estimation et tests statistiques, TD 5. Solutions

Estimation et tests statistiques, TD 5. Solutions ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études

Plus en détail

Chapitre 3 : INFERENCE

Chapitre 3 : INFERENCE Chapitre 3 : INFERENCE 3.1 L ÉCHANTILLONNAGE 3.1.1 Introduction 3.1.2 L échantillonnage aléatoire 3.1.3 Estimation ponctuelle 3.1.4 Distributions d échantillonnage 3.1.5 Intervalles de probabilité L échantillonnage

Plus en détail

Introduction au cours STA 102 Analyse des données : Méthodes explicatives

Introduction au cours STA 102 Analyse des données : Méthodes explicatives Analyse des données - Méthodes explicatives (STA102) Introduction au cours STA 102 Analyse des données : Méthodes explicatives Giorgio Russolillo giorgio.russolillo@cnam.fr Infos et support du cours Slide

Plus en détail

Probabilités et Statistiques. Chapitre 1 : Statistique descriptive

Probabilités et Statistiques. Chapitre 1 : Statistique descriptive U.P.S. I.U.T. A, Département d Informatique Année 2008-2009 Probabilités et Statistiques Emmanuel PAUL Chapitre 1 : Statistique descriptive 1 Objectifs des statistiques. Il s agit d étudier un ou plusieurs

Plus en détail

TS. 2012/2013. Lycée Prévert. Corrigé du contrôle n 3. Durée : 3 heures. Mardi 20/11/12

TS. 2012/2013. Lycée Prévert. Corrigé du contrôle n 3. Durée : 3 heures. Mardi 20/11/12 TS. 01/013. Lycée Prévert. Corrigé du contrôle n 3. Durée : 3 heures. Mardi 0/11/1 Exercice 1 : ( 6,5 pts) Première partie : Démonstration à rédiger { Démontrer que si ( ) et (v n ) sont deux suites telles

Plus en détail

Probabilités. I Petits rappels sur le vocabulaire des ensembles 2 I.1 Définitions... 2 I.2 Propriétés... 2

Probabilités. I Petits rappels sur le vocabulaire des ensembles 2 I.1 Définitions... 2 I.2 Propriétés... 2 Probabilités Table des matières I Petits rappels sur le vocabulaire des ensembles 2 I.1 s................................................... 2 I.2 Propriétés...................................................

Plus en détail

TD 4 : HEC 2001 épreuve II

TD 4 : HEC 2001 épreuve II TD 4 : HEC 200 épreuve II Dans tout le problème, n désigne un entier supérieur ou égal à 2 On dispose de n jetons numérotés de à n On tire, au hasard et sans remise, les jetons un à un La suite (a, a 2,,

Plus en détail

Chapitre I. Probabilités. Bcpst 1 2 novembre 2015. I Exemples d expériences aléatoires

Chapitre I. Probabilités. Bcpst 1 2 novembre 2015. I Exemples d expériences aléatoires Chapitre I Probabilités Bcpst 1 2 novembre 2015 I Exemples d expériences aléatoires Une expérience aléatoire est une expérience dont on ne peut pas prédire le résultat avant de l avoir réalisée... ce qui

Plus en détail

Échantillonnage et estimation

Échantillonnage et estimation Échantillonnage et estimation Dans ce chapitre, on s intéresse à un caractère dans une population donnée dont la proportion est notée. Cette proportion sera dans quelques cas connue (échantillonnage),

Plus en détail

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Chapitre 5 UE4 : Biostatistiques Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.

Plus en détail

Variables aléatoires continues

Variables aléatoires continues IUT Aix-en-Provence Année 204-205 DUT Informatique TD Probabilités feuille n 6 Variables aléatoires continues Exercice (La station-service) Dans une station-service, la demande hebdomadaire en essence,

Plus en détail

TABLEAU 5 Nombre moyen (et écarts types) de mots produits selon le niveau scolaire et les trois conditions de révision

TABLEAU 5 Nombre moyen (et écarts types) de mots produits selon le niveau scolaire et les trois conditions de révision Dans ce tableau, si le chercheur ne s intéresse pas aux notes item par item mais simplement à la note globale, alors il conservera seulement les première et dernière colonnes et calculera des statistiques

Plus en détail

STATISTIQUES I) UN PEU DE VOCABULAIRE

STATISTIQUES I) UN PEU DE VOCABULAIRE STATISTIQUES I) UN PEU DE VOCABULAIRE Toute étude statistique s'appuie sur des données. Dans le cas ou ces données sont numériques (99% des cas), on distingue les données discrètes (qui prennent un nombre

Plus en détail

Simulation d un système d assurance automobile

Simulation d un système d assurance automobile Simulation d un système d assurance automobile DESSOUT / PLESEL / DACHI Plan 1 Introduction... 2 Méthodes et outils utilisés... 2.1 Chaines de Markov... 2.2 Méthode de Monte Carlo... 2.3 Méthode de rejet...

Plus en détail

Probabilités. I- Expérience aléatoire, espace probabilisé : ShotGun. 1- Définitions :

Probabilités. I- Expérience aléatoire, espace probabilisé : ShotGun. 1- Définitions : Probabilités I- Expérience aléatoire, espace probabilisé : 1- Définitions : Ω : Ensemble dont les points w sont les résultats possibles de l expérience Des évènements A parties de Ω appartiennent à A une

Plus en détail

Un corrigé de l épreuve de mathématiques du baccalauréat blanc

Un corrigé de l épreuve de mathématiques du baccalauréat blanc Terminale ES Un corrigé de l épreuve de mathématiques du baccalauréat blanc EXERCICE ( points). Commun à tous les candidats On considère une fonction f : définie, continue et doublement dérivable sur l

Plus en détail

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

Représentation d une distribution

Représentation d une distribution 5 Représentation d une distribution VARIABLE DISCRÈTE : FRÉQUENCES RELATIVES DES CLASSES Si dans un graphique représentant une distribution, on place en ordonnées le rapport des effectifs n i de chaque

Plus en détail

Ch.12 : Loi binomiale

Ch.12 : Loi binomiale 4 e - programme 2007 - mathématiques ch.12 - cours Page 1 sur 5 1 RÉPÉTITION D'EXPÉRIENCES INDÉPENDANTES Lancer plusieurs fois un dé et noter les résultats successifs. Ch.12 : Loi binomiale Prélever des

Plus en détail

Probabilité mathématique et distributions théoriques

Probabilité mathématique et distributions théoriques Probabilité mathématique et distributions théoriques 3 3.1 Notion de probabilité 3.1.1 classique de la probabilité s Une expérience ou une épreuve est dite aléatoire lorsqu on ne peut en prévoir exactement

Plus en détail

Programme de Première

Programme de Première BAC TECHNO STAV 66 I. Algèbre Programme de Première Objectif 1 - Effectuer de manière autonome des calculs numériques ou algébriques, résoudre des équations ou inéquations en vue de résoudre des problèmes

Plus en détail

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction

Plus en détail

Statistique Descriptive I (M1102)

Statistique Descriptive I (M1102) Illustration du cours de Statistique Descriptive I (M1102) Année scolaire 2013/2014 Université de Perpignan Via Domitia, IUT STatistique et Informatique Décisionnelle (STID) Table des matières 1 Généralités

Plus en détail

Cours de mathématiques

Cours de mathématiques Cours de mathématiques Thomas Rey classe de première ES ii Table des matières 1 Les pourcentages 1 1.1 Variation en pourcentage............................... 1 1.1.1 Calcul d une variation............................

Plus en détail

VI. Tests non paramétriques sur un échantillon

VI. Tests non paramétriques sur un échantillon VI. Tests non paramétriques sur un échantillon Le modèle n est pas un modèle paramétrique «TESTS du CHI-DEUX» : VI.1. Test d ajustement à une loi donnée VI.. Test d indépendance de deux facteurs 96 Différentes

Plus en détail

INTRODUCTION A LA RECHERCHE QUANTITATIVE

INTRODUCTION A LA RECHERCHE QUANTITATIVE INTRODUCTION A LA RECHERCHE QUANTITATIVE Deuxième partie : de la base de données aux résultats Juin 2010 Julien Gelly, Caroline Huas, Josselin Le Bel Plan 2 1. Introduction 2. Saisie des données : Epi

Plus en détail

STATISTIQUES. Cours I : Test d hypothèses. Télécom Physique Strasbourg Module 2101. Fabrice Heitz. Octobre 2014

STATISTIQUES. Cours I : Test d hypothèses. Télécom Physique Strasbourg Module 2101. Fabrice Heitz. Octobre 2014 Télécom Physique Strasbourg Module 2101 STATISTIQUES Cours I : Test d hypothèses Fabrice Heitz Octobre 2014 Fabrice Heitz (Télécom PS) Statistiques 2014 1 / 75 Cours I TESTS D HYPOTHÈSES Fabrice Heitz

Plus en détail

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

Lois de probabilité à densité Loi normale

Lois de probabilité à densité Loi normale DERNIÈRE IMPRESSIN LE 31 mars 2015 à 14:11 Lois de probabilité à densité Loi normale Table des matières 1 Lois à densité 2 1.1 Introduction................................ 2 1.2 Densité de probabilité

Plus en détail

CONTENUS CAPACITÉS ATTENDUES COMMENTAIRES Probabilités Épreuve de Bernoulli, loi de Bernoulli.

CONTENUS CAPACITÉS ATTENDUES COMMENTAIRES Probabilités Épreuve de Bernoulli, loi de Bernoulli. 1 ère - 3 Chap.9 : Loi binomiale. Échantillonnage. 1 ère - Chapitre 9 : LOI BINOMIALE. ÉCHANTILLONNAGE. Textes officiels (30 septembre 2010) : CONTENU CAPACITÉ ATTENDUE COMMENTAIRE Probabilités Épreuve

Plus en détail

1ES Février 2013 Corrigé

1ES Février 2013 Corrigé 1ES Février 213 Corrigé Exercice 1 Le tableau ci-dessous renseigne sur les besoins en eau dans le monde : Population mondiale (Milliards d habitants) Volume moyen par habitant ( ) 195 2,5 4 1 197 3,6 5

Plus en détail

Séminaire de Statistique

Séminaire de Statistique Master 1 - Economie & Management Séminaire de Statistique Support (2) Variables aléatoires & Lois de probabilité R. Abdesselam - 2013/2014 Faculté de Sciences Economiques et de Gestion Université Lumière

Plus en détail

Module 2 29 Décembre 2009 Intervenant: Dhuin STATISTIQUES

Module 2 29 Décembre 2009 Intervenant: Dhuin STATISTIQUES STATISTIQUES I. Séries statistiques simples... 1 A. Définitions... 1 1. Population... 1 2. Caractère statistique... 1 B. Séries classées / représentations graphiques.... 2 1. Séries classées... 2 2. Représentations

Plus en détail

Emilien Suquet, suquet@automaths.com

Emilien Suquet, suquet@automaths.com STATISTIQUES Emilien Suquet, suquet@automaths.com I Comment réagir face à un document statistique? Les deux graphiques ci-dessous représentent l évolution du taux de chômage en France sur les 1 mois de

Plus en détail

Analyse de la variance à deux facteurs

Analyse de la variance à deux facteurs 1 1 IRMA, Université Louis Pasteur Strasbourg, France Master 1 Psychologie du développement 06-10-2008 Contexte Nous nous proposons d analyser l influence du temps et de trois espèces ligneuses d arbre

Plus en détail

GUIDE D AIDE STATISTIQUE A LA PREPARATION DE LA THESE

GUIDE D AIDE STATISTIQUE A LA PREPARATION DE LA THESE Département Universitaire de Recherche et d Enseignement en Médecine Générale GUIDE D AIDE STATISTIQUE A LA PREPARATION DE LA THESE Enseignants : Esther GUERY, Julien LE BRETON, Emilie FERRAT, Jacques

Plus en détail

Baccalauréat ES Centres étrangers 12 juin 2014 - Corrigé

Baccalauréat ES Centres étrangers 12 juin 2014 - Corrigé Baccalauréat ES Centres étrangers 1 juin 14 - Corrigé A. P. M. E. P. Exercice 1 5 points Commun à tous les candidats 1. On prend un candidat au hasard et on note : l évènement «le candidat a un dossier

Plus en détail

1S DS 4 Durée :?mn. 2. La courbe ci-dessous est la représentation graphique de la fonction g, définie sur I = [ 1; 3].

1S DS 4 Durée :?mn. 2. La courbe ci-dessous est la représentation graphique de la fonction g, définie sur I = [ 1; 3]. 1S DS 4 Durée :?mn Exercice 1 ( 5 points ) Les trois questions sont indépendantes. 1. Soit f la fonction définie par f(x) = 3 x. a) Donner son ensemble de définition. Il faut 3 x 0 3 x donc D f =] ; 3]

Plus en détail

Première STMG1 2014-2015 progression. - 1. Séquence : Proportion d une sous population dans une population.

Première STMG1 2014-2015 progression. - 1. Séquence : Proportion d une sous population dans une population. Première STMG1 2014-2015 progression. - 1 Table des matières Fil rouge. 3 Axes du programme. 3 Séquence : Proportion d une sous population dans une population. 3 Information chiffrée : connaître et exploiter

Plus en détail

Fluctuation d une fréquence selon les échantillons - Probabilités

Fluctuation d une fréquence selon les échantillons - Probabilités Fluctuation d une fréquence selon les échantillons - Probabilités C H A P I T R E 3 JE DOIS SAVOIR Calculer une fréquence JE VAIS ÊTRE C APABLE DE Expérimenter la prise d échantillons aléatoires de taille

Plus en détail

Terminale STMG Lycée Jean Vilar 2013/2014. Terminale STMG. O. Lader

Terminale STMG Lycée Jean Vilar 2013/2014. Terminale STMG. O. Lader Terminale STMG O. Lader Table des matières 1 Information chiffrée (4s) 4 1.1 Taux d évolution....................................... 6 1.2 indices............................................. 6 1.3 Racine

Plus en détail

Qu est-ce qu une probabilité?

Qu est-ce qu une probabilité? Chapitre 1 Qu est-ce qu une probabilité? 1 Modéliser une expérience dont on ne peut prédire le résultat 1.1 Ensemble fondamental d une expérience aléatoire Une expérience aléatoire est une expérience dont

Plus en détail

MÉTHODES ET STATISTIQUES POUR LIRE UN ARTICLE

MÉTHODES ET STATISTIQUES POUR LIRE UN ARTICLE MÉTHODES ET STATISTIQUES POUR LIRE UN ARTICLE Forum HH 05.02.2013 Ghislaine Gagnon Unité HPCI Qualitatif ou quantitatif? Les 2 méthodes peuvent être utilisées séparément ou en conjonction - le qualitatif

Plus en détail

Estimateur et Estimation Prof Franck Bonnetain Unité de méthodologie & de qualité de vie en cancérologie (EA3181) CHRU Besançon

Estimateur et Estimation Prof Franck Bonnetain Unité de méthodologie & de qualité de vie en cancérologie (EA3181) CHRU Besançon PACES - APEMK UE 4 Evaluation des méthodes d analyses appliquées aux sciences de la vie et de la santé Estimateur et Estimation Prof Franck Bonnetain Unité de méthodologie & de qualité de vie en cancérologie

Plus en détail

TSTI 2D CH X : Exemples de lois à densité 1

TSTI 2D CH X : Exemples de lois à densité 1 TSTI 2D CH X : Exemples de lois à densité I Loi uniforme sur ab ; ) Introduction Dans cette activité, on s intéresse à la modélisation du tirage au hasard d un nombre réel de l intervalle [0 ;], chacun

Plus en détail

La gestion des ventes.

La gestion des ventes. I. La prévision des ventes. A. Principe. La gestion des ventes. Elle consiste à déterminer les ventes futures à la fois en quantité et en valeur en tenant compte des tendances et contraintes imposées à

Plus en détail

Statistiques et probabilités : Loi Normale. Les I.P.R. et Formateurs de l Académie de LILLE

Statistiques et probabilités : Loi Normale. Les I.P.R. et Formateurs de l Académie de LILLE Statistiques et probabilités : Loi Normale Les I.P.R. et Formateurs de l Académie de LILLE Bulletin officiel spécial 8 du 13 octobre 2011 Cadre général : loi à densité Définition Une fonction f définie

Plus en détail

Chapitre 8 : Probabilités-Indépendance

Chapitre 8 : Probabilités-Indépendance Cours de mathématiques Terminale S Chapitre 8 : Probabilités-Indépendance Année scolaire 008-009 mise à jour 6 janvier 009 Fig. Andreï Kolmogorov Un précurseur de la formalisation de la théorie des probabilités

Plus en détail

Séries Statistiques Simples

Séries Statistiques Simples 1. Collecte et Représentation de l Information 1.1 Définitions 1.2 Tableaux statistiques 1.3 Graphiques 2. Séries statistiques simples 2.1 Moyenne arithmétique 2.2 Mode & Classe modale 2.3 Effectifs &

Plus en détail

Licence MASS 2000-2001. (Re-)Mise à niveau en Probabilités. Feuilles de 1 à 7

Licence MASS 2000-2001. (Re-)Mise à niveau en Probabilités. Feuilles de 1 à 7 Feuilles de 1 à 7 Ces feuilles avec 25 exercices et quelques rappels historiques furent distribuées à des étudiants de troisième année, dans le cadre d un cours intensif sur deux semaines, en début d année,

Plus en détail

Feuille d exercices 1

Feuille d exercices 1 Université Paris 7 - Denis Diderot L2 - Probabilités PS4 Année 2014-2015 Feuille d exercices 1 Exercice 1 Combien y a-t-il de paires d entiers non consécutifs compris entre 1 et n (n 1)? Exercice 2 1.

Plus en détail

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE UE4 : Biostatistiques Chapitre 6 Test de comparaison de pourcentages χ² José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Nature des variables

Plus en détail

Les probabilités. Chapitre 18. Tester ses connaissances

Les probabilités. Chapitre 18. Tester ses connaissances Chapitre 18 Les probabilités OBJECTIFS DU CHAPITRE Calculer la probabilité d événements Tester ses connaissances 1. Expériences aléatoires Voici trois expériences : - Expérience (1) : on lance une pièce

Plus en détail

Espace de probabilité, indépendance et probabilité conditionnelle

Espace de probabilité, indépendance et probabilité conditionnelle Chapter 2 Espace de probabilité, indépendance et probabilité conditionnelle Sommaire 2.1 Tribu et événements........................................... 15 2.2 Probabilité................................................

Plus en détail

Lycée Fénelon Sainte-Marie Préparation Science-Po/Prépa HEC

Lycée Fénelon Sainte-Marie Préparation Science-Po/Prépa HEC Lycée Fénelon Sainte-Marie Préparation Science-Po/Prépa HEC Dénombrement et probabilités Version du juillet 05 Enoncés Exercice - YouTube Sur YouTube, les vidéos sont identifiées à l aide d une chaîne

Plus en détail

Cours de mathématiques pour la Terminale S

Cours de mathématiques pour la Terminale S Cours de mathématiques pour la Terminale S Savoir-Faire par chapitre Florent Girod 1 Année scolaire 2015 / 2016 1. Externat Notre Dame - Grenoble Table des matières 1) Suites numériques.................................

Plus en détail

Introduction à Rcommander

Introduction à Rcommander Introduction à Rcommander Pauline Scherdel Septembre 2014 Table des matières 1 Introduction à Rcmdr sous R 2 2 Interagir avec R 3 3 Installer et charger le package Rcmdr sous R 3 4 Importation des données

Plus en détail

Principe des tests statistiques

Principe des tests statistiques Principe des tests statistiques Jean Vaillant Un test de signification est une procédure permettant de choisir parmi deux hypothèses celles la plus probable au vu des observations effectuées à partir d

Plus en détail

Épreuve de mathématiques Terminale ES 200 minutes

Épreuve de mathématiques Terminale ES 200 minutes Examen 2 Épreuve de mathématiques Terminale ES 200 minutes L usage de la calculatrice programmable est autorisé. La bonne présentation de la copie est de rigueur. Cet examen comporte 7 pages et 5 exercices.

Plus en détail

Travaux Dirigés de Probabilités - Statistiques, TD 4. Lois limites ; estimation.

Travaux Dirigés de Probabilités - Statistiques, TD 4. Lois limites ; estimation. Travaux Dirigés de Probabilités - Statistiques, TD 4 Lois limites ; estimation. Exercice 1. Trois machines, A, B, C fournissent respectivement 50%, 30%, 20% de la production d une usine. Les pourcentages

Plus en détail

Le regroupement de valeurs continues, ARRONDIR... Notion de discrétisation : groupes ou intervalles de valeurs. Exemple : Glycémie normale :

Le regroupement de valeurs continues, ARRONDIR... Notion de discrétisation : groupes ou intervalles de valeurs. Exemple : Glycémie normale : Variables : samedi 14 novembre 2009 12:54 1. Quelques Exemples : C'est une caractéristique ou un facteur susceptible de prendre des valeurs différentes selon les individus. Exemples : o Couleur des cheveux

Plus en détail

11. Tests d hypothèses (partie 1/2)

11. Tests d hypothèses (partie 1/2) 11. Tests d hypothèses (partie 1/2) MTH2302D S. Le Digabel, École Polytechnique de Montréal H2015 (v1) MTH2302D: tests d hypothèses 1/30 Plan 1. Introduction 2. Hypothèses et erreurs 3. Tests d hypothèses

Plus en détail

Master 1 Informatique Éléments de statistique inférentielle

Master 1 Informatique Éléments de statistique inférentielle Master 1 Informatique Éléments de statistique inférentielle Faicel Chamroukhi Maître de Conférences UTLN, LSIS UMR CNRS 7296 email: chamroukhi@univ-tln.fr web: chamroukhi.univ-tln.fr 2014/2015 Faicel Chamroukhi

Plus en détail

EXERCICES D ENTRAINEMENT POUR LE DS 7. 1ère STG (Extraits de devoirs d années précédentes)

EXERCICES D ENTRAINEMENT POUR LE DS 7. 1ère STG (Extraits de devoirs d années précédentes) EXERCICES D ENTRAINEMENT POUR LE DS 7. 1ère STG (Extraits de devoirs d années précédentes) Les corrigés sont en seconde partie de ce fichier (pages 4 à 8). Exercice 1: A la sortie d un hypermarché, on

Plus en détail