1
Statistique iferetielle. Relatios Iteratioales Lucya Firlej Pl. E.Bataillo, Bat.11, cc.06 34095 Motpellier cedex 5 Frace lucya.firlej@umotpellier.fr
S3. Statistics. 30 h d eseigemet: 10 cours, 10 TD, 1 TP Objectifs du module (Pla Pédagogique Natioal 013) : Approfodir les lois de probabilité : lois usuelles (biomiale, Poisso, expoetielle, ormale...). Savoir estimer et tester les paramètres d ue populatio à partir des doées d u échatillo : lois d échatilloage, estimatios, tests d hypothèse, corrélatio. Compéteces visées : Coaître les opératios mathématiques mises e œuvre das l aalyse et savoir exploiter leurs potetialités, Maîtriser les méthodes statistiques d estimatio, de test, de régressio et de corrélatio. 3
S3.Statistics. Prérequis : Notios de base e probabilités, statistiques et dérivées. Lois usuelles de probabilité. Tests statistiques. Régressio et corrélatio. Théorie d échatilloage. Théorie d estimatio. Itroductio aux plas d expériece. Cours (et otes) accessibles à : http://www.coulomb.uiv-motp.fr/~firlej/ 4
Cotrôle cotiu des coaissaces. DS (Fial) QCM 10 poits TP (Rappo Cotrôle poits rt) cotiu (DM) 5 poits CC DS (Cotrôle (Fial) Cotiu) (problème) 6 5 poits poits 1 poits 5
Cours o.1. Rappels: Lois de probabilité. Statistique descriptive. 6
Statistique descriptive. Système à étudier (réel ou modèle) Expériece (réelle ou umérique) Doées brutes Aalyse statistique Propriétés physiques ENERGY [K] -500-510 -50-530 -540-550 0 000 4000 6000 8000 10000 MC steps/10 4 Les mesures géèret ue grade quatité de doées qui, das la forme brute, sot totalemet iutilisables. Pour e extraire ue iformatio sesée, des simplificatios (= la perte partielle d iformatio) sot écessaires. Statistique descriptive méthodes de collecte et traitemet de doées (apparemmet) aléatoires, sas tirer des coclusios des résultats. 7
Série statistique. Les doées brutes - u esemble des mesures aleatoires (series statistiques) qui ot pas été orgaisées umériquemet. f Pour u esemble de doées brutes {x i }, et la propriété X: i effectif de x i f diagramme e bâtos x f i = i / fréquece d apparitio de x i Seulemet 5 catégories de distributio de fréqueces. histogramme x Seulemet 3 paramètres sot écessaires pour caractériser ue distributio de fréquece : paramètres de tedace cetrale (localisatio) paramètres de variabilité (étedue) paramètres de forme (déformatio) e forme de U e forme de cloche e forme de J 8
Paramètres de tedace cetrale. modale la valeur observée le plus souvet. peut e pas exister; les distributios multimodales sot très fréquetes. modale médiae milieu de la série arragée e ordre croissat/décroissat. la valeur uique peut e pas exister; médiae itervalle média moyee arithmétique si valeurs discrètes x i apparaisset avec fréqueces f i, k = x i= 1 f i x i moyee arithmétique das les situatios spécifiques autres types de moyees peuvet être plus appropriés (géométrique, harmoique, quadratique, podérée ) 9
Paramètres de variabilité. Paramètres de la tedace cetrale e décrivet pas la variabilité! étedue différece etre les valeurs extrêmes de la série statistique. distace iterquartile IQR différece etre les limites du plus grad et le plus petit de quartiles. variace la moyee des carres des écarts etre les valeurs x i et leur moyee x: S ( x) = f i= 1 i ( ) x x écart-type la racie carrée de la variace : i f(x) 5% 5% IQR Théorème de Koeigs : S ( ) ( x) = x x x S( x) = S ( x) = 1 i= 1 ( ) x i x exprimée das les mêmes uités que x i ; si {x i } = résultats expérimetaux, alors S estime l icertitude. 10
Paramètres de forme. coefficiet d aplatissemet, kurtosis mesure la forme de la distributio. α 4 = m = m 4 m S 4 4 α 4 <3 leptokurtic α 4 =3 mesokurtic α 4 >3 platykurtic coefficiet d asymétrie mesure l asymétrie de la distributio. α = 3 m 3 m 3 où m s = s-ieme momet par rapport à la moyee: m s = 1 i= 1 ( x i x) s α 3 < 0 déformée à gauche α 3 = 0 symétrique α 3 > 0 déformée à droite Les paramètres de tedace cetrale idiquet la forme de la distributio: x mode α3 S Mo < Me < M M < Me < Mo 11
Distributio biomiale. Si vous posez de boes questios, presque toujours la répose (pour ous, u résultat expérimetal) suivra la distributio biomiale (et parfois multiomiale). Propriétés géérales d ue expériece biomiale: chaque essais est idépedat des autres; à chaque essais, uiquemet deux résultats possibles: - succès (probabilité p) - échec (probabilité q = 1 p) Probabilité de succès e N essais: k k k P( x = k) = C p q m 1 = x = Np m = s = Npq q p asymétrie α 3 = Npq 1 6 pq kurtosis α 4 = Npq P() N expériece de Beroulli P() 1 s(x) s(x) E(x) p = q 3 p q 1 < < 3 1
Distributio ormale (gaussiee). Si o répète des mesures de X u grad ombre des fois ( grad ombre ), chaque valeur x i de l itervalle (-, ) peut être obteue. X deviet alors ue variable cotiue. Probabilité d observer x est: 1 ( x µ ) f ( x) = exp( ) σ π σ f(x) µ σ distributio ormale x Théorème cetral limite : quad l échatillo (sa taille N) deviet grad, la distributio des moyees ormale, peu importe la distributio de la variable d origie; la distributio des moyees reste cetrée a la moyee de la populatio m de la variable d origie. l écart-type de la distributio des moyees approche la valeur σ N chagemet d origie et echelle x µ x y = σ f(y) distributio ormale cetrée réduite σ = 1 µ = 0 y 13
Les itervalles de cofiaces. Si la variable x suit la loi ormale N(µ,σ), la probabilité de voir durat la mesure de x ue valeur de l itervalle (µ σ, µ+σ) est P µ σ µ, = f( x) dx = 0.686 µ σ { x ( σ µ + σ )} + p(x) 68.3% x Si ous décidos a priori quelle fractio α des résultats doit se trouver à ue distace pas plus grade que [ue certaie valeur] de la valeur moyee µ, alors cette [ue certaie valeur] deviet la limite de cofiace. x σ = x ±α α/ α/ 1-α -y 0 y 0 y o σ = α 14
15