Rappel sur les concepts de base de statistiques et statistiques descriptives
|
|
- Richard Trudeau
- il y a 6 ans
- Total affichages :
Transcription
1 Rappel sur les concepts de base de statistiques et statistiques descriptives Atelier de formation à l'analyse des données pour l'estimation des stocks de carbone forestier, 30 juin4 juillet 2014, Yaoundé Nicolas Picard Projet de renforcement des capacités institutionnelles en matière de REDD+ pour la gestion durable des forêts dans le bassin du Congo PREREDD (COMIFAC) Rappel sur les concepts de base de statistiques et statistiques descriptives I 1 / 9
2 Panorama des statistiques et rappels 1 Panorama 2 Rappels de probabilités 3 Lois usuelles 4 Statistiques descriptives : cas unidimensionnel 5 Statistiques descriptives : cas multidimensionnel 6 Conclusion Nicolas Picard (CIRAD / IRET) December 1, / 106
3 Utilité des statistiques en foresterie Quelques exemples Inventorier une ressource forestière (stock de bois... ) on ne peut pas tout mesurer Z quelle règle d échantillonnage pour estimer la ressource avec une précision donnée? Mesurer des arbres (dendrométrie) tarifs de cubage : prédire le volume en fonction du diamètre et/ou de la hauteur relation hauteur / diamètre Z comment établir une relation alors qu il y a naturellement de la variabilité? Nicolas Picard (CIRAD / IRET) December 1, / 106
4 Utilité des statistiques en foresterie Quelques exemples Inventorier une ressource forestière (stock de bois... ) on ne peut pas tout mesurer Z quelle règle d échantillonnage pour estimer la ressource avec une précision donnée? échantillonnage Mesurer des arbres (dendrométrie) tarifs de cubage : prédire le volume en fonction du diamètre et/ou de la hauteur relation hauteur / diamètre Z comment établir une relation alors qu il y a naturellement de la variabilité? modélisation Nicolas Picard (CIRAD / IRET) December 1, / 106
5 Utilité des statistiques en foresterie Quelques exemples (suite) Comprendre l écologie des espèces relation sol / espèce Z comment tester une relation qui n est pas univoque? Analyser des données d inventaire d aménagement décrire la structuration des données définir des types de formations végétales comment extraire l information d une masse de données? Z comment classer des observations? Nicolas Picard (CIRAD / IRET) December 1, / 106
6 Utilité des statistiques en foresterie Quelques exemples (suite) Comprendre l écologie des espèces relation sol / espèce Z comment tester une relation qui n est pas univoque? test statistique Analyser des données d inventaire d aménagement décrire la structuration des données définir des types de formations végétales Z comment extraire l information d une masse de données? Z comment classer des observations? statistiques descriptives (analyses multivariées) Nicolas Picard (CIRAD / IRET) December 1, / 106
7 Statistiques et probabilités Probabilité : théorie mathématique traitant des événements aléatoires Statistique : dès que l on a affaire à des observations, des données Z les statistiques s appuient sur les probabilités... mais une partie des statistiques (en particulier les statistiques descriptives) ne font pas référence aux probabilités Ce cours n est pas un cours de mathématiques : approche intuitive savoir quand utiliser les méthodes adéquates savoir interpréter les résultats savoir chercher de l aide pour les analyses plus poussées! Nicolas Picard (CIRAD / IRET) December 1, / 106
8 Panorama : probabilités Probabilités Nicolas Picard (CIRAD / IRET) December 1, / 106
9 Panorama : probabilités Probabilités Variable aléatoire fonction de répartition densité moments lois continues lois discrètes fonction caractéristique Nicolas Picard (CIRAD / IRET) December 1, / 106
10 Panorama : probabilités Probabilités Variable aléatoire Couple de VA fonction de loi jointe répartition loi marginale densité loi condition- moments -nelle lois continues lois discrètes fonction caractéristique Nicolas Picard (CIRAD / IRET) December 1, / 106
11 Panorama : probabilités Probabilités Variable aléatoire Couple de VA fonction de loi jointe répartition loi marginale densité loi condition- moments -nelle lois continues lois discrètes fonction caractéristique Vecteur aléatoire Nicolas Picard (CIRAD / IRET) December 1, / 106
12 Panorama : probabilités Probabilités Variable aléatoire Couple de VA fonction de loi jointe répartition loi marginale densité loi condition- moments -nelle lois continues lois discrètes fonction caractéristique Vecteur aléatoire Processus aléatoire processus temporel processus ponctuel Nicolas Picard (CIRAD / IRET) December 1, / 106
13 Panorama : probabilités Probabilités Variable aléatoire Couple de VA fonction de loi jointe répartition loi marginale densité loi condition- moments -nelle lois continues lois discrètes fonction caractéristique Vecteur aléatoire Processus aléatoire processus temporel processus ponctuel Journée 1 Nicolas Picard (CIRAD / IRET) December 1, / 106
14 Panorama : statistique exploratoire Statistique exploratoire Statistiques descriptives Analyses multivariées Nicolas Picard (CIRAD / IRET) December 1, / 106
15 Panorama : statistique exploratoire Statistique exploratoire Statistiques descriptives Analyses multivariées Description d une variable moyenne médiane quantiles écart-type graphiques Nicolas Picard (CIRAD / IRET) December 1, / 106
16 Panorama : statistique exploratoire Statistique exploratoire Statistiques descriptives Analyses multivariées Description d une variable moyenne médiane quantiles écart-type graphiques Liaison entre deux variables graphiques numériques ordinales qualitatives quantitative et qualitative Nicolas Picard (CIRAD / IRET) December 1, / 106
17 Panorama : statistique exploratoire Statistique exploratoire Statistiques descriptives Analyses multivariées Description d une variable moyenne médiane quantiles écart-type graphiques Liaison entre deux variables graphiques numériques ordinales qualitatives quantitative et qualitative Journée 1 Nicolas Picard (CIRAD / IRET) December 1, / 106
18 Panorama : statistique exploratoire Statistique exploratoire Statistiques descriptives Analyses multivariées Analyse d un tableau ACP AFC AFCM Nicolas Picard (CIRAD / IRET) December 1, / 106
19 Panorama : statistique exploratoire Statistique exploratoire Statistiques descriptives Analyses multivariées Analyse d un tableau ACP AFC AFCM Couplage de 2 tableaux variables instrumentales co-inertie canonique Nicolas Picard (CIRAD / IRET) December 1, / 106
20 Panorama : statistique exploratoire Statistique exploratoire Statistiques descriptives Analyses multivariées Analyse d un tableau ACP AFC AFCM Couplage de 2 tableaux variables instrumentales co-inertie canonique Classification automatique hiérarchique non hiérarchique Nicolas Picard (CIRAD / IRET) December 1, / 106
21 Panorama : statistique exploratoire Statistique exploratoire Statistiques descriptives Analyses multivariées Analyse d un tableau ACP AFC AFCM Couplage de 2 tableaux variables instrumentales co-inertie canonique Journées 5 & 6 Classification automatique hiérarchique non hiérarchique Nicolas Picard (CIRAD / IRET) December 1, / 106
22 Panorama : statistique inférentielle Statistique inférentielle (1) Nicolas Picard (CIRAD / IRET) December 1, / 106
23 Panorama : statistique inférentielle Statistique inférentielle (1) Distribution d un échantillon fonction de répartition empirique moyenne empirique variance empirique échantillon gaussien Nicolas Picard (CIRAD / IRET) December 1, / 106
24 Panorama : statistique inférentielle Statistique inférentielle (1) Distribution d un échantillon fonction de répartition empirique moyenne empirique variance empirique échantillon gaussien Estimation maximum de vraisemblance moments intervalle de confiance taille de population Nicolas Picard (CIRAD / IRET) December 1, / 106
25 Panorama : statistique inférentielle Statistique inférentielle (1) Distribution d un échantillon fonction de répartition empirique moyenne empirique variance empirique échantillon gaussien Estimation maximum de vraisemblance moments intervalle de confiance taille de population Échantillonnage Nicolas Picard (CIRAD / IRET) December 1, / 106
26 Panorama : statistique inférentielle Statistique inférentielle (1) Distribution d un échantillon fonction de répartition empirique moyenne empirique variance empirique échantillon gaussien Estimation maximum de vraisemblance moments intervalle de confiance taille de population Tests ajustement comparaison de 2 moyennes comparaison multiple de moyennes comparaison de variance du χ 2 Échantillonnage Nicolas Picard (CIRAD / IRET) December 1, / 106
27 Panorama : statistique inférentielle Statistique inférentielle (1) Distribution d un échantillon fonction de répartition empirique moyenne empirique variance empirique échantillon gaussien Estimation maximum de vraisemblance moments intervalle de confiance taille de population Échantillonnage Tests ajustement comparaison de 2 moyennes comparaison multiple de moyennes comparaison de variance du χ 2 Journée 2 Nicolas Picard (CIRAD / IRET) December 1, / 106
28 Panorama : statistique inférentielle (suite) Statistique inférentielle (2) Nicolas Picard (CIRAD / IRET) December 1, / 106
29 Panorama : statistique inférentielle (suite) Statistique inférentielle (2) Modèle linéaire analyse de variance à un facteur analyse de variance à n facteurs régression simple régression multiple analyse de covariance cas général Nicolas Picard (CIRAD / IRET) December 1, / 106
30 Panorama : statistique inférentielle (suite) Statistique inférentielle (2) Modèle linéaire analyse de variance à un facteur analyse de variance à n facteurs régression simple régression multiple analyse de covariance cas général Dispositifs expérimentaux Nicolas Picard (CIRAD / IRET) December 1, / 106
31 Panorama : statistique inférentielle (suite) Statistique inférentielle (2) Modèle linéaire analyse de variance à un facteur analyse de variance à n facteurs régression simple régression multiple analyse de covariance cas général Modèle non linéaire Dispositifs expérimentaux Nicolas Picard (CIRAD / IRET) December 1, / 106
32 Panorama : statistique inférentielle (suite) Statistique inférentielle (2) Modèle linéaire analyse de variance à un facteur analyse de variance à n facteurs régression simple régression multiple analyse de covariance cas général Modèle non linéaire Analyse discriminante Dispositifs expérimentaux Nicolas Picard (CIRAD / IRET) December 1, / 106
33 Panorama : statistique inférentielle (suite) Statistique inférentielle (2) Modèle linéaire analyse de variance à un facteur analyse de variance à n facteurs régression simple régression multiple analyse de covariance cas général Modèle non linéaire Analyse discriminante Journées 3 & 4 Dispositifs expérimentaux Nicolas Picard (CIRAD / IRET) December 1, / 106
34 Et encore : Statistique bayésienne Séries chronologiques Statistiques spatiales : géostatistique processus ponctuels lattices Etc, etc. Nicolas Picard (CIRAD / IRET) December 1, / 106
35 Panorama des statistiques et rappels 1 Panorama 2 Rappels de probabilités 3 Lois usuelles 4 Statistiques descriptives : cas unidimensionnel 5 Statistiques descriptives : cas multidimensionnel 6 Conclusion Nicolas Picard (CIRAD / IRET) December 1, / 106
36 Probabilités : les bases Approche fréquentiste Événement aléatoire défini par : ses réalisations possibles la probabilité associée à chaque réalisation Exemple : dé à 6 faces Si on note A 1,..., A n les réalisations possibles et Pr la mesure de probabilité : Pr(A i A j ) = Pr(A i ) + Pr(A j ) (i j) n Pr(A i ) = 1 i=1 Nicolas Picard (CIRAD / IRET) December 1, / 106
37 Probabilité conditionnelle et indépendance Soient A et B deux événements aléatoires Probabilité conditionnelle de A sachant B : Pr(A B) = Pr(A B) Pr(B) Indépendance de A par rapport à B : Pr(A B) = Pr(A) A indépendant de B :B indépendant de A Pour des événements indépendants : Pr(A B) = Pr(A) Pr(B) Nicolas Picard (CIRAD / IRET) December 1, / 106
38 Variable aléatoire Définition Application qui associe à chaque réalisation d un événement aléatoire une valeur numérique (réelle) Exemple : dé à 6 faces ; on y associe X {1, 2, 3, 4, 5, 6} Exemple : statut d un arbre pris au hasard en forêt dominant 1 co-dominant 2 dominé 3 Exemple : diamètre d un arbre pris au hasard en forêt D [d min ; + [ Nicolas Picard (CIRAD / IRET) December 1, / 106
39 Variable aléatoire Définition Application qui associe à chaque réalisation d un événement aléatoire une valeur numérique (réelle) Exemple : dé à 6 faces ; on y associe X {1, 2, 3, 4, 5, 6} Exemple : statut d un arbre pris au hasard en forêt dominant 1 co-dominant 2 dominé 3 Exemple : diamètre d un arbre pris au hasard en forêt D [d min ; + [ Nicolas Picard (CIRAD / IRET) December 1, / 106
40 Variable aléatoire Définition Application qui associe à chaque réalisation d un événement aléatoire une valeur numérique (réelle) Exemple : dé à 6 faces ; on y associe X {1, 2, 3, 4, 5, 6} Exemple : statut d un arbre pris au hasard en forêt dominant 1 co-dominant 2 dominé 3 Exemple : diamètre d un arbre pris au hasard en forêt D [d min ; + [ Nicolas Picard (CIRAD / IRET) December 1, / 106
41 Fonction de répartition Définition : F (x) = Pr(X < x) Fonction à valeurs dans [0, 1] monotone croissante Propriété : Pr(a X < b) = F (b) F (a) Nicolas Picard (CIRAD / IRET) December 1, / 106
42 Différents types de variable Variable discrète Variable ordinale Exemple : statut de l arbre dominant > co-dominant > dominé Variable nominale Exemple : couleur du feuillage vert clair 1 vert clair 4 vert foncé 2 ou bien vert foncé 8 jaune 3 jaune 5 Variable continue Exemple : diamètre Nicolas Picard (CIRAD / IRET) December 1, / 106
43 Variable aléatoire discrète Loi de probabilité On indexe les modalités de la variable par des entiers 1, 2, 3,..., m Loi de probabilité : définie par Pr(X = i) pour tout i = 1,..., m Exemple : somme du lancer de deux dés à 6 faces 6/36 Probabilité /36 4/36 3/36 2/36 1/36 5/36 4/36 3/36 2/36 1/ Nicolas Picard (CIRAD / IRET) December 1, / 106
44 Variable aléatoire discrète Fonction de répartition Exemple : somme du lancer de deux dés à 6 faces Probabilité /36 1/36 6/36 10/36 15/36 21/36 26/36 30/36 35/36 33/ Nicolas Picard (CIRAD / IRET) December 1, / 106
45 Variable aléatoire continue Loi de probabilité Densité de probabilité : Pr(x < X < x + dx) = f(x) dx Fonction de répartition : F (b) = b f(x) dx En d autres termes : f(x) = F (x) Nicolas Picard (CIRAD / IRET) December 1, / 106
46 Variable aléatoire continue Exemple X défini par : { exp( λx) Pr(X > x) = 1 λ f(x) = 1 { λ exp( λx) (x 0) 0 (x < 0) f(x) Pr(a < X < b) F(x) 0 0 a x b 0 0 x Nicolas Picard (CIRAD / IRET) December 1, / 106
47 Changement de variable Nouvelle variable aléatoire Y = ϕ(x) avec ϕ bijective Fonction de répartition de Y : { F (ϕ G(y) = 1 (y)) (ϕ croissante) 1 F (ϕ 1 (y)) (ϕ décroissante) Densité de Y : g(y) = f[ϕ 1 (y)] ϕ [ϕ 1 (y)] Nicolas Picard (CIRAD / IRET) December 1, / 106
48 Indépendance de deux variables aléatoires X et Y sont indépendantes si et seulement si : Fonction de répartition du couple (X, Y ) : H(x, y) = Pr(X < x et Y < y) = F (x) G(y) Densité du couple (X, Y ) : h(x, y) = f(x) g(y) Nicolas Picard (CIRAD / IRET) December 1, / 106
49 Moments d une variable aléatoire Moment non centré d ordre p : m p = Moment centré d ordre p : µ p = x p f(x) dx (x m 1 ) p f(x) dx Par définition, le moment non centré d ordre 1 s appelle l espérance Notation : E(X) Par définition, le moment centré d ordre 2 s appelle la variance Notation : Var(X) Nicolas Picard (CIRAD / IRET) December 1, / 106
50 Espérance Interprétation : tirons n valeurs de X de façon indépendante : x 1, x 2,..., x n Z la moyenne empirique (x 1 + x x n )/n converge vers E(X) Espérance d une somme de deux variables aléatoires : E(X + Y ) = E(X) + E(Y ) Espérance d un produit de deux variables aléatoires : X et Y indépendantes : E(XY ) = E(X) E(Y ) Nicolas Picard (CIRAD / IRET) December 1, / 106
51 Espérance d une fonction d une variable aléatoire Changement de variable Y = ϕ(x) (pas forcément bijective) Espérance : E[ϕ(X)] = ϕ(x) f(x) dx Exemple : moment non centré d ordre p = E(X p ) Nicolas Picard (CIRAD / IRET) December 1, / 106
52 Variance Variance : Var(X) = E[(X E(X)) 2 ] Z mesure la dispersion autour de l espérance Autre expression équivalente : Var(X) = E(X 2 ) [E(X)] 2 «espérance du carré moins le carré de l espérance» Écart-type : σ = Var(X) Variance d une somme de variables aléatoires : X et Y indépendantes : Var(X + Y ) = Var(X) + Var(Y ) Unités : si X en m, Var(X) en m 2 (mais σ en m) Nicolas Picard (CIRAD / IRET) December 1, / 106
53 Quantiles et médiane quantile d ordre q = F 1 (q) c est la probabilité p telle que Pr(X < p) = q médiane = quantile 50% F(x) er quartile médiane 3e quartile x Nicolas Picard (CIRAD / IRET) December 1, / 106
54 Mode(s) Mode = maximum (local) de la densité de distribution f(x) x Nicolas Picard (CIRAD / IRET) December 1, / 106
55 Couple de variables aléatoires fonction de répartition : H(x, y) = Pr(X < x et Y < y) densité de distribution (variables continues) : densités marginales : f(x) = g(y) = R R h(x, y) = 2 H x y h(x, y) dy F (x) = H(x, ) h(x, y) dx G(y) = H(, y) Nicolas Picard (CIRAD / IRET) December 1, / 106
56 Couple de VA : covariance Covariance : Cov(X, Y ) = E[(X E(X)) (Y E(Y ))] Autre expression équivalente : Cov(X, Y ) = E(XY ) E(X) E(Y ) Si X et Y sont indépendants, alors Cov(X, Y ) = 0 Cov(X, X) = Var(X) Nicolas Picard (CIRAD / IRET) December 1, / 106
57 Vecteur aléatoire généralise le couple de variables aléatoires à p variables aléatoires X = (X 1, X 2,..., X p ) fonction de répartition : F (x 1, x 2,..., x p ) = Pr(X 1 < x 1 et X 2 < x 2 et... et X p < x p ) densité de distribution : f(x 1, x 2,..., x p ) = p F x 1 x 2... x p Nicolas Picard (CIRAD / IRET) December 1, / 106
58 Vecteur aléatoire : moments d ordre 1 et 2 espérance : vecteur de longueur p E(X 1, X 2,..., X p ) = (E(X 1 ), E(X 2 ),..., E(X p )) = m matrice de variance-covariance : matrice p p σ1 2 Cov(X 1, X 2 )... Cov(X 1, X p ) Cov(X) = Cov(X 2, X 1 ) σ Cov(X p, X 1 )... σp 2 = E(X t X) m t m Z matrice symétrique Z matrice diagonale si X 1,..., X m mutuellement indépendants Nicolas Picard (CIRAD / IRET) December 1, / 106
59 Panorama des statistiques et rappels 1 Panorama 2 Rappels de probabilités 3 Lois usuelles 4 Statistiques descriptives : cas unidimensionnel 5 Statistiques descriptives : cas multidimensionnel 6 Conclusion Nicolas Picard (CIRAD / IRET) December 1, / 106
60 Loi uniforme (U) Lois discrètes Ex.: dé à n faces paramètre : n X {1, 2, 3,..., n} Pr(X = k) = 1 pour tout k n E(X) = n Var(X) = n2 1 2 Pr(X = x) x Nicolas Picard (CIRAD / IRET) December 1, / 106
61 Loi de Bernoulli Lois discrètes Ex.: lancer d une pièce (pile ou face) Ex.: survie d un arbre paramètre : p X {0, 1} Pr(X = 1) = p (0 < p < 1) E(X) = p Var(X) = p(1 p) Pr(X = x) x Nicolas Picard (CIRAD / IRET) December 1, / 106
62 Loi binomiale (B) Lois discrètes Ex.: nombre d arbres morts paramètres : n et p somme de n variables indépendantes et identiquement distribuées (i.i.d) Bernoulli(p) X {0, 1,..., n} Pr(X = k) = C k np k (1 p) n k E(X) = np Var(X) = np(1 p) propriété d additivité : X B(n, p) Y B(m, p) X et Y indépendantes : X + Y B(n + m, p) Nicolas Picard (CIRAD / IRET) December 1, / 106
63 Loi binomiale (B) (suite) Pr(X = x) n = 10 p = 0.05 Pr(X = x) n = 10 p = 0.1 Pr(X = x) x n = 10 p = x Pr(X = x) x n = 10 p = x Nicolas Picard (CIRAD / IRET) December 1, / 106
64 Loi de Poisson (P) Lois discrètes paramètre : µ X N Pr(X = k) = exp( µ) µk k! E(X) = Var(X) = µ Loi de référence pour les variables de comptage Si E(X) < Var(X), sous-dispersion Si E(X) > Var(X), sur-dispersion propriété d additivité : X P(µ) Y P(λ) X et Y indépendantes : X + Y P(λ + µ) Nicolas Picard (CIRAD / IRET) December 1, / 106
65 Loi de Poisson (P) (suite) Pr(X = x) µ = 0.5 Pr(X = x) µ = x x Pr(X = x) µ = x Pr(X = x) µ = x Nicolas Picard (CIRAD / IRET) December 1, / 106
66 Origines de la loi de Poisson 1 Limite d une loi binomiale : soit un événement A de probabilité p très faible (< 0.1) que l on essaie d obtenir quelques fois en répétant l expérience un grande nombre de fois (n > 50). Le nombre de réalisations de A suit une loi binomiale B(n, p) avec : B(n, p) P(np) 2 Processus temporel de Poisson : temps d attente indépendants la loi du nombre d événements arrivant dans l intervalle {t; t + T } ne dépend que de T deux événements ne peuvent pas arriver simultanément Alors le nombre d événements suit une loi de Poisson 3 Processus spatial de Poisson Nicolas Picard (CIRAD / IRET) December 1, / 106
67 Autres loi discrètes loi géométrique loi hypergéométrique loi de Pascal loi binomiale négative etc. (N.ML. Johnson, A.W. Kemp & S. Kotz, 2005, Univariate Discrete Distributions, 3 e édition, John Wiley & Sons, New York, 646 p.) Nicolas Picard (CIRAD / IRET) December 1, / 106
68 Loi uniforme Lois continues paramètre : a et b X [a, b] f(x) = 1/(b a) pour x [a, b], 0 sinon F (x) = (x a)/(b a) pour x [a, b] E(X) = (a + b)/2 Var(X) = (b a) 2 /12 1 b a f(x) a b x Nicolas Picard (CIRAD / IRET) December 1, / 106
69 Loi exponentielle Lois continues µ paramètre : µ X > 0 f(x) = µ exp( µx) pour x > 0, 0 sinon F (x) = 1 exp( µx) pour x > 0 E(X) = 1/λ Var(X) = 1/λ 2 f(x) Nicolas Picard (CIRAD / IRET) December 1, / 106 x
70 Loi de Laplace-Gauss (N ) Lois continues aussi appelée «loi normale» paramètre : m et σ X R f(x) [ x) = 1 σ 2π exp 1 2 ( ) ] x m 2 σ E(X) = m Var(X) = σ 2 m 3σ m 2σ m σ m x m + σ m + 2σ m + 3σ Nicolas Picard (CIRAD / IRET) December 1, / 106
71 Quelques propriétés de la loi normale quantiles à 95 % : Pr(m 1.96σ < X < m σ) = 0.95 propriété d additivité : X N (m, σ) Y N (p, τ) X et Y indépendantes : X + Y N (m + p, σ + τ) convergence de la loi de Poisson vers la loi normale : X P(µ) X µ µ N (0, 1) µ Nicolas Picard (CIRAD / IRET) December 1, / 106
72 Théorème central-limite il justifie le rôle central de la loi normale (X n ) suite de variables aléatoires i.i.d d espérance µ et d écart-type σ ( ) 1 X1 + X X n nµ N (0, 1) n σ n Nicolas Picard (CIRAD / IRET) December 1, / 106
73 Loi du chi-deux (χ 2 ) Lois continues Définition : U 1, U 2,..., U p i.i.d N (0, 1) p i=1 U 2 i χ 2 p paramètre : p N X > 0 E(X) = p Var(X) = 2p f(x) x Nicolas Picard (CIRAD / IRET) December 1, / 106
74 Loi de Fisher-Snedecor (F ) Lois continues Définition : X χ 2 n Y χ 2 p X et Y indépendants paramètre : n et p X/n Y/p F (n, p) Nicolas Picard (CIRAD / IRET) December 1, / 106
75 Loi de Student (T ) Lois continues Définition : U N (0, 1) X χ 2 n X et U indépendants U X/n T (n) paramètre : n E(X) = 0 (n > 1) f(x) Var(X) = n/(n 2) (n > 2) x n = 1 n = 2 n = 5 n = 10 n = 50 Nicolas Picard (CIRAD / IRET) December 1, / 106
76 Autres lois continues loi gamma loi bêta (type I, type II) loi de l arc sinus loi log-normale loi de Weibull loi Cauchy loi de Gumbel loi du T 2 de Hotelling loi du Λ de Wilks Etc. (N.L. Johnson & S. Kotz, 1970, Distributions in Statistics: Continuous Univariate Distributions, vol.1, John Wiley & Sons, New York, 300 p.) Nicolas Picard (CIRAD / IRET) December 1, / 106
77 Loi multinomiale (M) Loi multivariée discrète Généralise la loi binomiale à k modalités Définition : soit X variable modale à k modalités soit p i la probabilité de tirer la modalité i on fait n tirages indépendants de X soit Ni le nombre de fois où l on a tiré la i e modalité (N 1, N 2,..., N k ) M(n, p 1, p 2,..., p k ) Loi : Pr(N 1 = n 1,..., N k = n k ) = n! n 1!n 2!... n k! pn 1 1 pn pn k k Nicolas Picard (CIRAD / IRET) December 1, / 106
78 Loi multinomiale (suite) Espérance : E(N 1, N 2,..., N k ) = (np 1, np 2,..., np k ) Résultat à la base du test du χ 2 : k (N i np i ) 2 χ 2 np i n k 1 i=1 Nicolas Picard (CIRAD / IRET) December 1, / 106
79 Loi multinormale Loi multivariée continue Définition : X est un vecteur gaussien à p dimensions si toute combinaison linéaire de ses composantes suit une loi de Laplace-Gauss densité de probabilité : ( 1 f(x 1, x 2,..., x p ) = (2π) p/2 detσ exp 1 ) t (x m)σ 1 (x m) 2 avec m = espérance du vecteur et Σ = matrice de variance-covariance Nicolas Picard (CIRAD / IRET) December 1, / 106
80 f(x,y) f(x,y) Loi multinormale (suite) y y x x y y x x Nicolas Picard (CIRAD / IRET) December 1, / 106
81 Autres lois multivariées loi de Wishart Etc. (N.L. Johnson & S. Kotz (1972) Distributions in Statistics: Continuous Multivariate Distributions, vol.2, John Wiley & Sons, New York) Nicolas Picard (CIRAD / IRET) December 1, / 106
82 Panorama des statistiques et rappels 1 Panorama 2 Rappels de probabilités 3 Lois usuelles 4 Statistiques descriptives : cas unidimensionnel 5 Statistiques descriptives : cas multidimensionnel 6 Conclusion Nicolas Picard (CIRAD / IRET) December 1, / 106
83 Présentation des données : variable numérique discrète Variable prenant des valeurs entières (plus rarement décimales) Nombre de valeurs distinctes assez faibles ( 20) Exemple : nombre de semis d une essence dans 48 placeaux Nicolas Picard (CIRAD / IRET) December 1, / 106
84 Présentation des données : tableau statistique Variable numérique discrète 1 ère colonne : observations distinctes rangées par ordre croissant 2 e colonne : effectif 3 e colonne : effectif cumulé 4 e colonne : fréquence 5 e colonne : fréquence cumulée x n N f F Nicolas Picard (CIRAD / IRET) December 1, / 106
85 Présentation des données : «stem-and-leaf» Variable numérique discrète «tige» : chiffre des dizaines «feuille» : chiffre des unités Nicolas Picard (CIRAD / IRET) December 1, / 106
86 Présentation des données : variable qualitative Tableau statistique Exemple : répartition de la population active selon la catégorie socioprofessionnelle (France, 1988) CSP effectif fréquence agriculteurs artisans, commerçants cadres professions intermédiaires employés ouvriers Nicolas Picard (CIRAD / IRET) December 1, / 106
87 Présentation des données : variable quantitative continue Découpage en classes Tableau statistique sur les classes Exemple : diamètres de 255 sapelli (Entandrophragma cylindricum) avec D 10 cm classe effectif fréquence [10, 20) [20, 30) [30, 40) [40, 50) [50, 60) [60, ) Nicolas Picard (CIRAD / IRET) December 1, / 106
88 Représentation graphique : diagramme en bâtons Variable quantitative discrète Exemple du nombre de semis dans 48 placeaux Effectif Nombre de semis Nicolas Picard (CIRAD / IRET) December 1, / 106
89 Représentation graphique : diagramme cumulatif Variable quantitative discrète Exemple du nombre de semis dans 48 placeaux Effectif cumulé Nombre de semis Nicolas Picard (CIRAD / IRET) December 1, / 106
90 Représentation graphique : diagramme en colonnes Variable qualitative Exemple des catégories socioprofessionnelles Effectif agriculteurs artisans... cadres profs. interm. employés ouvriers Nicolas Picard (CIRAD / IRET) December 1, / 106
91 Représentation graphique : diagramme en barre Variable qualitative Exemple des catégories socioprofessionnelles Effectif cumulé agriculteurs artisans... cadres profs. interm. employés ouvriers Nicolas Picard (CIRAD / IRET) December 1, / 106
92 Représentation graphique : diagramme en secteurs Variable qualitative Exemple des catégories socioprofessionnelles profs. interm. cadres artisans... agriculteurs employés ouvriers Nicolas Picard (CIRAD / IRET) December 1, / 106
93 Représentation graphique : courbe cumulative Variable quantitative continue Exemple des diamètres de sapelli Fréquence cumulée Diamètre (cm) Nicolas Picard (CIRAD / IRET) December 1, / 106
94 Représentation graphique : histogramme Variable quantitative continue Exemple des diamètres de sapelli Effectif Diamètre (cm) Nicolas Picard (CIRAD / IRET) December 1, / 106
95 Représentation graphique : histogramme (suite) Variable quantitative continue Exemple des diamètres de sapelli Densité de fréquence Diamètre (cm) Nicolas Picard (CIRAD / IRET) December 1, / 106
96 Représentation graphique : courbe de densité Variable quantitative continue Exemple des diamètres de sapelli Densité N = 255 Bandwidth = Nicolas Picard (CIRAD / IRET) December 1, / 106
97 Représentation graphique : boîte à moustaches Variable quantitative continue Exemple des diamètres de sapelli Diamètre (cm) Nicolas Picard (CIRAD / IRET) December 1, / 106
98 Résumés numériques Variable quantitative continue une variable : moyenne écart-type coefficient de variation quartiles et médiane deux variables : corrélation... n variables : matrice des corrélations... Nicolas Picard (CIRAD / IRET) December 1, / 106
99 La moyenne empirique Moyenne arithmétique : x = 1 n (x 1 + x x n ) Il existe d autres moyennes : moyenne géométrique : n x 1... x n certains indices économiques moyenne quadratique : (x x2 n)/n diamètre équivalent 1 moyenne harmonique : ( ) 1 1 n x x n Nicolas Picard (CIRAD / IRET) December 1, / 106
100 La médiane empirique x 1 < x 2 <... < x n m = x (n+1)/2 ou x n/2 + x n/2+1 2 Nicolas Picard (CIRAD / IRET) December 1, / 106
101 Le quantile empirique α x 1 < x 2 <... < x n Exemple : quantile à 95 % x m tel que m n = α Nicolas Picard (CIRAD / IRET) December 1, / 106
102 L écart-type empirique Variance empirique : s 2 = 1 n Écart-type empirique : s = s 2 n (x i x) 2 i=1 Nicolas Picard (CIRAD / IRET) December 1, / 106
103 Cas de la loi normale Relation entre moyenne (m), écart-type (σ) et quantiles : 95 % des observations sont comprises entre m 1.96σ et m σ Nicolas Picard (CIRAD / IRET) December 1, / 106
104 Limites de l écart-type Valeur relative et absolue Un écart-type de 500 g pour la masse n a pas la même signification selon la taille de l animal : Nicolas Picard (CIRAD / IRET) December 1, / 106
105 Le coefficient de variation CV = s x Nicolas Picard (CIRAD / IRET) December 1, / 106
106 Panorama des statistiques et rappels 1 Panorama 2 Rappels de probabilités 3 Lois usuelles 4 Statistiques descriptives : cas unidimensionnel 5 Statistiques descriptives : cas multidimensionnel 6 Conclusion Nicolas Picard (CIRAD / IRET) December 1, / 106
107 Liaison entre deux variables quantitatives Méthode graphique Nuage de points : une des variables sur l axe des x l autre sur l axe des y Nicolas Picard (CIRAD / IRET) December 1, / 106
108 Coefficient de corrélation linéaire Définition : Estimation : Ĉov(X, Y ) = 1 n ρ = Cov(X, Y ) σ X σ Y n (X i X)(Y i Ȳ ) i=1 Remarque : Cov(X, X) = 1 n n (X i X) 2 = Var(X) = SX 2 i=1 donc ρ(x, X) = 1 Nicolas Picard (CIRAD / IRET) December 1, / 106
109 Coefficient de corrélation linéaire (suite) Le coefficient de corrélation linéaire est aussi : la racine carrée du coefficient de détermination de la régression linéaire de Y par rapport à X le pourcentage de variance expliquée par cette régression linéaire Nicolas Picard (CIRAD / IRET) December 1, / 106
110 Il quantifie la «force» de la relation linéaire et varie entre 1 et 1 Y R = 0 Y R = 0.3 Y R = X X X Y R = 0.7 Y R = 0.9 Y R = Nicolas Picard (CIRAD X / IRET) X December 1, 2011 X 83 / 106
111 Les pièges du coefficient de corrélation linéaire ρ = 0.77 ρ = 0.66 ρ = 0.8 ρ = 0.76 Nicolas Picard (CIRAD / IRET) December 1, / 106
112 Réchauffement climatique Corrélation positive... Nicolas Picard (CIRAD / IRET) December 1, / 106
113 Réchauffement climatique... ou corrélation négative? Nicolas Picard (CIRAD / IRET) December 1, / 106
114 Liaison entre deux variables ordinales Coefficient de corrélation des rangs τ de Kendall : k = 1 si X i < X j et Y i < Y j, ou si X i > X j et Y i > Y j k = 1 sinon S = k sur les n(n 1)/2 couples 2S τ = n(n 1) Nicolas Picard (CIRAD / IRET) December 1, / 106
115 Liaison entre une variable quantitative et une variable qualitative Rapport de corrélation : η 2 = Var[E(Y X)] Var(Y ) C est aussi : la racine carrée du coefficient de détermination de l analyse de variance de Y par rapport à X le coefficient de corrélation multiple de Y par rapport aux variables indicatrices des modalités de X la racine carrée du coefficient de détermination de la régression multiple de Y par rapport à ces variables indicatrices Nicolas Picard (CIRAD / IRET) December 1, / 106
116 Liaison entre une variable quantitative et une variable qualitative Représentation graphique Boîtes parallèles : une boîte à moustache de la variable quantitative par modalité de la variable qualitative Valeurs a b c d e f Modalités Nicolas Picard (CIRAD / IRET) December 1, / 106
117 Liaison entre deux variables qualitatives Coefficient de corrélation canonique : c est la valeur maximale (autre que 1) du coefficient de corrélation linéaire entre une combinaison linéaire des variables indicatrices des modalités de X et une combinaison linéaire des variables indicatrices des modalités de Y C est aussi la première valeur propre (autre que 1) de l analyse canonique des tableaux disjonctifs complets formés à partir de X et Y Nicolas Picard (CIRAD / IRET) December 1, / 106
118 Liaison entre deux variables qualitatives Statistique du χ 2 sur table de contingence Y j. X i n ij n i. X 2 = i. n.j n ( n ij n i.n.j n n i. n.j j n ) 2 Nicolas Picard (CIRAD / IRET) December 1, / 106
119 Liaison entre deux variables qualitatives Représentation graphique Diagramme en barres : un diagramme pour l une des variables par modalité de l autre variable Exemple : durée d obtention du DEUG en fonction de l âge d obtention du bac Effectif Fréquence Durée d obtention du DEUG 2 ans 3 ans 4 ans < >19 Âge d obtention du bac (ans) moy >19 Âge d obtention du bac (ans) Nicolas Picard (CIRAD / IRET) December 1, / 106
120 Liaison entre n variables Liaison deux à deux : matrice des corrélations graphiques j L absence de liaisons 2 à 2 ne signifie pas qu il n y a pas de liaisons entre 3, 4... variables j Contre-exemple : (X, Y, Z) avec X loi uniforme dans { 1, 1} Y loi uniforme dans { 1, 1} indépendamment de X Z = X Y Nicolas Picard (CIRAD / IRET) December 1, / 106
121 Exemple : les iris de Fisher Nicolas Picard (CIRAD / IRET) December 1, / 106
122 Relation entre n variables : tableau des nuages de points Exemple des iris : Sepal.Length Sepal.Width Petal.Length Petal.Width Nicolas Picard (CIRAD / IRET) December 1, / 106
123 Panorama des statistiques et rappels 1 Panorama 2 Rappels de probabilités 3 Lois usuelles 4 Statistiques descriptives : cas unidimensionnel 5 Statistiques descriptives : cas multidimensionnel 6 Conclusion Nicolas Picard (CIRAD / IRET) December 1, / 106
124 Démarche Question scientifique Quelle méthode? Quel dispositif de mesure? Acquisition, puis structuration des données Analyses exploratoires Analyse pour répondre à la question Nicolas Picard (CIRAD / IRET) December 1, / 106
125 Quelle méthode? Quel dispositif de mesure? Estimer Exemple de la moyenne d une population gaussienne quelle taille d échantillon? Tester Exemple de la comparaison des moyennes de deux populations gaussiennes Liaisons Nicolas Picard (CIRAD / IRET) December 1, / 106
Statistiques Descriptives à une dimension
I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des
Plus en détailAnnexe commune aux séries ES, L et S : boîtes et quantiles
Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans
Plus en détail3. Caractéristiques et fonctions d une v.a.
3. Caractéristiques et fonctions d une v.a. MTH2302D S. Le Digabel, École Polytechnique de Montréal H2015 (v2) MTH2302D: fonctions d une v.a. 1/32 Plan 1. Caractéristiques d une distribution 2. Fonctions
Plus en détailMoments des variables aléatoires réelles
Chapter 6 Moments des variables aléatoires réelles Sommaire 6.1 Espérance des variables aléatoires réelles................................ 46 6.1.1 Définition et calcul........................................
Plus en détailSimulation de variables aléatoires
Chapter 1 Simulation de variables aléatoires Références: [F] Fishman, A first course in Monte Carlo, chap 3. [B] Bouleau, Probabilités de l ingénieur, chap 4. [R] Rubinstein, Simulation and Monte Carlo
Plus en détailLogiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS
Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence
Plus en détailProgrammes des classes préparatoires aux Grandes Ecoles
Programmes des classes préparatoires aux Grandes Ecoles Filière : scientifique Voie : Biologie, chimie, physique et sciences de la Terre (BCPST) Discipline : Mathématiques Seconde année Préambule Programme
Plus en détailStatistique Descriptive Élémentaire
Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Élémentaire (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219 Université Paul Sabatier
Plus en détailPROBABILITES ET STATISTIQUE I&II
PROBABILITES ET STATISTIQUE I&II TABLE DES MATIERES CHAPITRE I - COMBINATOIRE ELEMENTAIRE I.1. Rappel des notations de la théorie des ensemble I.1.a. Ensembles et sous-ensembles I.1.b. Diagrammes (dits
Plus en détail4 Distributions particulières de probabilités
4 Distributions particulières de probabilités 4.1 Distributions discrètes usuelles Les variables aléatoires discrètes sont réparties en catégories selon le type de leur loi. 4.1.1 Variable de Bernoulli
Plus en détailSéries Statistiques Simples
1. Collecte et Représentation de l Information 1.1 Définitions 1.2 Tableaux statistiques 1.3 Graphiques 2. Séries statistiques simples 2.1 Moyenne arithmétique 2.2 Mode & Classe modale 2.3 Effectifs &
Plus en détailExercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.
14-3- 214 J.F.C. p. 1 I Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques. Exercice 1 Densité de probabilité. F { ln x si x ], 1] UN OVNI... On pose x R,
Plus en détailChapitre 3. Les distributions à deux variables
Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles
Plus en détailTests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA
Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA Soutenance de doctorat, sous la direction de Pr. Bilodeau, M. et Pr. Ducharme, G. Université de Montréal et Université
Plus en détailEspérance conditionnelle
Espérance conditionnelle Samy Tindel Nancy-Université Master 1 - Nancy Samy T. (IECN) M1 - Espérance conditionnelle Nancy-Université 1 / 58 Plan 1 Définition 2 Exemples 3 Propriétés de l espérance conditionnelle
Plus en détailIntroduction à l approche bootstrap
Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?
Plus en détailChapitre 6 Test de comparaison de pourcentages χ². José LABARERE
UE4 : Biostatistiques Chapitre 6 Test de comparaison de pourcentages χ² José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Nature des variables
Plus en détailQue faire lorsqu on considère plusieurs variables en même temps?
Chapitre 3 Que faire lorsqu on considère plusieurs variables en même temps? On va la plupart du temps se limiter à l étude de couple de variables aléatoires, on peut bien sûr étendre les notions introduites
Plus en détailTSTI 2D CH X : Exemples de lois à densité 1
TSTI 2D CH X : Exemples de lois à densité I Loi uniforme sur ab ; ) Introduction Dans cette activité, on s intéresse à la modélisation du tirage au hasard d un nombre réel de l intervalle [0 ;], chacun
Plus en détailBiostatistiques : Petits effectifs
Biostatistiques : Petits effectifs Master Recherche Biologie et Santé P. Devos DRCI CHRU de Lille EA2694 patrick.devos@univ-lille2.fr Plan Données Générales : Définition des statistiques Principe de l
Plus en détail3. Conditionnement P (B)
Conditionnement 16 3. Conditionnement Dans cette section, nous allons rappeler un certain nombre de définitions et de propriétés liées au problème du conditionnement, c est à dire à la prise en compte
Plus en détailCalcul élémentaire des probabilités
Myriam Maumy-Bertrand 1 et Thomas Delzant 1 1 IRMA, Université Louis Pasteur Strasbourg, France Licence 1ère Année 16-02-2006 Sommaire La loi de Poisson. Définition. Exemple. 1 La loi de Poisson. 2 3 4
Plus en détailVariables Aléatoires. Chapitre 2
Chapitre 2 Variables Aléatoires Après avoir réalisé une expérience, on ne s intéresse bien souvent à une certaine fonction du résultat et non au résultat en lui-même. Lorsqu on regarde une portion d ADN,
Plus en détailDéroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI
1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage
Plus en détail1. Vocabulaire : Introduction au tableau élémentaire
L1-S1 Lire et caractériser l'information géographique - Le traitement statistique univarié Statistique : le terme statistique désigne à la fois : 1) l'ensemble des données numériques concernant une catégorie
Plus en détailt 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :
Terminale STSS 2 012 2 013 Pourcentages Synthèse 1) Définition : Calculer t % d'un nombre, c'est multiplier ce nombre par t 100. 2) Exemples de calcul : a) Calcul d un pourcentage : Un article coûtant
Plus en détailTable des matières. I Mise à niveau 11. Préface
Table des matières Préface v I Mise à niveau 11 1 Bases du calcul commercial 13 1.1 Alphabet grec...................................... 13 1.2 Symboles mathématiques............................... 14 1.3
Plus en détailBases : Probabilités, Estimation et Tests.
Université René Descartes LMD Sciences de la Vie et de la Santé UFR Biomédicale, M1 de Santé Publique 45 rue des Saints-Père, 75 006 Paris Spécialité Biostatistique M1 COURS de BIOSTATISTIQUE I Bases :
Plus en détailTABLE DES MATIERES. C Exercices complémentaires 42
TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence
Plus en détailIntroduction à la Statistique Inférentielle
UNIVERSITE MOHAMMED V-AGDAL SCIENCES FACULTE DES DEPARTEMENT DE MATHEMATIQUES SMI semestre 4 : Probabilités - Statistique Introduction à la Statistique Inférentielle Prinemps 2013 0 INTRODUCTION La statistique
Plus en détailTests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles
Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA
Plus en détailReprésentation d une distribution
5 Représentation d une distribution VARIABLE DISCRÈTE : FRÉQUENCES RELATIVES DES CLASSES Si dans un graphique représentant une distribution, on place en ordonnées le rapport des effectifs n i de chaque
Plus en détailEstimation: intervalle de fluctuation et de confiance. Mars 2012. IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison
Estimation: intervalle de fluctuation et de confiance Mars 2012 IREM: groupe Proba-Stat Estimation Term.1 Intervalle de fluctuation connu : probabilité p, taille de l échantillon n but : estimer une fréquence
Plus en détailStatistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier
Statistiques Appliquées à l Expérimentation en Sciences Humaines Christophe Lalanne, Sébastien Georges, Christophe Pallier Table des matières 1 Méthodologie expérimentale et recueil des données 6 1.1 Introduction.......................................
Plus en détailTravaux dirigés d introduction aux Probabilités
Travaux dirigés d introduction aux Probabilités - Dénombrement - - Probabilités Élémentaires - - Variables Aléatoires Discrètes - - Variables Aléatoires Continues - 1 - Dénombrement - Exercice 1 Combien
Plus en détailI3, Probabilités 2014 Travaux Dirigés F BM F BM F BM F BM F B M F B M F B M F B M 20 20 80 80 100 100 300 300
I3, Probabilités 2014 Travaux Dirigés TD 1 : rappels. Exercice 1 Poker simplié On tire 3 cartes d'un jeu de 52 cartes. Quelles sont les probabilités d'obtenir un brelan, une couleur, une paire, une suite,
Plus en détailMA6.06 : Mesure et Probabilités
Année universitaire 2002-2003 UNIVERSITÉ D ORLÉANS Olivier GARET MA6.06 : Mesure et Probabilités 2 Table des matières Table des matières i 1 Un peu de théorie de la mesure 1 1.1 Tribus...............................
Plus en détailChapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens
Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques
Plus en détailMéthodes de Simulation
Méthodes de Simulation JEAN-YVES TOURNERET Institut de recherche en informatique de Toulouse (IRIT) ENSEEIHT, Toulouse, France Peyresq06 p. 1/41 Remerciements Christian Robert : pour ses excellents transparents
Plus en détailINTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES
INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine
Plus en détailLoi binomiale Lois normales
Loi binomiale Lois normales Christophe ROSSIGNOL Année scolaire 204/205 Table des matières Rappels sur la loi binomiale 2. Loi de Bernoulli............................................ 2.2 Schéma de Bernoulli
Plus en détailProbabilités III Introduction à l évaluation d options
Probabilités III Introduction à l évaluation d options Jacques Printems Promotion 2012 2013 1 Modèle à temps discret 2 Introduction aux modèles en temps continu Limite du modèle binomial lorsque N + Un
Plus en détailTests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision
Page n 1. Tests du χ 2 une des fonctions des statistiques est de proposer, à partir d observations d un phénomène aléatoire (ou modélisé comme tel) une estimation de la loi de ce phénomène. C est que nous
Plus en détailRelation entre deux variables : estimation de la corrélation linéaire
CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence
Plus en détailAide-mémoire de statistique appliquée à la biologie
Maxime HERVÉ Aide-mémoire de statistique appliquée à la biologie Construire son étude et analyser les résultats à l aide du logiciel R Version 5(2) (2014) AVANT-PROPOS Les phénomènes biologiques ont cela
Plus en détailLois de probabilité. Anita Burgun
Lois de probabilité Anita Burgun Problème posé Le problème posé en statistique: On s intéresse à une population On extrait un échantillon On se demande quelle sera la composition de l échantillon (pourcentage
Plus en détailFPSTAT 2 í La dçecision statistique. 1. Introduction ça l'infçerence. 1
INTRODUCTION ça L'INFçERENCE STATISTIQUE 1. Introduction 2. Notion de variable alçeatoire íprçesentation ívariables alçeatoires discrçetes ívariables alçeatoires continues 3. Reprçesentations d'une distribution
Plus en détailCours d Analyse. Fonctions de plusieurs variables
Cours d Analyse Fonctions de plusieurs variables Licence 1ère année 2007/2008 Nicolas Prioux Université de Marne-la-Vallée Table des matières 1 Notions de géométrie dans l espace et fonctions à deux variables........
Plus en détailLecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888
Lecture critique d article Rappels Bio statistiques Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888 Plan du cours Rappels fondamentaux Statistiques descriptives Notions de tests statistiques
Plus en détailCours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES
LES STATISTIQUES INFERENTIELLES (test de Student) L inférence statistique est la partie des statistiques qui, contrairement à la statistique descriptive, ne se contente pas de décrire des observations,
Plus en détailCapacité d un canal Second Théorème de Shannon. Théorie de l information 1/34
Capacité d un canal Second Théorème de Shannon Théorie de l information 1/34 Plan du cours 1. Canaux discrets sans mémoire, exemples ; 2. Capacité ; 3. Canaux symétriques ; 4. Codage de canal ; 5. Second
Plus en détailStatistiques descriptives
Statistiques descriptives L3 Maths-Eco Université de Nantes Frédéric Lavancier F. Lavancier (Univ. Nantes) Statistiques descriptives 1 1 Vocabulaire de base F. Lavancier (Univ. Nantes) Statistiques descriptives
Plus en détailLes devoirs en Première STMG
Les devoirs en Première STMG O. Lader Table des matières Devoir sur table 1 : Proportions et inclusions....................... 2 Devoir sur table 1 : Proportions et inclusions (corrigé)..................
Plus en détailProbabilités et statistique. Benjamin JOURDAIN
Probabilités et statistique Benjamin JOURDAIN 11 septembre 2013 2 i ii À Anne Préface Ce livre est issu du polycopié du cours de probabilités et statistique de première année de l École des Ponts ParisTech
Plus en détailProbabilités et Statistique
Ricco Rakotomalala Probabilités et Statistique Notes de cours Université Lumière Lyon 2 Avant-propos Ce document est un support de cours pour les enseignements des probabilités et de la statistique. Il
Plus en détailBiostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke
www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3
Plus en détail4. Martingales à temps discret
Martingales à temps discret 25 4. Martingales à temps discret 4.1. Généralités. On fixe un espace de probabilités filtré (Ω, (F n ) n, F, IP ). On pose que F contient ses ensembles négligeables mais les
Plus en détailRésumé du Cours de Statistique Descriptive. Yves Tillé
Résumé du Cours de Statistique Descriptive Yves Tillé 15 décembre 2010 2 Objectif et moyens Objectifs du cours Apprendre les principales techniques de statistique descriptive univariée et bivariée. Être
Plus en détailTESTS D HYPOTHÈSE FONDÉS SUR LE χ². http://fr.wikipedia.org/wiki/eugénisme
TESTS D HYPOTHÈSE FONDÉS SUR LE χ² http://fr.wikipedia.org/wiki/eugénisme Logo du Second International Congress of Eugenics 1921. «Comme un arbre, l eugénisme tire ses constituants de nombreuses sources
Plus en détailPrincipe d un test statistique
Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre
Plus en détailModélisation géostatistique des débits le long des cours d eau.
Modélisation géostatistique des débits le long des cours d eau. C. Bernard-Michel (actuellement à ) & C. de Fouquet MISTIS, INRIA Rhône-Alpes. 655 avenue de l Europe, 38334 SAINT ISMIER Cedex. Ecole des
Plus en détailAmphi 3: Espaces complets - Applications linéaires continues
Amphi 3: Espaces complets - Applications linéaires continues Département de Mathématiques École polytechnique Remise en forme mathématique 2013 Suite de Cauchy Soit (X, d) un espace métrique. Une suite
Plus en détailL ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ
L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et
Plus en détailActuariat I ACT2121. septième séance. Arthur Charpentier. Automne 2012. charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free.
Actuariat I ACT2121 septième séance Arthur Charpentier charpentier.arthur@uqam.ca http ://freakonometrics.blog.free.fr/ Automne 2012 1 Exercice 1 En analysant le temps d attente X avant un certain événement
Plus en détailSTATISTIQUES. UE Modélisation pour la biologie
STATISTIQUES UE Modélisation pour la biologie 2011 Cadre Général n individus: 1, 2,..., n Y variable à expliquer : Y = (y 1, y 2,..., y n ), y i R Modèle: Y = Xθ + ε X matrice du plan d expériences θ paramètres
Plus en détailFORMULAIRE DE STATISTIQUES
FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)
Plus en détailModélisation aléatoire en fiabilité des logiciels
collection Méthodes stochastiques appliquées dirigée par Nikolaos Limnios et Jacques Janssen La sûreté de fonctionnement des systèmes informatiques est aujourd hui un enjeu économique et sociétal majeur.
Plus en détailLa simulation probabiliste avec Excel
La simulation probabiliste avec Ecel (2 e version) Emmanuel Grenier emmanuel.grenier@isab.fr Relu par Kathy Chapelain et Henry P. Aubert Incontournable lorsqu il s agit de gérer des phénomènes aléatoires
Plus en détailBac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)
Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures) Eercice 1 (5 points) pour les candidats n ayant pas choisi la spécialité MATH Le tableau suivant donne l évolution du chiffre
Plus en détailSection «Maturité fédérale» EXAMENS D'ADMISSION Session de février 2014 RÉCAPITULATIFS DES MATIÈRES EXAMINÉES. Formation visée
EXAMENS D'ADMISSION Admission RÉCAPITULATIFS DES MATIÈRES EXAMINÉES MATIÈRES Préparation en 3 ou 4 semestres Formation visée Préparation complète en 1 an 2 ème partiel (semestriel) Niveau Durée de l examen
Plus en détailBACCALAURÉAT PROFESSIONNEL SUJET
SESSION 203 Métropole - Réunion - Mayotte BACCALAURÉAT PROFESSIONNEL ÉPREUVE E4 CULTURE SCIENTIFIQUE ET TECHNOLOGIQUE : MATHÉMATIQUES Toutes options Durée : 2 heures Matériel(s) et document(s) autorisé(s)
Plus en détailLA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
Plus en détailStatistique : Résumé de cours et méthodes
Statistique : Résumé de cours et méthodes 1 Vocabulaire : Population : c est l ensemble étudié. Individu : c est un élément de la population. Effectif total : c est le nombre total d individus. Caractère
Plus en détailMODELES DE DUREE DE VIE
MODELES DE DUREE DE VIE Cours 1 : Introduction I- Contexte et définitions II- Les données III- Caractéristiques d intérêt IV- Evènements non renouvelables/renouvelables (unique/répété) I- Contexte et définitions
Plus en détailFonctions de plusieurs variables, intégrales multiples, et intégrales dépendant d un paramètre
IUFM du Limousin 2009-10 PLC1 Mathématiques S. Vinatier Rappels de cours Fonctions de plusieurs variables, intégrales multiples, et intégrales dépendant d un paramètre 1 Fonctions de plusieurs variables
Plus en détailApproche modèle pour l estimation en présence de non-réponse non-ignorable en sondage
Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage Journées de Méthodologie Statistique Eric Lesage Crest-Ensai 25 janvier 2012 Introduction et contexte 2/27 1 Introduction
Plus en détailVI. Tests non paramétriques sur un échantillon
VI. Tests non paramétriques sur un échantillon Le modèle n est pas un modèle paramétrique «TESTS du CHI-DEUX» : VI.1. Test d ajustement à une loi donnée VI.. Test d indépendance de deux facteurs 96 Différentes
Plus en détailUNE REPRESENTATION GRAPHIQUE DE LA LIAISON STATISTIQUE ENTRE DEUX VARIABLES ORDONNEES. Éric TÉROUANNE 1
33 Math. Inf. Sci. hum., (33 e année, n 130, 1995, pp.33-42) UNE REPRESENTATION GRAPHIQUE DE LA LIAISON STATISTIQUE ENTRE DEUX VARIABLES ORDONNEES Éric TÉROUANNE 1 RÉSUMÉ Le stéréogramme de liaison est
Plus en détailLoi d une variable discrète
MATHEMATIQUES TD N : VARIABLES DISCRETES - Corrigé. P[X = k] 0 k point de discontinuité de F et P[X = k] = F(k + ) F(k ) Ainsi, P[X = ] =, P[X = 0] =, P[X = ] = R&T Saint-Malo - nde année - 0/0 Loi d une
Plus en détailCours de Tests paramétriques
Cours de Tests paramétriques F. Muri-Majoube et P. Cénac 2006-2007 Licence Ce document est sous licence ALC TYPE 2. Le texte de cette licence est également consultable en ligne à l adresse http://www.librecours.org/cgi-bin/main?callback=licencetype2.
Plus en détailCalcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes.
1 Définitions, notations Calcul matriciel Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes. On utilise aussi la notation m n pour le
Plus en détailClasse de première L
Classe de première L Orientations générales Pour bon nombre d élèves qui s orientent en série L, la classe de première sera une fin d étude en mathématiques au lycée. On a donc voulu ici assurer à tous
Plus en détailLa Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1
La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1 La licence Mathématiques et Economie-MASS de l Université des Sciences Sociales de Toulouse propose sur les trois
Plus en détailPROBABILITÉS: COURS DE LICENCE DE MATHÉMATIQUES APPLIQUÉES LM 390
PROBABILITÉS: COURS DE LICENCE DE MATHÉMATIQUES APPLIQUÉES LM 390 Université PARIS 6 2008/2009 Jean BERTOIN 1 Table des Matières ( ) ces parties peuvent ^etre omises en première lecture, et ne feront pas
Plus en détailProbabilités et Statistiques. Feuille 2 : variables aléatoires discrètes
IUT HSE Probabilités et Statistiques Feuille : variables aléatoires discrètes 1 Exercices Dénombrements Exercice 1. On souhaite ranger sur une étagère 4 livres de mathématiques (distincts), 6 livres de
Plus en détailChristophe SANNIER christophe.sannier@sirs-fr.com
Systèmes d Information à Référence Spatiale Utilisation d un Estimateur de Régression avec des Données Landsat pour l Estimation de l Etendu et des Changements du Couvert Forestier du Gabon de 1990 à 2010
Plus en détailPrécision d un résultat et calculs d incertitudes
Précision d un résultat et calculs d incertitudes PSI* 2012-2013 Lycée Chaptal 3 Table des matières Table des matières 1. Présentation d un résultat numérique................................ 4 1.1 Notations.........................................................
Plus en détailLeçon N 4 : Statistiques à deux variables
Leçon N 4 : Statistiques à deux variables En premier lieu, il te faut relire les cours de première sur les statistiques à une variable, il y a tout un langage à se remémorer : étude d un échantillon d
Plus en détailRappels sur les suites - Algorithme
DERNIÈRE IMPRESSION LE 14 septembre 2015 à 12:36 Rappels sur les suites - Algorithme Table des matières 1 Suite : généralités 2 1.1 Déition................................. 2 1.2 Exemples de suites............................
Plus en détailLa classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
Plus en détailCours de méthodes de scoring
UNIVERSITE DE CARTHAGE ECOLE SUPERIEURE DE STATISTIQUE ET D ANALYSE DE L INFORMATION Cours de méthodes de scoring Préparé par Hassen MATHLOUTHI Année universitaire 2013-2014 Cours de méthodes de scoring-
Plus en détailTABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie
PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats Pierre Dagnelie TABLE DES MATIÈRES 2012 Presses agronomiques de Gembloux pressesagro.gembloux@ulg.ac.be www.pressesagro.be
Plus en détailCONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un
Plus en détailAnalyse en Composantes Principales
Analyse en Composantes Principales Anne B Dufour Octobre 2013 Anne B Dufour () Analyse en Composantes Principales Octobre 2013 1 / 36 Introduction Introduction Soit X un tableau contenant p variables mesurées
Plus en détailComplexité. Licence Informatique - Semestre 2 - Algorithmique et Programmation
Complexité Objectifs des calculs de complexité : - pouvoir prévoir le temps d'exécution d'un algorithme - pouvoir comparer deux algorithmes réalisant le même traitement Exemples : - si on lance le calcul
Plus en détailBaccalauréat ES Pondichéry 7 avril 2014 Corrigé
Baccalauréat ES Pondichéry 7 avril 204 Corrigé EXERCICE 4 points Commun à tous les candidats. Proposition fausse. La tangente T, passant par les points A et B d abscisses distinctes, a pour coefficient
Plus en détailExercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT
Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT Ces exercices portent sur les items 2, 3 et 5 du programme d informatique des classes préparatoires,
Plus en détailLire ; Compter ; Tester... avec R
Lire ; Compter ; Tester... avec R Préparation des données / Analyse univariée / Analyse bivariée Christophe Genolini 2 Table des matières 1 Rappels théoriques 5 1.1 Vocabulaire....................................
Plus en détailMÉTHODE DE MONTE CARLO.
MÉTHODE DE MONTE CARLO. Alexandre Popier Université du Maine, Le Mans A. Popier (Le Mans) Méthode de Monte Carlo. 1 / 95 PLAN DU COURS 1 MÉTHODE DE MONTE CARLO 2 PROBLÈME DE SIMULATION Théorème fondamental
Plus en détailProbabilités avancées. Florin Avram
Probabilités avancées Florin Avram 24 janvier 2014 Table des matières 1 Mise en scène discrète 3 1.1 Espace des épreuves/résultats possibles, événements, espace probabilisé, mesure de probabilités, variables
Plus en détail