Deuxième partie II. Cours 4 à 6 : Construction d estimateurs, Modèle linéaire, Tests et intervalles de confiance

Save this PDF as:
 WORD  PNG  TXT  JPG

Dimension: px
Commencer à balayer dès la page:

Download "Deuxième partie II. Cours 4 à 6 : Construction d estimateurs, Modèle linéaire, Tests et intervalles de confiance"

Transcription

1 Deuxième partie II Cours 4 à 6 : Construction d estimateurs, Modèle linéaire, Tests et intervalles de confiance (version corrigée, 4 avril 27) Construction d estimateurs 4 Construction d estimateurs Estimateur de moments Divergence de Kullback Maximum de vraisemblance L exemple de la régression logistique M-Estimateurs 5 Le modèle linéaire 6 Tests et intervalles de confiance

2 Construction d estimateurs La question à laquelle on cherche à répondre Etant donné un modèle statistique {P θ, θ Θ} comment utiliser les données au mieux pour estimer θ? Un premier critère important Estimateur consistant [Définition 5.] Une séquence d estimateurs ˆθ n (ou par abus de langage un estimateur) de θ est dit consistant si ˆθ n n θ presque sûrement (consistance forte) ou en probabilité (consistance faible), lorsque l on suppose que les observations sont de loi P θ Cet objectif n est envisageable que si le modèle est identifiable au sens où θ θ 2 P θ P θ2 Autres critères On souhaite en particulier que le risque quadratique de ˆθ n soit aussi faible que possible Construction d estimateurs Estimateur de moments Estimateur de moments Si δ(y) est une statistique telle que E θ [δ(y )] = θ, l estimateur n n δ(y i ) est Sans biais Consistant (loi des grands nombres) On peut juger de ses performances (vis à vis de la perte quadratique) en comparant V θ [δ(y )] à I F (θ) (rappel : la borne n est pas nécessairement atteignable)

3 Construction d estimateurs Estimateur de moments Il est possible d être plus précis dans certains modèles Si {P θ, θ Θ} correspond à un modèle exponentiel sous forme naturelle (l(y; θ) = C(θ)h(y) exp [θ T (y)]), l estimateur de moments basé sur la statistique T (Y ) est efficace pour ϕ = E θ [T (Y )] = log C(θ) θ Preuve Cf. critère d efficacité vu précédemment : T (y) E θ [T (Y )] = log l(y; θ) θ Ou en calculant l expression de la borne de FDCR pour vérifier que 2 log C(θ) θ θ = I F (θ) = V θ [T (Y )] Exemples Estimation de la moyenne dans le modèle gaussien (de variance connue), estimation de l espérance pour une loi exponentielle,... [Section 4.3] Construction d estimateurs Estimateur de moments On peut généraliser la construction Exemple (Modèle linéaire univarié) { Yi = β + β X i + U i avec E θ [U i X i ] = et E θ [Ui 2 X i] < E[X i ] = et E[Xi 2] < On a E θ (Y i ) = E (E θ [Y i X i ]) = β + β E[X i ] = β E θ (X i Y i ) = E (X i E θ [Y i X i ]) = β E[Xi 2 ] Donc (/n n Y i) et (/n n X iy i ) / ( /n n des estimateurs consistants de β et β X2 i ) sont Mais l évaluation des performances devient délicate (voir plus loin concernant l approche asymptotique)

4 Construction d estimateurs Estimateur de moments temperature latitude Fig.: Régression linéaire sur les données de température en fonction de la latitude (centrée) Construction d estimateurs Divergence de Kullback On recherche un critère numérique Permettant d attester la proximité de deux lois 2 Susceptible d être approché empiriquement (à partir de données) 3 Se prêtant à l optimisation 4 Garantissant de bonnes performances statistiques

5 Construction d estimateurs Divergence de Kullback Divergence de Kullback * -(Leibler) [Définition 3.4] Pour deux lois P et P 2, de densités l et l 2 par rapport à µ, on définit la divergence de Kullback par [ I(P P 2 ) = E P log l ] (Y ) = log l (y) l 2 (Y ) l 2 (y) l (y)µ(dy) La divergence de Kullback Ne dépend pas du choix de µ Est toujours bien définie (c est une quantité positive qui vaut éventuellement + ) Dans un modèle paramétrique, on note I(θ θ 2 ) plutôt que I(P θ P θ2 ) * Solomon Kullback (93 994) [Définition 3.4] Construction d estimateurs Divergence de Kullback Propriété [Proposition 3.5] I(P P 2 ) 2 I(P P 2 ) = si et seulement si P = P 2 Preuve Rappel (Inégalité de Jensen) : Si g est un fonction convexe et E Z <, E[g(Z)] g(e[z]) ; si, de plus, g est strictement convexe, E[g(Z)] = g(e[z]) implique qu il existe c R tel que P[Z = c] = [ I(P P 2 ) = E P log l ] 2(Y ) l (Y ) soit en appliquant l inégalité de Jensen à la fonction log, l2 (y) I(P P 2 ) log l (y) l (y)µ(dy) =

6 Construction d estimateurs Maximum de vraisemblance Utilisation de la divergence de Kullback en statistique La divergence de Kullback constitue une mesure permettant d attester la proximité de deux lois P et P 2 (bien qu elle ne soit pas symétrique) Critère asymptotique du maximum de vraisemblance Q(θ) def = I(P P θ ) = log l(y; θ) l(y) l(y)µ(dy) où P désigne la loi des observations et {P θ, θ Θ} est un modèle statistique paramétrique θ def = arg max θ Θ Q(θ) définit le meilleur ajustement (au sens de la divergence de Kullback) dans la famille paramétrique {P θ, θ Θ} Construction d estimateurs Maximum de vraisemblance Propriétés du critère asymptotique du maximum de vraisemblance Si P = P θ pour θ Θ et le modèle {P θ, θ Θ} est identifiable, Q(θ) admet un maximum unique en θ = θ 2 Si, de plus, le modèle est régulier (de vraisemblance l( ; θ)) 2 [ Q(θ) 2 ] log l(y ; θ) θ θ = E θ θ=θ θ θ = I F (θ ) θ=θ En particulier [Proposition 3.6] Q(θ) = 2 (θ θ ) I F (θ )(θ θ ) + o( θ θ 2 ) la matrice d information de Fisher détermine le comportement local du critère autour du maximum θ

7 Construction d estimateurs Maximum de vraisemblance Estimateur du maximum de vraisemblance On appelle critère empirique du maximum de vraisemblance Q n (θ) = n n log l(y i ; θ)= n log l n(y,..., Y n ; θ) } {{ } L n (Y,...,Y n ;θ) L estimateur du maximum de vraisemblance est défini (implicitement) par ˆθ n = arg max θ Θ Q n(θ) Remarque Q n (θ) a même optimum que Q n (θ) = n n log l(y i;θ) l(y i ;θ ) P θ p.s. Q(θ) Construction d estimateurs Maximum de vraisemblance Exemple (Modèle de régression linéaire univarié gaussien) Y i = β + β X i + U i avec U i X i N (, σ 2 ) Q n (θ) = C te 2nσ 2 n (Y i β β X i ) 2 } {{ } à minimiser en β, β En supposant n n X i = (sinon, s y ramener) on trouve ˆβ,n = n n Y i ˆβ,n = n X iy i n X2 i

8 Construction d estimateurs Maximum de vraisemblance Cas des modèles exponentiels Si {P θ, θ Θ} correspond à un modèle exponentiel sous forme naturelle (l(y; θ) = C(θ)h(y) exp [θ T (y)]) Q(θ) = log C(θ) + θ E P [T (y)] et la condition d optimalité au premier ordre est log C(θ) = E θ [T (Y )] = E P [T (y)] θ Q n (θ) = log C(θ) + θ ( n n T (Y i) ) et la condition d optimalité au premier ordre est log C(θ) θ = E θ [T (Y )] = n n T (Y i ) Si I F (θ), Q et Q n sont des fonctions strictement concaves de θ est l estimateur du maximum de vraisemblance ˆθ n est défini (implicitement) par l équation de vraisemblance [T (Y )] = n T (Y Eˆθn i ) n Construction d estimateurs Maximum de vraisemblance Equivariance du maximum de vraisemblance Si ϕ = g(θ) correspond à une reparamétrisation du modèle (g bijective) ) ˆϕ n = g (ˆθn Exemple (Estimation d une loi exponentielle) Pour l(y; θ) = θ e θy pour y R + l équation de vraisemblance s écrit n n θ Y i = donc l estimateur du maximum de vraisemblance de θ est ˆθ n = ( n n Y i) et celui de ϕ = /θ = Eθ [Y ] est n n Y i

9 Construction d estimateurs L exemple de la régression logistique On s intéresse souvent à des modèles conditionnels dans lesquels la variable de réponse Y est catégorielle (ou qualitative), c est-à-dire prend un nombre fini de valeurs (on considère ici le cas binaire) sbp tobacco ldl obesity alcohol age Fig.: Présence de la maladie coronarienne en fonction de 6 facteurs (27 individus) Construction d estimateurs L exemple de la régression logistique Régression logistique (ou modèle logit) Conditionnellement à X, Y est une variable de Bernoulli telle que log P θ(y = X) P θ (Y = X) = X θ C est un modèle de régression linéaire sur le log-rapport de probabilités De façon équivalente logit (P θ [Y = X]) = X θ avec logit : ], [ ], + [, p log P θ (Y = X) = logit (X θ) avec p p logit : ], + [ ], [, x ex + e x = ( + e x)

10 Construction d estimateurs L exemple de la régression logistique Formulation équivalente On peut voir le modèle logit comme un modèle à donnée latente où Y = X θ + U Y = {Y > } [Section 2.27] P θ (Y = X) = P θ (Y > X) = P θ (U > X θ X) = F ( X θ) où F (x) désigne la fonction de répartition de U (supposé indépendant de X), qui doit donc être égale à logit (x) (de façon équivalente, logit (U) suit une loi uniforme sur ], [) On peut imaginer d autre types de modélisation pour U (par ex. modèle probit) Construction d estimateurs L exemple de la régression logistique Estimateur du maximum de vraisemblance Log-vraisemblance (conditionnelle) log l n (Y,..., Y n X,..., X n ; θ) n = Y i log P θ (Y i = X i ) + ( Y i ) log P θ (Y i = X i ) = n Y i log P θ(y i = X i ) P θ (Y i = X i ) + log P θ(y i = X i ) Gradient (fonction de score) = n Y i (X iθ) log( + e X i θ ) log l n (Y,..., Y n X,..., X n ; θ) θ = n X i {Y i P θ (Y i = X i )}

11 Construction d estimateurs L exemple de la régression logistique Hessien 2 log l n (Y,..., Y n X,..., X n ; θ) θ θ n = X i X i P θ (Y i = X i ) { P θ (Y i = X i )} } {{ } variance conditionnelle de Y i ( avec P X -probabilité si X a une loi continue et n > p) La maximisation de la log-vraisemblance (conditionnelle) est un problème d optimisation convexe Construction d estimateurs L exemple de la régression logistique sbp tobacco ldl obesity alcohol Fig.: Présence de la maladie coronarienne en fonction de 6 facteurs age sbp.66 tobacco 6.6 ldl.74 obesity 2E-4 alcohol age 9.59 Tab.: Paramètres estimés (2 itérations de l algorithme de Newton) sur les données centrées et normalisées

12 Construction d estimateurs M-Estimateurs M-Estimateur Dans les cas où L estimateur du maximum de vraisemblance est difficile à déterminer La loi des observations n est pas entièrement déterminée par le paramètre θ (modèle semi-paramétrique) On souhaite imposer certaines propriétés aux estimateurs (voir ci-après l exemple de régression robuste) on est amené à utiliser un M-Estimateur défini (implicitement) par n ˆθ n = arg max ψ(y i ; θ) θ Θ n où ψ est une fonction à valeur réelle [Définition 5.3] Remarque : Ce cadre général est aussi intéressant car il permet d inclure d autres types d estimateurs (comme les estimateurs de moments) Construction d estimateurs M-Estimateurs Outre des conditions de régularité (cf. [Proposition 5.4]), il est raisonnable de penser (et nous le démontrerons plus loin) que ˆθ n ne peut être consistant que si E θ [ψ(y ; θ)] a un maximum unique en θ puisque c est le critère asymptotique limite lorsque Y,..., Y n sont IID de loi P θ (par la loi des grands nombres) Modèle de régression non-linéaire Dans un modèle conditionnel où E [h(x; θ )] = E [h(x; θ 2 )] implique θ = θ 2 (en notant h(x; θ) = E θ [Y X]), on peut utiliser le critère des moindres carrés (non-linéaire) : Q n (θ) = n n (Y i h(x i ; θ)) 2 } {{ } ψ(y i,x i ;θ)

13 Construction d estimateurs M-Estimateurs La régression linéaire est sensible à la présence de données aberrantes temperature latitude Fig.: Régression linéaire sur les données de température en fonction de la latitude, avec ou sans donnée aberrante Construction d estimateurs M-Estimateurs Régression linéaire robuste Plutôt que la fonction des moindres carrés : ψ(x, y; β) = γ MC (r) où γ MC (r) = r 2 avec r def = y (β + β x) On utilise une fonction de Huber { r 2 si r τ γ H (r) = 2τ r τ 2 sinon On vérifie aisément que γ H est convexe et de classe C (mais pas C 2 ) de telle façon que τ τ min (β,β ) R 2 n n γ H {Y i (β + β X i )} est un problème de minimisation convexe qui se prête bien à l optimisation numérique

14 Construction d estimateurs M-Estimateurs temperature latitude Fig.: Régression linéaire robuste sur les données de température en fonction de la latitude, avec ou sans donnée aberrante (τ = 4.9, soit environ 8% des résidus qui tombent la partie quadratique du critère) Le modèle linéaire 4 Construction d estimateurs 5 Le modèle linéaire Estimateur des moindres carrés Cas gaussien 6 Tests et intervalles de confiance

15 Le modèle linéaire Le modèle linéaire [Chapitre 9] On s intéresse ici au cas du modèle linéaire (ou modèle de régression linéaire) dans lequel Y i = X iβ + U i où U i est indépendant de X i et E[U i ] =, E[U 2 i ] = σ2 Si on suppose de plus que U i N (, σ 2 ), on parlera de modèle linéaire gaussien (ou normal) Remarque Dans le cas où les régresseurs {X i } sont aléatoires, le modèle est défini de façon conditionnelle (de même que certains des résultats qui suivent doivent être compris de façon conditionnelle) Le modèle linéaire Il est utile de réécrire le modèle de l ensemble des observations sous forme vectorielle : Y X = (X (),..., X (p)) U. =. β +. Y n } {{ } Y X n = (X n (),..., X n (p)) } {{ } X (n p) U n } {{ } U avec E θ [U] = et V θ [U] = σ 2 Id n (ou U N (, σ 2 Id n ) si le modèle est gaussien) On suppose que X est de rang p

16 Le modèle linéaire Estimateur des moindres carrés On considère le critère des moindres carrés ψ(x i, Y i ; β) = (Y i X i β)2 ˆβ MC = arg min β R p n (Y i X iβ) 2 } {{ } Y Xβ 2 Interprétation géométrique Problème de projection orthogonale du vecteur Y R n sur le sous espace de Y dimension p im(x) (engendré par les Y Ŷ colonnes de X) Ŷ Y Ŷ im(x) def où Ŷ = X ˆβ im(x) Le modèle linéaire Estimateur des moindres carrés La condition Y Ŷ im(x) est équivalente à X (Y X ˆβ) = d où L estimateur des moindres carrés ˆβ = ( X X ) X Y La décomposition ˆβ = β + (X X) X U montre que E θ [ ˆβ] = β, ˆβ est sans biais 2 V θ [ ˆβ] = σ 2 (X X) Propriété ˆβ est l estimateur linéaire sans biais de β de matrice de covariance minimale [Théorème (Gauss-Markov) 4.] Remarque : Généralisation au cas hétéroscédastique, E θ [U i ] = σ 2 i, ou au cas d une matrice de covariance quelconque (connue)

17 Relation de Pythagore Le modèle linéaire Estimateur des moindres carrés Y Ŷ 2 = Y 2 Ŷ 2 = Y 2 Y Ŷ = Y Y Y X ( X X ) X Y = Y ( Id n X ( X X ) X ) Y = U ( Id n X ( X X ) X ) U X (X X) X est la matrice de projection sur im(x) Id n X (X X) X est la matrice de projection sur le sous-espace (de dimension n p) orthogonal à im(x) Il existe M matrice unitaire (M M = Id n ) telle que Id n X ( X X ) X Id n p. = M M. Le modèle linéaire Estimateur des moindres carrés Estimation de la variance Y Ŷ 2 /(n p) est un estimateur sans biais de la variance σ 2 Preuve ( [ E θ Y Ŷ 2) = E θ {tr ( U Id n X ( X X ) ) ]} X U = tr [(Id n X ( X X ) ) ( X E θ UU )] = σ 2 (n p)

18 Le modèle linéaire Cas gaussien Dans le cas gaussien, U N (, σ 2 Id n ) } log l n (Y,..., Y n ; θ) = 2 {n log 2π + n log σ 2 Y Xβ 2 + σ 2 donc ˆβ et (n p)/nˆσ 2 sont les estimateurs du maximum de vraisemblance 2 ˆβ = β + (X X) X U implique que ˆβ N (β, σ 2 ( XX ) ) 3 (n p)ˆσ 2 /σ 2 χ 2 (n p), loi du khi-deux à n p degrés de libertés, dans la mesure où (n p)ˆσ 2 = Y Ŷ 2 = U Id n p. M M } {{ U}. N (,σ 2 Id n ) Le modèle linéaire Cas gaussien Rappel [Cours de probabilité, Tables 3 et 4] La loi du khi-deux à k degrés de liberté est la loi de k X2 i lorsque {X i } sont IID de loi N (, ) La loi de Student * à k degrés de Y liberté est la loi de q /k P k X2 i lorsque {X i } sont IID de loi N (, ) et Y est une variable normale indépendante des {X i } * William S. Gosset ( )

19 Le modèle linéaire Cas gaussien 4 ˆβ i β i ˆσ 2 x ii t(n p) où xii est le ième terme diagonal de (XX ) et t(n p) désigne la loi de Student à n p degrés de liberté Preuve ˆβ = β + (X X) X U et (n p)ˆσ 2 = (Id n X (X X) X )U 2, or [ (X Cov X ) X U, (Id n X ( X X ) ] X )U = ( X X ) X E θ [UU ](Id } {{ } n X σ 2 Id n ( X X ) X ) = (3) donc (X X) X U et (Id n X (X X) X )U sont indépendants et, par suite, ˆβ et ˆσ 2 sont indépendants Tests et intervalles de confiance 4 Construction d estimateurs 5 Le modèle linéaire 6 Tests et intervalles de confiance Tests Cas de deux hypothèses simples Cas général : Approche de Neyman-Pearson Intervalles de confiance

20 Tests et intervalles de confiance Tests La problématique des tests Test d hypothèses (binaires) [Section 6.] Soit un modèle statistique {P θ ; θ Θ} et des hypothèses H : θ Θ H : θ Θ = Θ \ Θ Un test (pur) est une statistique à valeur dans {, } dont l interprétation est { ϕ(y ) = H est vraie ϕ(y ) = H est vraie Remarque : Il existe également des tests mixtes ou aléatoires dont l importance est essentiellement théorique Tests et intervalles de confiance Tests Hypothèses simples et composites Une hypothèse H i : θ Θ i est dite Simple si Θ i = {θ i } Composite sinon Dans le cas d un modèle paramétrique et si H i est une hypothèse simple, la loi des observations est connue sous H i 2 Il est fréquent qu une seule des deux hypothèses soit simple : par exemple, Θ = R p, H : θ = θ 3 Les hypothèses peuvent aussi être définies implicitement sous la forme H i : g(θ) = où g : Θ R p est une fonction (par exemple, g(θ, θ 2 ) = θ θ 2 pour tester l égalité de deux coordonnées du paramètres)

21 Tests et intervalles de confiance Tests Comment quantifier la performance d un test? Risque de première espèce Risque de seconde espèce α ϕ (θ) def = P θ [ϕ(y ) = ] = E θ [ϕ(y )] pour θ Θ β ϕ (θ) = P θ [ϕ(y ) = ] = E θ [ϕ(y )] pour θ Θ On utilise en général plutôt la puissance ρ ϕ (θ) = E θ [ϕ(y )] pour θ Θ En se plaçant du point de vue de H, on peut interpréter α ϕ (θ) comme le taux de fausses alarmes et ρ ϕ (θ) comme la probabilité de détection Tests et intervalles de confiance Cas de deux hypothèses simples On considère un modèle statistique dominé et deux hypothèses simples { H : θ = θ l(y; θ ) = H : θ = θ l(y; θ ) { α ϕ ρ ϕ = ϕ(y)l(y; θ )µ(dy) = ϕ(y)l(y; θ )µ(dy) On présente ici deux façons classiques de choisir ϕ : l approche bayésienne et l approche de Neyman-Pearson * * Thomas Bayes (72 76), Jerzy Neyman (894 98), Egon Pearson ( )

22 Tests et intervalles de confiance Dans l approche bayésienne Cas de deux hypothèses simples On définit une fonction de perte en donnant des coûts c et c aux erreurs de première et seconde espèce 2 On probabilise les hypothèses en spécifiant des probabilités a priori π et π (π + π = ) pour H et H Le risque du test est défini par r ϕ = E {c P(ϕ(Y ) = H vraie) + c P(ϕ(Y ) = H vraie)} = c π α ϕ + c π ( ρ ϕ ) Test bayésien Le test ϕ qui minimise le risque bayésien r ϕ est donné par ϕ(y) = { si l(y;θ ) l(y;θ ) > c π c π sinon Preuve Tests et intervalles de confiance Cas de deux hypothèses simples r ϕ = c π α ϕ + c π ( ρ ϕ ) = c π ϕ(y)l(y; θ )µ(dy) ) + c π ( ϕ(y)l(y; θ )µ(dy) Le risque bayésien minimal est obtenu en arg ϕ(y) [c π l(y; θ ) c π l(y; θ )] µ(dy) min ϕ mesurable soit ϕ(y) = { si c π l(y; θ ) c π l(y; θ ) < sinon (valeur en cas d égalité indifférente)

23 Tests et intervalles de confiance Cas de deux hypothèses simples Exemple (Test de deux lois normales de même variance) { H : Y N (µ, σ) H : Y N (µ, σ) avec µ > µ l(y ; θ ) l(y ; θ ) s log l(y ; θ ) l(y ; θ ) log s [ (Y ) 2 ( ) ] µ Y 2 µ log s 2 σ σ (µ [ ] µ ) Y (µ + µ )/2 log s σ σ De même pour n observations log l n(y,..., Y n ; θ ) l n (Y,..., Y n ; θ ) = (µ µ ) σ [ n {Y ] i (µ + µ )/2} σ Tests et intervalles de confiance Cas de deux hypothèses simples Test de deux lois normales de même variance (suite) n {Y i (µ + µ )/2} a pour loi σ n { Sous H, N ( n [ µ µ ] ) 2σ, Sous H, N ( [ n µ µ ] ) 2σ, D où pour le test σ n n {Y i (µ + µ )/2} t : Risque de première espèce α (t) = Φ ( t + n [ µ µ ]) 2σ Puissance ρ (t) = Φ ( t n [ µ µ ]) 2σ La courbe ρ (t) en fonction de α (t) (lorsque t varie) est dite courbe COR (Caractéristique Opérationnelle de Réception) et nous renseigne sur le compromis entre les deux objectifs antagonistes ρ (t) et α (t)

24 Tests et intervalles de confiance Cas de deux hypothèses simples puissance risque er esp Fig.: Courbes COR pour (µ µ )/σ =.2 avec, 5 et 2 observations Tests et intervalles de confiance Dans l approche de Neyman-Pearson Cas de deux hypothèses simples On dissymétrise les deux types d erreurs : { H est l hypothèse de référence ou hypothèse nulle H est l hypothèse alternative 2 On cherche à maximiser la puissance du test sous la contrainte que le risque de première espèce α ϕ (θ) soit inférieur à une valeur α spécifiée par l utilisateur Le niveau du test est la valeur α ϕ = sup θ Θ α ϕ (θ) Test UPP (Uniformément Plus Puissant) [Définition 6.9] Un test ϕ est dit UPP dans la classe C si α ϕ α ϕ pour ϕ C implique pour θ Θ ρ ϕ (θ) ρ ϕ (θ) E θ [ ϕ(y )] E θ [ϕ(y )]

25 Tests et intervalles de confiance Cas de deux hypothèses simples Lemme de Neyman-Pearson [Proposition 6.3] Pour tout α, < α <, il existe un test de Neyman de la forme * { si l(y; θ )/l(y; θ ) > s ϕ(y) = si l(y; θ )/l(y; θ ) < s (où s R + ) qui est de niveau α ; celui-ci est UPP dans la classe des tests de niveau inférieur ou égal à α Inversement, un test qui possède ces propriétés est nécessairement un test de Neyman n o * La formulation ci-dessus suffit si on suppose que µ y : l(y;θ ) = s l(y;θ = ) s R +, sinon il faut régler plus précisément le cas d égalité (en considérant un test mixte) Tests et intervalles de confiance Cas de deux hypothèses simples Preuve La preuve complète est donnée dans le polycopié L argument principal est le fait que si ϕ est un test de Neyman associé au seuil s et ϕ est un autre test [ϕ(y) ϕ(y)] [l(y; θ ) sl(y; θ )] µ(dy) d où c est à dire E θ [ϕ(y ) ϕ(y )] s E θ [ϕ(y ) ϕ(y )] ρ ϕ ρ ϕ s (α ϕ α ϕ )

26 Tests et intervalles de confiance Cas général : Approche de Neyman-Pearson Cas général Les arguments précédents se généralisent difficilement dans le cas où les deux hypothèses ne sont pas des hypothèses simples * L approche adoptée dans la suite consiste à Choisir une statistique de test ξ(y ) dont la loi est connue sous H 2 Ajuster le seuil s de façon à ce que le test ϕ(y ) correspondant à ξ(y ) s soit de niveau α (fixé par l utilisateur, suffisamment faible pour que le test soit significatif) 3 Si possible, évaluer la puissance du test (sous H ) * Voir toutefois le cas d une hypothèse composite unilatérale [Section 6.3.2] Tests et intervalles de confiance Cas général : Approche de Neyman-Pearson (Exemple) Cas de la régression linéaire Test de Student Dans le modèle Y i = β + β X i + U i avec U i N (, σ 2 ), on sait que ξ n = ( ˆβ β )/ ˆσ 2 x = n X 2 i ( ˆβ β ) ˆσ 2 temperature suit une loi de Student à n 2 degrés de libertés (cf. cours précédent + régresseurs centrés) latitude On utilise ξ n = n X2 i ˆβ ˆσ 2 pour tester l hypothèse H : β =, c est-à-dire, les régresseurs n ont pas d influence sur la valeur des variables de réponse

27 Tests et intervalles de confiance Cas général : Approche de Neyman-Pearson En utilisant la [Table n 4] ou équivalent (fonction cdft en scilab) on détermine le seuil z α/2 tel que P(T > z α/2 ) = α/2 α pour une variable T de loi de Student à n 2 degrés de liberté, où α est le niveau de confiance (souvent pris à.5) z α/2 ξ n z α/2 H acceptée ξ n > z α/2 H refusée (au niveau de confiance α) Remarque Pour une idée plus qualitative du résultat, on calcule souvent la probabilité critique (ou p-valeur) : 2P(T > ξ n ) (interprétation : le niveau de confiance maximum pour lequel on aurait rejeté l hypothèse H ) ξ n Tests et intervalles de confiance Cas général : Approche de Neyman-Pearson temperature temperature latitude longitude températures/latitudes n H (α =.5) p-valeur 7 Acceptée.4 4 Rejetée Rejetée Rejetée. 6 températures/longitudes n H (α =.5) p-valeur 7 Acceptée.6 4 Acceptée.9 28 Acceptée Acceptée.87

28 Tests et intervalles de confiance Intervalles de confiance Les intervalles de confiances Question posée Au vu des données, quelles sont les valeurs de θ qui sont crédibles? Et comment quantifier la fiabilité de la réponse fournie à cette question? Région de confiance [Définition 8.] Une région de confiance pour θ est une fonction S(y) de y à valeur dans l ensemble des parties de Y telle que P θ (θ S(Y )) = α où α est dit probabilité de couverture ou niveau de confiance Si θ est un paramètre scalaire, on parle d intervalle de confiance Tests et intervalles de confiance Intervalles de confiance Fonction pivotale Une fonction v(y; θ) est dite pivotale si la loi de v(y ; θ) ne dépend pas de θ sous P θ Si v est un fonction pivotale à valeur réelle telle que P θ (v(y ; θ) [a, b]) = α, {θ : v(y ; θ) [a, b]} constitue une région de confiance de probabilité de couverture α Si v(y ; θ) a une loi symétrique sous P θ, on vérifie que pour une probabilité α donnée, l intervalle de longueur minimale vérifiant les conditions ci-dessus est de la forme [ a, a] ; c est celui-ci qui sera choisi

29 Tests et intervalles de confiance Intervalles de confiance (Exemple) Cas de la régression linéaire Dans le modèle Y i = β + β X i + U i avec U i N (, σ 2 ), on sait que n Xi 2 ( ˆβ β ) ˆσ 2 suit une loi de Student à n 2 degrés de libertés Si z α/2 désigne le niveau dépassé avec probabilité α/2 pour cette loi, ˆβ z α/2 ˆσ 2 n X2 i ˆσ, ˆβ 2 + z α/2 n X2 i est l intervalle de confiance de probabilité α pour β Tests et intervalles de confiance Intervalles de confiance Dans le cas précédent, l intervalle de confiance obtenu coïncide avec l ensemble des valeurs de β pour lequel le test d hypothèse H : β = β de niveau α aurait été accepté, compte tenu de la valeur estimé ˆβ Par exemple On peut tester H : β = en vérifiant si l origine se situe ou non dans l intervalle ˆσ 2 ˆσ ˆβ z α/2 n, ˆβ 2 + z α/2 n X2 i X2 i Cette équivalence entre test et intervalle de confiance constitue une remarque générale

30 Tests et intervalles de confiance Intervalles de confiance temperature 2 temperature latitude longitude températures/latitudes n Intervalle de confiance à 95% 7.76 ± ± ± ±.9 températures/longitudes n Intervalle de confiance à 95% 7.7 ± ± ± ±.3

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur

Plus en détail

Statistique. Jean-Yves Tourneret (1) (1) Université of Toulouse, ENSEEIHT-IRIT-TéSA Thème 1 : Analyse et Synthèse de l Information jyt@n7.

Statistique. Jean-Yves Tourneret (1) (1) Université of Toulouse, ENSEEIHT-IRIT-TéSA Thème 1 : Analyse et Synthèse de l Information jyt@n7. Statistique Jean-Yves Tourneret (1) (1) Université of Toulouse, ENSEEIHT-IRIT-TéSA Thème 1 : Analyse et Synthèse de l Information jyt@n7.fr Cours Statistique, 2010 p. 1/52 Plan du cours Chapitre 1 : Estimation

Plus en détail

Cours 2 6 octobre. 2.1 Maximum de vraisemblance pour une loi Gaussienne multivariée

Cours 2 6 octobre. 2.1 Maximum de vraisemblance pour une loi Gaussienne multivariée Introduction aux modèles graphiques 2010/2011 Cours 2 6 octobre Enseignant: Francis Bach Scribe: Nicolas Cheifetz, Issam El Alaoui 2.1 Maximum de vraisemblance pour une loi Gaussienne multivariée Soit

Plus en détail

Statistique (MATH-F-315, Cours #3)

Statistique (MATH-F-315, Cours #3) Statistique (MATH-F-315, Cours #3) Thomas Verdebout Université Libre de Bruxelles 2015 Plan de la partie Statistique du cours 1. Introduction. 2. Théorie de l estimation. 3. Tests d hypothèses et intervalles

Plus en détail

Statistiques - Notes de cours - M1. Elisabeth Gassiat

Statistiques - Notes de cours - M1. Elisabeth Gassiat Statistiques - Notes de cours - M1 Elisabeth Gassiat Table des matières 1 Introduction 5 1.1 Estimation et régions de confiance...................... 5 1.2 Tests.......................................

Plus en détail

Tests statistiques Formation «Analyse de données RNA-seq/ChiP-seq»

Tests statistiques Formation «Analyse de données RNA-seq/ChiP-seq» Tests statistiques Formation «Analyse de données RNA-seq/ChiP-seq» Guy Perrière Pôle Rhône-Alpes de Bioinformatique 14 novembre 2012 Guy Perrière (PRABI) Tests statistiques 14 novembre 2012 1 / 40 Plan

Plus en détail

Régression logistique

Régression logistique Régression logistique Gilles Gasso. INSA Rouen -Département ASI Laboratoire LITIS Régression logistique p. 1 Introduction Objectifs Le classifieur de Bayes est basé sur la comparaison des probabilités

Plus en détail

Bases du Modèle Linéaire

Bases du Modèle Linéaire AgroParisTech Bases du Modèle Linéaire J.J. Daudin, E. Lebarbier, C. Vuillet Table des matières 1 Introduction 3 2 Estimation des paramètres 5 2.1 Estimation des paramètres de l espérance......................

Plus en détail

MODELISATION DE DONNÉES QUALITATIVES PREMIÈRE PARTIE

MODELISATION DE DONNÉES QUALITATIVES PREMIÈRE PARTIE MODELISATION DE DONNÉES QUALITATIVES PREMIÈRE PARTIE Pierre-Louis Gonzalez 1 I INTRODUCTION 1 variable qualitative. Tri à plat. Représentations graphiques. Modélisation : loi binomiale loi multinomiale

Plus en détail

Statistique de base avec R Partie 2 : Test d hypothèses et régression linéaire

Statistique de base avec R Partie 2 : Test d hypothèses et régression linéaire Statistique de base avec R Partie 2 : Test d hypothèses et régression linéaire Julien JACQUES Polytech Lille - Université Lille 1 Julien JACQUES (Polytech Lille) Statistiques de base 1 / 48 Plan 1 Tests

Plus en détail

Techniques d estimation : Maximum de Vraisemblance et Méthode des Moments Généralisée

Techniques d estimation : Maximum de Vraisemblance et Méthode des Moments Généralisée Techniques d estimation : Maximum de Vraisemblance et Méthode des Moments Généralisée Philippe Gagnepain Université Paris 1 Ecole d Economie de Paris Centre d économie de la Sorbonne-UG 4-Bureau 405 philippe.gagnepain@univ-paris1.fr

Plus en détail

CHAPITRE 1 La nature de l économétrie et la structure des données économiques... 25

CHAPITRE 1 La nature de l économétrie et la structure des données économiques... 25 TABLE DES MATIÈRES Sommaire... 5 Avant- propos... 9 Remerciements... 19 À propos de l auteur... 23 CHAPITRE 1 La nature de l économétrie et la structure des données économiques... 25 1.1 Qu est- ce que

Plus en détail

1/4 2/4 3/4 4/4. 10. Estimation MTH2302D. S. Le Digabel, École Polytechnique de Montréal H2016. (v1) MTH2302D: estimation 1/50

1/4 2/4 3/4 4/4. 10. Estimation MTH2302D. S. Le Digabel, École Polytechnique de Montréal H2016. (v1) MTH2302D: estimation 1/50 10. Estimation MTH2302D S. Le Digabel, École Polytechnique de Montréal H2016 (v1) MTH2302D: estimation 1/50 Plan 1. Introduction 2. Estimation ponctuelle 3. Estimation par intervalles de confiance 4. Autres

Plus en détail

Analyse en composantes principales

Analyse en composantes principales Analyse en composantes principales Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire LITIS Analyse en composantes principales p. 1/18 Introduction Objectifs Soit {x i } i=1,,l

Plus en détail

geffray@math.unistra.fr Outils pour la statistique avancée Année 2015/2016 TD 1 : Bootstrap

geffray@math.unistra.fr Outils pour la statistique avancée Année 2015/2016 TD 1 : Bootstrap Université de Strasbourg Ségolen Geffray M2 - Statistique geffray@math.unistra.fr Outils pour la statistique avancée Année 2015/2016 TD 1 : Bootstrap Ces exercices seront effectués au moyen du logiciel

Plus en détail

Rapport de Recherche. 1 Estimation fonctionnelle en temps continu. 1.1 Vitesses de convergence pour l estimateur à noyau. (D. Blanke - Mars 2008)

Rapport de Recherche. 1 Estimation fonctionnelle en temps continu. 1.1 Vitesses de convergence pour l estimateur à noyau. (D. Blanke - Mars 2008) Rapport de Recherche (D. Blanke - Mars 2008) L essentiel de mes activités de recherche porte sur l estimation fonctionnelle ou paramétrique pour des processus. L ensemble de ces travaux peut se diviser

Plus en détail

Tests Statistiques. Rejeter, ne pas rejeter... Se risquer? Magalie Fromont. Année universitaire 2015-2016

Tests Statistiques. Rejeter, ne pas rejeter... Se risquer? Magalie Fromont. Année universitaire 2015-2016 Tests Statistiques Rejeter, ne pas rejeter... Se risquer? Magalie Fromont Année universitaire 2015-2016 Table des matières 1 Introduction 5 1.1 Problèmes de tests.................................. 5 1.1.1

Plus en détail

Chapitre 6 TESTS STATISTIQUES

Chapitre 6 TESTS STATISTIQUES Statistique appliquée à la gestion et au marketing http://foucart.thierry.free.fr/statpc Chapitre 6 TESTS STATISTIQUES Les tests statistiques sont des méthodes de la statistique inférentielle qui, comme

Plus en détail

Chapitre 15 Variables Dépendantes Limitées et Qualitatives

Chapitre 15 Variables Dépendantes Limitées et Qualitatives Chapitre 15 Variables Dépendantes Limitées et Qualitatives 15.1 Introduction Les modèles de régression supposent de manière implicite que la variable dépendante, peut-être après une transformation logarithmique

Plus en détail

TP 3 : STATISTIQUE PARAMÉTRIQUE

TP 3 : STATISTIQUE PARAMÉTRIQUE Statistique Numérique et Analyse de Données Ecole des Ponts ParisTech, 2 ème année TP 3 : STATISTIQUE PARAMÉTRIQUE La séance de TP se fait sous environnement Windows, sauf si vous avez une nette préférence

Plus en détail

Chapitre 4 : RÉGRESSION

Chapitre 4 : RÉGRESSION Chapitre 4 : RÉGRESSION 4.3 Régression linéaire multiple 4.3.1 Equation et Estimation 4.3.2 Inférence 4.3.3 Coefficients de détermination 4.3.4 Spécifications Régression linéaire multiple 1 / 50 Chapitre

Plus en détail

Estimation indirecte en sciences humaines : une méthode bayésienne

Estimation indirecte en sciences humaines : une méthode bayésienne Estimation indirecte en sciences humaines : une méthode bayésienne Henri Caussinus, Institut de Mathématiques de Toulouse, en collaboration avec Daniel Courgeau, INED Isabelle Séguy, INED Luc Buchet, CNRS

Plus en détail

Baccalauréat Série S Métropole, juin 2014

Baccalauréat Série S Métropole, juin 2014 Baccalauréat Série S Métropole, juin 4 Sujet et Corrigé Stéphane PASQUET Disponible sur http://www.mathweb.fr juin 4 Exercice (5 points) - Commun à tous les candidats Partie A Dans le plan muni d un repère

Plus en détail

Liste complète des sujets d oral (SESSION 2004) servant pour 2004-2005. Leçons d Algèbre et de Géométrie

Liste complète des sujets d oral (SESSION 2004) servant pour 2004-2005. Leçons d Algèbre et de Géométrie http://perso.wanadoo.fr/gilles.costantini/agreg.htm Liste complète des sujets d oral (SESSION 2004) servant pour 2004-2005 Légende : En italique : leçons dont le libellé a changé ou évolué par rapport

Plus en détail

1 Définition, existence, unicité.

1 Définition, existence, unicité. Université Denis Diderot Paris 7 Espérance conditionnelle Ces rappels et compléments de cours sont inspirés de [1], [2], [3]. Il va de soi que pour une bonne connaissance des notions qui suivent, il est

Plus en détail

Théorème de Rolle et égalité des accroissements finis. Applications

Théorème de Rolle et égalité des accroissements finis. Applications 0 Théorème de Rolle et égalité des accroissements finis. Applications 0. Le théorème de Rolle sur un espace vectoriel normé Pour ce paragraphe, on se donne un espace vectoriel normé (E, ). Le théorème

Plus en détail

«Cours Statistique et logiciel R»

«Cours Statistique et logiciel R» «Cours Statistique et logiciel R» Rémy Drouilhet (1), Adeline Leclercq-Samson (1), Frédérique Letué (1), Laurence Viry (2) (1) Laboratoire Jean Kuntzmann, Dép. Probabilites et Statistique, (2) Laboratoire

Plus en détail

Master 2 IMOI - Mathématiques Financières

Master 2 IMOI - Mathématiques Financières Master 2 IMOI - Mathématiques Financières Exercices - Liste 1 1 Comportement d un investisseur face au risque Exercice 1 Soit K la matrice définie par 1 2 [ 3 1 1 3 1.1 Montrer que K est la matrice de

Plus en détail

Chapitre 01 : Intégrales généralisées. Objectifs : En première année, on a étudié l intégrale d une fonction définie et continue sur un intervalle

Chapitre 01 : Intégrales généralisées. Objectifs : En première année, on a étudié l intégrale d une fonction définie et continue sur un intervalle Chapitre 01 : Intégrales généralisées Objectifs : En première année, on a étudié l intégrale d une fonction définie et continue sur un intervalle fermé borné de Dans ce chapitre, on va étudier le cas d

Plus en détail

Actuariat IARD - ACT2040 Partie 2 - régression logistique et arbres de régression (Y {0, 1})

Actuariat IARD - ACT2040 Partie 2 - régression logistique et arbres de régression (Y {0, 1}) Actuariat IARD - ACT2040 Partie 2 - régression logistique et arbres de régression (Y {0, 1}) Arthur Charpentier charpentier.arthur@uqam.ca http ://freakonometrics.hypotheses.org/ Hiver 2013 1 Modèlisation

Plus en détail

Modèles statistiques pour l analyse des séquences biologiques

Modèles statistiques pour l analyse des séquences biologiques Modèles statistiques pour l analyse des séquences biologiques Franck Picard UMR CNRS-5558, Laboratoire de Biométrie et Biologie Evolutive franck.picard@univ-lyon1.fr F. Picard (LBBE) 1 / 60 Outline Introduction

Plus en détail

Eléments de statistique Leçons 3 et 4 - Estimation

Eléments de statistique Leçons 3 et 4 - Estimation Eléments de statistique Leçons 3 et 4 - Estimation Louis Wehenkel Département d Electricité, Electronique et Informatique - Université de Liège B24/II.93 - L.Wehenkel@ulg.ac.be MATH0487-1 : 3BacIng, 3BacInf

Plus en détail

Filtre de Wiener. Analyse en Composantes Principales

Filtre de Wiener. Analyse en Composantes Principales Filtre de Wiener Analyse en Composantes Principales Guillaume Obozinski LIGM/Ecole des Ponts - ParisTech Traitement de l information et vision artificielle Ecole des Ponts Filtre de Wiener Norbert Wiener

Plus en détail

Exercices de travaux dirigés Cours d économétrie Maîtrise d économétrie

Exercices de travaux dirigés Cours d économétrie Maîtrise d économétrie Exercices de travaux dirigés Cours d économétrie Maîtrise d économétrie September 21, 2004 1 Le modèle linéaire - Rendements d une fonction de production Cobb-Douglas Présentation du problème: On considère

Plus en détail

Master 1 Informatique Éléments de statistique inférentielle

Master 1 Informatique Éléments de statistique inférentielle Master 1 Informatique Éléments de statistique inférentielle Faicel Chamroukhi Maître de Conférences UTLN, LSIS UMR CNRS 7296 email: chamroukhi@univ-tln.fr web: chamroukhi.univ-tln.fr 2014/2015 Faicel Chamroukhi

Plus en détail

Statistiques. IUT Biotechnologie 2ème année. Jean-Christophe Breton Université de La Rochelle Octobre-Novembre 2008

Statistiques. IUT Biotechnologie 2ème année. Jean-Christophe Breton Université de La Rochelle Octobre-Novembre 2008 Statistiques IUT Biotechnologie 2ème année Jean-Christophe Breton Université de La Rochelle Octobre-Novembre 2008 version du 04 octobre 2008 Table des matières 1 Lois de probabilité usuelles 1 1.1 Dénombrement................................

Plus en détail

Sujets HEC B/L 2013-36-

Sujets HEC B/L 2013-36- -36- -37- Sujet HEC 2012 B/L Exercice principal B/L1 1. Question de cours : Définition et propriétés de la fonction de répartition d une variable aléatoire à densité. Soit f la fonction définie par : f(x)

Plus en détail

Aide Mémoire de Statistique

Aide Mémoire de Statistique Aide Mémoire de Statistique (E, E, P) modèle statistique (E, E, P) modèle probabiliste E probabilité, o coaît la loi P et o fait des calculs E statistique, o e coaît pas la loi (seulemet ue famille de

Plus en détail

Régression logistique avec R

Régression logistique avec R Université Rennes 2, UFR Sciences Sociales Régression logistique avec R Université Rennes 2 Place du Recteur H. le Moal CS 24307-35043 Rennes Tel : 02 99 14 18 06 Mel : laurent.rouviere@univ-rennes2.fr

Plus en détail

Feuille d exercices n o 1. N(x i ). 4. On rappelle qu un espace normé est séparable s il contient une partie dénombrable dense.

Feuille d exercices n o 1. N(x i ). 4. On rappelle qu un espace normé est séparable s il contient une partie dénombrable dense. 1 Feuille d exercices n o 1 1. Deuxième forme géométrique du théorème de Hahn-Banach Soient A E et B E deux convexes, non vides, disjoints (E est une espace vectoriel normé). On suppose que A est fermé

Plus en détail

2 Ensembles convexes. 2.1 Définition et premières propriétés

2 Ensembles convexes. 2.1 Définition et premières propriétés 2 Ensembles convexes Les chapitres 2 et 3 présentent les éléments d analyse convexe qui nous seront utiles pour étudier les problèmes d optimisation et les algorithmes qui les résolvent. Le chapitre 2

Plus en détail

Université de Nantes UFR des Sciences et Techniques Département de Mathématiques. Master 1 Ingénierie mathématique Année 2012-2013

Université de Nantes UFR des Sciences et Techniques Département de Mathématiques. Master 1 Ingénierie mathématique Année 2012-2013 Université de Nantes UFR des Sciences et Techniques Département de Mathématiques Master 1 Ingénierie mathématique Année 2012-2013 TP 1: Statistique descriptive F. Lavancier, A. Philippe Le logiciel utilisé

Plus en détail

Analyse en composantes principales Christine Decaestecker & Marco Saerens ULB & UCL

Analyse en composantes principales Christine Decaestecker & Marco Saerens ULB & UCL Analyse en composantes principales Christine Decaestecker & Marco Saerens ULB & UCL LINF 2275 Stat. explor. multidim. 1 A.C.P.: Analyse en Composantes Principales Analyse de la structure de la matrice

Plus en détail

L2 2011/2012 USTV. Analyse. numérique M43. Recueil d exercices corrigés et aide-mémoire G. FACCANONI. Dernière mise-à-jour

L2 2011/2012 USTV. Analyse. numérique M43. Recueil d exercices corrigés et aide-mémoire G. FACCANONI. Dernière mise-à-jour L / Recueil d exercices corrigés et aide-mémoire USTV M Analyse numérique G FACCANONI Dernière mise-à-jour Jeudi mai Avertissement : ces notes sont régulièrement mises à jour et corrigées, ne vous étonnez

Plus en détail

Modélisation des codes de calcul dans. le cadre des processus gaussiens

Modélisation des codes de calcul dans. le cadre des processus gaussiens Modélisation des codes de calcul dans le cadre des processus gaussiens Amandine Marrel Laboratoire de Modélisation des Transferts dans l Environnement CEA Cadarache Introduction (1) Fiabilité et calcul

Plus en détail

Modélisation de la demande de transport

Modélisation de la demande de transport Modélisation de la demande de transport Fabien Leurent ENPC / LVMT Introduction Approche empirique Fonctions de répartition Position microéconomique : préférences et rationalité Distribution des décideurs,

Plus en détail

Arithmétique Algorithmique. http://www.math.univ-lyon1.fr/~roblot/ens.html

Arithmétique Algorithmique. http://www.math.univ-lyon1.fr/~roblot/ens.html Arithmétique Algorithmique http://www.math.univ-lyon1.fr/~roblot/ens.html Partie III Algorithmes classiques 1 Coût de la multiplication et de la division 2 Exponentiation rapide 3 Algorithme d Euclide

Plus en détail

ECGE 1224 - Statistiques en économie et gestion : TP 1

ECGE 1224 - Statistiques en économie et gestion : TP 1 ECGE 14 - Statistiques en économie et gestion : TP 1 Exercice 1 Un dé parfaitement équilibré est lancé. Soit X la variable aléatoire (v.a.) correspondant au résultat obtenu avec le dé. a) Justifer pourquoi

Plus en détail

Au menu. Cours 7: Classes Probabilistes. Application : Calcul de la médiane. Sous menu. Retours sur quelques algorithmes.

Au menu. Cours 7: Classes Probabilistes. Application : Calcul de la médiane. Sous menu. Retours sur quelques algorithmes. Au menu Cours 7: Classes Probabilistes Olivier Bournez bournez@lix.polytechnique.fr LIX, Ecole Polytechnique Retours sur quelques algorithmes Quelques résultats INF561 Algorithmes et Complexité 1 2 Sous

Plus en détail

Intégration de polynômes Points de Gauss

Intégration de polynômes Points de Gauss Intégration de polynômes Points de Gauss Commençons par un exercice classique de premier cycle. Problème 1 Trouver trois réels α, β et γ tels que, pour tout polynôme P de degré au plus 2, on ait : ( )

Plus en détail

Statistique (MATH-F-315, Cours #1)

Statistique (MATH-F-315, Cours #1) Statistique (MATH-F-315, Cours #1) Thomas Verdebout Université Libre de Bruxelles 2015 Plan de la partie Statistique du cours 1. Introduction. 2. Théorie de l estimation. 3. Tests d hypothèses et intervalles

Plus en détail

TD : Microéconomie de l incertain. Emmanuel Duguet

TD : Microéconomie de l incertain. Emmanuel Duguet TD : Microéconomie de l incertain Emmanuel Duguet 2013-2014 Sommaire 1 Les loteries 2 2 Production en univers incertain 4 3 Prime de risque 6 3.1 Prime de risque et utilité CRRA.................. 6 3.2

Plus en détail

A. Popier (Le Mans) Copules. Septembre 2010 1 / 72

A. Popier (Le Mans) Copules. Septembre 2010 1 / 72 COPULES. Alexandre Popier Université du Maine, Le Mans Septembre 2010 A. Popier (Le Mans) Copules. Septembre 2010 1 / 72 PLAN DU COURS 1 RAPPELS SUR LES VECTEURS ALÉATOIRES 2 RAPPELS SUR LA MÉTHODE DE

Plus en détail

Exo7. Développements limités. 1 Calculs. 2 Applications. Corrections d Arnaud Bodin.

Exo7. Développements limités. 1 Calculs. 2 Applications. Corrections d Arnaud Bodin. Exo7 Développements ités Corrections d Arnaud Bodin. Calculs Exercice Donner le développement ité en 0 des fonctions :. cosx expx à l ordre 2. ln + x)) 2 à l ordre 4 shx x. x à l ordre 6 4. exp sinx) )

Plus en détail

Statistiques des lois à queue régulière avec l application sur les perturbations des comètes

Statistiques des lois à queue régulière avec l application sur les perturbations des comètes Statistiques des lois à queue régulière avec l application sur les perturbations des comètes Shuyan LIU Université Paris - SAMM Youri DAVYDOV et Radu STOICA Université Lille - Laboratoire Paul Painlevé

Plus en détail

Laurent Garcin MPSI Lycée Jean-Baptiste Corot. (a, b) + (c, d) = (a + c, b + d) (a, b) (c, d) = (ac bd, ad + bc) (a, 0) (b, 0) = (ab, 0)

Laurent Garcin MPSI Lycée Jean-Baptiste Corot. (a, b) + (c, d) = (a + c, b + d) (a, b) (c, d) = (ac bd, ad + bc) (a, 0) (b, 0) = (ab, 0) NOMBRES COMPLEXES 1 Corps C des nombres complexes 1.1 Construction de C Construction de C On munit R de deux lois internes + et de la manière suivante. Pour (a, b, c, d) R 4, on pose (a, b) + (c, d) =

Plus en détail

ALGÈBRE BILINÉAIRE 1

ALGÈBRE BILINÉAIRE 1 3-8- 213 J.F.C. Eve p. 1 ALGÈBRE BILINÉAIRE 1 P mentionne des résultats particulièrement utiles et souvent oubliés dans la pratique de l algèbre bilinéaire... mentionne des erreurs à ne pas faire où des

Plus en détail

Agrégation de Mathématiques Exercices d algèbre linéaire

Agrégation de Mathématiques Exercices d algèbre linéaire Agrégation de Mathématiques Exercices d algèbre linéaire P. HUBERT La plupart des exercices ci-dessous se trouvent dans les livres suivants : - E. Leichtnam, X. Schaeur, Exercices corrigés de mathématiques

Plus en détail

I. LA VARIABILITE AU SEIN DES POPULATIONS

I. LA VARIABILITE AU SEIN DES POPULATIONS I. LA VARIABILITE AU SEIN DES POPULATIONS La notion de population recouvre un concept difficilement réductible à une définition unique. Au sens de la génétique, une population représente une entité de

Plus en détail

Détection statistique d anomalies en présence de paramètres de nuisance

Détection statistique d anomalies en présence de paramètres de nuisance Détection statistique d anomalies en présence de paramètres de nuisance Lionel Fillatre ENST Bretagne, département Signal & Communication Lionel Fillatre (département SC) Détection d anomalies 1 / 29 Structure

Plus en détail

Méthodes d analyse empirique

Méthodes d analyse empirique Méthodes d analyse empirique Partie Quantitative Michel Beine (suppl. S. Laurent) michel.beine@uni.lu Université du Luxembourg http://www.michelbeine.be Méthodes d analyse empirique p. 1/? Méthodes d analyse

Plus en détail

RÉPUBLIQUE ALGÉRIENNE DÉMOCRATIQUE ET POPULAIRE MINISTÈRE DE L ENSEIGNEMENT SUPÉRIEUR ET DE LA RECHERCHE SCIENTIFIQUE

RÉPUBLIQUE ALGÉRIENNE DÉMOCRATIQUE ET POPULAIRE MINISTÈRE DE L ENSEIGNEMENT SUPÉRIEUR ET DE LA RECHERCHE SCIENTIFIQUE RÉPUBLIQUE ALGÉRIENNE DÉMOCRATIQUE ET POPULAIRE MINISTÈRE DE L ENSEIGNEMENT SUPÉRIEUR ET DE LA RECHERCHE SCIENTIFIQUE N o d ordre :... N o de série :... UNIVERSITÉ MENTOURI CONSTANTINE FACULTÉ DES SCIENCES

Plus en détail

ÉLÉMENTS D OPTIMISATION. Complément au cours et au livre de MTH 1101 - CALCUL I

ÉLÉMENTS D OPTIMISATION. Complément au cours et au livre de MTH 1101 - CALCUL I ÉLÉMENTS D OPTIMISATION Complément au cours et au livre de MTH 1101 - CALCUL I CHARLES AUDET DÉPARTEMENT DE MATHÉMATIQUES ET DE GÉNIE INDUSTRIEL ÉCOLE POLYTECHNIQUE DE MONTRÉAL Hiver 2011 1 Introduction

Plus en détail

Méthodes de placement multidimensionnelles. Fabrice Rossi Télécom ParisTech

Méthodes de placement multidimensionnelles. Fabrice Rossi Télécom ParisTech Méthodes de placement multidimensionnelles Fabrice Rossi Télécom ParisTech Plan Introduction Analyse en composantes principales Modèle Qualité et interprétation Autres méthodes 2 / 27 F. Rossi Plan Introduction

Plus en détail

2- La relation risque rentabilité attendue

2- La relation risque rentabilité attendue 2- La relation risque rentabilité attendue L'incertitude est au cœur de la logique financière. Par la composition de leur portefeuille, les investisseurs choisissent un profil de risque. Si on suppose

Plus en détail

Statistiques Appliquées Rôle des femmes dans la société

Statistiques Appliquées Rôle des femmes dans la société Statistiques Appliquées Rôle des femmes dans la société Denis Schelling Semestre d automne 2012 Résumé A partir de données concernant le rôle des femmes dans la société, nous avons effectué une analyse

Plus en détail

1 Contrôle des connaissances 2010/2011

1 Contrôle des connaissances 2010/2011 1 Contrôle des connaissances 2010/2011 Remarque préliminaire On s attachera dans la rédaction à être aussi précis que possible. Ainsi, lors de l écriture de chaque problème d optimisation et de chaque

Plus en détail

Cours Statistiques L2 Université Nice Sophia-Antipolis. François Delarue

Cours Statistiques L2 Université Nice Sophia-Antipolis. François Delarue Cours Statistiques L2 Université Nice Sophia-Antipolis François Delarue Table des matières Chapitre 1. Rappels de Probabilités 5 1. Espaces de probabilité et Variables aléatoires 5 2. Espérances et variances

Plus en détail

Introduction à l optimisation

Introduction à l optimisation Université du Québec à Montréal Introduction à l optimisation Donnée dans le cadre du cours Microéconomie II ECO2012 Baccalauréat en économique Par Dominique Duchesneau 21 janvier septembre 2008 Ce document

Plus en détail

Seconde Partie. Cours de Mathématiques. Semestre

Seconde Partie. Cours de Mathématiques. Semestre Année 2009-2010 ntégration et Probabilités Seconde Partie Cours de Mathématiques Takéo Takahashi Première Année FICM Semestre Table des matières 5 Indépendance et Convolution 3 5.1 Indépendance..............................................

Plus en détail

Programmes des classes préparatoires aux Grandes Ecoles

Programmes des classes préparatoires aux Grandes Ecoles Programmes des classes préparatoires aux Grandes Ecoles Filière : économique et commerciale Option : Technologique (ECT) Discipline : Mathématiques- Informatique Seconde année Ministère de l enseignement

Plus en détail

HUITIEME PARTIE ANALYSE EN COMPSANTES PRINCIPALES

HUITIEME PARTIE ANALYSE EN COMPSANTES PRINCIPALES 105 HUITIEME PARTIE ANALYSE EN COMPSANTES PRINCIPALES 1. Introduction En statistiques il arrive fréquemment que les individus soient décrits par un grand nombre de caractères. : voitures décrites par leur

Plus en détail

Estimateur et Estimation Prof Franck Bonnetain Unité de méthodologie & de qualité de vie en cancérologie (EA3181) CHRU Besançon

Estimateur et Estimation Prof Franck Bonnetain Unité de méthodologie & de qualité de vie en cancérologie (EA3181) CHRU Besançon PACES - APEMK UE 4 Evaluation des méthodes d analyses appliquées aux sciences de la vie et de la santé Estimateur et Estimation Prof Franck Bonnetain Unité de méthodologie & de qualité de vie en cancérologie

Plus en détail

Intégrale de Lebesgue

Intégrale de Lebesgue Intégrale de Lebesgue ÉCOLE POLYTECHNIQUE Cours 4 : intégrale de Lebesgue Bertrand Rémy 1 / 50 1. Motivations et points de vue ÉCOLE POLYTECHNIQUE Cours 4 : intégrale de Lebesgue Bertrand Rémy 2 / 50 Deux

Plus en détail

UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2013 2014 MATHS/STATS. Solution des exercices d algèbre linéaire

UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2013 2014 MATHS/STATS. Solution des exercices d algèbre linéaire UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 3 4 Master d économie Cours de M. Desgraupes MATHS/STATS Document : Solution des exercices d algèbre linéaire Table des matières

Plus en détail

Statistiques appliquées (L3 d'économie) - Cours de Patrick Sevestre - TD 2 - Corrigé

Statistiques appliquées (L3 d'économie) - Cours de Patrick Sevestre - TD 2 - Corrigé Statistiques appliquées (L3 d'économie) - Cours de Patrick Sevestre - TD 2 - Corrigé Marc Sangnier - marc.sangnier@ens-cachan.fr 29 octobre 2007 Exercice 1 - Lien entre salaire et formation Remarques préliminaires

Plus en détail

Une introduction aux statistiques inférentielles

Une introduction aux statistiques inférentielles 1 Une introduction aux statistiques inférentielles Christophe Lalanne Sommaire 1 Quelques rappels utiles de probabilités.................................. 1 1.1 Les axiomes fondamentaux..........................................

Plus en détail

Estimation et calibration des paramètres

Estimation et calibration des paramètres et calibration des paramètres 6-601-09 Simulation Monte Carlo Geneviève Gauthier HEC Montréal 1 1. Nous allons discuter des diverses façons de déterminer les paramètres des modèles que nous employons lors

Plus en détail

CHAPITRE 5. Michel LUBRANO. Octobre 2007. 1 Introduction 2

CHAPITRE 5. Michel LUBRANO. Octobre 2007. 1 Introduction 2 CHAPITRE 5 Inférence et Tests dans les Modèles Cointégrés Michel LUBRANO Octobre 2007 Contents 1 Introduction 2 2 La Methode de Engle et Granger 3 2.1 Estimation en deux étapes..........................

Plus en détail

MAITRISE de MATHÉMATIQUES STATISTIQUE. M. Gradinaru

MAITRISE de MATHÉMATIQUES STATISTIQUE. M. Gradinaru MAITRISE de MATHÉMATIQUES STATISTIQUE M. Gradinaru 2002-2005 2 Avant propos Ces notes sont une rédaction du cours oral en amphithéâtre. Il s agit d un document de travail et pas d un ouvrage; il est destiné

Plus en détail

et Transversalité par Pierre Vogel

et Transversalité par Pierre Vogel Université Paris 7 Denis Diderot Institut de Mathématiques de Jussieu Géométrie des Variétés et Transversalité par Pierre Vogel Introduction Ce cours est destiné à l étude des variétés différentiables

Plus en détail

Chapitre I Théorie de la ruine

Chapitre I Théorie de la ruine Chapitre I Théorie de la ruine Olivier Wintenberger ISUP 2, Université Paris VI (slides Olivier Lopez) Année universitaire 2013-2014 1 Risque collectif 2 Modélisation des coûts de sinistres 3 Probabilité

Plus en détail

Inférence via distribution asymptotique Objective : Construction des intervalles de confiance (approximatifs) c 2 µ 2 m (2) σ 2

Inférence via distribution asymptotique Objective : Construction des intervalles de confiance (approximatifs) c 2 µ 2 m (2) σ 2 Inférence via distribution asymptotique Objective : Construction des intervalles de confiance (approximatifs) Soit h = c n 1/5. Donc, par conséquent d un TCL, pour n : Estimateur localement linéaire :

Plus en détail

Formulaire de Probabilités et Statistiques

Formulaire de Probabilités et Statistiques Formulaire de Probabilités et Statistiques AD+JS 1 Rappels de combinatoire Arrangements avec répétitions Nombre d applications d un ensemble à k éléments dans un ensemble à n éléments : n k Arrangements

Plus en détail

Programme de Mathématique Préparation Maths-Physique. Analyse et Géométrie Différentielle. Première Année

Programme de Mathématique Préparation Maths-Physique. Analyse et Géométrie Différentielle. Première Année Programme de Mathématique Préparation Maths-Physique Analyse et Géométrie Différentielle Première Année I NOMBRES REELS ET COMPLEXES, SUITES ET FONCTIONS 1 Nombres réels et complexes 2 Suites de nombres

Plus en détail

PC* Espaces préhilbertiens réels

PC* Espaces préhilbertiens réels I. Espace préhilbertien réel................................... 3 I.1 Produit scalaire dans un espace vectoriel réel................... 3 I.2 Inégalités de Cauchy-Schwarz et de Minkowski..................

Plus en détail

Tests statistiques élémentaires

Tests statistiques élémentaires Résumé Il serait vain de chercher à présenter l ensemble des tests statistiques, la littérature est très abondante sur le sujet. Cette vignette introduit les plus couramment calculés par les logiciels

Plus en détail

TD1, sur la Régression Logistique (STA 2211)

TD1, sur la Régression Logistique (STA 2211) TD, sur la Régression Logistique STA 22) Exercice : Un sondage international cité dans un article de presse le 4 décembre 2004) rapportait le faible taux d approbation de la politique du Président des

Plus en détail

Estimation. Anita Burgun

Estimation. Anita Burgun Estimation Anita Burgun Estimation Anita Burgun Contenu du cours Sondages Mesures statistiques sur un échantillon Estimateurs Problème posé Le problème posé en statistique: On s intéresse à une population

Plus en détail

SPLEX Statistiques pour la classification et fouille de données en

SPLEX Statistiques pour la classification et fouille de données en SPLEX Statistiques pour la classification et fouille de données en génomique Classification Linéaire Binaire CLB Pierre-Henri WUILLEMIN DEcision, Système Intelligent et Recherche opérationnelle LIP6 pierre-henri.wuillemin@lip6.fr

Plus en détail

Reconnaissance des formes

Reconnaissance des formes Reconnaissance des formes Discrimination A. Belaïd LORIA - Nancy Discrimination linéaire Notion d hyperplan Discrimination linéaire Principe Une forme x R d (vecteur forme) Rôle de la Trouver D : R d x

Plus en détail

Support du cours de Probabilités et Statistiques. IUT d Orléans, Département Informatique

Support du cours de Probabilités et Statistiques. IUT d Orléans, Département Informatique Support du cours de Probabilités et Statistiques IUT d Orléans, Département informatique Pierre Andreoletti IUT d Orléans, Département Informatique Laboratoire MAPMO (Bât. de Mathématiques UFR Sciences)

Plus en détail

Le problème des multiplications matricielles enchaînées peut être énoncé comme suit : étant

Le problème des multiplications matricielles enchaînées peut être énoncé comme suit : étant Licence informatique - L Année 0/0 Conception d algorithmes et applications (LI) COURS Résumé. Dans cette cinquième séance, nous continuons l exploration des algorithmes de type Programmation Dynamique.

Plus en détail

Séminaire d Epidémiologie Animale Analyse de données en présence de clusters

Séminaire d Epidémiologie Animale Analyse de données en présence de clusters Analyse de données en présence de clusters Notion de clusters Conséquences de la non prise en compte des clusters Un exemple, une structure hiérarchique Elevage > Animal Le facteur d inflation de la variance

Plus en détail

Econométrie des Variables Qualitatives. Emmanuel Duguet

Econométrie des Variables Qualitatives. Emmanuel Duguet Econométrie des Variables Qualitatives Emmanuel Duguet Version 5 2008 1 Les variables qualitatives explicatives 6 11 Modèlesanstermeconstant 6 12 Modèleavecuntermeconstant 10 13 Modèleavecvariablesexplicatives

Plus en détail

Recueil d annales en Mathématiques. Terminale S Enseignement obligatoire. Intégrales

Recueil d annales en Mathématiques. Terminale S Enseignement obligatoire. Intégrales Recueil d annales en Mathématiques Terminale S Enseignement obligatoire Frédéric Demoulin Dernière révision : 3 juin 2 Document diffusé via le site www.bacamaths.net de Gilles Costantini 2. frederic.demoulin

Plus en détail

1. Explorer, organiser et démontrer des propriétés géométriques en termes de longueurs et d angles. Découvrir et étudier des nombres irrationnels.

1. Explorer, organiser et démontrer des propriétés géométriques en termes de longueurs et d angles. Découvrir et étudier des nombres irrationnels. Compétences : math, 2 ème degré (pages 1 à 3) math, 3 ème degré (pages 4 à 8) 3 grands thèmes du cours à 4h sem (pages 9 à 11) 3 grands thèmes du cours à 2h sem (pages 12 à 14) (Seules les définitions

Plus en détail

ÉCOLE POLYTECHNIQUE Promotion 2009. CONTRÔLE DU COURS DE PHYSIQUE PHY311 Lundi 12 juillet 2010, durée : 2 heures

ÉCOLE POLYTECHNIQUE Promotion 2009. CONTRÔLE DU COURS DE PHYSIQUE PHY311 Lundi 12 juillet 2010, durée : 2 heures ÉCOE POYTECHNIQUE Promotion 2009 CONTRÔE DU COURS DE PHYSIQUE PHY311 undi 12 juillet 2010, durée : 2 heures Documents autorisés : cours, recueil de problèmes, copies des diapositives, notes de PC Indiquer

Plus en détail

COURS OPTIMISATION. Cours en Master M1 SITN. Ionel Sorin CIUPERCA

COURS OPTIMISATION. Cours en Master M1 SITN. Ionel Sorin CIUPERCA COURS OPTIMISATION Cours en Master M1 SITN Ionel Sorin CIUPERCA 1 Table des matières 1 Introduction 4 2 Quelques rappels de calcul différentiel, analyse convexe et extremum 5 2.1 Rappel calcul différentiel............................

Plus en détail