_t ÄÉ aéüåtäx TáçÅ àü Öâx

Documents pareils
TSTI 2D CH X : Exemples de lois à densité 1

Limites finies en un point

Chapitre 3. Quelques fonctions usuelles. 1 Fonctions logarithme et exponentielle. 1.1 La fonction logarithme

Moments des variables aléatoires réelles

Continuité et dérivabilité d une fonction

Séminaire TEST. 1 Présentation du sujet. October 18th, 2013

Probabilités sur un univers fini

Exo7. Limites de fonctions. 1 Théorie. 2 Calculs

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable T : pour travailler et mémoriser le cours

Résolution d équations non linéaires

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Texte Agrégation limitée par diffusion interne

Image d un intervalle par une fonction continue

Espérance conditionnelle

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Fonctions homographiques

Fonctions de plusieurs variables, intégrales multiples, et intégrales dépendant d un paramètre

3. Conditionnement P (B)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Peut-on imiter le hasard?

De même, le périmètre P d un cercle de rayon 1 vaut P = 2π (par définition de π). Mais, on peut démontrer (difficilement!) que

Loi binomiale Lois normales

Chapitre 2 Le problème de l unicité des solutions

Suites numériques 4. 1 Autres recettes pour calculer les limites

Dérivation : cours. Dérivation dans R

Probabilités III Introduction à l évaluation d options

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.

Continuité en un point

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

3 Approximation de solutions d équations

Calcul fonctionnel holomorphe dans les algèbres de Banach

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

EXERCICE 4 (7 points ) (Commun à tous les candidats)

TABLE DES MATIERES. C Exercices complémentaires 42

Probabilités sur un univers fini

Commun à tous les candidats

aux différences est appelé équation aux différences d ordre n en forme normale.

Exercices - Fonctions de plusieurs variables : corrigé. Pour commencer

Exercices - Polynômes : corrigé. Opérations sur les polynômes

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

Amphi 3: Espaces complets - Applications linéaires continues

CCP PSI Mathématiques 1 : un corrigé

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

Cours d Analyse. Fonctions de plusieurs variables

Les Conditions aux limites

Correction de l examen de la première session

Raisonnement par récurrence Suites numériques

Analyse de la variance Comparaison de plusieurs moyennes

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Fibonacci et les paquerettes

DÉRIVÉES. I Nombre dérivé - Tangente. Exercice 01 (voir réponses et correction) ( voir animation )

Correction du Baccalauréat S Amérique du Nord mai 2007

TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options

Dérivées d ordres supérieurs. Application à l étude d extrema.

AC AB. A B C x 1. x + 1. d où. Avec un calcul vu au lycée, on démontre que cette solution admet deux solutions dont une seule nous intéresse : x =

I. Polynômes de Tchebychev

L E Ç O N. Marches aléatoires. Niveau : Terminale S Prérequis : aucun

3. Caractéristiques et fonctions d une v.a.

Calcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes.

Programmes des classes préparatoires aux Grandes Ecoles

Simulation de variables aléatoires

Comparaison de fonctions Développements limités. Chapitre 10

CHOIX OPTIMAL DU CONSOMMATEUR. A - Propriétés et détermination du choix optimal

Correction du baccalauréat ES/L Métropole 20 juin 2014

Les correcteurs accorderont une importance particulière à la rigueur des raisonnements et aux représentations graphiques demandées.

2.4 Représentation graphique, tableau de Karnaugh

Statistiques Descriptives à une dimension

Dualité dans les espaces de Lebesgue et mesures de Radon finies

Méthodes de Simulation

MODELES DE DUREE DE VIE

Chp. 4. Minimisation d une fonction d une variable

Les indices à surplus constant

Processus aléatoires avec application en finance

BTS Groupement A. Mathématiques Session Spécialités CIRA, IRIS, Systèmes électroniques, TPIL

4 Distributions particulières de probabilités

I - PUISSANCE D UN POINT PAR RAPPORT A UN CERCLE CERCLES ORTHOGONAUX POLES ET POLAIRES

Représentation d une distribution

PRINCIPES DE LA CONSOLIDATION. CHAPITRE 4 : Méthodes de consolidation. Maître de conférences en Sciences de Gestion Diplômé d expertise comptable

Planche n o 22. Fonctions de plusieurs variables. Corrigé

Partie 1 - Séquence 3 Original d une fonction

Fonctions de plusieurs variables

Le modèle de Black et Scholes

CHAPITRE V SYSTEMES DIFFERENTIELS LINEAIRES A COEFFICIENTS CONSTANTS DU PREMIER ORDRE. EQUATIONS DIFFERENTIELLES.

Licence MASS (Re-)Mise à niveau en Probabilités. Feuilles de 1 à 7

Calculs de probabilités avec la loi normale


Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

C f tracée ci- contre est la représentation graphique d une

Suites numériques 3. 1 Convergence et limite d une suite

Exercice 3 (5 points) A(x) = 1-e -0039' e- 0,039x A '() -'-,..--,-,--,------:-- X = (l_e-0,039x)2

!-.!#- $'( 1&) &) (,' &*- %,!

La demande Du consommateur. Contrainte budgétaire Préférences Choix optimal

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

Probabilités Loi binomiale Exercices corrigés

Précision d un résultat et calculs d incertitudes

Introduction à la Statistique Inférentielle

TESTS D'HYPOTHESES Etude d'un exemple

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

Transcription:

_t ÄÉ aéüåtäx áçå àü Öâx Définition, premières propriétés, estimation des paramètres Pour que l asymétrie ne soit plus considérée comme anormale Olivier SICARD Mars 013

SOMMAIRE 1. Préambule..page 3. Rappels sur la loi normale page 5 3. Définition d une normale asymétrique..page 5 4. Intervalle de confiance asymétrique....page 8 5. Opérations et normale asymétrique page 8 6. Espérance...page 7. Variance..page 10 8. Estimation des paramètres page 11. Simulation d un échantillon page 1

I. Préambule La loi Normale est partout autour de nous. Les variables de taille, poids, QI, (pour ne citer que ces exemples) sont souvent modélisés par une loi normale. Il faut bien avouer que, le théorème central limite, qui nous enseigne que toute somme de variables aléatoires indépendantes et identiquement distribuées tend vers une variable aléatoire gaussienne, nous incite fortement à nous en servir. Cependant, la loi normale comme nous la connaissons, a une propriété importante et incontournable : elle est symétrique. Alors que faire si lors de l étude d une série statistique, nous obtenons un histogramme de ce genre? Peut-on considérer que la variable sous-jacente suit une loi normale? Elle semble un peu tordue : étirée vers la droite et compressée du côté gauche. Nous pourrions faire un test de normalité (test du d adéquation par exemple), mais que faire si le test rejette l hypothèse de normalité? Ou encore Dans un article, l INSEE compare le niveau de vie au revenu disponible des familles. Source INSEE (http://www.insee.fr/fr/themes/document.asp?ref_iderf004) Sans même faire de test de normalité, il semble évident, que les variables étudiées dans cet article de ne suivent pas de lois normales. 3

Aujourd hui l asymétrie dans les distributions peut se gérer de plusieurs façons : 1. D abord par le calcul du coefficient d asymétrie qui donne justement une mesure du degré d asymétrie de la distribution. Il est défini par ( ) où est l espérance de X et son écart-type. Lorsque 0 la distribution est symétrique, sinon l asymétrie penchera vers la gauche ou vers la droite suivant que S soit négatif ou positif.. On peut tenter d estomper l asymétrie d une distribution par des transformations de type ou log (1+) 3. Si la variable X étudiée est à valeur dans R, on peut utiliser des lois déjà asymétriques comme la loi log-normale ou la loi gamma. 4. Une loi normale asymétrique (skew-normal distribution) existe déjà, (http://fr.wikipedia.org/wiki/loi_normale_asymétrique). Sa densité se définit à partir de la densité et de la fonction de répartition de la loi normale, cependant l estimation des paramètres de cette loi semble être délicate. Cet article propose une nouvelle définition de la loi normale asymétrique fondée sur l utilisation de deux lois normales «classiques» tronquées et recollées. Dans un premier temps, les propriétés de base ainsi que le calcul de l espérance et de la variance y sont présentés, puis l avant dernier chapitre de l article est consacré à l estimation des paramètres de la loi normale asymétrique. Le dernier chapitre s intéresse à la simulation d échantillons suivant une loi normale asymétrique, et à l application des estimateurs sur quelques échantillons de tailles diverses. Dans l espoir que cet article puisse servir aux éventuels lecteurs détenteurs d échantillons à distribution asymétrique. 4

II. Rappels sur la loi normale Avant tout autre développement, remémorons-nous certaines propriétés de la loi normale. Nous tenterons par la suite de les étendre à la loi normale asymétrique. Soit m R etσ R * + Une loi normale N( m, σ ) est une loi à densité. La densité est définie par la fonction suivante : ( x m) 1 σ f ( x) e σ π Les résultats suivants sont classiques : Lorsque ~(,) + f ( x) dx 1 "() et #()² ² Si de plus on considère ($ $,%) R² et &~(, ), alors la variable $+%&~ ~($ +%, $² ²+%² ²) '( ) *,,+-).0,5 III. Définition d une normale asymétrique Soit m R et σ, τ R *, considé + érons la fonction suivante : ( ) x m σ f ( x) e π ( σ + τ ) 1 ( x m) τ ; m m; + ] 1 ( x) + e ( x) ] ] [ 5

héorème 1 : f est une densité. Preuve : La fonction 1 étant positive et intégrable sur R, il suffit de vérifier que f ( x) dx 1. + f ( x) dx e dx + e dx π ( σ + τ ) m + m ( x m) + ( x m) σ τ ( ) ( ) 1 + x m + x m σ τ e dx e dx (par symétrie axiale d'axe x m) π ( σ τ ) + + 1 σ π + τ π ( σ + τ ) π 1 Définition : Considérons X une variable aléatoire réelle, X suit une loi normale asymétrique de paramètres m, σ, τ (s écrit ~(,,)) si et seulement si X admet pour densité ( ) ( ) x m x m σ τ f ( x) e 1] ; ]( x) + e 1] ; [ ( x) m m + π ( σ + τ ) x Sa fonction de répartition sera définie par F( x) f ( t) dt. En conclusion X suit une loi normale asymétrique si X s éloigne normalement de la valeur mais de façon différente selon que l on s éloigne par valeur inférieure ou par valeur supérieure. Remarque : Si, X suit une loi normale classique! Exemples : Il est assez simple de créer ce type de fonction de densité sous GeoGebra. Ici La variable % joue le rôle de (l écart type des valeurs inférieures à ) La variable $ joue le rôle de (l écart type des valeurs supérieures à ) L asymétrie apparaît nettement autour de l axe d équation 3 6

Voici la fonction de densité d une ( ; 0,5 ;1,5 Voici la fonction de densité d une (0 ; ;1 héorème : Soit ~(,,) alors 4(5 < < et 4( < Preuve : 4(5 )6 1(7)87 :( < 6 (>?@ A AB A 87 < : :(< < < Par un raisonnement analogue on obtient 4( < 7

IV. Intervalle de confiance asymétrique héorème 3 : Soit ~(,,) Alors P X [ m σ m τ ] (, + ) 0, 5 Preuve : 4'( ), +-) < 6 1(3)83 C6?(D?@)² :(<) AF² 83+6 <?(D?@)² AB² 83 G :(<) H I.K,LM + I.K,LM N 0,5 Sur l exemple ci-dessous, ~(0,1,3) il y a donc 5% de chances qu une réalisation de X soit comprise entre - et 6. V. Opérations et loi normale asymétrique héorème 4 : Soit ~(,,) alors Pour tout $>0 7 %PR, $+% ~ ($ +%,$,$) Pour tout $<0 7 %PR, $+% ~ ($ +%, $, $) rem : quand a est négatif il inverse les rôles des écarts types et. 8

Corollaire : Soit ~(,,) alors & ~ (0,,) ~(,,) VI. Espérance héorème 5 : Soit ~(,,) Alors E( X ) m + ( τ σ ) π Preuve : + E( X ) x. f ( x) dx m ( x m) + ( x m) σ τ x. e dx + x. e dx ( σ + τ ) π ( σ + τ ) π m 1444444443 1444444443 A B Calcul de A : 0 u x m A ( σu + m). e. σ. du changement de variable u ( σ + τ ) π σ 0 u 0 u. σ σ u. e. du + m e. du ( σ τ ) π + 0 u. σ π σ e + m. ( σ + τ ) π 1443 σ. σ mσ + ( σ + τ ) π σ + τ

Calcul de B : + u x m B ( τu + m). e. τ. du changement de variable u ( σ + τ ) π τ 0 + ( σ τ ) π + u + u. τ τ u. e. du m e. du + 0 0 + u. τ π τ e + m. ( σ + τ ) π 0 1443 τ. τ mτ + ( σ + τ ) π σ + τ + +. CQFD π D où E( X ) A B m ( τ σ ) VII. Variance héorème 6 : V ( X ) στ 1 + τ σ π Soit ~(,,) Alors ( ) Preuve : #() Q R3 "()S 1(3)83 Q U3 I ( )V 1(3)83 Q (3 ) 1(3)83 ( ) Q (3 )1(3)83+ ( )² Q 1(3)83 I I WXXYXXZ _ c ^ b ^ Q(3 ) (`)A A 83+ Q (3 ) (`)A < A 83b I(+) ^ WXXXXXXYXXXXXXZ b ^ WXXXXXXYXXXXXXZ b ] [ A [ <A a I ( ) I(+) : d Q(3 )(`)A A 83 < : +Q (3 ) (`)A < A 83 [\ e+ I ( )² 10

#() QA K I(+) f I+ Ig 4( ) I(+) i A 8 k + k + 4( ) lf ²`² ²g +f ² `² <²g m+ I(+) WXXXXXXXXXYXXXXXXXXXZ I ( ) K <²² K +Q A K < A 8 j+ I ( )² +² 4 I ( ) + I ( )² ( ) + I ( )² +n1 I o( )² CQFD VIII. Estimation des paramètres Soit (3 \,,3 q ), une série de n observations correspondant à des réalisations de n variables aléatoires ( r ) \srsq indépendantes et suivant toutes une loi (,,). Il semble assez difficile de trouver des estimateurs sans biais et convergents des trois paramètres,,. Nous allons nous contenter de donner des estimateurs conditionnels de et de sachant. Le paramètre sera donc connu dès le départ. On peut imaginer que sa valeur sera déterminée et justifiée par des arguments mathématiquesphysiques-chimiques-biologiques-économiques selon le type de phénomène étudié à travers la série d observations. On peut aussi tenter d estimer par le centre de la classe modale de la série. Calcul des estimateurs de t et u connaissant v : Etape 1 : q x[\ 3 x est un estimateur sans biais et convergent de "() + ( ) : étant connu, y ( ) : est un estimateur de Etape ² \ q (3 q\ x[\ x )² est un estimateur sans biais convergent de #()+z1 {( )² : Dans ce cas ² z1 {( y)² est un estimateur de. : Etape 3 11

Le polynôme du second degré ²+(*)* A pour discriminant Δ(*) +4(+) Pour première racine : (<) ~ * Pour deuxième racine : (<) ~ Etape 4 Δ* y +4 est un estimateur du discriminant Δ. (< y) ~ est un estimateur de. (< y) ~ est un estimateur de. On en déduit le théorème suivant : héorème 7 : Soit (3 \,,3 q ), une série de n observations correspondant à des réalisations de n variables aléatoires ( r ) \srsq indépendantes et suivant toutes une loi (,,). y ( ) : est un estimateur sans biais de ² z1 {( y)² est un estimateur de : (< y) < ya ƒ< est un estimateur de (< y) < ya ƒ< est un estimateur de IX. Simulation d un échantillon 1. Comment simuler une loi normale asymétrique héorème 8 : Soient et deux réels strictement positifs, et un réel Notons : ~ z < { une variable de Bernoulli de paramètre <, ~(0,) et < ~(0,) trois variables indépendantes les unes des autres, Alors +(1 ) < ~ (0,,) 1

Preuve : Soit un réel Cas n 1 : Considérons que 0, et montrons que 4( ) (<) : 4( )4(* +(1* ) < ) 4R( 1) (* )S+4R( 0) ( < )S 4(* < )+ < 4( < < ) 4( < *)+0 (Š$ 0) 4( < ) (par symétrie de la densité de la loi normale) \ r r AF²83 AF²83 cqfd. 6?D² < : D² 6 (<) : r D² 6 AF²83 Cas n : Considérons que 0, et montrons que 4( ) < + 4( )4( +(1 ) < ) 4R( 1) ( )S+4R( 0) ( < )S < 4( )+ < < 4( < ) < + < < 4( < ) (Š$ 4( )1 4ŒŽŒ 0) < + < < + < 6 r (<) : D² AB²83 K < 4(0 ) (par symétrie de la densité de la loi normale) 6 r?d² < K AB²83 \ + 6 r < : < (<) : D² AB²83 K cqfd.. Simulation d un échantillon et estimation des paramètres Ce théorème va nous permettre de créer aisément des normales asymétriques centrées (0,,) à l aide d une bernoulli et de deux normales centrées. Pour simuler des normales asymétriques (,,) il suffira d ajouter à toutes nos valeurs simulées puisque lorsque ~(0,,), + ~(,,) Le choix s est porté sur la simulation d une (17,3,7) Voici les résultats obtenus : PARAMERES REELS m 17 sigma 3 tau 7 PARAMERES 13

ESIMES ^t-s 3,570366 ^st 1,48656 ^s,86346 ^t 6,7734036 Echantillon de taille 500 PARAMERES ESIMES ^t-s 3,570366 ^st 1,48656 ^s 3,060376 ^t 7,011334 Echantillon de taille 1000 PARAMERES ESIMES ^t-s 3,570366 ^st 1,48656 ^s 3,067005 ^t 6,80715 Echantillon de taille 1500 PARAMERES ESIMES ^t-s 4,085834 ^st 1,011456 ^s,75543 ^t 7,06137166 Echantillon de taille 10000 14