Définitions Covariance Corrélation Meilleur prédicteur linéaire. Chapitre 5 Couple de variables aléatoires



Documents pareils
Chapitre 3. Les distributions à deux variables

Actuariat I ACT2121. septième séance. Arthur Charpentier. Automne charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free.

Master IMEA 1 Calcul Stochastique et Finance Feuille de T.D. n o 1

Programmes des classes préparatoires aux Grandes Ecoles

1 TD1 : rappels sur les ensembles et notion de probabilité

Loi d une variable discrète

M2 IAD UE MODE Notes de cours (3)

Statistique Descriptive Élémentaire

PROJET DE GESTION PORTEFEUILLE. Evaluation d une Stratégie de Trading

Le théorème des deux fonds et la gestion indicielle

Théorie des sondages : cours 5

Que faire lorsqu on considère plusieurs variables en même temps?

Relation entre deux variables : estimation de la corrélation linéaire

Licence MASS (Re-)Mise à niveau en Probabilités. Feuilles de 1 à 7

Exercice : la frontière des portefeuilles optimaux sans actif certain

PROBABILITES ET STATISTIQUE I&II

Moments des variables aléatoires réelles

Etude des propriétés empiriques du lasso par simulations

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Couples de variables aléatoires discrètes

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

Probabilités. C. Charignon. I Cours 3

Gestion obligataire passive

Notes du cours MTH1101 Calcul I Partie II: fonctions de plusieurs variables

Une réponse (très) partielle à la deuxième question : Calcul des exposants critiques en champ moyen

Capacité d un canal Second Théorème de Shannon. Théorie de l information 1/34

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

TD1 Signaux, énergie et puissance, signaux aléatoires

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Simulation de variables aléatoires

Modèles et Méthodes de Réservation

DCG 6. Finance d entreprise. L essentiel en fiches

Pratique des options Grecs et stratégies de trading. F. Wellers

Bases : Probabilités, Estimation et Tests.

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Théorie des Graphes Cours 3: Forêts et Arbres II / Modélisation

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #16

3. Caractéristiques et fonctions d une v.a.

Statistiques à deux variables

Travaux dirigés d introduction aux Probabilités

Introduction à la statistique non paramétrique

MESURE ET PRECISION. Il est clair que si le voltmètre mesure bien la tension U aux bornes de R, l ampèremètre, lui, mesure. R mes. mes. .

Cours de Tests paramétriques

Programmation Linéaire - Cours 1

Value at Risk. CNAM GFN 206 Gestion d actifs et des risques. Grégory Taillard. 27 février & 13 mars 20061

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

Économetrie non paramétrique I. Estimation d une densité

MODELE A CORRECTION D ERREUR ET APPLICATIONS

Exercices - Fonctions de plusieurs variables : corrigé. Pour commencer

Probabilité. Table des matières. 1 Loi de probabilité Conditions préalables Définitions Loi équirépartie...

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #4-5

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

STATISTIQUES. UE Modélisation pour la biologie

Introduction au Data-Mining

Lagrange, où λ 1 est pour la contrainte sur µ p ).

Dérivées d ordres supérieurs. Application à l étude d extrema.

Espérance conditionnelle

Résolution d équations non linéaires

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #12

3. Conditionnement P (B)

Analyse de la variance Comparaison de plusieurs moyennes

Licence Economie-Gestion, 1ère Année Polycopié de Statistique Descriptive. Année universitaire :

Guidance de Statistique : Epreuve de préparation à l examen

I3, Probabilités 2014 Travaux Dirigés F BM F BM F BM F BM F B M F B M F B M F B M

CAPTEURS - CHAINES DE MESURES

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Dérivés Financiers Contrats à terme

Introduction au Data-Mining

Pierre Thérond Année universitaire

Assurance en responsabilité civile automobile en Europe

Fonctions de deux variables. Mai 2011

Température corporelle d un castor (une petite introduction aux séries temporelles)

Estimation: intervalle de fluctuation et de confiance. Mars IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

Probabilités. I Petits rappels sur le vocabulaire des ensembles 2 I.1 Définitions... 2 I.2 Propriétés... 2

I. Cas de l équiprobabilité

Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes

Modèle GARCH Application à la prévision de la volatilité

Lois de probabilité. Anita Burgun

Calculabilité Cours 3 : Problèmes non-calculables.

I. Introduction. 1. Objectifs. 2. Les options. a. Présentation du problème.

Le théorème de Perron-Frobenius, les chaines de Markov et un célèbre moteur de recherche

Note:... Q1 :... Q2 :... Q3 :... Q4 :... Bonus :... Total :...

Probabilités et statistique. Benjamin JOURDAIN

UNIVERSITE DE TECHNOLOGIE DE COMPIEGNE. Le Traitement du Signal aléatoire

Statistiques descriptives

Principe d un test statistique

Outils théoriques du modèle standard. MASTER 2003 Paris IX [Dauphine] François Jubin

EI - EXERCICES DE PROBABILITES CORRIGES

Logiciel XLSTAT version rue Damrémont PARIS

TSTI 2D CH X : Exemples de lois à densité 1

Partie 5 : La consommation et l investissement

MÉTHODE DE MONTE CARLO.

Calcul Stochastique pour la finance. Romuald ELIE

(51) Int Cl.: H04L 29/06 ( ) G06F 21/55 ( )

Notes du cours MTH1101N Calcul I Partie II: fonctions de plusieurs variables

CGB Contrats à terme sur obligations du gouvernement. OGB Options sur contrats à terme sur obligations du gouvernement

Modélisation de séries financières par un modèle multifractal. Céline Azizieh

GEA II Introduction aux probabilités Poly. de révision. Lionel Darondeau

Transcription:

Chapitre 5 Couple de variables aléatoires

Définitions 1 On appelle couple de variables aléatoires (discrètes) l application: Ω R ω (X (ω), Y (ω)) 2 La distribution d un couple de v.a. est définie par les ensembles X (Ω) et Y (Ω) x i X (Ω) et y j Y (Ω), la probabilité p ij de l évenement [(X = x i ) (Y = y j )] 3 De la loi conjointe, on tire les lois marginales P(X = x i ) = P [(X = x i ) (Y = y j )] = p ij = p i y j Y (Ω) y j Y (Ω) P(Y = y j ) = P [(X = x i ) (Y = y j )] = p ij = p j x i X (Ω) x i X (Ω)

Exemple Si X et Y prennent un nb fini de valeurs, on représente graphiquement la loi conjointe dans un tableau. Exemple : On tire 3 cartes d un jeu de 32. Soit X le nombre de cœurs et Y le nombre de brelan (3 cartes de même type ). X (Ω) = {0, 1, 2, 3} ; Y (Ω) = {0, 1} ; C32 3 = 4960 tirages possibles Cardinaux : Y X 0 1 2 3 0 C24 3 8 C 8 1C 24 2 24 C 8 2C 24 1 C8 3 1 8 24 0 0 Distribution de probabilités : Y X 0 1 2 3 0 p 00 = 252 p 10 = 273 p 20 = 84 p 30 = 7 p 0 = 616 1 p 01 = 1 p 11 = 3 p 21 = 0 p 31 = 0 p 1 = 4 p 0 = 253 p 1 = 276 p 2 = 84 p 3 = 7 p = 1

Indépendance Définition Deux v.a. X et Y sont dites indépendantes si: x i X (Ω) et y j Y (Ω), on a P [(X = x i ) (Y = y j )] = P(X = x i )P(Y = y j ) Dans l exemple, on remarque P [(X = 3) (Y = 1)] = 0 P(X = 3)P(Y = 1), donc X et Y ne sont pas indépendants Généralisation n v.a. X 1,..., X n sont dites indépendantes si: x 1 X 1 (Ω),..., x n X n (Ω), on a P [(X 1 = x 1 )... (X n = x n )] = P(X 1 = x 1 )...P(X n = x n ) Typiquement, si on répête une même expérience plusieurs fois dans les mêmes conditions, et que X i se réfère à la i ème expérience, on a indépendance des X i

Covariance Obejctif : Étudier le lien entre deux v.a. Définition Soient X et Y deux v.a. On appelle covariance X et Y le réél σ XY = cov(xy ) = E [(X E(X )) (Y E(Y ))] Propriétés 1 cov(x, Y ) = E(XY ) E(X )E(Y ) 2 cov(x, Y ) =cov(y, X ) (symétrie) 3 cov(x, X ) = σ 2 X =Var(X ) 4 cov(ax + by, Z) = acov(x, Z) + bcov(y, Z) 5 Var(X + Y ) =Var(X ) + 2cov(X, Y )+Var(Y ) 6 Si X et Y sont indépendants alors cov(x, Y ) = 0 (cov(x, Y ) = 0 n implique pas nécessairement X et Y indpts) 7 cov(x, Y ) σ x σ y (égalité ssi Y = ax + b)

Exemple On a deux boîtes A et B et 2 billes 1 et 2. Chaque bille est placée au hasard dans une des deux boîtes. Soit X =nb de billes dans la boite A ; Y=nb de boîtes vides. On a X (Ω) = {0, 1, 2} et Y (Ω) = {0, 1} 4 cas équiprobables

Y X 0 1 2 0 0 1/2 0 1/2 1 1/4 0 1/4 1/2 1/4 1/2 1/4 1 E(X ) = 0x1/4 + 1x1/2 + 2x1/4 = 1 ; E(Y ) = 0x1/2 + 1x1/2 = 1/2 E(XY ) =?, XY (Ω) = {0, 1, 2} P(XY = 0) = 3/4, P(XY = 1) = 0, P(XY = 2) = 1/4 E(XY ) = 2/4 = 1/2 cov(x, Y ) = 1x1/2 1/2 = 0 On a cov(x, Y ) = 0, or X et Y ne sont pas indépendants, par ex P(X = 1 Y = 1) = 0 P(X = 1)P(Y = 1) = 1/2x1/2 = 1/4

Corrélation Définition Soient X et Y des v.a. de moyennes finies et de variances non nulles. Le coefficient de correlation de X et Y est alors ρ X,Y = cov(x, Y ) σ X σ Y Propriété : D après la propriété 7 de la covariance : 1 ρ X,Y 1 Par ailleurs ρ X,Y = 1 ssi Y = ax + b avec a > 0 si ρ = 1 et a < 1 si ρ = 1 si ρ X,Y = 1, X et Y évoluent dans la même direction alors que si ρ X,Y = 1 Y diminue quand X augmente et vice-versa

Vocabulaire ρ X,Y = 0 X et Y sont non corrélés indépendants non corrélés (la réciproque n est pas vraie) ρ X,Y > 0 X et Y sont positivement corrélés ρ X,Y = 1 X et Y sont parfaitement positivement corrélés ρ X,Y < 0 X et Y sont négativement corrélés ρ X,Y = 1 X et Y sont parfaitement négativement corrélés

Meilleur prédicteur linéaire Le coefficient de corrélation est souvent présenté comme une mesure de la relation linéaire entre deux variables On a vu précédemment qu une correlation parfaite correspond à une relation linéaire (parfaite) Qu en est-il pour les correlations imparfaites? Supposons que l on veuille approximer une variable aléatoire Y par une fonction linéaire de X (autre v.a.) : α + βx. Comment choisir au mieux α et β? (on parlera alors de meilleur prédicteur linéaire)

L erreur de l approximation s écrit ɛ = Y α βx et est appelée la variable aléatoire résiduelle. L idée est de choisir α et β de façon à minimiser E(ɛ 2 ), l erreur quadratique moyenne. On note MSE (Mean Squared Error) = E(ɛ 2 ) = E [(Y α βx ) 2 ] On a déjà vu que si ρ X,Y = ±1, l apprimation peut-être faite de manière exacte, i.e. avec E(ɛ 2 ) = 0. Dans le cas général, l erreur quadratique moyenne peut s écrire: MSE = E(Y 2 ) 2αE(Y ) 2βE(XY )+β 2 E(X 2 )+2αβE(X )+α 2

La valeur minimum de cette expression (si elle existe) est obtenue en égalisant les dérivées partielles (par rapport à α et à β) à 0. On obtient alors { βe(x 2 ) + αe(x ) = E(XY ) C est-à-dire βe(x ) + α = E(Y ) { β = σ XY σ 2 x α = E(Y ) βe(x ) Remarque : alors E(ɛ) = 0

Pour résumer, on a Definition Soient X et Y deux v.a. Soit l équation Y = α + βx + ɛ où α et β sont des constantes et ɛ une v.a. définie par ɛ = Y α βx. Alors Y est approximée par la relation linéaire α + βx avec ɛ comme variable aléatoire résiduelle. Le meilleur prédicteur linéaire de Y par X est l appliquation linéaire α + βx qui minimise l erreur quadratique moyenne E(ɛ 2 ). Le coefficient β est appelé le beta de Y par rapport à X et la droite y = α + βx est appelée droite de régression.

Théroème Le meilleur prédicteur linéaire de Y par X est donné par : σ XY σ 2 X X + E(Y ) σ XY σ 2 X E(X ) Alors, l erreur quadratique moyenne minimum est égale à E(ɛ 2 ) = σ 2 Y (1 ρ 2 X,Y ) On peut donc définir les propriétés suivantes du coefficient de correlation ρ X,Y = ±1 ssi il existe une relation linéaire en X et Y Plus ρ X,Y est proche de ±1, plus l erreur quadratique moyenne (MSE) est faible quand on utilise le meilleur prédicteur linéaire

Si ρ X,Y est positif, le meilleur prédicteur linéaire a une pente positive. Ainsi, quand X augmente (resp. diminue), le meilleur prédicteur linéaire de Y augmente (resp. diminue) aussi Si ρ X,Y est négatif, le meilleur prédicteur linéaire a une pente négative. Ainsi, quand X augmente, le meilleur prédicteur linéaire de Y diminue et vice-versa. Attention : Une forte correlation n implique pas de relation causale. Le fait qu une variable Y prenne des valeurs qui peuvent être approximées linéairement par les valeurs d une autre v.a. X, ne signifie pas qu une évolution de X cause une évolution de Y (ex : augmentation des ventes d ordinateur et d automobile dans les années 90)

Application - Modèle de marché Soit une action S. En utilisant le meilleur prédicteur linéaire, on veut approximer le rendement hebdomadaire de S (R S ) par une fonction linéaire du rendement hebdomadaire du marché (R M ). Le meilleur prédicteur linéaire donne avec R S = α S + β S R M + ɛ β S = cov(r S, R M ) et α σm 2 S = E(R S ) βe(r M ) β S est le beta de l action S et correspond à la pente de la régression linéaire de R S sur R M

Deux titres différents peuvent avoir le même beta β S = 1 : les variations du titre suivent l évolution du marché β S > 1 : le titre amplifie les fluctuations du marché (titre volatil) β S < 1 : le titre sous-réagit par rapport au marché (une variation de 1% du marché entraine une variation de moins de 1% du titre)

Calcul du risque du titre Or, Var(R S ) = Var(α S + β S R M + ɛ) = Var(β S R M + ɛ) = Var(β S R M ) + Var(ɛ) + 2β S cov(r M, ɛ) cov(r M, ɛ) = cov(r M, R S α S β S R M ) par définition de β S. Ainsi, = cov(r M, R S ) β S cov(r M, R M ) = 0 Var(R S ) = β 2 SVar(R M ) + Var(ɛ) = β 2 Sσ 2 M + σ 2 ɛ

Le risque d un titre peut donc être décomposé en : un risque systématique : βs 2σ2 M dépendant de l état global (macroscopique) du marché (taux d intérêt, offre de monnaie, guerre,...) et proportionnel à β S (effet amplificateur) un risque spécifique : σ 2 ɛ qui affecte uniquement le titre considéré et est indépendant des phénomènes macroscopiques. Ex : mauvaise gestion de l entreprise, incendie qui détruit son usine ou invention technologique qui rend obsolète la gamme de produits D après la théorie économique, un portefeuille diversifié (cf. TD) permet de supprimer le risque spécifique. Seul le risque systématique devrait donc être pris en compte pour évaluer le rendement d un titre. Le beta d un titre est alors la caractéristique principale de l analyse de son rendement.