Introduction à l économétrie : Spécifications, formes fonctionnelles, hétéroscédasticité et variables instrumentales

Dimension: px
Commencer à balayer dès la page:

Download "Introduction à l économétrie : Spécifications, formes fonctionnelles, hétéroscédasticité et variables instrumentales"

Transcription

1 Introduction à l économétrie : Spécifications, formes fonctionnelles, hétéroscédasticité et variables instrumentales Pierre Thomas Léger IEA, HEC Montréal 2013 Table des matières 1 Introduction 2 2 Spécifications et forme fonctionnelle Variables binaires Transformation non linéaire Analyse de la spécification Oubli de variables pertinentes Ajout de variables Hétéroscédasticité Introduction Hétéroscédasticité Variance de MCO: Estimateur de White Tests d hétéroscédasticité Test de Goldfed-Quandt (GQ) Test de Breusch-Pagan (BP) Test de Koenker Estimation : Les moindres carrés généralisés (MCG) Problèmes d endogénéité Introduction Estimation par variables instrumentales

2 5 Conclusion 40 1 Introduction Dans cette partie, nous aborderons les di érents types de problèmes rencontrés dans le processus de modélisation. Nous en profiterons pour dériver les biais occasionnés, la manière dont il est possible de détecter les problèmes, et enfin, la façon dont il est possible de les résoudre. Cette étape de la modélisation est très importante car elle met l accent sur les détails qui peuvent remettre en cause la validité des résultats obtenus. 2 Spécifications et forme fonctionnelle 2.1 Variables binaires Une variable binaire est une variable qui prend uniquement la valeur 0 ou 1. Ce type de variable est aussi appelée dummy et elle est utile lorsque l on veut introduire des facteurs qui sont qualitatifs et di Exemple de variables binaires : - Homme ou femme - Noir ou blanc - Urbain ou non urbain cilement quantifiables. Soit le modèle suivant qui utilise une variable binaire : lwage = femme + 1 educ + Á, (1) où lwage représente le logarithme du salaire et la variable binaire femme = 1 si l individu est une femme et femme = 0 si l individu est un homme. Il est à noter qu on aurait pu remplacer la variable femme par la variable 2

3 homme (égale à 1 si l individu est un homme et 0 sinon) et les conclusions seraient les mêmes ; ici le choix est arbitraire. Par conséquent, 0 est la di érence dans le salaire horaire entre les hommes et les femmes pour un niveau de scolarité équivalent et le même Á. Observons deux cas pour illustrer ce propos : Premier cas : Si nous supposons que E(u f emme, educ) = 0 0 = E [Y femme =1,educ] E [Y femme =0,educ]. Autrement dit, si nous posons comme hypothèse qu il n y a pas de problème d endogénéité, alors le coe cient 0 indique si le salaire entre femme et homme est identique pour un même niveau d éducation. En d autres termes, si on suppose que la partie non-observable qui a ecte le salaire n est pas corrélée avec le sexe, alors il n y aura pas de problème d endogénéité et, donc, 0 exprimera sans biais l e et partiel du sexe d un individu sur la variable dépendante. Si les salaires sont identiques, 0 doit être égale à zéro. ( ) est l intercepte pour les femmes et 0 est l intercepte pour les hommes (Important : se référer à la figure 1 dans l annexe). Remarque : Dans l exemple ci-dessus l éducation rapporte autant à la femme qu à l homme ( 1 est le même quel que soit le sexe de l individu) mais ces derniers commencent à un niveau de Y di érent pour une quantité d éducation nulle. Si nous n avons pas de problème d endogénéité, 0 peut représenter la di érence (la discrimination) dans les salaires horaires entre les femmes et les hommes. Les valeurs de 0 s interprètent comme suit : 3

4 Si 0 < 0 alors, pour un même niveau d éducation, les femmes gagnent moins en moyenne que les hommes. Si 0 > 0 alors, pour un même niveau d éducation, les femmes gagnent plus que les hommes. Si 0 =0alors, pour un même niveau d éducation, il n y a aucune discrimination entre les femmes et les hommes. Par exemple, si nous estimons le modèle dans Stata avec un échantillon de données, nous obtenons le tableau qui suit. L interprétation des coe cients des variables binaires est simple en pratique comme elles correspondent à des di érences entre les moyennes de deux groupes, ceteris paribus. Comme notre variable dépendante est le logarithme naturel du salaire horaire, ce modèle prédit que la femme moyenne gagne e $=1.044$ de moins par heure que l homme moyen. 4

5 Deuxième cas : Supposons que l e et marginal de l éducation sur les salaires est di érent entre les hommes et les femmes. Dans ce cas là, il faut réécrire l équation sans oublier d inclure l interaction entre la variable educ (l éducation) et la variable f emme (être une femme ou un homme) pour exprimer cette érence d e et marginal. Nous pourrions avoir, un modèle de cette forme : Ex : ln[y ]= femme + 1 educ + 1 educ femme + Á = ln[y ]=( femme)+( femme) educ + Á. Remarque : En prenant le logarithme de la variable dépendante (ln) nous exprimons la part de l intercepte qui est attribuable à la di érence de sexe di érence de pourcentage de Y. Définition des coe cients : Si l individu est un homme : l intercepte est 0 la pente est 1 Si l individu est une femme : l intercepte est la pente est = 0 est la di érence de l intercept hommes et femmes, 1 est la di érence de pente entre les hommes et les femmes (Important :seréférer à la figure 2 dans l annexe). 5

6 En estimant le modèle avec le mï me ï chantillon qu au paravant avec Stata, nous pouvons constater que l e et de l éducation sur le logarithme du salaire pour les femmes est di érent de celui des hommes. Les ordonnées à l orgine et les pentes sont di érentes dans ce modèle. Remarquons que le symbole "##" dans Stata est un opérateur spécifiant les interactions entre les variables. Le coe cient associé à f emme#c.educ exprime donc la di érence de l e et de l éducation entre les hommes et les femmes. Nous constatons alors que l e et de l éducation est plus grand chez les femmes que chez les hommes. Il est généralement intéressant de tester les hypothèses suivantes : H 0 : 1 =0, la pente est donc identique pour les hommes et les femmes = utilisation du test t 6

7 H 0 : 0 =0et 1 =0, le salaire moyen est identique pour les hommes et les femmes = utilisation du test F (hypothèses jointes) (contre leurs hypothèses alternatives H 1 respectives). 2.2 Transformation non linéaire Nous commençons par un exemple afin d illustrer les transformations non linéaires couramment employées. Test entre groupes : Nous voulons tester si un même modèle de régression décrit le logarithme du prix des maisons unifamiliales (LP RIXM) entre une ville A et une ville B. Nous écrivons alors l équation suivante : LP RIXM i = PROXEC i + 2 SUPERF i + 3 NBPIECE i + Á, où PRXEC i est la proximité d une école de la maison i, SUPERF i est la superficie du terrain de la maison et NBPIECE i est le nombre de pièces de cette maison. Pour savoir s il y a une di érence entre la ville A et la ville B, définissons une variable binaire villea i prennant la valeur 1 si la maison i se trouve sur le territoire de la ville A et la valeur 0 si la résidence se trouve dans la ville B. Avec cette nouvelle variable, le modèle se transforme de la manière suivante (forme non linéaire) : LP RIXM i = villea i + 1 PROXEC i + 1 villea i PROXEC i + 2 SUPERF i + 2 villea i SUPERF i + 3 NBPIECE i + 3 villea i NBPIECE i + Á i, 7

8 où nous e ectuons le test F : H 0 : 0 = 1 = 2 = 3 =0. Si nous ne réussissons pas à rejeter H 0, alors nous pouvons a rmer qu il ne semble pas y avoir de di érence entre la ville A et la ville B dans le prix des logis. Ce test peut être e ectué facilement en comparant le R 2 du modèle contraint et le R 2 du modèle non contraint. Exemple de résultats : Soit les résultats de la régression du modèle non contraint : LP RIXM i = villea i + 1 PROXEC i + 1 villea i PROXEC i + 2 SUPERF i + 2 villea i SUPERF i + 3 NBPIECE i + 3 villea i NBPIECE i. Supposons que l échantillon présente n = 262 observations et, qu après estimation, nous obtenons : RSR 2 =0.502 et R2 R =0.463, où l indice SR dénote le modèle sans restriction et R représente le modèle avec restriction. Pour calculer la statistique F, nous reprenons la régression où 0 = 1 = 2 = 3 =0(le modèle contraint), soit : LP RIXM = PROXEC + 2 SUPERF + 3 NBPIECE + Á. On obtient : Â R 2 =0.463 = R 2 R F = (RSR 2 R2 R )/4 (1 RSR 2 )/(n k) = ( )/4 ( )/(262 8) F = =

9 p-value = , donc au moins un n est pas égal à 0, H 0 est rejetée, et nous pouvons a rmer que notre échantillon suggère une di érence entre les deux villes. Cas général Soit k variables indépendantes et deux groupes (g =1ou 2). On s intéresse à savoir maintenant si l intercepte et les pentes sont identiques entre les groupes 1 et 2. Y = g,0 + g,1 x 1 + g,2 x g,k x k + u où l indice g représente le groupe. Le modèle avec restrictions a k +1 restrictions, puisqu on test si chaque est identique entre les deux groupes. Le modèle sans restriction a donc n 2(k + 1) degrés de liberté. De plus, nous avons : SSR 1 et n 1 observations pour g =1et SSR 2 et n 2 observations pour g =2. Dans le modèle sans restriction, nous avons : Remarques : SSR SR = SSR 1 + SSR 2 F = [SSR (SSR 1 + SSR 2 )] /[k + 1]. (SSR 1 + SSR 2 )/[n 2(k + 1)] 1. SSR est la somme des résidus au carré sur toute la population sans dummy ou, dit autrement, c est la somme des résidus au carré du modèle contraint. Il s agit simplement de fusionner les deux groupes, d estimer la régression et de calculer SSR. 9

10 2. La statistique F, dans ce cas particulier, est appelée la statistique de Chow 2.3 Analyse de la spécification Oubli de variables pertinentes Rappel : Lorsque l on oublie des variables pertinentes clés, cela peut entraîner une corrélation entre le terme d erreur et certaines variables explicatives. Ainsi, cet oubli conduit très souvent à une inconsistance et un biais dans tous les estimateurs MCO. Dans cette partie, nous allons etudier les di érences qui vont apparaître entre le vrai modèle et le modèle omettant une variable explicative. Premier cas : Le bon modèle Soit le modèle suivant : Y = X X Á, avec X 1 :(n k 1 ), X 2 :(n k 2 ), 1 :(k 1 1) et 2 :(k 2 1). Nous pouvons réécrire le modèle ainsi : Y = X X Á D Y = [X 1,X 2 ] Y = X + Á, C Á où X =[X 1,X 2 ]. Deuxième cas : Le modèle partiel Prenons maintenant le cas où nous omettons X 2, nous faisons donc une régression seulement sur X 1.Si 10

11 nous estimons Y = X Á, alors l estimateur MCO de 1 est : 1 = (X1X Õ 1 ) 1 X1Y Õ = (X1X Õ 1 ) 1 X1(X Õ X Á) = (X1X Õ 1 ) 1 X1X Õ 1 1 +(X1X Õ 1 ) 1 X1X Õ 2 2 +(X1X Õ 1 ) 1 X1Á Õ = 1 +(X1X Õ 1 ) 1 X1X Õ 2 2 +(X1X Õ 1 ) 1 X1Á. Õ Calculons l espérance de 1 : E( 1 X) = 1 +(X Õ 1X 1 ) 1 X Õ 1X 2 2. Or, sauf si X1 Õ X 2 =0, il y a un biais correspondant à (X1 Õ X 1) 1 X1 Õ X 2 lorsqu on estime 1. Donc, si nous oublions d inclure une variable explicative qui est corrélée avec une ou plusieurs autres variables explicatives, nous introduisons un biais dans l estimation de nos paramètres. Ce cas en particulier est appelé : biais de variables omises (omitted variable bias). N.B. : (X Õ 1 X 1) 1 X Õ 1 X 2 est l estimateur d une régression par MCO de X 2 sur X 1 Chaque colonne de cette matrice représente les coe cients associés à chaque variable de X 2 sur X 1, soit : # (X Õ 1 X 1 ) 1 X Õ 1 x 21, (X Õ 1 X 1) 1 X Õ 1 x 22,...,(X Õ 1 X 1) 1 X Õ 1 x 2k 2 $ (k 1 k 2 ). Exemple : Soit : y i = x i1 + 2 x i2 + Á i. 11

12 Si nous régressons y i sur x i1 uniquement, nous obtienons E( 1 )= 1 + S 2, où S est le coe cient de régression obtenu en régressant x 2 sur x 1. Il s agit donc d une mesure de corrélation entre 1 et 2. E( 1 ) contient ainsi deux composantes : la vraie valeur de 1 et une autre composante (S 2 )qui tente de répliquer l e et du coe avec 2. cent 2 dans la mesure où 1 est corrélé Calculons maintenant la variance : Si nous oublions X 2 : Y = X Á = Var( 1 )= 2 (X Õ 1X 1 ) 1, mais, comme vu auparavant, 1 est biaisé. Dans le vrai modèle, ou bon modèle (BM) : Y = X X Á = Var( BM 1 )= 2 (X Õ X) 1 et Donc, 2 (X Õ X) 1 = C Var( 1 BM ) Cov( 1 BM, 2 BM ) Cov( 2 BM, 1 BM ) Var( 2 BM ) D. Var( BM 1 ) = 2 (X Õ 1MX 1 ) 1 et, avec M = I X 2 (X2 Õ X 2) 1 X2 Õ, nous avons : Var( BM 1 ) = 2 (X Õ 1(I X 2 (X Õ 2X 2 ) 1 X Õ 2)X 1 ) 1 Var( BM 1 ) = 2 (X Õ 1X 1 X Õ 1X 2 (X Õ 2X 2 ) 1 X Õ 2X 1 ) 1. 12

13 Si nous comparons la variance de l estimateur 1 obtenue avec les deux modèles, nous trouvons que : Var( 1 ) 1 Var( BM 1 ) 1 = 1 2 (XÕ 1X 1 ) 1 2 (XÕ 1X 1 X Õ 1X 2 (X Õ 2X 2 ) 1 X Õ 2X 1 ) Var( 1 ) 1 Var( BM 1 ) 1 > 0 = 1 2 (XÕ 1X 2 (X Õ 2X 2 ) 1 X Õ 2X 1 ), = Var( 1 ) 1 > Var( 1 BM ) > Var( 1 ) Var( 1 BM ) Var( 1 ) < Var( 1 BM ). 1 est biaisé et sous-estime la variance Ajout de variables Qu arrive-t-il si nous ajoutons une variable non pertinente dans un modèle? Soit le vrai modèle : Y = X Á. Ajoutons une variable X 2 au bon modèle : Y = X X Á. En réalité, cela revient à ne pas imposer la restriction 2 =0. Il n y a donc pas de problème de biais et 2 devrait être, en moyenne, égal à 0. Par contre lorsqu on ajoute des variables inappropriées, nous perdons de la précision dans notre estimation et la variance des estimateurs est plus grande. 13

14 3 Hétéroscédasticité Lorsque nous avons étudié le modèle linéaire, nous avons fait l hypothèse que la variance du terme d erreur était constante conditionnellement aux variables explicatives. Nous disions alors qu on était en présence d homoscédasticité. Intuitivement, cela veut dire que la variance du terme d erreur est constante peu importe le niveau des variables explicatives. Dans cette section, nous étudions ce qui arrive lorsque cette hypothèse est relâchée. 3.1 Introduction Rappel : La condition d homoscédasticité (MRL 5) estvar(á i x 1, x 2,...x k )= 2, i œ {1, 2,...,n}. Si la variance du terme d erreur varie, conditionnellement à x i, nous nous retrouvons en présence d hétéroscédasticité. Exemple d hétéroscédasticité : Si nous e ectuons un sondage afin de recueillir des données sur le revenu et la consommation d individus habitant la ville de Montréal, nous risquons de remarquer que les individus ayant un revenu faible auront un niveau de consommation très similaire, puisque la très grande majorité de leur revenu servira à consommer des biens de base. Il y aura donc très peu de variation dans le niveau de consommation. Cependant, pour les individus avec un revenu élevé, nous risquons de remarquer que le niveau de consommation varie beaucoup plus. En e et, certains consommeront presque tout leur revenu, tandis que d autres épargneront une grande portion de celui-ci. Ainsi, il y aura une plus grande variation dans le niveau de consommation lorsque le niveau de revenu est élevé. 14

15 En se référant à la matière de la première partie du cours, nous savons que même sans l hypothèse d homoscédasticité, les estimateurs MCOs sont toujours sans biais sous les hypothèses MLR 1 à 4. Cependant, sans cette dernière, ils ne sont pas BLUE. Nous avons aussi vu auparavant que l estimateur MCO de est avec = (X Õ X) 1 X Õ Y = =(X Õ X) 1 X Õ (X + Á) = = +(X Õ X) 1 X Õ Á = E( x) =, si X Á. Notons, qu il n y a aucune raison de penser que X et Á ne sont plus indépendant, nous pouvons toujours avoir E(Á x) =0en présence d hétéroscédasticité. 3.2 Hétéroscédasticité Considérons le modèle suivant : Y = X + Á. (2) L hypothèse d homoscédasticité (MRL 5) impliquait : S 2 T 0 Var(Á) =E(ÁÁ Õ X) = 2 2 I n = W. U.. X. V 0 2 Note : Même si nous relâchons MRL 5, nous supposerons, comme nous l avons fait lorsque l hypothèse tenait, que Cov(Á i Á j )=0si i = j (MRL 2). En présence d hétéroscédasticité, nous exprimons la variance comme : Var(Á i x i )= 2 i, avec i =1, 2,,n. (3) 15

16 Rappelons que Á =[Á 1, Á 1,, Á n ] Õ. Si nous connaissons la forme que prend l hétéroscédasticité, on peut écrire la variance du terme d erreur comme le produit d un terme fixe, 2, et d un terme w i qui change selon les observations. Ainsi, nous aurons : E(ÁÁ Õ x) = 2, où S = W U w 1 0 w w n T X et V 2 i = w i 2. Par conséquent : S E(ÁÁ Õ X) = W U w w w n 2 T S X = W V U n T X. V Dans l exemple du début, le revenu des foyers pourrait être Ô w i ( Ô w i pourrait aussi être une autre fonction du revenu des foyers, cela dépend de la forme que prend l hétéroscédasticité). Il faut aussi normaliser : tr( )= nÿ w i = n, i=1 où tr( ) désigne l opérateur trace qui fait la somme des éléments de la diagonale de la matrice. Remarques : 1 Si w i = 1, i œ {1, 2,,n}, nous retrouvons le cas classique de E(ÁÁ Õ x) = 2 I n. 2 L estimateur MCO est sans biais même si nous sommes en présence d hétéroscédasticité si MLR 1 à 4 tiennent. 16

17 3 L estimateur MCO n est plus BLUE en présence d hétéroscédasticité. 4 Comme nous ne sommes plus en présence d homoscedasticité, Var( X) est estimée avec un biais et : (a) les statistiques t ne suivront plus une distribution de Student et sont donc invalides. (b) les statistiques F ne suivront plus une distribution de Fisher et sont donc invalides Variance de MCO: Lorsque nous étudiions le modèle linéaire, nous avions dérivé la variance conditionnelle de : 5 1 Var( 2 6 Õ X) = E !X = E Õ X " 1!X X Á21 Õ Õ X " Õ X Õ Á Ë!X = E Õ X " 1 X Õ ÁÁ Õ X(X Õ X) 1È =! X Õ X " 1 X Õ E(ÁÁ Õ x)x(x Õ X) 1 = 2! X Õ X " 1. Cependant, nous venons de voir que, en cas d hétéroscédasticité, E(ÁÁ Õ x) = 2 = 2 I n et donc : Var( X) = 2! X Õ X " 1 X Õ X(X Õ X) 1. Si = I n, alors : Par conséquent : Var( X) = 2! X Õ X " 1. 17

18 Les écarts-types de MCO ne sont plus fiables. Les tests T et les tests F sont maintenant invalides. Var( X) =S 2 (X Õ X) 1 X Õ X(X Õ X) 1 = S 2 (X Õ X) 1 et Var( X) n est calculable que si est connu. Important : L estimateur des MCOs n est plus BLUE. Dans ce contexte, il serait possible de trouver des estimateurs linéaires et sans biais avec une plus petite variance. 3.3 Estimateur de White Il est tout de même possible de trouver un estimateur consistant de la variance de. Un estimateur consistant est un estimateur qui converge en probabilité vers le paramètre qu il tente d estimer et qui se concentre de plus en plus autour de ce paramètre à mesure que le nombre d observations augmente. Ainsi, la variance d un estimateur consistant diminue à mesure qu on augmente la taille de l échantillon. Rappel : Var( X) = 2! X Õ X " 1 X Õ X(X Õ X) 1 Var( X) =! X Õ X " 1 X Õ Ë 2 È X(X Õ X) 1. Par contre, nous pouvons démontrer qu il n est généralement pas possible d estimer, de manière consistante, les n variances spécifiques et donc 2. Il est cependant possible d estimer la matrice X Õ 2 X de dimension (k k). 18

19 Nous voulons donc estimer : = 1 n XÕ 2 X = 1 n (k k) nÿ i 2 x i x Õ i. i=1 (k 1)(1 k) où l indice i fait référence à la i eme ligne et où x i est de dimension (k 1). Rappelons que x i est le vecteur des observations des variables indépendantes pour l individu i. Tel que discuté précédemment, MCO est sans biais même en présence d hétéroscédasticité. Ainsi, ˆÁ = Y X MCO est toujours sans biais et, si S 0 est l estimateur de (où plim(s 0 )= ), alors : S 0 = 1 nÿ Á 2 i x i x Õ n i. i=1 L estimateur S 0 est consistant, c est-à-dire qu à mesure qu on augmente le nombre d observations, n, nous diminuons sa variance. L estimateur de Var( ) peut être noté Var( )=n(x Õ X) 1 S 0 (X Õ X) 1. Var( ) et est donc simplement : On peut démontrer que Var( ) converge en probabilité vers Var( ). Ò Nous qualifions généralement les écarts-types Var( ) de robustes à l hétéroscédasticité. Il faut cependant noter que ces écarts-types ne sont valides qu avec de grands échantillons et que les statistiques t et les statistiques F calculées avec ces écarts-types peuvent être invalides sur de petits échantillons. 19

20 Dans le logiciel Stata, il est très facile d obtenir les estimateurs de White. Il su t d ajouter l option robust à la fin de la commande de régression. 3.4 Tests d hétéroscédasticité Puisque l hétéroscédasticité invalide les résultats des tests (particulièrement les tests t et F) et fait en sorte que les MCOs ne sont plus BLUE, il apparaît utile de pouvoir tester sa présence. Nous pouvons toujours tracer un graphique de "points" et observer s il y a de l hétéscédasticité, cependant il est préférable de procéder à un test formel. Les trois prochaines sous-sections portent sur de tels tests. 20

21 3.4.1 Test de Goldfed-Quandt (GQ) L idée générale du test peut se résumer comme ceci : si la variance est constante à travers les observations, c est-à-dire s il y a homoscédasticité, alors nous devrions trouver que la variance est la même partout dans l échantillon. Nous pouvons alors séparer l échantillon en di érents groupes et tester si la variance des di érents groupes est la même. Donc, nous divisons l échantillon en deux groupes, le groupe 1 et le groupe 2, et nous posons H 0 : 1 2 = 2 2, où 2 1 représente la variance du groupe 1 et 2 2 la variance du groupe 2. Notez bien qu il faut diviser l échantillon en deux groupes en "ordonnant" selon Z i, c est-à-dire qu on doit créer un groupe avec les plus petits Z i et un autre avec les plus grands. La variable Z i est la variable qui est suspectée d être reliée à t 2. Il s agit donc d une des variables explicatives (donc un x k ). Dans l exemple au début de ce document, Z i serait le niveau de revenu. Nous avons donc : i 2 = 2 Zi 2. Le test peut être résumé en quatre étapes : 1 Nous divisons le groupe en deux, nous avons n 1 observations dans le groupe 1 et n 2 observations dans le groupe 2. 2 Nous appliquons la méthode MCO sur les n 1 premières observations pour obtenir Á Õ 1 Á qn 1 1 ( Á 2 i ou SSR 1 ). t=1 3 Nous appliquons la méthode MCO sur les n 2 dernières observations pour obtenir Á Õ 2 Á nq 2 ( Á 2 i ou SSR 2). t=n n Nous e ectuons un des deux tests F suivants, selon la forme d hétéroscédasticité que l on suspecte : 21

22 Selon le test e ectué, les statistiques F prendrons alors l une ou l autre des deux formes suivantes : 1 er cas : H 0 : 2 1 = 2 2 H 1 : 2 1 > eme cas : H 0 : 2 1 = 2 2 H 1 : 2 1 < 2 2 F [n 1 k, n 2 k] = ÁÕ 1 Á 1/(n 1 k) Á Õ 2 Á 2/(n 2 k) F n 1 k,n 2 k, F [n 2 k, n 1 k] = ÁÕ 2 Á 2/(n 2 k) Á Õ 1 Á 1/(n 1 k) F n 2 k,n 1 k. Pour augmenter la précision et le pouvoir du test, Goldfed et Quandt suggèrent d omettre une partie de l échantillon située au centre - entre un sixième et un tier de l échantillon. Aussi, le test suppose que la variance de Á est proportionnelle à x i et que l hétéroscédasticité est causée par une seule variable explicative. Avec Stata, nous pouvons suivre les étapes et tester s il y a présence d hétéroscedasticité. Illustrons cela à l aide d un exemple. Exemple d implémentation du test GQ Reprenons la régression (1) pour exprimer ce point. Rappelons nous que le modèle prennait la forme suivant : lwage = femme + 1 educ + Á. Nous soupçonnons qu il y a présence d hétéroscédasticité et que celle-ci provient de la variable educ. Intuitivement, nous pourrions justifier un tel 22

23 soupçon en soulignant qu il serait raisonnable de croire que les gens présentant le plus faible niveau auraient une moins grande variation dans leur salaire que les gens présentant un plus grand nombre d années d éducation. En e et, une plus grande quantité d éducation a générallement un e et positif sur le revenu, mais dans des mesures di érentes selon le domaine d étude. Ainsi, il serait raisonnable de supposer que la volatilité salariale entre les individus croît avec l éducation. Afin de soutenir ou de contredire cette hypothèse, nous e ectuons les régressions pour le début et la fin de l échantillon après avoir ordonné les données par la variable educ. Premièrement, nous ordonnons les données avec la commande sort. Ensuite, nous e ectuons la première régression pour les plus petites valeurs de educ et nous sauvegardons les statistiques nécessaires. 23

24 Puis, pour la deuxième régression (sur les valeurs de educ les plus élevées), nous obtenons le tableau ci-dessous. 24

25 Finalement, nous comparons les deux résultats obtenus et nous les exprimons en utilisant la commande scalarlist. 25

26 Cette valeur doit être confrontée à la valeur de F pour un seuil de significativité donné. Si =0.05, nous avons : Nous voyons que R>F 30,30,0.05 et que nous sommes donc en présence d hétéroscedasticité Test de Breusch-Pagan (BP) Ce test est une alternative intéressante au test GQ. En e et, le test de BP permet, contrairement au test GQ, la présence de plus qu une source d hétéroscédasticité. Nous observons la raison de cela dans l exposition qui suit. Pour obtenir la statistique du test BP, il faut d abord estimer le modèle de régression. Supposons qu il prend la forme y = x x k x k + Á et posons l hypothèse nulle suivante : avec Z i : variables indépendantes. H 0 : 2 i = 2 f( 0 + Õ Z i ) w i (4) Remarque : Si =0, alors le modèle est homoscédastique. Soit Z une matrice de dimension (n (p + 1)) formée des observations (1,Z i ) et soit g, un vecteur de taille (n 1), dont la i eme entrée est donnée par : g i = Á2 i ( Á Õ Á)/n. 26

27 Alors, nous définissons une statistique LM comme : LM = 1 2 [gõ Z(Z Õ Z) 1 Z Õ g] 2 p. Si H 0 est vraie, alors {( =0) = (résidus homoscédastiques)}. En d autres termes, cela signifie que, si =0, alors la variance de Á i sera 2 i = 2 f( 0 ), i œ {1, 2,,n}. Remarques : Ce test est toutefois sensible à l hypothèse de normalité. Le test LM suit une loi Khi-carré avec p degrés de libertés. Dans le chapitre 8 de Wooldridge, il se trouve l explication étape par étape d une version plus pratique pour estimer le test. Avec Stata, nous pouvons performer un test similaire au test de Breusch- Pagan, le test de Cook-Weisberg avec la commande hettest. Nous pouvons rejeter l hypothèse nulle d homoscedasticité. Il faut bien utiliser une correction pour l hétéroscedasticité afin que notre inférence soit valide. 27

28 3.4.3 Test de Koenker Koenker suggère un test basé sur un estimateur plus robuste de la variance de Á 2 i. L hypothèse nulle de ce test est identique à celle de Breusch et Pagan. Tout comme dans l approche précédente, SnousTutilisons un test LM. 1 Soit µ = [ Á 2 1, Á2 2,, Á2 n], µ =( Á Õ 1 Á)/n, i = W X et V, que l on U. V 1 (n 1) définie comme : V = 1 nÿ [( Á 2 i ( Á Õ Á)/n] 2. n i=n Alors, la statistique LM du test de Koenker prend la forme : LM = 1 V (µ µi)õ Z(Z Õ Z) 1 Z Õ ((µ µi) 2 p. Remarque : Ce test est valide même en l abscence de normalité. 3.5 Estimation : Les moindres carrés généralisés (MCG) Nous avons vu que, dans un contexte où (MRL 5) n est pas respectée, les estimés obtenues avec les MCOs ne sont plus BLUE. Dans un tel cas, il est compliqué d utiliser les statistiques t et F, il est donc intéressant de se pencher sur d autres méthodes plus e caces pour estimer les paramètres k. Cette section porte sur une telle procédure, les MCGs ou les moindres carrés généralisés, qui nous permettra (sous certaines conditions) d obtenir des estimateurs BLUE même en présence d hétéroscédasticité. Cas général : Pour i donnée, la variance de Á i est exprimée comme : Var(Á i )= 2 i = 2 w i 28

29 et, par conséquent, Var(Á) = 2, où : S w 1 0 w 2 = W. U.. 0 w n T X. V Soit le modèle : Y = X + Á. Si nous multiplions cette équation par 1/2, nous obtienons : 1/2 Y = 1/2 X + 1/2 Á Y ú = X ú + Á ú, (5) où Y ú 1/2 Y, X ú 1/2 X et Á ú 1/2 Á. On estime ensuite (4) par MCO. L estimateur MCG s écrit alors : MCG = (X úõ X ú ) 1 X úõ Y ú = (X Õ 1 X) 1 X Õ 1 Y. Il faut noter que l estimateur MCG est sans biais (facile à démontrer). Remarque : Puisque est une matrice diagonale, nous avons : S 1 T w = w 2 W. U.. X. V 0 1 w n Dit d une autre manière, l estimateur MCG est obtenu en régressant : S Y 1 / Ô T S w 1 Y 2 / Ô X 1 / Ô T w 1 w 2 P Y = W X U. sur P X 2 / Ô w 2 X = W X Y n / Ô V U.. w n X n / Ô V w n 29

30 En se servant des MCO, nous obtienons ainsi l estimateur MCG : C n D ÿ 1 C n D MCG = w i X i Xi Õ ÿ w i X i Y i. i=1 i=1 En utilisant les MCGs, nous avons Var(Á ú X) =Var(Á ú ). C est-à-dire qu on ne rejette plus (MRL 5) (homoscédasticité). Démonstration : Nous avons : Á ú = 1/2 Á et : E(ÁÁ Õ x) = 2. Ainsi : E(Á ú Á úõ X) = 1/2 E(ÁÁ Õ X) 1/2 = 1/2 E(ÁÁ Õ X) 1/2 = 1/2 2 1/2 = 2. Toute la di culté réside cependant dans l estimation de. Il faut généralement connaître la forme que prend l hétéroscédasticité pour pouvoir utiliser les MCGs. Sous une autre forme, nous avons : Y i = 1 X i0 + 2 X i + Á i, (6) 30

31 où E(Á 2 i )= 2 i = 2 w i. En divisant (5) par Ô w i, nous obtenons : Y i Ô = 1 ( X i0 Ô )+ 2 ( X i Ô )+ Á i Ô. wi wi wi wi Si nous posons que X ú i0 = 1 Ô wi, nous obtienons : Y ú i = 1 X ú i0 + 2 X ú i + Á ú i et la variance de Á ú i, pour i œ {1, 2,,n}, prend la forme : YA B Z ] 2 Var(Á ú i )=E[(Á ú i ) 2 Ái ^ ]=E Ô [ wi \ = 1 w i E(Á 2 i )= 1 w i Var(Á i ) = 1 2 w i w i = 2. 4 Problèmes d endogénéité 4.1 Introduction Dans les hypothèses de base du modèle linéaire, il est nécessaire que les variables explicatives ne soient pas corrélées avec le terme d erreur pour que les estimateurs ne soient pas biaisés. Il existe cependant des cas où nous savons qu une ou plusieurs variables violent cette hypothèse. Cette source d endogénéité peut être causée par : Une variable contenue dans le terme d erreur et corrélée avec une variable explicative incluse dans le modèle (problème de variable omise corrélée avec une variable incluse de la section 1.3.1) Deux variables peuvent se déterminer simultanément, autrement dit, une variable présumée indépendante du modèle détermine une variable 31

32 dépendante ET la même variable présumée indépendante est déterminée par la variable dépendante. x = activite sportive y = poids x y Il peut exister des erreurs de mesures qui sont corrélées avec au moins une caractéristique de l individu. 4.2 Estimation par variables instrumentales L estimation par variables instrumentales est une technique d estimation souvent utilisée en économétrie dont le but est d éliminer le biais des estimateurs (mais, en pratique, elle risque de le réduire). En reprenant le modèle classique nous avons : y i = 1 x i1 + 2 x i k x ik + Á i pour i =1,...,n et avec : E[Á] = 0 Cov(x j, Á) = 0 j = 1,...,k 1 Cov(x k, Á) = 0. La variable x k est corrélée avec le terme d erreur. Nous pouvons voir que les variables explicatives de x 1 à x (k 1) sont exogènes, mais que x k est endogène. Nous prendrons comme exemple le cas où le terme d erreur contient une variable omise corrélée avec x k. Ainsi, tous les sont biaisés. 32

FOAD COURS D ECONOMETRIE 1 CHAPITRE 2 : Hétéroscédasicité des erreurs. 23 mars 2012.

FOAD COURS D ECONOMETRIE 1 CHAPITRE 2 : Hétéroscédasicité des erreurs. 23 mars 2012. FOAD COURS D ECONOMETRIE CHAPITRE 2 : Hétéroscédasicité des erreurs. 23 mars 202. Christine Maurel Maître de conférences en Sciences Economiques Université de Toulouse - Capitole Toulouse School of Economics-ARQADE

Plus en détail

Chapitre 3. Les distributions à deux variables

Chapitre 3. Les distributions à deux variables Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles

Plus en détail

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

L Econométrie des Données de Panel

L Econométrie des Données de Panel Ecole Doctorale Edocif Séminaire Méthodologique L Econométrie des Données de Panel Modèles Linéaires Simples Christophe HURLIN L Econométrie des Données de Panel 2 Figure.: Présentation Le but de ce séminaire

Plus en détail

Le modèle de régression linéaire

Le modèle de régression linéaire Chapitre 2 Le modèle de régression linéaire 2.1 Introduction L économétrie traite de la construction de modèles. Le premier point de l analyse consiste à se poser la question : «Quel est le modèle?». Le

Plus en détail

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques

Plus en détail

Arithmétique binaire. Chapitre. 5.1 Notions. 5.1.1 Bit. 5.1.2 Mot

Arithmétique binaire. Chapitre. 5.1 Notions. 5.1.1 Bit. 5.1.2 Mot Chapitre 5 Arithmétique binaire L es codes sont manipulés au quotidien sans qu on s en rende compte, et leur compréhension est quasi instinctive. Le seul fait de lire fait appel au codage alphabétique,

Plus en détail

Exercice : la frontière des portefeuilles optimaux sans actif certain

Exercice : la frontière des portefeuilles optimaux sans actif certain Exercice : la frontière des portefeuilles optimaux sans actif certain Philippe Bernard Ingénierie Economique & Financière Université Paris-Dauphine Février 0 On considère un univers de titres constitué

Plus en détail

Exo7. Matrice d une application linéaire. Corrections d Arnaud Bodin.

Exo7. Matrice d une application linéaire. Corrections d Arnaud Bodin. Exo7 Matrice d une application linéaire Corrections d Arnaud odin. Exercice Soit R muni de la base canonique = ( i, j). Soit f : R R la projection sur l axe des abscisses R i parallèlement à R( i + j).

Plus en détail

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p. STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,

Plus en détail

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES LES STATISTIQUES INFERENTIELLES (test de Student) L inférence statistique est la partie des statistiques qui, contrairement à la statistique descriptive, ne se contente pas de décrire des observations,

Plus en détail

Régression linéaire. Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr

Régression linéaire. Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr Régression linéaire Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr 2005 Plan Régression linéaire simple Régression multiple Compréhension de la sortie de la régression Coefficient de détermination R

Plus en détail

NON-LINEARITE ET RESEAUX NEURONAUX

NON-LINEARITE ET RESEAUX NEURONAUX NON-LINEARITE ET RESEAUX NEURONAUX Vêlayoudom MARIMOUTOU Laboratoire d Analyse et de Recherche Economiques Université de Bordeaux IV Avenue. Leon Duguit, 33608 PESSAC, France tel. 05 56 84 85 77 e-mail

Plus en détail

1 Complément sur la projection du nuage des individus

1 Complément sur la projection du nuage des individus TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent

Plus en détail

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé Baccalauréat S ntilles-guyane 11 septembre 14 Corrigé EXERCICE 1 6 points Commun à tous les candidats Une entreprise de jouets en peluche souhaite commercialiser un nouveau produit et à cette fin, effectue

Plus en détail

Les indices à surplus constant

Les indices à surplus constant Les indices à surplus constant Une tentative de généralisation des indices à utilité constante On cherche ici en s inspirant des indices à utilité constante à définir un indice de prix de référence adapté

Plus en détail

INF6304 Interfaces Intelligentes

INF6304 Interfaces Intelligentes INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie

Plus en détail

Chapitre 2 Le problème de l unicité des solutions

Chapitre 2 Le problème de l unicité des solutions Université Joseph Fourier UE MAT 127 Mathématiques année 2011-2012 Chapitre 2 Le problème de l unicité des solutions Ce que nous verrons dans ce chapitre : un exemple d équation différentielle y = f(y)

Plus en détail

Évaluation de la régression bornée

Évaluation de la régression bornée Thierry Foucart UMR 6086, Université de Poitiers, S P 2 M I, bd 3 téléport 2 BP 179, 86960 Futuroscope, Cedex FRANCE Résumé. le modèle linéaire est très fréquemment utilisé en statistique et particulièrement

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

1 Définition de la non stationnarité

1 Définition de la non stationnarité Chapitre 2: La non stationnarité -Testsdedétection Quelques notes de cours (non exhaustives) 1 Définition de la non stationnarité La plupart des séries économiques sont non stationnaires, c est-à-direqueleprocessusquiles

Plus en détail

Leçon N 4 : Statistiques à deux variables

Leçon N 4 : Statistiques à deux variables Leçon N 4 : Statistiques à deux variables En premier lieu, il te faut relire les cours de première sur les statistiques à une variable, il y a tout un langage à se remémorer : étude d un échantillon d

Plus en détail

La demande Du consommateur. Contrainte budgétaire Préférences Choix optimal

La demande Du consommateur. Contrainte budgétaire Préférences Choix optimal La demande Du consommateur Contrainte budgétaire Préférences Choix optimal Plan du cours Préambule : Rationalité du consommateur I II III IV V La contrainte budgétaire Les préférences Le choix optimal

Plus en détail

UNIVERSITÉ DU QUÉBEC À MONTRÉAL TESTS EN ÉCHANTILLONS FINIS DU MEDAF SANS LA NORMALITÉ ET SANS LA CONVERGENCE

UNIVERSITÉ DU QUÉBEC À MONTRÉAL TESTS EN ÉCHANTILLONS FINIS DU MEDAF SANS LA NORMALITÉ ET SANS LA CONVERGENCE UNIVERSITÉ DU QUÉBEC À MONTRÉAL TESTS EN ÉCHANTILLONS FINIS DU MEDAF SANS LA NORMALITÉ ET SANS LA CONVERGENCE MÉMOIRE PRÉSENTÉ COMME EXIGENCE PARTIELLE DE LA MAÎTRISE EN ÉCONOMIE PAR MATHIEU SISTO NOVEMBRE

Plus en détail

Suites numériques 3. 1 Convergence et limite d une suite

Suites numériques 3. 1 Convergence et limite d une suite Suites numériques 3 1 Convergence et limite d une suite Nous savons que les termes de certaines suites s approchent de plus en plus d une certaine valeur quand n augmente : par exemple, les nombres u n

Plus en détail

Trépier avec règle, ressort à boudin, chronomètre, 5 masses de 50 g.

Trépier avec règle, ressort à boudin, chronomètre, 5 masses de 50 g. PHYSQ 130: Hooke 1 LOI DE HOOKE: CAS DU RESSORT 1 Introduction La loi de Hooke est fondamentale dans l étude du mouvement oscillatoire. Elle est utilisée, entre autres, dans les théories décrivant les

Plus en détail

Etude de fonctions: procédure et exemple

Etude de fonctions: procédure et exemple Etude de fonctions: procédure et exemple Yves Delhaye 8 juillet 2007 Résumé Dans ce court travail, nous présentons les différentes étapes d une étude de fonction à travers un exemple. Nous nous limitons

Plus en détail

Examen de Logiciels Statistiques

Examen de Logiciels Statistiques G. Hunault Angers, mai 2011 Licence MEF Examen de Logiciels Statistiques On s intéresse ici au dossier EAEF01 qui contient un extrait des données du recensement américain. On trouvera ces données et leur

Plus en détail

3. Conditionnement P (B)

3. Conditionnement P (B) Conditionnement 16 3. Conditionnement Dans cette section, nous allons rappeler un certain nombre de définitions et de propriétés liées au problème du conditionnement, c est à dire à la prise en compte

Plus en détail

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes. Promotion X 004 COURS D ANALYSE DES STRUCTURES MÉCANIQUES PAR LA MÉTHODE DES ELEMENTS FINIS (MEC 568) contrôle non classant (7 mars 007, heures) Documents autorisés : polycopié ; documents et notes de

Plus en détail

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et

Plus en détail

Relation entre deux variables : estimation de la corrélation linéaire

Relation entre deux variables : estimation de la corrélation linéaire CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence

Plus en détail

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,

Plus en détail

Master 2: Econométrie 2

Master 2: Econométrie 2 Master 2: Econométrie 2 Partie 1 Michel BEINE michel.beine@uni.lu Université du Luxembourg Master 2: Econométrie 2 p. 1/22 Manuel La partie économétrique du cours est basé sur le livre Introductory Econometrics,

Plus en détail

Exercices - Fonctions de plusieurs variables : corrigé. Pour commencer

Exercices - Fonctions de plusieurs variables : corrigé. Pour commencer Pour commencer Exercice 1 - Ensembles de définition - Première année - 1. Le logarithme est défini si x + y > 0. On trouve donc le demi-plan supérieur délimité par la droite d équation x + y = 0.. 1 xy

Plus en détail

ÉPREUVE COMMUNE DE TIPE 2008 - Partie D

ÉPREUVE COMMUNE DE TIPE 2008 - Partie D ÉPREUVE COMMUNE DE TIPE 2008 - Partie D TITRE : Les Fonctions de Hachage Temps de préparation :.. 2 h 15 minutes Temps de présentation devant le jury :.10 minutes Entretien avec le jury :..10 minutes GUIDE

Plus en détail

3 Approximation de solutions d équations

3 Approximation de solutions d équations 3 Approximation de solutions d équations Une équation scalaire a la forme générale f(x) =0où f est une fonction de IR dans IR. Un système de n équations à n inconnues peut aussi se mettre sous une telle

Plus en détail

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA

Plus en détail

Couples de variables aléatoires discrètes

Couples de variables aléatoires discrètes Couples de variables aléatoires discrètes ECE Lycée Carnot mai Dans ce dernier chapitre de probabilités de l'année, nous allons introduire l'étude de couples de variables aléatoires, c'est-à-dire l'étude

Plus en détail

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

Probabilités sur un univers fini

Probabilités sur un univers fini [http://mp.cpgedupuydelome.fr] édité le 10 août 2015 Enoncés 1 Proailités sur un univers fini Evènements et langage ensemliste A quelle condition sur (a,, c, d) ]0, 1[ 4 existe-t-il une proailité P sur

Plus en détail

Exo7. Calculs de déterminants. Fiche corrigée par Arnaud Bodin. Exercice 1 Calculer les déterminants des matrices suivantes : Exercice 2.

Exo7. Calculs de déterminants. Fiche corrigée par Arnaud Bodin. Exercice 1 Calculer les déterminants des matrices suivantes : Exercice 2. Eo7 Calculs de déterminants Fiche corrigée par Arnaud Bodin Eercice Calculer les déterminants des matrices suivantes : Correction Vidéo ( ) 0 6 7 3 4 5 8 4 5 6 0 3 4 5 5 6 7 0 3 5 4 3 0 3 0 0 3 0 0 0 3

Plus en détail

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3

Plus en détail

Chapitre 1. L intérêt. 2. Concept d intérêt. 1. Mise en situation. Au terme de ce chapitre, vous serez en mesure de :

Chapitre 1. L intérêt. 2. Concept d intérêt. 1. Mise en situation. Au terme de ce chapitre, vous serez en mesure de : Chapitre 1 L intérêt Au terme de ce chapitre, vous serez en mesure de : 1. Comprendre la notion générale d intérêt. 2. Distinguer la capitalisation à intérêt simple et à intérêt composé. 3. Calculer la

Plus en détail

Mesure, impact des politiques et estimation. Programme de formation MIMAP. Remerciements

Mesure, impact des politiques et estimation. Programme de formation MIMAP. Remerciements Pauvreté, bienêtre social et équité : Mesure, impact des politiques et estimation par JeanYves Duclos Département d économique et CRÉFACIRPÉE, Université Laval, Canada Programme de formation MIMAP Remerciements

Plus en détail

Théorie des sondages : cours 5

Théorie des sondages : cours 5 Théorie des sondages : cours 5 Camelia Goga IMB, Université de Bourgogne e-mail : camelia.goga@u-bourgogne.fr Master Besançon-2010 Chapitre 5 : Techniques de redressement 1. poststratification 2. l estimateur

Plus en détail

Correction de l examen de la première session

Correction de l examen de la première session de l examen de la première session Julian Tugaut, Franck Licini, Didier Vincent Si vous trouvez des erreurs de Français ou de mathématiques ou bien si vous avez des questions et/ou des suggestions, envoyez-moi

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

Le Modèle Linéaire par l exemple :

Le Modèle Linéaire par l exemple : Publications du Laboratoire de Statistique et Probabilités Le Modèle Linéaire par l exemple : Régression, Analyse de la Variance,... Jean-Marc Azaïs et Jean-Marc Bardet Laboratoire de Statistique et Probabilités

Plus en détail

Cours 02 : Problème général de la programmation linéaire

Cours 02 : Problème général de la programmation linéaire Cours 02 : Problème général de la programmation linéaire Cours 02 : Problème général de la Programmation Linéaire. 5 . Introduction Un programme linéaire s'écrit sous la forme suivante. MinZ(ou maxw) =

Plus en détail

Premier modèle - Version simple

Premier modèle - Version simple Chapitre 1 Premier modèle - Version simple Les individus vivent chacun six générations successives d adultes, chacune d une durée de dix ans, sans distinction faite entre les individus d une même génération.

Plus en détail

Formations EViews FORMATIONS GENERALES INTRODUCTIVES INTRO : INTRODUCTION A LA PRATIQUE DE L ECONOMETRIE AVEC EVIEWS

Formations EViews FORMATIONS GENERALES INTRODUCTIVES INTRO : INTRODUCTION A LA PRATIQUE DE L ECONOMETRIE AVEC EVIEWS Formations EViews FORMATIONS GENERALES INTRODUCTIVES DEB : DECOUVERTE DU LOGICIEL EVIEWS INTRO : INTRODUCTION A LA PRATIQUE DE L ECONOMETRIE AVEC EVIEWS FORMATIONS METHODES ECONOMETRIQUES VAR : MODELES

Plus en détail

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent

Plus en détail

CHAPITRE V SYSTEMES DIFFERENTIELS LINEAIRES A COEFFICIENTS CONSTANTS DU PREMIER ORDRE. EQUATIONS DIFFERENTIELLES.

CHAPITRE V SYSTEMES DIFFERENTIELS LINEAIRES A COEFFICIENTS CONSTANTS DU PREMIER ORDRE. EQUATIONS DIFFERENTIELLES. CHAPITRE V SYSTEMES DIFFERENTIELS LINEAIRES A COEFFICIENTS CONSTANTS DU PREMIER ORDRE EQUATIONS DIFFERENTIELLES Le but de ce chapitre est la résolution des deux types de systèmes différentiels linéaires

Plus en détail

Impact du mobile banking sur les comportements d épargne et de transferts à Madagascar. Florence Arestoff Baptiste Venet

Impact du mobile banking sur les comportements d épargne et de transferts à Madagascar. Florence Arestoff Baptiste Venet Impact du mobile banking sur les comportements d épargne et de transferts à Madagascar Florence Arestoff Baptiste Venet 1 Introduction : contexte du contrat de recherche Ce contrat de recherche fait suite

Plus en détail

Probabilités sur un univers fini

Probabilités sur un univers fini [http://mp.cpgedupuydelome.fr] édité le 7 août 204 Enoncés Probabilités sur un univers fini Evènements et langage ensembliste A quelle condition sur (a, b, c, d) ]0, [ 4 existe-t-il une probabilité P sur

Plus en détail

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications A. Optimisation sans contrainte.... Généralités.... Condition nécessaire et condition suffisante

Plus en détail

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION Bruno Saussereau Laboratoire de Mathématiques de Besançon Université de Franche-Comté Travail en commun

Plus en détail

Optimisation, traitement d image et éclipse de Soleil

Optimisation, traitement d image et éclipse de Soleil Kléber, PCSI1&3 014-015 I. Introduction 1/8 Optimisation, traitement d image et éclipse de Soleil Partie I Introduction Le 0 mars 015 a eu lieu en France une éclipse partielle de Soleil qu il était particulièrement

Plus en détail

Les incitations fiscales aux dons sont-elles efficaces?

Les incitations fiscales aux dons sont-elles efficaces? ÉCONOMIE Les incitations fiscales aux dons sont-elles efficaces? Gabrielle Fack* et Camille Landais** Cet article est consacré à l estimation de l effet des incitations fiscales en faveur des dons aux

Plus en détail

Fonctions de plusieurs variables

Fonctions de plusieurs variables Module : Analyse 03 Chapitre 00 : Fonctions de plusieurs variables Généralités et Rappels des notions topologiques dans : Qu est- ce que?: Mathématiquement, n étant un entier non nul, on définit comme

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

Calcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes.

Calcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes. 1 Définitions, notations Calcul matriciel Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes. On utilise aussi la notation m n pour le

Plus en détail

Fonctions de deux variables. Mai 2011

Fonctions de deux variables. Mai 2011 Fonctions de deux variables Dédou Mai 2011 D une à deux variables Les fonctions modèlisent de l information dépendant d un paramètre. On a aussi besoin de modéliser de l information dépendant de plusieurs

Plus en détail

Données longitudinales et modèles de survie

Données longitudinales et modèles de survie ANALYSE DU Données longitudinales et modèles de survie 5. Modèles de régression en temps discret André Berchtold Département des sciences économiques, Université de Genève Cours de Master ANALYSE DU Plan

Plus en détail

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I Roxane Duroux 1 Cadre de l étude Cette étude s inscrit dans le cadre de recherche de doses pour des essais cliniques

Plus en détail

STATISTIQUES. UE Modélisation pour la biologie

STATISTIQUES. UE Modélisation pour la biologie STATISTIQUES UE Modélisation pour la biologie 2011 Cadre Général n individus: 1, 2,..., n Y variable à expliquer : Y = (y 1, y 2,..., y n ), y i R Modèle: Y = Xθ + ε X matrice du plan d expériences θ paramètres

Plus en détail

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée. ANALYSE 5 points Exercice 1 : Léonie souhaite acheter un lecteur MP3. Le prix affiché (49 ) dépasse largement la somme dont elle dispose. Elle décide donc d économiser régulièrement. Elle a relevé qu elle

Plus en détail

Chapitre 7. Récurrences

Chapitre 7. Récurrences Chapitre 7 Récurrences 333 Plan 1. Introduction 2. Applications 3. Classification des récurrences 4. Résolution de récurrences 5. Résumé et comparaisons Lectures conseillées : I MCS, chapitre 20. I Rosen,

Plus en détail

CONSEILS POUR LA REDACTION DU RAPPORT DE RECHERCHE. Information importante : Ces conseils ne sont pas exhaustifs!

CONSEILS POUR LA REDACTION DU RAPPORT DE RECHERCHE. Information importante : Ces conseils ne sont pas exhaustifs! CONSEILS POUR LA REDACTION DU RAPPORT DE RECHERCHE Information importante : Ces conseils ne sont pas exhaustifs! Conseils généraux : Entre 25 et 60 pages (hormis références, annexes, résumé) Format d un

Plus en détail

Quelles sont les entreprises qui ont recours au commerce électronique?

Quelles sont les entreprises qui ont recours au commerce électronique? Nicolas POUSSING Anne-Sophie GENEVOIS octobre 2003 Quelles sont les entreprises qui ont recours au commerce électronique? Dans le cadre du projet «eeurope 2002», une enquête communautaire intitulée «E-commerce

Plus en détail

Cours 9 : Plans à plusieurs facteurs

Cours 9 : Plans à plusieurs facteurs Cours 9 : Plans à plusieurs facteurs Table des matières Section 1. Diviser pour regner, rassembler pour saisir... 3 Section 2. Définitions et notations... 3 2.1. Définitions... 3 2.2. Notations... 4 Section

Plus en détail

Gestion obligataire passive

Gestion obligataire passive Finance 1 Université d Evry Séance 7 Gestion obligataire passive Philippe Priaulet L efficience des marchés Stratégies passives Qu est-ce qu un bon benchmark? Réplication simple Réplication par échantillonnage

Plus en détail

Bien lire l énoncé 2 fois avant de continuer - Méthodes et/ou Explications Réponses. Antécédents d un nombre par une fonction

Bien lire l énoncé 2 fois avant de continuer - Méthodes et/ou Explications Réponses. Antécédents d un nombre par une fonction Antécédents d un nombre par une fonction 1) Par lecture graphique Méthode / Explications : Pour déterminer le ou les antécédents d un nombre a donné, on trace la droite (d) d équation. On lit les abscisses

Plus en détail

Exercices - Nombres complexes : corrigé. Formes algébriques et trigonométriques, module et argument

Exercices - Nombres complexes : corrigé. Formes algébriques et trigonométriques, module et argument Formes algébriques et trigonométriques, module et argument Exercice - - L/Math Sup - On multiplie le dénominateur par sa quantité conjuguée, et on obtient : Z = 4 i 3 + i 3 i 3 = 4 i 3 + 3 = + i 3. Pour

Plus en détail

Statistique Descriptive Élémentaire

Statistique Descriptive Élémentaire Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Élémentaire (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219 Université Paul Sabatier

Plus en détail

Analyse en Composantes Principales

Analyse en Composantes Principales Analyse en Composantes Principales Anne B Dufour Octobre 2013 Anne B Dufour () Analyse en Composantes Principales Octobre 2013 1 / 36 Introduction Introduction Soit X un tableau contenant p variables mesurées

Plus en détail

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels Etab=MK3, Timbre=G430, TimbreDansAdresse=Vrai, Version=W2000/Charte7, VersionTravail=W2000/Charte7 Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

Plus en détail

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine

Plus en détail

Programmation linéaire et Optimisation. Didier Smets

Programmation linéaire et Optimisation. Didier Smets Programmation linéaire et Optimisation Didier Smets Chapitre 1 Un problème d optimisation linéaire en dimension 2 On considère le cas d un fabricant d automobiles qui propose deux modèles à la vente, des

Plus en détail

Résolution de systèmes linéaires par des méthodes directes

Résolution de systèmes linéaires par des méthodes directes Résolution de systèmes linéaires par des méthodes directes J. Erhel Janvier 2014 1 Inverse d une matrice carrée et systèmes linéaires Ce paragraphe a pour objet les matrices carrées et les systèmes linéaires.

Plus en détail

Théorie et codage de l information

Théorie et codage de l information Théorie et codage de l information Les codes linéaires - Chapitre 6 - Principe Définition d un code linéaire Soient p un nombre premier et s est un entier positif. Il existe un unique corps de taille q

Plus en détail

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Recherche opérationnelle Les démonstrations et les exemples seront traités en cours Souad EL Bernoussi Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Table des matières 1 Programmation

Plus en détail

CHAPITRE 10. Jacobien, changement de coordonnées.

CHAPITRE 10. Jacobien, changement de coordonnées. CHAPITRE 10 Jacobien, changement de coordonnées ans ce chapitre, nous allons premièrement rappeler la définition du déterminant d une matrice Nous nous limiterons au cas des matrices d ordre 2 2et3 3,

Plus en détail

aux différences est appelé équation aux différences d ordre n en forme normale.

aux différences est appelé équation aux différences d ordre n en forme normale. MODÉLISATION ET SIMULATION EQUATIONS AUX DIFFÉRENCES (I/II) 1. Rappels théoriques : résolution d équations aux différences 1.1. Équations aux différences. Définition. Soit x k = x(k) X l état scalaire

Plus en détail

Principe de symétrisation pour la construction d un test adaptatif

Principe de symétrisation pour la construction d un test adaptatif Principe de symétrisation pour la construction d un test adaptatif Cécile Durot 1 & Yves Rozenholc 2 1 UFR SEGMI, Université Paris Ouest Nanterre La Défense, France, cecile.durot@gmail.com 2 Université

Plus en détail

Classification non supervisée

Classification non supervisée AgroParisTech Classification non supervisée E. Lebarbier, T. Mary-Huard Table des matières 1 Introduction 4 2 Méthodes de partitionnement 5 2.1 Mesures de similarité et de dissimilarité, distances.................

Plus en détail

Chapitre 3. Quelques fonctions usuelles. 1 Fonctions logarithme et exponentielle. 1.1 La fonction logarithme

Chapitre 3. Quelques fonctions usuelles. 1 Fonctions logarithme et exponentielle. 1.1 La fonction logarithme Chapitre 3 Quelques fonctions usuelles 1 Fonctions logarithme et eponentielle 1.1 La fonction logarithme Définition 1.1 La fonction 7! 1/ est continue sur ]0, +1[. Elle admet donc des primitives sur cet

Plus en détail

Exercices - Polynômes : corrigé. Opérations sur les polynômes

Exercices - Polynômes : corrigé. Opérations sur les polynômes Opérations sur les polynômes Exercice 1 - Carré - L1/Math Sup - Si P = Q est le carré d un polynôme, alors Q est nécessairement de degré, et son coefficient dominant est égal à 1. On peut donc écrire Q(X)

Plus en détail

MODELE A CORRECTION D ERREUR ET APPLICATIONS

MODELE A CORRECTION D ERREUR ET APPLICATIONS MODELE A CORRECTION D ERREUR ET APPLICATIONS Hélène HAMISULTANE Bibliographie : Bourbonnais R. (2000), Econométrie, DUNOD. Lardic S. et Mignon V. (2002), Econométrie des Séries Temporelles Macroéconomiques

Plus en détail

Que faire lorsqu on considère plusieurs variables en même temps?

Que faire lorsqu on considère plusieurs variables en même temps? Chapitre 3 Que faire lorsqu on considère plusieurs variables en même temps? On va la plupart du temps se limiter à l étude de couple de variables aléatoires, on peut bien sûr étendre les notions introduites

Plus en détail

PEUT-ON «VOIR» DANS L ESPACE À N DIMENSIONS?

PEUT-ON «VOIR» DANS L ESPACE À N DIMENSIONS? PEUT-ON «VOIR» DANS L ESPACE À N DIMENSIONS? Pierre Baumann, Michel Émery Résumé : Comment une propriété évidente visuellement en dimensions deux et trois s étend-elle aux autres dimensions? Voici une

Plus en détail

CONSOMMATION INTERTEMPORELLE & MARCHE FINANCIER. Epargne et emprunt Calcul actuariel

CONSOMMATION INTERTEMPORELLE & MARCHE FINANCIER. Epargne et emprunt Calcul actuariel CONSOMMATION INTERTEMPORELLE & MARCHE FINANCIER Epargne et emprunt Calcul actuariel Plan du cours Préambule : la contrainte budgétaire intertemporelle et le calcul actuariel I II III Demandes d épargne

Plus en détail

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI 1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage

Plus en détail

Théorème du point fixe - Théorème de l inversion locale

Théorème du point fixe - Théorème de l inversion locale Chapitre 7 Théorème du point fixe - Théorème de l inversion locale Dans ce chapitre et le suivant, on montre deux applications importantes de la notion de différentiabilité : le théorème de l inversion

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

Etude des propriétés empiriques du lasso par simulations

Etude des propriétés empiriques du lasso par simulations Etude des propriétés empiriques du lasso par simulations L objectif de ce TP est d étudier les propriétés empiriques du LASSO et de ses variantes à partir de données simulées. Un deuxième objectif est

Plus en détail

Rapport sur. La situation financière de l ensemble des retraités Québécois et des secteurs public et parapublic du Québec

Rapport sur. La situation financière de l ensemble des retraités Québécois et des secteurs public et parapublic du Québec Rapport sur La situation financière de l ensemble des retraités Québécois et des secteurs public et parapublic du Québec François Vaillancourt CIRANO et Université de Montréal et Viorela Diaconu Université

Plus en détail

= 1 si n = m& où n et m sont souvent des indices entiers, par exemple, n, m = 0, 1, 2, 3, 4... En fait,! n m

= 1 si n = m& où n et m sont souvent des indices entiers, par exemple, n, m = 0, 1, 2, 3, 4... En fait,! n m 1 épartement de Physique, Université Laval, Québec Pierre Amiot, 1. La fonction delta et certaines de ses utilisations. Clientèle Ce texte est destiné aux physiciens, ingénieurs et autres scientifiques.

Plus en détail

Chapitre 0 Introduction à la cinématique

Chapitre 0 Introduction à la cinématique Chapitre 0 Introduction à la cinématique Plan Vitesse, accélération Coordonnées polaires Exercices corrigés Vitesse, Accélération La cinématique est l étude du mouvement Elle suppose donc l existence à

Plus en détail