ECONOMETRIE APPLIQUEE A LA GESTION Titulaire : Catherine DEHON

Dimension: px
Commencer à balayer dès la page:

Download "ECONOMETRIE APPLIQUEE A LA GESTION Titulaire : Catherine DEHON"

Transcription

1 Année académique STAT-S-308 ECONOMETRIE APPLIQUEE A LA GESTION Titulaire : Catherine DEHON Exercices (Partie informatique) : 1 ère Partie : Régression multiple 2 ème Partie : Séries Chronologiques 3 ème Partie : Modèles Logit et Probit Assistants : Alice McCathie Benoît Dewaele 1

2 Exercice 1- Le prix des Maisons REGRESSION MULTIPLE Considérons les données suivantes relatives au prix d'achat de maisons en fonction de différentes variables (cf légende ci-dessous). PRICE BDR FLR FP RMS ST LOT BTH GAR PRICE = Prix de vente de la maison en milliers de dollars, BDR = Nombre de chambres à coucher, FLR = Superficie totale (calculée à partir des dimensions de chaque pièce et augmentée de 10%, calculée en pieds carrés), FP = nombre de cheminées, RMS = nombre de pièces, ST = fenêtres tempêtes (1 si oui, 0 sinon), LOT = largeur de facade (en pieds), BTH = nombre de salles de bains, GAR = taille du garage (0 si pas de garage, 1 si un garage pour 1 voiture,...), (Source : Mr. Terry Tasch of Long-Kogan Realty, Chicago reproduced in A., Sen and M. Srivastava, Regression analysis. Theory, Method, and Applications, Springer Verlag 1990, p. 32) 2

3 Questions: 1. Ecrivez l équation du modèle. ESTIMATION 2. Donnez les estimations des paramètres du modèle et interprétez. 3. Estimez le prix de vente moyen d une maison de mille pieds carrés en surface habitable, 40 pieds de façade, 8 pièces, 4 chambres à coucher, 2 salles de bains, avec volets, avec un garage pour une voiture et sans cheminée. 4. Quel serait le coût moyen estimé d une place supplémentaire dans le garage, toutes choses restant égales par ailleurs. 5. Quel serait le coût moyen estimé d une augmentation de 1 pied carré de surface habitable, toutes choses restant égales par ailleurs. 6. Discutez le signe du coefficient associé à la variable BDR. 7. Interprétez la valeur du coefficient associé à la variable ST. 8. Examinez brièvement les sorties graphiques concernant les résidus et détectez d éventuelles violations des hypothèses classiques. TESTS ET INTERVALLES DE CONFIANCE (niveau 5 %) 9. Testez l hypothèse que l ensemble des variables retenues dans ce modèle n ont aucun effet sur le prix de vente d une maison. 10. Testez indépendamment les hypothèses de nullité de chacun des coefficients de régression du modèle. Que représente les valeurs dans la colonne 2-tail signification? 11. Proposez un modèle en ne retenant que les variables dont les coefficients de régression du modèle ci-dessus sont significativement différents de zéro. Pensez-vous que tous les coefficients de ce nouveau modèle seront tous significativement différents de zéro? 12. Donnez un intervalle de confiance approximatif pour chaque coefficient du modèle indépendamment. 3

4 Exercice 2- Le prix des MBA Une problématique importante liée aux programmes MBA est l'absence de régulation étatique dans ce secteur. En effet, le seul organe jouant ce rôle est l'aacsb (the Association to Advance Collegiate Schools of Business) qui n'a pas pour rôle de faire appliquer des règles, mais seulement d'informer le public de certains critères considérés comme essentiels. Il en résulte donc une grande diversité dans les méthodes, les cours et les objectifs des différents MBA. Quels sont donc les facteurs qui permettent d expliquer les prix des MBA? La base de données MBA.txt va vous permettre d'étudier les caractéristiques qui expliquent la formation des prix des Masters in Business Administration (MBA) à travers le monde. Les variables sont les suivantes: 1. NOM : nom de l université. 2. MIN : prix d inscription à charge de l étudiant pour la totalité du MBA. (VARIABLE REPONSE) 3. Variables des régions (US, EU et RDM) : variables binaires qui vaut 1 si l université se trouve aux Etats-Unis, en Europe ou dans le reste du monde respectivement. 4. AASCB : variable binaire égale à 1 si le programme MBA est accrédité par cette association. 5. NBRETUD : nombre d étudiants inscrits dans le programme MBA de l université. 6. TYPEE : variable binaire égale à 1 si l institution qui organise le programme est privée et 0 si elle est publique. 7. DCP : année de création des différentes institutions universitaires. 8. PF : pourcentage d étudiants de sexe féminin présents au programme par rapport au total d étudiants inscrits. 9. PE : pourcentage d étudiants étrangers présents au programme par rapport au total d étudiants inscrits. 10. AGE : âge moyen des étudiants participant au programme. 11. GMIN : score minimum au GMAT 1 demandé comme critère d admission. Note : Dans la base figure aussi les variables quantitatives transformées en ln. 1 Le Graduate Management Admission Test (GMAT) est un examen en anglais qui mesure les compétences et qui sert à tester l aptitude à étudier le management 4

5 Questions: 1. Ecrivez l équation du modèle complet (sans le nom de l université). Avant de travailler sur les données, proposez un signe pour chacun des paramètres de régression. Expliquez très brièvement pourquoi vous attendez-vous à obtenir ces signes. 2. Importez les données dans SAS. Pourquoi effectuer la régression avec les variables en log? Comment interpréter la valeur du coefficient dans ce modèle où les variables quantitatives sont toutes exprimées en log (modèle log-log)? 3. A l aide de SAS, effectuez la régression du modèle Comparez les signes des coefficients à votre réponse à la question 1. Expliquez brièvement si vous pensez qu il est possible que notre modèle ait des problèmes de multicolinearité. 4. Testez l'hypothèse que l'ensemble des variables retenues dans le dernier modèle n'ont aucun effet sur la formation des prix des MBA 5. Construisez un nouveau modèle en utilisant la méthode «step-by-step» vue au cours théorique. Est-ce que les variables éliminées sont les mêmes que vous auriez éliminé intuitivement? Si non, est-ce que vous les élimineriez quand même? 6. Utilisez les méthodes graphiques pour vérifier les hypothèses classiques sur les erreurs. 7. Effectuez une analyse des résultats de la dernière régression estimée (valeur et signe des 2 coefficients, interprétation, pertinence des variables, R et R 2 ajusté). 8. En vous basant sur le modèle obtenu au point 6, estimez le prix d un MBA avec les caractéristiques suivantes : université européenne privée, non affiliée à l AASCB, avec 300 étudiants d une moyenne d âge de 29 ans, avec 30% sont étrangers et dont le GMAT min demandé est de 500 points. 5

6 Exercice 3- Les meurtres aux USA Le fichier DEMO.TXT contient des données démographiques éparses concernant es 50 états américains. Les données sont organisées de la manière suivante : HS : nombres de diplômés d école supérieure par 1000, CR : taux de criminalité par habitants, MT : nombre de meurtres par habitants, PR : nombre de prisonniers par habitants, RP : pourcentage de votants pour le candidat républicain aux élections présidentielles, VT : taux de participation aux élections présidentielles parmi les personnes en âge de voter, PH : nombre de raccordements téléphoniques par 100 habitants (1979), INC : revenu moyen par individu en dollars en 1972, PL : fraction de la population en dessous du seuil de pauvreté. Si non stipulé, ces données sont relatives à l année Source Sen and Srivastava. i.d. pp Questions: 1. Récupérez les données, contenues dans un fichier TXT, dans le logiciel SAS. 2. Faites une régression multiple avec MT comme variable dépendante et inclure toutes les variables indépendantes. Commentez les résultats obtenus. Certaines des variables indépendantes ont peut-être peu d effet sur MT ou mesurent essentiellement le même effet (redondance). Si vous détectez de telles variables, supprimez-les et refaites tourner le modèle. 3. Essayez le modèle MT en fonction de INC, PL et VT. Comparez les résultats avec les précédents. Pouvez-vous expliquer ce que vous observez? 6

7 Exercice 4- Le trafic de véhicules On désire étudier la relation qui existe entre la vitesse moyenne d un flot de véhicules et la densité du trafic sur une route donnée. Les données sont fournies dans le tableau suivant: Densité du trafic (véhicules / minute) Vitesse moyenne (miles / heure) A l aide du logiciel SAS, proposez une relation permettant de modéliser la vitesse uniquement en fonction de la densité du trafic. Questions: 1. Estimez le modèle : vitesse = β 0 + β 1 densité. Examinez les résidus à la lumière des hypothèses classiques. 2. Estimez le modèle : vitesse = β 0 + β 1 densité + β 2 densité 2. Comparez ce modèle au précédent. Examinez les résidus, en particulier l hypothèse d homoscédasticité. 3. Examinez l effet au niveau des résidus des transformations stabilisatrices de variance suivantes : a) y log(y) b) y y Faites un choix entre les deux transformations ou, au besoin, proposez une transformation alternative. 4. Proposez une relation entre la vitesse et la densité du trafic. 7

8 Exercice 5- Les appareils électroménagers (supplémentaire) Un fabriquant d appareils ménagers souhaiterait analyser la relation entre ses ventes totales et les budgets publicitaires relatifs aux trois types de médias (télévision, radio et magazines). Les 3 premières colonnes du tableau suivant contiennent les budgets publicitaires, par type, pour 10 périodes sélectionnées au hasard. La quatrième colonne contient les ventes totales. Toutes les données sont exprimées en millions de dollars. TV MAG RAD VENTES Nous proposons d effectuer une analyse de régression, avec l aide du logiciel SAS, où les budgets publicitaires de télévision (TV), magazine (MAG), et radio (RD) seront considérés comme régresseurs (variables explicatives), et les ventes (VEN) comme variable dépendante. Supposons que les variables prises en considération satisfont aux conditions classiques. Questions: 1. Effectuez la régression et interprétez les résultats obtenus. 2. Donnez l écart-type (standard erreur) des estimateurs et interprétez. 3. Au seuil de signification 5%, est-ce que le modèle choisi, basé sur les 3 variables TV, RAD et MAG, explique correctement les ventes? (soyez précis dans votre réponse) 4. Mêmes questions que précédemment si on ne considère que la variable TEL. 4. Mêmes questions que précédemment si on ne considère que la variable RAD. 5. Donnez une estimation de la moyenne des ventes si on suppose que les dépenses publicitaires sont respectivement de $9.5 millions pour TV, de $4.3 millions pour MAG et de $5.2 millions pour RAD. 6. Donnez un intervalle de confiance, au niveau 5%, pour les ventes moyennes quand les dépenses publicitaires sont respectivement de $9.5 millions pour TV, de $4.3 millions pour MAG et de $5.2 millions pour RAD. 7. Déterminez la prévision de ventes quand les dépenses publicitaires sont respectivement de $9.5 millions pour TV, de $4.3 millions pour MAG et de $5.2 millions pour RAD. 8. Donnez un intervalle de prévision, au niveau 5%, pour les ventes, quand les dépenses publicitaires sont respectivement de $9.5 millions pour TV, de $4.3 millions pour MAG et de $5.2 millions pour RAD. 8

9 Exercice 6- Le prix des corvettes (supplémentaire) Dix Corvettes (célèbre voiture américaine) d âge compris entre 1 an et 6 ans ont été sélectionnées au hasard par The Arizona Republic (Vlan local). Pour chaque voiture on connaît l âge (AGE), le nombre de miles (MIL) parcourus et le prix (PRI). Le tableau suivant contient les données. AGE (ans) MIL(milliers) PRI ($100s) Nous proposons d effectuer une analyse de régression, avec l aide du logiciel SAS, où les variables AGE et MIL seront considérées comme prédicteurs pour la variable PRI. Supposons que les variables prises en considération satisfassent aux conditions classiques. Questions: 1. Effectuez la régression et interprétez les résultats obtenus. 2. Donnez l écart type des estimateurs et interprétez. 3. Au seuil de signification 5%, pensez vous que le modèle choisi, contenant les 2 variables AGE et MIL, prédit correctement le prix (PRI)? 4. Même question mais en supposant que le modèle ne contient que la variable AGE? Soyez précis dans votre conclusion. 5. Répétez la même question mais en supposant que le modèle ne contient que la variable MIL? Qu en est-il si le seuil est porté à 10%? 6. Déterminez une estimation du prix moyen des Corvettes qui ont 4 ans d âge et ont parcouru miles. 7. Calculez un intervalle de confiance (au niveau 5%) pour le prix moyen des Corvettes qui ont 4 ans d âge et ont parcouru miles. 8. Déterminez la prévision pour une Corvette quelconque (au hasard) qui a 4 ans d âge et a parcouru miles. 9. Donnez un intervalle de prévision (au niveau 5%) pour le prix d une Corvette qui a 4 ans d âge et a parcouru miles. 9

10 Exercice 7- La consommation de carburant (supplémentaire) On souhaiterait prédire la consommation de carburant (mesuré en gallons / 100 miles), on dispose des variables suivantes : 1.COU : Nationalité du constructeur 2.CAR: nom et type 3.MPG: Miles per gallon, une mesure de consommation 4.DRI: rapport de vitesse 5.HOR: puissance 6.DIS : volume du véhicule (en cubic inches) 7.CYL: le nombre de cylindres 8.WEI : le poids Les données que nous disposons ont été collectées par un organisme de consommateur au cours d un test sur route en suivant les recommandations de maintenance données par les constructeurs de chaque véhicule. Nous avons codé la variable COU afin de pouvoir la lire avec SAS suivant la règle suivante : US=1 Japan=2 Germany=3 Sweden=4 France=5 Italy=6 La variable CAR représente le numéro d observation et vous aidera à déterminer le nom des véhicules. Questions: 1. Dans un premier temps, étudiez les corrélations existant entre toutes les variables (mis à part CAR). Discutez et citez les variables les plus corrélées entre elles. 2. On propose de partir du modèle suivant : MPG = β 1 WEI + β 2 DRI + β 3 HOR + β 4 DIS + β 5 CYL + β 6 + ε Effectuez à l aide de SAS les régressions, jusqu à obtenir un modèle où tout les coefficients sont significativement différents de zéro (méthode rétroactive : supprimez une à une les variables les moins non-significatives (au seuil 10%)). 3. On considère le modèle suivant : MPG = β 1 WEI + β 2 DRI + β 3 + ε Effectuez une analyse complète de la dernière sortie disponible (valeur des coefficients, interprétation, pertinence des variables, analyse des résidus, R2, Durbin-Watson). 4. Une des valeurs des résidus semble être aberrante. Précisez laquelle et interprétez. 5. Expliquez comment inclure la variable COU dans le modèle. Nom du fichier de données: CARS.TXT disponible sur le serveur habituel. 10

11 Voici les données : COU CAR MPG WEI DRI HOR DIS CYL U.S. Buick Estate Wagon U.S. Ford Country Squire Wagon U.S. Chevy Malibu Wagon U.S. Chrysler LeBaron Wagon U.S. Chevette Japan Toyota Corona Japan Datsun U.S. Dodge Omni Germany Audi Sweden Volvo 240 GL Sweden Saab 99 GLE France Peugeot 694 SL U.S. Buick Century Special U.S. Mercury Zephyr U.S. Dodge Aspen U.S. AMC Concord D/L U.S. Chevy Caprice Classic U.S. Ford LTD U.S. Mercury Grand Marquis U.S. Dodge St Regis U.S. Ford Mustang U.S. Ford Mustang Ghia Japan Mazda GLC Japan Dodge Colt U.S. AMC Spirit Germany VW Scirocco Japan Honda Accord LX U.S. Buick Skylark U.S. Chevy Citation U.S. Olds Omega U.S. Pontiac Phoenix U.S. Plymouth Horizon Japan Datsun Italy Fiat Strada Germany VW Dasher Japan Datsun Germany BMW 320i Germany VW Rabbit Référence: Henderson, H. V. and Velleman, P. F. (1981), "Building Regression Models Interactively." Biometrics, 37, Data originally collected from Consumer Reports. Authorization: Contact Consumer Reports Description: Measurements on model automobiles. The gas mileage in miles per gallon measured by Consumers' Union on a test track. Other values as reported by automobile manufacturer. Number of cases: 38 as 11

12 Exercice 1- Chiffres d affaires SERIES CHRONOLOGIQUES Les données à étudier proviennent de l Annuaire Statistique de la Belgique. Il s agit de l indice du chiffre d affaire mensuel des grands magasins à rayons multiples dans le rayon alimentaire sur la période s étendant de janvier 1978 à décembre Le fichier contenant la série brute (notée : Z t ) porte le nom de MAG.TXT, il se trouve sur le disque E. Recopiez-le sur votre disque H. Nous allons étudier cette série sur une période s étendant de janvier 1978 à juin 1990 (les 6 dernières données seront réservées pour mesurer la qualité des prévisions fournies par les différents modèles). a. Etude préliminaire. - Importation des données et creation d'un compteur de temps - Représentation des données - Obtenir les corrélogrammes et placer les valeurs des autocorrelations dans la base de données que nous décidons d'appeler "magacov". b. Stationnarisation de la série. - Stabilisation de la variance : Nous proposons tout d abord (sur base de l étude préliminaire), la transformation logarithmique suivante : X log Z t t Cette transformation stabilise quelque peu la variance, mais le corrélogramme et corrélogramme partiel des résidus sont semblables à ceux de la série initiale - Stabilisation de la moyenne et traitement de la saisonnalité. On propose de différencier la série transformée : Y t ( 1 B) X. t On voit que cette transformation stabilise quelque peu la tendance, mais que le corrélogramme et corrélogramme partiel des résidus comportent encore des valeurs significatives aux délais 1, 11, 12, 13, 24, 25, 35, 36, 37 ce qui témoigne un phénomène saisonnier important (de période 12). On propose d appliquer une différenciation saisonnière sur la série transformée: 12 W ( 1 B ) Y t t Peut-on conclure que la série transformée W ( 1 B 12 )( 1 B)log Z est stationnaire? t t 12

13 c. Spécification et estimation Nous allons utiliser la série dslmag : Wt ( 1 B 12 )( 1 B)log Zt (série stationnaire). Sur base des corrélogramme et corrélogramme partiel, proposez un ou plusieurs modèles candidats. Si après estimation du modèle on voit que la constante est non significative, il est inutile de la laisser dans le modèle. Nous ne parlerons pas ici des valeurs extrêmes ou aberrantes. Choix de la méthode: Vous pouvez maintenant préciser les paramètres que vous voulez estimer. Par exemple, pour estimer un SARiMA(2,1,0)(0, 1, 1)12, sur la série lmag, d. Validation du modèle Cette dernière étape est essentielle. Pour chaque modèle estimé, vous devez tester si les résidus forment un bruit blanc. Pour ce faire regardez le correlogramme des résidus qui doit être celui d'un bruit blanc. Les critères AIC et Schwartz doivent être les plus petits possibles. Indication: Nous proposons dans l ordre les modèles suivants: AR(2), SARIMA ( 2, 0, 0)( 0, 0, 1) 12 et SARIMA ( 2, 0, 0)( 1, 0, 0) 12 pour W t. Trouvez comment obtenir les paramètres estimés. Justifiez le choix de ces modèles, déterminez les valeurs des coefficients de chaque modèle estimé et donnez les résultats de validation. Quel modèle vous paraît le mieux représenter la série? 13

14 Exercice 2-Assurances vie (Mélard p 406) Les données du fichier ASSVIE.TXT sont relatives à la production d assurances sur la vie dans la branche vie-individuelle, pour une grande compagnie. Il s agit du nombre de propositions enregistrées diminué du nombre d affaires classées sans suite pour une raison quelconque. La période de temps étudiée s étend de janvier 1964 à décembre Il faut noter que le mois de décembre connaît une production plus élevée que la normale à cause du système de rémunération des producteurs. En effet, plusieurs catégories ont été établies, délimitées par des planchers et des plafonds de production. Le passage à une catégorie supérieure procure des avantages intéressants. En revanche, le début de l année, et particulièrement le mois de janvier, est souvent creux pour deux raisons: d une part, le nombre d affaires sans suite est important, et d autre part, les producteurs ont tendance à se remettre des efforts consentis. Analysez ces données. 14

15 MODELES LOGIT ET PROBIT Exercice 1- Offre de travail des femmes mariées (exemple de devoir) Les données sont constituées de 753 observations de 19 variables, relatives à des femmes blanches mariées qui avaient entre 30 et 60 ans en 1975 (année où l on a récolté les données). Le fichier MROZ.TXT est disponible dans le répertoire habituel E:\. Ce fichier est en format texte. Les séries sont rangées par observation. Liste des variables dans le fichier (dans l ordre): LFP WHRS KL6 K618 WA WE WW RPWG HHRS HA HE HW FAMINC MTR WMED WFED UN CIT AX. Les 428 premières observations sont relatives aux femmes qui ont travaillé durant l année 1975 (le nombre d heures de travail est positif). Elles constituent ce que nous appellerons l échantillon E1. Les 325 dernières observations concernent les femmes qui n ont pas travaillé durant cette année. Elles constituent ce que nous appellerons l échantillon E2. Les variables intervenant dans les modèles étudiés sont les suivantes: - LFP (Labor Force Participation) est une variable indicatrice qui vaut 1 si la femme a travaillé en 1975 et 0 sinon. - WHRS (Wife HouRS of work) est une variable quantitative discrète qui compte le nombre d heures de travail de chaque femme. - KL6 indique le nombre d enfants du ménage qui ont moins de 6 ans. - K618 indique le nombre d enfants du ménage qui ont entre 6 ans et 18 ans. - WA (Wife Age) est une variable quantitative discrète indiquant l âge de la femme au moment de l enquête, en années. - WE (Wife s Educational attainment) est une variable quantitative discrète qui donne le nombre d années passées dans le système scolaire. - WW (Wife s Wage) est une variable quantitative continue, le salaire horaire moyen de la femme, en dollars (1975). - FAMINC (FAMily INCome) est le revenu du ménage pour l année UN (UNemployment) est une variable quantitative continue qui exprime le taux de chômage dans le pays de résidence de la femme. - CIT (CITy) est une variable indicatrice qui vaut 1 si la famille habite dans une grande ville, et 0 sinon. - AX est une variable quantitative discrète donnant le nombre d années passées dans les divers emplois occupés. Elle constitue une mesure du niveau d expérience professionnelle. Questions : Première partie. Examen des données (a) Il est parfois utile de vérifier que les données fournies correspondent bien à celles que l on souhaite étudier. Une façon de procéder est ici de calculer la moyenne et l écart type des observations pour chacune des 19 variables, en utilisant l échantillon complet des 753 observations. Les résultats que vous devriez obtenir sont les suivants: LFP (0.5684, ), WHRS ( , 871,3142), KL6 (0.2377, 0.524), etc. 15

16 Vérifiez à l aide de SAS. Une façon de vérifier qu il n y a pas d erreur d encodage est de rechercher la plus petite valeur et la plus grande et de les comparer aux paramètres ci-dessus. Faites-le pour les variables LFP et WHRS Détectez-vous de cette façon des valeurs qui vous paraissent suspectes? Si oui, pourquoi vous paraissent-elles suspectes? (pour détecter rapidement les valeurs minimum et maximum prises par une variable, aidez-vous des graphiques) (b) Dans le modèle d'offre de travail estimé par Mroz, on suppose que les femmes qui décident de travailler prennent en compte d'une part le revenu du ménage qui ne provient pas du travail, et d'autre part le revenu de leur mari. Mroz appelle ces deux revenus cumulés "revenu propre de la femme", qu'on note PRIN (wife PRoperty INcome). Il le calcule pour les 753 observations de la façon suivante : PRIN = FAMINC - WW*WHRS (créer PRIN = FAMINC - WW*WHRS) Calculez la moyenne et la variance de PRIN. Vous obtenez normalement pour la moyenne. N'oubliez-pas de sauver la variable que vous venez de créer. (c) L'une des variables fréquemment utilisée dans des études empiriques de la force de travail est le salaire horaire WW. Pourtant, on ne dispose pas d'observations du salaire horaire chez les femmes qui ne travaillent pas. Une tentative pour résoudre ce problème est d'estimer une équation qui détermine le salaire horaire à partir des seules observations concernant les femmes qui travaillent, et ensuite d'utiliser les estimations des paramètres ainsi obtenus et les caractéristiques de l'échantillon des femmes qui ne travaillent pas pour construire les salaires horaires prédits ou ajustés pour chacune des femmes sans activité professionnelle rémunérée. En vous restreignant uniquement à l'échantillon des femmes qui travaillent, E1, passez au logarithme de WW. Notez la nouvelle variable LWW. Calculez la moyenne arithmétique et l'écart-type de LWW dans l'échantillon E1. Générez ensuite la variable AX2 = AX*AX. Estimez une équation de détermination du salaire horaire à partir de E1 en utilisant les MCO: LWW WA WE CIT AX AX Cette équation a-t-elle un sens? Pourquoi? Pour chacune des femmes de l'échantillon E2, servez-vous des estimations des paramètres de cette équation et des valeurs des variables WA, WE, CIT, AX et AX2 pour déterminer les valeurs ajustées ou prédites de LWW. Notez LWWFIT la série ainsi obtenue. Comparez la moyenne et l'écart-type de LWWFIT dans E2 à la moyenne et à l'écart-type de LWW dans E1, respectivement. La différence vous paraît-elle importante? Comment interprétez-vous ce résultat? Générez en suite pour l'échantillon global E la variable LWW1, définie comme suit: LWW1 = LWW pour les observations de E1 et LWW1 = LWWFIT pour les observations de E2. Notez que la variable LWW1 contient soit le salaire actuel, soit le salaire prédit pour chaque individu de l'échantillon. Si vous n'avez pas fait d'erreur dans la manipulation des séries, vous devriez avoir pour moyenne et écart-type de LWW1 les nombres et , respectivement. Vérifiez-le et sauvez la série LWW1. Deuxième partie. Estimation des modèles logit et probit. On demande d'estimer une équation relative à la participation des femmes à la force de travail (variable LFP), à l'aide de modèles logit et probit. On comparera ensuite les résultats. 16

17 (d) Estimez par le maximum de vraisemblance les paramètres d'un modèle logit où LFP est la variable dépendante et où les variables LWW1, KL6, K618, WA, WE, UN, CIT et PRIN sont les variables explicatives. Introduisez également une constante dans le modèle. Commentez les signes des estimations des paramètres. Quels paramètres de ce modèle sont significativement non nuls? Interprétez les résultats. Après combien d'itérations l'algorithme utilisé par SAS pour résoudre les équations de vraisemblance converge-t-il? Peut-on parler de convergence rapide? SAS fournit-il parmi les sorties une mesure de la qualité de l ajustement proposé? (e) On considère maintenant un modèle probit. Répondez aux mêmes questions qu'au point (d) et comparez la vitesse de convergence de l'algorithme de résolution par ces deux méthodes. 17

18 Exercice 2- Les prêts hypothécaires (supplémentaire) Considérons les données relatives à un échantillon de 750 prêts hypothécaires dans les villes des Etats de Columbia et de Carolyne du Sud. On observe 500 demandes de prêts hypothécaires acceptées et 250 demandes de prêts hypothécaires refusées. On définit si la demande de pret est acceptée y 1 0 si la demande de pret est refusée. On a estimé 2 modèles différents: le modèle logit et le modèle probit (le modèle de probabilité linéaire ne sera pas étudié au cours des séances de travaux pratiques, en raison de ses nombreux inconvénients). Les variables explicatives sont : AI = revenu du candidat à l hypothèque (en milliers de dollars) XMD = dette - hypothèque (en milliers de dollars) DF = variable indicatrice, 1 pour les hommes et 0 pour les femmes DR = variable indicatrice, 1 pour les non blancs et 0 pour les blancs DS = variable indicatrice, 1 pour les célibataires et 0 pour les autres DA = âge de la maison (en centaines d années) NNWP = pourcentage de non blancs dans le voisinage NMFI = revenus familiaux moyens du voisinage (en centaines de milliers de dollars) NA = âge moyen des maisons du voisinage (en centaines d années) Les résultats sont fournis dans le tableau ci-dessous. Questions : Logit Model Probit Model Variables coefficients standard error coefficients standard error AI 2,254 0,49 2,030 0,43 XMD -1,170 0,21-1,773 0,31 DF 0,563 0,65 0,206 0,22 DR -0,240 0,15-0,279 0,17 DS -0,222 0,15-0,274 0,16 DA -1,463 0,44-1,570 0,48 NNWP -2,028 2,54-2,360 2,78 NMFI 0,149 0,75 0,194 0,78 NA -0,386 0,31-0,425 0,34 Constante 0,363 0,488 (a) Ecrivez le modèle dichotomique simple relatif à cet exemple. (b) Quelles variables sont significatives? (c) Comment pourriez-vous comparer les deux modèles (comparez les deux ensembles de coefficients présentés dans le tableau ci-dessus). Sont-ils très différents les uns des autres? (d) Interprétez les signes et valeurs des estimations dans le modèle logit. Comparez la demande de prêt d une femme par rapport à celle dans les mêmes conditions d un homme. 18

Chapitre 4 : Régression linéaire

Chapitre 4 : Régression linéaire Exercice 1 Méthodes statistiques appliquées aux sciences sociales (STAT-D-203) Titulaire : Catherine Vermandele Chapitre 4 : Régression linéaire Le diplôme de Master of Business Administration ou MBA est

Plus en détail

UNIVERSITE PARIS 1 PANTHEON SORBONNE LICENCE DE SCIENCES ECONOMIQUES. STATISTIQUE APPLIQUEE F. Gardes / P. Sevestre. Fiche N 7.

UNIVERSITE PARIS 1 PANTHEON SORBONNE LICENCE DE SCIENCES ECONOMIQUES. STATISTIQUE APPLIQUEE F. Gardes / P. Sevestre. Fiche N 7. UNIVERSITE PARIS 1 PANTHEON SORBONNE LICENCE DE SCIENCES ECONOMIQUES STATISTIQUE APPLIQUEE F. Gardes / P. Sevestre Fiche N 7 (avec corrigé) L objet de ce TD est de vous initier à la démarche et à quelques

Plus en détail

Régression linéaire. Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr

Régression linéaire. Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr Régression linéaire Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr 2005 Plan Régression linéaire simple Régression multiple Compréhension de la sortie de la régression Coefficient de détermination R

Plus en détail

Données qualitatives, modèles probit et logit

Données qualitatives, modèles probit et logit Données qualitatives, modèles probit et logit I Un modèle pour données qualitatives Cette section est fortement inspirée du cours de Christophe Hurlin. On est confronté à des données qualitatives en micro-économie

Plus en détail

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

Chapitre 3 RÉGRESSION ET CORRÉLATION

Chapitre 3 RÉGRESSION ET CORRÉLATION Statistique appliquée à la gestion et au marketing http://foucart.thierry.free.fr/statpc Chapitre 3 RÉGRESSION ET CORRÉLATION La corrélation est une notion couramment utilisée dans toutes les applications

Plus en détail

Travaux pratiques de Séries Temporelles F. Lavancier, A. Philippe

Travaux pratiques de Séries Temporelles F. Lavancier, A. Philippe Université de Nantes UFR des Sciences et Techniques Département de Mathématiques Master 2 Ingénierie mathématique 2012-2013 Travaux pratiques de Séries Temporelles F. Lavancier, A. Philippe Étude préliminaire

Plus en détail

Dossier / TD Econométrie. Analyse de la demande d essence aux Etats-Unis entre 1960-1995 fichier : essence.xls

Dossier / TD Econométrie. Analyse de la demande d essence aux Etats-Unis entre 1960-1995 fichier : essence.xls Dossier / TD Econométrie Analyse de la demande d essence aux Etats-Unis entre 1960-1995 fichier : essence.xls Source : Greene "Econometric Analysis" Prentice Hall International, 4 ème édition, 2000 Council

Plus en détail

Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015 Exercices M1 SES 214-215 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 215 Les exemples numériques présentés dans ce document d exercices ont été traités sur le logiciel R, téléchargeable par

Plus en détail

Économétrie 2 : données qualitatives, probit et logit

Économétrie 2 : données qualitatives, probit et logit URCA Hugo Harari-Kermadec 2008-2009 harari@ecogest.ens-cachan.fr Économétrie 2 : données qualitatives, probit et logit I Un modèle pour données qualitatives Cette section est fortement inspirée du cours

Plus en détail

EXTENSIONS DU MODÈLE LINÉAIRE

EXTENSIONS DU MODÈLE LINÉAIRE 1 EXTENSIONS DU MODÈLE LINÉAIRE Rappelons tout d'abord que dans le modèle linéaire examiné jusqu'ici, la linéarité requise concerne les coefficients et non les variables explicatives initiales; ainsi les

Plus en détail

Introduction à l'analyse statistique des données

Introduction à l'analyse statistique des données INTRODUCTION À L'ANALYSE STATISTIQUE DES DONNÉES CONCEPTS DE BASE Un certain nombre de concepts, préalables indispensables à la compréhension des analyses présentées, sont définis ici. De même pour quelques

Plus en détail

Cours IFT6266, Exemple d application: Data-Mining

Cours IFT6266, Exemple d application: Data-Mining Cours IFT6266, Exemple d application: Data-Mining Voici un exemple du processus d application des algorithmes d apprentissage statistique dans un contexte d affaire, qu on appelle aussi data-mining. 1.

Plus en détail

Arrondir à la troisième décimale

Arrondir à la troisième décimale Université Sidi Mohamed Ben Abdellah Faculté des sciences Juridiques, Economiques et Sociales - Fès- Année Universitaire 2004/2005 Filière: Sciences Economiques et Gestion S2 Module: Méthodes quantitatives

Plus en détail

Fonctions affines. Table des matières

Fonctions affines. Table des matières Fonctions affines Table des matières 1 fonction linéaire, fonction constante, fonction affine 3 1.1 activités.............................................. 3 1.1.1 activité 1 : fonction linéaire et variation

Plus en détail

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels Etab=MK3, Timbre=G430, TimbreDansAdresse=Vrai, Version=W2000/Charte7, VersionTravail=W2000/Charte7 Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

Plus en détail

Cours 11 : Homogénéité de la variance et transformations non linéaires

Cours 11 : Homogénéité de la variance et transformations non linéaires Cours 11 : Homogénéité de la variance et transformations non linéaires Table des matières Section 1. Régularité de la nature et effets linéaires... 2 Section 2. Homogénéité des variances... 2 Section 3.

Plus en détail

Econométrie. 1. Matière: Problèmes de spécification et variables explicatives binaires

Econométrie. 1. Matière: Problèmes de spécification et variables explicatives binaires Econométrie Répétition 9 1. Matière: Problèmes de spécification et variables explicatives binaires Utilisation des variables explicatives binaires. Test de la forme fonctionnelle. Testd hétéroscédasticitéetutilisationde

Plus en détail

Séance 8 : Régression Logistique

Séance 8 : Régression Logistique Séance 8 : Régression Logistique Sommaire Proc LOGISTIC : Régression logistique... 2 Exemple commenté : Achat en (t+1) à partir du sexe et du chiffre d affaires de la période précédente. 4 La régression

Plus en détail

Université d Orléans - Maitrise Econométrie Econométrie des Variables Qualitatives

Université d Orléans - Maitrise Econométrie Econométrie des Variables Qualitatives Université d Orléans - Maitrise Econométrie Econométrie des Variables Qualitatives Examen Décembre 00. C. Hurlin Exercice 1 (15 points) : Politique de Dividendes On considère un problème de politique de

Plus en détail

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels Etab=MK3, Timbre=G430, TimbreDansAdresse=Vrai, Version=W2000/Charte7, VersionTravail=W2000/Charte7 Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

Plus en détail

X1 = Cash flow/ Dette totale. X2 = Revenu net / Total des actifs au bilan. X3 = Actif réalisable et disponible / Passif courant

X1 = Cash flow/ Dette totale. X2 = Revenu net / Total des actifs au bilan. X3 = Actif réalisable et disponible / Passif courant EXEMPLE : FAILLITE D ENTREPRISES Cet exemple a pour objectif d étudier la faillite d entreprises. Les données proviennent de l ouvrage de R.A.Johnson et D.W Wichern : Applied Multivariate Statistical Analysis»,

Plus en détail

Simulation Examen de Statistique Approfondie II **Corrigé **

Simulation Examen de Statistique Approfondie II **Corrigé ** Simulation Examen de Statistique Approfondie II **Corrigé ** Ces quatre exercices sont issus du livre d exercices de François Husson et de Jérôme Pagès intitulé Statistiques générales pour utilisateurs,

Plus en détail

La régression logistique PLS

La régression logistique PLS La régression logistique PLS Michel Tenenhaus Groupe HEC, 78351 Jouy-en-Josas 1 Introduction La régression PLS permet de relier une ou plusieurs variables de réponse y àun ensemble de variables prédictives

Plus en détail

REGRESSION MULTIPLE: CONSOMMATION D ELECTRICITE

REGRESSION MULTIPLE: CONSOMMATION D ELECTRICITE REGRESSION MULTIPLE: CONSOMMATION D ELECTRICITE LES DONNEES OBS KW SURFACE PERS PAVILLON AGE VOL SBAINS 1 4805 130 4 1 65 410 1 2 3783 123 4 1 5 307 2 3 2689 98 3 0 18 254 1 4 5683 178 6 1 77 570 3 5 3750

Plus en détail

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p. STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,

Plus en détail

Master 1- Informatique. Modèle Linéaire Général Travaux dirigés

Master 1- Informatique. Modèle Linéaire Général Travaux dirigés Département Informatique et Statistique Université Lumière Lyon 2 Master 1- Informatique Informatique Décisionnelle et Statistique Modèle Linéaire Général Travaux dirigés Année Universitaire 2011-2012

Plus en détail

Estimation et tests statistiques, TD 5. Solutions

Estimation et tests statistiques, TD 5. Solutions ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études

Plus en détail

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,

Plus en détail

Exercice I. Commenter brièvement les résultats obtenus, et indiquer quelle serait selon ce modèle l influence d une année d étude supplémentaire.

Exercice I. Commenter brièvement les résultats obtenus, et indiquer quelle serait selon ce modèle l influence d une année d étude supplémentaire. 1 Exercice I I. Désirant étudier quelques déterminants du salaire dans le cadre de la théorie du capital humain, on dispose de données (fichier «travail85.sas», en mode ASCII, section Exemples pour SAS)

Plus en détail

Actuariat I ACT2121. huitième séance. Arthur Charpentier. Automne 2012. charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free.

Actuariat I ACT2121. huitième séance. Arthur Charpentier. Automne 2012. charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free. Actuariat I ACT2121 huitième séance Arthur Charpentier charpentier.arthur@uqam.ca http ://freakonometrics.blog.free.fr/ Automne 2012 1 Exercice 1 Soit X une variable aléatoire continue de fonction de densité

Plus en détail

Principes de mathématiques 12 SÉRIE DE PROBLÈMES. Septembre 2001. Student Assessment and Program Evaluation Branch

Principes de mathématiques 12 SÉRIE DE PROBLÈMES. Septembre 2001. Student Assessment and Program Evaluation Branch Principes de mathématiques 12 SÉRIE DE PROBLÈMES Septembre 2001 Student Assessment and Program Evaluation Branch REMERCIEMENTS Le Ministère de l Éducation tient à remercier chaleureusement les professionnels

Plus en détail

EXERCICES SUR LE CHAPITRE 1 : «MIXTE»

EXERCICES SUR LE CHAPITRE 1 : «MIXTE» EXERCICES SUR LE CHAPITRE 1 : «MIXTE» 1. Les électeurs d'une grande ville américaine sont constitués de 40% de blancs, 40% de noirs et 20% d'hispaniques. Un candidat noir à la fonction de Maire espère

Plus en détail

La régression logistique

La régression logistique La régression logistique Présentation pour le cours SOL6210, Analyse quantitative avancée Claire Durand, 2015 1 Utilisation PQuand la variable dépendante est nominale ou ordinale < Deux types selon la

Plus en détail

Travaux Dirigés de Probabilités - Statistiques, TD 4. Lois limites ; estimation.

Travaux Dirigés de Probabilités - Statistiques, TD 4. Lois limites ; estimation. Travaux Dirigés de Probabilités - Statistiques, TD 4 Lois limites ; estimation. Exercice 1. Trois machines, A, B, C fournissent respectivement 50%, 30%, 20% de la production d une usine. Les pourcentages

Plus en détail

Examen de Logiciels Statistiques

Examen de Logiciels Statistiques G. Hunault Angers, mai 2011 Licence MEF Examen de Logiciels Statistiques On s intéresse ici au dossier EAEF01 qui contient un extrait des données du recensement américain. On trouvera ces données et leur

Plus en détail

Brevet de technicien supérieur Polynésie session mai 2012 - Informatique de gestion

Brevet de technicien supérieur Polynésie session mai 2012 - Informatique de gestion Brevet de technicien supérieur Polynésie session mai 2012 - Informatique de gestion A. P. M. E. P. ÉPREUVE OBLIGATOIRE Durée : 3 heures Coefficient : 2 Exercice 1 7 points Les parties A et B de cet exercice

Plus en détail

SUJET INÉDIT 1. Dossier 1. Charges et choix d une unité d œuvre 4 points 45 minutes CHAPITRES 1 et 4

SUJET INÉDIT 1. Dossier 1. Charges et choix d une unité d œuvre 4 points 45 minutes CHAPITRES 1 et 4 SUJET INÉDIT 1 La société Coupe & Shampoing Coupe & Shampoing est un salon de coiffure indépendant. Afin de faire face à la concurrence de salons de coiffure franchisés, son dirigeant, Kamel, aimerait

Plus en détail

La gestion des ventes.

La gestion des ventes. I. La prévision des ventes. A. Principe. La gestion des ventes. Elle consiste à déterminer les ventes futures à la fois en quantité et en valeur en tenant compte des tendances et contraintes imposées à

Plus en détail

11. Tests d hypothèses (partie 1/2)

11. Tests d hypothèses (partie 1/2) 11. Tests d hypothèses (partie 1/2) MTH2302D S. Le Digabel, École Polytechnique de Montréal H2015 (v1) MTH2302D: tests d hypothèses 1/30 Plan 1. Introduction 2. Hypothèses et erreurs 3. Tests d hypothèses

Plus en détail

ADMISSION AU COLLEGE UNIVERSITAIRE Samedi 1 mars 2014 MATHEMATIQUES durée de l épreuve : 3h coefficient 2

ADMISSION AU COLLEGE UNIVERSITAIRE Samedi 1 mars 2014 MATHEMATIQUES durée de l épreuve : 3h coefficient 2 ADMISSION AU COLLEGE UNIVERSITAIRE Samedi 1 mars 2014 MATHEMATIQUES durée de l épreuve : 3h coefficient 2 Le sujet est numéroté de 1 à 5. L annexe 1 est à rendre avec la copie. L exercice Vrai-Faux est

Plus en détail

Feuille de TP N 3 : Modèle log-linéaire - Travail guidé. 1 Cancers : modèle log-linéaire à deux facteurs croisés

Feuille de TP N 3 : Modèle log-linéaire - Travail guidé. 1 Cancers : modèle log-linéaire à deux facteurs croisés M1 MLG Année 2012 2013 Feuille de TP N 3 : Modèle log-linéaire - Travail guidé 1 Cancers : modèle log-linéaire à deux facteurs croisés Ce premier exercice reprend l exercice 1 de la feuille de TD n 3.

Plus en détail

Licence Economie-Gestion, 1ère Année Polycopié de Statistique Descriptive. Année universitaire : 2013-2014.

Licence Economie-Gestion, 1ère Année Polycopié de Statistique Descriptive. Année universitaire : 2013-2014. Licence Economie-Gestion, 1ère Année Polycopié de Statistique Descriptive. Année universitaire : 2013-2014. Thèmes des séances de TD Thème n.1: Tableaux statistiques et représentations graphiques. Thème

Plus en détail

Analyse de donne es Exercices

Analyse de donne es Exercices Analyse de donne es Exercices Table des matières Séquence 1 : Détermination des types d enquêtes, choix d échantillons... 3 Application n 1 : Construire un sondage par quotas... 3 Application n 2 : Construire

Plus en détail

L'analyse des données multivariées à l'aide du logiciel

L'analyse des données multivariées à l'aide du logiciel L'analyse des données multivariées à l'aide du logiciel L'analyse factorielle des correspondances multiples (A.F.C.m.) INRA - Formation Permanente Juillet 2005 André Bouchier p.1/25 Copyright 2005 André

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

Analyse de données et méthodes numériques

Analyse de données et méthodes numériques Analyse de données et méthodes numériques Analyse de données: Que faire avec un résultat? Comment le décrire? Comment l analyser? Quels sont les «modèles» mathématiques associés? Analyse de données et

Plus en détail

UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2013 2014 MATHS/STATS. 1 Généralités sur les tests statistiques 2

UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2013 2014 MATHS/STATS. 1 Généralités sur les tests statistiques 2 UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2013 2014 Master d économie Cours de M. Desgraupes MATHS/STATS Document 4 : Les tests statistiques 1 Généralités sur les tests

Plus en détail

Enquête consommation - Tableaux croisés dynamiques

Enquête consommation - Tableaux croisés dynamiques Enquête consommation Tableaux croisés dynamiques 1. Chargement des données dans Excel Souvent les données collectées sont stockées dans un fichier au format texte, dont les informations sont séparées par

Plus en détail

ESSEC. Cours FIN 260 Gestion de portefeuille. Séance 8 Mesures de performance

ESSEC. Cours FIN 260 Gestion de portefeuille. Séance 8 Mesures de performance ESSEC Cours FIN 260 Gestion de portefeuille Séance 8 Mesures de performance François Longin Plan Introduction Mesures de performance des fonds: développements académiques Premier niveau: la rentabilité

Plus en détail

Comment ne pas construire un score-titanic

Comment ne pas construire un score-titanic Comment ne pas construire un score-titanic Mon mailing Olivier Decourt ABS Technologies / Educasoft Formations 1- Les principes 2- Un premier exemple : les vins de France 3- Mise en œuvre sous SAS 4- Un

Plus en détail

Statistiques bivariées : corrélation et régression linéaire

Statistiques bivariées : corrélation et régression linéaire : corrélation et régression linéaire Activité d'introduction Ce chapitre de statistique est présenté avec l'objectif de promouvoir la réflexion des étudiants et leur faire remarquer que ces notions statistiques

Plus en détail

Lycée Alexis de Tocqueville. BACCALAUREAT TECHNOLOGIQUE Blanc Corrigé. Série S.T.M.G. Février 2015 Épreuve de mathématiques.

Lycée Alexis de Tocqueville. BACCALAUREAT TECHNOLOGIQUE Blanc Corrigé. Série S.T.M.G. Février 2015 Épreuve de mathématiques. Lycée Alexis de Tocqueville BACCALAUREAT TECHNOLOGIQUE Blanc Corrigé Série S.T.M.G. Février 2015 Épreuve de mathématiques Durée 3 heures Le candidat traitera obligatoirement les quatre exercices ******

Plus en détail

Projet : Recherche de source d onde gravitationnelle (analyse de données Metropolis Hastings Markov Chain) 1

Projet : Recherche de source d onde gravitationnelle (analyse de données Metropolis Hastings Markov Chain) 1 Université Paris Diderot Physique L2 2014-2015 Simulations Numériques SN4 Projet : Recherche de source d onde gravitationnelle (analyse de données Metropolis Hastings Markov Chain) 1 Objectifs : Simuler

Plus en détail

Conditions d application des méthodes statistiques paramétriques :

Conditions d application des méthodes statistiques paramétriques : Conditions d application des méthodes statistiques paramétriques : applications sur ordinateur GLELE KAKAÏ R., SODJINOU E., FONTON N. Cotonou, Décembre 006 Conditions d application des méthodes statistiques

Plus en détail

Projetde SériesTemporelles

Projetde SériesTemporelles COMMUNAUTE ECONOMIQU E ET MONETAIRE DE L AFRIQUE CENTRALE (CEMAC) INSTITUT SOUS REGIONAL DE STATISTIQUES ET D ECONOMIE APPLIQUEE (ISSEA) Projetde SériesTemporelles MODELISATION DE LA RENTABILITE DE L INDICE

Plus en détail

TSTI 2D CH X : Exemples de lois à densité 1

TSTI 2D CH X : Exemples de lois à densité 1 TSTI 2D CH X : Exemples de lois à densité I Loi uniforme sur ab ; ) Introduction Dans cette activité, on s intéresse à la modélisation du tirage au hasard d un nombre réel de l intervalle [0 ;], chacun

Plus en détail

Statistiques Descriptives à une dimension

Statistiques Descriptives à une dimension I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des

Plus en détail

Chapitre 2: Prévisions des ventes

Chapitre 2: Prévisions des ventes Chapitre 2: Prévisions des ventes AVIS IMPORTANT : Ces notes sont basées sur le livre de Steven Nahmias : Production et Operations Analysis, 4 ième édition, McGraw-Hill Irwin 200. Les figures sont issues

Plus en détail

«Monsieur, on fait quoi?»

«Monsieur, on fait quoi?» Nous avons le plaisir aujourd hui de vous proposer une séance de travaux pratiques de statistique, c est-à-dire, une séance où vous allez pouvoir mettre les mains dans le cambouis (dans les données) et

Plus en détail

Analyse de la variance à deux facteurs

Analyse de la variance à deux facteurs 1 1 IRMA, Université Louis Pasteur Strasbourg, France Master 1 Psychologie du développement 06-10-2008 Contexte Nous nous proposons d analyser l influence du temps et de trois espèces ligneuses d arbre

Plus en détail

Collecter des informations statistiques

Collecter des informations statistiques Collecter des informations statistiques FICHE MÉTHODE A I Les caractéristiques essentielles d un tableau statistique La statistique a un vocabulaire spécifique. L objet du tableau (la variable) s appelle

Plus en détail

Cours (8) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012. Test du Khi 2

Cours (8) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012. Test du Khi 2 Test du Khi 2 Le test du Khi 2 (khi deux ou khi carré) fournit une méthode pour déterminer la nature d'une répartition, qui peut être continue ou discrète. Domaine d application du test : Données qualitatives

Plus en détail

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences

Plus en détail

Introduction au cours STA 102 Analyse des données : Méthodes explicatives

Introduction au cours STA 102 Analyse des données : Méthodes explicatives Analyse des données - Méthodes explicatives (STA102) Introduction au cours STA 102 Analyse des données : Méthodes explicatives Giorgio Russolillo giorgio.russolillo@cnam.fr Infos et support du cours Slide

Plus en détail

0.2.3 Polynômes... 4. 0.2.1 Monômes... 4 0.2.2 Opérations entre monômes... 4

0.2.3 Polynômes... 4. 0.2.1 Monômes... 4 0.2.2 Opérations entre monômes... 4 Table des matières 0 Rappels sur les polynômes et fractions algébriques 1 0.1 Puissances............................................... 1 0.1.1 Puissance d un nombre réel.................................

Plus en détail

Analyse de la variance

Analyse de la variance M2 Statistiques et Econométrie Fanny MEYER Morgane CADRAN Margaux GAILLARD Plan du cours I. Introduction II. Analyse de la variance à un facteur III. Analyse de la variance à deux facteurs IV. Analyse

Plus en détail

CHÔMAGE ET STRATÉGIES DES FAMILLES : LES EFFETS MITIGÉS DU PASSAGE DE L ASSURANCE-CHÔMAGE À L ASSURANCE-EMPLOI

CHÔMAGE ET STRATÉGIES DES FAMILLES : LES EFFETS MITIGÉS DU PASSAGE DE L ASSURANCE-CHÔMAGE À L ASSURANCE-EMPLOI CHÔMAGE ET STRATÉGIES DES FAMILLES : LES EFFETS MITIGÉS DU PASSAGE DE L ASSURANCE-CHÔMAGE À L ASSURANCE-EMPLOI Édith Martel Université de Montréal Benoît Laplante Institut National de la Recherche Scientifique

Plus en détail

Fondements de Finance

Fondements de Finance Programme Grande Ecole Fondements de Finance Chapitre 7. : Risque, rentabilité et diversification Cours proposé par Fahmi Ben Abdelkader Version Etudiants Mars 2012 Préambule Fig. 10.1 (p.294) : Evolution

Plus en détail

Probabilités et Statistiques. Chapitre 1 : Statistique descriptive

Probabilités et Statistiques. Chapitre 1 : Statistique descriptive U.P.S. I.U.T. A, Département d Informatique Année 2008-2009 Probabilités et Statistiques Emmanuel PAUL Chapitre 1 : Statistique descriptive 1 Objectifs des statistiques. Il s agit d étudier un ou plusieurs

Plus en détail

Statistique Descriptive I (M1102)

Statistique Descriptive I (M1102) Illustration du cours de Statistique Descriptive I (M1102) Année scolaire 2013/2014 Université de Perpignan Via Domitia, IUT STatistique et Informatique Décisionnelle (STID) Table des matières 1 Généralités

Plus en détail

La régression sur données de panel

La régression sur données de panel La régression sur données de panel 1 I. Définition Les données utilisées en économétrie sont le plus souvent des séries chronologiques, tel le nombre de naissances enregistrées par an dans le département

Plus en détail

Chapitre 8 ANALYSE DES SÉRIES CHRONOLOGIQUES

Chapitre 8 ANALYSE DES SÉRIES CHRONOLOGIQUES Statistique appliquée à la gestion et au marketing http://foucart.thierry.free.fr/statpc Chapitre 8 ANALYSE DES SÉRIES CHRONOLOGIQUES Nous abordons dans ce chapitre l analyse de données statistiques particulières

Plus en détail

1 ère ES/L MATHÉMATIQUES TRIMESTRE 1. Sylvie LAMY Agrégée de Mathématiques Diplômée de l École Polytechnique. PROGRAMME 2011 (v2.

1 ère ES/L MATHÉMATIQUES TRIMESTRE 1. Sylvie LAMY Agrégée de Mathématiques Diplômée de l École Polytechnique. PROGRAMME 2011 (v2. MATHÉMATIQUES 1 ère ES/L TRIMESTRE 1 PROGRAMME 2011 (v2.3) Sylvie LAMY Agrégée de Mathématiques Diplômée de l École Polytechnique Les Cours Pi 42-44 rue du Fer à Moulin 75005 PARIS Tél. : 01 42 22 39 46

Plus en détail

PROBABILITES TRAVAUX DIRIGES

PROBABILITES TRAVAUX DIRIGES Université de Caen Basse-Normandie U.F.R. de Sciences Economiques et de Gestion Année universitaire 2009-2010 LICENCE ECONOMIE ET GESTION Semestre 3 L2 PROBABILITES TRAVAUX DIRIGES (18 heures) Hélène Ferrer

Plus en détail

CAPTEURS - CHAINES DE MESURES

CAPTEURS - CHAINES DE MESURES CAPTEURS - CHAINES DE MESURES Pierre BONNET Pierre Bonnet Master GSI - Capteurs Chaînes de Mesures 1 Plan du Cours Propriétés générales des capteurs Notion de mesure Notion de capteur: principes, classes,

Plus en détail

L équivalent patrimonial des droits à la retraite en France

L équivalent patrimonial des droits à la retraite en France L équivalent patrimonial des droits à la retraite en France Christophe Daniel (GRANEM, Université d Angers), Anne Lavigne (LEO, Université d Orléans), Stéphane Mottet(GRIEF, Université de Poitiers), Jésus-HerellNzeObame(GRANEM,

Plus en détail

Chapitre 3 : INFERENCE

Chapitre 3 : INFERENCE Chapitre 3 : INFERENCE 3.1 L ÉCHANTILLONNAGE 3.1.1 Introduction 3.1.2 L échantillonnage aléatoire 3.1.3 Estimation ponctuelle 3.1.4 Distributions d échantillonnage 3.1.5 Intervalles de probabilité L échantillonnage

Plus en détail

Modèles ARIMA et SARIMA Estimation dans R 1 et SAS 2 Novembre 2007 Yves Aragon aragon@cict.fr

Modèles ARIMA et SARIMA Estimation dans R 1 et SAS 2 Novembre 2007 Yves Aragon aragon@cict.fr Modèles ARIMA et SARIMA Estimation dans R 1 et SAS 2 Novembre 2007 Yves Aragon aragon@cict.fr Cette note examine les différences entre R et SAS dans l estimation des modèles ARIMA et SARIMA. Elle illustre

Plus en détail

Le Sphinx Millenium Modes opératoires d'analyse de données Traitements et analyses avec Le Sphinx Plus²

Le Sphinx Millenium Modes opératoires d'analyse de données Traitements et analyses avec Le Sphinx Plus² Le Sphinx Millenium Modes opératoires d'analyse de données Traitements et analyses avec Le Sphinx Plus² Le Sphinx Développement Parc Altaïs 74650 CHAVANOD Tél : 33 / 4.50.69.82.98. Fax : 33 / 4.50.69.82.78.

Plus en détail

Enquête mensuelle de conjoncture auprès des ménages

Enquête mensuelle de conjoncture auprès des ménages Note Méthodologique Dernière mise à jour : 27-1-214 Enquête mensuelle de conjoncture auprès des ménages Présentation de l enquête L Insee réalise depuis janvier 1987 l enquête mensuelle de conjoncture

Plus en détail

Items étudiés dans le CHAPITRE N5. 7 et 9 p 129 D14 Déterminer par le calcul l'antécédent d'un nombre par une fonction linéaire

Items étudiés dans le CHAPITRE N5. 7 et 9 p 129 D14 Déterminer par le calcul l'antécédent d'un nombre par une fonction linéaire CHAPITRE N5 FONCTIONS LINEAIRES NOTION DE FONCTION FONCTIONS LINEAIRES NOTION DE FONCTION FONCTIONS LINEAIRES NOTION DE FONCTION Code item D0 D2 N30[S] Items étudiés dans le CHAPITRE N5 Déterminer l'image

Plus en détail

STATISTIQUES. Cours I : Test d hypothèses. Télécom Physique Strasbourg Module 2101. Fabrice Heitz. Octobre 2014

STATISTIQUES. Cours I : Test d hypothèses. Télécom Physique Strasbourg Module 2101. Fabrice Heitz. Octobre 2014 Télécom Physique Strasbourg Module 2101 STATISTIQUES Cours I : Test d hypothèses Fabrice Heitz Octobre 2014 Fabrice Heitz (Télécom PS) Statistiques 2014 1 / 75 Cours I TESTS D HYPOTHÈSES Fabrice Heitz

Plus en détail

CREER UNE ENTREPRISE A JERSEY

CREER UNE ENTREPRISE A JERSEY CREER UNE ENTREPRISE A JERSEY Avant toute autre démarche, il faut avoir un «business plan» (projet professionnel) solide et bien conçu. Pour cela, il vous suffit de suivre les instructions ci-dessous :

Plus en détail

Questions pratiques 4: Transformer la variable dépendante

Questions pratiques 4: Transformer la variable dépendante Questions pratiques 4: Transformer la variable dépendante Jean-François Bickel Statistique II SPO8 Transformer une variable consiste en une opération arithmétique qui vise à construire une nouvelle variable

Plus en détail

Ricco.Rakotomalala http://eric.univ-lyon2.fr/~ricco/cours

Ricco.Rakotomalala http://eric.univ-lyon2.fr/~ricco/cours Ricco.Rakotomalala http://eric.univ-lyon2.fr/~ricco/cours R.R. Université Lyon 2 1 Fichier de données Prédiction de la consommation de véhicules (1) Prédire la consommation des véhicules à partir de ses

Plus en détail

Séries Statistiques Simples

Séries Statistiques Simples 1. Collecte et Représentation de l Information 1.1 Définitions 1.2 Tableaux statistiques 1.3 Graphiques 2. Séries statistiques simples 2.1 Moyenne arithmétique 2.2 Mode & Classe modale 2.3 Effectifs &

Plus en détail

Test basé sur les normes Mathématiques du consommateur 12 e année. Cahier de l élève du test écrit

Test basé sur les normes Mathématiques du consommateur 12 e année. Cahier de l élève du test écrit Test basé sur les normes Mathématiques du consommateur 12 e année Cahier de l élève du test écrit Juin 2012 Données de catalogage avant publication Éducation Manitoba Test basé sur les normes, mathématiques

Plus en détail

L'APPROCHE EXPERIMENTALE EN RECHERCHE: introduction aux statistiques.

L'APPROCHE EXPERIMENTALE EN RECHERCHE: introduction aux statistiques. L'APPROCHE EXPERIMENTALE EN RECHERCHE: introduction aux statistiques 1 BUTS DU COURS : se familiariser avec le vocabulaire statistique o variable dépendante, variable indépendante o statistique descriptive,

Plus en détail

Croisement de deux variables quantitatives

Croisement de deux variables quantitatives Fiche TD avec le logiciel : tdr206 Croisement de deux variables quantitatives A.B. Dufour & M. Royer L objectif de cette séance est d étudier la relation entre deux variables quantitatives. Les notions

Plus en détail

Board Development. Comprendre les états financiers

Board Development. Comprendre les états financiers Les états présentés aux réunions de conseil vous intimident-ils? Cherchez-vous des renseignements de base qui pourraient vous aider à lire les états? Si c est le cas, les renseignements qui suivent sont

Plus en détail

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

Annexe commune aux séries ES, L et S : boîtes et quantiles

Annexe commune aux séries ES, L et S : boîtes et quantiles Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans

Plus en détail

Heidi WECHTLER. Octobre 2005

Heidi WECHTLER. Octobre 2005 Heidi WECHTLER Le support aux analyses de données Séminaire GREGOR Octobre 2005 Support aux analyse de données du GREGOR Le poste Chargée d étude statistiques au GREGOR, bureau B126 (wechtler.iae@univ-paris1.fr)

Plus en détail

Simulation et première évaluation de ce dispositif

Simulation et première évaluation de ce dispositif les notes N 2 / 29 septembre 2011 Faut il revenir sur la défiscalisation des heures supplémentaires? Simulation et première évaluation de ce dispositif Éric Heyer Parmi les mesures du plan d économies

Plus en détail

HEC Université de Lausanne Analyse économique : macroéconomie

HEC Université de Lausanne Analyse économique : macroéconomie HEC Université de Lausanne Analyse économique : macroéconomie Prof. Mathias Thoenig et Philippe Andrade Examen de Rattrapage : Session d été 2015 Nom et prénom No matricule No de place Points EX 1 EX 2

Plus en détail

R i = a 0 +b 0 B i +ε i, R = Xβ +ε,

R i = a 0 +b 0 B i +ε i, R = Xβ +ε, Statistiques 2010-2011 TP sur le Modèle linéaire gaussien avec R 1 Les exercices Vous traiterez les exercices suivants avec le logiciel R. Exercice 1 Des photographies aériennes de champs d orge sont analysées

Plus en détail

Chacune des valeurs d une variable en est une modalité particulière.

Chacune des valeurs d une variable en est une modalité particulière. Psychologie générale Jean Paschoud STATISTIQUE Sommaire Rôle de la statistique Variables Échelles de mesure Résumer, décrire Comparer Rôle de la statistique La statistique est avant tout un outil permettant

Plus en détail

Initiation à la théorie des sondages: cours IREM-Dijon

Initiation à la théorie des sondages: cours IREM-Dijon Initiation à la théorie des sondages: cours IREM-Dijon Camelia Goga IMB, Université de Bourgogne Dijon, 12 novembre 2009 Très court historique Laplace a présenté à l Académie des Sciences en 1783 une nouvelle

Plus en détail