T. D. n o 2 Régression linéaire multiple

Documents pareils
Âge effectif de sortie du marché du travail

Quel est le temps de travail des enseignants?

Le creusement des inégalités touche plus particulièrement les jeunes et les pauvres

Actifs des fonds de pension et des fonds de réserve publics

REGARDS SUR L ÉDUCATION 2013 : POINTS SAILLANTS POUR LE CANADA

Régimes publics de retraite État de la situation. Perspectives des différents régimes publics de retraite. Plan

Le point sur les marchés des pensions. des pays de l OCDE OCDE

Analyse de la variance Comparaison de plusieurs moyennes

Quelle part de leur richesse nationale les pays consacrent-ils à l éducation?

LA RÉDUCTION DU TEMPS DE TRAVAIL : UNE COMPARAISON DE LA POLITIQUE DES «35 HEURES» AVEC LES POLITIQUES D AUTRES PAYS MEMBRES DE L OCDE

CMC MARKETS UK PLC. Conditions Tarifaires CFDs. Plateforme Next Generation. Janvier RCS Paris:

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Conditions tarifaires

AMÉLIORER LE RAPPORT COÛT-EFFICACITÉ DES SYSTÈMES DE SANTÉ

à la Consommation dans le monde à fin 2012

Améliorer la gouvernance des Services Publics d'emploi pour de meilleurs résultats sur l'emploi

FRANCE. PISA 2012 : Faits marquants. Performance en mathématiques. Performance en compréhension de l écrit et en sciences

Atlas économique de Paris 2013 du greffe du tribunal de commerce de Paris

La situation en matière de pension privées et de fonds de pension dans les pays de l OCDE

Principaux partenaires commerciaux de l UE, (Part dans le total des échanges de biens extra-ue, sur la base de la valeur commerciale)

MIEUX TRAVAILLER AVEC L ÂGE

Notre solution IP pour réaliser vos plus belles économies. 18 rue Pharaon Toulouse

Mobilité de l enseignement supérieur

Agricultural Policies in OECD Countries: Monitoring and Evaluation Les politiques agricoles des pays de l OCDE: Suivi et évaluation 2005.

La révision des indices du cours du franc suisse, nominaux et réels, pondérés par les exportations

COMPRENDRE, EVALUER ET PREVENIR LE RISQUE DE CORRUPTION

Global WorkPlace Solutions. Créer un avantage concurrentiel

Étude de marché. Critères de qualification Travaux de génie civil et construction de bâtiments industriels au CERN

Résultats techniques de la mortalité au Canada

TARIFICATION DES INSTRUMENTS FINANCIERS AU 01 JANVIER 2015

Taux de risque de pauvreté ou d exclusion sociale le plus élevé en Bulgarie, le plus faible en République tchèque

Étude EcoVadis - Médiation Inter-Entreprises COMPARATIF DE LA PERFORMANCE RSE DES ENTREPRISES FRANCAISES AVEC CELLE DES PAYS DE L OCDE ET DES BRICS

ACCORD RELATIF AU TRANSIT DES SERVICES AÉRIENS INTERNATIONAUX SIGNÉ À CHICAGO LE 7 DÉCEMBRE 1944

Le travail est-il le meilleur antidote contre la pauvreté?

Pension AOW pour les assurés hors des Pays-Bas

Thème 1: l environnement pédagogique et scolaire dans le primaire et le secondaire

ESIEA PARIS

La publication, au second

Niveau de scolarité et emploi : le Canada dans un contexte international

TARIFS DE COURTAGE. OFFRE ZONEBOURSE.COM / INTERACTIVE BROKERS Au 7 juillet 2015

Votre interlocuteur : Téléphonie IP d'entreprise

L épidémiologie du suicide au Québec : que savons-nous de la situation récente?

L Europe des consommateurs : Contexte international Rapport Eurobaromètre 47.0

Document explicatif Introduction à Fairtrade

PROPOSITIONDE RÉSOLUTION PRÉSENTÉEENAPLICATIONDEL'ARTICL E 73 BISDURÈGLEMENT,surla PRÉSENTÉE

Vos lignes téléphoniques fixes Analogiques, numériques (T0/T2) ou IP (Trunk SIP)

Les Français ais et à la consommation

SPÉCIMEN. Couverture Maladie Universelle. Protection de base. Nous sommes là pour vous aider

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Logement aux frais du membre du personnel 3,82 EUR 19,22 EUR 43,78 EUR 23,04 EUR

Un Formulaire officiel de l ambassade de Taiwan. Deux photos d'identité récentes - format 4,5 x 3,5cm (pas de photocopie ni de photo scannée)

La chirurgie ambulatoire dans les pays de l OCDE

SERIE OCDE LES PRINCIPES DE BONNES PRATIQUES DE LABORATOIRE ET LA VERIFICATION DU RESPECT DE CES PRINCIPES. Numéro 2 (révisé)

DEMANDE D IMMATRICULATION D UN TRAVAILLEUR notice explicative

Les perspectives économiques

Conditions tarifaires des principaux services financiers et bancaires au 1 er février intermédiaire en opérations de banque de Socram Banque

La BRI. Au service de la stabilité monétaire et financière

Les concepts et définitions utilisés dans l enquête «Chaînes d activité mondiales»

Guide SEPA Paramétrage Experts Solutions SAGE depuis 24 ans

L indice de SEN, outil de mesure de l équité des systèmes éducatifs. Une comparaison à l échelle européenne

L IMMIGRATION AU SEIN DE L UE

REGARDS SUR L ÉDUCATION RAPPORT INTERMÉDIAIRE MISE À JOUR DES INDICATEURS RELATIFS A L EMPLOI ET AU NIVEAU DE FORMATION

EGALITÉ ENTRE LES FEMMES

Carte Familles nombreuses

les étudiants d assas au service des professionnels

Aperçu des prix des opérations de placement. Édition de janvier 2015

Click to edit Master title style

LES INÉGALITÉS s accroissent dans

3La charge fiscale effective induite par les. 3Les pouvoirs publics consacrent déjà plus. 3Si nous voulons garantir la compétitivité

ICC septembre 2012 Original : anglais. tendances de la consommation du café dans certains pays importateurs.

Vous avez eu ou élevé des enfants Vos droits

RETRAITES : Y A-T-IL UNE SOLUTION IDÉALE EN EUROPE POUR UN AVENIR?

CONFERENCE DE PRESSE > LANCEMENT DU «MANIFESTE POUR UNE SOCIÉTÉ POSITIVE»

Louvain School of Management The Preferred International Management School in Belgium CAMPUS UCL MONS

CAHIERS. Parités de pouvoir d achat : mesure et utilisations STATISTIQUES. Dans ce numéro. Que sont les PPA? mars nº 3

BOURSES SCOLAIRES. au bénéfice des enfants français résidant avec leur famille à l étranger AGENCE POUR L ENSEIGNEMENT FRANÇAIS À L ÉTRANGER

LA SOCIETE DE PARTICIPATIONS FINANCIERES «LA SOPARFI»

Délais de paiement : Le grand écart

Convention pour la reconnaissance mutuelle des inspections concernant la fabrication des produits pharmaceutiques.

CONDITIONS CONTRACTUELLES APPLICABLES A L OPERATION «LES BONNES AFFAIRES MICROSOFT OFFRE MULTIPRODUITS»

SOUSCRIPTION DU CONTRAT : TERRITORIALITE

OBSERVATOIRE DE L EPARGNE EUROPEENNE

L immobilier de bureaux en Europe 2010 : une parenthèse dans la crise

La recherche d assurance maladie à l étranger Procédure à l usage des CPAS

La situation financière des SNF françaises Quelques éléments de diagnostic élaborés à partir des comptes nationaux

relative à l établissement d un bureau international des poids et mesures

Bénéficiaires du droit d asile dans l UE, par nationalités, Irak 5% Afghanistan

VI. TENDANCES DE L INVESTISSEMENT DIRECT ÉTRANGER DANS LES PAYS DE L OCDE

Le commerce de détail en Europe : la diversité des tissus commerciaux

Gestion des débiteurs Financement Assurance-crédit: trois problèmes, une solution: le factoring

Qui sont les enseignants?

TROISIEME REUNION DU FORUM SUR L ADMINISTRATION FISCALE DE L OCDE

THE GLOBAL PV EXPERTS. KRANNICH TRINITY

Les problèmes de politisation. Comprendre. l Indice de réponse humanitaire

Base de données sur l'économie mondiale Alix de Saint Vaulry *

Les enfants laissés pour compte

Transcription:

T. D. n o 2 Régression linéaire multiple Les exercices 1, 2, 5, 6 sont issus du livre «Probabilités, Statistique et technique de régression» de Gérald Baillargeon, Les éditions SMG et les exercices 3, 4 sont issus du livre «Analyse de régression appliquée» de Yadolah Dodge, Édition Dunod. Exercice 1. L anxiété. Un bureau de conseil en ressources humaines a effectué une étude sur le niveau d anxiété Y mesuré sur une échelle de 1 à 50 de cadres d entreprises au cours d une période de deux semaines. Nous voulons examiner si les facteurs suivants peuvent influencer sur le niveau d anxiété des cadres : X 1 : pression artérielle systolique X 2 : test évaluant les capacités managériales X 3 : niveau de satisfaction du poste occupé. Le tableau d analyse de la variance indique l apport de chaque variable introduite dans l ordre indiqué et ceci pour 22 cadres. Source de Somme des ddl Régression due à X 1 981, 326 1 Régression due à X 2 190, 232 1 Régression due à X 3 129, 431 1 Résiduelle 442, 292 18 Totale 1743, 281 21 1. Quelle est la somme des due à la régression pour l ensemble des trois variables explicatives? 2. Quelle proportion de la dans le niveau d anxiété est expliquée par les trois variables explicatives? 3. Pouvons-nous conclure que dans l ensemble les trois variables explicatives ont un effet significatif sur le niveau d anxiété? Utiliser un seuil de signification α = 5%. Préciser les hypothèses que nous souhaitons tester. 4. Si nous ne tenons compte que de la variable explicative X 1, quel serait alors le tableau d analyse de la variance correspondant? Source de Somme des ddl Régression due à X 1 981, 326 Résiduelle Totale 5. Tester les hypothèses nulles suivantes, au seuil de signification α = 5%, en utilisant un rapport F approprié : a) H 0 : β 1 = 0 dans le modèle Y = β 0 + β 1 X 1 + ε ; b) H 0 : β 2 = 0 dans le modèle Y = β 0 + β 1 X 1 + β 2 X 2 + ε ; 1

c) H 0 : β 3 = 0 dans le modèle Y = β 0 + β 1 X 1 + β 2 X 2 + β 3 X 3 + ε. 6. Quelle est la valeur du coefficient de détermination R 2 associée à l estimation de chaque modèle spécifié à la question 5.? 7. Lequel des trois modèles semble le mieux approprié pour expliquer les fluctuations du niveau d anxiété des cadres d entreprises? Exercice 2. Les jouets. Les calculs ont été faits à partir du logiciel R. L entreprise CITRON fabrique un matériau en matière plastique qui est utilisé dans la fabrication de jouets. Le département de contrôle de qualité de l entreprise a effectué une étude qui a pour but d établir dans quelle mesure la résistance à la rupture (en kg/cm 2 ) de cette matière plastique pouvait être affectée par l épaisseur du matériau ainsi que la densité de ce matériau. Douze essais ont été effectués et les résultats sont présentés dans le tableau ci-dessous. Essai Résistance à la rupture Épaisseur du matériau Densité numéro Y i X i1 X i2 1 37, 8 4 4, 0 2 22, 5 4 3, 6 3 17, 1 3 3, 1 4 10, 8 2 3, 2 5 7, 2 1 3, 0 6 42, 3 6 3, 8 7 30, 2 4 3, 8 8 19, 4 4 2, 9 9 14, 8 1 3, 8 10 9, 5 1 2, 8 11 32, 4 3 3, 4 12 21, 6 4 2, 8 Diverses analyses ont été effectuées sur ordinateur et nous les résumons dans les trois tableaux suivants : Régression de la résistance à la rupture Y en fonction de l épaisseur X 1 Coefficients Erreurs-types β j s( β j ) β 0 = 3.523 β 1 = 6.036 s( β 1 ) = 1.279 Source de Somme des ddl Régression X 1 980.63 1 Résiduelle 440.03 110 Régression de la résistance à la rupture Y en fonction de la densité X 2 Coefficients Erreurs-types β j s( β j ) β 0 = 36.373 β 2 = 17.464 s( β 2 ) = 6.069 Source de Somme des ddl Régression X 2 643.57 1 Résiduelle 777.10 10 2

Régression de la résistance à la rupture Y en fonction de l épaisseur X 1 et de la densité X 2 Coefficients Erreurs-types β j s( β j ) β 0 = 30.081 β 1 = 4.905 s( β 1 ) = 1.014 β 2 = 11.072 s( β 2 ) = 3.621 Source de Somme des ddl Régression (X 1, X 2 ) 1204.85 2 Résiduelle 215.81 9 1. Quel pourcentage de dans la résistance à la rupture est expliquée par chacune des régressions? 2. Pour chaque régression linéaire, compléter le tableau suivant : Régression due à X 1 Régression due à X 2 Régression due à (X 1, X 2 ) Carrés moyens résiduels Écart-types résiduels 3. Compléter le tableau d analyse de la variance suivant pour la régression comportant les deux variables explicatives. Source de Somme des ddl Carrés moyens F obs Régression due à (X 1, X 2 ) Résiduelle Totale 4. Tester au seuil de signification α = 5%, l hypothèse nulle contre l hypothèse alternative H 0 : β 1 = β 2 = 0 H 1 : au moins un des β 0. Quelle est votre conclusion? 5. Dans le cas du modèle de régression linéaire ne comportant que l épaisseur du matériau comme variable explicative, déterminer un intervalle de confiance à 95% pour β 1. 6. Avec l intervalle de confiance calculé à la question 5., pouvons-nous affirmer, au seuil de signification α = 5%, que la régression linéaire est significative entre la résistance à la rupture et l épaisseur du matériau? Justifier votre conclusion. 7. Quel est l apport marginal de la variable X 2 lorsqu elle est introduite à la suite de la variable X 1? 8. Est-ce que la contribution marginale de la variable «densité du matériau», lorsqu elle est introduite à la suite de la variable «épaisseur du matériau» est significative au seuil de signification α = 5%? Utiliser les deux façons équivalentes d effectuer ce test. «F partiel» F c t obs t c 3

9. Nous voulons obtenir diverses estimations et prévisions de la résistance à la rupture. Quelle est, en moyenne, la résistance à la rupture de jouets dont l épaisseur du matériau utilisé et la densité du matériau sont celles indiquées dans le tableau suivant? Épaisseur Densité X 1 X 2 4 3, 8 3 3, 4 4 2, 9 Estimation de la résistance moyenne Écart-type de l estimation 2, 10 1, 43 2, 57 10. Entre quelles valeurs peut se situer la résistance moyenne à la rupture, pour des jouets dont l épaisseur du matériau est X 1 = 4 et la densité du matériau est X 2 = 3, 8, si l entreprise utilise un niveau de confiance de 95%? 11. Quelle est la marge d erreur dans l estimation effectuée à la question 10.? 12. Nous désirons un intervalle de prédiction de la résistance à la rupture pour un jouet ayant comme épaisseur du matériau et densité celles précisées à la question 10. Quel est cet intervalle au niveau de confiance de 95%? Exercice 3. Un exercice sans contexte. Nous utilisons le modèle de régression linéaire multiple : Y = β 0 + β 1 X 1 + β 2 X 2 + ε. 1. Compléter le tableau d analyse de variance suivant : Source de Somme des ddl Carrés moyens F obs Régression 1 504, 4 Résiduelle 19, 6 Totale 1 680, 8 2. Tester l hypothèse nulle contre l hypothèse alternative H 0 : β 1 = β 2 = 0. H 1 : au moins un des β 0. 3. Quel est le coefficient de détermination R 2 du modèle? 4. Donner une estimation de la variance de ε. Exercice 4. Les attaques cardiaques. Les données proposées dans cet exercice présentent le taux de décès par attaque cardiaque ches les hommes de 55 à 59 ans dans différents pays. Les variables sont les suivantes : Y : 100 [log(nombre de décès par crise cardiaque pour 100 000 hommes de 55 à 59 ans) -2] ; X 1 : téléphones par millier d habitants ; X 2 : calories grasses en pourcentage du total des calories ; X 3 : calories provenant de protéines animales en pourcentage du total des calories. 1. Régresser Y sur X 1 et tester la signification de cette régression linéaire simple. 4

2. Trouver l équation de la régression linéaire multiple de Y sur X 1 et X 2. 3. Effectuer un test conjoint d hypothèse nulle H 0 : β 1 = β 2 = 0. 4. Tester si l adjonction de la variable X 2 à l équation trouvée à la question 1. a significativement amélioré l estimation. 5. Construire la régression linéaire multiple de Y sur X 1, X 2 et X 3. 6. Donner les limites de l intervalle de confiance à 95% pour β 3 dans cette équation. 7. Donner les limites de l intervalle de confiance à 95% pour Ŷ au point X 1 = 221, X 2 = 39 et X 3 = 7. 8. Tester si X 2 et X 3 ensemble apportent quelque chose à la régression linéaire simple de Y sur X 1. 9. Régresser X 1 sur X 2 et X 3. 10. Donner les limites de l intervalle de confiance à 95% pour les coefficients de la régression linéaire de X 1 sur X 3. Observation Pays X 1 X 2 X 3 Y i x 1i x 2i x 3i x 4i 1 Australie 124 33 8 81 2 Autriche 49 31 6 55 3 Canada 181 38 8 80 4 Ceylan 4 17 2 24 5 Chili 22 20 4 78 6 Danemark 152 39 6 52 7 Finlande 75 30 7 88 8 France 54 29 7 45 9 Allemagne 43 35 6 50 10 Irlande 41 31 5 69 11 Israel 17 23 4 66 12 Italie 22 21 3 45 13 Japon 16 8 3 24 14 Mexique 10 23 3 43 15 Pays-Bas 63 37 6 38 16 Nouvelle-Zélande 170 40 8 72 17 Norvège 125 38 6 41 18 Portugal 12 25 4 38 19 Suède 221 39 7 52 20 Suisse 171 33 7 52 21 Grande-Bretagne 97 38 6 66 22 États-Unis 254 39 8 89 Exercice 5. Qui a raison? Votre collègue ou vous? Dans une étude de régression linéaire multiple comportant quatre variables explicatives X 1, X 2, X 3, X 4, nous avons obtenu le tableau d analyse de la variance suivant, et ceci pour 20 observations. 5

Source de Somme des ddl Carrés moyens Régression (X 1, X 2, X 3, X 4 ) 85 570 4 21 392,50 Résiduelle 1 426 15 95,07 Totale 86 996 19 1. Est-ce que la régression est significative dans son ensemble? Utiliser α = 5%. 2. Une de vos collègues mentionne que les variables X 3 et X 4 sont inutiles dans le modèle de régression linéaire. Une autre analyse de régression linéaire ne comportant cette fois que les variables explicatives X 1 et X 2 conduit au tableau d analyse de la variance suivant. Source de Somme des ddl Carrés moyens Régression (X 1, X 2 ) 62 983 2 31 491,50 Résiduelle 24 013 17 1 412,53 Totale 86 996 19 Est-ce que l affirmation de votre collègue est vraisemblable au seuil de signification α = 5%? Effectuer le test approprié. Exercice 6. Encore un exerice sans contexte. Dans une étude de régression multiple comportant quatre variables explicatives et 20 observations, nous avons introduit, dans l ordre, les variables X 1, X 2, X 3, X 4. Variables explicatives dans l équation Variable additionnelle Écart-type des résidus Proportion de la expliquée Aucune s Y = 2, 7456 X 1 X 1 1,8968 0,5480 X 1, X 2 X 2 1,6352 0,6830 X 1, X 2, X 3 X 3 0,7349 0,9400 X 1, X 2, X 3, X 4 X 4 0,6281 0,9590 1. Dans quelle proportion la non expliquée par X 1 est réduite avec l ajout de X 2 dans l équation de régression? 2. Quelle est la corrélation partielle entre Y et X 3 après s être débarrassé de l influence des variables explicatives X 1 et X 2 sur Y et X 3? Nous considérons que le coefficient de régression β 3 est négatif. 3. Déterminer la somme de résiduelle lorsque les variables explicatives X 1 et X 2 sont dans l équation de régression. 4. Quelle est la somme de de régression attribuable à X 3 lorsque nous ajoutons cette variable à la suite de X 1 et X 2? 5. Quelle est la somme de de régression attribuable à X 4 lorsque nous ajoutons cette variable à la suite de X 1, X 2 et X 3? 6

Exercice 7. Le coefficient de corrélation partielle. Supposons que dans l exercice précédent, les variables ont été introduites dans l ordre suivant : X 2, X 3, X 4, X 1. Nous avons alors le tableau suivant : Variables explicatives dans l équation Variable additionnelle Écart-type résiduel Aucune s Y = 2, 7456 X 2 X 2 2,8116 X 2, X 3 X 3 2,5486 X 2, X 3, X 4 X 4 2,4935 X 2, X 3, X 4, X 1 X 1 0,6281 1. Déterminer les coefficients de détermination multiple suivants : R 2 Y,2, R2 Y,2,3, R 2 Y,2,3,4, R2 Y,2,3,4,1. 2. Déterminer la somme de résiduelle lorsque les variables explicatives X 2 et X 3 sont dans l équation de régression linéaire. 3. Déterminer les coefficients de détermination partielle suivants : r 2 Y,3,2, r2 Y,4,2,3, r 2 Y,1,2,3,4. 4. Quelle est la corrélation partielle entre Y et X 3 après s être débarrassé de l influence de X 2 sur Y et X 3? Nous supposons que le coefficient de β 3 peut être négatif. 5. Quelle est la somme de de régression attribuable à X 4 lorsque nous ajoutons cette variable à la suite de X 2 et X 3? 6. Quelle est la somme de de régression attribuable à X 1 lorsque nous ajoutons cette variable à la suite de X 2, X 3 et X 4? 7