REGRESSION MULTIPLE: CONSOMMATION D ELECTRICITE



Documents pareils
Exemples d application

MODELE A CORRECTION D ERREUR ET APPLICATIONS

Modèles pour données répétées

Exemple PLS avec SAS

Régression linéaire. Nicolas Turenne INRA

Exercices M1 SES Ana Fermin ( fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

Analyse de la variance Comparaison de plusieurs moyennes

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

Chapitre 4 : Régression linéaire

Une introduction. Lionel RIOU FRANÇA. Septembre 2008

Évaluation de la régression bornée

IBM SPSS Regression 21

Un exemple de régression logistique sous

STATISTIQUES. UE Modélisation pour la biologie

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Introduction à l approche bootstrap

Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9

Data mining II. Modélisation Statistique & Apprentissage

Bureau : 238 Tel : dominique.muller@upmf-grenoble.fr

SAS de base : gestion des données et procédures élémentaires

Données longitudinales et modèles de survie

INITIATION AU LOGICIEL SAS

Lire ; Compter ; Tester... avec R

TABLE DES MATIERES. C Exercices complémentaires 42

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

Formations EViews FORMATIONS GENERALES INTRODUCTIVES INTRO : INTRODUCTION A LA PRATIQUE DE L ECONOMETRIE AVEC EVIEWS

PROGRAMME (Susceptible de modifications)

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

LOGO. Module «Big Data» Extraction de Connaissances à partir de Données. Claudia MARINICA MCF, ETIS UCP/ENSEA/CNRS

Principe d un test statistique

Relation entre deux variables : estimation de la corrélation linéaire

2.4 Représentation graphique, tableau de Karnaugh

Imputation du salaire d ego dans TeO

Étude de cas Assurance (d après une étude de Philippe Périé, CISIA)

CONFERENCE PALISADE. Optimisation robuste d un plan d expériences par simulation Monte-Carlo Concepts de «Design Space» et de «Quality by Design»

Logiciel XLSTAT version rue Damrémont PARIS

FORMULAIRE DE STATISTIQUES

Gestion de Portefeuille. Mesures de Performance Ajustées du Risque

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 06/12/2009 Stéphane Tufféry - Data Mining -

Le risque Idiosyncrasique

ESIEA PARIS

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU

Séance 11 : Typologies

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Séance 0 : Linux + Octave : le compromis idéal

Introduction à la statistique non paramétrique

INF6304 Interfaces Intelligentes

Introduction aux Statistiques et à l utilisation du logiciel R

Modèles Estimés sur Données de Panel

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année

ANTISELECTION ET CHOIX D'ASSURANCE : LE CAS DU VOL EN HABITATION UNE APPROCHE DE LA MESURE DU PHENOMENE

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

1 Définition de la non stationnarité

Critère du choix des variables auxiliaires à utiliser dans l'estimateur par calage

Mémoire d actuariat - promotion complexité et limites du modèle actuariel, le rôle majeur des comportements humains.

Analyse des durées de vie avec le logiciel R

Analyse discriminante et régression logistique: application au cas de l innovation pour les entreprises du Canton du Tessin

CAPTEURS - CHAINES DE MESURES

Modèle GARCH Application à la prévision de la volatilité

Biostatistiques : Petits effectifs

Une comparaison de méthodes de discrimination des masses de véhicules automobiles

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

LE TABLEUR OPENOFFICE CALC : CONTRÔLES DE FORMULAIRES ACCÈS AUX BASES DE DONNÉES

PROJET MODELE DE TAUX

données en connaissance et en actions?

Chapitre 3. Les distributions à deux variables

SAS ENTERPRISE MINER POUR L'ACTUAIRE

Séries Statistiques Simples


Introduction au Data-Mining

1. Vocabulaire : Introduction au tableau élémentaire

Processus de compétitivité : Facteurs et évaluation

Exercices sur SQL server 2000

EFFICACITÉ ET INNOCUITÉ D UN MÉDICAMENT CONTRE LA MPOC COMPARATIVEMENT À UN CONTRÔLE

Répartition du tourisme de croisière dans la Caraïbe : quels déterminants?

Comment évaluer une banque?

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

Exercice : la frontière des portefeuilles optimaux sans actif certain

Introduction à la Statistique Inférentielle

1 Modélisation d être mauvais payeur

Université de Montréal. département de sociologie. L'analyse factorielle et l'analyse de fidélité. notes de cours et exemples

SDLS08 - Modes propres d'une plaque carrée calculés sur base réduite

FOAD COURS D ECONOMETRIE 1 CHAPITRE 2 : Hétéroscédasicité des erreurs. 23 mars 2012.

Analyse des correspondances avec colonne de référence

Statistiques Descriptives à une dimension

Faire un semi variograme et une carte krigée avec surfer

IBM SPSS Forecasting. Créez des prévisions d'expert en un clin d'œil. Points clés. IBM Software Business Analytics

PROGRAMMATION ET LOGICIELS ECONOMETRIQUES

Introduction à SPSS. Guy Mélard, U.L.B. Mars 2006 Guy Mélard, ULB 1. Introduction à SPSS. Objectif de la leçon.

DETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES

Validation probabiliste d un Système de Prévision d Ensemble

Didacticiel - Études de cas. Description de quelques fonctions du logiciel PSPP, comparaison des résultats avec ceux de Tanagra, R et OpenStat.

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Christophe SANNIER

Surveillance et maintenance prédictive : évaluation de la latence de fautes. Zineb SIMEU-ABAZI Univ. Joseph Fourier, LAG)

Premiers pas avec SES-Pegase (version 7.0) SES : Un Système Expert pour l analyse Statistique des données. Premiers pas avec SES-Pegase 1

TP: Représentation des signaux binaires. 1 Simulation d un message binaire - Codage en ligne

Ects. Utilitaire d Économétrie Version 2. Russell Davidson

Exemples d Analyses de Variance avec R

Utilisation du Logiciel de statistique SPSS 8.0

Transcription:

REGRESSION MULTIPLE: CONSOMMATION D ELECTRICITE LES DONNEES OBS KW SURFACE PERS PAVILLON AGE VOL SBAINS 1 4805 130 4 1 65 410 1 2 3783 123 4 1 5 307 2 3 2689 98 3 0 18 254 1 4 5683 178 6 1 77 570 3 5 3750 134 4 1 5 335 2 6 2684 100 4 0 34 280 1 7 1478 78 3 0 7 180 1 8 1685 100 4 0 10 250 1 9 1980 95 3 0 8 237 1 10 1075 78 4 0 5 180 1 11 2423 110 5 1 12 286 1 12 4253 130 4 1 25 351 1 13 1754 73 2 0 56 220 1 14 1873 87 4 1 2 217 2 15 3487 152 5 1 12 400 2 16 2954 128 5 1 20 356 1 17 4762 180 7 1 27 520 2 18 3076 124 4 0 22 330 1 DESCRIPTION DES VARIABLES KW: Nombre de KWH consommés pendant le mois de janvier SURFACE: Surface du logement en m 2 PERS: Nombre de personnes habitant le logement PAVILLON: Pavillon codé 1; Appartement codé 0 AGE: Age du logement VOL: Volume intérieur du logement en m 3 SBAINS: Nombre desalles de bains CONSOMMATION D ELECTRICITE- LOGICIEL STATGRAPHICS

OBJECTIF: On souhaite expliquer la consommation d électricité au mois de janvier pour des logements équipés du tout électrique. Construire un modèle adapté à l aide des variables disponibles. A l aide du modèle retenu donner une estimation par intervalle pour la consommation d un pavillon d une surface de 150 m2, habité par 4 personnes, construit il y a 18 ans, comprenant deux salles de bains et dont le volume intérieur est de 405 m3 TABLEAU 1 : Correlation Analysis Simple Statistics Variable N Mean Std Dev Sum Minimum Maximum KW 18 3011 1299 54194 1075 5683 SURFACE 18 116.55556 31.71050 2098 73.00000 180.00000 PERS 18 4.16667 1.15045 75.00000 2.00000 7.00000 PAVILLON 18 0.55556 0.51131 10.00000 0 1.00000 AGE 18 22.77778 22.02821 410.00000 2.00000 77.00000 VOL 18 315.72222 107.95740 5683 180.00000 570.00000 SBAINS 18 1.38889 0.60768 25.00000 1.00000 3.00000 Pearson Correlation Coefficients / Prob > R under Ho: Rho=0 / N = 18 KW SURFACE PERS PAVILLON AGE VOL SBAINS KW 1.00000 0.90270 0.62296 0.67877 0.56683 0.92988 0.59201 0.0 0.0001 0.0058 0.0020 0.0142 0.0001 0.0096 SURFACE 0.90270 1.00000 0.83739 0.67641 0.36356 0.96963 0.65970 0.0001 0.0 0.0001 0.0021 0.1381 0.0001 0.0029 PERS 0.62296 0.83739 1.00000 0.63333 0.15242 0.79750 0.57496 0.0058 0.0001 0.0 0.0048 0.5460 0.0001 0.0126 PAVILLON 0.67877 0.67641 0.63333 1.00000 0.11606 0.63382 0.58898 0.0020 0.0021 0.0048 0.0 0.6465 0.0047 0.0101 AGE 0.56683 0.36356 0.15242 0.11606 1.00000 0.57220 0.20019 0.0142 0.1381 0.5460 0.6465 0.0 0.0131 0.4258 VOL 0.92988 0.96963 0.79750 0.63382 0.57220 1.00000 0.63567 0.0001 0.0001 0.0001 0.0047 0.0131 0.0 0.0046 SBAINS 0.59201 0.65970 0.57496 0.58898 0.20019 0.63567 1.00000 0.0096 0.0029 0.0126 0.0101 0.4258 0.0046 0.0 CONSOMMATION D ELECTRICITE LOGICIEL STATGRAPHICS 2

KW surface pers pavillon age vol sbains TABLEAU 2 : MODELE COMPLET Analyse de régression multiple Variable à expliquer: KW Paramètre Estimation Erreur T Proba. type CONSTANTE -226,408 1344,21-0,168432 0,8693 surface 28,2901 54,3052 0,520947 0,6127 pers -456,262 229,229-1,99042 0,0720 pavillon 595,984 276,274 2,15722 0,0540 age 8,40731 27,0671 0,31061 0,7619 vol 4,52065 20,0856 0,225069 0,8261 sbains -78,4555 219,732-0,357052 0,7278 Analyse de variance Source Somme des carrés Ddl Carré moyen F Proba. Modèle 2,69498E7 6 4,49163E6 28,33 0,0000 Résidu 1,74383E6 11 158530,0 Total (Corr.) 2,86936E7 17 R-carré = 93,9226 % R-carré (ajusté pour les ddl) = 90,6076 % Estimation de l'écart-type du résidu = 398,158 Erreur absolue moyenne = 240,068 Test de Durbin-Watson = 1,58315 (P=0,1643) Autocorrélation résiduelle d'ordre 1 = 0,188723 CONSOMMATION D ELECTRICITE LOGICIEL STATGRAPHICS 3

Le StatAdvisor -------------- Le tableau montre les résultats de l'ajustement d'un modèle de régression linéaire multiple pour décrire la relation entre KW et 6variables explicatives. L'équation du modèle ajusté est : KW = -226,408 + 28,2901*surface - 456,262*pers + 595,984*pavillon + 8,40731*age + 4,52065*vol - 78,4555*sbains Comme la valeur de la probabilité dans le tableau de l'anova est inférieure à 0.01, il y a une relation statistiquement significative entre les variables au niveau de confiance de 99%. La statistique du R-carré indique que le modèle ajusté explique 93,9226% de la variabilité de KW. La statistique du R-carré ajusté, qui est plus adaptée pour comparer des modèles comportant des nombres différents de variables explicatives, est 90,6076%. L'erreur-type d'estimation indique que l'écart-type des résidus est de 398,158. Cette valeur peut être utilisée pour construire des limites de prévision pour de nouvelles observations en sélectionnant l'option Rapports dans le menu des options pour les tableaux. L'erreur absolue moyenne de 240,068 est la valeur moyenne des résidus. La statistique de Durbin-Watson (DW) teste les résidus pour déterminer s'il y a une corrélation significative basée sur l'ordre dans lequel ils apparaissent dans le fichier des données. Comme la valeur de la probabilité est supérieure à 0.05, il n'y a pas de corrélation sérielle dans les résidus. Pour déterminer si le modèle peut être simplifié, noter que la plus grande valeur de probabilité pour les variables explicatives est de 0,8261, et est associée à vol. Comme la valeur de la probabilité est supérieure ou égale à 0.10, ce terme n'est pas statistiquement significatif au niveau de confiance de 90% ou plus. Ainsi, vous pouvez envisager de supprimer vol du modèle. CONSOMMATION D ELECTRICITE LOGICIEL STATGRAPHICS 4

TABLEAU 3 : SELECTION DE MODELES Variables explicatives: A=surface B=pers C=pavillon D=age E=vol F=sbains Modèles ayant les plus grands R-carrés ajustés Résultats des modèles ---------------------------------------------------------------- R-carré Variables MSE R-carré ajusté Cp incluses ---------------------------------------------------------------- 134494,0 93,4378 92,0317 1,8774 BCE 136156,0 93,8313 91,9332 3,16524 ABCD 137132,0 93,7871 91,8754 3,24531 ABCE 139250,0 93,6911 91,7499 3,41903 BCDE 143871,0 93,4818 91,4761 3,79791 BCEF 145988,0 93,8946 91,3507 5,05066 ABCDF 146594,0 93,8693 91,3148 5,09648 ABCEF 147003,0 93,8522 91,2906 5,12749 ABCDE 148904,0 93,7727 91,1779 5,27139 BCDEF 177762,0 91,3268 89,4682 5,6984 ABE 177886,0 91,3207 89,4609 5,70937 BDE 182386,0 91,1012 89,1943 6,10673 ABD 183204,0 91,6997 89,1458 7,02333 ACDE 184903,0 90,3339 89,0451 5,49546 BE 196240,0 90,4252 88,3735 7,33022 BEF 197657,0 91,7337 88,2895 8,96176 ACDEF 228616,0 88,0488 86,4553 9,63151 AD 233303,0 87,8037 86,1776 10,075 CE 240994,0 87,4017 85,7219 10,8027 AB 242673,0 86,4682 85,6224 10,4924 E 255417,0 86,6477 84,8674 12,1674 DE 332022,0 81,486 80,3288 19,5101 A 967100,0 46,073 42,7026 83,6068 C 1,09739E6 38,808 34,9835 96,7565 B 1,16483E6 35,0475 30,988 103,563 F 1,68786E6 0,0 0,0 164,998 ---------------------------------------------------------------- Le StatAdvisor -------------- Ce tableau affiche les modèles qui ont les meilleurs R-carrés ajustés. La statistique du R- carré ajusté mesure la proportion de la variabilité de KW expliquée par le modèle. De larges valeurs du R-carré ajusté correspondent à de petites valeurs de l'erreur quadratique moyenne (MSE). Jusqu'à 5 modèles pour chaque sous-ensemble de 0 à 5 variables sont affichés. Le meilleur modèle contient 3 variables, pers, pavillon, et vol. CONSOMMATION D ELECTRICITE LOGICIEL STATGRAPHICS 5

TABLEAU 4 : Procédure de sélection ascendante Régression pas à pas ------------------- Méthode: sélection ascendante F-en-entrée: 4,0 F-en-sortie: 4,0 Etape 0: --------- 0 variables dans le modèle. 17 ddl pour l'erreur. R-carré = 0,00% R-carré ajusté = 0,00% Err. moy. quadra. = 1,68786E6 Etape 1: --------- Entrée de la variable vol avec F-en-entrée = 102,24 1 variables dans le modèle. 16 ddl pour l'erreur. R-carré = 86,47% R-carré ajusté = 85,62% Err. moy. quadra. = 242673,0 Etape 2: --------- Entrée de la variable pers avec F-en-entrée = 5,99892 2 variables dans le modèle. 15 ddl pour l'erreur. R-carré = 90,33% R-carré ajusté = 89,05% Err. moy. quadra. = 184903,0 Etape 3: --------- Entrée de la variable pavillon avec F-en-entrée = 6,62205 3 variables dans le modèle. 14 ddl pour l'erreur. R-carré = 93,44% R-carré ajusté = 92,03% Err. moy. quadra. = 134494,0 Modèle final ajusté. TABLEAU 5 : Procédure de sélection descendante Régression pas à pas ------------------- Méthode: sélection descendante F-en-entrée: 4,0 F-en-sortie: 4,0 Etape 0: --------- 6 variables dans le modèle. 11 ddl pour l'erreur. R-carré = 93,92% R-carré ajusté = 90,61% Err. moy. quadra. = 158530,0 Etape 1: --------- Sortie de la variable vol avec F-en-sortie = 0,0506563 5 variables dans le modèle. 12 ddl pour l'erreur. R-carré = 93,89% R-carré ajusté = 91,35% Err. moy. quadra. = 145988,0 Etape 2: --------- Sortie de la variable sbains avec F-en-sortie = 0,124425 4 variables dans le modèle. 13 ddl pour l'erreur. R-carré = 93,83% R-carré ajusté = 91,93% Err. moy. quadra. = 136156,0 Modèle final ajusté. CONSOMMATION D ELECTRICITE LOGICIEL STATGRAPHICS 6

Analyse de régression multiple : Etude du modèle à 4 variables provenant de la sélection descendante Variable à expliquer: KW Paramètre Estimation Erreur T Proba. type CONSTANTE -522,588 399,74-1,30732 0,2138 surface 39,7409 6,182 6,42849 0,0000 pers -420,354 150,147-2,79961 0,0150 pavillon 584,532 243,692 2,39865 0,0322 age 14,4034 4,62065 3,11719 0,0082 Analyse de variance Source Somme des carrés Ddl Carré moyen F Proba. Modèle 2,69236E7 4 6,7309E6 49,44 0,0000 Résidu 1,77002E6 13 136156,0 Total (Corr.) 2,86936E7 17 R-carré = 93,8313 % R-carré (ajusté pour les ddl) = 91,9332 % Estimation de l'écart-type du résidu = 368,993 Erreur absolue moyenne = 240,364 Test de Durbin-Watson = 1,64108 (P=0,1949) Autocorrélation résiduelle d'ordre 1 = 0,149834 CONSOMMATION D ELECTRICITE LOGICIEL STATGRAPHICS 7

TABLEAU 6 : Modele à 3 variables: VOL PAVILLON PERS Analyse de régression multiple Variable à expliquer: KW Paramètre Estimation Erreur T Proba. type CONSTANTE 399,088 364,086 1,09614 0,2915 pers -461,968 133,248-3,46699 0,0038 pavillon 601,781 233,852 2,57334 0,0221 vol 13,3099 1,42069 9,36861 0,0000 Analyse de variance Source Somme des carrés Ddl Carré moyen F Proba. Modèle 2,68107E7 3 8,9369E6 66,45 0,0000 Résidu 1,88292E6 14 134494,0 Total (Corr.) 2,86936E7 17 R-carré = 93,4378 % R-carré (ajusté pour les ddl) = 92,0317 % Estimation de l'écart-type du résidu = 366,735 Erreur absolue moyenne = 267,736 Test de Durbin-Watson = 1,54956 (P=0,1171) Autocorrélation résiduelle d'ordre 1 = 0,210465 Le StatAdvisor -------------- Le tableau montre les résultats de l'ajustement d'un modèle de régression linéaire multiple pour décrire la relation entre KW et 3 variables explicatives. L'équation du modèle ajusté est : KW = 399,088-461,968*pers + 601,781*pavillon + 13,3099*vol Matrice des corrélations des coefficients estimés CONSTANTE pers pavillon vol CONSTANTE 1,0000-0,6119 0,4007-0,1245 pers -0,6119 1,0000-0,2740-0,6617 pavillon 0,4007-0,2740 1,0000-0,2757 vol -0,1245-0,6617-0,2757 1,0000 Le StatAdvisor -------------- Le tableau donne les corrélations estimées entre les coefficients du modèle ajusté. Ces corrélations peuvent être utilisées pour détecter la présence de sérieuses multicolinéarités, par exemple la corrélation entre les variables explicatives. Dans ce cas, il y a 1 corrélation en valeur absolue supérieure à 0.5 (sans inclure le terme constant). CONSOMMATION D ELECTRICITE LOGICIEL STATGRAPHICS 8

INTERPRETATION DU MODELE Graphique Composant+Résidu pour KW Effet du composant 4000 3000 2000 1000 0-1000 -2000 180 280 380 480 580 vol CONSOMMATION D ELECTRICITE LOGICIEL STATGRAPHICS 9

Graphique Composant+Résidu pour KW Effet du composant 1100 700 300-100 -500-900 -1300 2 3 4 5 6 7 pers Graphique Composant+Résidu pour KW Effet du composant 1000 600 200-200 -600-1000 0 0,2 0,4 0,6 0,8 1 pavillon CONSOMMATION D ELECTRICITE LOGICIEL STATGRAPHICS 10

TABLEAU 8: PREVISION ET MESURES D INFLUENCE Résultats de la régression pour KW ---------------------------------------------------------------------- Observé Ajusté Studentisé Ligne Résidu Résidu ---------------------------------------------------------------------- 1 4805,0 4610,06 194,94 0,601449 2 3783,0 3239,14 543,861 1,72005 3 2689,0 2393,9 295,099 0,867474 4 5683,0 5815,71-132,709-0,463294 5 3750,0 3611,82 138,184 0,395921 6 2684,0 2277,99 406,01 1,22497 7 1478,0 1408,97 69,0329 0,197883 8 1685,0 1878,69-193,693-0,564645 9 1980,0 2167,63-187,632-0,537765 10 1075,0 946,999 128,001 0,405855 11 2423,0 2497,66-74,6618-0,22819 12 4253,0 3824,77 428,225 1,30327 13 1754,0 2403,33-649,332-2,54517 14 1873,0 2041,25-168,246-0,543899 15 3487,0 4014,99-527,992-1,60553 16 2954,0 3429,36-475,356-1,43083 17 4762,0 4688,25 73,7548 0,264483 18 3076,0 2943,49 132,514 0,389432 ---------------------------------------------------------------------- Résultats de la régression pour KW --------- Observé Inf. 95,0% NC Sup. 95,0% NC Inf. 95,0% NC Sup. 95,0% NC Ligne pour prév. pour prév. pour moy. pour moy. --------- 1 4805,0 3729,06 5491,06 4213,24 5006,88 2 3783,0 2394,66 4083,62 2931,81 3546,46 3 2689,0 1548,65 3239,15 2084,45 2703,35 4 5683,0 4877,04 6754,38 5303,45 6327,97 5 3750,0 2768,74 4454,89 3308,36 3915,27 6 2684,0 1433,03 3122,95 1969,33 2586,65 7 1478,0 562,82 2255,11 1097,08 1720,85 8 1685,0 1028,74 2728,64 1556,64 2200,75 9 1980,0 1327,51 3007,75 1872,49 2462,77 10 1075,0 48,603 1845,39 512,922 1381,08 11 2423,0 1615,47 3379,85 2098,2 2897,13 12 4253,0 2978,63 4670,92 3512,9 4136,65 13 1754,0 1497,34 3309,32 1953,75 2852,91 14 1873,0 1136,07 2946,43 1593,3 2489,2 15 3487,0 3188,06 4841,93 3759,79 4270,2 16 2954,0 2597,69 4261,03 3159,2 3699,51 17 4762,0 3737,76 5638,73 4154,65 5221,84 18 3076,0 2084,98 3801,99 2599,49 3287,48 --------- Résidus non usuels -------------------------------------------------------------- Ligne Y Y Résidu Résidu prévu studentisé -------------------------------------------------------------- 13 1754,0 2403,33-649,332-2,55 -------------------------------------------------------------- CONSOMMATION D ELECTRICITE LOGICIEL STATGRAPHICS 11

Le StatAdvisor -------------- Le tableau des résidus non usuels liste les observations qui ont des résidus studentisés supérieurs à 2.0 en valeur absolue. Les résidus studentisés mesurent de combien d'écartstypes chaque valeur observée de KW varie si on ajuste un modèle utilisant toutes les observations sauf cette observation. Dans ce cas, il y a un résidu studentisé supérieur à 2.0, mais aucun supérieur à 3.0. Points influents ------------------------------------------------ Ligne Levier Distance de DFITS Mahalanobis ------------------------------------------------ 13 0,326697 6,82226-1,7729 ------------------------------------------------ Levier moyen pour une observation = 0,222222 Le StatAdvisor -------------- Le tableau des points influents liste les observations qui ont des leviers supérieurs à 3 fois celui d'un point moyen ou qui ont des valeurs particulièrement élevées du DFITS. Le levier est une statistique qui mesure l'influence de chaque observation dans la détermination des coefficients du modèle estimé. La statistique DFITS mesure de combien les coefficients estimés changent si chaqueobservation était retirée du jeu des données. Dans ce cas, un point moyen a un levier égal à 0,222222. Il n'y a pas de points ayant un levier 3 fois plus grand que le levier moyen. Il y a un point qui a une valeur particulièrement grande du DFITS. CONSOMMATION D ELECTRICITE LOGICIEL STATGRAPHICS 12

REGRESSION MULTIPLE: CONSOMMATION D ELECTRICITE LES DONNEES OBS KW SURFACE PERS PAVILLON AGE VOL SBAINS 1 4805 130 4 1 65 410 1 2 3783 123 4 1 5 307 2 3 2689 98 3 0 18 254 1 4 5683 178 6 1 77 570 3 5 3750 134 4 1 5 335 2 6 2684 100 4 0 34 280 1 7 1478 78 3 0 7 180 1 8 1685 100 4 0 10 250 1 9 1980 95 3 0 8 237 1 10 1075 78 4 0 5 180 1 11 2423 110 5 1 12 286 1 12 4253 130 4 1 25 351 1 13 1754 73 2 0 56 220 1 14 1873 87 4 1 2 217 2 15 3487 152 5 1 12 400 2 16 2954 128 5 1 20 356 1 17 4762 180 7 1 27 520 2 18 3076 124 4 0 22 330 1 DESCRIPTION DES VARIABLES KW: Nombre de KWH consommés pendant le mois de janvier SURFACE: Surface du logement en m 2 PERS: Nombre de personnes habitant le logement PAVILLON: Pavillon codé 1; Appartement codé 0 AGE: Age du logement VOL: Volume intérieur du logement en m 3 SBAINS: Nombre desalles de bains Consommation d électricité logiciel SAS

OBJECTIF: On souhaite expliquer la consommation d électricité au mois de janvier pour des logements équipés du tout électrique. Construire un modèle adapté à l aide des variables disponibles. A l aide du modèle retenu donner une estimation par intervalle pour la consommation d un pavillon d une surface de 150 m2, habité par 4 personnes, construit il y a 18 ans, comprenant deux salles de bains et dont le volume intérieur est de 405 m3 TABLEAU 1: PROGRAMME SAS OPTIONS LS=80; data electric; INPUT KW SURFACE PERS PAVILLON AGE VOL SBAINS ; cards; 4805 130 4 1 65 410 1 3783 123 4 1 5 307 2 2689 98 3 0 18 254 1 5683 178 6 1 77 570 3 3750 134 4 1 5 335 2 2684 100 4 0 34 280 1 1478 78 3 0 7 180 1 1685 100 4 0 10 250 1 1980 95 3 0 8 237 1 1075 78 4 0 5 180 1 2423 110 5 1 12 286 1 4253 130 4 1 25 351 1 1754 73 2 0 56 220 1 1873 87 4 1 2 217 2 3487 152 5 1 12 400 2 2954 128 5 1 20 356 1 4762 180 7 1 27 520 2 3076 124 4 0 22 330 1. 150 4 1 18 405 2 ; proc print; proc corr; proc reg data= electric; model KW = SURFACE PERS PAVILLON AGE VOL SBAINS ; model KW = SURFACE PERS PAVILLON AGE VOL SBAINS / selection=adjrsq rmse cp; model KW = SURFACE PERS PAVILLON AGE VOL SBAINS / selection =forward details ; model KW = SURFACE PERS PAVILLON AGE VOL SBAINS / selection = backward details; model KW = PAVILLON PERS VOL 2

/ CORRB COLLIN INFLUENCE R CLM CLI ; quit; TABLEAU 2 : Correlation Analysis Simple Statistics Variable N Mean Std Dev Sum Minimum Maximum KW 18 3011 1299 54194 1075 5683 SURFACE 18 116.55556 31.71050 2098 73.00000 180.00000 PERS 18 4.16667 1.15045 75.00000 2.00000 7.00000 PAVILLON 18 0.55556 0.51131 10.00000 0 1.00000 AGE 18 22.77778 22.02821 410.00000 2.00000 77.00000 VOL 18 315.72222 107.95740 5683 180.00000 570.00000 SBAINS 18 1.38889 0.60768 25.00000 1.00000 3.00000 Pearson Correlation Coefficients / Prob > R under Ho: Rho=0 / N = 18 KW SURFACE PERS PAVILLON AGE VOL SBAINS KW 1.00000 0.90270 0.62296 0.67877 0.56683 0.92988 0.59201 0.0 0.0001 0.0058 0.0020 0.0142 0.0001 0.0096 SURFACE 0.90270 1.00000 0.83739 0.67641 0.36356 0.96963 0.65970 0.0001 0.0 0.0001 0.0021 0.1381 0.0001 0.0029 PERS 0.62296 0.83739 1.00000 0.63333 0.15242 0.79750 0.57496 0.0058 0.0001 0.0 0.0048 0.5460 0.0001 0.0126 PAVILLON 0.67877 0.67641 0.63333 1.00000 0.11606 0.63382 0.58898 0.0020 0.0021 0.0048 0.0 0.6465 0.0047 0.0101 AGE 0.56683 0.36356 0.15242 0.11606 1.00000 0.57220 0.20019 0.0142 0.1381 0.5460 0.6465 0.0 0.0131 0.4258 VOL 0.92988 0.96963 0.79750 0.63382 0.57220 1.00000 0.63567 0.0001 0.0001 0.0001 0.0047 0.0131 0.0 0.0046 SBAINS 0.59201 0.65970 0.57496 0.58898 0.20019 0.63567 1.00000 0.0096 0.0029 0.0126 0.0101 0.4258 0.0046 0.0 3

KW surface pers pavillon age vol sbains 4

TABLEAU 3 : MODELE COMPLET Model: MODEL1 Dependent Variable: KW Analysis of Variance Sum of Mean Source DF Squares Square F Value Prob>F Model 6 26949783.064 4491630.5107 28.333 0.0001 Error 11 1743828.0466 158529.82242 C Total 17 28693611.111 Root MSE 398.15804 R-square 0.9392 Dep Mean 3010.77778 Adj R-sq 0.9061 C.V. 13.22442 Parameter Estimates Parameter Standard T for H0: Variable DF Estimate Error Parameter=0 Prob > T INTERCEP 1-226.407789 1344.2096254-0.168 0.8693 SURFACE 1 28.290102 54.30518332 0.521 0.6127 PERS 1-456.261605 229.22900510-1.990 0.0720 PAVILLON 1 595.983723 276.27357029 2.157 0.0540 AGE 1 8.407310 27.06708563 0.311 0.7619 VOL 1 4.520655 20.08559412 0.225 0.8261 SBAINS 1-78.455549 219.73170525-0.357 0.7278 5

TABLEAU 4 : SELECTION DE MODELES N = 18 Regression Models for Dependent Variable: KW Adjusted R-square C(p) Root Variables in Model R-square In MSE 0.9203165 0.9343783 3 1.8774 366.735 PERS PAVILLON VOL 0.9193324 0.9383130 4 3.1652 368.993 SURFACE PERS PAVILLON AGE 0.9187539 0.9378706 4 3.2453 370.313 SURFACE PERS PAVILLON VOL 0.9174988 0.9369108 4 3.4190 373.163 PERS PAVILLON AGE VOL 0.9147614 0.9348175 4 3.7979 379.303 PERS PAVILLON VOL SBAINS 0.9135069 0.9389460 5 5.0507 382.084 SURFACE PERS PAVILLON AGE SBAINS 0.9131482 0.9386929 5 5.0965 382.875 SURFACE PERS PAVILLON VOL SBAINS 0.9129055 0.9385216 5 5.1275 383.410 SURFACE PERS PAVILLON AGE VOL 0.9117793 0.9377265 5 5.2714 385.881 PERS PAVILLON AGE VOL SBAINS 0.9060764 0.9392259 6 7.0000 398.158 SURFACE PERS PAVILLON AGE VOL SBAINS 0.8946822 0.9132677 3 5.6984 421.618 SURFACE PERS VOL 0.8946085 0.9132070 3 5.7094 421.765 PERS AGE VOL 0.8919427 0.9110116 3 6.1067 427.066 SURFACE PERS AGE 0.8914581 0.9169973 4 7.0233 428.023 SURFACE PAVILLON AGE VOL 0.8904509 0.9033390 2 5.4955 430.004 PERS VOL 0.8867665 0.9134097 4 7.6727 437.175 SURFACE PERS AGE VOL 0.8867645 0.9134081 4 7.6730 437.179 SURFACE PERS VOL SBAINS 0.8866067 0.9132875 4 7.6948 437.484 PERS AGE VOL SBAINS 0.8840015 0.9112953 4 8.0554 442.481 SURFACE PERS AGE SBAINS 0.8837346 0.9042520 3 7.3302 442.990 PERS VOL SBAINS 0.8828948 0.9173375 5 8.9618 444.587 SURFACE PAVILLON AGE VOL SBAINS 0.8799331 0.9011214 3 7.8969 450.173 SURFACE PAVILLON AGE 0.8774797 0.9135151 5 9.6536 454.749 SURFACE PERS AGE VOL SBAINS 0.8716667 0.9018628 4 9.7627 465.412 SURFACE PAVILLON AGE SBAINS 0.8691061 0.8922050 3 9.5107 470.033 SURFACE PERS PAVILLON 0.8645977 0.8884923 3 10.1827 478.059 SURFACE AGE VOL 0.8645527 0.8804877 2 9.6315 478.138 SURFACE AGE 0.8628058 0.8870166 3 10.4498 481.211 PAVILLON AGE VOL 0.8617758 0.8780374 2 10.0750 483.015 PAVILLON VOL 0.8599368 0.8928929 4 11.3862 486.217 SURFACE PERS PAVILLON SBAINS 0.8572194 0.8740172 2 10.8027 490.911 SURFACE PERS 0.8562242 0.8646816 1 10.4924 492.619 VOL 0.8549962 0.8805851 3 11.6139 494.718 SURFACE AGE SBAINS 0.8547666 0.8889392 4 12.1018 495.110 SURFACE AGE VOL SBAINS 0.8535348 0.8793816 3 11.8317 497.205 PAVILLON VOL SBAINS 0.8534239 0.8792903 3 11.8482 497.393 SURFACE PAVILLON VOL 0.8528905 0.8875045 4 12.3615 498.297 PAVILLON AGE VOL SBAINS 0.8486741 0.8664771 2 12.1674 505.388 AGE VOL 0.8471127 0.8740928 3 12.7890 507.988 SURFACE PERS SBAINS 0.8466604 0.8647003 2 12.4890 508.739 SURFACE VOL 0.8466407 0.8646830 2 12.4921 508.772 VOL SBAINS 0.8434842 0.8803115 4 13.6634 513.981 SURFACE PAVILLON VOL SBAINS 0.8380564 0.8666347 3 14.1389 522.817 AGE VOL SBAINS 0.8357076 0.8647004 3 14.4890 526.595 SURFACE VOL SBAINS 0.8032884 0.8148597 1 19.5101 576.213 SURFACE 0.7998845 0.8234275 2 19.9593 581.177 SURFACE PAVILLON 0.7901989 0.8148814 2 21.5061 595.075 SURFACE SBAINS 0.7866492 0.8242993 3 21.8015 600.088 SURFACE PAVILLON SBAINS 0.6869780 0.7422172 3 36.6582 726.868 PERS PAVILLON AGE 6

Adjusted R-square C(p) Root Variables in Model R-square In MSE 0.6765049 0.7526214 4 36.7751 738.928 PERS PAVILLON AGE SBAINS 0.6691835 0.7275629 3 39.3106 747.243 PAVILLON AGE SBAINS 0.6624708 0.7021801 2 41.9049 754.786 PAVILLON AGE 0.5933419 0.6651051 3 50.6154 828.482 PERS AGE SBAINS 0.5648511 0.6160451 2 57.4951 857.012 PERS AGE 0.5011707 0.5598565 2 67.6652 917.580 AGE SBAINS 0.4593701 0.5229736 2 74.3409 955.252 PERS PAVILLON 0.4542969 0.5505974 3 71.3410 959.724 PERS PAVILLON SBAINS 0.4529478 0.5173069 2 75.3666 960.910 PAVILLON SBAINS 0.4270260 0.4607303 1 83.6068 983.412 PAVILLON 0.3990593 0.4697582 2 83.9728 1007.126 PERS SBAINS 0.3498347 0.3880797 1 96.7565 1047.563 PERS 0.3098800 0.3504753 1 103.5628 1079.271 SBAINS 0.2788794 0.3212982 1 108.8438 1103.245 AGE ----------------------------------------------- TABLEAU 5 : Forward Selection Procedure for Dependent Variable KW Statistics for Entry: Step 1 DF = 1,16 Model Variable Tolerance R**2 F Prob>F SURFACE 1.000000 0.8149 70.4209 0.0001 PERS 1.000000 0.3881 10.1472 0.0058 PAVILLON 1.000000 0.4607 13.6698 0.0020 AGE 1.000000 0.3213 7.5744 0.0142 VOL 1.000000 0.8647 102.2397 0.0001 SBAINS 1.000000 0.3505 8.6334 0.0096 Step 1 Variable VOL Entered R-square = 0.86468161 C(p) = 10.49238385 DF Sum of Squares Mean Square F Prob>F Regression 1 24810837.848128 24810837.848128 102.24 0.0001 Error 16 3882773.2629832 242673.32893645 Total 17 28693611.111111 Parameter Standard Type II Variable Estimate Error Sum of Squares F Prob>F INTERCEP -522.26568956 368.20025213 488243.95605928 2.01 0.1753 VOL 11.19035411 1.10671078 24810837.848128 102.24 0.0001 Bounds on condition number: 1, 1 --- Statistics for Entry: Step 2 DF = 1,15 Model Variable Tolerance R**2 F Prob>F SURFACE 0.059827 0.8647 0.0021 0.9643 PERS 0.363993 0.9033 5.9989 0.0271 PAVILLON 0.598266 0.8780 1.6426 0.2194 AGE 0.672585 0.8665 0.2017 0.6598 SBAINS 0.595922 0.8647 0.0002 0.9903 7

Step 2 Variable PERS Entered R-square = 0.90333903 C(p) = 5.49546081 DF Sum of Squares Mean Square F Prob>F Regression 2 25920058.815436 12960029.407718 70.09 0.0001 Error 15 2773552.2956749 184903.48637833 Total 17 28693611.111111 Parameter Standard Type II Variable Estimate Error Sum of Squares F Prob>F INTERCEP 23.68536050 391.13153858 678.04641729 0.00 0.9525 PERS -368.01987894 150.25702746 1109220.9673083 6.00 0.0271 VOL 14.31799304 1.60121322 14784650.440128 79.96 0.0001 Bounds on condition number: 2.747306, 10.98922 Statistics for Entry: Step 3 DF = 1,14 Model Variable Tolerance R**2 F Prob>F SURFACE 0.048534 0.9133 1.6026 0.2262 PAVILLON 0.553354 0.9344 6.6221 0.0221 AGE 0.418843 0.9132 1.5917 0.2277 SBAINS 0.583214 0.9043 0.1335 0.7203 Step 3 Variable PAVILLON Entered R-square = 0.93437833 C(p) = 1.87740346 DF Sum of Squares Mean Square F Prob>F Regression 3 26810688.449776 8936896.1499253 66.45 0.0001 Error 14 1882922.6613353 134494.47580966 Total 17 28693611.111111 Parameter Standard Type II Variable Estimate Error Sum of Squares F Prob>F INTERCEP 399.08758682 364.08562093 161597.19993451 1.20 0.2915 PERS -461.96844532 133.24780880 1616623.6167329 12.02 0.0038 PAVILLON 601.78055824 233.85238601 890629.63433963 6.62 0.0221 VOL 13.30991576 1.42069316 11804687.063155 87.77 0.0001 Bounds on condition number: 2.973377, 23.25247 --- Statistics for Entry: Step 4 DF = 1,13 Model Variable Tolerance R**2 F Prob>F SURFACE 0.045740 0.9379 0.7307 0.4081 AGE 0.383490 0.9369 0.5218 0.4829 SBAINS 0.535676 0.9348 0.0876 0.7719 Step 4 Variable SURFACE Entered R-square = 0.93787061 C(p) = 3.24530632 DF Sum of Squares Mean Square F Prob>F Regression 4 26910894.697143 6727723.6742858 49.06 0.0001 Error 13 1782716.4139680 137132.03184369 Total 17 28693611.111111 8

Parameter Standard Type II Variable Estimate Error Sum of Squares F Prob>F INTERCEP 147.97440383 470.58732488 13559.12479565 0.10 0.7582 SURFACE 11.32068739 13.24325844 100206.24736727 0.73 0.4081 PERS -509.14122569 145.42506060 1680880.8580647 12.26 0.0039 PAVILLON 551.88934176 243.24015212 705947.47964384 5.15 0.0410 VOL 10.63634649 3.44092082 1310311.3550870 9.56 0.0086 Bounds on condition number: 21.8628, 177.4277 --- No other variable met the 0.5000 significance level for entry into the model. Summary of Forward Selection Procedure for Dependent Variable KW Variable Number Partial Model Step Entered In R**2 R**2 C(p) F Prob>F 1 VOL 1 0.8647 0.8647 10.4924 102.2397 0.0001 2 PERS 2 0.0387 0.9033 5.4955 5.9989 0.0271 3 PAVILLON 3 0.0310 0.9344 1.8774 6.6221 0.0221 4 SURFACE 4 0.0035 0.9379 3.2453 0.7307 0.4081 TABLEAU 6 : Backward Elimination Procedure for Dependent Variable KW Step 0 All Variables Entered R-square = 0.93922591 C(p) = 7.00000000 DF Sum of Squares Mean Square F Prob>F Regression 6 26949783.064490 4491630.5107484 28.33 0.0001 Error 11 1743828.0466209 158529.82242009 Total 17 28693611.111111 Parameter Standard Type II Variable Estimate Error Sum of Squares F Prob>F INTERCEP -226.40778877 1344.20962535 4497.38117481 0.03 0.8693 SURFACE 28.29010244 54.30518332 43022.67847885 0.27 0.6127 PERS -456.26160540 229.22900510 628057.89994378 3.96 0.0720 PAVILLON 595.98372260 276.27357029 737736.19246105 4.65 0.0540 AGE 8.40730992 27.06708563 15294.73981803 0.10 0.7619 VOL 4.52065460 20.08559412 8030.53096913 0.05 0.8261 SBAINS -78.45554894 219.73170525 20210.30426212 0.13 0.7278 Bounds on condition number: 504.2108, 5231.054 --- Statistics for Removal: Step 1 DF = 1,11 Partial Model Variable R**2 R**2 SURFACE 0.0015 0.9377 PERS 0.0219 0.9173 PAVILLON 0.0257 0.9135 AGE 0.0005 0.9387 VOL 0.0003 0.9389 SBAINS 0.0007 0.9385 9

Step 1 Variable VOL Removed R-square = 0.93894604 C(p) = 5.05065628 DF Sum of Squares Mean Square F Prob>F Regression 5 26941752.533521 5388350.5067042 36.91 0.0001 Error 12 1751858.5775901 145988.21479917 Total 17 28693611.111111 Parameter Standard Type II Variable Estimate Error Sum of Squares F Prob>F INTERCEP -512.87676180 414.83719017 223145.67490053 1.53 0.2400 SURFACE 40.41177762 6.67788738 5346327.0964791 36.62 0.0001 PERS -419.76563201 155.48342877 1064053.1842349 7.29 0.0193 PAVILLON 607.45353290 260.57074470 793400.76334554 5.43 0.0380 AGE 14.39503702 4.78464127 1321431.3512013 9.05 0.0109 SBAINS -74.08823367 210.03713273 18164.52802029 0.12 0.7304 Bounds on condition number: 5.221742, 71.02664 --- Statistics for Removal: Step 2 DF = 1,12 Partial Model Variable R**2 R**2 SURFACE 0.1863 0.7526 PERS 0.0371 0.9019 PAVILLON 0.0277 0.9113 AGE 0.0461 0.8929 SBAINS 0.0006 0.9383 Step 2 Variable SBAINS Removed R-square = 0.93831299 C(p) = 3.16523742 DF Sum of Squares Mean Square F Prob>F Regression 4 26923588.005501 6730897.0013752 49.44 0.0001 Error 13 1770023.1056104 136155.62350849 Total 17 28693611.111111 Parameter Standard Type II Variable Estimate Error Sum of Squares F Prob>F INTERCEP -522.58765203 399.74047862 232700.65976273 1.71 0.2138 SURFACE 39.74090378 6.18199627 5626697.7294479 41.33 0.0001 PERS -420.35411697 150.14746351 1067161.6110610 7.84 0.0150 PAVILLON 584.53157337 243.69192453 783374.18656325 5.75 0.0322 AGE 14.40342599 4.62064826 1323004.6634446 9.72 0.0082 Bounds on condition number: 4.798184, 47.02278 --- All variables left in the model are significant at the 0.1000 level. Summary of Backward Elimination Procedure for Dependent Variable KW Variable Number Partial Model Step Removed In R**2 R**2 C(p) F Prob>F 1 VOL 5 0.0003 0.9389 5.0507 0.0507 0.8261 2 SBAINS 4 0.0006 0.9383 3.1652 0.1244 0.7304 10

TABLEAU 7 : Modele à 3 variables: VOL PAVILLON PERS Model: MODEL4 Dependent Variable: KW Analysis of Variance Sum of Mean Source DF Squares Square F Value Prob>F Model 3 26810688.45 8936896.1499 66.448 0.0001 Error 14 1882922.6613 134494.47581 C Total 17 28693611.111 Root MSE 366.73488 R-square 0.9344 Dep Mean 3010.77778 Adj R-sq 0.9203 C.V. 12.18074 Parameter Estimates Parameter Standard T for H0: Variable DF Estimate Error Parameter=0 Prob > T INTERCEP 1 399.087587 364.08562093 1.096 0.2915 PAVILLON 1 601.780558 233.85238601 2.573 0.0221 PERS 1-461.968445 133.24780880-3.467 0.0038 VOL 1 13.309916 1.42069316 9.369 0.0001 Correlation of Estimates CORRB INTERCEP PAVILLON PERS VOL INTERCEP 1.0000 0.4007-0.6119-0.1245 PAVILLON 0.4007 1.0000-0.2740-0.2757 PERS -0.6119-0.2740 1.0000-0.6617 VOL -0.1245-0.2757-0.6617 1.0000 Collinearity Diagnostics Condition Var Prop Var Prop Var Prop Var Prop Number Eigenvalue Index INTERCEP PAVILLON PERS VOL 1 3.66213 1.00000 0.0039 0.0145 0.0016 0.0024 2 0.28509 3.58404 0.0423 0.6319 0.0029 0.0019 3 0.03750 9.88192 0.7005 0.3315 0.0240 0.3957 4 0.01527 15.48595 0.2534 0.0221 0.9714 0.600 11

INTERPRETATION DU MODELE (X 1000) 4 Component+Residual Plot for KW component effect 3 2 1 0-1 -2 180 280 380 480 580 vol Component+Residual Plot for KW component effect 1100 700 300-100 -500-900 -1300 2 3 4 5 6 7 pers 12

Component+Residual Plot for KW component effect 1000 600 200-200 -600-1000 0 0,2 0,4 0,6 0,8 1 pavillon TABLEAU 8: PREVISION ET MESURES D INFLUENCE Dep Var Predict Std Err Lower95% Upper95% Lower95% Upper95% Obs KW Value Predict Mean Mean Predict Predict 1 4805.0 4610.1 185.018 4213.2 5006.9 3729.1 5491.1 2 3783.0 3239.1 143.290 2931.8 3546.5 2394.7 4083.6 3 2689.0 2393.9 144.279 2084.5 2703.3 1548.7 3239.2 4 5683.0 5815.7 238.841 5303.4 6328.0 4877.0 6754.4 5 3750.0 3611.8 141.483 3308.4 3915.3 2768.7 4454.9 6 2684.0 2278.0 143.912 1969.3 2586.7 1433.0 3123.0 7 1478.0 1409.0 145.415 1097.1 1720.9 562.8 2255.1 8 1685.0 1878.7 150.157 1556.6 2200.7 1028.7 2728.6 9 1980.0 2167.6 137.609 1872.5 2462.8 1327.5 3007.8 10 1075.0 947.0 202.387 512.9 1381.1 48.6049 1845.4 11 2423.0 2497.7 186.248 2098.2 2897.1 1615.5 3379.9 12 4253.0 3824.8 145.412 3512.9 4136.7 2978.6 4670.9 13 1754.0 2403.3 209.616 1953.8 2852.9 1497.3 3309.3 14 1873.0 2041.2 208.855 1593.3 2489.2 1136.1 2946.4 15 3487.0 4015.0 118.989 3759.8 4270.2 3188.1 4841.9 16 2954.0 3429.4 125.959 3159.2 3699.5 2597.7 4261.0 17 4762.0 4688.2 248.788 4154.6 5221.8 3737.8 5638.7 18 3076.0 2943.5 160.386 2599.5 3287.5 2085.0 3802.0 19. 4543.5 180.492 4156.4 4930.6 3666.8 5420.2 13

Std Err Student Cook's Obs Residual Residual Residual -2-1-0 1 2 D Rstudent 1 194.9 316.643 0.616 * 0.032 0.6014 2 543.9 337.583 1.611 *** 0.117 1.7200 3 295.1 337.162 0.875 * 0.035 0.8675 4-132.7 278.297-0.477 0.042-0.4633 5 138.2 338.344 0.408 0.007 0.3959 6 406.0 337.318 1.204 ** 0.066 1.2250 7 69.0329 336.673 0.205 0.002 0.1979 8-193.7 334.586-0.579 * 0.017-0.5646 9-187.6 339.939-0.552 * 0.012-0.5378 10 128.0 305.834 0.419 0.019 0.4059 11-74.6618 315.921-0.236 0.005-0.2282 12 428.2 336.675 1.272 ** 0.075 1.3033 13-649.3 300.925-2.158 **** 0.565-2.5452 14-168.2 301.453-0.558 * 0.037-0.5439 15-528.0 346.895-1.522 *** 0.068-1.6055 16-475.4 344.425-1.380 ** 0.064-1.4308 17 73.7548 269.442 0.274 0.016 0.2645 18 132.5 329.804 0.402 0.010 0.3894 Hat Diag Cov INTERCEP PAVILLON PERS VOL Obs H Ratio Dffits Dfbetas Dfbetas Dfbetas Dfbetas 1 0.2545 1.6167 0.3514 0.1122 0.1388-0.2646 0.2279 2 0.1527 0.6990 0.7301 0.3939 0.5780-0.2165-0.1343 3 0.1548 1.2706 0.3712 0.1917-0.1625-0.1591 0.1312 4 0.4241 2.1876-0.3976 0.2203 0.1042 0.0387-0.2846 5 0.1488 1.5063 0.1656 0.0847 0.1199-0.0805 0.0157 6 0.1540 1.0271 0.5226-0.0422-0.3989 0.1706-0.0008 7 0.1572 1.5769 0.0855 0.0515-0.0201 0.0045-0.0318 8 0.1676 1.4667-0.2534 0.0107 0.1655-0.1269 0.0723 9 0.1408 1.4336-0.2177-0.1226 0.0894 0.0725-0.0425 10 0.3046 1.8391 0.2686 0.0081-0.0938 0.1871-0.1888 11 0.2579 1.7838-0.1345 0.0004-0.0615-0.0798 0.1043 12 0.1572 0.9766 0.5629 0.2691 0.3724-0.3246 0.1400 13 0.3267 0.3964-1.7729-1.3708 0.1126 1.3797-0.7685 14 0.3243 1.8193-0.3768-0.1682-0.2683-0.0760 0.2782 15 0.1053 0.7291-0.5507 0.0958-0.1874-0.0154-0.0815 16 0.1180 0.8496-0.5233 0.0536-0.2398-0.1857 0.1866 17 0.4602 2.4389 0.2442-0.2012-0.0781 0.1541 0.0115 18 0.1913 1.5878 0.1894-0.0242-0.1528-0.0000 0.0836 Sum of Residuals 0 Sum of Squared Residuals 1882922.6613 Predicted Resid SS (Press) 2999011.2085 14