REGRESSION MULTIPLE: CONSOMMATION D ELECTRICITE

Dimension: px
Commencer à balayer dès la page:

Download "REGRESSION MULTIPLE: CONSOMMATION D ELECTRICITE"

Transcription

1 REGRESSION MULTIPLE: CONSOMMATION D ELECTRICITE LES DONNEES OBS KW SURFACE PERS PAVILLON AGE VOL SBAINS DESCRIPTION DES VARIABLES KW: Nombre de KWH consommés pendant le mois de janvier SURFACE: Surface du logement en m 2 PERS: Nombre de personnes habitant le logement PAVILLON: Pavillon codé 1; Appartement codé 0 AGE: Age du logement VOL: Volume intérieur du logement en m 3 SBAINS: Nombre desalles de bains CONSOMMATION D ELECTRICITE- LOGICIEL STATGRAPHICS

2 OBJECTIF: On souhaite expliquer la consommation d électricité au mois de janvier pour des logements équipés du tout électrique. Construire un modèle adapté à l aide des variables disponibles. A l aide du modèle retenu donner une estimation par intervalle pour la consommation d un pavillon d une surface de 150 m2, habité par 4 personnes, construit il y a 18 ans, comprenant deux salles de bains et dont le volume intérieur est de 405 m3 TABLEAU 1 : Correlation Analysis Simple Statistics Variable N Mean Std Dev Sum Minimum Maximum KW SURFACE PERS PAVILLON AGE VOL SBAINS Pearson Correlation Coefficients / Prob > R under Ho: Rho=0 / N = 18 KW SURFACE PERS PAVILLON AGE VOL SBAINS KW SURFACE PERS PAVILLON AGE VOL SBAINS CONSOMMATION D ELECTRICITE LOGICIEL STATGRAPHICS 2

3 KW surface pers pavillon age vol sbains TABLEAU 2 : MODELE COMPLET Analyse de régression multiple Variable à expliquer: KW Paramètre Estimation Erreur T Proba. type CONSTANTE -226, ,21-0, ,8693 surface 28, ,3052 0, ,6127 pers -456, ,229-1, ,0720 pavillon 595, ,274 2, ,0540 age 8, ,0671 0, ,7619 vol 4, ,0856 0, ,8261 sbains -78, ,732-0, ,7278 Analyse de variance Source Somme des carrés Ddl Carré moyen F Proba. Modèle 2,69498E7 6 4,49163E6 28,33 0,0000 Résidu 1,74383E ,0 Total (Corr.) 2,86936E7 17 R-carré = 93,9226 % R-carré (ajusté pour les ddl) = 90,6076 % Estimation de l'écart-type du résidu = 398,158 Erreur absolue moyenne = 240,068 Test de Durbin-Watson = 1,58315 (P=0,1643) Autocorrélation résiduelle d'ordre 1 = 0, CONSOMMATION D ELECTRICITE LOGICIEL STATGRAPHICS 3

4 Le StatAdvisor Le tableau montre les résultats de l'ajustement d'un modèle de régression linéaire multiple pour décrire la relation entre KW et 6variables explicatives. L'équation du modèle ajusté est : KW = -226, ,2901*surface - 456,262*pers + 595,984*pavillon + 8,40731*age + 4,52065*vol - 78,4555*sbains Comme la valeur de la probabilité dans le tableau de l'anova est inférieure à 0.01, il y a une relation statistiquement significative entre les variables au niveau de confiance de 99%. La statistique du R-carré indique que le modèle ajusté explique 93,9226% de la variabilité de KW. La statistique du R-carré ajusté, qui est plus adaptée pour comparer des modèles comportant des nombres différents de variables explicatives, est 90,6076%. L'erreur-type d'estimation indique que l'écart-type des résidus est de 398,158. Cette valeur peut être utilisée pour construire des limites de prévision pour de nouvelles observations en sélectionnant l'option Rapports dans le menu des options pour les tableaux. L'erreur absolue moyenne de 240,068 est la valeur moyenne des résidus. La statistique de Durbin-Watson (DW) teste les résidus pour déterminer s'il y a une corrélation significative basée sur l'ordre dans lequel ils apparaissent dans le fichier des données. Comme la valeur de la probabilité est supérieure à 0.05, il n'y a pas de corrélation sérielle dans les résidus. Pour déterminer si le modèle peut être simplifié, noter que la plus grande valeur de probabilité pour les variables explicatives est de 0,8261, et est associée à vol. Comme la valeur de la probabilité est supérieure ou égale à 0.10, ce terme n'est pas statistiquement significatif au niveau de confiance de 90% ou plus. Ainsi, vous pouvez envisager de supprimer vol du modèle. CONSOMMATION D ELECTRICITE LOGICIEL STATGRAPHICS 4

5 TABLEAU 3 : SELECTION DE MODELES Variables explicatives: A=surface B=pers C=pavillon D=age E=vol F=sbains Modèles ayant les plus grands R-carrés ajustés Résultats des modèles R-carré Variables MSE R-carré ajusté Cp incluses ,0 93, ,0317 1,8774 BCE ,0 93, ,9332 3,16524 ABCD ,0 93, ,8754 3,24531 ABCE ,0 93, ,7499 3,41903 BCDE ,0 93, ,4761 3,79791 BCEF ,0 93, ,3507 5,05066 ABCDF ,0 93, ,3148 5,09648 ABCEF ,0 93, ,2906 5,12749 ABCDE ,0 93, ,1779 5,27139 BCDEF ,0 91, ,4682 5,6984 ABE ,0 91, ,4609 5,70937 BDE ,0 91, ,1943 6,10673 ABD ,0 91, ,1458 7,02333 ACDE ,0 90, ,0451 5,49546 BE ,0 90, ,3735 7,33022 BEF ,0 91, ,2895 8,96176 ACDEF ,0 88, ,4553 9,63151 AD ,0 87, , ,075 CE ,0 87, , ,8027 AB ,0 86, , ,4924 E ,0 86, , ,1674 DE ,0 81,486 80, ,5101 A ,0 46,073 42, ,6068 C 1,09739E6 38,808 34, ,7565 B 1,16483E6 35, , ,563 F 1,68786E6 0,0 0,0 164, Le StatAdvisor Ce tableau affiche les modèles qui ont les meilleurs R-carrés ajustés. La statistique du R- carré ajusté mesure la proportion de la variabilité de KW expliquée par le modèle. De larges valeurs du R-carré ajusté correspondent à de petites valeurs de l'erreur quadratique moyenne (MSE). Jusqu'à 5 modèles pour chaque sous-ensemble de 0 à 5 variables sont affichés. Le meilleur modèle contient 3 variables, pers, pavillon, et vol. CONSOMMATION D ELECTRICITE LOGICIEL STATGRAPHICS 5

6 TABLEAU 4 : Procédure de sélection ascendante Régression pas à pas Méthode: sélection ascendante F-en-entrée: 4,0 F-en-sortie: 4,0 Etape 0: variables dans le modèle. 17 ddl pour l'erreur. R-carré = 0,00% R-carré ajusté = 0,00% Err. moy. quadra. = 1,68786E6 Etape 1: Entrée de la variable vol avec F-en-entrée = 102,24 1 variables dans le modèle. 16 ddl pour l'erreur. R-carré = 86,47% R-carré ajusté = 85,62% Err. moy. quadra. = ,0 Etape 2: Entrée de la variable pers avec F-en-entrée = 5, variables dans le modèle. 15 ddl pour l'erreur. R-carré = 90,33% R-carré ajusté = 89,05% Err. moy. quadra. = ,0 Etape 3: Entrée de la variable pavillon avec F-en-entrée = 6, variables dans le modèle. 14 ddl pour l'erreur. R-carré = 93,44% R-carré ajusté = 92,03% Err. moy. quadra. = ,0 Modèle final ajusté. TABLEAU 5 : Procédure de sélection descendante Régression pas à pas Méthode: sélection descendante F-en-entrée: 4,0 F-en-sortie: 4,0 Etape 0: variables dans le modèle. 11 ddl pour l'erreur. R-carré = 93,92% R-carré ajusté = 90,61% Err. moy. quadra. = ,0 Etape 1: Sortie de la variable vol avec F-en-sortie = 0, variables dans le modèle. 12 ddl pour l'erreur. R-carré = 93,89% R-carré ajusté = 91,35% Err. moy. quadra. = ,0 Etape 2: Sortie de la variable sbains avec F-en-sortie = 0, variables dans le modèle. 13 ddl pour l'erreur. R-carré = 93,83% R-carré ajusté = 91,93% Err. moy. quadra. = ,0 Modèle final ajusté. CONSOMMATION D ELECTRICITE LOGICIEL STATGRAPHICS 6

7 Analyse de régression multiple : Etude du modèle à 4 variables provenant de la sélection descendante Variable à expliquer: KW Paramètre Estimation Erreur T Proba. type CONSTANTE -522, ,74-1, ,2138 surface 39,7409 6,182 6, ,0000 pers -420, ,147-2, ,0150 pavillon 584, ,692 2, ,0322 age 14,4034 4, , ,0082 Analyse de variance Source Somme des carrés Ddl Carré moyen F Proba. Modèle 2,69236E7 4 6,7309E6 49,44 0,0000 Résidu 1,77002E ,0 Total (Corr.) 2,86936E7 17 R-carré = 93,8313 % R-carré (ajusté pour les ddl) = 91,9332 % Estimation de l'écart-type du résidu = 368,993 Erreur absolue moyenne = 240,364 Test de Durbin-Watson = 1,64108 (P=0,1949) Autocorrélation résiduelle d'ordre 1 = 0, CONSOMMATION D ELECTRICITE LOGICIEL STATGRAPHICS 7

8 TABLEAU 6 : Modele à 3 variables: VOL PAVILLON PERS Analyse de régression multiple Variable à expliquer: KW Paramètre Estimation Erreur T Proba. type CONSTANTE 399, ,086 1, ,2915 pers -461, ,248-3, ,0038 pavillon 601, ,852 2, ,0221 vol 13,3099 1, , ,0000 Analyse de variance Source Somme des carrés Ddl Carré moyen F Proba. Modèle 2,68107E7 3 8,9369E6 66,45 0,0000 Résidu 1,88292E ,0 Total (Corr.) 2,86936E7 17 R-carré = 93,4378 % R-carré (ajusté pour les ddl) = 92,0317 % Estimation de l'écart-type du résidu = 366,735 Erreur absolue moyenne = 267,736 Test de Durbin-Watson = 1,54956 (P=0,1171) Autocorrélation résiduelle d'ordre 1 = 0, Le StatAdvisor Le tableau montre les résultats de l'ajustement d'un modèle de régression linéaire multiple pour décrire la relation entre KW et 3 variables explicatives. L'équation du modèle ajusté est : KW = 399, ,968*pers + 601,781*pavillon + 13,3099*vol Matrice des corrélations des coefficients estimés CONSTANTE pers pavillon vol CONSTANTE 1,0000-0,6119 0,4007-0,1245 pers -0,6119 1,0000-0,2740-0,6617 pavillon 0,4007-0,2740 1,0000-0,2757 vol -0,1245-0,6617-0,2757 1,0000 Le StatAdvisor Le tableau donne les corrélations estimées entre les coefficients du modèle ajusté. Ces corrélations peuvent être utilisées pour détecter la présence de sérieuses multicolinéarités, par exemple la corrélation entre les variables explicatives. Dans ce cas, il y a 1 corrélation en valeur absolue supérieure à 0.5 (sans inclure le terme constant). CONSOMMATION D ELECTRICITE LOGICIEL STATGRAPHICS 8

9 INTERPRETATION DU MODELE Graphique Composant+Résidu pour KW Effet du composant vol CONSOMMATION D ELECTRICITE LOGICIEL STATGRAPHICS 9

10 Graphique Composant+Résidu pour KW Effet du composant pers Graphique Composant+Résidu pour KW Effet du composant ,2 0,4 0,6 0,8 1 pavillon CONSOMMATION D ELECTRICITE LOGICIEL STATGRAPHICS 10

11 TABLEAU 8: PREVISION ET MESURES D INFLUENCE Résultats de la régression pour KW Observé Ajusté Studentisé Ligne Résidu Résidu ,0 4610,06 194,94 0, ,0 3239,14 543,861 1, ,0 2393,9 295,099 0, ,0 5815,71-132,709-0, ,0 3611,82 138,184 0, ,0 2277,99 406,01 1, ,0 1408,97 69,0329 0, ,0 1878,69-193,693-0, ,0 2167,63-187,632-0, ,0 946, ,001 0, ,0 2497,66-74,6618-0, ,0 3824,77 428,225 1, ,0 2403,33-649,332-2, ,0 2041,25-168,246-0, ,0 4014,99-527,992-1, ,0 3429,36-475,356-1, ,0 4688,25 73,7548 0, ,0 2943,49 132,514 0, Résultats de la régression pour KW Observé Inf. 95,0% NC Sup. 95,0% NC Inf. 95,0% NC Sup. 95,0% NC Ligne pour prév. pour prév. pour moy. pour moy ,0 3729, , , , ,0 2394, , , , ,0 1548, , , , ,0 4877, , , , ,0 2768, , , , ,0 1433, , , , ,0 562, , , , ,0 1028, , , , ,0 1327, , , , ,0 48, ,39 512, , ,0 1615, , ,2 2897, ,0 2978, , ,9 4136, ,0 1497, , , , ,0 1136, , ,3 2489, ,0 3188, , , , ,0 2597, , ,2 3699, ,0 3737, , , , ,0 2084, , , , Résidus non usuels Ligne Y Y Résidu Résidu prévu studentisé ,0 2403,33-649,332-2, CONSOMMATION D ELECTRICITE LOGICIEL STATGRAPHICS 11

12 Le StatAdvisor Le tableau des résidus non usuels liste les observations qui ont des résidus studentisés supérieurs à 2.0 en valeur absolue. Les résidus studentisés mesurent de combien d'écartstypes chaque valeur observée de KW varie si on ajuste un modèle utilisant toutes les observations sauf cette observation. Dans ce cas, il y a un résidu studentisé supérieur à 2.0, mais aucun supérieur à 3.0. Points influents Ligne Levier Distance de DFITS Mahalanobis , , , Levier moyen pour une observation = 0, Le StatAdvisor Le tableau des points influents liste les observations qui ont des leviers supérieurs à 3 fois celui d'un point moyen ou qui ont des valeurs particulièrement élevées du DFITS. Le levier est une statistique qui mesure l'influence de chaque observation dans la détermination des coefficients du modèle estimé. La statistique DFITS mesure de combien les coefficients estimés changent si chaqueobservation était retirée du jeu des données. Dans ce cas, un point moyen a un levier égal à 0, Il n'y a pas de points ayant un levier 3 fois plus grand que le levier moyen. Il y a un point qui a une valeur particulièrement grande du DFITS. CONSOMMATION D ELECTRICITE LOGICIEL STATGRAPHICS 12

13 REGRESSION MULTIPLE: CONSOMMATION D ELECTRICITE LES DONNEES OBS KW SURFACE PERS PAVILLON AGE VOL SBAINS DESCRIPTION DES VARIABLES KW: Nombre de KWH consommés pendant le mois de janvier SURFACE: Surface du logement en m 2 PERS: Nombre de personnes habitant le logement PAVILLON: Pavillon codé 1; Appartement codé 0 AGE: Age du logement VOL: Volume intérieur du logement en m 3 SBAINS: Nombre desalles de bains Consommation d électricité logiciel SAS

14 OBJECTIF: On souhaite expliquer la consommation d électricité au mois de janvier pour des logements équipés du tout électrique. Construire un modèle adapté à l aide des variables disponibles. A l aide du modèle retenu donner une estimation par intervalle pour la consommation d un pavillon d une surface de 150 m2, habité par 4 personnes, construit il y a 18 ans, comprenant deux salles de bains et dont le volume intérieur est de 405 m3 TABLEAU 1: PROGRAMME SAS OPTIONS LS=80; data electric; INPUT KW SURFACE PERS PAVILLON AGE VOL SBAINS ; cards; ; proc print; proc corr; proc reg data= electric; model KW = SURFACE PERS PAVILLON AGE VOL SBAINS ; model KW = SURFACE PERS PAVILLON AGE VOL SBAINS / selection=adjrsq rmse cp; model KW = SURFACE PERS PAVILLON AGE VOL SBAINS / selection =forward details ; model KW = SURFACE PERS PAVILLON AGE VOL SBAINS / selection = backward details; model KW = PAVILLON PERS VOL 2

15 / CORRB COLLIN INFLUENCE R CLM CLI ; quit; TABLEAU 2 : Correlation Analysis Simple Statistics Variable N Mean Std Dev Sum Minimum Maximum KW SURFACE PERS PAVILLON AGE VOL SBAINS Pearson Correlation Coefficients / Prob > R under Ho: Rho=0 / N = 18 KW SURFACE PERS PAVILLON AGE VOL SBAINS KW SURFACE PERS PAVILLON AGE VOL SBAINS

16 KW surface pers pavillon age vol sbains 4

17 TABLEAU 3 : MODELE COMPLET Model: MODEL1 Dependent Variable: KW Analysis of Variance Sum of Mean Source DF Squares Square F Value Prob>F Model Error C Total Root MSE R-square Dep Mean Adj R-sq C.V Parameter Estimates Parameter Standard T for H0: Variable DF Estimate Error Parameter=0 Prob > T INTERCEP SURFACE PERS PAVILLON AGE VOL SBAINS

18 TABLEAU 4 : SELECTION DE MODELES N = 18 Regression Models for Dependent Variable: KW Adjusted R-square C(p) Root Variables in Model R-square In MSE PERS PAVILLON VOL SURFACE PERS PAVILLON AGE SURFACE PERS PAVILLON VOL PERS PAVILLON AGE VOL PERS PAVILLON VOL SBAINS SURFACE PERS PAVILLON AGE SBAINS SURFACE PERS PAVILLON VOL SBAINS SURFACE PERS PAVILLON AGE VOL PERS PAVILLON AGE VOL SBAINS SURFACE PERS PAVILLON AGE VOL SBAINS SURFACE PERS VOL PERS AGE VOL SURFACE PERS AGE SURFACE PAVILLON AGE VOL PERS VOL SURFACE PERS AGE VOL SURFACE PERS VOL SBAINS PERS AGE VOL SBAINS SURFACE PERS AGE SBAINS PERS VOL SBAINS SURFACE PAVILLON AGE VOL SBAINS SURFACE PAVILLON AGE SURFACE PERS AGE VOL SBAINS SURFACE PAVILLON AGE SBAINS SURFACE PERS PAVILLON SURFACE AGE VOL SURFACE AGE PAVILLON AGE VOL PAVILLON VOL SURFACE PERS PAVILLON SBAINS SURFACE PERS VOL SURFACE AGE SBAINS SURFACE AGE VOL SBAINS PAVILLON VOL SBAINS SURFACE PAVILLON VOL PAVILLON AGE VOL SBAINS AGE VOL SURFACE PERS SBAINS SURFACE VOL VOL SBAINS SURFACE PAVILLON VOL SBAINS AGE VOL SBAINS SURFACE VOL SBAINS SURFACE SURFACE PAVILLON SURFACE SBAINS SURFACE PAVILLON SBAINS PERS PAVILLON AGE 6

19 Adjusted R-square C(p) Root Variables in Model R-square In MSE PERS PAVILLON AGE SBAINS PAVILLON AGE SBAINS PAVILLON AGE PERS AGE SBAINS PERS AGE AGE SBAINS PERS PAVILLON PERS PAVILLON SBAINS PAVILLON SBAINS PAVILLON PERS SBAINS PERS SBAINS AGE TABLEAU 5 : Forward Selection Procedure for Dependent Variable KW Statistics for Entry: Step 1 DF = 1,16 Model Variable Tolerance R**2 F Prob>F SURFACE PERS PAVILLON AGE VOL SBAINS Step 1 Variable VOL Entered R-square = C(p) = DF Sum of Squares Mean Square F Prob>F Regression Error Total Parameter Standard Type II Variable Estimate Error Sum of Squares F Prob>F INTERCEP VOL Bounds on condition number: 1, Statistics for Entry: Step 2 DF = 1,15 Model Variable Tolerance R**2 F Prob>F SURFACE PERS PAVILLON AGE SBAINS

20 Step 2 Variable PERS Entered R-square = C(p) = DF Sum of Squares Mean Square F Prob>F Regression Error Total Parameter Standard Type II Variable Estimate Error Sum of Squares F Prob>F INTERCEP PERS VOL Bounds on condition number: , Statistics for Entry: Step 3 DF = 1,14 Model Variable Tolerance R**2 F Prob>F SURFACE PAVILLON AGE SBAINS Step 3 Variable PAVILLON Entered R-square = C(p) = DF Sum of Squares Mean Square F Prob>F Regression Error Total Parameter Standard Type II Variable Estimate Error Sum of Squares F Prob>F INTERCEP PERS PAVILLON VOL Bounds on condition number: , Statistics for Entry: Step 4 DF = 1,13 Model Variable Tolerance R**2 F Prob>F SURFACE AGE SBAINS Step 4 Variable SURFACE Entered R-square = C(p) = DF Sum of Squares Mean Square F Prob>F Regression Error Total

21 Parameter Standard Type II Variable Estimate Error Sum of Squares F Prob>F INTERCEP SURFACE PERS PAVILLON VOL Bounds on condition number: , No other variable met the significance level for entry into the model. Summary of Forward Selection Procedure for Dependent Variable KW Variable Number Partial Model Step Entered In R**2 R**2 C(p) F Prob>F 1 VOL PERS PAVILLON SURFACE TABLEAU 6 : Backward Elimination Procedure for Dependent Variable KW Step 0 All Variables Entered R-square = C(p) = DF Sum of Squares Mean Square F Prob>F Regression Error Total Parameter Standard Type II Variable Estimate Error Sum of Squares F Prob>F INTERCEP SURFACE PERS PAVILLON AGE VOL SBAINS Bounds on condition number: , Statistics for Removal: Step 1 DF = 1,11 Partial Model Variable R**2 R**2 SURFACE PERS PAVILLON AGE VOL SBAINS

22 Step 1 Variable VOL Removed R-square = C(p) = DF Sum of Squares Mean Square F Prob>F Regression Error Total Parameter Standard Type II Variable Estimate Error Sum of Squares F Prob>F INTERCEP SURFACE PERS PAVILLON AGE SBAINS Bounds on condition number: , Statistics for Removal: Step 2 DF = 1,12 Partial Model Variable R**2 R**2 SURFACE PERS PAVILLON AGE SBAINS Step 2 Variable SBAINS Removed R-square = C(p) = DF Sum of Squares Mean Square F Prob>F Regression Error Total Parameter Standard Type II Variable Estimate Error Sum of Squares F Prob>F INTERCEP SURFACE PERS PAVILLON AGE Bounds on condition number: , All variables left in the model are significant at the level. Summary of Backward Elimination Procedure for Dependent Variable KW Variable Number Partial Model Step Removed In R**2 R**2 C(p) F Prob>F 1 VOL SBAINS

23 TABLEAU 7 : Modele à 3 variables: VOL PAVILLON PERS Model: MODEL4 Dependent Variable: KW Analysis of Variance Sum of Mean Source DF Squares Square F Value Prob>F Model Error C Total Root MSE R-square Dep Mean Adj R-sq C.V Parameter Estimates Parameter Standard T for H0: Variable DF Estimate Error Parameter=0 Prob > T INTERCEP PAVILLON PERS VOL Correlation of Estimates CORRB INTERCEP PAVILLON PERS VOL INTERCEP PAVILLON PERS VOL Collinearity Diagnostics Condition Var Prop Var Prop Var Prop Var Prop Number Eigenvalue Index INTERCEP PAVILLON PERS VOL

24 INTERPRETATION DU MODELE (X 1000) 4 Component+Residual Plot for KW component effect vol Component+Residual Plot for KW component effect pers 12

25 Component+Residual Plot for KW component effect ,2 0,4 0,6 0,8 1 pavillon TABLEAU 8: PREVISION ET MESURES D INFLUENCE Dep Var Predict Std Err Lower95% Upper95% Lower95% Upper95% Obs KW Value Predict Mean Mean Predict Predict

26 Std Err Student Cook's Obs Residual Residual Residual D Rstudent * *** * ** * * ** **** * *** ** Hat Diag Cov INTERCEP PAVILLON PERS VOL Obs H Ratio Dffits Dfbetas Dfbetas Dfbetas Dfbetas Sum of Residuals 0 Sum of Squared Residuals Predicted Resid SS (Press)

Exemples d application

Exemples d application AgroParisTech Exemples d application du modèle linéaire E Lebarbier, S Robin Table des matières 1 Introduction 4 11 Avertissement 4 12 Notations 4 2 Régression linéaire simple 7 21 Présentation 7 211 Objectif

Plus en détail

MODELE A CORRECTION D ERREUR ET APPLICATIONS

MODELE A CORRECTION D ERREUR ET APPLICATIONS MODELE A CORRECTION D ERREUR ET APPLICATIONS Hélène HAMISULTANE Bibliographie : Bourbonnais R. (2000), Econométrie, DUNOD. Lardic S. et Mignon V. (2002), Econométrie des Séries Temporelles Macroéconomiques

Plus en détail

Modèles pour données répétées

Modèles pour données répétées Résumé Les données répétées, ou données longitudinales, constituent un domaine à la fois important et assez particulier de la statistique. On entend par données répétées des données telles que, pour chaque

Plus en détail

Exemple PLS avec SAS

Exemple PLS avec SAS Exemple PLS avec SAS This example, from Umetrics (1995), demonstrates different ways to examine a PLS model. The data come from the field of drug discovery. New drugs are developed from chemicals that

Plus en détail

Régression linéaire. Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr

Régression linéaire. Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr Régression linéaire Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr 2005 Plan Régression linéaire simple Régression multiple Compréhension de la sortie de la régression Coefficient de détermination R

Plus en détail

Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015 Exercices M1 SES 214-215 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 215 Les exemples numériques présentés dans ce document d exercices ont été traités sur le logiciel R, téléchargeable par

Plus en détail

Analyse de la variance Comparaison de plusieurs moyennes

Analyse de la variance Comparaison de plusieurs moyennes Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction

Plus en détail

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position Arbre de NESI distribution quelconque Signe 1 échantillon distribution symétrique non gaussienne Wilcoxon gaussienne Student position appariés 1 échantillon sur la différence avec référence=0 2 échantillons

Plus en détail

Chapitre 4 : Régression linéaire

Chapitre 4 : Régression linéaire Exercice 1 Méthodes statistiques appliquées aux sciences sociales (STAT-D-203) Titulaire : Catherine Vermandele Chapitre 4 : Régression linéaire Le diplôme de Master of Business Administration ou MBA est

Plus en détail

Une introduction. Lionel RIOU FRANÇA. Septembre 2008

Une introduction. Lionel RIOU FRANÇA. Septembre 2008 Une introduction INSERM U669 Septembre 2008 Sommaire 1 Effets Fixes Effets Aléatoires 2 Analyse Classique Effets aléatoires Efficacité homogène Efficacité hétérogène 3 Estimation du modèle Inférence 4

Plus en détail

Évaluation de la régression bornée

Évaluation de la régression bornée Thierry Foucart UMR 6086, Université de Poitiers, S P 2 M I, bd 3 téléport 2 BP 179, 86960 Futuroscope, Cedex FRANCE Résumé. le modèle linéaire est très fréquemment utilisé en statistique et particulièrement

Plus en détail

IBM SPSS Regression 21

IBM SPSS Regression 21 IBM SPSS Regression 21 Remarque : Avant d utiliser ces informations et le produit qu elles concernent, lisez les informations générales sous Remarques sur p. 46. Cette version s applique à IBM SPSS Statistics

Plus en détail

Un exemple de régression logistique sous

Un exemple de régression logistique sous Fiche TD avec le logiciel : tdr341 Un exemple de régression logistique sous A.B. Dufour & A. Viallefont Etude de l apparition ou non d une maladie cardiaque des coronaires 1 Présentation des données Les

Plus en détail

STATISTIQUES. UE Modélisation pour la biologie

STATISTIQUES. UE Modélisation pour la biologie STATISTIQUES UE Modélisation pour la biologie 2011 Cadre Général n individus: 1, 2,..., n Y variable à expliquer : Y = (y 1, y 2,..., y n ), y i R Modèle: Y = Xθ + ε X matrice du plan d expériences θ paramètres

Plus en détail

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent

Plus en détail

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9

Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9 Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9 L analyse de variance à un facteur permet de vérifier, moyennant certaines hypothèses, si un facteur (un critère de classification,

Plus en détail

Data mining II. Modélisation Statistique & Apprentissage

Data mining II. Modélisation Statistique & Apprentissage Publications du Laboratoire de Statistique et Probabilités Data mining II. Modélisation Statistique & Apprentissage Philippe BESSE Version janvier 2003 mises à jour : www.lsp.ups-tlse.fr/besse Laboratoire

Plus en détail

Bureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr

Bureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr Dominique Muller Laboratoire Inter-universitaire de Psychologie Bureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr Supports de cours : webcom.upmf-grenoble.fr/lip/perso/dmuller/m2r/acm/

Plus en détail

SAS de base : gestion des données et procédures élémentaires

SAS de base : gestion des données et procédures élémentaires 1 SAS de base : gestion des données et procédures élémentaires SAS de base : gestion des données et procédures élémentaires Résumé Description des commandes (module SAS de base) les plus utiles de l étape

Plus en détail

Données longitudinales et modèles de survie

Données longitudinales et modèles de survie ANALYSE DU Données longitudinales et modèles de survie 5. Modèles de régression en temps discret André Berchtold Département des sciences économiques, Université de Genève Cours de Master ANALYSE DU Plan

Plus en détail

INITIATION AU LOGICIEL SAS

INITIATION AU LOGICIEL SAS INITIATION AU LOGICIEL SAS (version 9.1.3 sous Windows) Hélène HAMISULTANE Bibliographie : Initiation au logiciel SAS(9) pour Windows, Coqué N. (juin 2006). www.agroparistech.fr/img/pdf/polysas.pdf SAS

Plus en détail

Lire ; Compter ; Tester... avec R

Lire ; Compter ; Tester... avec R Lire ; Compter ; Tester... avec R Préparation des données / Analyse univariée / Analyse bivariée Christophe Genolini 2 Table des matières 1 Rappels théoriques 5 1.1 Vocabulaire....................................

Plus en détail

TABLE DES MATIERES. C Exercices complémentaires 42

TABLE DES MATIERES. C Exercices complémentaires 42 TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence

Plus en détail

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels Etab=MK3, Timbre=G430, TimbreDansAdresse=Vrai, Version=W2000/Charte7, VersionTravail=W2000/Charte7 Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

Plus en détail

Formations EViews FORMATIONS GENERALES INTRODUCTIVES INTRO : INTRODUCTION A LA PRATIQUE DE L ECONOMETRIE AVEC EVIEWS

Formations EViews FORMATIONS GENERALES INTRODUCTIVES INTRO : INTRODUCTION A LA PRATIQUE DE L ECONOMETRIE AVEC EVIEWS Formations EViews FORMATIONS GENERALES INTRODUCTIVES DEB : DECOUVERTE DU LOGICIEL EVIEWS INTRO : INTRODUCTION A LA PRATIQUE DE L ECONOMETRIE AVEC EVIEWS FORMATIONS METHODES ECONOMETRIQUES VAR : MODELES

Plus en détail

PROGRAMME (Susceptible de modifications)

PROGRAMME (Susceptible de modifications) Page 1 sur 8 PROGRAMME (Susceptible de modifications) Partie 1 : Méthodes des revues systématiques Mercredi 29 mai 2013 Introduction, présentation du cours et des participants Rappel des principes et des

Plus en détail

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p. STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,

Plus en détail

LOGO. Module «Big Data» Extraction de Connaissances à partir de Données. Claudia MARINICA MCF, ETIS UCP/ENSEA/CNRS Claudia.Marinica@u-cergy.

LOGO. Module «Big Data» Extraction de Connaissances à partir de Données. Claudia MARINICA MCF, ETIS UCP/ENSEA/CNRS Claudia.Marinica@u-cergy. Module «Big Data» Extraction de Connaissances à partir de Données Claudia MARINICA MCF, ETIS UCP/ENSEA/CNRS Claudia.Marinica@u-cergy.fr 14 Janvier 2015 Pourquoi l extraction de connaissances à partir de

Plus en détail

Principe d un test statistique

Principe d un test statistique Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre

Plus en détail

Relation entre deux variables : estimation de la corrélation linéaire

Relation entre deux variables : estimation de la corrélation linéaire CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence

Plus en détail

2.4 Représentation graphique, tableau de Karnaugh

2.4 Représentation graphique, tableau de Karnaugh 2 Fonctions binaires 45 2.4 Représentation graphique, tableau de Karnaugh On peut définir complètement une fonction binaire en dressant son tableau de Karnaugh, table de vérité à 2 n cases pour n variables

Plus en détail

Imputation du salaire d ego dans TeO

Imputation du salaire d ego dans TeO Imputation du salaire d ego dans TeO Objet de la note : linéariser la réponse en tranche du salaire, et imputer le salaire en cas de non réponse Champ et principe de la méthode Les individus qui se sont

Plus en détail

Étude de cas Assurance (d après une étude de Philippe Périé, CISIA)

Étude de cas Assurance (d après une étude de Philippe Périé, CISIA) Étude de cas Assurance (d après une étude de Philippe Périé, CISIA) I.1.Les données L échantillon est constitué de 1106 assurés Belges observés en 1992 et répartis en 2 groupes. - les assurés qui n ont

Plus en détail

CONFERENCE PALISADE. Optimisation robuste d un plan d expériences par simulation Monte-Carlo Concepts de «Design Space» et de «Quality by Design»

CONFERENCE PALISADE. Optimisation robuste d un plan d expériences par simulation Monte-Carlo Concepts de «Design Space» et de «Quality by Design» CONFERENCE PALISADE Optimisation robuste d un plan d expériences par simulation Monte-Carlo Concepts de «Design Space» et de «Quality by Design» 1 SIGMA PLUS Logiciels, Formations et Etudes Statistiques

Plus en détail

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence

Plus en détail

FORMULAIRE DE STATISTIQUES

FORMULAIRE DE STATISTIQUES FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)

Plus en détail

Gestion de Portefeuille. Mesures de Performance Ajustées du Risque

Gestion de Portefeuille. Mesures de Performance Ajustées du Risque Gestion de Portefeuille Mesures de Performance Ajustées du Risque Le Ratio de Sharpe La mesure de performance (ajustée du risque) la plus utilisée Rappel: Propriétés du ratio de Sharpe Mesure de la stratégie:

Plus en détail

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 06/12/2009 Stéphane Tufféry - Data Mining - http://data.mining.free.fr

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 06/12/2009 Stéphane Tufféry - Data Mining - http://data.mining.free.fr Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE 1 Plan du cours Qu est-ce que le data mining? A quoi sert le data mining? Les 2 grandes familles de techniques Le déroulement d un projet de data

Plus en détail

Le risque Idiosyncrasique

Le risque Idiosyncrasique Le risque Idiosyncrasique -Pierre CADESTIN -Magali DRIGHES -Raphael MINATO -Mathieu SELLES 1 Introduction Risque idiosyncrasique : risque non pris en compte dans le risque de marché (indépendant des phénomènes

Plus en détail

ESIEA PARIS 2011-2012

ESIEA PARIS 2011-2012 ESIEA PARIS 2011-2012 Examen MAT 5201 DATA MINING Mardi 08 Novembre 2011 Première Partie : 15 minutes (7 points) Enseignant responsable : Frédéric Bertrand Remarque importante : les questions de ce questionnaire

Plus en détail

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU $SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU Fabien FIGUERES fabien.figueres@mpsa.com 0RWVFOpV : Krigeage, plans d expériences space-filling, points de validations, calibration moteur. 5pVXPp Dans le

Plus en détail

Séance 11 : Typologies

Séance 11 : Typologies Séance 11 : Typologies Sommaire Proc CLUSTER : Typologie hiérarchique... 3 Proc FASTCLUS : Typologie nodale... 8 Proc MODECLUS : Typologie non paramétrique... 11 - Les phénomènes observés (attitudes, comportements,

Plus en détail

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

Séance 0 : Linux + Octave : le compromis idéal

Séance 0 : Linux + Octave : le compromis idéal Séance 0 : Linux + Octave : le compromis idéal Introduction Linux est un système d'exploitation multi-tâches et multi-utilisateurs, basé sur la gratuité et développé par une communauté de passionnés. C'est

Plus en détail

Introduction à la statistique non paramétrique

Introduction à la statistique non paramétrique Introduction à la statistique non paramétrique Catherine MATIAS CNRS, Laboratoire Statistique & Génome, Évry http://stat.genopole.cnrs.fr/ cmatias Atelier SFDS 27/28 septembre 2012 Partie 2 : Tests non

Plus en détail

INF6304 Interfaces Intelligentes

INF6304 Interfaces Intelligentes INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie

Plus en détail

Introduction aux Statistiques et à l utilisation du logiciel R

Introduction aux Statistiques et à l utilisation du logiciel R Introduction aux Statistiques et à l utilisation du logiciel R Christophe Lalanne Christophe Pallier 1 Introduction 2 Comparaisons de deux moyennes 2.1 Objet de l étude On a mesuré le temps de sommeil

Plus en détail

Modèles Estimés sur Données de Panel

Modèles Estimés sur Données de Panel Modèles Estimés sur Données de Panel Introduction Il est fréquent en économétrie qu on ait à composer avec des données à deux dimensions : - une dimension chronologique - une dimension spatiale Par exemple,

Plus en détail

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année 2010-2011

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année 2010-2011 Master 1 Biologie et technologie du végétal Année 010-011 Statistiques Rappels de cours et travaux dirigés (Seul ce document sera autorisé en examen) auteur : Jean-Marc Labatte jean-marc.labatte@univ-angers.fr

Plus en détail

ANTISELECTION ET CHOIX D'ASSURANCE : LE CAS DU VOL EN HABITATION UNE APPROCHE DE LA MESURE DU PHENOMENE

ANTISELECTION ET CHOIX D'ASSURANCE : LE CAS DU VOL EN HABITATION UNE APPROCHE DE LA MESURE DU PHENOMENE ANTISELECTION ET CHOIX D'ASSURANCE : LE CAS DU VOL EN HABITATION UNE APPROCHE DE LA MESURE DU PHENOMENE Yannick MACÉ Statisticien-Economiste Responsable du Secteur Analyses Techniques, Groupama (C.C.A.M.A.)

Plus en détail

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION Bruno Saussereau Laboratoire de Mathématiques de Besançon Université de Franche-Comté Travail en commun

Plus en détail

1 Définition de la non stationnarité

1 Définition de la non stationnarité Chapitre 2: La non stationnarité -Testsdedétection Quelques notes de cours (non exhaustives) 1 Définition de la non stationnarité La plupart des séries économiques sont non stationnaires, c est-à-direqueleprocessusquiles

Plus en détail

Critère du choix des variables auxiliaires à utiliser dans l'estimateur par calage

Critère du choix des variables auxiliaires à utiliser dans l'estimateur par calage des variables auxiliaires à utiliser dans l'estimateur par calage Mohammed El Haj Tirari Institut National de Statistique et d'economie Appliquée - roc Laboratoire de Statistique d'enquêtes, CREST - Ensai

Plus en détail

Mémoire d actuariat - promotion 2010. complexité et limites du modèle actuariel, le rôle majeur des comportements humains.

Mémoire d actuariat - promotion 2010. complexité et limites du modèle actuariel, le rôle majeur des comportements humains. Mémoire d actuariat - promotion 2010 La modélisation des avantages au personnel: complexité et limites du modèle actuariel, le rôle majeur des comportements humains. 14 décembre 2010 Stéphane MARQUETTY

Plus en détail

Analyse des durées de vie avec le logiciel R

Analyse des durées de vie avec le logiciel R Analyse des durées de vie avec le logiciel R Ségolen Geffray Des outils ainsi que des données pour l analyse des durées de vie sont disponibles dans les packages survival MASS Il est nécessaire de charger

Plus en détail

Analyse discriminante et régression logistique: application au cas de l innovation pour les entreprises du Canton du Tessin

Analyse discriminante et régression logistique: application au cas de l innovation pour les entreprises du Canton du Tessin Analyse discriminante et régression logistique: application au cas de l innovation pour les entreprises du Canton du Tessin Sandro Petrillo Université de Neuchâtel - Diplôme Postgrade en Statistique Projet

Plus en détail

CAPTEURS - CHAINES DE MESURES

CAPTEURS - CHAINES DE MESURES CAPTEURS - CHAINES DE MESURES Pierre BONNET Pierre Bonnet Master GSI - Capteurs Chaînes de Mesures 1 Plan du Cours Propriétés générales des capteurs Notion de mesure Notion de capteur: principes, classes,

Plus en détail

Modèle GARCH Application à la prévision de la volatilité

Modèle GARCH Application à la prévision de la volatilité Modèle GARCH Application à la prévision de la volatilité Olivier Roustant Ecole des Mines de St-Etienne 3A - Finance Quantitative Décembre 2007 1 Objectifs Améliorer la modélisation de Black et Scholes

Plus en détail

Biostatistiques : Petits effectifs

Biostatistiques : Petits effectifs Biostatistiques : Petits effectifs Master Recherche Biologie et Santé P. Devos DRCI CHRU de Lille EA2694 patrick.devos@univ-lille2.fr Plan Données Générales : Définition des statistiques Principe de l

Plus en détail

Une comparaison de méthodes de discrimination des masses de véhicules automobiles

Une comparaison de méthodes de discrimination des masses de véhicules automobiles p.1/34 Une comparaison de méthodes de discrimination des masses de véhicules automobiles A. Rakotomamonjy, R. Le Riche et D. Gualandris INSA de Rouen / CNRS 1884 et SMS / PSA Enquêtes en clientèle dans

Plus en détail

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur

Plus en détail

LE TABLEUR OPENOFFICE CALC : CONTRÔLES DE FORMULAIRES ACCÈS AUX BASES DE DONNÉES

LE TABLEUR OPENOFFICE CALC : CONTRÔLES DE FORMULAIRES ACCÈS AUX BASES DE DONNÉES LE TABLEUR OPENOFFICE CALC : CONTRÔLES DE FORMULAIRES ACCÈS AUX BASES DE DONNÉES 1. Les bases de données dans OpenOffice CALC Dans OpenOffice Calc une base de données désigne simplement un tableau de valeurs.

Plus en détail

PROJET MODELE DE TAUX

PROJET MODELE DE TAUX MASTER 272 INGENIERIE ECONOMIQUE ET FINANCIERE PROJET MODELE DE TAUX Pricing du taux d intérêt des caplets avec le modèle de taux G2++ Professeur : Christophe LUNVEN 29 Fevrier 2012 Taylan KUNAL - Dinh

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

Chapitre 3. Les distributions à deux variables

Chapitre 3. Les distributions à deux variables Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles

Plus en détail

SAS ENTERPRISE MINER POUR L'ACTUAIRE

SAS ENTERPRISE MINER POUR L'ACTUAIRE SAS ENTERPRISE MINER POUR L'ACTUAIRE Conférence de l Association des Actuaires I.A.R.D. 07 JUIN 2013 Sylvain Tremblay Spécialiste en formation statistique SAS Canada AGENDA Survol d Enterprise Miner de

Plus en détail

Séries Statistiques Simples

Séries Statistiques Simples 1. Collecte et Représentation de l Information 1.1 Définitions 1.2 Tableaux statistiques 1.3 Graphiques 2. Séries statistiques simples 2.1 Moyenne arithmétique 2.2 Mode & Classe modale 2.3 Effectifs &

Plus en détail

Conception systematique d'algorithmes de detection de pannes dans les systemes dynamiques Michele Basseville, Irisa/Cnrs, Campus de Beaulieu, 35042 Rennes Cedex, bassevilleirisa.fr. 1 Publications. Exemples

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane

Plus en détail

1. Vocabulaire : Introduction au tableau élémentaire

1. Vocabulaire : Introduction au tableau élémentaire L1-S1 Lire et caractériser l'information géographique - Le traitement statistique univarié Statistique : le terme statistique désigne à la fois : 1) l'ensemble des données numériques concernant une catégorie

Plus en détail

Processus de compétitivité : Facteurs et évaluation

Processus de compétitivité : Facteurs et évaluation Processus de compétitivité : Facteurs et évaluation Application aux entreprises tunisiennes par Selma Katlane Ben Mlouka Selma Katlane Ben Mlouka Docteur en gestion, Assistante à la Faculté des Sciences

Plus en détail

Exercices sur SQL server 2000

Exercices sur SQL server 2000 Exercices sur SQL server 2000 La diagramme de classe : Exercices sur SQL server 2000 Le modèle relationnel correspondant : 1 Créer les tables Clic-droit on Tables et choisir «New Table» Créer la table

Plus en détail

EFFICACITÉ ET INNOCUITÉ D UN MÉDICAMENT CONTRE LA MPOC COMPARATIVEMENT À UN CONTRÔLE

EFFICACITÉ ET INNOCUITÉ D UN MÉDICAMENT CONTRE LA MPOC COMPARATIVEMENT À UN CONTRÔLE MICHÈLE PICARD FLIBOTTE EFFICACITÉ ET INNOCUITÉ D UN MÉDICAMENT CONTRE LA MPOC COMPARATIVEMENT À UN CONTRÔLE Essai-stage présenté à la Faculté des études supérieures de l Université Laval dans le cadre

Plus en détail

Répartition du tourisme de croisière dans la Caraïbe : quels déterminants?

Répartition du tourisme de croisière dans la Caraïbe : quels déterminants? Centre d Etude et de Recherche en Economie, Gestion, Modélisation et Informatique Appliquée www.ceregmia.eu Document de travail 2010-09 Décembre 2010 Répartition du tourisme de croisière dans la Caraïbe

Plus en détail

Comment évaluer une banque?

Comment évaluer une banque? Comment évaluer une banque? L évaluation d une banque est basée sur les mêmes principes généraux que n importe quelle autre entreprise : une banque vaut les flux qu elle est susceptible de rapporter dans

Plus en détail

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et

Plus en détail

Exercice : la frontière des portefeuilles optimaux sans actif certain

Exercice : la frontière des portefeuilles optimaux sans actif certain Exercice : la frontière des portefeuilles optimaux sans actif certain Philippe Bernard Ingénierie Economique & Financière Université Paris-Dauphine Février 0 On considère un univers de titres constitué

Plus en détail

Introduction à la Statistique Inférentielle

Introduction à la Statistique Inférentielle UNIVERSITE MOHAMMED V-AGDAL SCIENCES FACULTE DES DEPARTEMENT DE MATHEMATIQUES SMI semestre 4 : Probabilités - Statistique Introduction à la Statistique Inférentielle Prinemps 2013 0 INTRODUCTION La statistique

Plus en détail

1 Modélisation d être mauvais payeur

1 Modélisation d être mauvais payeur 1 Modélisation d être mauvais payeur 1.1 Description Cet exercice est très largement inspiré d un document que M. Grégoire de Lassence de la société SAS m a transmis. Il est intitulé Guide de démarrage

Plus en détail

Université de Montréal. département de sociologie. L'analyse factorielle et l'analyse de fidélité. notes de cours et exemples

Université de Montréal. département de sociologie. L'analyse factorielle et l'analyse de fidélité. notes de cours et exemples Université de Montréal département de sociologie L'analyse factorielle et l'analyse de fidélité notes de cours et exemples Claire Durand, 2003 Notes aux lecteurs... Ce texte a d'abord été préparé pour

Plus en détail

SDLS08 - Modes propres d'une plaque carrée calculés sur base réduite

SDLS08 - Modes propres d'une plaque carrée calculés sur base réduite Titre : SDLS08 - Modes propres d'une plaque carrée calculé[...] Date : 03/08/2011 Page : 1/6 SDLS08 - Modes propres d'une plaque carrée calculés sur base réduite Résumé : Ce cas test a pour objectif de

Plus en détail

FOAD COURS D ECONOMETRIE 1 CHAPITRE 2 : Hétéroscédasicité des erreurs. 23 mars 2012.

FOAD COURS D ECONOMETRIE 1 CHAPITRE 2 : Hétéroscédasicité des erreurs. 23 mars 2012. FOAD COURS D ECONOMETRIE CHAPITRE 2 : Hétéroscédasicité des erreurs. 23 mars 202. Christine Maurel Maître de conférences en Sciences Economiques Université de Toulouse - Capitole Toulouse School of Economics-ARQADE

Plus en détail

Analyse des correspondances avec colonne de référence

Analyse des correspondances avec colonne de référence ADE-4 Analyse des correspondances avec colonne de référence Résumé Quand une table de contingence contient une colonne de poids très élevé, cette colonne peut servir de point de référence. La distribution

Plus en détail

Statistiques Descriptives à une dimension

Statistiques Descriptives à une dimension I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des

Plus en détail

Faire un semi variograme et une carte krigée avec surfer

Faire un semi variograme et une carte krigée avec surfer Faire un semi variograme et une carte krigée avec surfer Jérôme Mathieu http://www.jerome.mathieu.freesurf.fr avril 2004 Fichier de données Faire un fichier excel avec les données organisée en colonnes:

Plus en détail

IBM SPSS Forecasting. Créez des prévisions d'expert en un clin d'œil. Points clés. IBM Software Business Analytics

IBM SPSS Forecasting. Créez des prévisions d'expert en un clin d'œil. Points clés. IBM Software Business Analytics IBM SPSS Statistics 19 IBM SPSS Forecasting Créez des prévisions d'expert en un clin d'œil Points clés Développer des prévisions fiables rapidement Réduire les erreurs de prévision Mettre à jour et gérer

Plus en détail

PROGRAMMATION ET LOGICIELS ECONOMETRIQUES

PROGRAMMATION ET LOGICIELS ECONOMETRIQUES PROGRAMMATION ET LOGICIELS ECONOMETRIQUES Manfred GILLI UNIVERSITE DE GENEVE Département d économétrie 1993 2006 (Ed 10 11 2006) TABLE DES MATIÈRES 1 ENVIRONNEMENT DE TRAVAIL 1 2 TSP: NOTIONS GÉNÉRALES

Plus en détail

Introduction à SPSS. Guy Mélard, U.L.B. Mars 2006 (gmelard@ulb.ac.be) Guy Mélard, ULB 1. Introduction à SPSS. Objectif de la leçon.

Introduction à SPSS. Guy Mélard, U.L.B. Mars 2006 (gmelard@ulb.ac.be) Guy Mélard, ULB 1. Introduction à SPSS. Objectif de la leçon. à SPSS Objectif de la leçon à SPSS Elle a pour but de fournir une introduction à ce logiciel statistique de manière à faciliter son utilisation en complément de SAS, avec l illustration sur des exemples

Plus en détail

DETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES

DETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES Agence fédérale pour la Sécurité de la Chaîne alimentaire Administration des Laboratoires Procédure DETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES Date de mise en application

Plus en détail

Validation probabiliste d un Système de Prévision d Ensemble

Validation probabiliste d un Système de Prévision d Ensemble Validation probabiliste d un Système de Prévision d Ensemble Guillem Candille, janvier 2006 Système de Prévision d Ensemble (EPS) (ECMWF Newsletter 90, 2001) Plan 1 Critères de validation probabiliste

Plus en détail

Didacticiel - Études de cas. Description de quelques fonctions du logiciel PSPP, comparaison des résultats avec ceux de Tanagra, R et OpenStat.

Didacticiel - Études de cas. Description de quelques fonctions du logiciel PSPP, comparaison des résultats avec ceux de Tanagra, R et OpenStat. 1 Objectif Description de quelques fonctions du logiciel PSPP, comparaison des résultats avec ceux de Tanagra, R et OpenStat. Tout le monde l aura compris, je passe énormément de temps à analyser les logiciels

Plus en détail

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA

Plus en détail

Christophe SANNIER christophe.sannier@sirs-fr.com

Christophe SANNIER christophe.sannier@sirs-fr.com Systèmes d Information à Référence Spatiale Utilisation d un Estimateur de Régression avec des Données Landsat pour l Estimation de l Etendu et des Changements du Couvert Forestier du Gabon de 1990 à 2010

Plus en détail

Surveillance et maintenance prédictive : évaluation de la latence de fautes. Zineb SIMEU-ABAZI Univ. Joseph Fourier, LAG)

Surveillance et maintenance prédictive : évaluation de la latence de fautes. Zineb SIMEU-ABAZI Univ. Joseph Fourier, LAG) Surveillance et maintenance prédictive : évaluation de la latence de fautes Zineb SIMEU-ABAZI Univ. Joseph Fourier, LAG) SURVEILLANCE Analyser une situation et fournir des indicateurs! Détection de symptômes!

Plus en détail

Premiers pas avec SES-Pegase (version 7.0) SES : Un Système Expert pour l analyse Statistique des données. Premiers pas avec SES-Pegase 1

Premiers pas avec SES-Pegase (version 7.0) SES : Un Système Expert pour l analyse Statistique des données. Premiers pas avec SES-Pegase 1 Premiers pas avec SES-Pegase 1 Premiers pas avec SES-Pegase (version 7.0) SES : Un Système Expert pour l analyse Statistique des données www.delta-expert.com Mise à jour : Premiers pas avec SES-Pegase

Plus en détail

TP: Représentation des signaux binaires. 1 Simulation d un message binaire - Codage en ligne

TP: Représentation des signaux binaires. 1 Simulation d un message binaire - Codage en ligne Objectifs : Ce TP est relatif aux différentes méthodes de codage d une information binaire, et à la transmission en bande de base de cette information. Les grandes lignes de ce TP sont l étude des méthodes

Plus en détail

Ects. Utilitaire d Économétrie Version 2. Russell Davidson

Ects. Utilitaire d Économétrie Version 2. Russell Davidson Ects Utilitaire d Économétrie Version 2 Russell Davidson Mars 1993 Ects, Version 2 c Russell Davidson, Mars 1993. Tous droits de reproduction, de traduction, d adaptation, et d exécution réservés pour

Plus en détail

Exemples d Analyses de Variance avec R

Exemples d Analyses de Variance avec R Exemples d Analyses de Variance avec R Christophe Pallier 5 août 00 Résumé R est un logiciel d analyse statistique qui fournit toutes les procédures usuelles (t-tests, anova, tests non paramétriques...)

Plus en détail

Utilisation du Logiciel de statistique SPSS 8.0

Utilisation du Logiciel de statistique SPSS 8.0 Utilisation du Logiciel de statistique SPSS 8.0 1 Introduction Etude épidémiologique transversale en population générale dans 4 pays d Afrique pour comprendre les différences de prévalence du VIH. 2000

Plus en détail