Régression sur variables qualitatives - Analyse de la variance
|
|
- Noëlle Fontaine
- il y a 7 ans
- Total affichages :
Transcription
1 Régression sur variables qualitatives Analyse de la variance ENSAI Deuxième année - Modèles de régression
2 Introduction Dans ce chapitre, on étudie des cas particuliers de régression linéaire où : La variable à expliquer Y est quantitative, La ou les variables explicatives potentielles sont qualitatives très fréquent en pratique Exemples des données du Cirad et d Air Breizh
3 Cas d une variable à expliquer quantitative Y et d une variable explicative qualitative potentielle Objectif : déterminer si la variable explicative qualitative considérée a un effet - significatif - sur Y Définition La variable qualitative considérée est souvent appelée facteur On suppose qu elle prend ses valeurs dans un ensemble fini à I éléments appelés niveaux (du facteur) Une première analyse graphique : boîtes à moustaches (boxplot)
4 Données du Cirad Hauteur des eucalyptus Bloc
5 Données d Air Breizh ( ) Concentration maximale ozone E N S W Direction du vent
6 Données d Air Breizh ( ) Concentration maximale ozone Ensoleillé Nuageux Nébulosité
7 Pour i = 1 I, on note n i le nombre d observations de Y correspondant au ième niveau du facteur, et pour j = 1 n i, y ij désigne la jème observation de Y pour le ième niveau du facteur Soit n = I i=1 n i le nombre total d observations Définition Si n i > 0 pour tout i, on dira que le plan d expérience est complet Si n 1 = = n I, on dira que le plan d expérience est équilibré
8 Modèle d ANOVA à un facteur Les observations y ij, i = 1I, j = 1 n i sont supposées être issues du modèle { i = 1 I Y ij = µ + α i + ε ij,, j = 1 n i où les variables ε ij vérifient les conditions standards : - (C 1 ) E[ε ij ] = 0, - (C 2 ) cov(ε ij,ε i j ) = 0, - (C 3 ) var(ε ij ) = σ 2
9 Ecriture sous forme matricielle Recodage (disjonctif complet) du facteur en variables indicatrices (dummy variables) Matrice d incidence : A = (½ 1, ½ 2,, ½ I ) ie A =
10 Modèle : Y = Xβ + ε avec - Y = (Y 11,,Y 1n1,,Y I1,,Y InI ) - β = (µ,α 1,,α I ) - ε = (ε 11,,ε 1n1,,ε I1,,ε InI ), - X = (½,A), ie X =
11 Identifiabilité et contraintes Problème : le modèle n est pas identifiable Contre-exemple pour l unicité La matrice X n est pas de plein rang Solution : contrainte linéaire identifiante sur les cœfficients reparamétrisation du modèle 1 Contrainte de type analyse par cellule : µ = 0 On pose alors β = (α 1,,α I ) et X = A 2 Contrainte de type cellule de référence : α ir = 0 pour un i r choisi dans {1,,I } Choix de SAS et R par défaut 3 Contrainte d orthogonalité : I i=1 n iα i = 0 4 Contrainte de type somme : I i=1 α i = 0
12 Contrainte µ = 0 Modèle : Y = Xβ + ε avec β = (α 1,,α I ) et X = A 1 n n X 0 n X = et (X X) 1 0 n = n 1 I 0 0 n I Estimateur des moindres carrés ordinaires de β ˆβ = (X X) 1 X Y = (ˆα 1,, ˆα I ) où ˆα i = Ȳ i = 1 n i ni j=1 Y ij pour tout i
13 Remarque : l estimateur ˆβ est intuitif! Proposition ˆβ est un estimateur sans biais de β de variance σ 2 diag ( 1 n 1,, 1 n I ) minimale parmi les estimateurs linéaires sans biais de β Le vecteur des valeurs ajustées est défini par Ŷ = (Ȳ1,,ȲI ), et celui des résidus par : ˆε ij = Y ij Ȳi Proposition L estimateur sans biais de la variance σ 2 est σ 2 = 1 I ni n I i=1 j=1 ˆε2 ij = 1 I ni n I i=1 j=1 (Y ij Ȳ i ) 2
14 Contrainte α ir = 0 Modèle : Y = Xβ + ε avec β = (µ,α 1,,α ir 1,α ir+1,,α I ) et X = (½, ½ 1,, ½ ir 1, ½ ir+1,, ½ I ) Estimateur des moindres carrés ordinaires de β ˆβ = (X X) 1 X Y = (ˆµ, ˆα 1,, ˆα ir 1, ˆα ir+1,, ˆα I ), avec ˆµ = Ȳi r, ˆα i = Ȳi Ȳi r pour i {1,,i r 1,i r + 1,,I } Remarques : - Vecteur des valeurs ajustées inchangé car E(X) inchangé ie Ŷ = (Ȳ1,,ȲI ) - Vecteur des résidus et estimateur sans biais de σ 2 : idem aussi
15 Contrainte I i=1 n iα i = 0 (α I = 1 n I I 1 i=1 n iα i ) Modèle ( : Y = Xβ + ε avec β = (µ,α 1 ),,α I 1 ) et X = ½, ½ 1 n 1 n I ½ I,, ½ I 1 n I 1 n I ½ I Estimateur des moindres carrés ordinaires de β ˆβ = (ˆµ, ˆα 1,, ˆα I 1 ), avec ˆµ = Ȳ = 1 n I i=1 n iȳi, ˆα i = Ȳ i Ȳ pour i {1,,I 1} Remarque : vecteur des valeurs ajustées, vecteur des résidus et estimateur sans biais de σ 2 inchangés (E(X) inchangé)
16 Contrainte I i=1 α i = 0 (α I = I 1 i=1 α i) Modèle : Y = Xβ + ε avec β = (µ,α 1,,α I 1 ) et X = (½, ½ 1 ½ I,, ½ I 1 ½ I ) Estimateur des moindres carrés ordinaires de β ˆβ = (ˆµ, ˆα 1,, ˆα I 1 ), avec ˆµ = 1 I I i=1 Ȳi, ˆα i = Ȳ i 1 I I i=1 Ȳi pour i {1,,I 1} Remarque : vecteur des valeurs ajustées, vecteur des résidus et estimateur sans biais de σ 2 inchangés (E(X) inchangé)
17 On rappelle ici l équation d analyse de la variance usuelle : SCT = SCE + SCR Elle s exprime ici, puisque ½ E(X) quelle que soit la contrainte, sous la forme : Interprétation : Y Ȳ ½ 2 = Ŷ Ȳ ½ 2 + Y Ŷ 2 SCE = variabilité inter cellules, dispersion des moyennes empiriques par cellules autour de la moyenne empirique globale SCR = variabilité intra cellules
18 On suppose (C 4 ) vérifiée : ε suit une loi gaussienne Test d effet du facteur (H 0 ) : α 1 = = α I = 0 contre (H 1 ) : (i,i ),α i α i Cas particulier de test de validité de sous-modèle Statistique de test : F(Y ) = SCE/(I 1) SCR/(n I) = I i=1 ni(ȳi Ȳ )2 /(I 1) I ni i=1 j=1 (Y ij Y i ) 2 /(n I) Loi sous (H 0 ) : F(Y ) (H0 ) F(I 1,n I) Région critique du test de niveau α : {y, F(y) > f I 1,n I (1 α)}
19 Tableau d analyse de la variance Variation ddl SC CM F Pr(> F) Facteur I 1 SCE SCE/(I 1) Résiduelle n I SCR SCR/(n I) Totale n 1 SCT SCE/(I 1) SCR/(n I)
20 Cas d une variable à expliquer Y quantitative et de deux variables explicatives qualitatives potentielles = deux facteurs dont le premier à I niveaux, et le deuxième à J niveaux Objectif : déterminer si les facteurs considérés ont un effet - significatif - sur Y Une première analyse graphique : tracé des moyennes empiriques par cellules (profils)
21 Exemple des données d Air Breizh Concentration maximale ozone moyenne Nébulosité Ensoleillé Nuageux E N S W Direction du vent
22 Introduction Exemple des données d Air Breizh Concentration maximale ozone moyenne Vent E S N W Ensoleillé Nuageux Nébulosité
23 Pour tout i = 1 I, j = 1 J, on note n i,j le nombre d observations de la variable Y correspondant aux ième et jème niveaux des deux facteurs considérés, et y ijk la kième observation de Y correspondant aux ième et jème niveaux des facteurs On suppose que y ijk est l observation d une variable aléatoire Y ijk Notations utiles : n = I J i=1 j=1 n i,j nombre total d observations, Ȳ ij = 1 ni,j n i,j k=1 Y ijk, 1 Ȳ i = J ni,j J j=1 n j=1 i,j Ȳ j = 1 I i=1 n i,j I i=1 Ȳ = 1 n I i=1 J j=1 k=1 Y ijk, ni,j k=1 Y ijk, ni,j k=1 Y ijk
24 Modèle d ANOVA à deux facteurs Les observations y ijk, i = 1 I, j = 1 J, k = 1 n i,j sont supposées être issues du modèle Y ijk = µ + α i + η j + γ ij + ε ijk, i = 1 I j = 1 J k = 1 n i,j, où les variables ε ijk vérifient les conditions standards : - (C 1 ) E[ε ijk ] = 0, - (C 2 ) cov(ε ijk,ε i j k ) = 0, - (C 3 ) var(ε ijk ) = σ 2 On considère dans la suite seulement le cas d un plan d expérience équilibré ie n i,j = K pour tout (i,j)
25 Ecriture sous forme matricielle Recodage des facteurs en variables indicatrices Matrices d incidences : A = (½ 1, ½ 2,,½ I ), B = (½ 1, ½ 2,, ½ J ), C = (½ 11, ½ 12,, ½ 1J,, ½ I1,,½ IJ ) Modèle : Y = Xβ + ε avec Y = (Y ijk ) i=1i,j=1j,k=1k, ε = (ε ijk ) i=1i,j=1j,k=1k, β = (µ,α 1,,α I,η 1,,η J,γ 11,,γ 1J,,γ I1,,γ IJ ), X = (½,A,B,C)
26 Identifiabilité et contraintes Problème : Le modèle n est pas identifiable La matrice X est de taille n (1 + I + J + IJ), mais rang(x) = IJ Solution : ensemble de 1 + I + J contraintes linéaires identifiantes sur les cœfficients linéairement indépendantes reparamétrisation du modèle 1 Contrainte de type analyse par cellule : µ = 0, α i = 0 i, η j = 0 j, 2 Contrainte de type cellule de référence : α ir = η jr = 0 et γ ijr = γ irj = 0 i = 1I, j = 1 J 3 Contrainte de type somme : I i=1 α i = J j=1 η j = 0 et I i=1 γ ij = J j=1 γ ij = 0 i = 1I, j = 1 J
27 Contrainte de type analyse par cellule i = 1 I Modèle : Y ijk = γ ij + ε ijk j = 1 J k = 1K Estimateurs des moindres carrés ordinaires des cœfficients ˆγ ij = Ȳ ij pour tout i = 1 I, j = 1 J Valeurs ajustées : Ŷ ijk = Ȳ ij, résidus : ˆε ijk = Y ijk Ȳ ij Estimateur sans biais de la variance σ 2 = SCR n IJ = 1 n IJ I i=1 J j=1 K k=1 (Y ijk Ȳ ij ) 2
28 Contrainte de type somme Modèle : Y ijk = µ + α i + η j + γ ij + ε ijk i = 1 I j = 1 J k = 1K, avec I i=1 α i = J j=1 η j = I i=1 γ ij = J j=1 γ ij = 0 i = 1 I, j = 1 J Estimateurs des moindres carrés ordinaires des cœfficients ˆµ = Ȳ, ˆα i = Ȳ i Ȳ, ˆη j = Ȳ j Ȳ, ˆγ ij = Ȳ ij Ȳ i Ȳ j + Ȳ Remarque : Valeurs ajustées, résidus et estimateur sans biais de la variance inchangés
29 On rappelle l équation d analyse de la variance usuelle : SCT = SCE + SCR La somme des carrés expliquée peut se décomposer par Pythagore en : SCE = SCE A + SCE B + SCE C, où SCE A = JK I i=1 ˆα2 i, SCE B = IK J j=1 ˆη2 j, SCE C = K I i=1 J j=1 ˆγ2 ij L équation d analyse de la variance devient alors : SCT = SCE A + SCE B + SCE C + SCR
30 On suppose (C 4 ) vérifiée : ε suit une loi gaussienne Test de l interaction (H 0 ) C : (i,j) γ ij = 0 contre (H 1 ) C : (i,j), γ ij 0 Cas particulier de test de validité de sous-modèle Statistique de test : F C (Y ) = SCE C /((I 1)(J 1)) SCR/(n IJ) Loi sous (H 0 ) C : F C (Y ) (H0 ) C F((I 1)(J 1),n IJ) Région critique du test de niveau α : {y, F C (y) > f (I 1)(J 1),n IJ (1 α)}
31 Remarque : Si on rejette (H 0 ) C, les facteurs ont un effet significatif, on ne teste donc pas les effets individuels de chaque facteur Si on ne rejette pas (H 0 ) C, on suppose que (i,j) γ ij = 0 et on teste les effets individuels de chaque facteur On suppose dans la suite (C 4 ) vérifiée : ε suit une loi gaussienne, et (i,j) γ ij = 0
32 Test de l effet du facteur A (H 0 ) A : i α i = 0 contre (H 1 ) A : i,α i 0 Par précaution, on choisit généralement d estimer σ 2 dans le modèle complet ie avec interaction (choix usuel des logiciels) Test de validité de sous-modèle Statistique de test : F A (Y ) = SCE A/(I 1) SCR/(n IJ) Loi sous (H 0 ) A : F A (Y ) (H0 ) A F(I 1,n IJ) Région critique du test de niveau α : {y, F A (y) > f I 1,n IJ (1 α)}
33 Test de l effet du facteur B (H 0 ) B : j η j = 0 contre (H 1 ) B : j,η j 0 Test de validité de sous-modèle Statistique de test : F B (Y ) = SCE B/(J 1) SCR/(n IJ) Loi sous (H 0 ) B : F B (Y ) (H0 ) B F(J 1,n IJ) Région critique du test de niveau α : {y, F B (y) > f J 1,n IJ (1 α)}
34 Tableau d analyse de la variance Variation ddl SC CM F Pr(> F) Facteur A I 1 SCE A SCE A I 1 Facteur B J 1 SCE B SCE B J 1 Interaction (I 1)(J 1) SCE C SCE C (I 1)(J 1) Résiduelle n IJ SCR SCR n IJ Totale n 1 SCT SCE A /(I 1) SCR/(n IJ) SCE B /(J 1) SCR/(n IJ) SCE C /((I 1)(J 1)) SCR/(n IJ)
35 Autres tests et intervalles de confiance par extension de la régression linéaire multiple générale Plans d expérience plus complexes Remarque fondamentale : une analyse de la variance doit être complétée comme toute analyse de modèle de régression par la recherche d éventuels écarts au modèle analyse des résidus, données atypiques, etc Pour une présentation plus complète de l analyse de la variance : Scheffé (1959) Mélange de variables quantitatives et qualitatives : ANCOVA (cf cours de Modèles de régression 2)
STATISTIQUES. UE Modélisation pour la biologie
STATISTIQUES UE Modélisation pour la biologie 2011 Cadre Général n individus: 1, 2,..., n Y variable à expliquer : Y = (y 1, y 2,..., y n ), y i R Modèle: Y = Xθ + ε X matrice du plan d expériences θ paramètres
Plus en détailAnalyse de la variance Comparaison de plusieurs moyennes
Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction
Plus en détailExemples d application
AgroParisTech Exemples d application du modèle linéaire E Lebarbier, S Robin Table des matières 1 Introduction 4 11 Avertissement 4 12 Notations 4 2 Régression linéaire simple 7 21 Présentation 7 211 Objectif
Plus en détailLe Modèle Linéaire par l exemple :
Publications du Laboratoire de Statistique et Probabilités Le Modèle Linéaire par l exemple : Régression, Analyse de la Variance,... Jean-Marc Azaïs et Jean-Marc Bardet Laboratoire de Statistique et Probabilités
Plus en détailFORMULAIRE DE STATISTIQUES
FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)
Plus en détailLe modèle de régression linéaire
Chapitre 2 Le modèle de régression linéaire 2.1 Introduction L économétrie traite de la construction de modèles. Le premier point de l analyse consiste à se poser la question : «Quel est le modèle?». Le
Plus en détailAnalyse en Composantes Principales
Analyse en Composantes Principales Anne B Dufour Octobre 2013 Anne B Dufour () Analyse en Composantes Principales Octobre 2013 1 / 36 Introduction Introduction Soit X un tableau contenant p variables mesurées
Plus en détailBureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr
Dominique Muller Laboratoire Inter-universitaire de Psychologie Bureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr Supports de cours : webcom.upmf-grenoble.fr/lip/perso/dmuller/m2r/acm/
Plus en détail2008/03. La concentration des portefeuilles : perspective générale et illustration
2008/03 La concentration des portefeuilles : perspective générale et illustration Olivier Le Courtois Professeur de finance et d assurance UPR Economie, Finance et Gestion EMLYON Christian Walter Actuaire
Plus en détailLa problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites
La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur
Plus en détailCONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un
Plus en détailApproche modèle pour l estimation en présence de non-réponse non-ignorable en sondage
Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage Journées de Méthodologie Statistique Eric Lesage Crest-Ensai 25 janvier 2012 Introduction et contexte 2/27 1 Introduction
Plus en détailIntroduction à l approche bootstrap
Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?
Plus en détailAnnexe commune aux séries ES, L et S : boîtes et quantiles
Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans
Plus en détailTESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION
TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION Bruno Saussereau Laboratoire de Mathématiques de Besançon Université de Franche-Comté Travail en commun
Plus en détailChapitre 5 : Flot maximal dans un graphe
Graphes et RO TELECOM Nancy A Chapitre 5 : Flot maximal dans un graphe J.-F. Scheid 1 Plan du chapitre I. Définitions 1 Graphe Graphe valué 3 Représentation d un graphe (matrice d incidence, matrice d
Plus en détailINTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES
INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine
Plus en détailEconométrie La régression linéaire simple et multiple
Ricco Rakotomalala Econométrie La régression linéaire simple et multiple Version 1.1 Université Lumière Lyon 2 Page: 1 job: Econometrie_Regression macro: svmono.cls date/time: 26-May-2015/18:13 Page: 2
Plus en détailStatistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année 2010-2011
Master 1 Biologie et technologie du végétal Année 010-011 Statistiques Rappels de cours et travaux dirigés (Seul ce document sera autorisé en examen) auteur : Jean-Marc Labatte jean-marc.labatte@univ-angers.fr
Plus en détailBiostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke
www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3
Plus en détailApprentissage non paramétrique en régression
1 Apprentissage non paramétrique en régression Apprentissage non paramétrique en régression Résumé Différentes méthodes d estimation non paramétriques en régression sont présentées. Tout d abord les plus
Plus en détailPrudence, Epargne et Risques de Soins de Santé Christophe Courbage
Prudence, Epargne et Rique de Soin de Santé Chritophe Courbage ASSOCIATION DE GENÈVE Introduction Le compte d épargne anté (MSA), une nouvelle forme d intrument pour couvrir le dépene de anté en ca de
Plus en détailChapitre 3. Les distributions à deux variables
Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles
Plus en détailCours 9 : Plans à plusieurs facteurs
Cours 9 : Plans à plusieurs facteurs Table des matières Section 1. Diviser pour regner, rassembler pour saisir... 3 Section 2. Définitions et notations... 3 2.1. Définitions... 3 2.2. Notations... 4 Section
Plus en détailStatistiques descriptives
Statistiques descriptives L3 Maths-Eco Université de Nantes Frédéric Lavancier F. Lavancier (Univ. Nantes) Statistiques descriptives 1 1 Vocabulaire de base F. Lavancier (Univ. Nantes) Statistiques descriptives
Plus en détail(51) Int Cl.: H04L 29/06 (2006.01) G06F 21/55 (2013.01)
(19) TEPZZ 8 8 4_A_T (11) EP 2 838 241 A1 (12) DEMANDE DE BREVET EUROPEEN (43) Date de publication: 18.02.1 Bulletin 1/08 (1) Int Cl.: H04L 29/06 (06.01) G06F 21/ (13.01) (21) Numéro de dépôt: 141781.4
Plus en détailAnalyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9
Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9 L analyse de variance à un facteur permet de vérifier, moyennant certaines hypothèses, si un facteur (un critère de classification,
Plus en détailCours de méthodes de scoring
UNIVERSITE DE CARTHAGE ECOLE SUPERIEURE DE STATISTIQUE ET D ANALYSE DE L INFORMATION Cours de méthodes de scoring Préparé par Hassen MATHLOUTHI Année universitaire 2013-2014 Cours de méthodes de scoring-
Plus en détailStatistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier
Statistiques Appliquées à l Expérimentation en Sciences Humaines Christophe Lalanne, Sébastien Georges, Christophe Pallier Table des matières 1 Méthodologie expérimentale et recueil des données 6 1.1 Introduction.......................................
Plus en détailL ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ
L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et
Plus en détailCours Informatique Master STEP
Cours Informatique Master STEP Bases de la programmation: Compilateurs/logiciels Algorithmique et structure d'un programme Programmation en langage structuré (Fortran 90) Variables, expressions, instructions
Plus en détailTABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie
PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats Pierre Dagnelie TABLE DES MATIÈRES 2012 Presses agronomiques de Gembloux pressesagro.gembloux@ulg.ac.be www.pressesagro.be
Plus en détailLES GENERATEURS DE NOMBRES ALEATOIRES
LES GENERATEURS DE NOMBRES ALEATOIRES 1 Ce travail a deux objectifs : ====================================================================== 1. Comprendre ce que font les générateurs de nombres aléatoires
Plus en détailTempérature corporelle d un castor (une petite introduction aux séries temporelles)
Température corporelle d un castor (une petite introduction aux séries temporelles) GMMA 106 GMMA 106 2014 2015 1 / 32 Cas d étude Temperature (C) 37.0 37.5 38.0 0 20 40 60 80 100 Figure 1: Temperature
Plus en détailTests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»
Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences
Plus en détailChapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens
Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques
Plus en détailUFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES
Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,
Plus en détailProgrammation linéaire et Optimisation. Didier Smets
Programmation linéaire et Optimisation Didier Smets Chapitre 1 Un problème d optimisation linéaire en dimension 2 On considère le cas d un fabricant d automobiles qui propose deux modèles à la vente, des
Plus en détailL Econométrie des Données de Panel
Ecole Doctorale Edocif Séminaire Méthodologique L Econométrie des Données de Panel Modèles Linéaires Simples Christophe HURLIN L Econométrie des Données de Panel 2 Figure.: Présentation Le but de ce séminaire
Plus en détailNotes de cours Statistique avec le logiciel R
Notes de cours Statistique avec le logiciel R Shuyan LIU Shuyan.Liu@univ-paris1.fr http ://samm.univ-paris1.fr/shuyan-liu-enseignement Année 2013-2014 Chapitre 1 Introduction L objectif de ce cours est
Plus en détailProgrammation linéaire
Programmation linéaire DIDIER MAQUIN Ecole Nationale Supérieure d Electricité et de Mécanique Institut National Polytechnique de Lorraine Mathématiques discrètes cours de 2ème année Programmation linéaire
Plus en détailDurée de L épreuve : 2 heures. Barème : Exercice n 4 : 1 ) 1 point 2 ) 2 points 3 ) 1 point
03 Mai 2013 Collège Oasis Durée de L épreuve : 2 heures. apple Le sujet comporte 4 pages et est présenté en livret ; apple La calculatrice est autorisée ; apple 4 points sont attribués à la qualité de
Plus en détailCours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES
LES STATISTIQUES INFERENTIELLES (test de Student) L inférence statistique est la partie des statistiques qui, contrairement à la statistique descriptive, ne se contente pas de décrire des observations,
Plus en détailEtude des propriétés empiriques du lasso par simulations
Etude des propriétés empiriques du lasso par simulations L objectif de ce TP est d étudier les propriétés empiriques du LASSO et de ses variantes à partir de données simulées. Un deuxième objectif est
Plus en détailStéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 06/12/2009 Stéphane Tufféry - Data Mining - http://data.mining.free.fr
Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE 1 Plan du cours Qu est-ce que le data mining? A quoi sert le data mining? Les 2 grandes familles de techniques Le déroulement d un projet de data
Plus en détailEstimation et tests statistiques, TD 5. Solutions
ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études
Plus en détailPierre Thérond pierre@therond.fr. Année universitaire 2013-2014
http://www.therond.fr pierre@therond.fr Institut de Science Financière et d Assurances - Université Lyon 1 Année universitaire 2013-2014 Plan du cours 1 Chapitre 1 - Introduction 2 3 4 Bibliographie principale
Plus en détailObjectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique
Objectifs Clustering On ne sait pas ce qu on veut trouver : on laisse l algorithme nous proposer un modèle. On pense qu il existe des similarités entre les exemples. Qui se ressemble s assemble p. /55
Plus en détailCours d analyse numérique SMI-S4
ours d analyse numérique SMI-S4 Introduction L objet de l analyse numérique est de concevoir et d étudier des méthodes de résolution de certains problèmes mathématiques, en général issus de problèmes réels,
Plus en détailExercice : la frontière des portefeuilles optimaux sans actif certain
Exercice : la frontière des portefeuilles optimaux sans actif certain Philippe Bernard Ingénierie Economique & Financière Université Paris-Dauphine Février 0 On considère un univers de titres constitué
Plus en détailFOAD COURS D ECONOMETRIE 1 CHAPITRE 2 : Hétéroscédasicité des erreurs. 23 mars 2012.
FOAD COURS D ECONOMETRIE CHAPITRE 2 : Hétéroscédasicité des erreurs. 23 mars 202. Christine Maurel Maître de conférences en Sciences Economiques Université de Toulouse - Capitole Toulouse School of Economics-ARQADE
Plus en détailEvaluation des modèles non-linéaires à effets mixtes
Evaluation des effets mixtes INSERM UMR738 GDR Statistiques et Santé, 20 octobre 2009 Pharmacométrie Définition modélisation des données obtenues lors d essais cliniques sur des médicaments développement
Plus en détailLa place de SAS dans l'informatique décisionnelle
La place de SAS dans l'informatique décisionnelle Olivier Decourt ABS Technologies - Educasoft Formations La place de SAS dans l'informatique décisionnelle! L'historique de SAS! La mécanique! La carrosserie
Plus en détailLA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
Plus en détailUtilisation du module «Geostatistical Analyst» d ARCVIEW dans le cadre de la qualité de l air
Etude n 10 Assistance en modélisation (Rapport 3/3) Utilisation du module «Geostatistical Analyst» d ARCVIEW dans le cadre de la qualité de l air Novembre 2004 Convention : 04000087 Giovanni CARDENAS Utilisation
Plus en détailUne introduction. Lionel RIOU FRANÇA. Septembre 2008
Une introduction INSERM U669 Septembre 2008 Sommaire 1 Effets Fixes Effets Aléatoires 2 Analyse Classique Effets aléatoires Efficacité homogène Efficacité hétérogène 3 Estimation du modèle Inférence 4
Plus en détailChapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE
UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction
Plus en détailGUIDE PRATIQUE. Du provisionnement des emprunts à risques
Ministère de l Égalité des territoires et du Logement Ministère de l Économie et des Finances GUIDE PRATIQUE Du provisionnement des emprunts à risques Application aux Offices Publics de l Habitat à comptabilité
Plus en détailCorrigé du baccalauréat S Asie 21 juin 2010
Corrigé du baccalauréat S Asie juin 00 EXERCICE Commun à tous les candidats 4 points. Question : Le triangle GBI est : Réponse a : isocèle. Réponse b : équilatéral. Réponse c : rectangle. On a GB = + =
Plus en détailModèles et Méthodes de Réservation
Modèles et Méthodes de Réservation Petit Cours donné à l Université de Strasbourg en Mai 2003 par Klaus D Schmidt Lehrstuhl für Versicherungsmathematik Technische Universität Dresden D 01062 Dresden E
Plus en détailLa programmation linéaire : une introduction. Qu est-ce qu un programme linéaire? Terminologie. Écriture mathématique
La programmation linéaire : une introduction Qu est-ce qu un programme linéaire? Qu est-ce qu un programme linéaire? Exemples : allocation de ressources problème de recouvrement Hypothèses de la programmation
Plus en détailProgrammation linéaire
1 Programmation linéaire 1. Le problème, un exemple. 2. Le cas b = 0 3. Théorème de dualité 4. L algorithme du simplexe 5. Problèmes équivalents 6. Complexité de l Algorithme 2 Position du problème Soit
Plus en détailTABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.
STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,
Plus en détailGestion des Clés Publiques (PKI)
Chapitre 3 Gestion des Clés Publiques (PKI) L infrastructure de gestion de clés publiques (PKI : Public Key Infrastructure) représente l ensemble des moyens matériels et logiciels assurant la gestion des
Plus en détailProbabilités et Statistiques. Feuille 2 : variables aléatoires discrètes
IUT HSE Probabilités et Statistiques Feuille : variables aléatoires discrètes 1 Exercices Dénombrements Exercice 1. On souhaite ranger sur une étagère 4 livres de mathématiques (distincts), 6 livres de
Plus en détailExercices du Cours de la programmation linéaire donné par le Dr. Ali DERBALA
75. Un plombier connaît la disposition de trois tuyaux sous des dalles ( voir figure ci dessous ) et il lui suffit de découvrir une partie de chacun d eux pour pouvoir y poser les robinets. Il cherche
Plus en détailRégression linéaire. Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr
Régression linéaire Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr 2005 Plan Régression linéaire simple Régression multiple Compréhension de la sortie de la régression Coefficient de détermination R
Plus en détailMéthodes de quadrature. Polytech Paris-UPMC. - p. 1/48
Méthodes de Polytech Paris-UPMC - p. 1/48 Polynôme d interpolation de Preuve et polynôme de Calcul de l erreur d interpolation Étude de la formule d erreur Autres méthodes - p. 2/48 Polynôme d interpolation
Plus en détailLA PHYSIQUE DES MATERIAUX. Chapitre 1 LES RESEAUX DIRECT ET RECIPROQUE
LA PHYSIQUE DES MATERIAUX Chapitre 1 LES RESEAUX DIRECT ET RECIPROQUE Pr. A. Belayachi Université Mohammed V Agdal Faculté des Sciences Rabat Département de Physique - L.P.M belayach@fsr.ac.ma 1 1.Le réseau
Plus en détailACTUARIAT 1, ACT 2121, AUTOMNE 2013 #16
ACTUARIAT 1, ACT 2121, AUTOMNE 201 #16 ARTHUR CHARPENTIER 1 Dans une petite compagnie d assurance le nombre N de réclamations durant une année suit une loi de Poisson de moyenne λ = 100. On estime que
Plus en détailArbres binaires de décision
1 Arbres binaires de décision Résumé Arbres binaires de décision Méthodes de construction d arbres binaires de décision, modélisant une discrimination (classification trees) ou une régression (regression
Plus en détailMODELE A CORRECTION D ERREUR ET APPLICATIONS
MODELE A CORRECTION D ERREUR ET APPLICATIONS Hélène HAMISULTANE Bibliographie : Bourbonnais R. (2000), Econométrie, DUNOD. Lardic S. et Mignon V. (2002), Econométrie des Séries Temporelles Macroéconomiques
Plus en détailPremière partie. Préliminaires : noyaux itérés. MPSI B 6 juin 2015
Énoncé Soit V un espace vectoriel réel. L espace vectoriel des endomorphismes de V est désigné par L(V ). Lorsque f L(V ) et k N, on désigne par f 0 = Id V, f k = f k f la composée de f avec lui même k
Plus en détailLes droites (d 1 ) et (d 2 ) sont sécantes en A Le point A est le point d intersection des 2 droites
I Droites perpendiculaires Lorsque deux droites se coupent, on dit qu elles sont sécantes Les droites (d 1 ) et (d 2 ) sont sécantes en A Le point A est le point d intersection des 2 droites Lorsque deux
Plus en détailPropriétés des options sur actions
Propriétés des options sur actions Bornes supérieure et inférieure du premium / Parité call put 1 / 1 Taux d intérêt, capitalisation, actualisation Taux d intéret composés Du point de vue de l investisseur,
Plus en détailRésumé du Cours de Statistique Descriptive. Yves Tillé
Résumé du Cours de Statistique Descriptive Yves Tillé 15 décembre 2010 2 Objectif et moyens Objectifs du cours Apprendre les principales techniques de statistique descriptive univariée et bivariée. Être
Plus en détailBIOSTATISTIQUES AVANCEES PLAN. Quelques références. Master Biologie Intégrative 1 ère année
Master Biologie Intégrative 1 ère année 1 BIOSTATISTIQUES AVANCEES Yves Desdevises! Observatoire Océanologique de Banyuls-sur-Mer (www.obs-banyuls.fr)! 04 68 88 73 13! desdevises@obs-banyuls.fr! http://desdevises.free.fr
Plus en détailEvolutions du Relevé de Compte 120 caractères pour les opérations de virements et de prélèvements SEPA
Evolutions du Relevé de Compte 120 caractères pour les opérations de virements et de prélèvements SEPA MARS 2010 Version Validée : 2.0 Objet : l objet de ce document est de présenter les évolutions nécessaires
Plus en détailEnoncé et corrigé du brevet des collèges dans les académies d Aix- Marseille, Montpellier, Nice Corse et Toulouse en 2000. Énoncé.
Enoncé et corrigé du brevet des collèges dans les académies d Aix- Marseille, Montpellier, Nice Corse et Toulouse en 2000. Énoncé. I- ACTIVITES NUMERIQUES (12 points) Exercice 1 (3 points) On considère
Plus en détailExo7. Matrice d une application linéaire. Corrections d Arnaud Bodin.
Exo7 Matrice d une application linéaire Corrections d Arnaud odin. Exercice Soit R muni de la base canonique = ( i, j). Soit f : R R la projection sur l axe des abscisses R i parallèlement à R( i + j).
Plus en détailAide-mémoire de statistique appliquée à la biologie
Maxime HERVÉ Aide-mémoire de statistique appliquée à la biologie Construire son étude et analyser les résultats à l aide du logiciel R Version 5(2) (2014) AVANT-PROPOS Les phénomènes biologiques ont cela
Plus en détailFctsAffines.nb 1. Mathématiques, 1-ère année Edition 2007-2008. Fonctions affines
FctsAffines.nb 1 Mathématiques, 1-ère année Edition 2007-2008 Fonctions affines Supports de cours de mathématiques de degré secondaire II, lien hpertete vers la page mère http://www.deleze.name/marcel/sec2/inde.html
Plus en détailTD1 Signaux, énergie et puissance, signaux aléatoires
TD1 Signaux, énergie et puissance, signaux aléatoires I ) Ecrire l'expression analytique des signaux représentés sur les figures suivantes à l'aide de signaux particuliers. Dans le cas du signal y(t) trouver
Plus en détailTests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles
Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA
Plus en détailApplication sur le Dispositif en Blocs Complètement Randomisés
Roger Vumilia. KIZUNGU Directeur de l Expérimentation Agricole à l INERA Professeur Associé Faculté des Sciences Agronomiques Université de Kinshasa Utilisation des Logiciels de base dans la Recherche
Plus en détailAnalyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés
Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent
Plus en détailIntroduction à l étude des Corps Finis
Introduction à l étude des Corps Finis Robert Rolland (Résumé) 1 Introduction La structure de corps fini intervient dans divers domaines des mathématiques, en particulier dans la théorie de Galois sur
Plus en détailLES AMORTISSEMENTS : CALCULS ENREGISTREMENTS
LES AMORTISSEMENTS : CALCULS ENREGISTREMENTS PRESENTATION DES MODES D AMORTISSEMENT Exemple 1 : CAS D UN AMORTISSEMENT VARIABLE On acquiert le 04/08/N une machine-outil pour une valeur HT de. Cette machine,
Plus en détailFonctions de plusieurs variables : dérivés partielles, diérentielle. Fonctions composées. Fonctions de classe C 1. Exemples
45 Fonctions de plusieurs variables : dérivés partielles, diérentielle. Fonctions composées. Fonctions de classe C 1. Exemples Les espaces vectoriels considérés sont réels, non réduits au vecteur nul et
Plus en détail1 Complément sur la projection du nuage des individus
TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent
Plus en détaildonnées en connaissance et en actions?
1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)
Plus en détail1 - Connexion au service de gestion des demandes informatiques du lycée
1 - Connexion au service de gestion des demandes informatiques du lycée http://support.e-lycee-paca.fr Adresse du service en ligne à partir de tout point d accès internet, 24h/24. 1 Les identifiants sont
Plus en détailModèles Estimés sur Données de Panel
Modèles Estimés sur Données de Panel Introduction Il est fréquent en économétrie qu on ait à composer avec des données à deux dimensions : - une dimension chronologique - une dimension spatiale Par exemple,
Plus en détailReprésentation géométrique d un nombre complexe
CHAPITRE 1 NOMBRES COMPLEXES 1 Représentation géométrique d un nombre complexe 1. Ensemble des nombres complexes Soit i le nombre tel que i = 1 L ensemble des nombres complexes est l ensemble des nombres
Plus en détailLe nouveau système de surveillance continue des émissions atmosphériques
Le nouveau système de surveillance continue des émissions atmosphériques à l'incinérateur Mars 2010 Travaux publics Gestion des matières résiduelles CONTENU DE LA PRÉSENTATION 1. L incinérateur 2. Obligations
Plus en détailAPPROCHER LES QUANTITES ET LES NOMBRES en Moyenne Section
APPROCHER LES QUANTITES ET LES NOMBRES en Moyenne Section Module Dénombrer une quantité ( 8) Mémoriser la suite des nombres( 15) Décomposer les nombres( 3,4 et 5 ) Au travers de l exploitation d albums
Plus en détailChristophe CANDILLIER Cours de DataMining mars 2004 Page 1
Christophe CANDILLIER Cours de DataMining mars 2004 age 1 1. Introduction 2. rocessus du DataMining 3. Analyse des données en DataMining 4. Analyse en Ligne OLA 5. Logiciels 6. Bibliographie Christophe
Plus en détailProjet Etienne Marceau Méthodes statistiques en assurance non vie
Trinôme : Carine Sauser, Mélanie Groisne, Xavier Milhaud Projet Etienne Marceau Méthodes statistiques en assurance non vie Méthodes statistiques pour la finance et l assurance ISFA - Décembre 2007 Table
Plus en détailTests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE
Chapitre 5 UE4 : Biostatistiques Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.
Plus en détailTests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA
Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA Soutenance de doctorat, sous la direction de Pr. Bilodeau, M. et Pr. Ducharme, G. Université de Montréal et Université
Plus en détail