Régression sur variables qualitatives - Analyse de la variance
|
|
|
- Noëlle Fontaine
- il y a 9 ans
- Total affichages :
Transcription
1 Régression sur variables qualitatives Analyse de la variance ENSAI Deuxième année - Modèles de régression
2 Introduction Dans ce chapitre, on étudie des cas particuliers de régression linéaire où : La variable à expliquer Y est quantitative, La ou les variables explicatives potentielles sont qualitatives très fréquent en pratique Exemples des données du Cirad et d Air Breizh
3 Cas d une variable à expliquer quantitative Y et d une variable explicative qualitative potentielle Objectif : déterminer si la variable explicative qualitative considérée a un effet - significatif - sur Y Définition La variable qualitative considérée est souvent appelée facteur On suppose qu elle prend ses valeurs dans un ensemble fini à I éléments appelés niveaux (du facteur) Une première analyse graphique : boîtes à moustaches (boxplot)
4 Données du Cirad Hauteur des eucalyptus Bloc
5 Données d Air Breizh ( ) Concentration maximale ozone E N S W Direction du vent
6 Données d Air Breizh ( ) Concentration maximale ozone Ensoleillé Nuageux Nébulosité
7 Pour i = 1 I, on note n i le nombre d observations de Y correspondant au ième niveau du facteur, et pour j = 1 n i, y ij désigne la jème observation de Y pour le ième niveau du facteur Soit n = I i=1 n i le nombre total d observations Définition Si n i > 0 pour tout i, on dira que le plan d expérience est complet Si n 1 = = n I, on dira que le plan d expérience est équilibré
8 Modèle d ANOVA à un facteur Les observations y ij, i = 1I, j = 1 n i sont supposées être issues du modèle { i = 1 I Y ij = µ + α i + ε ij,, j = 1 n i où les variables ε ij vérifient les conditions standards : - (C 1 ) E[ε ij ] = 0, - (C 2 ) cov(ε ij,ε i j ) = 0, - (C 3 ) var(ε ij ) = σ 2
9 Ecriture sous forme matricielle Recodage (disjonctif complet) du facteur en variables indicatrices (dummy variables) Matrice d incidence : A = (½ 1, ½ 2,, ½ I ) ie A =
10 Modèle : Y = Xβ + ε avec - Y = (Y 11,,Y 1n1,,Y I1,,Y InI ) - β = (µ,α 1,,α I ) - ε = (ε 11,,ε 1n1,,ε I1,,ε InI ), - X = (½,A), ie X =
11 Identifiabilité et contraintes Problème : le modèle n est pas identifiable Contre-exemple pour l unicité La matrice X n est pas de plein rang Solution : contrainte linéaire identifiante sur les cœfficients reparamétrisation du modèle 1 Contrainte de type analyse par cellule : µ = 0 On pose alors β = (α 1,,α I ) et X = A 2 Contrainte de type cellule de référence : α ir = 0 pour un i r choisi dans {1,,I } Choix de SAS et R par défaut 3 Contrainte d orthogonalité : I i=1 n iα i = 0 4 Contrainte de type somme : I i=1 α i = 0
12 Contrainte µ = 0 Modèle : Y = Xβ + ε avec β = (α 1,,α I ) et X = A 1 n n X 0 n X = et (X X) 1 0 n = n 1 I 0 0 n I Estimateur des moindres carrés ordinaires de β ˆβ = (X X) 1 X Y = (ˆα 1,, ˆα I ) où ˆα i = Ȳ i = 1 n i ni j=1 Y ij pour tout i
13 Remarque : l estimateur ˆβ est intuitif! Proposition ˆβ est un estimateur sans biais de β de variance σ 2 diag ( 1 n 1,, 1 n I ) minimale parmi les estimateurs linéaires sans biais de β Le vecteur des valeurs ajustées est défini par Ŷ = (Ȳ1,,ȲI ), et celui des résidus par : ˆε ij = Y ij Ȳi Proposition L estimateur sans biais de la variance σ 2 est σ 2 = 1 I ni n I i=1 j=1 ˆε2 ij = 1 I ni n I i=1 j=1 (Y ij Ȳ i ) 2
14 Contrainte α ir = 0 Modèle : Y = Xβ + ε avec β = (µ,α 1,,α ir 1,α ir+1,,α I ) et X = (½, ½ 1,, ½ ir 1, ½ ir+1,, ½ I ) Estimateur des moindres carrés ordinaires de β ˆβ = (X X) 1 X Y = (ˆµ, ˆα 1,, ˆα ir 1, ˆα ir+1,, ˆα I ), avec ˆµ = Ȳi r, ˆα i = Ȳi Ȳi r pour i {1,,i r 1,i r + 1,,I } Remarques : - Vecteur des valeurs ajustées inchangé car E(X) inchangé ie Ŷ = (Ȳ1,,ȲI ) - Vecteur des résidus et estimateur sans biais de σ 2 : idem aussi
15 Contrainte I i=1 n iα i = 0 (α I = 1 n I I 1 i=1 n iα i ) Modèle ( : Y = Xβ + ε avec β = (µ,α 1 ),,α I 1 ) et X = ½, ½ 1 n 1 n I ½ I,, ½ I 1 n I 1 n I ½ I Estimateur des moindres carrés ordinaires de β ˆβ = (ˆµ, ˆα 1,, ˆα I 1 ), avec ˆµ = Ȳ = 1 n I i=1 n iȳi, ˆα i = Ȳ i Ȳ pour i {1,,I 1} Remarque : vecteur des valeurs ajustées, vecteur des résidus et estimateur sans biais de σ 2 inchangés (E(X) inchangé)
16 Contrainte I i=1 α i = 0 (α I = I 1 i=1 α i) Modèle : Y = Xβ + ε avec β = (µ,α 1,,α I 1 ) et X = (½, ½ 1 ½ I,, ½ I 1 ½ I ) Estimateur des moindres carrés ordinaires de β ˆβ = (ˆµ, ˆα 1,, ˆα I 1 ), avec ˆµ = 1 I I i=1 Ȳi, ˆα i = Ȳ i 1 I I i=1 Ȳi pour i {1,,I 1} Remarque : vecteur des valeurs ajustées, vecteur des résidus et estimateur sans biais de σ 2 inchangés (E(X) inchangé)
17 On rappelle ici l équation d analyse de la variance usuelle : SCT = SCE + SCR Elle s exprime ici, puisque ½ E(X) quelle que soit la contrainte, sous la forme : Interprétation : Y Ȳ ½ 2 = Ŷ Ȳ ½ 2 + Y Ŷ 2 SCE = variabilité inter cellules, dispersion des moyennes empiriques par cellules autour de la moyenne empirique globale SCR = variabilité intra cellules
18 On suppose (C 4 ) vérifiée : ε suit une loi gaussienne Test d effet du facteur (H 0 ) : α 1 = = α I = 0 contre (H 1 ) : (i,i ),α i α i Cas particulier de test de validité de sous-modèle Statistique de test : F(Y ) = SCE/(I 1) SCR/(n I) = I i=1 ni(ȳi Ȳ )2 /(I 1) I ni i=1 j=1 (Y ij Y i ) 2 /(n I) Loi sous (H 0 ) : F(Y ) (H0 ) F(I 1,n I) Région critique du test de niveau α : {y, F(y) > f I 1,n I (1 α)}
19 Tableau d analyse de la variance Variation ddl SC CM F Pr(> F) Facteur I 1 SCE SCE/(I 1) Résiduelle n I SCR SCR/(n I) Totale n 1 SCT SCE/(I 1) SCR/(n I)
20 Cas d une variable à expliquer Y quantitative et de deux variables explicatives qualitatives potentielles = deux facteurs dont le premier à I niveaux, et le deuxième à J niveaux Objectif : déterminer si les facteurs considérés ont un effet - significatif - sur Y Une première analyse graphique : tracé des moyennes empiriques par cellules (profils)
21 Exemple des données d Air Breizh Concentration maximale ozone moyenne Nébulosité Ensoleillé Nuageux E N S W Direction du vent
22 Introduction Exemple des données d Air Breizh Concentration maximale ozone moyenne Vent E S N W Ensoleillé Nuageux Nébulosité
23 Pour tout i = 1 I, j = 1 J, on note n i,j le nombre d observations de la variable Y correspondant aux ième et jème niveaux des deux facteurs considérés, et y ijk la kième observation de Y correspondant aux ième et jème niveaux des facteurs On suppose que y ijk est l observation d une variable aléatoire Y ijk Notations utiles : n = I J i=1 j=1 n i,j nombre total d observations, Ȳ ij = 1 ni,j n i,j k=1 Y ijk, 1 Ȳ i = J ni,j J j=1 n j=1 i,j Ȳ j = 1 I i=1 n i,j I i=1 Ȳ = 1 n I i=1 J j=1 k=1 Y ijk, ni,j k=1 Y ijk, ni,j k=1 Y ijk
24 Modèle d ANOVA à deux facteurs Les observations y ijk, i = 1 I, j = 1 J, k = 1 n i,j sont supposées être issues du modèle Y ijk = µ + α i + η j + γ ij + ε ijk, i = 1 I j = 1 J k = 1 n i,j, où les variables ε ijk vérifient les conditions standards : - (C 1 ) E[ε ijk ] = 0, - (C 2 ) cov(ε ijk,ε i j k ) = 0, - (C 3 ) var(ε ijk ) = σ 2 On considère dans la suite seulement le cas d un plan d expérience équilibré ie n i,j = K pour tout (i,j)
25 Ecriture sous forme matricielle Recodage des facteurs en variables indicatrices Matrices d incidences : A = (½ 1, ½ 2,,½ I ), B = (½ 1, ½ 2,, ½ J ), C = (½ 11, ½ 12,, ½ 1J,, ½ I1,,½ IJ ) Modèle : Y = Xβ + ε avec Y = (Y ijk ) i=1i,j=1j,k=1k, ε = (ε ijk ) i=1i,j=1j,k=1k, β = (µ,α 1,,α I,η 1,,η J,γ 11,,γ 1J,,γ I1,,γ IJ ), X = (½,A,B,C)
26 Identifiabilité et contraintes Problème : Le modèle n est pas identifiable La matrice X est de taille n (1 + I + J + IJ), mais rang(x) = IJ Solution : ensemble de 1 + I + J contraintes linéaires identifiantes sur les cœfficients linéairement indépendantes reparamétrisation du modèle 1 Contrainte de type analyse par cellule : µ = 0, α i = 0 i, η j = 0 j, 2 Contrainte de type cellule de référence : α ir = η jr = 0 et γ ijr = γ irj = 0 i = 1I, j = 1 J 3 Contrainte de type somme : I i=1 α i = J j=1 η j = 0 et I i=1 γ ij = J j=1 γ ij = 0 i = 1I, j = 1 J
27 Contrainte de type analyse par cellule i = 1 I Modèle : Y ijk = γ ij + ε ijk j = 1 J k = 1K Estimateurs des moindres carrés ordinaires des cœfficients ˆγ ij = Ȳ ij pour tout i = 1 I, j = 1 J Valeurs ajustées : Ŷ ijk = Ȳ ij, résidus : ˆε ijk = Y ijk Ȳ ij Estimateur sans biais de la variance σ 2 = SCR n IJ = 1 n IJ I i=1 J j=1 K k=1 (Y ijk Ȳ ij ) 2
28 Contrainte de type somme Modèle : Y ijk = µ + α i + η j + γ ij + ε ijk i = 1 I j = 1 J k = 1K, avec I i=1 α i = J j=1 η j = I i=1 γ ij = J j=1 γ ij = 0 i = 1 I, j = 1 J Estimateurs des moindres carrés ordinaires des cœfficients ˆµ = Ȳ, ˆα i = Ȳ i Ȳ, ˆη j = Ȳ j Ȳ, ˆγ ij = Ȳ ij Ȳ i Ȳ j + Ȳ Remarque : Valeurs ajustées, résidus et estimateur sans biais de la variance inchangés
29 On rappelle l équation d analyse de la variance usuelle : SCT = SCE + SCR La somme des carrés expliquée peut se décomposer par Pythagore en : SCE = SCE A + SCE B + SCE C, où SCE A = JK I i=1 ˆα2 i, SCE B = IK J j=1 ˆη2 j, SCE C = K I i=1 J j=1 ˆγ2 ij L équation d analyse de la variance devient alors : SCT = SCE A + SCE B + SCE C + SCR
30 On suppose (C 4 ) vérifiée : ε suit une loi gaussienne Test de l interaction (H 0 ) C : (i,j) γ ij = 0 contre (H 1 ) C : (i,j), γ ij 0 Cas particulier de test de validité de sous-modèle Statistique de test : F C (Y ) = SCE C /((I 1)(J 1)) SCR/(n IJ) Loi sous (H 0 ) C : F C (Y ) (H0 ) C F((I 1)(J 1),n IJ) Région critique du test de niveau α : {y, F C (y) > f (I 1)(J 1),n IJ (1 α)}
31 Remarque : Si on rejette (H 0 ) C, les facteurs ont un effet significatif, on ne teste donc pas les effets individuels de chaque facteur Si on ne rejette pas (H 0 ) C, on suppose que (i,j) γ ij = 0 et on teste les effets individuels de chaque facteur On suppose dans la suite (C 4 ) vérifiée : ε suit une loi gaussienne, et (i,j) γ ij = 0
32 Test de l effet du facteur A (H 0 ) A : i α i = 0 contre (H 1 ) A : i,α i 0 Par précaution, on choisit généralement d estimer σ 2 dans le modèle complet ie avec interaction (choix usuel des logiciels) Test de validité de sous-modèle Statistique de test : F A (Y ) = SCE A/(I 1) SCR/(n IJ) Loi sous (H 0 ) A : F A (Y ) (H0 ) A F(I 1,n IJ) Région critique du test de niveau α : {y, F A (y) > f I 1,n IJ (1 α)}
33 Test de l effet du facteur B (H 0 ) B : j η j = 0 contre (H 1 ) B : j,η j 0 Test de validité de sous-modèle Statistique de test : F B (Y ) = SCE B/(J 1) SCR/(n IJ) Loi sous (H 0 ) B : F B (Y ) (H0 ) B F(J 1,n IJ) Région critique du test de niveau α : {y, F B (y) > f J 1,n IJ (1 α)}
34 Tableau d analyse de la variance Variation ddl SC CM F Pr(> F) Facteur A I 1 SCE A SCE A I 1 Facteur B J 1 SCE B SCE B J 1 Interaction (I 1)(J 1) SCE C SCE C (I 1)(J 1) Résiduelle n IJ SCR SCR n IJ Totale n 1 SCT SCE A /(I 1) SCR/(n IJ) SCE B /(J 1) SCR/(n IJ) SCE C /((I 1)(J 1)) SCR/(n IJ)
35 Autres tests et intervalles de confiance par extension de la régression linéaire multiple générale Plans d expérience plus complexes Remarque fondamentale : une analyse de la variance doit être complétée comme toute analyse de modèle de régression par la recherche d éventuels écarts au modèle analyse des résidus, données atypiques, etc Pour une présentation plus complète de l analyse de la variance : Scheffé (1959) Mélange de variables quantitatives et qualitatives : ANCOVA (cf cours de Modèles de régression 2)
STATISTIQUES. UE Modélisation pour la biologie
STATISTIQUES UE Modélisation pour la biologie 2011 Cadre Général n individus: 1, 2,..., n Y variable à expliquer : Y = (y 1, y 2,..., y n ), y i R Modèle: Y = Xθ + ε X matrice du plan d expériences θ paramètres
Analyse de la variance Comparaison de plusieurs moyennes
Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction
Exemples d application
AgroParisTech Exemples d application du modèle linéaire E Lebarbier, S Robin Table des matières 1 Introduction 4 11 Avertissement 4 12 Notations 4 2 Régression linéaire simple 7 21 Présentation 7 211 Objectif
Le Modèle Linéaire par l exemple :
Publications du Laboratoire de Statistique et Probabilités Le Modèle Linéaire par l exemple : Régression, Analyse de la Variance,... Jean-Marc Azaïs et Jean-Marc Bardet Laboratoire de Statistique et Probabilités
FORMULAIRE DE STATISTIQUES
FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)
Le modèle de régression linéaire
Chapitre 2 Le modèle de régression linéaire 2.1 Introduction L économétrie traite de la construction de modèles. Le premier point de l analyse consiste à se poser la question : «Quel est le modèle?». Le
Analyse en Composantes Principales
Analyse en Composantes Principales Anne B Dufour Octobre 2013 Anne B Dufour () Analyse en Composantes Principales Octobre 2013 1 / 36 Introduction Introduction Soit X un tableau contenant p variables mesurées
Bureau : 238 Tel : 04 76 82 58 90 Email : [email protected]
Dominique Muller Laboratoire Inter-universitaire de Psychologie Bureau : 238 Tel : 04 76 82 58 90 Email : [email protected] Supports de cours : webcom.upmf-grenoble.fr/lip/perso/dmuller/m2r/acm/
2008/03. La concentration des portefeuilles : perspective générale et illustration
2008/03 La concentration des portefeuilles : perspective générale et illustration Olivier Le Courtois Professeur de finance et d assurance UPR Economie, Finance et Gestion EMLYON Christian Walter Actuaire
La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites
La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un
Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage
Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage Journées de Méthodologie Statistique Eric Lesage Crest-Ensai 25 janvier 2012 Introduction et contexte 2/27 1 Introduction
Introduction à l approche bootstrap
Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?
Annexe commune aux séries ES, L et S : boîtes et quantiles
Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans
TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION
TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION Bruno Saussereau Laboratoire de Mathématiques de Besançon Université de Franche-Comté Travail en commun
Chapitre 5 : Flot maximal dans un graphe
Graphes et RO TELECOM Nancy A Chapitre 5 : Flot maximal dans un graphe J.-F. Scheid 1 Plan du chapitre I. Définitions 1 Graphe Graphe valué 3 Représentation d un graphe (matrice d incidence, matrice d
INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES
INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine
Econométrie La régression linéaire simple et multiple
Ricco Rakotomalala Econométrie La régression linéaire simple et multiple Version 1.1 Université Lumière Lyon 2 Page: 1 job: Econometrie_Regression macro: svmono.cls date/time: 26-May-2015/18:13 Page: 2
Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année 2010-2011
Master 1 Biologie et technologie du végétal Année 010-011 Statistiques Rappels de cours et travaux dirigés (Seul ce document sera autorisé en examen) auteur : Jean-Marc Labatte [email protected]
Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke
www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3
Apprentissage non paramétrique en régression
1 Apprentissage non paramétrique en régression Apprentissage non paramétrique en régression Résumé Différentes méthodes d estimation non paramétriques en régression sont présentées. Tout d abord les plus
Prudence, Epargne et Risques de Soins de Santé Christophe Courbage
Prudence, Epargne et Rique de Soin de Santé Chritophe Courbage ASSOCIATION DE GENÈVE Introduction Le compte d épargne anté (MSA), une nouvelle forme d intrument pour couvrir le dépene de anté en ca de
Chapitre 3. Les distributions à deux variables
Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles
Cours 9 : Plans à plusieurs facteurs
Cours 9 : Plans à plusieurs facteurs Table des matières Section 1. Diviser pour regner, rassembler pour saisir... 3 Section 2. Définitions et notations... 3 2.1. Définitions... 3 2.2. Notations... 4 Section
Statistiques descriptives
Statistiques descriptives L3 Maths-Eco Université de Nantes Frédéric Lavancier F. Lavancier (Univ. Nantes) Statistiques descriptives 1 1 Vocabulaire de base F. Lavancier (Univ. Nantes) Statistiques descriptives
(51) Int Cl.: H04L 29/06 (2006.01) G06F 21/55 (2013.01)
(19) TEPZZ 8 8 4_A_T (11) EP 2 838 241 A1 (12) DEMANDE DE BREVET EUROPEEN (43) Date de publication: 18.02.1 Bulletin 1/08 (1) Int Cl.: H04L 29/06 (06.01) G06F 21/ (13.01) (21) Numéro de dépôt: 141781.4
Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9
Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9 L analyse de variance à un facteur permet de vérifier, moyennant certaines hypothèses, si un facteur (un critère de classification,
Cours de méthodes de scoring
UNIVERSITE DE CARTHAGE ECOLE SUPERIEURE DE STATISTIQUE ET D ANALYSE DE L INFORMATION Cours de méthodes de scoring Préparé par Hassen MATHLOUTHI Année universitaire 2013-2014 Cours de méthodes de scoring-
Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier
Statistiques Appliquées à l Expérimentation en Sciences Humaines Christophe Lalanne, Sébastien Georges, Christophe Pallier Table des matières 1 Méthodologie expérimentale et recueil des données 6 1.1 Introduction.......................................
L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ
L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et
Cours Informatique Master STEP
Cours Informatique Master STEP Bases de la programmation: Compilateurs/logiciels Algorithmique et structure d'un programme Programmation en langage structuré (Fortran 90) Variables, expressions, instructions
TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie
PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats Pierre Dagnelie TABLE DES MATIÈRES 2012 Presses agronomiques de Gembloux [email protected] www.pressesagro.be
LES GENERATEURS DE NOMBRES ALEATOIRES
LES GENERATEURS DE NOMBRES ALEATOIRES 1 Ce travail a deux objectifs : ====================================================================== 1. Comprendre ce que font les générateurs de nombres aléatoires
Température corporelle d un castor (une petite introduction aux séries temporelles)
Température corporelle d un castor (une petite introduction aux séries temporelles) GMMA 106 GMMA 106 2014 2015 1 / 32 Cas d étude Temperature (C) 37.0 37.5 38.0 0 20 40 60 80 100 Figure 1: Temperature
Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»
Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences
Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens
Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques
UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES
Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,
Programmation linéaire et Optimisation. Didier Smets
Programmation linéaire et Optimisation Didier Smets Chapitre 1 Un problème d optimisation linéaire en dimension 2 On considère le cas d un fabricant d automobiles qui propose deux modèles à la vente, des
L Econométrie des Données de Panel
Ecole Doctorale Edocif Séminaire Méthodologique L Econométrie des Données de Panel Modèles Linéaires Simples Christophe HURLIN L Econométrie des Données de Panel 2 Figure.: Présentation Le but de ce séminaire
Notes de cours Statistique avec le logiciel R
Notes de cours Statistique avec le logiciel R Shuyan LIU [email protected] http ://samm.univ-paris1.fr/shuyan-liu-enseignement Année 2013-2014 Chapitre 1 Introduction L objectif de ce cours est
Programmation linéaire
Programmation linéaire DIDIER MAQUIN Ecole Nationale Supérieure d Electricité et de Mécanique Institut National Polytechnique de Lorraine Mathématiques discrètes cours de 2ème année Programmation linéaire
Durée de L épreuve : 2 heures. Barème : Exercice n 4 : 1 ) 1 point 2 ) 2 points 3 ) 1 point
03 Mai 2013 Collège Oasis Durée de L épreuve : 2 heures. apple Le sujet comporte 4 pages et est présenté en livret ; apple La calculatrice est autorisée ; apple 4 points sont attribués à la qualité de
Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES
LES STATISTIQUES INFERENTIELLES (test de Student) L inférence statistique est la partie des statistiques qui, contrairement à la statistique descriptive, ne se contente pas de décrire des observations,
Etude des propriétés empiriques du lasso par simulations
Etude des propriétés empiriques du lasso par simulations L objectif de ce TP est d étudier les propriétés empiriques du LASSO et de ses variantes à partir de données simulées. Un deuxième objectif est
Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 06/12/2009 Stéphane Tufféry - Data Mining - http://data.mining.free.fr
Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE 1 Plan du cours Qu est-ce que le data mining? A quoi sert le data mining? Les 2 grandes familles de techniques Le déroulement d un projet de data
Estimation et tests statistiques, TD 5. Solutions
ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études
Pierre Thérond [email protected]. Année universitaire 2013-2014
http://www.therond.fr [email protected] Institut de Science Financière et d Assurances - Université Lyon 1 Année universitaire 2013-2014 Plan du cours 1 Chapitre 1 - Introduction 2 3 4 Bibliographie principale
Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique
Objectifs Clustering On ne sait pas ce qu on veut trouver : on laisse l algorithme nous proposer un modèle. On pense qu il existe des similarités entre les exemples. Qui se ressemble s assemble p. /55
Cours d analyse numérique SMI-S4
ours d analyse numérique SMI-S4 Introduction L objet de l analyse numérique est de concevoir et d étudier des méthodes de résolution de certains problèmes mathématiques, en général issus de problèmes réels,
Exercice : la frontière des portefeuilles optimaux sans actif certain
Exercice : la frontière des portefeuilles optimaux sans actif certain Philippe Bernard Ingénierie Economique & Financière Université Paris-Dauphine Février 0 On considère un univers de titres constitué
FOAD COURS D ECONOMETRIE 1 CHAPITRE 2 : Hétéroscédasicité des erreurs. 23 mars 2012.
FOAD COURS D ECONOMETRIE CHAPITRE 2 : Hétéroscédasicité des erreurs. 23 mars 202. Christine Maurel Maître de conférences en Sciences Economiques Université de Toulouse - Capitole Toulouse School of Economics-ARQADE
Evaluation des modèles non-linéaires à effets mixtes
Evaluation des effets mixtes INSERM UMR738 GDR Statistiques et Santé, 20 octobre 2009 Pharmacométrie Définition modélisation des données obtenues lors d essais cliniques sur des médicaments développement
La place de SAS dans l'informatique décisionnelle
La place de SAS dans l'informatique décisionnelle Olivier Decourt ABS Technologies - Educasoft Formations La place de SAS dans l'informatique décisionnelle! L'historique de SAS! La mécanique! La carrosserie
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
Utilisation du module «Geostatistical Analyst» d ARCVIEW dans le cadre de la qualité de l air
Etude n 10 Assistance en modélisation (Rapport 3/3) Utilisation du module «Geostatistical Analyst» d ARCVIEW dans le cadre de la qualité de l air Novembre 2004 Convention : 04000087 Giovanni CARDENAS Utilisation
Une introduction. Lionel RIOU FRANÇA. Septembre 2008
Une introduction INSERM U669 Septembre 2008 Sommaire 1 Effets Fixes Effets Aléatoires 2 Analyse Classique Effets aléatoires Efficacité homogène Efficacité hétérogène 3 Estimation du modèle Inférence 4
Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE
UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction
GUIDE PRATIQUE. Du provisionnement des emprunts à risques
Ministère de l Égalité des territoires et du Logement Ministère de l Économie et des Finances GUIDE PRATIQUE Du provisionnement des emprunts à risques Application aux Offices Publics de l Habitat à comptabilité
Corrigé du baccalauréat S Asie 21 juin 2010
Corrigé du baccalauréat S Asie juin 00 EXERCICE Commun à tous les candidats 4 points. Question : Le triangle GBI est : Réponse a : isocèle. Réponse b : équilatéral. Réponse c : rectangle. On a GB = + =
Modèles et Méthodes de Réservation
Modèles et Méthodes de Réservation Petit Cours donné à l Université de Strasbourg en Mai 2003 par Klaus D Schmidt Lehrstuhl für Versicherungsmathematik Technische Universität Dresden D 01062 Dresden E
La programmation linéaire : une introduction. Qu est-ce qu un programme linéaire? Terminologie. Écriture mathématique
La programmation linéaire : une introduction Qu est-ce qu un programme linéaire? Qu est-ce qu un programme linéaire? Exemples : allocation de ressources problème de recouvrement Hypothèses de la programmation
Programmation linéaire
1 Programmation linéaire 1. Le problème, un exemple. 2. Le cas b = 0 3. Théorème de dualité 4. L algorithme du simplexe 5. Problèmes équivalents 6. Complexité de l Algorithme 2 Position du problème Soit
TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.
STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,
Gestion des Clés Publiques (PKI)
Chapitre 3 Gestion des Clés Publiques (PKI) L infrastructure de gestion de clés publiques (PKI : Public Key Infrastructure) représente l ensemble des moyens matériels et logiciels assurant la gestion des
Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes
IUT HSE Probabilités et Statistiques Feuille : variables aléatoires discrètes 1 Exercices Dénombrements Exercice 1. On souhaite ranger sur une étagère 4 livres de mathématiques (distincts), 6 livres de
Exercices du Cours de la programmation linéaire donné par le Dr. Ali DERBALA
75. Un plombier connaît la disposition de trois tuyaux sous des dalles ( voir figure ci dessous ) et il lui suffit de découvrir une partie de chacun d eux pour pouvoir y poser les robinets. Il cherche
Régression linéaire. Nicolas Turenne INRA [email protected]
Régression linéaire Nicolas Turenne INRA [email protected] 2005 Plan Régression linéaire simple Régression multiple Compréhension de la sortie de la régression Coefficient de détermination R
Méthodes de quadrature. Polytech Paris-UPMC. - p. 1/48
Méthodes de Polytech Paris-UPMC - p. 1/48 Polynôme d interpolation de Preuve et polynôme de Calcul de l erreur d interpolation Étude de la formule d erreur Autres méthodes - p. 2/48 Polynôme d interpolation
LA PHYSIQUE DES MATERIAUX. Chapitre 1 LES RESEAUX DIRECT ET RECIPROQUE
LA PHYSIQUE DES MATERIAUX Chapitre 1 LES RESEAUX DIRECT ET RECIPROQUE Pr. A. Belayachi Université Mohammed V Agdal Faculté des Sciences Rabat Département de Physique - L.P.M [email protected] 1 1.Le réseau
ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #16
ACTUARIAT 1, ACT 2121, AUTOMNE 201 #16 ARTHUR CHARPENTIER 1 Dans une petite compagnie d assurance le nombre N de réclamations durant une année suit une loi de Poisson de moyenne λ = 100. On estime que
Arbres binaires de décision
1 Arbres binaires de décision Résumé Arbres binaires de décision Méthodes de construction d arbres binaires de décision, modélisant une discrimination (classification trees) ou une régression (regression
MODELE A CORRECTION D ERREUR ET APPLICATIONS
MODELE A CORRECTION D ERREUR ET APPLICATIONS Hélène HAMISULTANE Bibliographie : Bourbonnais R. (2000), Econométrie, DUNOD. Lardic S. et Mignon V. (2002), Econométrie des Séries Temporelles Macroéconomiques
Première partie. Préliminaires : noyaux itérés. MPSI B 6 juin 2015
Énoncé Soit V un espace vectoriel réel. L espace vectoriel des endomorphismes de V est désigné par L(V ). Lorsque f L(V ) et k N, on désigne par f 0 = Id V, f k = f k f la composée de f avec lui même k
Les droites (d 1 ) et (d 2 ) sont sécantes en A Le point A est le point d intersection des 2 droites
I Droites perpendiculaires Lorsque deux droites se coupent, on dit qu elles sont sécantes Les droites (d 1 ) et (d 2 ) sont sécantes en A Le point A est le point d intersection des 2 droites Lorsque deux
Propriétés des options sur actions
Propriétés des options sur actions Bornes supérieure et inférieure du premium / Parité call put 1 / 1 Taux d intérêt, capitalisation, actualisation Taux d intéret composés Du point de vue de l investisseur,
Résumé du Cours de Statistique Descriptive. Yves Tillé
Résumé du Cours de Statistique Descriptive Yves Tillé 15 décembre 2010 2 Objectif et moyens Objectifs du cours Apprendre les principales techniques de statistique descriptive univariée et bivariée. Être
BIOSTATISTIQUES AVANCEES PLAN. Quelques références. Master Biologie Intégrative 1 ère année
Master Biologie Intégrative 1 ère année 1 BIOSTATISTIQUES AVANCEES Yves Desdevises! Observatoire Océanologique de Banyuls-sur-Mer (www.obs-banyuls.fr)! 04 68 88 73 13! [email protected]! http://desdevises.free.fr
Evolutions du Relevé de Compte 120 caractères pour les opérations de virements et de prélèvements SEPA
Evolutions du Relevé de Compte 120 caractères pour les opérations de virements et de prélèvements SEPA MARS 2010 Version Validée : 2.0 Objet : l objet de ce document est de présenter les évolutions nécessaires
Enoncé et corrigé du brevet des collèges dans les académies d Aix- Marseille, Montpellier, Nice Corse et Toulouse en 2000. Énoncé.
Enoncé et corrigé du brevet des collèges dans les académies d Aix- Marseille, Montpellier, Nice Corse et Toulouse en 2000. Énoncé. I- ACTIVITES NUMERIQUES (12 points) Exercice 1 (3 points) On considère
Exo7. Matrice d une application linéaire. Corrections d Arnaud Bodin.
Exo7 Matrice d une application linéaire Corrections d Arnaud odin. Exercice Soit R muni de la base canonique = ( i, j). Soit f : R R la projection sur l axe des abscisses R i parallèlement à R( i + j).
Aide-mémoire de statistique appliquée à la biologie
Maxime HERVÉ Aide-mémoire de statistique appliquée à la biologie Construire son étude et analyser les résultats à l aide du logiciel R Version 5(2) (2014) AVANT-PROPOS Les phénomènes biologiques ont cela
FctsAffines.nb 1. Mathématiques, 1-ère année Edition 2007-2008. Fonctions affines
FctsAffines.nb 1 Mathématiques, 1-ère année Edition 2007-2008 Fonctions affines Supports de cours de mathématiques de degré secondaire II, lien hpertete vers la page mère http://www.deleze.name/marcel/sec2/inde.html
TD1 Signaux, énergie et puissance, signaux aléatoires
TD1 Signaux, énergie et puissance, signaux aléatoires I ) Ecrire l'expression analytique des signaux représentés sur les figures suivantes à l'aide de signaux particuliers. Dans le cas du signal y(t) trouver
Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles
Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA
Application sur le Dispositif en Blocs Complètement Randomisés
Roger Vumilia. KIZUNGU Directeur de l Expérimentation Agricole à l INERA Professeur Associé Faculté des Sciences Agronomiques Université de Kinshasa Utilisation des Logiciels de base dans la Recherche
Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés
Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour [email protected] Une grande partie des illustrations viennent
Introduction à l étude des Corps Finis
Introduction à l étude des Corps Finis Robert Rolland (Résumé) 1 Introduction La structure de corps fini intervient dans divers domaines des mathématiques, en particulier dans la théorie de Galois sur
LES AMORTISSEMENTS : CALCULS ENREGISTREMENTS
LES AMORTISSEMENTS : CALCULS ENREGISTREMENTS PRESENTATION DES MODES D AMORTISSEMENT Exemple 1 : CAS D UN AMORTISSEMENT VARIABLE On acquiert le 04/08/N une machine-outil pour une valeur HT de. Cette machine,
Fonctions de plusieurs variables : dérivés partielles, diérentielle. Fonctions composées. Fonctions de classe C 1. Exemples
45 Fonctions de plusieurs variables : dérivés partielles, diérentielle. Fonctions composées. Fonctions de classe C 1. Exemples Les espaces vectoriels considérés sont réels, non réduits au vecteur nul et
1 Complément sur la projection du nuage des individus
TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent
données en connaissance et en actions?
1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)
1 - Connexion au service de gestion des demandes informatiques du lycée
1 - Connexion au service de gestion des demandes informatiques du lycée http://support.e-lycee-paca.fr Adresse du service en ligne à partir de tout point d accès internet, 24h/24. 1 Les identifiants sont
Modèles Estimés sur Données de Panel
Modèles Estimés sur Données de Panel Introduction Il est fréquent en économétrie qu on ait à composer avec des données à deux dimensions : - une dimension chronologique - une dimension spatiale Par exemple,
Représentation géométrique d un nombre complexe
CHAPITRE 1 NOMBRES COMPLEXES 1 Représentation géométrique d un nombre complexe 1. Ensemble des nombres complexes Soit i le nombre tel que i = 1 L ensemble des nombres complexes est l ensemble des nombres
Le nouveau système de surveillance continue des émissions atmosphériques
Le nouveau système de surveillance continue des émissions atmosphériques à l'incinérateur Mars 2010 Travaux publics Gestion des matières résiduelles CONTENU DE LA PRÉSENTATION 1. L incinérateur 2. Obligations
APPROCHER LES QUANTITES ET LES NOMBRES en Moyenne Section
APPROCHER LES QUANTITES ET LES NOMBRES en Moyenne Section Module Dénombrer une quantité ( 8) Mémoriser la suite des nombres( 15) Décomposer les nombres( 3,4 et 5 ) Au travers de l exploitation d albums
Christophe CANDILLIER Cours de DataMining mars 2004 Page 1
Christophe CANDILLIER Cours de DataMining mars 2004 age 1 1. Introduction 2. rocessus du DataMining 3. Analyse des données en DataMining 4. Analyse en Ligne OLA 5. Logiciels 6. Bibliographie Christophe
Projet Etienne Marceau Méthodes statistiques en assurance non vie
Trinôme : Carine Sauser, Mélanie Groisne, Xavier Milhaud Projet Etienne Marceau Méthodes statistiques en assurance non vie Méthodes statistiques pour la finance et l assurance ISFA - Décembre 2007 Table
Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE
Chapitre 5 UE4 : Biostatistiques Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.
Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA
Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA Soutenance de doctorat, sous la direction de Pr. Bilodeau, M. et Pr. Ducharme, G. Université de Montréal et Université
