Régression linéaire multiple
|
|
- Aurore Pageau
- il y a 6 ans
- Total affichages :
Transcription
1 1 1 IRMA, Université de Strasbourg France ESIEA
2 Régression linéaire simple Exemple Affiner le modèle Exemple : Issu du livre «Statistiques avec R», P.A. Cornillon, et al., Deuxième édition, 2010 Problème : Étude de la concentration d ozone dans l air. Modèle : La température à 12 heures (v.a. X 1 ) et la concentration d ozone (v.a. Y ) sont liées de manière linéaire : Y = β 0 + β 1 X 1 + ε. Observations : n = 112 observations de la température à 12 heures et de la concentration d ozone. But : Estimer β 0 et β 1 afin de prédire la concentration d ozone connaissant la température à 12 heures.
3 Régression linéaire simple Exemple Affiner le modèle
4 Régression linéaire simple Exemple Affiner le modèle Affiner le modèle Souvent la régression linéaire est trop simpliste. Il faut alors utiliser d autres modèles plus réalistes mais parfois plus complexes : Utiliser d autres fonctions que les fonctions affines comme les fonctions polynômiales, exponentielles, logarithmiques... Considérer plusieurs variables explicatives. Exemple : La température à 12 heures et la vitesse du vent.
5 Vision pratique Le principe de la régression linéaire multiple est simple : Déterminer la variable expliquée Y. Exemple : La concentration d ozone. Déterminer (p 1) variables explicatives X 1,..., X p 1 Exemple : X 1 température à 12 heures, X 2 vitesse du vent,... Il ne reste plus qu à appliquer un modèle linéaire : Y = β 0 + β 1 X β p 1 X p 1 + ε.
6 Vision pratique Dans un échantillon de n individus, nous mesurons y i, x i,1,..., x i,p 1 pour i = 1,..., n. Remarque Observations Y X 1... X p 1 1 y 1 x 1,1... x 1,p 1 2 y 2 x 2,1... x 2,p n y n x n,1... x n,p 1 Les variables x i,j sont fixes tandis que les variables Y i sont aléatoires.
7 Méthode Version matricielle Les calculs Cas p = 2 Exemple avec le logiciel R Problème Il faut estimer les paramètres β 0,..., β p 1 du modèle de régression et ce de manière optimale. Solution Utiliser la méthode des moindres carrés. Cette méthode revient à minimiser la quantité suivante : min β 0,...,β p 1 n ( yi ( )) 2 β 0 + β 1 x i,1 + + β p 1 x i,p 1. i=1
8 Méthode Version matricielle Les calculs Cas p = 2 Exemple avec le logiciel R Le système peut se réécrire : y 1 1 x 1,1 x 1,p 1. = x n,1 x n,p 1 y = X β + ε y n Vecteur des résidus : ê = y ŷ = y X β. β 0. β p 1 + ε 1. ε n
9 Méthode Version matricielle Les calculs Cas p = 2 Exemple avec le logiciel R Remarque Les variables y et X sont mesurées tandis que l estimateur β est à déterminer. La méthode des moindres carrés ordinaires consiste à trouver le vecteur β qui minimise ε 2 = t εε.
10 Méthode Version matricielle Les calculs Cas p = 2 Exemple avec le logiciel R Les calculs ε 2 = t( y X β )( y X β ) = t yy t βt Xy t yx β + t βt XX β = t yy 2 t βt Xy + t βt XX β car t βt Xy est un scalaire. Donc il est égal à sa transposée. La dérivée par rapport à β est alors égale à : 2 t Xy + 2 t XX β.
11 Méthode Version matricielle Les calculs Cas p = 2 Exemple avec le logiciel R Problème Nous cherchons β qui annule cette dérivée. Donc nous devons résoudre l équation suivante : t XX β = t Xy. Solution Nous trouvons après avoir inversé la matrice t XX (il faut naturellement vérifier que t XX est carrée et inversible c est-à-dire qu aucune des colonnes qui compose cette matrice ne soit proportionnelle aux autres colonnes) β = ( t XX) 1t Xy.
12 Méthode Version matricielle Les calculs Cas p = 2 Exemple avec le logiciel R Remarque Retrouvons les résultats de la régression linéaire simple (p = 2) t XX = ( n xi xi x 2 i ) ; ( ) t yi Xy =. xi y i Donc : ( t XX) 1 = = ( 1 x n xi 2 ( 2 i x i x i ) 2 x i n ( ) 1 x 2 i /n x n (xi x n ) 2. x n 1 )
13 Méthode Version matricielle Les calculs Cas p = 2 Exemple avec le logiciel R Suite et fin de la remarque Finalement nous retrouvons bien : Y n x 2 ( ) i x n xi Y i β0 (xi x n ) 2 β = = β 1 xi Y i nx n Y n (xi x n ) 2 ce qui correspond aux estimateurs de la régression linéaire simple que nous avons déjà rencontrés dans le cours 6.
14 Méthode Version matricielle Les calculs Cas p = 2 Exemple avec le logiciel R Exemple avec le logiciel R Reprenons l exemple traité en début de ce chapitre. Introduisons comme variables explicatives la température à 12 heures et la vitesse du vent. Utilisons pour cela R. > modele1 <- lm(max03 T12 + Vx12) > summary(modele1) Call: lm(formula = max03 T12 + Vx12) Residuals: Min 1Q Median 3Q Max
15 Méthode Version matricielle Les calculs Cas p = 2 Exemple avec le logiciel R Suite de l exemple avec le logiciel R Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) T < 2e-16 *** Vx *** Residual standard error: on 109 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 2 and 109 DF, p-value: < 2.2e-16
16 Méthode Version matricielle Les calculs Cas p = 2 Exemple avec le logiciel R Test de normalité Pour lire la p valeur du test de Fisher et celles des tests de Student, il faut s assurer auparavant que les résidus suivent une loi normale. Pour cela, vous allez réaliser un test de normalité, celui de Shapiro-Wilk avec R. > residus<-residuals(modele2) > shapiro.test(residus) Shapiro-Wilk normality test data: residus W = , p-value =
17 Méthode Version matricielle Les calculs Cas p = 2 Exemple avec le logiciel R Conclusion du test de normalité La p-valeur (p-value = 0,2624) du test de Shapiro-Wilk étant strictement supérieure à α = 5%, le test n est pas significatif. Nous décidons de ne pas rejeter et donc d accepter H 0 au seuil α = 5%. Le risque d erreur associé à cette décision est un risque d erreur de seconde espèce β. Dans le cas présent, vous ne pouvez pas l évaluer. Interprétation Il ne nous reste plus qu à interpréter la sortie de summary(modele2).
18 Méthode Version matricielle Les calculs Cas p = 2 Exemple avec le logiciel R Suite de l interprétation La p-valeur (p-value < 2.2e-16) du test de Fisher étant inférieure ou égale à α = 5%, le test est significatif. Nous rejetons H 0 et nous décidons que H 1 est vraie avec un risque de première espèce α = 5%. Donc il y a au moins une des deux variables qui joue le rôle de variable explicative. La p-valeur (p-value < 2e-16) du test de Student, associée à «T12» étant inférieure ou égale à α = 5%, le test est significatif. Nous rejetons H 0 et nous décidons que H 1 est vraie avec un risque de première espèce α = 5%. Nous pouvons faire la même conclusion pour la variable vitesse du vent à 12 heures.
19 «à la Pythagore» Coefficient de détermination Résultats préliminaires 1 ŷ 2 i = ŷ i y i ou (forme matricielle) t ŷŷ = t yŷ 2 ŷi = y i Propriété des moindres carrés ordinaires (yi y n ) 2 = (ŷ i y n ) 2 + (y i ŷ i ) 2 sc tot = sc reg + sc res
20 «à la Pythagore» Coefficient de détermination Représentation graphique de la relation fondamentale
21 «à la Pythagore» Coefficient de détermination Rappel sur le coefficient de détermination Nous rappelons que le coefficient de détermination est défini par : R 2 = sc reg sc tot Intuitivement ce coefficient de détermination quantifie la capacité du modèle à expliquer les variations de Y. Si R 2 est proche de 1 alors le modèle est proche de la réalité. Si R 2 est proche de 0 alors le modèle explique très mal la réalité. Il faut alors trouver un meilleur modèle.
22 Hypothèses pour les tests Estimation de σ 2 Les hypothèses indispensables pour réaliser les tests Nous faisons les hypothèses suivantes : y = Xβ + ε où le vecteur aléatoire ε suit une loi multinormale qui vérifie les hypothèses suivantes : E[ε] = 0 Var[ε] = σ 2 I n, où σ 2 est la variance de la population et I n est la matrice identité de taille n.
23 Hypothèses pour les tests Estimation de σ 2 Conséquences Les hypothèses précédentes impliquent E [y] = Xβ Var [y] = σ 2 I n. Nous pouvons alors démontrer, sous ces hypothèses : ] E [ β = β. Ce qui signifie que le vecteur β est un estimateur sans biais de β. [ β] Var = σ 2 ( t XX) 1. Problème La variance σ 2 est inconnue. Donc il faut estimer σ 2!
24 Hypothèses pour les tests Estimation de σ 2 Construction d un estimateur de σ 2 Un estimateur sans biais de la variance σ 2 est défini par : CM res = (Yi Ŷi) 2 n p = SC res n p = SC tot SC reg n p où n est le nombre d individus/d observations, p est le nombre de variables explicatives. Nous rappelons que la quantité (n p) est le nombre de degrés de liberté associé à SC res.
25 Test de Fisher Tester l hypothèse nulle : H 0 : β 1 = β 2 = = β p 1 = 0 contre l hypothèse alternative : H 1 : au moins un j pour lequel β j 0 où j varie de 1 à p 1. Remarque Si l hypothèse nulle H 0 est vérifiée alors le modèle s écrit : Y i = β 0 + ε i.
26 Tableau de l analyse de la variance Source de sc ddl cm F obs variation Régression n sc reg = (ŷ i y) 2 sc reg cm reg p 1 p 1 cm res Résiduelle sc res = Totale sc tot = i=1 n (y i ŷ i ) 2 n p i=1 n (y i y) 2 n 1 i=1 sc res n p
27 Méthode 1 Calculer la statistique F obs = CM reg CM res 2 Lire la valeur critique F 1 α,p 1,n p où F 1 α,p 1,n p est le (1 α)-quantile d une loi de Fisher avec (p 1) et (n p) degrés de liberté, car si l hypothèse nulle H 0 est vraie, alors F obs suit une loi de Fisher avec (p 1) et (n p) degrés de liberté. 3 Comparer la statistique c est-à-dire la valeur observée à la valeur critique.
28 Règle de décision Nous décidons de rejeter l hypothèse nulle H 0 et d accepter l hypothèse alternative H 1, au seuil α = 5%, si F obs F 1 α,p 1,n p. Nous décidons de ne pas rejeter l hypothèse nulle H 0 et donc de l accepter si F obs < F 1 α,p 1,n p.
29 Les tests de Student Intervalles de confiance Test de Fisher partiel Tests de Student Tester l hypothèse nulle H 0 : β j = b j pour j = 0,..., p 1 contre l hypothèse alternative H 1 : β j b j pour un certain j entre 0 et p 1.
30 Les tests de Student Intervalles de confiance Test de Fisher partiel Méthode 1 Calculer la statistique t obs = β j b j s( β j ) où s 2 ( β j ) est l élément diagonal d indice j de CM res ( t XX) 1. 2 Lire la valeur critique t n p;1 α/2 où t n 2;1 α/2 est le (1 α/2)-quantile d une loi de Student avec (n p) degrés de liberté, car si l hypothèse nulle H 0 est vraie, alors t obs suit une loi de Student avec (n p) degrés de liberté. 3 Comparer la statistique c est-à-dire la valeur observée à la valeur critique.
31 Les tests de Student Intervalles de confiance Test de Fisher partiel Règle de décision Nous décidons de rejeter l hypothèse nulle H 0 et d accepter l hypothèse alternative H 1, au seuil α = 5%, si t obs t n p;1 α/2. Nous décidons de ne pas rejeter l hypothèse nulle H 0 et donc de l accepter si t obs < t n p;1 α/2.
32 Les tests de Student Intervalles de confiance Test de Fisher partiel Cas particulier Tester l hypothèse nulle H 0 : β j = 0 pour j = 0,..., p 1 contre l hypothèse alternative H 1 : β j 0 pour un certain j entre 0 et p 1.
33 Les tests de Student Intervalles de confiance Test de Fisher partiel Méthode 1 Calculer la statistique t obs = ˆβ j s( ˆβ j ) 2 Lire la valeur critique t n p;1 α/2 où t n p;1 α/2 est le (1 α/2)-quantile d une loi de Student avec (n p) degrés de liberté, car si l hypothèse nulle H 0 est vraie, alors t obs suit une loi de Student avec (n p) degrés de liberté. 3 Comparer la valeur observée et la valeur critique.
34 Les tests de Student Intervalles de confiance Test de Fisher partiel Règle de décision Nous décidons de rejeter l hypothèse nulle H 0 et d accepter l hypothèse alternative H 1, au seuil α = 5%, si t obs t n p;1 α/2. Nous décidons de ne pas rejeter l hypothèse nulle H 0 et donc de l accepter si t obs < t n p;1 α/2.
35 Les tests de Student Intervalles de confiance Test de Fisher partiel IC pour β j Un intervalle de confiance au niveau (1 α) où α est la probabilité d erreur pour β j est défini par ] βj t n p;1 α/2 s( β j ); β j + t n p;1 α/2 s( β j )[. Remarque Cet intervalle de confiance est construit de telle sorte qu il contienne le paramètre inconnu β j avec une probabilité de (1 α).
36 Les tests de Student Intervalles de confiance Test de Fisher partiel Test de Fisher partiel La nullité d un certain nombre r de paramètres dans un modèle de p paramètres. l hypothèse nulle H 0 : modèle réduit avec (p r) paramètres contre l hypothèse alternative H 1 : modèle complet avec p paramètres.
37 Les tests de Student Intervalles de confiance Test de Fisher partiel Exemples Tester la nullité d un paramètre, par exemple : β 1. H 0 : Y i = β 0 + β 2 x i2 + + β p x ip + ε i contre H 1 : Y i = β 0 + β 1 x i1 + β 2 x i2 + + β p x ip + ε i. Tester la nullité de plusieurs paramètres, par exemple les pairs : β 2j. H 0 : Y i = β 1 x i1 + β 3 x i3 + + β p 1 x ip 1 + ε i contre H 1 : Y i = β 0 + β 1 x i1 + β 2 x i2 + + β p x ip + ε i avec p pair.
38 Les tests de Student Intervalles de confiance Test de Fisher partiel Méthode 1 Calculer les valeurs estimées ŷ i en utilisant la méthode des moindres carrés pour chacun des 2 modèles définis par H 0 et H 1, notées : ŷ i (H 0 ) et ŷ i (H 1 ). 2 Calculer ensuite SC res (H 0 ) et SC res (H 1 ). 3 Calculer la statistique F obs = SC res(h 0 ) SC res (H 1 ) SC res (H 1 ) n p r
39 Les tests de Student Intervalles de confiance Test de Fisher partiel Méthode - Suite et fin 4 Lire la valeur critique F 1 α,r,n p où F 1 α,r,n p est le (1 α)-quantile d une loi de Fisher avec r et (n p) degrés de liberté, car si l hypothèse nulle H 0 est vraie, alors F obs suit une loi de Fisher avec r et (n p) degrés de liberté. 5 Comparer la valeur observée et la valeur critique.
40 Les tests de Student Intervalles de confiance Test de Fisher partiel Règle de décision Nous décidons de rejeter l hypothèse nulle H 0 et par conséquent d accepter l hypothèse alternative H 1, au seuil α = 5%, si F obs F 1 α,r,n p. Nous décidons de ne pas rejeter l hypothèse nulle H 0 et donc de l accepter si F obs < F 1 α,r,n p.
Analyse de la variance Comparaison de plusieurs moyennes
Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction
Plus en détailAnalyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés
Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent
Plus en détailLe Modèle Linéaire par l exemple :
Publications du Laboratoire de Statistique et Probabilités Le Modèle Linéaire par l exemple : Régression, Analyse de la Variance,... Jean-Marc Azaïs et Jean-Marc Bardet Laboratoire de Statistique et Probabilités
Plus en détailCours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES
LES STATISTIQUES INFERENTIELLES (test de Student) L inférence statistique est la partie des statistiques qui, contrairement à la statistique descriptive, ne se contente pas de décrire des observations,
Plus en détailLa problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites
La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur
Plus en détailStatistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année 2010-2011
Master 1 Biologie et technologie du végétal Année 010-011 Statistiques Rappels de cours et travaux dirigés (Seul ce document sera autorisé en examen) auteur : Jean-Marc Labatte jean-marc.labatte@univ-angers.fr
Plus en détailExercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015
Exercices M1 SES 214-215 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 215 Les exemples numériques présentés dans ce document d exercices ont été traités sur le logiciel R, téléchargeable par
Plus en détailFORMULAIRE DE STATISTIQUES
FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)
Plus en détailExemples d application
AgroParisTech Exemples d application du modèle linéaire E Lebarbier, S Robin Table des matières 1 Introduction 4 11 Avertissement 4 12 Notations 4 2 Régression linéaire simple 7 21 Présentation 7 211 Objectif
Plus en détailTable des matières. I Mise à niveau 11. Préface
Table des matières Préface v I Mise à niveau 11 1 Bases du calcul commercial 13 1.1 Alphabet grec...................................... 13 1.2 Symboles mathématiques............................... 14 1.3
Plus en détailMODELE A CORRECTION D ERREUR ET APPLICATIONS
MODELE A CORRECTION D ERREUR ET APPLICATIONS Hélène HAMISULTANE Bibliographie : Bourbonnais R. (2000), Econométrie, DUNOD. Lardic S. et Mignon V. (2002), Econométrie des Séries Temporelles Macroéconomiques
Plus en détailCalcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes.
1 Définitions, notations Calcul matriciel Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes. On utilise aussi la notation m n pour le
Plus en détailSouad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/
Recherche opérationnelle Les démonstrations et les exemples seront traités en cours Souad EL Bernoussi Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Table des matières 1 Programmation
Plus en détailCours de méthodes de scoring
UNIVERSITE DE CARTHAGE ECOLE SUPERIEURE DE STATISTIQUE ET D ANALYSE DE L INFORMATION Cours de méthodes de scoring Préparé par Hassen MATHLOUTHI Année universitaire 2013-2014 Cours de méthodes de scoring-
Plus en détailINTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES
INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine
Plus en détail3 Approximation de solutions d équations
3 Approximation de solutions d équations Une équation scalaire a la forme générale f(x) =0où f est une fonction de IR dans IR. Un système de n équations à n inconnues peut aussi se mettre sous une telle
Plus en détailFonctions de plusieurs variables
Module : Analyse 03 Chapitre 00 : Fonctions de plusieurs variables Généralités et Rappels des notions topologiques dans : Qu est- ce que?: Mathématiquement, n étant un entier non nul, on définit comme
Plus en détailIntroduction à la Statistique Inférentielle
UNIVERSITE MOHAMMED V-AGDAL SCIENCES FACULTE DES DEPARTEMENT DE MATHEMATIQUES SMI semestre 4 : Probabilités - Statistique Introduction à la Statistique Inférentielle Prinemps 2013 0 INTRODUCTION La statistique
Plus en détailCONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un
Plus en détailProgrammation linéaire
Programmation linéaire DIDIER MAQUIN Ecole Nationale Supérieure d Electricité et de Mécanique Institut National Polytechnique de Lorraine Mathématiques discrètes cours de 2ème année Programmation linéaire
Plus en détailLa programmation linéaire : une introduction. Qu est-ce qu un programme linéaire? Terminologie. Écriture mathématique
La programmation linéaire : une introduction Qu est-ce qu un programme linéaire? Qu est-ce qu un programme linéaire? Exemples : allocation de ressources problème de recouvrement Hypothèses de la programmation
Plus en détailChapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens
Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques
Plus en détailUne introduction. Lionel RIOU FRANÇA. Septembre 2008
Une introduction INSERM U669 Septembre 2008 Sommaire 1 Effets Fixes Effets Aléatoires 2 Analyse Classique Effets aléatoires Efficacité homogène Efficacité hétérogène 3 Estimation du modèle Inférence 4
Plus en détailTests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE
Chapitre 5 UE4 : Biostatistiques Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.
Plus en détailCalcul différentiel sur R n Première partie
Calcul différentiel sur R n Première partie Université De Metz 2006-2007 1 Définitions générales On note L(R n, R m ) l espace vectoriel des applications linéaires de R n dans R m. Définition 1.1 (différentiabilité
Plus en détailIntroduction aux Statistiques et à l utilisation du logiciel R
Introduction aux Statistiques et à l utilisation du logiciel R Christophe Lalanne Christophe Pallier 1 Introduction 2 Comparaisons de deux moyennes 2.1 Objet de l étude On a mesuré le temps de sommeil
Plus en détailBureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr
Dominique Muller Laboratoire Inter-universitaire de Psychologie Bureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr Supports de cours : webcom.upmf-grenoble.fr/lip/perso/dmuller/m2r/acm/
Plus en détailNOTE SUR LA MODELISATION DU RISQUE D INFLATION
NOTE SUR LA MODELISATION DU RISQUE D INFLATION 1/ RESUME DE L ANALYSE Cette étude a pour objectif de modéliser l écart entre deux indices d inflation afin d appréhender le risque à très long terme qui
Plus en détailDonnées longitudinales et modèles de survie
ANALYSE DU Données longitudinales et modèles de survie 5. Modèles de régression en temps discret André Berchtold Département des sciences économiques, Université de Genève Cours de Master ANALYSE DU Plan
Plus en détailBiostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke
www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3
Plus en détailÉvaluation de la régression bornée
Thierry Foucart UMR 6086, Université de Poitiers, S P 2 M I, bd 3 téléport 2 BP 179, 86960 Futuroscope, Cedex FRANCE Résumé. le modèle linéaire est très fréquemment utilisé en statistique et particulièrement
Plus en détailAnalyse en Composantes Principales
Analyse en Composantes Principales Anne B Dufour Octobre 2013 Anne B Dufour () Analyse en Composantes Principales Octobre 2013 1 / 36 Introduction Introduction Soit X un tableau contenant p variables mesurées
Plus en détailSTATISTIQUES. UE Modélisation pour la biologie
STATISTIQUES UE Modélisation pour la biologie 2011 Cadre Général n individus: 1, 2,..., n Y variable à expliquer : Y = (y 1, y 2,..., y n ), y i R Modèle: Y = Xθ + ε X matrice du plan d expériences θ paramètres
Plus en détailLA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
Plus en détailProgrammation linéaire et Optimisation. Didier Smets
Programmation linéaire et Optimisation Didier Smets Chapitre 1 Un problème d optimisation linéaire en dimension 2 On considère le cas d un fabricant d automobiles qui propose deux modèles à la vente, des
Plus en détailLire ; Compter ; Tester... avec R
Lire ; Compter ; Tester... avec R Préparation des données / Analyse univariée / Analyse bivariée Christophe Genolini 2 Table des matières 1 Rappels théoriques 5 1.1 Vocabulaire....................................
Plus en détailChapitre 2. Matrices
Département de mathématiques et informatique L1S1, module A ou B Chapitre 2 Matrices Emmanuel Royer emmanuelroyer@mathuniv-bpclermontfr Ce texte mis gratuitement à votre disposition a été rédigé grâce
Plus en détailFONCTIONS DE PLUSIEURS VARIABLES (Outils Mathématiques 4)
FONCTIONS DE PLUSIEURS VARIABLES (Outils Mathématiques 4) Bernard Le Stum Université de Rennes 1 Version du 13 mars 2009 Table des matières 1 Fonctions partielles, courbes de niveau 1 2 Limites et continuité
Plus en détailMathématiques appliquées à l'économie et à la Gestion
Mathématiques appliquées à l'économie et à la Gestion Mr Makrem Ben Jeddou Mme Hababou Hella Université Virtuelle de Tunis 2008 Continuité et dérivation1 1- La continuité Théorème : On considère un intervalle
Plus en détailExercice : la frontière des portefeuilles optimaux sans actif certain
Exercice : la frontière des portefeuilles optimaux sans actif certain Philippe Bernard Ingénierie Economique & Financière Université Paris-Dauphine Février 0 On considère un univers de titres constitué
Plus en détailRésolution d équations non linéaires
Analyse Numérique Résolution d équations non linéaires Said EL HAJJI et Touria GHEMIRES Université Mohammed V - Agdal. Faculté des Sciences Département de Mathématiques. Laboratoire de Mathématiques, Informatique
Plus en détail1 Complément sur la projection du nuage des individus
TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent
Plus en détailEnjeux mathématiques et Statistiques du Big Data
Enjeux mathématiques et Statistiques du Big Data Mathilde Mougeot LPMA/Université Paris Diderot, mathilde.mougeot@univ-paris-diderot.fr Mathématique en Mouvements, Paris, IHP, 6 Juin 2015 M. Mougeot (Paris
Plus en détailChapitre 6 Test de comparaison de pourcentages χ². José LABARERE
UE4 : Biostatistiques Chapitre 6 Test de comparaison de pourcentages χ² José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Nature des variables
Plus en détailEtude des propriétés empiriques du lasso par simulations
Etude des propriétés empiriques du lasso par simulations L objectif de ce TP est d étudier les propriétés empiriques du LASSO et de ses variantes à partir de données simulées. Un deuxième objectif est
Plus en détailPrincipe d un test statistique
Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre
Plus en détailTests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles
Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles Valentin Patilea 1 Cesar Sanchez-sellero 2 Matthieu Saumard 3 1 CREST-ENSAI et IRMAR 2 USC Espagne 3 IRMAR-INSA
Plus en détailTABLE DES MATIERES. C Exercices complémentaires 42
TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence
Plus en détailÉquations non linéaires
Équations non linéaires Objectif : trouver les zéros de fonctions (ou systèmes) non linéaires, c-à-d les valeurs α R telles que f(α) = 0. y f(x) α 1 α 2 α 3 x Equations non lineaires p. 1/49 Exemples et
Plus en détailBaccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé
Baccalauréat S ntilles-guyane 11 septembre 14 Corrigé EXERCICE 1 6 points Commun à tous les candidats Une entreprise de jouets en peluche souhaite commercialiser un nouveau produit et à cette fin, effectue
Plus en détailRelation entre deux variables : estimation de la corrélation linéaire
CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence
Plus en détailSujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.
Promotion X 004 COURS D ANALYSE DES STRUCTURES MÉCANIQUES PAR LA MÉTHODE DES ELEMENTS FINIS (MEC 568) contrôle non classant (7 mars 007, heures) Documents autorisés : polycopié ; documents et notes de
Plus en détailL ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ
L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et
Plus en détailÉtude des flux d individus et des modalités de recrutement chez Formica rufa
Étude des flux d individus et des modalités de recrutement chez Formica rufa Bruno Labelle Théophile Olivier Karl Lesiourd Charles Thevenin 07 Avril 2012 1 Sommaire Remerciements I) Introduction p3 Intérêt
Plus en détailModèles Estimés sur Données de Panel
Modèles Estimés sur Données de Panel Introduction Il est fréquent en économétrie qu on ait à composer avec des données à deux dimensions : - une dimension chronologique - une dimension spatiale Par exemple,
Plus en détail3. Caractéristiques et fonctions d une v.a.
3. Caractéristiques et fonctions d une v.a. MTH2302D S. Le Digabel, École Polytechnique de Montréal H2015 (v2) MTH2302D: fonctions d une v.a. 1/32 Plan 1. Caractéristiques d une distribution 2. Fonctions
Plus en détailBiostatistiques : Petits effectifs
Biostatistiques : Petits effectifs Master Recherche Biologie et Santé P. Devos DRCI CHRU de Lille EA2694 patrick.devos@univ-lille2.fr Plan Données Générales : Définition des statistiques Principe de l
Plus en détaildistribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position
Arbre de NESI distribution quelconque Signe 1 échantillon distribution symétrique non gaussienne Wilcoxon gaussienne Student position appariés 1 échantillon sur la différence avec référence=0 2 échantillons
Plus en détailModèles pour données répétées
Résumé Les données répétées, ou données longitudinales, constituent un domaine à la fois important et assez particulier de la statistique. On entend par données répétées des données telles que, pour chaque
Plus en détailChapitre 3. Les distributions à deux variables
Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles
Plus en détailProgrammes des classes préparatoires aux Grandes Ecoles
Programmes des classes préparatoires aux Grandes Ecoles Filière : scientifique Voie : Biologie, chimie, physique et sciences de la Terre (BCPST) Discipline : Mathématiques Seconde année Préambule Programme
Plus en détailTests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»
Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences
Plus en détailIntroduction à la statistique non paramétrique
Introduction à la statistique non paramétrique Catherine MATIAS CNRS, Laboratoire Statistique & Génome, Évry http://stat.genopole.cnrs.fr/ cmatias Atelier SFDS 27/28 septembre 2012 Partie 2 : Tests non
Plus en détailPrudence, Epargne et Risques de Soins de Santé Christophe Courbage
Prudence, Epargne et Rique de Soin de Santé Chritophe Courbage ASSOCIATION DE GENÈVE Introduction Le compte d épargne anté (MSA), une nouvelle forme d intrument pour couvrir le dépene de anté en ca de
Plus en détailEconométrie et applications
Econométrie et applications Ecole des Ponts ParisTech Département Sciences Economiques Gestion Finance Nicolas Jacquemet (nicolas.jacquemet@univ-paris1.fr) Université Paris 1 & Ecole d Economie de Paris
Plus en détailRésolution de systèmes linéaires par des méthodes directes
Résolution de systèmes linéaires par des méthodes directes J. Erhel Janvier 2014 1 Inverse d une matrice carrée et systèmes linéaires Ce paragraphe a pour objet les matrices carrées et les systèmes linéaires.
Plus en détailUn exemple de régression logistique sous
Fiche TD avec le logiciel : tdr341 Un exemple de régression logistique sous A.B. Dufour & A. Viallefont Etude de l apparition ou non d une maladie cardiaque des coronaires 1 Présentation des données Les
Plus en détail1 Définition de la non stationnarité
Chapitre 2: La non stationnarité -Testsdedétection Quelques notes de cours (non exhaustives) 1 Définition de la non stationnarité La plupart des séries économiques sont non stationnaires, c est-à-direqueleprocessusquiles
Plus en détailLeçon N 4 : Statistiques à deux variables
Leçon N 4 : Statistiques à deux variables En premier lieu, il te faut relire les cours de première sur les statistiques à une variable, il y a tout un langage à se remémorer : étude d un échantillon d
Plus en détailCouples de variables aléatoires discrètes
Couples de variables aléatoires discrètes ECE Lycée Carnot mai Dans ce dernier chapitre de probabilités de l'année, nous allons introduire l'étude de couples de variables aléatoires, c'est-à-dire l'étude
Plus en détailPrincipe de symétrisation pour la construction d un test adaptatif
Principe de symétrisation pour la construction d un test adaptatif Cécile Durot 1 & Yves Rozenholc 2 1 UFR SEGMI, Université Paris Ouest Nanterre La Défense, France, cecile.durot@gmail.com 2 Université
Plus en détailTESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION
TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION Bruno Saussereau Laboratoire de Mathématiques de Besançon Université de Franche-Comté Travail en commun
Plus en détailQuantification Scalaire et Prédictive
Quantification Scalaire et Prédictive Marco Cagnazzo Département Traitement du Signal et des Images TELECOM ParisTech 7 Décembre 2012 M. Cagnazzo Quantification Scalaire et Prédictive 1/64 Plan Introduction
Plus en détailTP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options
Université de Lorraine Modélisation Stochastique Master 2 IMOI 2014-2015 TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options 1 Les options Le but de ce
Plus en détailRésumé du Cours de Statistique Descriptive. Yves Tillé
Résumé du Cours de Statistique Descriptive Yves Tillé 15 décembre 2010 2 Objectif et moyens Objectifs du cours Apprendre les principales techniques de statistique descriptive univariée et bivariée. Être
Plus en détailExo7. Matrice d une application linéaire. Corrections d Arnaud Bodin.
Exo7 Matrice d une application linéaire Corrections d Arnaud odin. Exercice Soit R muni de la base canonique = ( i, j). Soit f : R R la projection sur l axe des abscisses R i parallèlement à R( i + j).
Plus en détailPremière partie. Préliminaires : noyaux itérés. MPSI B 6 juin 2015
Énoncé Soit V un espace vectoriel réel. L espace vectoriel des endomorphismes de V est désigné par L(V ). Lorsque f L(V ) et k N, on désigne par f 0 = Id V, f k = f k f la composée de f avec lui même k
Plus en détailVI. Tests non paramétriques sur un échantillon
VI. Tests non paramétriques sur un échantillon Le modèle n est pas un modèle paramétrique «TESTS du CHI-DEUX» : VI.1. Test d ajustement à une loi donnée VI.. Test d indépendance de deux facteurs 96 Différentes
Plus en détailCours d analyse numérique SMI-S4
ours d analyse numérique SMI-S4 Introduction L objet de l analyse numérique est de concevoir et d étudier des méthodes de résolution de certains problèmes mathématiques, en général issus de problèmes réels,
Plus en détailModèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes
de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes Zohra Guessoum 1 & Farida Hamrani 2 1 Lab. MSTD, Faculté de mathématique, USTHB, BP n 32, El Alia, Alger, Algérie,zguessoum@usthb.dz
Plus en détailExo7. Calculs de déterminants. Fiche corrigée par Arnaud Bodin. Exercice 1 Calculer les déterminants des matrices suivantes : Exercice 2.
Eo7 Calculs de déterminants Fiche corrigée par Arnaud Bodin Eercice Calculer les déterminants des matrices suivantes : Correction Vidéo ( ) 0 6 7 3 4 5 8 4 5 6 0 3 4 5 5 6 7 0 3 5 4 3 0 3 0 0 3 0 0 0 3
Plus en détailSimulation de variables aléatoires
Chapter 1 Simulation de variables aléatoires Références: [F] Fishman, A first course in Monte Carlo, chap 3. [B] Bouleau, Probabilités de l ingénieur, chap 4. [R] Rubinstein, Simulation and Monte Carlo
Plus en détailExercices - Fonctions de plusieurs variables : corrigé. Pour commencer
Pour commencer Exercice 1 - Ensembles de définition - Première année - 1. Le logarithme est défini si x + y > 0. On trouve donc le demi-plan supérieur délimité par la droite d équation x + y = 0.. 1 xy
Plus en détailStatistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux 4 2013-2014
Tests du χ 2 Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux 4 2013-2014 A. Lourme http://alexandrelourme.free.fr Outline
Plus en détailPython - introduction à la programmation et calcul scientifique
Université de Strasbourg Environnements Informatique Python - introduction à la programmation et calcul scientifique Feuille de TP 1 Avant de commencer Le but de ce TP est de vous montrer les bases de
Plus en détailLa classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
Plus en détailBaccalauréat ES Pondichéry 7 avril 2014 Corrigé
Baccalauréat ES Pondichéry 7 avril 204 Corrigé EXERCICE 4 points Commun à tous les candidats. Proposition fausse. La tangente T, passant par les points A et B d abscisses distinctes, a pour coefficient
Plus en détailIntroduction à l économétrie : Spécifications, formes fonctionnelles, hétéroscédasticité et variables instrumentales
Introduction à l économétrie : Spécifications, formes fonctionnelles, hétéroscédasticité et variables instrumentales Pierre Thomas Léger IEA, HEC Montréal 2013 Table des matières 1 Introduction 2 2 Spécifications
Plus en détailEteindre. les. lumières MATH EN JEAN 2013-2014. Mme BACHOC. Elèves de seconde, première et terminale scientifiques :
MTH EN JEN 2013-2014 Elèves de seconde, première et terminale scientifiques : Lycée Michel Montaigne : HERITEL ôme T S POLLOZE Hélène 1 S SOK Sophie 1 S Eteindre Lycée Sud Médoc : ROSIO Gauthier 2 nd PELGE
Plus en détailLe modèle de régression linéaire
Chapitre 2 Le modèle de régression linéaire 2.1 Introduction L économétrie traite de la construction de modèles. Le premier point de l analyse consiste à se poser la question : «Quel est le modèle?». Le
Plus en détailProgrammation Linéaire - Cours 1
Programmation Linéaire - Cours 1 P. Pesneau pierre.pesneau@math.u-bordeaux1.fr Université Bordeaux 1 Bât A33 - Bur 265 Ouvrages de référence V. Chvátal - Linear Programming, W.H.Freeman, New York, 1983.
Plus en détailt 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :
Terminale STSS 2 012 2 013 Pourcentages Synthèse 1) Définition : Calculer t % d'un nombre, c'est multiplier ce nombre par t 100. 2) Exemples de calcul : a) Calcul d un pourcentage : Un article coûtant
Plus en détailExercices - Polynômes : corrigé. Opérations sur les polynômes
Opérations sur les polynômes Exercice 1 - Carré - L1/Math Sup - Si P = Q est le carré d un polynôme, alors Q est nécessairement de degré, et son coefficient dominant est égal à 1. On peut donc écrire Q(X)
Plus en détaildonnées en connaissance et en actions?
1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)
Plus en détailCorrection du Baccalauréat S Amérique du Nord mai 2007
Correction du Baccalauréat S Amérique du Nord mai 7 EXERCICE points. Le plan (P) a une pour équation cartésienne : x+y z+ =. Les coordonnées de H vérifient cette équation donc H appartient à (P) et A n
Plus en détailArbres binaires de décision
1 Arbres binaires de décision Résumé Arbres binaires de décision Méthodes de construction d arbres binaires de décision, modélisant une discrimination (classification trees) ou une régression (regression
Plus en détailExemple PLS avec SAS
Exemple PLS avec SAS This example, from Umetrics (1995), demonstrates different ways to examine a PLS model. The data come from the field of drug discovery. New drugs are developed from chemicals that
Plus en détailL Econométrie des Données de Panel
Ecole Doctorale Edocif Séminaire Méthodologique L Econométrie des Données de Panel Modèles Linéaires Simples Christophe HURLIN L Econométrie des Données de Panel 2 Figure.: Présentation Le but de ce séminaire
Plus en détailCours de Tests paramétriques
Cours de Tests paramétriques F. Muri-Majoube et P. Cénac 2006-2007 Licence Ce document est sous licence ALC TYPE 2. Le texte de cette licence est également consultable en ligne à l adresse http://www.librecours.org/cgi-bin/main?callback=licencetype2.
Plus en détailIntroduction à l approche bootstrap
Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?
Plus en détail