Exercices M1 SES Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

Dimension: px
Commencer à balayer dès la page:

Download "Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015"

Transcription

1 Exercices M1 SES Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 215 Les exemples numériques présentés dans ce document d exercices ont été traités sur le logiciel R, téléchargeable par l intermédiaire du CRAN (Comprehensive R Archive Network) à l adresse Dans chaque exercice, nous ne donnerons que les sorties de R (ici nous ne donnerons pas les commandes utilisées). Exercice 1 : Nous souhaitons étudier les données enregistrées dans le fichier salaires.txt (téléchargeable sur et également sur ma page web). Ce fichier contient les données observées sur un échantillon de 474 employés tirés au sort dans une entreprise canadienne. Les variables étudiées sont les suivantes : salary : salaire brut actuel, en $/an salbegin : salaire de départ, en $/an jobtime : nombre de mois depuis l entrée dans l entreprise prevexp : expérience professionnelle antérieure (nombre de mois de travail avant l entrée dans l entreprise) educ : nombre d années d étude minority : appartenance à une minorité (Non, Oui) sex : sexe (H = Homme, F = Femme) 1. Décrire les données à l aide du résumé de variables et des graphiques ci-dessous. Indiquer quelles sont les variables quantitatives et qualitatives. Commenter les graphiques. Observations: 474 Variables: $ salary (int) 57, 42, 2145, 219, 45, 321, 36, $ salbegin (int) 27, 1875, 12, 132, 21, 135, 1875, $ jobtime (int) 98, 98, 98, 98, 98, 98, 98, 98, 98, 98, 98, 98, 98, 9... $ prevexp (int) 144, 36, 381, 19, 138, 67, 114,, 115, 244, 143, $ educ (int) 15, 16, 12, 8, 15, 15, 15, 12, 15, 12, 16, 8, 15, 15,... $ minority (fctr) Non, Non, Non, Non, Non, Non, Non, Non, Non, Non, No... $ sex (fctr) H, H, F, F, H, H, H, F, F, F, F, H, H, F, H, H, H, H... salary salbegin jobtime prevexp Min. : 1575 Min. : 9 Min. :63. Min. :. 1st Qu.: 24 1st Qu.: st Qu.:72. 1st Qu.: Median : Median :15 Median :81. Median : 55. Mean : 3442 Mean :1716 Mean :81.11 Mean : rd Qu.: rd Qu.:1749 3rd Qu.:9. 3rd Qu.: Max. :135 Max. :7998 Max. :98. Max. :476. educ minority sex Min. : 8. Non:37 H:258 1st Qu.:12. Oui:14 F:216 Median :12. Mean : rd Qu.:15. Max. :21. 1

2 H sex F Non minority Oui e+4 1e+5 salary salbegin Nous avons déterminé la matrice des corrélations pour l ensemble des variables quantitatives. salary salbegin jobtime prevexp educ salary salbegin jobtime prevexp educ Indiquer pour quels couples de variables la corrélation linéaire observée est la plus forte, la plus faible. Nous avons tracé, ci-dessous, à gauche le nuage de points représentant les observations conjointes des deux variables salaire de départ salbegin et salaire actuel salary et à droite l ajustement avec un modèle de régression linéaire simple. Nous avons également relevé les sorties de la régression linéaire simple. 2

3 16 1e+5 12 salary salary 8 5e salbegin salbegin Call: lm(formula = salary ~ salbegin, data = Salaire) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) 1.928e e * salbegin 1.99e e <2e-16 *** --- Signif. codes: '***'.1 '**'.1 '*'.5 '.'.1 ' ' 1 Residual standard error: 8115 on 472 degrees of freedom Multiple R-squared:.7746, Adjusted R-squared:.7741 F-statistic: 1622 on 1 and 472 DF, p-value: < 2.2e Que peut-on dire de la corrélation linéaire entre le salaire de départ et le salaire actuel? La dispersion des salaires actuels augmente-t-elle quand le salaire de départ augmente? Commenter. 4. Commenter les résultats de la régression linéaire simple. On veut savoir si la variable salaire du départ a une influence sur le salaire actuel. Effectuer un test d hypothèses au niveau α = 5% pour répondre à la question (écrire les hypothèses du test, donner la p-valeur et conclure). 5. Que vaut R 2 (coefficient de détermination)? Donner son interprétation. 6. Quel est le graphe qui permet de vérifier la normalité des résidus? Quel est le graphe qui permet de vérifier l homoscédasticité des résidus? Commenter ces deux graphiques : pensez vous que ces deux conditions sur le modèle sont vérifiées? Justifier. 3

4 4 Residuals vs Fitted Normal Q Q Residuals 2 2 Standardized residuals Fitted values 2 2 Theoretical Quantiles 7. Commenter les résultats la régression linéaire multiple suivante. Que vaut R 2? Donner son interprétation. Que vaut R 2 ajusté? Call: lm(formula = salary ~ salbegin + jobtime + prevexp + educ + sex, data = Salaire) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e e *** salbegin 1.723e+ 6.51e < 2e-16 *** jobtime 1.545e e e-6 *** prevexp e e e-8 *** educ 5.93e e *** sexf e e ** --- Signif. codes: '***'.1 '**'.1 '*'.5 '.'.1 ' ' 1 Residual standard error: 741 on 468 degrees of freedom Multiple R-squared:.8137, Adjusted R-squared:.8117 F-statistic: 48.7 on 5 and 468 DF, p-value: < 2.2e-16 4

5 Exercice 2 : Nous traitons un problème de défaut bancaire (données du livre An Introduction to Statistical Learning de Gareth James, Daniela Witten Trevor Hastie et Robert Tibshirani, également disponibles sur R). Nous cherchons à déterminer quels clients seront en défaut sur leur dette de carte de crédit (ici defaut = yes si le client fait défaut). La variable defaut est la variable réponse. Nous disposons d un échantillon de taille 1 et 3 variables explicatives : student: Yes si le client est un étudiant et No sinon balance: montant moyen mensuel d utilisation de la carte de crédit income: revenu du client. 1. Décrire les données à l aide du résumé des variables et des graphiques suivants : Observations: 1 Variables: $ default (fctr) No, No, No, No, No, No, No, No, No, No, No, No, No, N... $ student (fctr) No, Yes, No, No, No, Yes, No, Yes, No, No, Yes, Yes,... $ balance (dbl) , , , , , $ income (dbl) , , , , ,... default student balance income No :9667 No :756 Min. :. Min. : 772 Yes: 333 Yes:2944 1st Qu.: st Qu.:2134 Median : Median :34553 Mean : Mean : rd Qu.: rd Qu.:4388 Max. : Max. : No default Yes 1 2 balance income No student Yes Sans perte de généralité, nous notons X une variable ou un vecteur de plusieurs variables explicatives. Nous allons estimer π(x) = P(default = 1 X = x) à l aide du modèle logistique. Pour illustrer un peu le problème 5

6 et le jeu de données, nous commencerons par des modèles simples et nous terminerons par des modèles multiples. Modèle 1 : Call: glm(formula = default ~ balance, family = binomial(link = "logit"), data = Default) Deviance Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error z value Pr(> z ) (Intercept) -1.65e e <2e-16 *** balance 5.499e e <2e-16 *** --- Signif. codes: '***'.1 '**'.1 '*'.5 '.'.1 ' ' 1 (Dispersion parameter for binomial family taken to be 1) Null deviance: on 9999 degrees of freedom Residual deviance: on 9998 degrees of freedom AIC: 16.5 Number of Fisher Scoring iterations: 8 1. On veut savoir si la variable balance a une influence sur la variable default. Effectuer un test d hypothèses au niveau α = 5% pour répondre à la question (écrire les hypothèses du test. donner la p-valeur et conclure). 2. Utiliser les résultats ci-dessus pour donner l équation du modèle logistique ave les coefficients estimés. 3. Relever la valeur de la probabilité de défaut pour un client qui a un balance de 1 dollars et 2 dollars. Que peut-on en conclure? balance Modèle 2 : Call: glm(formula = default ~ student, family = binomial(link = "logit"), data = Default) Deviance Residuals: 6

7 Min 1Q Median 3Q Max Coefficients: Estimate Std. Error z value Pr(> z ) (Intercept) < 2e-16 *** studentyes *** --- Signif. codes: '***'.1 '**'.1 '*'.5 '.'.1 ' ' 1 (Dispersion parameter for binomial family taken to be 1) Null deviance: on 9999 degrees of freedom Residual deviance: on 9998 degrees of freedom AIC: Number of Fisher Scoring iterations: 6 4. Relever les coefficients estimées du modèle 2 et donner l équation du modèle logistique avec les coefficients estimés. Calculer aussi à la main les coefficients estimés du modèle à l aide du tableau de contingence suivant : student No Yes default No Yes Est-ce que vous obtenez les mêmes résultats que celui du logiciel R? 5. Donner à la main les estimations de P(default = Yes student = Yes) et P(default = Yes student = No) (aide : considerer Yes = 1 et No =). Est-ce que vos résultats coïncident avec les sorties ci-dessous? student 1 Yes 2 No Modèle 3 : Call: glm(formula = default ~ student + balance, family = binomial(link = "logit"), data = Default) Deviance Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error z value Pr(> z ) 7

8 (Intercept) -1.75e e < 2e-16 *** studentyes e e e-6 *** balance 5.738e e < 2e-16 *** --- Signif. codes: '***'.1 '**'.1 '*'.5 '.'.1 ' ' 1 (Dispersion parameter for binomial family taken to be 1) Null deviance: on 9999 degrees of freedom Residual deviance: on 9997 degrees of freedom AIC: Number of Fisher Scoring iterations: 8 π (x) Yes No student (Yes ou 1) et no student (No ou ) balance 6. Commenter le graphique obtenu avec les sorties du Modèle 3. Que pouvez vous suggérer? 7. Relever les valeurs estimées des trois coefficients du Modèle 3. Donner l équation du modèle logistique avec les coefficients estimés pour les student=yes et pour les student=no. 8. Commenter les sorties R suivantes : default student balance income 1 No No Yes Yes No No Nous avons relevé les valeurs estimées de la proportion de defaut selon les caractéristiques de trois clients au hasard. Est-ce qu on peut dire si ces trois clients feront default? Que peut-on en conclure? 8

9 Modèle 4 : Call: glm(formula = default ~ balance + income + student, family = binomial, data = Default) Deviance Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error z value Pr(> z ) (Intercept) -1.87e e < 2e-16 *** balance 5.737e e < 2e-16 *** income 3.33e e studentyes e e ** --- Signif. codes: '***'.1 '**'.1 '*'.5 '.'.1 ' ' 1 (Dispersion parameter for binomial family taken to be 1) Null deviance: on 9999 degrees of freedom Residual deviance: on 9996 degrees of freedom AIC: Number of Fisher Scoring iterations: 8 1. Utiliser le critère AIC pour choisir un modèle. Lequel choisissez-vous? Justifier. AIC.glm1 AIC.glm2 AIC.glm3 AIC.glm4 [1,]

10 Exercice 3 : Une étude conduite aux USA en 1986 cherche à cerner les facteurs pouvant augmenter le risque de donner naissance à des bébés de faible poids inférieur à 25 g. Source : Hosmer, D.W. and Lemeshow, S. (1989). Applied Logistic Regression. New York : Wiley (site Les données sont stockées aussi dans le fichier birthwt.txt téléchargeables sur ma page web et également sous R dans le package MASS. Les variables considérées sont mesurées sur 189 bébés. Variable low age lwt race smoke ptl ht ui ftv bwt Nom 1 si poids à la naisance est superieur à 2.5 kg, sinon. âge de la mère. le poids de la mère lors des dernières menstruations l ethnicité de la mère (1 = white, 2 = black, 3 = other). 1 si tabagisme pendant la grossesse, sinon nombre d accouchement prématuré précédente. 1 si antécédent d hypertension, sinon. 1 si présence d irritabilité utérine, sinon. le nombre de visites médicales durant le premier trimestre de grossesse. poids à la naissance en grammes. Observations: 189 Variables: $ low (int),,,,,,,,,,,,,,,,,,,... $ age (int) 19, 33, 2, 21, 18, 21, 22, 17, 29, 26, 19, 19, 22, 3,... $ lwt (int) 182, 155, 15, 18, 17, 124, 118, 13, 123, 113, 95, $ race (int) 2, 3, 1, 1, 1, 3, 1, 3, 1, 1, 3, 3, 3, 3, 1, 1, 2, 1, 3,... $ smoke (int),, 1, 1, 1,,,, 1, 1,,,,, 1, 1,, 1,,... $ ptl (int),,,,,,,,,,,,, 1,,,,,,... $ ht (int),,,,,,,,,,,, 1,,,,,,,... $ ui (int) 1,,, 1, 1,,,,,,,,, 1,,,,, 1,... $ ftv (int), 3, 1, 2,,, 1, 1, 1,,, 1,, 2,,,, 3,,... $ bwt (int) 2523, 2551, 2557, 2594, 26, 2622, 2637, 2637, 2663, Ces nécessitent quelques recodages. Nous avons transformé certains variables à facteur (variables qualitatives). Observations: 189 Variables: $ low (fctr) normal, normal, normal, normal, normal, normal, normal,... $ age (int) 19, 33, 2, 21, 18, 21, 22, 17, 29, 26, 19, 19, 22, 3,... $ lwt (int) 182, 155, 15, 18, 17, 124, 118, 13, 123, 113, 95, $ race (fctr) black, other, white, white, white, other, white, other,... $ smoke (fctr) no, no, yes, yes, yes, no, no, no, yes, yes, no, no, no... $ ptl (int),,,,,,,,,,,,, 1,,,,,,... $ ht (fctr) no, no, no, no, no, no, no, no, no, no, no, no, yes, no... $ ui (fctr) yes, no, no, yes, yes, no, no, no, no, no, no, no, no,... $ ftv (int), 3, 1, 2,,, 1, 1, 1,,, 1,, 2,,,, 3,,... $ bwt (int) 2523, 2551, 2557, 2594, 26, 2622, 2637, 2637, 2663,

11 normal low low white black other race no smoke yes age lwt ftv 11

12 bwt ptl no ui yes no ht yes Parmi les variables d intérêt figurent : low, age, lwt, ftv, race. Nous avons croisé la varaible quantitative age avec la variable catégorielle low. Les résumés numériques séparés pour chaque niveau de la variable catégorielle sont : low: normal Min. 1st Qu. Median Mean 3rd Qu. Max low: low Min. 1st Qu. Median Mean 3rd Qu. Max Pour comprende le problème nous avons commencé par des modèles simples et nous avons terminé par des modèles plus complexes. Nous avons ajusté un modèle logistique expliquant la probabilité qu un bébé naisse avec un faible poids à partir de la variable explicative lwt. 12

13 Call: glm(formula = low ~ lwt, family = binomial, data = Poids) Deviance Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error z value Pr(> z ) (Intercept) lwt * --- Signif. codes: '***'.1 '**'.1 '*'.5 '.'.1 ' ' 1 (Dispersion parameter for binomial family taken to be 1) Null deviance: on 188 degrees of freedom Residual deviance: on 187 degrees of freedom AIC: Number of Fisher Scoring iterations: 4 Nous avons ajusté un modèle logistique expliquant la probabilité qu un bébé naisse avec un faible poids à partir des variables explicatives age et lwt. Call: glm(formula = low ~ lwt + age, family = binomial, data = Poids) Deviance Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error z value Pr(> z ) (Intercept) lwt * age Signif. codes: '***'.1 '**'.1 '*'.5 '.'.1 ' ' 1 (Dispersion parameter for binomial family taken to be 1) Null deviance: on 188 degrees of freedom Residual deviance: on 186 degrees of freedom AIC: Number of Fisher Scoring iterations: 4 Nous avons ajusté un modèle logistique expliquant la probabilité qu un bébé naisse avec un faible poids à partir des variables explicatives age, lwt, ftv et race. 13

14 Call: glm(formula = low ~ lwt + race + ftv + age, family = binomial, data = Poids) Deviance Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error z value Pr(> z ) (Intercept) lwt * raceblack * raceother ftv age Signif. codes: '***'.1 '**'.1 '*'.5 '.'.1 ' ' 1 (Dispersion parameter for binomial family taken to be 1) Null deviance: on 188 degrees of freedom Residual deviance: on 183 degrees of freedom AIC: Number of Fisher Scoring iterations: 4 14

Un exemple de régression logistique sous

Un exemple de régression logistique sous Fiche TD avec le logiciel : tdr341 Un exemple de régression logistique sous A.B. Dufour & A. Viallefont Etude de l apparition ou non d une maladie cardiaque des coronaires 1 Présentation des données Les

Plus en détail

Régression logistique avec plusieurs variables explicative

Régression logistique avec plusieurs variables explicative Chapitre 17 Introduction à la statistique avec R Régression logistique avec plusieurs variables explicative Plusieurs variables explicatives Log p h. r. de suicide 1 p h. r. de suicide = a + b duree +

Plus en détail

Le modèle linéaire généralisé (logit, probit,...)

Le modèle linéaire généralisé (logit, probit,...) Le modèle linéaire généralisé (logit, probit,...) Master 2 Recherche SES-IES Analyse de données Ana Karina Fermin Université Paris-Ouest-Nanterre-La Défense http://fermin.perso.math.cnrs.fr/ 1 Modèle de

Plus en détail

Travaux dirigés - Régression linéaire simple: corrigé partiel Julien Chiquet et Guillem Rigaill 1er octobre 2015

Travaux dirigés - Régression linéaire simple: corrigé partiel Julien Chiquet et Guillem Rigaill 1er octobre 2015 Travaux dirigés - Régression linéaire simple: corrigé partiel Julien Chiquet et Guillem Rigaill 1er octobre 2015 Quelques révisions de R 1. Manipulation de vecteur. On rappelle que e x = k 0 Créer dans

Plus en détail

Données longitudinales et modèles de survie

Données longitudinales et modèles de survie ANALYSE DU Données longitudinales et modèles de survie 5. Modèles de régression en temps discret André Berchtold Département des sciences économiques, Université de Genève Cours de Master ANALYSE DU Plan

Plus en détail

Cours 7 : Exemples. I- Régression linéaire simple II- Analyse de variance à 1 facteur III- Tests statistiques

Cours 7 : Exemples. I- Régression linéaire simple II- Analyse de variance à 1 facteur III- Tests statistiques Cours 7 : Exemples I- Régression linéaire simple II- Analyse de variance à 1 facteur III- Tests statistiques Exemple 1 : On cherche à expliquer les variations de y par celles d une fonction linéaire de

Plus en détail

COURS DE STATISTIQUES (24h)

COURS DE STATISTIQUES (24h) COURS DE STATISTIQUES (24h) Introduction Statistiques descriptives (4 h) Rappels de Probabilités (4 h) Echantillonnage(4 h) Estimation ponctuelle (6 h) Introduction aux tests (6 h) Qu est-ce que la statistique?

Plus en détail

Le modèle linéaire généralisé avec R : fonction glm()

Le modèle linéaire généralisé avec R : fonction glm() SEMIN- Le modèle linéaire généralisé avec R : fonction glm() Sébastien BALLESTEROS UMR 7625 Ecologie Evolution Ecole Normale Supérieure 46 rue d'ulm F-75230 Paris Cedex 05 sebastien.ballesteros@biologie.ens.fr

Plus en détail

Régression de Poisson

Régression de Poisson ZHANG Mudong & LI Siheng & HU Chenyang 21 Mars, 2013 Plan Composantes des modèles Estimation Qualité d ajustement et Tests Exemples Conclusion 2/25 Introduction de modèle linéaire généralisé La relation

Plus en détail

UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SJAP Année universitaire 2013 2014. Cours de Statistiques et Économétrie.

UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SJAP Année universitaire 2013 2014. Cours de Statistiques et Économétrie. UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SJAP Année universitaire 2013 2014 Master Droit-Éco Cours de M. Desgraupes Cours de Statistiques et Économétrie Séance 05 1 Analyse de série temporelle

Plus en détail

X1 = Cash flow/ Dette totale. X2 = Revenu net / Total des actifs au bilan. X3 = Actif réalisable et disponible / Passif courant

X1 = Cash flow/ Dette totale. X2 = Revenu net / Total des actifs au bilan. X3 = Actif réalisable et disponible / Passif courant EXEMPLE : FAILLITE D ENTREPRISES Cet exemple a pour objectif d étudier la faillite d entreprises. Les données proviennent de l ouvrage de R.A.Johnson et D.W Wichern : Applied Multivariate Statistical Analysis»,

Plus en détail

Le provisionnement en assurance non-vie prise en compte de la dépendance

Le provisionnement en assurance non-vie prise en compte de la dépendance Le provisionnement en assurance non-vie prise en compte de la dépendance Arthur Charpentier http://freaconometrics.blog.free.fr Séminaire interne Desjardins Assurances Générales, février 2011 Les provisions

Plus en détail

Examen de Logiciels Statistiques

Examen de Logiciels Statistiques G. Hunault Angers, mai 2011 Licence MEF Examen de Logiciels Statistiques On s intéresse ici au dossier EAEF01 qui contient un extrait des données du recensement américain. On trouvera ces données et leur

Plus en détail

Introduction à Rcommander

Introduction à Rcommander Introduction à Rcommander Pauline Scherdel Septembre 2014 Table des matières 1 Introduction à Rcmdr sous R 2 2 Interagir avec R 3 3 Installer et charger le package Rcmdr sous R 3 4 Importation des données

Plus en détail

Démarrer en R. Présentation. Installation

Démarrer en R. Présentation. Installation 1 Démarrer en R Jean-Pierre Cabannes (www.cabannes.org) 2005-2013 Présentation Installation Principes et commandes de base Console Help Caractères Commentaires Commandes Affectation La commande «summary»

Plus en détail

Sélection de modèles avec l AIC et critères d information dérivés

Sélection de modèles avec l AIC et critères d information dérivés Sélection de modèles avec l AIC et critères d information dérivés Renaud LANCELOT et Matthieu LESNOFF Version 3, Novembre 2005 Ceci n est pas une revue exhaustive mais une courte introduction sur l'utilisation

Plus en détail

EXEMPLE : FAILLITE D ENTREPRISES

EXEMPLE : FAILLITE D ENTREPRISES EXEMPLE : FAILLITE D ENTREPRISES Cet exemple a pour objectif d étudier la faillite d entreprises. Les données proviennent de l ouvrage de R.A.Johnson et D.W Wichern : «Applied Multivariate Statistical

Plus en détail

Normalité des rendements?

Normalité des rendements? Normalité des rendements? Daniel Herlemont 31 mars 2011 Table des matières 1 Introduction 1 2 Test de Normalité des rendements 2 3 Graphiques quantile-quantile 2 4 Estimation par maximum de vraisemblance

Plus en détail

Package LeLogicielR. February 19, 2015

Package LeLogicielR. February 19, 2015 Type Package Package LeLogicielR February 19, 2015 Title Functions and datasets to accompany the book ``Le logiciel R: Maitriser le langage, Effectuer des analyses statistiques'' (french) Version 1.2 Date

Plus en détail

Analyse des données individuelles groupées

Analyse des données individuelles groupées Analyse des données individuelles groupées Analyse des Temps de Réponse Le modèle mixte linéaire (L2M) Y ij, j-ième observation continue de l individu i (i = 1,, N ; j =1,, n) et le vecteur des réponses

Plus en détail

Analyse de la Variance pour Plans à Mesures Répétées

Analyse de la Variance pour Plans à Mesures Répétées Analyse de la Variance pour Plans à Mesures Répétées Pr Roch Giorgi roch.giorgi@univ-amu.fr SESSTIM, Faculté de Médecine, Aix-Marseille Université, Marseille, France http://sesstim-orspaca.org http://optim-sesstim.univ-amu.fr/

Plus en détail

«Cours Statistique et logiciel R»

«Cours Statistique et logiciel R» «Cours Statistique et logiciel R» Rémy Drouilhet (1), Adeline Leclercq-Samson (1), Frédérique Letué (1), Laurence Viry (2) (1) Laboratoire Jean Kuntzmann, Dép. Probabilites et Statistique, (2) Laboratoire

Plus en détail

Problème 4: Les diagrammes suivants représentent la distribution de 4 variables discrètes X1, X2, X3 et X4 :

Problème 4: Les diagrammes suivants représentent la distribution de 4 variables discrètes X1, X2, X3 et X4 : Cours 5-62-96 : Traitement et analyse des données Test autodiagnostique PARTIE 1 : Problème 1 : Pour chacune des distributions ci-dessous, identifier la population et la variable étudiée en précisant si

Plus en détail

TESTS STATISTIQUES: COMPARAISON, INDÉPENDANCE ET RÉGRESSION LINÉAIRE

TESTS STATISTIQUES: COMPARAISON, INDÉPENDANCE ET RÉGRESSION LINÉAIRE TESTS STATISTIQUES: COMPARAISON, INDÉPENDANCE ET RÉGRESSION LINÉAIRE Les résultats donnés par R et SAS donnent les valeurs des tests, la valeur-p ainsi que les intervalles de confiance. TEST DE COMPARAISON

Plus en détail

SEMIN- Introduction au modèle linéaire mixte. Sébastien BALLESTEROS UMR 7625 Ecologie Evolution Equipe Eco-Evolution mathématique ENS Ulm, UPMS

SEMIN- Introduction au modèle linéaire mixte. Sébastien BALLESTEROS UMR 7625 Ecologie Evolution Equipe Eco-Evolution mathématique ENS Ulm, UPMS SEMIN- Introduction au modèle linéaire mixte Sébastien BALLESTEROS UMR 7625 Ecologie Evolution Equipe Eco-Evolution mathématique ENS Ulm, UPMS SEMIN-R du MNHN 18 Décembre 2008 Introduction au modèle linéaire

Plus en détail

Travailler sur des proportions - Les bonnes pratiques

Travailler sur des proportions - Les bonnes pratiques Travailler sur des proportions - Les bonnes pratiques Marc Girondot July 2, 2013 Contents 1 Chargement des bibliothèques 2 2 Introduction 3 3 Intervalle de confiance d une fréquence 4 3.1 Pourcentage..............................

Plus en détail

A quoi vont-elles servir?

A quoi vont-elles servir? A quoi vont-elles servir? Décrire Distribution Position : moyenne, mode, médiane, (ordre de grandeur) Résumer paramètres et graphes Forme (symétrie, tendance ) Dispersion : écart-type, variance, quantiles,

Plus en détail

Test d indépendance de deux variables qualitatives (Chi2) Rapport de chances et Odds-ratio

Test d indépendance de deux variables qualitatives (Chi2) Rapport de chances et Odds-ratio Université Paris Ouest - Nanterre La Défense Master M1 SES Enquêtes et méthodes d analyses quantitatives A.K. FERMIN et C. Hardouin Test d indépendance de deux variables qualitatives (Chi2) Rapport de

Plus en détail

R i = a 0 +b 0 B i +ε i, R = Xβ +ε,

R i = a 0 +b 0 B i +ε i, R = Xβ +ε, Statistiques 2010-2011 TP sur le Modèle linéaire gaussien avec R 1 Les exercices Vous traiterez les exercices suivants avec le logiciel R. Exercice 1 Des photographies aériennes de champs d orge sont analysées

Plus en détail

INTRODUCTION AU LOGICIEL R

INTRODUCTION AU LOGICIEL R INTRODUCTION AU LOGICIEL R 4. Statistiques avancées.. Anne Dubois, Julie Bertrand, Emmanuelle Comets emmanuelle.comets@inserm.fr INSERM UMR738 E. Comets (UMR738) Introduction à R - Novembre 2009 1 / 50

Plus en détail

UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2014 2015 Cours de B. Desgraupes. Simulation Stochastique

UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2014 2015 Cours de B. Desgraupes. Simulation Stochastique UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2014 2015 L2 MIASHS Cours de B. Desgraupes Simulation Stochastique Séance 04: Nombres pseudo-aléatoires Table des matières 1

Plus en détail

Analyse de la variance à un facteur

Analyse de la variance à un facteur Analyse de la variance à un facteur Frédéric Bertrand et Myriam Maumy-Bertrand IRMA, UMR 7501, Université de Strasbourg 08 juin 2015 F. Bertrand et M. Maumy-Bertrand (UdS) Analyse de la variance à un facteur

Plus en détail

Analyse de la variance à deux facteurs

Analyse de la variance à deux facteurs 1 1 IRMA, Université Louis Pasteur Strasbourg, France Master 1 Psychologie du développement 06-10-2008 Contexte Nous nous proposons d analyser l influence du temps et de trois espèces ligneuses d arbre

Plus en détail

Présentation rapide du logiciel Epi Info

Présentation rapide du logiciel Epi Info Présentation rapide du logiciel Epi Info Loïc Desquilbet, PhD Département des Productions Animales et de Santé Publique Ecole Nationale Vétérinaire d Alfort ldesquilbet@vet-alfort.fr Tutoriel Epi Info

Plus en détail

Introduction au MOOC

Introduction au MOOC Chapitre 0 Introduction à la statistique avec R Introduction au MOOC Plan À quoi servent les statistiques? Présentation d un «fichier de données» L étude «santé mentale en prison» Le planning du MOOC Les

Plus en détail

Régression linéaire multiple en R Exemple détaillé

Régression linéaire multiple en R Exemple détaillé Modèle Linéaire 2016-2017 Régression linéaire multiple en R Exemple détaillé Préambule : récupération et mise en forme des données On utilise la base state de R, que nous mettons en forme. > data(state)

Plus en détail

TD de statistique : tests du Chi 2

TD de statistique : tests du Chi 2 TD de statistique : tests du Chi 2 Jean-Baptiste Lamy 6 octobre 2008 1 Test du Chi 2 C est l équivalent de la comparaison de moyenne, mais pour les variables qualitatives. 1.1 Cas 1 : comparer les répartitions

Plus en détail

Modèles ARIMA et SARIMA Estimation dans R 1 et SAS 2 Novembre 2007 Yves Aragon aragon@cict.fr

Modèles ARIMA et SARIMA Estimation dans R 1 et SAS 2 Novembre 2007 Yves Aragon aragon@cict.fr Modèles ARIMA et SARIMA Estimation dans R 1 et SAS 2 Novembre 2007 Yves Aragon aragon@cict.fr Cette note examine les différences entre R et SAS dans l estimation des modèles ARIMA et SARIMA. Elle illustre

Plus en détail

REGRESSION LOGISTIQUE ASSURES BELGES

REGRESSION LOGISTIQUE ASSURES BELGES REGRESSION LOGISTIQUE ASSURES BELGES Cte étude concerne l assurance automobile. L échantillon est constitué de 1106 assurés belges observés en 1992 répartis en deux groupes. Les assurés qui n ont eu aucun

Plus en détail

Chapitre 4 : Régression linéaire

Chapitre 4 : Régression linéaire Exercice 1 Méthodes statistiques appliquées aux sciences sociales (STAT-D-203) Titulaire : Catherine Vermandele Chapitre 4 : Régression linéaire Le diplôme de Master of Business Administration ou MBA est

Plus en détail

Leçon N 4 : Statistiques à deux variables

Leçon N 4 : Statistiques à deux variables Leçon N 4 : Statistiques à deux variables En premier lieu, il te faut relire les cours de première sur les statistiques à une variable, il y a tout un langage à se remémorer : étude d un échantillon d

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

UNIVERSITE PARIS VIII ECOLE DOCTORALE COGNITION, LANGAGE, INTERACTION. Thèse de Doctorat en psychologie clinique et psychopathologie

UNIVERSITE PARIS VIII ECOLE DOCTORALE COGNITION, LANGAGE, INTERACTION. Thèse de Doctorat en psychologie clinique et psychopathologie UNIVERSITE PARIS VIII ECOLE DOCTORALE COGNITION, LANGAGE, INTERACTION Thèse de Doctorat en psychologie clinique et psychopathologie Présentée et soutenue publiquement par Rébecca Shankland Née le 9 août

Plus en détail

Contrôle sur machine (avec solution)

Contrôle sur machine (avec solution) DEA Analyse et Modélisation des Systèmes Biologiques Introduction au logiciel R - 2000/2001 Contrôle sur machine (avec solution) D. Chessel & J. Thioulouse 1. Questions Récupérer les fichiers wormshab.txt,

Plus en détail

Feuille de TP N 3 : Modèle log-linéaire - Travail guidé. 1 Cancers : modèle log-linéaire à deux facteurs croisés

Feuille de TP N 3 : Modèle log-linéaire - Travail guidé. 1 Cancers : modèle log-linéaire à deux facteurs croisés M1 MLG Année 2012 2013 Feuille de TP N 3 : Modèle log-linéaire - Travail guidé 1 Cancers : modèle log-linéaire à deux facteurs croisés Ce premier exercice reprend l exercice 1 de la feuille de TD n 3.

Plus en détail

Statistiques appliquées aux études médicamenteuses cliniques. Pierre BOUTOUYRIE Pharmacologie HEGP

Statistiques appliquées aux études médicamenteuses cliniques. Pierre BOUTOUYRIE Pharmacologie HEGP Statistiques appliquées aux études médicamenteuses cliniques Pierre BOUTOUYRIE Pharmacologie HEGP Grands principes méthodologiques Tout dépend de la formulation de la question scientifique Exemple : on

Plus en détail

La régression logistique. Par Sonia NEJI et Anne-Hélène JIGOREL

La régression logistique. Par Sonia NEJI et Anne-Hélène JIGOREL La régression logistique Par Sonia NEJI et Anne-Hélène JIGOREL Introduction La régression logistique s applique au cas où: Y est qualitative à 2 modalités Xk qualitatives ou quantitatives Le plus souvent

Plus en détail

Dossier / TD Econométrie. Analyse de la demande d essence aux Etats-Unis entre 1960-1995 fichier : essence.xls

Dossier / TD Econométrie. Analyse de la demande d essence aux Etats-Unis entre 1960-1995 fichier : essence.xls Dossier / TD Econométrie Analyse de la demande d essence aux Etats-Unis entre 1960-1995 fichier : essence.xls Source : Greene "Econometric Analysis" Prentice Hall International, 4 ème édition, 2000 Council

Plus en détail

TP 1 : Présentation générale du logiciel, l aide en ligne et les bases du langage

TP 1 : Présentation générale du logiciel, l aide en ligne et les bases du langage TP 1 : Présentation générale du logiciel, l aide en ligne et les bases du langage est distribué gratuitement à partir du site du CRAN (Comprehensive R Archive Network) : http://www.r-project.org/. Je vous

Plus en détail

L analyse de la variance avec R commander

L analyse de la variance avec R commander L analyse de la variance avec R commander 19 mars 2014 1 Installer R Pour installer R, il vous suffit d aller sur le site http://www.r-project.org/. Choisissez un miroir pour le téléchargement. Sélectionner

Plus en détail

Prise en main du Logiciel R 2 mots sur R R est un logiciel de statistique disponible librement sur internet.

Prise en main du Logiciel R 2 mots sur R R est un logiciel de statistique disponible librement sur internet. Prise en main du Logiciel R 2 mots sur R R est un logiciel de statistique disponible librement sur internet. Vous pouvez le télécharger à http://www.r-project.org/ Il est déjà installé dans ces salles

Plus en détail

3ICBE UFBC11 Statistique

3ICBE UFBC11 Statistique 3 ème année INSA-ICBE 2013/2014 UFBC11 contrôle de Statistique 1/8 3ICBE UFBC11 Statistique Contrôle du jeudi 7 novembre 2013 Les documents ne sont pas autorisés Modéliser la perte de poids du café lors

Plus en détail

Didacticiel - Études de cas

Didacticiel - Études de cas 1 Objectif Diagnostic et évaluation de la régression logistique. Ce tutoriel décrit la mise en œuvre des outils d évaluation et de diagnostic de la régression logistique binaire, disponibles depuis la

Plus en détail

Actuariat IARD - ACT2040 Partie 2 - régression logistique et arbres de régression (Y {0, 1})

Actuariat IARD - ACT2040 Partie 2 - régression logistique et arbres de régression (Y {0, 1}) Actuariat IARD - ACT2040 Partie 2 - régression logistique et arbres de régression (Y {0, 1}) Arthur Charpentier charpentier.arthur@uqam.ca http ://freakonometrics.hypotheses.org/ Hiver 2013 1 Modèlisation

Plus en détail

Cours 6 : Les statistiques avec R. XVII- Généralités XVIII- Les formules XIX- Les sorties

Cours 6 : Les statistiques avec R. XVII- Généralités XVIII- Les formules XIX- Les sorties Cours 6 : Les statistiques avec R XVII- Généralités XVIII- Les formules XIX- Les sorties XX- Les fonctions génériques XVII- Généralités Fonctions d analyse statistique disponibles Package «stats» : contient

Plus en détail

La régression logistique généralisée avec la procédure LOGISTIC

La régression logistique généralisée avec la procédure LOGISTIC La régression logistique généralisée avec la procédure LOGISTIC 1 Sommaire I / Régression logistique généralisée 3 a. Introduction 3 b. Présentation de l exemple à étudier 3 II / Modélisation avec la proc

Plus en détail

ANALYSE : OUTIL D ANALYSE DE DONNEES POUR LES SCIENCES HUAMINES MANUEL DE L UTILISATEUR : PRISE EN MAIN

ANALYSE : OUTIL D ANALYSE DE DONNEES POUR LES SCIENCES HUAMINES MANUEL DE L UTILISATEUR : PRISE EN MAIN Pôle Informatique de Recherche et d Enseignement en Histoire ANALYSE : OUTIL D ANALYSE DE DONNEES POUR LES SCIENCES HUAMINES MANUEL DE L UTILISATEUR : PRISE EN MAIN A. PREMIER PAS 1. INTEGRATION DU TABLEAU

Plus en détail

Analyse de la variance Comparaison de plusieurs moyennes

Analyse de la variance Comparaison de plusieurs moyennes Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction

Plus en détail

Econométrie. 1. Matière: Problèmes de spécification et variables explicatives binaires

Econométrie. 1. Matière: Problèmes de spécification et variables explicatives binaires Econométrie Répétition 9 1. Matière: Problèmes de spécification et variables explicatives binaires Utilisation des variables explicatives binaires. Test de la forme fonctionnelle. Testd hétéroscédasticitéetutilisationde

Plus en détail

UNIVERSITE PARIS X NANTERRE UFR SEGMI. TD d économétrie. TD 2. Le modèle de régression simple. Une application en séries temporelles

UNIVERSITE PARIS X NANTERRE UFR SEGMI. TD d économétrie. TD 2. Le modèle de régression simple. Une application en séries temporelles UNIVERSITE PARIS X NANTERRE UFR SEGMI Année universitaire 2007 2008 Cours d économétrie L3 Economie Cours de Valérie MIGNON TD de Benoît CHEZE et Anne-Laure SAMSON TD d économétrie TD 1. Introduction.

Plus en détail

Régression linéaire multiple Analyse de variance

Régression linéaire multiple Analyse de variance Chapitre 7 Introduction à la statistique avec R Régression linéaire multiple Analyse de variance Régression linéaire multiple La durée d entretien est liée À l âge À l existence d une dépression Régression

Plus en détail

Soutien illimité 7j/7 en maths: Coach, profs, exercices & annales, cours. Sujet de Bac 2013 Maths S Obligatoire & Spécialité - Amérique du Nord

Soutien illimité 7j/7 en maths: Coach, profs, exercices & annales, cours. Sujet de Bac 2013 Maths S Obligatoire & Spécialité - Amérique du Nord Sujet de Bac 2013 Maths S Obligatoire & Spécialité - Amérique du Nord EXERCICE 1 : 5 points On se place dans l espace muni d un repère orthonormé. On considère les points,, et. 1. Démontrer que les points,

Plus en détail

Utilisation du logiciel Excel pour des analyses simples de bases données

Utilisation du logiciel Excel pour des analyses simples de bases données Utilisation du logiciel Excel pour des analyses simples de bases données Catherine Raux (interne Santé Publique) et Benoît Lepage (AHU), Service d Epidémiologie du CHU de Toulouse Version 1.1 Avril 2012

Plus en détail

Fiches de Cours. CQLS : Jean-François Coeurjolly & Rémy Drouilhet Jean-Francois.Coeurjolly@upmf-grenoble.fr, Remy.Drouilhet@upmf-grenoble.

Fiches de Cours. CQLS : Jean-François Coeurjolly & Rémy Drouilhet Jean-Francois.Coeurjolly@upmf-grenoble.fr, Remy.Drouilhet@upmf-grenoble. Fiches de Cours CQLS : Jean-François Coeurjolly & Rémy Drouilhet Jean-Francois.Coeurjolly@upmf-grenoble.fr, Remy.Drouilhet@upmf-grenoble.fr 2 Table des matières 1 Phénomène de colinéarité 5 1.1 Appréhension

Plus en détail

T. D. n o 3 Analyse de données quantitatives avec le logiciel R

T. D. n o 3 Analyse de données quantitatives avec le logiciel R T. D. n o 3 Analyse de données quantitatives avec le logiciel R 1 Rappel de quelques fonctions statistiques sous R Fonction summary() cumsum() sum() mean() max() min() range() median() var() sd() Description

Plus en détail

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

REGRESSION MULTIPLE: CONSOMMATION D ELECTRICITE

REGRESSION MULTIPLE: CONSOMMATION D ELECTRICITE REGRESSION MULTIPLE: CONSOMMATION D ELECTRICITE LES DONNEES OBS KW SURFACE PERS PAVILLON AGE VOL SBAINS 1 4805 130 4 1 65 410 1 2 3783 123 4 1 5 307 2 3 2689 98 3 0 18 254 1 4 5683 178 6 1 77 570 3 5 3750

Plus en détail

Introduction aux Statistiques et à l utilisation du logiciel R

Introduction aux Statistiques et à l utilisation du logiciel R Introduction aux Statistiques et à l utilisation du logiciel R Christophe Lalanne Christophe Pallier 1 Introduction 2 Comparaisons de deux moyennes 2.1 Objet de l étude On a mesuré le temps de sommeil

Plus en détail

Analyse exploratoire des données

Analyse exploratoire des données Analyse exploratoire des données Introduction à R pour la recherche biomédicale http://wwwaliquoteorg/cours/2012_biomed Objectifs Au travers de l analyse exploratoire des données, on cherche essentiellement

Plus en détail

Chapitre 3. Les distributions à deux variables

Chapitre 3. Les distributions à deux variables Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles

Plus en détail

Statistiques Appliquées Rôle des femmes dans la société

Statistiques Appliquées Rôle des femmes dans la société Statistiques Appliquées Rôle des femmes dans la société Denis Schelling Semestre d automne 2012 Résumé A partir de données concernant le rôle des femmes dans la société, nous avons effectué une analyse

Plus en détail

Débuter avec R. Maxime Hervé. UMR 1099 INRA Agrocampus Ouest Université Rennes 1 BiO3P. 28 avril 2011

Débuter avec R. Maxime Hervé. UMR 1099 INRA Agrocampus Ouest Université Rennes 1 BiO3P. 28 avril 2011 Débuter avec R Maxime Hervé UMR 1099 INRA Agrocampus Ouest Université Rennes 1 BiO3P 28 avril 2011 Maxime Hervé (UMR BiO3P) Débuter avec R 28 avril 2011 1 / 23 R, c est quoi? Trois caractéristiques importantes

Plus en détail

Imputation du salaire d ego dans TeO

Imputation du salaire d ego dans TeO Imputation du salaire d ego dans TeO Objet de la note : linéariser la réponse en tranche du salaire, et imputer le salaire en cas de non réponse Champ et principe de la méthode Les individus qui se sont

Plus en détail

Utilisation de. Dominique Muller (dominique.muller@upmf-grenoble.fr)

Utilisation de. Dominique Muller (dominique.muller@upmf-grenoble.fr) Utilisation de Dominique Muller (dominique.muller@upmf-grenoble.fr) Pourquoi utiliser R? Flexibilité et puissance Simplicité du langage Multiplateforme (Windows, Mac, Linux) C'est gratuit! Installation

Plus en détail

Traitements statistiques et Informatique. Utilisation du logiciel R

Traitements statistiques et Informatique. Utilisation du logiciel R Traitements statistiques et Informatique. Utilisation du logiciel R Avertissement : Ce document est en cours d élaboration. La présente version n est donc que la version alpha d un travail qui demande

Plus en détail

UTILISATION PRATIQUE DU LOGICIEL STATISTIQUE «R»

UTILISATION PRATIQUE DU LOGICIEL STATISTIQUE «R» TP STA-MQGR UTILISATION PRATIQUE DU LOGICIEL STATISTIQUE «R» Seydou Barro SESSTIM, UMR 912, Aix-Marseille Université golo-seydou.barro@univ-amu.fr 1 INTRODUCTION R est un logiciel libre distribué gratuitement

Plus en détail

Choix de modèle en régression linéaire

Choix de modèle en régression linéaire Master pro Fouille de données Philippe Besse 1 Objectif Choix de modèle en régression linéaire La construction d un score d appétence sur les données bancaires correspond au choix et à l estimation d un

Plus en détail

79, avenue de la République - 75543 PARIS CEDEX 11 - Tél. : 01.49.23.20.00. I&OM Information & Operations Management

79, avenue de la République - 75543 PARIS CEDEX 11 - Tél. : 01.49.23.20.00. I&OM Information & Operations Management 79, avenue de la République - 75543 PARIS CEDEX 11 - Tél. : 01.49.23.20.00 Département : I&OM Information & Operations Management Cours : Statistique et Analyse de Données pour le Management Titre du document

Plus en détail

Seconds pas vers l analyse de données...

Seconds pas vers l analyse de données... Fiche TD avec le logiciel : tdr1102 Seconds pas vers l analyse de données... A.B. Dufour & D. Clot Cette fiche comprend des exercices portant sur les paramètres descriptifs principaux et les représentations

Plus en détail

Annexe commune aux séries ES, L et S : boîtes et quantiles

Annexe commune aux séries ES, L et S : boîtes et quantiles Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans

Plus en détail

Économétrie 2 : données qualitatives, probit et logit

Économétrie 2 : données qualitatives, probit et logit URCA Hugo Harari-Kermadec 2008-2009 harari@ecogest.ens-cachan.fr Économétrie 2 : données qualitatives, probit et logit I Un modèle pour données qualitatives Cette section est fortement inspirée du cours

Plus en détail

Analyse de la variance

Analyse de la variance M2 Statistiques et Econométrie Fanny MEYER Morgane CADRAN Margaux GAILLARD Plan du cours I. Introduction II. Analyse de la variance à un facteur III. Analyse de la variance à deux facteurs IV. Analyse

Plus en détail

BREVET DE TECHNICIEN SUPÉRIEUR COMPTABILITÉ ET GESTION DES ORGANISATIONS Session 2013 ÉPREUVE DE MATHÉMATIQUES. Durée : 2 heures Coefficient : 2

BREVET DE TECHNICIEN SUPÉRIEUR COMPTABILITÉ ET GESTION DES ORGANISATIONS Session 2013 ÉPREUVE DE MATHÉMATIQUES. Durée : 2 heures Coefficient : 2 BREVET DE TECHNICIEN SUPÉRIEUR COMPTABILITÉ ET GESTION DES ORGANISATIONS Session 2013 ÉPREUVE DE MATHÉMATIQUES Durée : 2 heures Coefficient : 2 SUJET Dès que le sujet vous est remis, assurez-vous qu il

Plus en détail

Préparation à l agrégation 2012/2013. Mots clés : Graphes. Vecteur propre ; matrices stochastiques ; matrices à coefficients positifs.

Préparation à l agrégation 2012/2013. Mots clés : Graphes. Vecteur propre ; matrices stochastiques ; matrices à coefficients positifs. Mots clés : Graphes. Vecteur propre ; matrices stochastiques ; matrices à coefficients positifs. Le jury n exige pas une compréhension exhaustive du texte. Vous êtes laissé(e) libre d organiser votre discussion

Plus en détail

Activité 1 : échantillonnage

Activité 1 : échantillonnage Activité échantillonnage, intervalle de fluctuation, prise de décision (à partir d un même thème) Les trois activités qui suivent s inspirent du document «ressources pour la classe de première générale

Plus en détail

Estimation et tests statistiques, TD 5. Solutions

Estimation et tests statistiques, TD 5. Solutions ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études

Plus en détail

TP 1. Introduction au logiciel SAS Analyse Statistique Univariée

TP 1. Introduction au logiciel SAS Analyse Statistique Univariée IMIS : Master 1 Université Paris Est Marne la Vallée TP 1. Introduction au logiciel SAS Analyse Statistique Univariée 1. Premier contact avec SAS 1. Lancez le logiciel sas. Vous voyez apparaître les fenètres

Plus en détail

La régression logistique PLS

La régression logistique PLS La régression logistique PLS Michel Tenenhaus Groupe HEC, 78351 Jouy-en-Josas 1 Introduction La régression PLS permet de relier une ou plusieurs variables de réponse y àun ensemble de variables prédictives

Plus en détail

Analyse en composantes principales (ACP)

Analyse en composantes principales (ACP) Analyse en composantes principales (ACP) François Husson Laboratoire de mathématiques appliquées - Agrocampus Rennes husson@agrocampus-ouest.fr 1 / 31 Quel type de données? L ACP s intéresse à des tableaux

Plus en détail

Régression linéaire multiple

Régression linéaire multiple 1 1 IRMA, Université Louis Pasteur Strasbourg, France Master 1ère Année 23-03-2009 Régression linéaire simple Exemple Affiner le modèle Problème : Étude de la concentration d ozone dans l air. Modèle :

Plus en détail

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent

Plus en détail

Données qualitatives, modèles probit et logit

Données qualitatives, modèles probit et logit Données qualitatives, modèles probit et logit I Un modèle pour données qualitatives Cette section est fortement inspirée du cours de Christophe Hurlin. On est confronté à des données qualitatives en micro-économie

Plus en détail

Économétrie - Une Étude de la Création d Entreprise entre 1994 et 2007

Économétrie - Une Étude de la Création d Entreprise entre 1994 et 2007 LESAUX Loïc MAROT Gildas TANGUY Brewal Économétrie - Une Étude de la Création d Entreprise entre 1994 et 007 Charpentier Arthur Semestre 008 Master 1 Cadoret Isabelle 1 Plan Introduction... 3 Présentation

Plus en détail

SY09 Rapport TP4 : Analyse discriminante, régression logistique

SY09 Rapport TP4 : Analyse discriminante, régression logistique UNIVERSITÉ DE TECHNOLOGIE DE COMPIÈGNE SY09 Rapport TP4 : Analyse discriminante, régression logistique CUNI Frédéric 15 juin 2015 Objectifs du TP : Le but de ce TP est l application de l analyse discriminante

Plus en détail

3 - Salaires. Il va falloir compléter une succession de fenêtres pour arriver au graphique final.

3 - Salaires. Il va falloir compléter une succession de fenêtres pour arriver au graphique final. 3 - Objectif : Traiter les statistiques descriptives à l'aide du tableur Excel. Partie 1 : Représentations graphiques 1.1 Histogrammes Les données brutes sont placées dans les deux premières colonnes 1

Plus en détail