Feuille de TP N 3 : Modèle log-linéaire - Travail guidé. 1 Cancers : modèle log-linéaire à deux facteurs croisés

Save this PDF as:
 WORD  PNG  TXT  JPG

Dimension: px
Commencer à balayer dès la page:

Download "Feuille de TP N 3 : Modèle log-linéaire - Travail guidé. 1 Cancers : modèle log-linéaire à deux facteurs croisés"

Transcription

1 M1 MLG Année Feuille de TP N 3 : Modèle log-linéaire - Travail guidé 1 Cancers : modèle log-linéaire à deux facteurs croisés Ce premier exercice reprend l exercice 1 de la feuille de TD n 3. Les données sont extraites du registre des cancers du Tarn. Elles concernent des patients ayant déclaré un cancer entre 1982 et L objet de cette analyse est d étudier le nombre de cancers en fonction de la localisation du cancer et du sexe du patient ; pour cela, on met en œuvre un modèle log-linéaire à 2 facteurs croisés. 1. Copiez la table SAS cancer (envoyée par mail). La table contient les variables suivantes : la localisation (notée loc), à 3 niveaux : A = Voies digestives ; B = Peau ; C = Organes génitaux et voies urinaires le sexe (noté sexe) : 1 = Femme / 2 = Homme, le nombre de patients (noté n). Vérifiez son contenu. Eléments de réponse : La table cancer contient 6 observations correspondant aux 6 combinaisons possibles entre la localisation (A, B ou C) et le sexe (Homme/Femme). La variable n fournit le nombre de patients atteints de cancers répartis selon la localisation du cancer et le sexe du patient. 2. Affichez la table de contingence à l aide de la procédure FREQ. Etant donné le format de la table SAS (données regroupées par localisation et par sexe), vous devez utiliser l instruction weight (qui attribue à chaque cellule un poids égal à n) : proc freq data=... ; weight n ; tables loc * sexe / chisq ; run; Commentez ce tableau croisé. Eléments de réponse : Le test d indépendance du Khi-2 est significatif (p-value= 0.03) montrant une dépendance significative entre les 2 facteurs. En commentant les profils-lignes et les profilscolonnes, on peut en déduire que : Chez les femmes, les cancers de type A et C sont les plus fréquents (respectivement, 48% et 39%), contrairement aux cancers de type B (12%). Chez les hommes, la fréquence des cancers de type B est similaire (11.7%). En revanche, les cancers de type C sont plus présents (47%) que chez les femmes au détriment des cancers de type C (41%). Globalement, sur l ensemble de l échantillon, il y a 59% de femmes : cette proportion est plus élevée parmi les cancers de type A (63%) que parmi les cancers de type C (54%). 3. Lancez la procédure GENMOD pour estimer le modèle saturé de la façon suivante : 1

2 proc genmod data=... ; class loc sexe ; model n = loc sexe / dist=poisson link=log; run; Note : en spécifiant loc sexe en variables explicatives, cela revient à spécifier loc sexe loc*sexe, c est-à-dire le modèle avec interactions (saturé). A partir des informations détaillées sur les sorties de la procédure GENMOD, suivez les commentaires sur les résultats obtenus : Informations sur le modèle Informations sur le modèle Data Set (A) Distribution (B) Link Function (C) Dependent Variable (D) SASUSER.CANCER Poisson Log n Number of Observations Read (E) 6 Number of Observations Used (E) 6 Informations sur le niveau de classe (F) Classe Niveaux Valeurs loc 3 A B C sexe (A) Table / Data set : table SAS utilisée dans la procédure. (B) Distribution : distribution de la variable réponse. Dans le cas d un modèle log-linéaire, on modélise un nombre d évènements, distribué selon une loi de Poisson, comme spécifié dans le code de la procédure par dist. (C) Link function : Fonction de lien associée à la loi de Poisson : fonction ln, comme mentionné dans le code de la procédure par link. (D) Dependent variable : variable réponse que l on cherche à expliquer par ce modèle, c est le nombre d évènements observés. (E) Nombre d observations lues/utilisées : Nombre d observations lues et utilisées pour l analyse. Le nombre d observations utilisées peut être inférieur au nombre d observations lues en cas de valeur manquante. Par défaut, SAS supprime les observations manquantes ou incomplètes. Le nombre d observations correspond au nombre de lignes dans la table SAS ; ici, c est le nombre de combinaisons possibles obtenues en croisant tous les facteurs. (F) Level information : liste les facteurs pris en compte dans le modèle, spécifiés comme variable qualitative dans l instruction CLASS. SAS y précise le nombre de niveaux de chaque facteur et les valeurs de ces niveaux. Ajustement global du modèle Critères d évaluation de l adéquation Critère DDL (K) Valeur (L) Valeur/DDL (M) Deviance (G)

3 Scaled Deviance (I) Pearson Chi-Square (H) Scaled Pearson X2 (I) Log Likelihood (J) Algorithm converged. L ajustement du modèle est mesuré selon plusieurs critères : la Deviance (G) qui mesure l écart entre l ajustement du modèle saturé et celui du modèle estimé, et la statistique du Khi-deux de Pearson (H) qui compare les effectifs observés avec les effectifs prédits par le modèle estimé. Ces critères sont nuls pour le modèle saturé, dont l ajustement est parfait (y i = ŷ i ). (I) Scaled Deviance et Scaled Pearson X2 : ces critères sont issus des deux critères précédents. Dans le cas où la distribution de la variable réponse ne dépend que d un seul paramètre, ces critères sont égaux aux précédents. Ce n est pas le cas si on estime un paramètre lié à la variance. (J) Log likelihood : donne la valeur de la log-vraisemblance. (K) DF : donne le nombre de degrés de liberté du modèle = nombre d observations (de cellules) - nombre de paramètres estimés. Le DDL du modèle saturé est nul puisque le nombre de paramètres estimés dans un modèle saturé est égal au nombre d observations. (L) Value : donne la valeur de chaque critère. (M) Value/DF : calcule la valeur des critères divisée par le nombre de degrés de liberté. Par exemple, pour la déviance, on obtient la déviance relative. C est grâce à cette colonne que l on peut juger de la qualité d ajustement du modèle estimé. Plus les valeurs relatives sont proches de 1, meilleur est l ajustement du modèle. Une déviance relative inférieure à 3 indique un bon ajustement. Un mauvais ajustement du modèle est associé à une déviance relative élevée (> 10). Estimations des paramètres Paramètres estimés par l analyse du maximum de vraisemblance Intervalle de Valeur Erreur confiance de Khi-2 Paramètre (N) DDL (O) estimée (P) type (Q) Wald à 95 % (R) de Wald (S) Pr > Khi-2 (S) Intercept <.0001 loc A loc B <.0001 loc C sexe sexe loc*sexe A loc*sexe A loc*sexe B loc*sexe B loc*sexe C loc*sexe C Scale Ce tableau donne les estimations des paramètres du modèle selon le paramétrage SAS et teste la nullité de chaque paramètre. Attention ce tableau ne donne pas les résultats des tests sur l effet de chaque composante du modèle. 3

4 (N) Paramètre / Parameter : donne la liste de tous les niveaux des facteurs et de toutes les interactions entre facteurs, spécifiés dans la procédure. Selon le paramétrage SAS, les paramètres associés aux derniers niveaux sont nuls, car le dernier niveau sert de référence. (O) DDL / DF : nombre de degrés de liberté associé au test de nullité d un paramètre : 1 si le paramètre est estimé, 0 si le paramètre est fixé à 0 selon le paramétrage SAS (pour les derniers niveaux). (P) Valeur estimée / estimate : donne les valeurs des paramètres estimés. Dans le cas du modèle log-linéaire, les variables explicatives sont des facteurs pour lesquels on n estime pas un seul paramètre comme c est le cas pour une variable explicative quantitative, mais on en estime un par niveau du facteur (-1). Chaque paramètre associé à un niveau ou à une cellule représente l écart entre ce niveau et le dernier niveau (de référence), ou entre cette cellule et la dernière cellule. (Q) Erreur Type / Standard errors : donne les erreurs standard de chaque paramètre estimé, permettant d évaluer la précision des estimations. Ils sont utilisés pour calculer les intervalles de confiance de chaque paramètre, et la statistique de Wald pour tester la nullité de chaque paramètre. (S) Khi-2 de Wald et Pr>Khi-2 / Chi-square et Pr>Chisq : donne, pour chaque paramètre, la valeur de la statistique de test de Wald et la p-value associée, pour tester l hypothèse de nullité du paramètre (sachant que d autres variables explicatives sont dans le modèle). On compare la p-value au risque 5%. Si la p-value est inférieure à 5%, on rejette H 0 et on conclut que le paramètre est significativement différent de 0, c est-à-dire que le niveau testé est significativement différent du niveau de référence. Synthèse des résultats : Etant donné que l on estime le modèle saturé, les critères de qualité d ajustement (Déviance et Chi-2 de Pearson) sont nuls. Ce modèle fournit le meilleur ajustement possible. Les paramètres estimés montrent que certains d entre eux sont significativement différents de 0, indiquant un effet du facteur Localisation et des interactions significatives. Par exemple, on observe que le paramètre associé à Loc=B est estimé à , indiquant que la fréquence des cancers de type B est plus basse que celle des cancers de type C. On observe également un paramètre d interaction élevé pour Loc=A et Sexe=1 suggérant que les cancers de type A sont sur-représentés chez les femmes. A souligner que l on retrouve dans ce tableau les paramètres nuls associés aux derniers niveaux de chaque facteur, selon les contraintes du paramétrage SAS. Toutefois cette syntaxe de base ne permet pas de juger de l effet de chaque composante du modèle, d où la question suivante. 4. Dans l instruction model, rajoutez l option type3. Quel est son effet? Interprétez. Eléments de réponse : L option type3 affiche un nouveau tableau LR Statistics for type 3 analysis permettant de juger de l effet de chaque composante (facteur / interaction) en se basant la statistique du rapport de vraisemblance. On teste l absence d effet de chaque composante (correspondant à H 0 ) en comparant le modèle estimé avec le modèle sous H 0 (ne contenant pas la composante). Une p-value inférieure à 5% indique un effet significatif de la composante ; plus la p-value est faible, plus l effet de la composante est fort. 4

5 Statistique LR pour Analyse de Type 3 Source DDL Khi-2 Pr > Khi-2 loc <.0001 sexe <.0001 loc*sexe On détecte ici un effet très significatif de la localisation et du sexe (p-value< ), mais aussi une interaction significative entre les 2 facteurs (p-value= 0.03). On retrouve les résultats du test d absence d interaction sur la sortie de la procédure FREQ (sous la ligne du test du Chi-2). Très important! Cette option n est pas optionnelle : il est obligatoire d afficher ce tableau pour juger de l effet de chaque composante, sous cette forme (associée à la statistique du rapport de vraisemblance) ou sous la forme suivante (correspondant au test de Wald). 5. Même question pour l option type3 wald. Eléments de réponse : L option type3 wald donne les mêmes résultats que l option précédente, mais les tests sont basés sur la statistique de Wald. On en déduit les mêmes effets significatifs. 6. Relancez la procédure GENMOD pour le modèle d indépendance (en spécifiant uniquement loc et sexe comme variables explicatives). Comparez ces résultats au modèle saturé et commentez. Eléments de réponse : Le modèle d indépendance ne contient plus les termes d interaction. On observe à nouveau des effets très significatifs de chaque facteur (p-value < ), mais les critères AIC et BIC sont plus élevés, respectivement et 54.75, alors qu ils valent et pour le modèle saturé. Cela est logique puisqu en retirant des interactions significatives, on perd en qualité d ajustement. 7. Concluez. Eléments de réponse : Pour conclure, on a mis en évidence que les cancers n étaient pas répartis de façon équiprobable selon le sexe (plus de femmes atteintes) et selon la localisation (moins de cancers de la peau). On a également montré que la répartition des cancers selon la localisation n est pas la même chez les hommes et chez les femmes. En effet, les femmes sont plus touchées par les cancers sur voies digestives, alors chez les hommes, ce sont les cancers sur voies urinaires et appareils génitaux qui sont les plus fréquents. 5

6 2 Accidents : modèle log-linéaire à trois facteurs croisés Les données traitées ici concernent des accidents de voitures. Les accidents enregistrés (notés nbaccid) sont classés selon 3 facteurs : alcool : absorption d alcool avant l accident (0=non, 1=oui) ; ceint : usage de la ceinture de sécurité au moment de l accident (0=non, 1=oui) ; bles : gravité des blessures (1=pas de blessure, 2=blessures légères, 3=blessures sérieuses et 4=blessures très graves ou fatales). Le croisement de ces 3 facteurs donne une table de contingence à 16 cellules. On veut étudier la répartition des accidents de la route selon les 3 facteurs. On met alors en œuvre sur ces données un modèle log-linéaire à 3 facteurs croisés. 1. Copiez la table SAS suivante accid.sas7bdat. Indications : Elle comprend 16 observations correspondant aux 16 combinaisons possibles entre les 3 facteurs et 4 colonnes (les 3 facteurs dans l ordre cité ci-dessus, et le nombre d accidents par cellule). 2. Quelle est la variable réponse? Quelles sont les variables explicatives? Quel est l objectif de cette modélisation? Eléments de réponse : On met en œuvre un modèle log-linéaire à 3 facteurs croisés pour modéliser le nombre d accidents de la route (variable réponse) selon les 3 facteurs (variables explicatives) : consommation d alcool avant l accident, usage de la ceinture de sécurité et gravité des blessures. L objectif de cette modélisation est d étudier la répartition du nombre d accidents de la route selon chaque facteur, et de détecter d éventuelles dépendances/interactions entre ces facteurs. Par exemple, la gravité des blessures est-elle corrélée à la consommation d alcool et au port de la ceinture? (Attention, on n étudie pas ici les effets de facteurs sur la présence ou non d un accident). 3. Estimez le modèle saturé en utilisant la procédure GENMOD (avec l option type3 vue à l exemple précédent). Commentez ces premiers résultats. Eléments de réponse : On met en œuvre le modèle saturé à 3 facteurs croisés, contenant toutes les interactions possibles, par la procédure GENMOD : proc genmod data=sasuser.accid ; class alcool ceint bles ; model nbaccid = alcool ceint bles / dist=poisson link=log type3 ; run; Nous obtenons les estimations du modèle saturé contenant au total 16 paramètres. Dans un premier temps, on étudie les effets de chaque composante selon les statistiques de test du rapport de vraisemblance (de type 3) : Statistique LR pour Analyse de Type 3 Source DDL Khi-2 Pr > Khi-2 alcool <.0001 ceint <.0001 alcool*ceint <.0001 bles <.0001 alcool*bles <.0001 ceint*bles alcool*ceint*bles On observe que l interaction d ordre 3 n est pas significative (p-value= 0.17 > 0.05). En revanche, toutes les interactions d ordre 2 ainsi que les effets de chaque facteur sont significatifs 6

7 (p-value< 0.05). Dans une prochaine étape, on pourra donc supprimer l interaction d ordre 3 et estimer le modèle d association homogène. 4. Dans ce modèle saturé, on estime que l interaction entre les facteurs Ceinture et Blessures est significative (p-value = ), alors que les paramètres associés à cette interaction ne sont pas significativement non-nuls (p-value > 0.50). Comment expliquez-vous cela? Eléments de réponse : Les paramètres estimés correspondent à l écart entre un niveau (ou une cellule), et le dernier niveau (ou la dernière cellule) qui sert de référence. Par exemple, le paramètre associé à alcool=0 égal à mesure l écart entre les accidents sans consommation d alcool (codé 0) et avec (codé 1, pris pour référence selon la paramétrage SAS). Si le facteur étudié a plusieurs niveaux, il se peut que les paramètres estimés soient nuls, indiquant que les premiers niveaux ne sont pas significativement différents du dernier niveau. En revanche, il se peut qu il y ait des différences entre d autres niveaux, mais cela n est pas directement observable avec le paramétrage SAS. C est ce qui se passe avec l interaction entre les facteurs ceinture et blessure, il n y a pas de différence par rapport à la dernière cellule, mais il doit y en avoir entre d autres cellules. Si on détecte un effet significatif pour un facteur, cela signifie qu il y a des différences entre au moins 2 niveaux de ce facteur. 5. En adoptant une démarche descendante logique (suppression des interactions non significatives, puis des facteurs non significatifs si possible), trouvez le meilleur modèle expliquant le nombre d accidents. Commentez. Eléments de réponse : On a montré à la question 4 que l interaction d ordre 3 n était pas significative. On peut donc estimer le modèle d association homogène contenant les effets des 3 facteurs et les 3 interactions d ordre 2. L analyse de type 3 permettant de tester l effet de chaque composante montre que toutes les composantes sont très significatives (p-value< ). Statistique LR pour Analyse de Type 3 Source DDL Khi-2 Pr > Khi-2 alcool <.0001 ceint <.0001 bles <.0001 alcool*ceint <.0001 ceint*bles <.0001 alcool*bles <.0001 Par ailleurs, on peut comparer ce modèle avec le modèle saturé selon les critères AIC et BIC : pour le modèle saturé : Critères d évaluation de l adéquation Critère DDL Valeur Valeur/DDL Deviance Scaled Deviance Pearson Chi-Square Scaled Pearson X Log Likelihood Full Log Likelihood AIC (smaller is better) AICC (smaller is better). BIC (smaller is better)

8 pour le modèle d association homogène : Critères d évaluation de l adéquation Critère DDL Valeur Valeur/DDL Deviance Scaled Deviance Pearson Chi-Square Scaled Pearson X Log Likelihood Full Log Likelihood AIC (smaller is better) AICC (smaller is better) BIC (smaller is better) On observe que les critères AIC et BIC sont plus faibles pour le modèle sans l interaction 3. De plus, la déviance du modèle d association homogène est inférieure à 3, montrant un bon ajustement du modèle aux données. 6. Pour compléter les résultats du modèle sélectionné, utilisez la procédure FREQ pour obtenir les tris croisés entre 2 facteurs correspondant aux interactions significatives. Synthétisez l ensemble de ces résultats pour caractériser les accidents de la route selon les 3 facteurs étudiés. Eléments de réponse : L analyse par modèle log-linéaire à 3 facteurs croisés montre des dépendances deux-à-deux entre les facteurs, ainsi qu un effet de chaque facteur (modèle d association homogène). Pour commenter ces résutats, on s appuie sur les tableaux croisés entre 2 facteurs. Globalement, les accidents sont en majorité survenus : sans port de la ceinture de sécurité (84.0%) (à l époque de l étude, le port de la ceinture n était pas obligatoire) et sans consommation d alcool (94%). On observe que 90.8% des accidents n ont pas occasionné de blessures, 5.4% des blessures légères, 3.5% des blessures sérieuses et 0.4% des blessures fatales. La proportion de conducteurs sans ceinture augmente avec la gravité des blessures : de 83.7% pour les accidents sans blessure, jusqu à 87.8% pour les accidents avec blessures graves. Plus les accidents sont graves, plus la proportion de conducteurs ayant consommé de l alcool est importante : de 5.5% pour les accidents sans blessure, jusqu à 20.3% pour les accidents avec blessures graves. La proportion de personnes avec ceinture est deux fois moins importante quand la personne a consommé de l alcool : 16.5% contre 7.1%. En conclusion, on a pu montrer que les blessures sont aggravées par le non-port de la ceinture de sécurité et par la consommation d alcool. 8

Régression logistique ou modèle binomial

Régression logistique ou modèle binomial Résumé Régression logistique ou modèle binomial Introduction au modèle linéaire et modèle linéaire général : la régression logistique ou modèle binomial Retour au plan du cours 1 Introduction Dans ce chapitre,

Plus en détail

Données qualitatives, modèles probit et logit

Données qualitatives, modèles probit et logit Données qualitatives, modèles probit et logit I Un modèle pour données qualitatives Cette section est fortement inspirée du cours de Christophe Hurlin. On est confronté à des données qualitatives en micro-économie

Plus en détail

La régression logistique. Par Sonia NEJI et Anne-Hélène JIGOREL

La régression logistique. Par Sonia NEJI et Anne-Hélène JIGOREL La régression logistique Par Sonia NEJI et Anne-Hélène JIGOREL Introduction La régression logistique s applique au cas où: Y est qualitative à 2 modalités Xk qualitatives ou quantitatives Le plus souvent

Plus en détail

REGRESSION LOGISTIQUE ASSURES BELGES

REGRESSION LOGISTIQUE ASSURES BELGES REGRESSION LOGISTIQUE ASSURES BELGES Cte étude concerne l assurance automobile. L échantillon est constitué de 1106 assurés belges observés en 1992 répartis en deux groupes. Les assurés qui n ont eu aucun

Plus en détail

La régression logistique généralisée avec la procédure LOGISTIC

La régression logistique généralisée avec la procédure LOGISTIC La régression logistique généralisée avec la procédure LOGISTIC 1 Sommaire I / Régression logistique généralisée 3 a. Introduction 3 b. Présentation de l exemple à étudier 3 II / Modélisation avec la proc

Plus en détail

EXEMPLE : FAILLITE D ENTREPRISES

EXEMPLE : FAILLITE D ENTREPRISES EXEMPLE : FAILLITE D ENTREPRISES Cet exemple a pour objectif d étudier la faillite d entreprises. Les données proviennent de l ouvrage de R.A.Johnson et D.W Wichern : «Applied Multivariate Statistical

Plus en détail

Cours (8) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012. Test du Khi 2

Cours (8) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012. Test du Khi 2 Test du Khi 2 Le test du Khi 2 (khi deux ou khi carré) fournit une méthode pour déterminer la nature d'une répartition, qui peut être continue ou discrète. Domaine d application du test : Données qualitatives

Plus en détail

X1 = Cash flow/ Dette totale. X2 = Revenu net / Total des actifs au bilan. X3 = Actif réalisable et disponible / Passif courant

X1 = Cash flow/ Dette totale. X2 = Revenu net / Total des actifs au bilan. X3 = Actif réalisable et disponible / Passif courant EXEMPLE : FAILLITE D ENTREPRISES Cet exemple a pour objectif d étudier la faillite d entreprises. Les données proviennent de l ouvrage de R.A.Johnson et D.W Wichern : Applied Multivariate Statistical Analysis»,

Plus en détail

Économétrie 2 : données qualitatives, probit et logit

Économétrie 2 : données qualitatives, probit et logit URCA Hugo Harari-Kermadec 2008-2009 harari@ecogest.ens-cachan.fr Économétrie 2 : données qualitatives, probit et logit I Un modèle pour données qualitatives Cette section est fortement inspirée du cours

Plus en détail

T de Student Khi-deux Corrélation

T de Student Khi-deux Corrélation Les tests d inférence statistiques permettent d estimer le risque d inférer un résultat d un échantillon à une population et de décider si on «prend le risque» (si 0.05 ou 5 %) Une différence de moyennes

Plus en détail

Séance 8 : Régression Logistique

Séance 8 : Régression Logistique Séance 8 : Régression Logistique Sommaire Proc LOGISTIC : Régression logistique... 2 Exemple commenté : Achat en (t+1) à partir du sexe et du chiffre d affaires de la période précédente. 4 La régression

Plus en détail

Exemple 7.7 : Modèles multiniveaux de croissance expliquant le soutien social perçu par les élèves

Exemple 7.7 : Modèles multiniveaux de croissance expliquant le soutien social perçu par les élèves Exemple 7.7 : Modèles multiniveaux de croissance expliquant le soutien social perçu par les élèves Modèle 1 (modèle vide) : GET FILE='C:\Users\Desktop\donnees stats\soutien.sav'. DATASET ACTIVATE Ensemble_de_données2.

Plus en détail

STAT0162-1 Analyse statistique de données qualitatives et quantitatives en sciences sociales. Transparents Philippe Lambert

STAT0162-1 Analyse statistique de données qualitatives et quantitatives en sciences sociales. Transparents Philippe Lambert STAT0162-1 Analyse statistique de données qualitatives et quantitatives en sciences sociales Transparents Philippe Lambert http : //www.statsoc.ulg.ac.be/quali.html Institut des Sciences Humaines et Sociales

Plus en détail

TESTS STATISTIQUES: COMPARAISON, INDÉPENDANCE ET RÉGRESSION LINÉAIRE

TESTS STATISTIQUES: COMPARAISON, INDÉPENDANCE ET RÉGRESSION LINÉAIRE TESTS STATISTIQUES: COMPARAISON, INDÉPENDANCE ET RÉGRESSION LINÉAIRE Les résultats donnés par R et SAS donnent les valeurs des tests, la valeur-p ainsi que les intervalles de confiance. TEST DE COMPARAISON

Plus en détail

Aurélien VESIN - Institut Albert Bonniot Grenoble (Version du 02/2012)

Aurélien VESIN - Institut Albert Bonniot Grenoble (Version du 02/2012) La régression de Poisson Théorie et Applications SAS Albert Bonniot Grenoble (Version du 02/2012) Introduction Principe : Modéliser une variable discrète positive En principe un nombre de quelque chose

Plus en détail

ASI (L2) : TP3 Calculs probabilistes avec Excel et Rstat

ASI (L2) : TP3 Calculs probabilistes avec Excel et Rstat ASI (L2) : TP3 Calculs probabilistes avec Excel et Rstat Objectifs du TP : Savoir utiliser Excel et Rstat pour calculer des moyennes pondérées, des variances pondérées et savoir faire des approximations

Plus en détail

Analyse de la variance Comparaison de plusieurs moyennes

Analyse de la variance Comparaison de plusieurs moyennes Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction

Plus en détail

Introduction à l analyse quantitative

Introduction à l analyse quantitative Introduction à l analyse quantitative Vue d ensemble du webinaire Le webinaire sera enregistré. Les diapositives et tous les autres documents seront envoyés aux participants après la séance. La séance

Plus en détail

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

Protocole d étude de l évaluation des résultats des centres de FIV 2011 1. -Activité 2011-

Protocole d étude de l évaluation des résultats des centres de FIV 2011 1. -Activité 2011- Protocole d étude Evaluation des résultats des centres de FIV -Activité 2011- Contexte Depuis 2005, l Agence de la biomédecine a pour mission de suivre et d évaluer les activités cliniques et biologiques

Plus en détail

Analyse statistique de données qualitatives et quantitatives en sciences sociales : TP RÉGRESSION LOGISTIQUE (MODÈLES CHAPITRE 1)

Analyse statistique de données qualitatives et quantitatives en sciences sociales : TP RÉGRESSION LOGISTIQUE (MODÈLES CHAPITRE 1) Analyse statistique de données qualitatives et quantitatives en sciences sociales : TP RÉGRESSION LOGISTIQUE (MODÈLES CHAPITRE 1) Modèles de régression logistique à réaliser Une explicative catégorielle

Plus en détail

Correction de l épreuve de Statistiques et Informatique appliquées à la Psychologie

Correction de l épreuve de Statistiques et Informatique appliquées à la Psychologie Université de Bretagne Occidentale Année Universitaire 2013-2014 U.F.R. de Lettres et Sciences Humaines CS 93837-29238 BREST CEDEX 3 Section : Psychologie - Licence 3è année Enseignant responsable : F.-G.

Plus en détail

Les variables indépendantes catégorielles

Les variables indépendantes catégorielles Les variables indépendantes catégorielles Jean-François Bickel Statistique II SP08 Jusqu à maintenant, nous avons considéré comme variables indépendantes uniquement des variables intervalles (âge) ou traitées

Plus en détail

Cours 9 08/11/2011. Les tableaux croisés et le test d indépendance du Chi-deux

Cours 9 08/11/2011. Les tableaux croisés et le test d indépendance du Chi-deux Cours 9 Les tableaux croisés et le test d indépendance du Chi-deux 1 Retour sur TP1 et Cours 8 Les tableaux croisés et le test du Chi-deux Utilité, postulats d utilisation et logique Exemple de calcul

Plus en détail

Endettement des jeunes adultes

Endettement des jeunes adultes Département fédéral de l'intérieur DFI Office fédéral de la statistique OFS 20 Situation économique et sociale de la population Neuchâtel, Août 2012 Endettement des jeunes adultes Analyses complémentaires

Plus en détail

Régression de Poisson

Régression de Poisson ZHANG Mudong & LI Siheng & HU Chenyang 21 Mars, 2013 Plan Composantes des modèles Estimation Qualité d ajustement et Tests Exemples Conclusion 2/25 Introduction de modèle linéaire généralisé La relation

Plus en détail

EXEMPLE D UTILISATION DE LA PROCEDURE CATMOD ALIMENTATION DES ALLIGATORS

EXEMPLE D UTILISATION DE LA PROCEDURE CATMOD ALIMENTATION DES ALLIGATORS EXEMPLE D UTILISATION DE LA PROCEDURE CATMOD ALIMENTATION DES ALLIGATORS Le tableau provient d une étude concernant les facteurs influençant le choix de la nourriture principale d alligators. L échantillon

Plus en détail

Didacticiel - Études de cas

Didacticiel - Études de cas Objectif Mesurer l importance de la relation entre deux variables nominales. Pour quantifier le lien existant entre deux variables continues, nous utilisons généralement le coefficient de corrélation.

Plus en détail

Analyse des données individuelles groupées

Analyse des données individuelles groupées Analyse des données individuelles groupées Analyse des Temps de Réponse Le modèle mixte linéaire (L2M) Y ij, j-ième observation continue de l individu i (i = 1,, N ; j =1,, n) et le vecteur des réponses

Plus en détail

CNAM 2002-2003 2léments de cours Bonus-malus et Crédibilité

CNAM 2002-2003 2léments de cours Bonus-malus et Crédibilité 1 CNAM 2002-2003 2léments de cours Bonus-malus et Crédibilité Une situation fréquente en pratique est de disposer non pas d un résultat mais de plusieurs. Le cas se présente en assurance, par exemple :

Plus en détail

Louis-André Vallet (CNRS) Laboratoire de Sociologie Quantitative, CREST, UMR 2773 CNRS & INSEE

Louis-André Vallet (CNRS) Laboratoire de Sociologie Quantitative, CREST, UMR 2773 CNRS & INSEE Utiliser le modèle log-linéaire pour mettre au jour la structure du lien entre les deux variables d un tableau de contingence : un exemple d application à la mobilité sociale Louis-André Vallet (CNRS)

Plus en détail

Simulation d un système d assurance automobile

Simulation d un système d assurance automobile Simulation d un système d assurance automobile DESSOUT / PLESEL / DACHI Plan 1 Introduction... 2 Méthodes et outils utilisés... 2.1 Chaines de Markov... 2.2 Méthode de Monte Carlo... 2.3 Méthode de rejet...

Plus en détail

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

NOTE SUR LA MODELISATION DU RISQUE D INFLATION NOTE SUR LA MODELISATION DU RISQUE D INFLATION 1/ RESUME DE L ANALYSE Cette étude a pour objectif de modéliser l écart entre deux indices d inflation afin d appréhender le risque à très long terme qui

Plus en détail

Estimation et tests statistiques, TD 5. Solutions

Estimation et tests statistiques, TD 5. Solutions ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études

Plus en détail

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction

Plus en détail

Résultats d Etude. L étude de marché. Résultats d Etude. Testez la fiabilité de votre projet. Juin 2013. N 1674 : Transactions Paypal

Résultats d Etude. L étude de marché. Résultats d Etude. Testez la fiabilité de votre projet. Juin 2013. N 1674 : Transactions Paypal Résultats d Etude N 1674 : Transactions Paypal L étude de marché Testez la fiabilité de votre projet 1 Sommaire : Introduction... 3 Synthèse... 5 PAGE 3 :... 6 Question 3/7... 6 Quel(s) type(s) de vente(s)

Plus en détail

VI. Tests non paramétriques sur un échantillon

VI. Tests non paramétriques sur un échantillon VI. Tests non paramétriques sur un échantillon Le modèle n est pas un modèle paramétrique «TESTS du CHI-DEUX» : VI.1. Test d ajustement à une loi donnée VI.. Test d indépendance de deux facteurs 96 Différentes

Plus en détail

Traitement des données avec EXCEL 2007

Traitement des données avec EXCEL 2007 Traitement des données avec EXCEL 2007 Vincent Jalby Octobre 2010 1 Saisie des données Les données collectées sont saisies dans une feuille Excel. Chaque ligne correspond à une observation (questionnaire),

Plus en détail

TD de statistique : tests du Chi 2

TD de statistique : tests du Chi 2 TD de statistique : tests du Chi 2 Jean-Baptiste Lamy 6 octobre 2008 1 Test du Chi 2 C est l équivalent de la comparaison de moyenne, mais pour les variables qualitatives. 1.1 Cas 1 : comparer les répartitions

Plus en détail

Chapitre 3. Les distributions à deux variables

Chapitre 3. Les distributions à deux variables Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles

Plus en détail

Enquête.sba Procédure Tableaux croisés

Enquête.sba Procédure Tableaux croisés Enquête.sba Procédure Tableaux croisés Tris croisés p. 27 «Cette procédure est conçue pour le calcul et l édition massive de tableaux croisés. On obtient à partir de cette procédure des tableaux de contingence,

Plus en détail

16. Comment introduire les valeurs prises par la variable SPORT pour les 30 premiers sujets introduits dans L2?

16. Comment introduire les valeurs prises par la variable SPORT pour les 30 premiers sujets introduits dans L2? T.P. 5 partie 1 Variable ordinale Calcul manuel de quantiles Utilisation des fonctions intégrées de la TI-84 Utilisation du programme D1 (Corrigé pour 30 cas) V. Prise en compte de 30 cas (pour éviter

Plus en détail

Statistiques Appliquées Rôle des femmes dans la société

Statistiques Appliquées Rôle des femmes dans la société Statistiques Appliquées Rôle des femmes dans la société Denis Schelling Semestre d automne 2012 Résumé A partir de données concernant le rôle des femmes dans la société, nous avons effectué une analyse

Plus en détail

STATISTIQUES. Cours I : Test d hypothèses. Télécom Physique Strasbourg Module 2101. Fabrice Heitz. Octobre 2014

STATISTIQUES. Cours I : Test d hypothèses. Télécom Physique Strasbourg Module 2101. Fabrice Heitz. Octobre 2014 Télécom Physique Strasbourg Module 2101 STATISTIQUES Cours I : Test d hypothèses Fabrice Heitz Octobre 2014 Fabrice Heitz (Télécom PS) Statistiques 2014 1 / 75 Cours I TESTS D HYPOTHÈSES Fabrice Heitz

Plus en détail

Activité 1 : échantillonnage

Activité 1 : échantillonnage Activité échantillonnage, intervalle de fluctuation, prise de décision (à partir d un même thème) Les trois activités qui suivent s inspirent du document «ressources pour la classe de première générale

Plus en détail

Les statistiques en biologie expérimentale

Les statistiques en biologie expérimentale Les statistiques en biologie expérimentale Qualités attendues d une méthode de quantification : Le résultat numérique de la mesure permet d estimer avec précision la grandeur mesurée (ex. : il lui est

Plus en détail

Introduction aux modèles mixtes Comparaison de k moyennes à partir d échantillons non indépendants. 27 mai 2009 Pierre INGRAND

Introduction aux modèles mixtes Comparaison de k moyennes à partir d échantillons non indépendants. 27 mai 2009 Pierre INGRAND Introduction aux modèles mixtes Comparaison de k moyennes à partir d échantillons non indépendants 27 mai 2009 Pierre INGRAND Position du problème. Exemple On cherche à comparer la réponse pharmacologique

Plus en détail

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences

Plus en détail

STATISTICA Test d hypothèseshè

STATISTICA Test d hypothèseshè TEST D HYPOTHESES STATISTICA Test d hypothèseshè TEST D HYPOTHESES Les étapes : Problématique Revue de la littérature Formulation d une hypothèse théorique Construction de l expérience (méthodologie) Lister

Plus en détail

STATISTIQUES A UNE VARIABLE EXERCICES CORRIGES

STATISTIQUES A UNE VARIABLE EXERCICES CORRIGES STATISTIQUES A UNE VARIALE EXERCICES CORRIGES Exercice n Les élèves d une classe ont obtenu les notes suivantes lors d un devoir : Note 4 5 8 0 4 5 8 0 Effectif 4 7 6 4 ) Déterminer l étendue et le mode

Plus en détail

Document d orientation sur les allégations issues d essais de non-infériorité

Document d orientation sur les allégations issues d essais de non-infériorité Document d orientation sur les allégations issues d essais de non-infériorité Février 2013 1 Liste de contrôle des essais de non-infériorité N o Liste de contrôle (les clients peuvent se servir de cette

Plus en détail

Analyse de la variance à deux facteurs

Analyse de la variance à deux facteurs 1 1 IRMA, Université Louis Pasteur Strasbourg, France Master 1 Psychologie du développement 06-10-2008 Contexte Nous nous proposons d analyser l influence du temps et de trois espèces ligneuses d arbre

Plus en détail

Exercice n 9 : Ne pas confondre observer et expérimenter

Exercice n 9 : Ne pas confondre observer et expérimenter Le pronostic des cancers du sein dépend de divers facteurs, dont la taille du cancer. En France, au cours d une étude, il a été observé un taux de survie plus important chez les femmes ayant un cancer

Plus en détail

«Cours Statistique et logiciel R»

«Cours Statistique et logiciel R» «Cours Statistique et logiciel R» Rémy Drouilhet (1), Adeline Leclercq-Samson (1), Frédérique Letué (1), Laurence Viry (2) (1) Laboratoire Jean Kuntzmann, Dép. Probabilites et Statistique, (2) Laboratoire

Plus en détail

Mortalité observée et mortalité attendue au cours de la vague de chaleur de juillet 2006 en France métropolitaine

Mortalité observée et mortalité attendue au cours de la vague de chaleur de juillet 2006 en France métropolitaine Mortalité observée et mortalité attendue au cours de la vague de chaleur de uillet en France métropolitaine FOUILLET A 1, REY G 1, JOUGLA E, HÉMON D 1 1 Inserm, U75, Villeuif, France. Inserm CépiDc, IFR9,

Plus en détail

Présentation rapide du logiciel Epi Info

Présentation rapide du logiciel Epi Info Présentation rapide du logiciel Epi Info Loïc Desquilbet, PhD Département des Productions Animales et de Santé Publique Ecole Nationale Vétérinaire d Alfort ldesquilbet@vet-alfort.fr Tutoriel Epi Info

Plus en détail

Cours 7 : Exemples. I- Régression linéaire simple II- Analyse de variance à 1 facteur III- Tests statistiques

Cours 7 : Exemples. I- Régression linéaire simple II- Analyse de variance à 1 facteur III- Tests statistiques Cours 7 : Exemples I- Régression linéaire simple II- Analyse de variance à 1 facteur III- Tests statistiques Exemple 1 : On cherche à expliquer les variations de y par celles d une fonction linéaire de

Plus en détail

La régression logistique

La régression logistique La régression logistique Présentation pour le cours SOL6210, Analyse quantitative avancée Claire Durand, 2015 1 Utilisation PQuand la variable dépendante est nominale ou ordinale < Deux types selon la

Plus en détail

Simulation Examen de Statistique Approfondie II **Corrigé **

Simulation Examen de Statistique Approfondie II **Corrigé ** Simulation Examen de Statistique Approfondie II **Corrigé ** Ces quatre exercices sont issus du livre d exercices de François Husson et de Jérôme Pagès intitulé Statistiques générales pour utilisateurs,

Plus en détail

TOUTE UNE VIE prévoir, aider, transmettre dans une société de longue vie

TOUTE UNE VIE prévoir, aider, transmettre dans une société de longue vie TOUTE UNE VIE prévoir, aider, transmettre dans une société de longue vie METHODOLOGIE I. Enquêtes utilisées Cette édition de BPCE L Observatoire s appuie notamment sur deux enquêtes : Une étude quantitative

Plus en détail

UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2013 2014 MATHS/STATS. 1 Généralités sur les tests statistiques 2

UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2013 2014 MATHS/STATS. 1 Généralités sur les tests statistiques 2 UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2013 2014 Master d économie Cours de M. Desgraupes MATHS/STATS Document 4 : Les tests statistiques 1 Généralités sur les tests

Plus en détail

Module 2 29 Décembre 2009 Intervenant: Dhuin STATISTIQUES

Module 2 29 Décembre 2009 Intervenant: Dhuin STATISTIQUES STATISTIQUES I. Séries statistiques simples... 1 A. Définitions... 1 1. Population... 1 2. Caractère statistique... 1 B. Séries classées / représentations graphiques.... 2 1. Séries classées... 2 2. Représentations

Plus en détail

Master 1 de Psychologie du Travail et des Organisations : Recueil et analyse des données - Corrigés des T.D. ( 2014/2015) -

Master 1 de Psychologie du Travail et des Organisations : Recueil et analyse des données - Corrigés des T.D. ( 2014/2015) - Dominique Ferrieux - Université Paul Valéry - Montpellier III Master de Psychologie du Travail et des Organisations : Recueil et analyse des données - Corrigés des T.D. ( /) - Deuxième partie : Plans :

Plus en détail

Christophe Fournier. Clinique de Thuys. Aunége - Christophe Fournier

Christophe Fournier. Clinique de Thuys. Aunége - Christophe Fournier Christophe Fournier Clinique de Thuys Aunége - Christophe Fournier 2 Table des matières Information sur l'échantillon 3 Structure de l'échantillon...4 Point méthodologique 6 Point méthodologique...7 Représentativité

Plus en détail

LE RÔLE DE LA STATISTIQUE DANS UN PROCESSUS DE PRISE DE DÉCISION

LE RÔLE DE LA STATISTIQUE DANS UN PROCESSUS DE PRISE DE DÉCISION LE RÔLE DE LA STATISTIQUE DANS UN PROCESSUS DE PRISE DE DÉCISION Sylvie Gervais Service des enseignements généraux École de technologie supérieure (sylvie.gervais@etsmtl.ca) Le laboratoire des condensateurs

Plus en détail

Analyse de l évolution de la structure des ménages dans l enquête sur le budget des ménages

Analyse de l évolution de la structure des ménages dans l enquête sur le budget des ménages Analyse de l évolution de la structure des ménages dans l enquête sur le budget des ménages S. Winandy, R. Palm OCA GxABT/ULg oca.gembloux@ulg.ac.be décembre 2011 1 Introduction La Direction Générale Statistique

Plus en détail

UTFPR. Nada Benlahbib. [DATA MINING] Fertility Data Set

UTFPR. Nada Benlahbib. [DATA MINING] Fertility Data Set UTFPR [DATA MINING] Fertility Data Set Sommaire Introduction... 2 1. Description de la base de données... 3 1.1. Origine de la base... 3 1.2. Description des attributs... 3 1.3. Exploration des données...

Plus en détail

Travaux Dirigés de Probabilités - Statistiques, TD 4. Lois limites ; estimation.

Travaux Dirigés de Probabilités - Statistiques, TD 4. Lois limites ; estimation. Travaux Dirigés de Probabilités - Statistiques, TD 4 Lois limites ; estimation. Exercice 1. Trois machines, A, B, C fournissent respectivement 50%, 30%, 20% de la production d une usine. Les pourcentages

Plus en détail

Relation entre deux variables : estimation de la corrélation linéaire

Relation entre deux variables : estimation de la corrélation linéaire CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence

Plus en détail

Utilisation du logiciel Excel pour des analyses simples de bases données

Utilisation du logiciel Excel pour des analyses simples de bases données Utilisation du logiciel Excel pour des analyses simples de bases données Catherine Raux (interne Santé Publique) et Benoît Lepage (AHU), Service d Epidémiologie du CHU de Toulouse Version 1.1 Avril 2012

Plus en détail

Annexe commune aux séries ES, L et S : boîtes et quantiles

Annexe commune aux séries ES, L et S : boîtes et quantiles Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans

Plus en détail

Recensement de la population

Recensement de la population Recensement de la population Ménages et familles 1. Définition des concepts Un ménage Un ménage regroupe l ensemble des occupants d une résidence principale, qu ils aient ou non des liens de parenté. Un

Plus en détail

Traitement des données avec Microsoft EXCEL 2010

Traitement des données avec Microsoft EXCEL 2010 Traitement des données avec Microsoft EXCEL 2010 Vincent Jalby Septembre 2012 1 Saisie des données Les données collectées sont saisies dans une feuille Excel. Chaque ligne correspond à une observation

Plus en détail

5. Validité de la méta-analyse

5. Validité de la méta-analyse 5. Validité de la méta-analyse 5.1. Poids de la preuve d une méta-analyse Le poids de la preuve d un résultat scientifique quantifie le degré avec lequel ce résultat s approche de la réalité. Il ne s agit

Plus en détail

Régression logistique ou modèle binomial

Régression logistique ou modèle binomial 1 Régression logistique ou modèle binomial Résumé Régression logistique ou modèle binomial Rappels sur la régression logistique ou modèle binomial du modèle linéaire général. Définition de la notion de

Plus en détail

Introduction à Rcommander

Introduction à Rcommander Introduction à Rcommander Pauline Scherdel Septembre 2014 Table des matières 1 Introduction à Rcmdr sous R 2 2 Interagir avec R 3 3 Installer et charger le package Rcmdr sous R 3 4 Importation des données

Plus en détail

Niveau. Situation étudiée. Type d activité. Durée. Objectifs. Seconde.

Niveau. Situation étudiée. Type d activité. Durée. Objectifs. Seconde. Simuler des expériences aléatoires avec une calculatrice Niveau Seconde. Situation étudiée Différentes selon les séances : Séance 1 : Jeu de pile ou face, tirages de boule dans une urne avec des proportions

Plus en détail

Normalité des rendements?

Normalité des rendements? Normalité des rendements? Daniel Herlemont 31 mars 2011 Table des matières 1 Introduction 1 2 Test de Normalité des rendements 2 3 Graphiques quantile-quantile 2 4 Estimation par maximum de vraisemblance

Plus en détail

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur

Plus en détail

Lycée Fénelon Sainte-Marie Préparation Science-Po/Prépa HEC

Lycée Fénelon Sainte-Marie Préparation Science-Po/Prépa HEC Lycée Fénelon Sainte-Marie Préparation Science-Po/Prépa HEC Dénombrement et probabilités Version du juillet 05 Enoncés Exercice - YouTube Sur YouTube, les vidéos sont identifiées à l aide d une chaîne

Plus en détail

TD de Statistiques - Séance N 2

TD de Statistiques - Séance N 2 TD de Statistiques - Séance N 2 1 Travail sur des variables catégorisées avec Excel 1.1 Quelques commandes d'excel utiles pour la saisie de données Saisie "assistée" ou non : utilisez le menu :Fichier

Plus en détail

Quelques modèles logistiques polytomiques

Quelques modèles logistiques polytomiques Quelques modèles logistiques polytomiques L. Rouvière laurent.rouviere@univ-rennes2.fr JANVIER 2015 L. Rouvière (Rennes 2) 1 / 35 1 Introduction 2 Le modèle saturé 3 Le modèle de régression logistique

Plus en détail

L essentiel sur les tests statistiques

L essentiel sur les tests statistiques L essentiel sur les tests statistiques 21 septembre 2014 2 Chapitre 1 Tests statistiques Nous considérerons deux exemples au long de ce chapitre. Abondance en C, G : On considère une séquence d ADN et

Plus en détail

SY09 Rapport TP4 : Analyse discriminante, régression logistique

SY09 Rapport TP4 : Analyse discriminante, régression logistique UNIVERSITÉ DE TECHNOLOGIE DE COMPIÈGNE SY09 Rapport TP4 : Analyse discriminante, régression logistique CUNI Frédéric 15 juin 2015 Objectifs du TP : Le but de ce TP est l application de l analyse discriminante

Plus en détail

Séance 1 : Prise en main de STATA CORRECTION. http://www.worldvaluessurvey.org/wvs.jsp. Allouer la mémoire nécessaire pour pouvoir ouvrir la base

Séance 1 : Prise en main de STATA CORRECTION. http://www.worldvaluessurvey.org/wvs.jsp. Allouer la mémoire nécessaire pour pouvoir ouvrir la base Marianne Tenand - TD d introduction à STATA Département d économie de l ENS (2015 2016) Séance 1 : Prise en main de STATA CORRECTION Base de données : World Values Survey (WWS) Issue d un projet de recherche

Plus en détail

Le Saux Loïc Tanguy Brewal. Enquête d opinion sur la dégradation de la qualité de la télévision française dans le temps

Le Saux Loïc Tanguy Brewal. Enquête d opinion sur la dégradation de la qualité de la télévision française dans le temps Le Saux Loïc Tanguy Brewal Enquête d opinion sur la dégradation de la qualité de la télévision française dans le temps Traitement des enquêtes M1 ISC 2007/2008 Sommaire Introduction... 3 I ANALYSE DESCRIPTIVE

Plus en détail

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE UE4 : Biostatistiques Chapitre 6 Test de comparaison de pourcentages χ² José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Nature des variables

Plus en détail

TP 1. Introduction au logiciel SAS Analyse Statistique Univariée

TP 1. Introduction au logiciel SAS Analyse Statistique Univariée IMIS : Master 1 Université Paris Est Marne la Vallée TP 1. Introduction au logiciel SAS Analyse Statistique Univariée 1. Premier contact avec SAS 1. Lancez le logiciel sas. Vous voyez apparaître les fenètres

Plus en détail

L analyse Factorielle des correspondances. 1/ Préambule descriptif de l AFC

L analyse Factorielle des correspondances. 1/ Préambule descriptif de l AFC L analyse Factorielle des correspondances...2 1/ Préambule descriptif de l AFC...2 Exemples de types de données que l AFC peut aborder:...2 Quelques types de tableaux traités par l AFC...3 2/ Exercice

Plus en détail

Description simple d une base de données

Description simple d une base de données Description simple d une base de données Sommaire I. Estimation des principaux paramètres de la statistique descriptive : moyenne, écart-type, pourcentage... 1 II. Les Graphiques dans Excel 2007... 3 A.

Plus en détail

GUIDE D AIDE STATISTIQUE A LA PREPARATION DE LA THESE

GUIDE D AIDE STATISTIQUE A LA PREPARATION DE LA THESE Département Universitaire de Recherche et d Enseignement en Médecine Générale GUIDE D AIDE STATISTIQUE A LA PREPARATION DE LA THESE Enseignants : Esther GUERY, Julien LE BRETON, Emilie FERRAT, Jacques

Plus en détail

Loi normale ou loi de Laplace-Gauss

Loi normale ou loi de Laplace-Gauss LivreSansTitre1.book Page 44 Mardi, 22. juin 2010 10:40 10 Loi normale ou loi de Laplace-Gauss I. Définition de la loi normale II. Tables de la loi normale centrée réduite S il y avait une seule loi de

Plus en détail

Estimation de la variance à l aide des poids de bootstrap Guide de l usager du programme BOOTVARF_V30.SAS (VERSION 3.0)

Estimation de la variance à l aide des poids de bootstrap Guide de l usager du programme BOOTVARF_V30.SAS (VERSION 3.0) Estimation de la variance à l aide des poids de bootstrap Guide de l usager du programme BOOTVARF_V30.SAS (VERSION 3.0) 1. Introduction Ce guide s adresse aux utilisateurs du programme SAS BOOTVARF_V30.SAS

Plus en détail

Introduction au modèle linéaire général

Introduction au modèle linéaire général Résumé Introductions au modèle linéaire général Retour au plan du cours Travaux pratiques 1 Introduction L objet de ce chapitre est d introduire le cadre théorique global permettant de regrouper tous les

Plus en détail

REGRESSION MULTIPLE: CONSOMMATION D ELECTRICITE

REGRESSION MULTIPLE: CONSOMMATION D ELECTRICITE REGRESSION MULTIPLE: CONSOMMATION D ELECTRICITE LES DONNEES OBS KW SURFACE PERS PAVILLON AGE VOL SBAINS 1 4805 130 4 1 65 410 1 2 3783 123 4 1 5 307 2 3 2689 98 3 0 18 254 1 4 5683 178 6 1 77 570 3 5 3750

Plus en détail

Test d indépendance de deux variables qualitatives (Chi2) Rapport de chances et Odds-ratio

Test d indépendance de deux variables qualitatives (Chi2) Rapport de chances et Odds-ratio Université Paris Ouest - Nanterre La Défense Master M1 SES Enquêtes et méthodes d analyses quantitatives A.K. FERMIN et C. Hardouin Test d indépendance de deux variables qualitatives (Chi2) Rapport de

Plus en détail

Informations importantes

Informations importantes Informations importantes Dernière semaine de cours (semaine du 12 au 16 décembre) Lundi 12 décembre, cours avec T. Mout en F111 (8h30-10h30: groupe1; 10h30-12h30: groupe 2): séance sur l examen de l an

Plus en détail

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,

Plus en détail

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Chapitre 5 UE4 : Biostatistiques Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.

Plus en détail