Feuille de TP N 3 : Modèle log-linéaire - Travail guidé. 1 Cancers : modèle log-linéaire à deux facteurs croisés
|
|
- Camille Chabot
- il y a 8 ans
- Total affichages :
Transcription
1 M1 MLG Année Feuille de TP N 3 : Modèle log-linéaire - Travail guidé 1 Cancers : modèle log-linéaire à deux facteurs croisés Ce premier exercice reprend l exercice 1 de la feuille de TD n 3. Les données sont extraites du registre des cancers du Tarn. Elles concernent des patients ayant déclaré un cancer entre 1982 et L objet de cette analyse est d étudier le nombre de cancers en fonction de la localisation du cancer et du sexe du patient ; pour cela, on met en œuvre un modèle log-linéaire à 2 facteurs croisés. 1. Copiez la table SAS cancer (envoyée par mail). La table contient les variables suivantes : la localisation (notée loc), à 3 niveaux : A = Voies digestives ; B = Peau ; C = Organes génitaux et voies urinaires le sexe (noté sexe) : 1 = Femme / 2 = Homme, le nombre de patients (noté n). Vérifiez son contenu. Eléments de réponse : La table cancer contient 6 observations correspondant aux 6 combinaisons possibles entre la localisation (A, B ou C) et le sexe (Homme/Femme). La variable n fournit le nombre de patients atteints de cancers répartis selon la localisation du cancer et le sexe du patient. 2. Affichez la table de contingence à l aide de la procédure FREQ. Etant donné le format de la table SAS (données regroupées par localisation et par sexe), vous devez utiliser l instruction weight (qui attribue à chaque cellule un poids égal à n) : proc freq data=... ; weight n ; tables loc * sexe / chisq ; run; Commentez ce tableau croisé. Eléments de réponse : Le test d indépendance du Khi-2 est significatif (p-value= 0.03) montrant une dépendance significative entre les 2 facteurs. En commentant les profils-lignes et les profilscolonnes, on peut en déduire que : Chez les femmes, les cancers de type A et C sont les plus fréquents (respectivement, 48% et 39%), contrairement aux cancers de type B (12%). Chez les hommes, la fréquence des cancers de type B est similaire (11.7%). En revanche, les cancers de type C sont plus présents (47%) que chez les femmes au détriment des cancers de type C (41%). Globalement, sur l ensemble de l échantillon, il y a 59% de femmes : cette proportion est plus élevée parmi les cancers de type A (63%) que parmi les cancers de type C (54%). 3. Lancez la procédure GENMOD pour estimer le modèle saturé de la façon suivante : 1
2 proc genmod data=... ; class loc sexe ; model n = loc sexe / dist=poisson link=log; run; Note : en spécifiant loc sexe en variables explicatives, cela revient à spécifier loc sexe loc*sexe, c est-à-dire le modèle avec interactions (saturé). A partir des informations détaillées sur les sorties de la procédure GENMOD, suivez les commentaires sur les résultats obtenus : Informations sur le modèle Informations sur le modèle Data Set (A) Distribution (B) Link Function (C) Dependent Variable (D) SASUSER.CANCER Poisson Log n Number of Observations Read (E) 6 Number of Observations Used (E) 6 Informations sur le niveau de classe (F) Classe Niveaux Valeurs loc 3 A B C sexe (A) Table / Data set : table SAS utilisée dans la procédure. (B) Distribution : distribution de la variable réponse. Dans le cas d un modèle log-linéaire, on modélise un nombre d évènements, distribué selon une loi de Poisson, comme spécifié dans le code de la procédure par dist. (C) Link function : Fonction de lien associée à la loi de Poisson : fonction ln, comme mentionné dans le code de la procédure par link. (D) Dependent variable : variable réponse que l on cherche à expliquer par ce modèle, c est le nombre d évènements observés. (E) Nombre d observations lues/utilisées : Nombre d observations lues et utilisées pour l analyse. Le nombre d observations utilisées peut être inférieur au nombre d observations lues en cas de valeur manquante. Par défaut, SAS supprime les observations manquantes ou incomplètes. Le nombre d observations correspond au nombre de lignes dans la table SAS ; ici, c est le nombre de combinaisons possibles obtenues en croisant tous les facteurs. (F) Level information : liste les facteurs pris en compte dans le modèle, spécifiés comme variable qualitative dans l instruction CLASS. SAS y précise le nombre de niveaux de chaque facteur et les valeurs de ces niveaux. Ajustement global du modèle Critères d évaluation de l adéquation Critère DDL (K) Valeur (L) Valeur/DDL (M) Deviance (G)
3 Scaled Deviance (I) Pearson Chi-Square (H) Scaled Pearson X2 (I) Log Likelihood (J) Algorithm converged. L ajustement du modèle est mesuré selon plusieurs critères : la Deviance (G) qui mesure l écart entre l ajustement du modèle saturé et celui du modèle estimé, et la statistique du Khi-deux de Pearson (H) qui compare les effectifs observés avec les effectifs prédits par le modèle estimé. Ces critères sont nuls pour le modèle saturé, dont l ajustement est parfait (y i = ŷ i ). (I) Scaled Deviance et Scaled Pearson X2 : ces critères sont issus des deux critères précédents. Dans le cas où la distribution de la variable réponse ne dépend que d un seul paramètre, ces critères sont égaux aux précédents. Ce n est pas le cas si on estime un paramètre lié à la variance. (J) Log likelihood : donne la valeur de la log-vraisemblance. (K) DF : donne le nombre de degrés de liberté du modèle = nombre d observations (de cellules) - nombre de paramètres estimés. Le DDL du modèle saturé est nul puisque le nombre de paramètres estimés dans un modèle saturé est égal au nombre d observations. (L) Value : donne la valeur de chaque critère. (M) Value/DF : calcule la valeur des critères divisée par le nombre de degrés de liberté. Par exemple, pour la déviance, on obtient la déviance relative. C est grâce à cette colonne que l on peut juger de la qualité d ajustement du modèle estimé. Plus les valeurs relatives sont proches de 1, meilleur est l ajustement du modèle. Une déviance relative inférieure à 3 indique un bon ajustement. Un mauvais ajustement du modèle est associé à une déviance relative élevée (> 10). Estimations des paramètres Paramètres estimés par l analyse du maximum de vraisemblance Intervalle de Valeur Erreur confiance de Khi-2 Paramètre (N) DDL (O) estimée (P) type (Q) Wald à 95 % (R) de Wald (S) Pr > Khi-2 (S) Intercept <.0001 loc A loc B <.0001 loc C sexe sexe loc*sexe A loc*sexe A loc*sexe B loc*sexe B loc*sexe C loc*sexe C Scale Ce tableau donne les estimations des paramètres du modèle selon le paramétrage SAS et teste la nullité de chaque paramètre. Attention ce tableau ne donne pas les résultats des tests sur l effet de chaque composante du modèle. 3
4 (N) Paramètre / Parameter : donne la liste de tous les niveaux des facteurs et de toutes les interactions entre facteurs, spécifiés dans la procédure. Selon le paramétrage SAS, les paramètres associés aux derniers niveaux sont nuls, car le dernier niveau sert de référence. (O) DDL / DF : nombre de degrés de liberté associé au test de nullité d un paramètre : 1 si le paramètre est estimé, 0 si le paramètre est fixé à 0 selon le paramétrage SAS (pour les derniers niveaux). (P) Valeur estimée / estimate : donne les valeurs des paramètres estimés. Dans le cas du modèle log-linéaire, les variables explicatives sont des facteurs pour lesquels on n estime pas un seul paramètre comme c est le cas pour une variable explicative quantitative, mais on en estime un par niveau du facteur (-1). Chaque paramètre associé à un niveau ou à une cellule représente l écart entre ce niveau et le dernier niveau (de référence), ou entre cette cellule et la dernière cellule. (Q) Erreur Type / Standard errors : donne les erreurs standard de chaque paramètre estimé, permettant d évaluer la précision des estimations. Ils sont utilisés pour calculer les intervalles de confiance de chaque paramètre, et la statistique de Wald pour tester la nullité de chaque paramètre. (S) Khi-2 de Wald et Pr>Khi-2 / Chi-square et Pr>Chisq : donne, pour chaque paramètre, la valeur de la statistique de test de Wald et la p-value associée, pour tester l hypothèse de nullité du paramètre (sachant que d autres variables explicatives sont dans le modèle). On compare la p-value au risque 5%. Si la p-value est inférieure à 5%, on rejette H 0 et on conclut que le paramètre est significativement différent de 0, c est-à-dire que le niveau testé est significativement différent du niveau de référence. Synthèse des résultats : Etant donné que l on estime le modèle saturé, les critères de qualité d ajustement (Déviance et Chi-2 de Pearson) sont nuls. Ce modèle fournit le meilleur ajustement possible. Les paramètres estimés montrent que certains d entre eux sont significativement différents de 0, indiquant un effet du facteur Localisation et des interactions significatives. Par exemple, on observe que le paramètre associé à Loc=B est estimé à , indiquant que la fréquence des cancers de type B est plus basse que celle des cancers de type C. On observe également un paramètre d interaction élevé pour Loc=A et Sexe=1 suggérant que les cancers de type A sont sur-représentés chez les femmes. A souligner que l on retrouve dans ce tableau les paramètres nuls associés aux derniers niveaux de chaque facteur, selon les contraintes du paramétrage SAS. Toutefois cette syntaxe de base ne permet pas de juger de l effet de chaque composante du modèle, d où la question suivante. 4. Dans l instruction model, rajoutez l option type3. Quel est son effet? Interprétez. Eléments de réponse : L option type3 affiche un nouveau tableau LR Statistics for type 3 analysis permettant de juger de l effet de chaque composante (facteur / interaction) en se basant la statistique du rapport de vraisemblance. On teste l absence d effet de chaque composante (correspondant à H 0 ) en comparant le modèle estimé avec le modèle sous H 0 (ne contenant pas la composante). Une p-value inférieure à 5% indique un effet significatif de la composante ; plus la p-value est faible, plus l effet de la composante est fort. 4
5 Statistique LR pour Analyse de Type 3 Source DDL Khi-2 Pr > Khi-2 loc <.0001 sexe <.0001 loc*sexe On détecte ici un effet très significatif de la localisation et du sexe (p-value< ), mais aussi une interaction significative entre les 2 facteurs (p-value= 0.03). On retrouve les résultats du test d absence d interaction sur la sortie de la procédure FREQ (sous la ligne du test du Chi-2). Très important! Cette option n est pas optionnelle : il est obligatoire d afficher ce tableau pour juger de l effet de chaque composante, sous cette forme (associée à la statistique du rapport de vraisemblance) ou sous la forme suivante (correspondant au test de Wald). 5. Même question pour l option type3 wald. Eléments de réponse : L option type3 wald donne les mêmes résultats que l option précédente, mais les tests sont basés sur la statistique de Wald. On en déduit les mêmes effets significatifs. 6. Relancez la procédure GENMOD pour le modèle d indépendance (en spécifiant uniquement loc et sexe comme variables explicatives). Comparez ces résultats au modèle saturé et commentez. Eléments de réponse : Le modèle d indépendance ne contient plus les termes d interaction. On observe à nouveau des effets très significatifs de chaque facteur (p-value < ), mais les critères AIC et BIC sont plus élevés, respectivement et 54.75, alors qu ils valent et pour le modèle saturé. Cela est logique puisqu en retirant des interactions significatives, on perd en qualité d ajustement. 7. Concluez. Eléments de réponse : Pour conclure, on a mis en évidence que les cancers n étaient pas répartis de façon équiprobable selon le sexe (plus de femmes atteintes) et selon la localisation (moins de cancers de la peau). On a également montré que la répartition des cancers selon la localisation n est pas la même chez les hommes et chez les femmes. En effet, les femmes sont plus touchées par les cancers sur voies digestives, alors chez les hommes, ce sont les cancers sur voies urinaires et appareils génitaux qui sont les plus fréquents. 5
6 2 Accidents : modèle log-linéaire à trois facteurs croisés Les données traitées ici concernent des accidents de voitures. Les accidents enregistrés (notés nbaccid) sont classés selon 3 facteurs : alcool : absorption d alcool avant l accident (0=non, 1=oui) ; ceint : usage de la ceinture de sécurité au moment de l accident (0=non, 1=oui) ; bles : gravité des blessures (1=pas de blessure, 2=blessures légères, 3=blessures sérieuses et 4=blessures très graves ou fatales). Le croisement de ces 3 facteurs donne une table de contingence à 16 cellules. On veut étudier la répartition des accidents de la route selon les 3 facteurs. On met alors en œuvre sur ces données un modèle log-linéaire à 3 facteurs croisés. 1. Copiez la table SAS suivante accid.sas7bdat. Indications : Elle comprend 16 observations correspondant aux 16 combinaisons possibles entre les 3 facteurs et 4 colonnes (les 3 facteurs dans l ordre cité ci-dessus, et le nombre d accidents par cellule). 2. Quelle est la variable réponse? Quelles sont les variables explicatives? Quel est l objectif de cette modélisation? Eléments de réponse : On met en œuvre un modèle log-linéaire à 3 facteurs croisés pour modéliser le nombre d accidents de la route (variable réponse) selon les 3 facteurs (variables explicatives) : consommation d alcool avant l accident, usage de la ceinture de sécurité et gravité des blessures. L objectif de cette modélisation est d étudier la répartition du nombre d accidents de la route selon chaque facteur, et de détecter d éventuelles dépendances/interactions entre ces facteurs. Par exemple, la gravité des blessures est-elle corrélée à la consommation d alcool et au port de la ceinture? (Attention, on n étudie pas ici les effets de facteurs sur la présence ou non d un accident). 3. Estimez le modèle saturé en utilisant la procédure GENMOD (avec l option type3 vue à l exemple précédent). Commentez ces premiers résultats. Eléments de réponse : On met en œuvre le modèle saturé à 3 facteurs croisés, contenant toutes les interactions possibles, par la procédure GENMOD : proc genmod data=sasuser.accid ; class alcool ceint bles ; model nbaccid = alcool ceint bles / dist=poisson link=log type3 ; run; Nous obtenons les estimations du modèle saturé contenant au total 16 paramètres. Dans un premier temps, on étudie les effets de chaque composante selon les statistiques de test du rapport de vraisemblance (de type 3) : Statistique LR pour Analyse de Type 3 Source DDL Khi-2 Pr > Khi-2 alcool <.0001 ceint <.0001 alcool*ceint <.0001 bles <.0001 alcool*bles <.0001 ceint*bles alcool*ceint*bles On observe que l interaction d ordre 3 n est pas significative (p-value= 0.17 > 0.05). En revanche, toutes les interactions d ordre 2 ainsi que les effets de chaque facteur sont significatifs 6
7 (p-value< 0.05). Dans une prochaine étape, on pourra donc supprimer l interaction d ordre 3 et estimer le modèle d association homogène. 4. Dans ce modèle saturé, on estime que l interaction entre les facteurs Ceinture et Blessures est significative (p-value = ), alors que les paramètres associés à cette interaction ne sont pas significativement non-nuls (p-value > 0.50). Comment expliquez-vous cela? Eléments de réponse : Les paramètres estimés correspondent à l écart entre un niveau (ou une cellule), et le dernier niveau (ou la dernière cellule) qui sert de référence. Par exemple, le paramètre associé à alcool=0 égal à mesure l écart entre les accidents sans consommation d alcool (codé 0) et avec (codé 1, pris pour référence selon la paramétrage SAS). Si le facteur étudié a plusieurs niveaux, il se peut que les paramètres estimés soient nuls, indiquant que les premiers niveaux ne sont pas significativement différents du dernier niveau. En revanche, il se peut qu il y ait des différences entre d autres niveaux, mais cela n est pas directement observable avec le paramétrage SAS. C est ce qui se passe avec l interaction entre les facteurs ceinture et blessure, il n y a pas de différence par rapport à la dernière cellule, mais il doit y en avoir entre d autres cellules. Si on détecte un effet significatif pour un facteur, cela signifie qu il y a des différences entre au moins 2 niveaux de ce facteur. 5. En adoptant une démarche descendante logique (suppression des interactions non significatives, puis des facteurs non significatifs si possible), trouvez le meilleur modèle expliquant le nombre d accidents. Commentez. Eléments de réponse : On a montré à la question 4 que l interaction d ordre 3 n était pas significative. On peut donc estimer le modèle d association homogène contenant les effets des 3 facteurs et les 3 interactions d ordre 2. L analyse de type 3 permettant de tester l effet de chaque composante montre que toutes les composantes sont très significatives (p-value< ). Statistique LR pour Analyse de Type 3 Source DDL Khi-2 Pr > Khi-2 alcool <.0001 ceint <.0001 bles <.0001 alcool*ceint <.0001 ceint*bles <.0001 alcool*bles <.0001 Par ailleurs, on peut comparer ce modèle avec le modèle saturé selon les critères AIC et BIC : pour le modèle saturé : Critères d évaluation de l adéquation Critère DDL Valeur Valeur/DDL Deviance Scaled Deviance Pearson Chi-Square Scaled Pearson X Log Likelihood Full Log Likelihood AIC (smaller is better) AICC (smaller is better). BIC (smaller is better)
8 pour le modèle d association homogène : Critères d évaluation de l adéquation Critère DDL Valeur Valeur/DDL Deviance Scaled Deviance Pearson Chi-Square Scaled Pearson X Log Likelihood Full Log Likelihood AIC (smaller is better) AICC (smaller is better) BIC (smaller is better) On observe que les critères AIC et BIC sont plus faibles pour le modèle sans l interaction 3. De plus, la déviance du modèle d association homogène est inférieure à 3, montrant un bon ajustement du modèle aux données. 6. Pour compléter les résultats du modèle sélectionné, utilisez la procédure FREQ pour obtenir les tris croisés entre 2 facteurs correspondant aux interactions significatives. Synthétisez l ensemble de ces résultats pour caractériser les accidents de la route selon les 3 facteurs étudiés. Eléments de réponse : L analyse par modèle log-linéaire à 3 facteurs croisés montre des dépendances deux-à-deux entre les facteurs, ainsi qu un effet de chaque facteur (modèle d association homogène). Pour commenter ces résutats, on s appuie sur les tableaux croisés entre 2 facteurs. Globalement, les accidents sont en majorité survenus : sans port de la ceinture de sécurité (84.0%) (à l époque de l étude, le port de la ceinture n était pas obligatoire) et sans consommation d alcool (94%). On observe que 90.8% des accidents n ont pas occasionné de blessures, 5.4% des blessures légères, 3.5% des blessures sérieuses et 0.4% des blessures fatales. La proportion de conducteurs sans ceinture augmente avec la gravité des blessures : de 83.7% pour les accidents sans blessure, jusqu à 87.8% pour les accidents avec blessures graves. Plus les accidents sont graves, plus la proportion de conducteurs ayant consommé de l alcool est importante : de 5.5% pour les accidents sans blessure, jusqu à 20.3% pour les accidents avec blessures graves. La proportion de personnes avec ceinture est deux fois moins importante quand la personne a consommé de l alcool : 16.5% contre 7.1%. En conclusion, on a pu montrer que les blessures sont aggravées par le non-port de la ceinture de sécurité et par la consommation d alcool. 8
Données longitudinales et modèles de survie
ANALYSE DU Données longitudinales et modèles de survie 5. Modèles de régression en temps discret André Berchtold Département des sciences économiques, Université de Genève Cours de Master ANALYSE DU Plan
Plus en détailT de Student Khi-deux Corrélation
Les tests d inférence statistiques permettent d estimer le risque d inférer un résultat d un échantillon à une population et de décider si on «prend le risque» (si 0.05 ou 5 %) Une différence de moyennes
Plus en détailModèles pour données répétées
Résumé Les données répétées, ou données longitudinales, constituent un domaine à la fois important et assez particulier de la statistique. On entend par données répétées des données telles que, pour chaque
Plus en détaildistribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position
Arbre de NESI distribution quelconque Signe 1 échantillon distribution symétrique non gaussienne Wilcoxon gaussienne Student position appariés 1 échantillon sur la différence avec référence=0 2 échantillons
Plus en détailTABLE DES MATIERES. C Exercices complémentaires 42
TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence
Plus en détailAnalyse statistique de données qualitatives et quantitatives en sciences sociales : TP RÉGRESSION LOGISTIQUE (MODÈLES CHAPITRE 1)
Analyse statistique de données qualitatives et quantitatives en sciences sociales : TP RÉGRESSION LOGISTIQUE (MODÈLES CHAPITRE 1) Modèles de régression logistique à réaliser Une explicative catégorielle
Plus en détailChapitre 6 Test de comparaison de pourcentages χ². José LABARERE
UE4 : Biostatistiques Chapitre 6 Test de comparaison de pourcentages χ² José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Nature des variables
Plus en détailUFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES
Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,
Plus en détailExercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015
Exercices M1 SES 214-215 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 215 Les exemples numériques présentés dans ce document d exercices ont été traités sur le logiciel R, téléchargeable par
Plus en détailIBM SPSS Regression 21
IBM SPSS Regression 21 Remarque : Avant d utiliser ces informations et le produit qu elles concernent, lisez les informations générales sous Remarques sur p. 46. Cette version s applique à IBM SPSS Statistics
Plus en détailTests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»
Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences
Plus en détailLogiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS
Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence
Plus en détailExemple PLS avec SAS
Exemple PLS avec SAS This example, from Umetrics (1995), demonstrates different ways to examine a PLS model. The data come from the field of drug discovery. New drugs are developed from chemicals that
Plus en détailAnalyse de la variance Comparaison de plusieurs moyennes
Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction
Plus en détailUne introduction. Lionel RIOU FRANÇA. Septembre 2008
Une introduction INSERM U669 Septembre 2008 Sommaire 1 Effets Fixes Effets Aléatoires 2 Analyse Classique Effets aléatoires Efficacité homogène Efficacité hétérogène 3 Estimation du modèle Inférence 4
Plus en détailChapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE
UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction
Plus en détailCONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un
Plus en détailEFFICACITÉ ET INNOCUITÉ D UN MÉDICAMENT CONTRE LA MPOC COMPARATIVEMENT À UN CONTRÔLE
MICHÈLE PICARD FLIBOTTE EFFICACITÉ ET INNOCUITÉ D UN MÉDICAMENT CONTRE LA MPOC COMPARATIVEMENT À UN CONTRÔLE Essai-stage présenté à la Faculté des études supérieures de l Université Laval dans le cadre
Plus en détailTests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE
Chapitre 5 UE4 : Biostatistiques Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.
Plus en détailPrincipe d un test statistique
Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre
Plus en détailUn exemple de régression logistique sous
Fiche TD avec le logiciel : tdr341 Un exemple de régression logistique sous A.B. Dufour & A. Viallefont Etude de l apparition ou non d une maladie cardiaque des coronaires 1 Présentation des données Les
Plus en détailRelation entre deux variables : estimation de la corrélation linéaire
CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence
Plus en détaildonnées en connaissance et en actions?
1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)
Plus en détail«Cours Statistique et logiciel R»
«Cours Statistique et logiciel R» Rémy Drouilhet (1), Adeline Leclercq-Samson (1), Frédérique Letué (1), Laurence Viry (2) (1) Laboratoire Jean Kuntzmann, Dép. Probabilites et Statistique, (2) Laboratoire
Plus en détailVI. Tests non paramétriques sur un échantillon
VI. Tests non paramétriques sur un échantillon Le modèle n est pas un modèle paramétrique «TESTS du CHI-DEUX» : VI.1. Test d ajustement à une loi donnée VI.. Test d indépendance de deux facteurs 96 Différentes
Plus en détailContents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes
Université Claude Bernard Lyon 1 Institut de Science Financière et d Assurances Système Bonus-Malus Introduction & Applications SCILAB Julien Tomas Institut de Science Financière et d Assurances Laboratoire
Plus en détailEstimation et tests statistiques, TD 5. Solutions
ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études
Plus en détailImputation du salaire d ego dans TeO
Imputation du salaire d ego dans TeO Objet de la note : linéariser la réponse en tranche du salaire, et imputer le salaire en cas de non réponse Champ et principe de la méthode Les individus qui se sont
Plus en détailCOMPARAISON DE LOGICIELS TESTANT L INDEPENDANCE DE VARIABLES BINAIRES
J. sci. pharm. biol., Vol.9, n - 00, pp. 9-0 EDUCI 00 9 VALLEE POLNEAU S.* DIAINE C. COMPARAISON DE LOGICIELS TESTANT L INDEPENDANCE DE VARIABLES BINAIRES Notre étude visait à comparer les résultats obtenus
Plus en détailExemples d application
AgroParisTech Exemples d application du modèle linéaire E Lebarbier, S Robin Table des matières 1 Introduction 4 11 Avertissement 4 12 Notations 4 2 Régression linéaire simple 7 21 Présentation 7 211 Objectif
Plus en détailNOTE SUR LA MODELISATION DU RISQUE D INFLATION
NOTE SUR LA MODELISATION DU RISQUE D INFLATION 1/ RESUME DE L ANALYSE Cette étude a pour objectif de modéliser l écart entre deux indices d inflation afin d appréhender le risque à très long terme qui
Plus en détailInfluence de la partition homme/femme et de l expériance kilométrique dans l assurance automobile
Influence de la partition homme/femme et de l expériance kilométrique dans l assurance automobile - Alexandre Mornet (Allianz, Université Lyon 1 Laboratoire SAF) - Patrick Leveillard (Allianz) - Stéphane
Plus en détailChapitre 3. Les distributions à deux variables
Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles
Plus en détailTABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.
STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,
Plus en détailNON-LINEARITE ET RESEAUX NEURONAUX
NON-LINEARITE ET RESEAUX NEURONAUX Vêlayoudom MARIMOUTOU Laboratoire d Analyse et de Recherche Economiques Université de Bordeaux IV Avenue. Leon Duguit, 33608 PESSAC, France tel. 05 56 84 85 77 e-mail
Plus en détailLE ROLE DES INCITATIONS MONETAIRES DANS LA DEMANDE DE SOINS : UNE EVALUATION EMPIRIQUE.
LE ROLE DES INCITATIONS MONETAIRES DANS LA DEMANDE DE SOINS : UNE EVALUATION EMPIRIQUE. Synthèse des travaux réalisés 1. Problématique La question D7 du plan d exécution du Programme National de Recherches
Plus en détailConstruction de bases biométriques pour l assurance dépendance. SCOR inform - Novembre 2012
Construction de bases biométriques pour l assurance dépendance SCOR inform - Novembre 2012 Construction de bases biométriques pour l assurance dépendance Auteur Laure de Montesquieu Responsable Centre
Plus en détailÉtude de cas Assurance (d après une étude de Philippe Périé, CISIA)
Étude de cas Assurance (d après une étude de Philippe Périé, CISIA) I.1.Les données L échantillon est constitué de 1106 assurés Belges observés en 1992 et répartis en 2 groupes. - les assurés qui n ont
Plus en détailArbres binaires de décision
1 Arbres binaires de décision Résumé Arbres binaires de décision Méthodes de construction d arbres binaires de décision, modélisant une discrimination (classification trees) ou une régression (regression
Plus en détailProtocoles DHCP et DNS
Protocoles DHCP et DNS DHCP (Dynamic Host Configuration Protocol) est un protocole qui permet à un serveur DHCP (Unix, Windows, AS400...) d'affecter des adresses IP temporaires (et d'autres paramètres)
Plus en détailINF6304 Interfaces Intelligentes
INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie
Plus en détailEvolution de la fréquence des sinistres 2003-2012 en assurance RC automobile
Evolution de la fréquence des sinistres 2003-2012 en assurance RC automobile Contenu 1. Nombre de sinistres en RC tourisme et affaires... 2 Fréquence des sinistres en RC tourisme et affaires... 2 Fréquence
Plus en détailIntroduction à l approche bootstrap
Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?
Plus en détailAnalyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés
Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent
Plus en détailEvolution de la fréquence des sinistres 2002-2011 en assurance RC automobile
Evolution de la fréquence des sinistres 2002-2011 en assurance RC automobile Contenu 1. Nombre de sinistres en RC tourisme et affaires... 2 Fréquence des sinistres en RC tourisme et affaires... 2 Fréquence
Plus en détailTP 03 B : Mesure d une vitesse par effet Doppler
TP 03 B : Mesure d une vitesse par effet Doppler Compétences exigibles : - Mettre en œuvre une démarche expérimentale pour mesurer une vitesse en utilisant l effet Doppler. - Exploiter l expression du
Plus en détailL aspect de votre logiciel a été modifié et reprend désormais la nouvelle charte graphique Sage.
Sage 100 Moyens de paiement Nouvelle charte graphique L aspect de votre logiciel a été modifié et reprend désormais la nouvelle charte graphique Sage. Intuisage L IntuiSage est une interface d accueil
Plus en détailt 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :
Terminale STSS 2 012 2 013 Pourcentages Synthèse 1) Définition : Calculer t % d'un nombre, c'est multiplier ce nombre par t 100. 2) Exemples de calcul : a) Calcul d un pourcentage : Un article coûtant
Plus en détailEXCEL et base de données
EXCEL et base de données 1. Variables et données 2. Saisie de données: quelques règles 3. EXCEL et saisie des données 4. Exemple de tableau EXCEL 5. Éviter d éventuels problèmes 1 1.1 Variables et données
Plus en détailTableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1
UN GROUPE D INDIVIDUS Un groupe d individus décrit par une variable qualitative binaire DÉCRIT PAR UNE VARIABLE QUALITATIVE BINAIRE ANALYSER UN SOUS-GROUPE COMPARER UN SOUS-GROUPE À UNE RÉFÉRENCE Mots-clés
Plus en détailCalc 2 Avancé. OpenOffice.org. Guide de formation avec exercices et cas pratiques. Philippe Moreau
OpenOffice.org Calc 2 Avancé Guide de formation avec exercices et cas pratiques Philippe Moreau Tsoft et Groupe Eyrolles, 2007, ISBN : 2-212-12036-2, ISBN 13 : 978-2-212-12036-3 4 - Plages de données 4
Plus en détailFluctuation d une fréquence selon les échantillons - Probabilités
Fluctuation d une fréquence selon les échantillons - Probabilités C H A P I T R E 3 JE DOIS SAVOIR Calculer une fréquence JE VAIS ÊTRE C APABLE DE Expérimenter la prise d échantillons aléatoires de taille
Plus en détailModélisation de la dépendance entre les garanties applicables en assurance automobile
RICHARD VERMETTE Modélisation de la dépendance entre les garanties applicables en assurance automobile Mémoire présenté à la Faculté des études supérieures de l Université Laval dans le cadre du programme
Plus en détailIntroduction au Data-Mining
Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme
Plus en détailOptimisation des ressources des produits automobile première
EURIA EURo Optimisation produits automobile première Pauline PERROT promotion 2011 EURIA EURo 1 ère partie : contexte MMA (FFSA) MAAF (GEMA) SGAM : COVEA (AFA) GMF (GEMA) MMA : Plus 3 millions clients
Plus en détailTraitement des données avec Microsoft EXCEL 2010
Traitement des données avec Microsoft EXCEL 2010 Vincent Jalby Septembre 2012 1 Saisie des données Les données collectées sont saisies dans une feuille Excel. Chaque ligne correspond à une observation
Plus en détailANTISELECTION ET CHOIX D'ASSURANCE : LE CAS DU VOL EN HABITATION UNE APPROCHE DE LA MESURE DU PHENOMENE
ANTISELECTION ET CHOIX D'ASSURANCE : LE CAS DU VOL EN HABITATION UNE APPROCHE DE LA MESURE DU PHENOMENE Yannick MACÉ Statisticien-Economiste Responsable du Secteur Analyses Techniques, Groupama (C.C.A.M.A.)
Plus en détailCours 9 : Plans à plusieurs facteurs
Cours 9 : Plans à plusieurs facteurs Table des matières Section 1. Diviser pour regner, rassembler pour saisir... 3 Section 2. Définitions et notations... 3 2.1. Définitions... 3 2.2. Notations... 4 Section
Plus en détailBaccalauréat ES Pondichéry 7 avril 2014 Corrigé
Baccalauréat ES Pondichéry 7 avril 204 Corrigé EXERCICE 4 points Commun à tous les candidats. Proposition fausse. La tangente T, passant par les points A et B d abscisses distinctes, a pour coefficient
Plus en détailMODELE A CORRECTION D ERREUR ET APPLICATIONS
MODELE A CORRECTION D ERREUR ET APPLICATIONS Hélène HAMISULTANE Bibliographie : Bourbonnais R. (2000), Econométrie, DUNOD. Lardic S. et Mignon V. (2002), Econométrie des Séries Temporelles Macroéconomiques
Plus en détailSAS ENTERPRISE MINER POUR L'ACTUAIRE
SAS ENTERPRISE MINER POUR L'ACTUAIRE Conférence de l Association des Actuaires I.A.R.D. 07 JUIN 2013 Sylvain Tremblay Spécialiste en formation statistique SAS Canada AGENDA Survol d Enterprise Miner de
Plus en détailLire ; Compter ; Tester... avec R
Lire ; Compter ; Tester... avec R Préparation des données / Analyse univariée / Analyse bivariée Christophe Genolini 2 Table des matières 1 Rappels théoriques 5 1.1 Vocabulaire....................................
Plus en détailAnalyse des correspondances avec colonne de référence
ADE-4 Analyse des correspondances avec colonne de référence Résumé Quand une table de contingence contient une colonne de poids très élevé, cette colonne peut servir de point de référence. La distribution
Plus en détailSTATISTIQUES. UE Modélisation pour la biologie
STATISTIQUES UE Modélisation pour la biologie 2011 Cadre Général n individus: 1, 2,..., n Y variable à expliquer : Y = (y 1, y 2,..., y n ), y i R Modèle: Y = Xθ + ε X matrice du plan d expériences θ paramètres
Plus en détailStatistique inférentielle TD 1 : Estimation
POLYTECH LILLE Statistique inférentielle TD : Estimation Exercice : Maîtrise Statistique des Procédés Une entreprise de construction mécanique fabrique de pièces demoteurdevoiturepourungrandconstructeur
Plus en détailUne variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants)
CIVILITE-SES.doc - 1 - Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants) 1 PRÉSENTATION DU DOSSIER CIVILITE On s intéresse
Plus en détailFeuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.
Université de Nantes Année 2013-2014 L3 Maths-Eco Feuille 6 : Tests Exercice 1 On cherche à connaître la température d ébullition µ, en degrés Celsius, d un certain liquide. On effectue 16 expériences
Plus en détailGender Directive Impacts opérationnels pour les assureurs
Gender Directive Impacts opérationnels pour les assureurs Conférence ActuariaCnam Présentation 3 1 / 0 5 / 2 0 1 2 Julien Chartier, Actuaire Manager AGENDA Introduction Partie 1 - L arrêt «Test-Achats»
Plus en détailINTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES
INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine
Plus en détailProgramme «maladie» - Partie II «Objectifs / Résultats» Objectif n 2 : développer la prévention
Programme «maladie» - Partie II «Objectifs / Résultats» Objectif n 2 : développer la prévention Indicateur n 2-3 : Indicateurs sur le dépistage du cancer 1 er sous-indicateur : taux de participation au
Plus en détailLE RÔLE DE LA STATISTIQUE DANS UN PROCESSUS DE PRISE DE DÉCISION
LE RÔLE DE LA STATISTIQUE DANS UN PROCESSUS DE PRISE DE DÉCISION Sylvie Gervais Service des enseignements généraux École de technologie supérieure (sylvie.gervais@etsmtl.ca) Le laboratoire des condensateurs
Plus en détailRésultats d Etude. L étude de marché. Résultats d Etude N 1889 : Conciergerie privée. Testez la fiabilité de votre projet.
Résultats d Etude L étude de marché Testez la fiabilité de votre projet 1 Sommaire : Introduction... 4 Synthèse... 6 PAGE 1 :... 7 Question 1/13... 7 Vous vivez :... 7 PAGE 2 :...10 Question 2/13...10
Plus en détailRapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/2011. 1.1 Présentation. 1.2 Ressources
Master Maths Finances 2010/2011 Data Mining janvier 2011 RapidMiner 1 Introduction 1.1 Présentation RapidMiner est un logiciel open source et gratuit dédié au data mining. Il contient de nombreux outils
Plus en détailMortalité observée et mortalité attendue au cours de la vague de chaleur de juillet 2006 en France métropolitaine
Mortalité observée et mortalité attendue au cours de la vague de chaleur de uillet en France métropolitaine FOUILLET A 1, REY G 1, JOUGLA E, HÉMON D 1 1 Inserm, U75, Villeuif, France. Inserm CépiDc, IFR9,
Plus en détailLa crise économique vue par les salariés français
La crise économique vue par les salariés français Étude du lien entre la performance sociale et le contexte socioéconomique Baggio, S. et Sutter, P.-E. La présente étude s intéresse au lien entre cette
Plus en détailDirection des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels
Etab=MK3, Timbre=G430, TimbreDansAdresse=Vrai, Version=W2000/Charte7, VersionTravail=W2000/Charte7 Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels
Plus en détailDisparités entre les cantons dans tous les domaines examinés
Office fédéral de la statistique Bundesamt für Statistik Ufficio federale di statistica Uffizi federal da statistica Swiss Federal Statistical Office EMBARGO: 02.05.2005, 11:00 COMMUNIQUÉ DE PRESSE MEDIENMITTEILUNG
Plus en détailEVALUATION DE LA QUALITE DES SONDAGES EN LIGNE : CAS D UN SONDAGE D OPINION AU BURKINA FASO
EVALUATION DE LA QUALITE DES SONDAGES EN LIGNE : CAS D UN SONDAGE D OPINION AU BURKINA FASO Auteur Baguinébié Bazongo 1 Ingénieur Statisticien Economiste Chef de l Unité de recherche à l Institut national
Plus en détailPrestations de conseil en SRM (Storage Ressource Management)
Prestations de conseil en SRM (Storage Ressource Management) Sommaire 1 BUTS DE LA PRESTATION 2 PRESENTATION DE LA PRESTATION 3 3 3 ETAPE 1 : ELEMENTS TECHNIQUES SUR LESQUELS S APPUIE LA PRESTATION DE
Plus en détailProjet SINF2275 «Data mining and decision making» Projet classification et credit scoring
Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems
Plus en détailExercices Corrigés Premières notions sur les espaces vectoriels
Exercices Corrigés Premières notions sur les espaces vectoriels Exercice 1 On considére le sous-espace vectoriel F de R formé des solutions du système suivant : x1 x 2 x 3 + 2x = 0 E 1 x 1 + 2x 2 + x 3
Plus en détailValeur verte des logements d après les bases Notariales BIEN et PERVAL Synthèse
Valeur verte des logements d après les bases Notariales BIEN et PERVAL Synthèse La valeur verte correspond à l augmentation de valeur 1 engendrée par la meilleure performance énergétique et environnementale
Plus en détailLe chi carré. Le sommaire. Approche quantitative
Approche quantitative Le chi carré Les objectifs pédagogiques Définir le test du chi carré Déterminer la nature des données propres au chi carré Savoir calculer le chi carré Savoir déterminer les fréquences
Plus en détailService des ressources informatiques - Conseil Scolaire de District Catholique Centre-Sud Page 1
Service des ressources informatiques - Conseil Scolaire de District Catholique Centre-Sud Page 1 Table des matières 1. Accéder au gestionnaire de notes... 3 2. Sélectionner une classe... 4 3. Première
Plus en détailEnquête auprès des parents
Projet Brosse à dents débutant Institut für Hygiene und Arbeitsphysiologie ETH-Zentrum, Clausiusstr. 25 8092 Zürich Adresse électronique: www_zahnbuerstenergonomie@web.ethz.ch Enquête auprès des parents
Plus en détailApproche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH
Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH Boris Hejblum 1,2,3 & Rodolphe Thiébaut 1,2,3 1 Inserm, U897
Plus en détailTravaux pratiques avec RapidMiner
Travaux pratiques avec RapidMiner Master Informatique de Paris 6 Spécialité IAD Parcours EDOW Module Algorithmes pour la Fouille de Données Janvier 2012 Prise en main Généralités RapidMiner est un logiciel
Plus en détail1 Définition de la non stationnarité
Chapitre 2: La non stationnarité -Testsdedétection Quelques notes de cours (non exhaustives) 1 Définition de la non stationnarité La plupart des séries économiques sont non stationnaires, c est-à-direqueleprocessusquiles
Plus en détailAnalyse de la bande passante
Analyse de la bande passante 1 Objectif... 1 2 Rappels techniques... 2 2.1 Définition de la bande passante... 2 2.2 Flux ascendants et descandants... 2 2.3 Architecture... 2 2.4 Bande passante et volumétrie...
Plus en détailCorefris RAPPORT ANNUEL 2011. Annexe 3 : La hausse des prix de l immobilier est-elle associée à une «bulle» de crédit en France?
Annexe 3 : La hausse des prix de l immobilier est-elle associée à une «bulle» de crédit en France? (DGTrésor) 1. Indépendamment de facteurs d offre et de demande, qui jouent indéniablement sur les prix,
Plus en détailIntroduction à la statistique non paramétrique
Introduction à la statistique non paramétrique Catherine MATIAS CNRS, Laboratoire Statistique & Génome, Évry http://stat.genopole.cnrs.fr/ cmatias Atelier SFDS 27/28 septembre 2012 Partie 2 : Tests non
Plus en détailLecture critique et pratique de la médecine
1-00.qxp 24/04/2006 11:23 Page 13 Lecture critique appliquée à la médecine vasculaireecture critique et pratique de la médecine Lecture critique et pratique de la médecine Introduction Si la médecine ne
Plus en détailCAISSE REGIONALE DU CREDIT AGRICOLE MUTUEL D AQUITAINE
CAISSE REGIONALE DU CREDIT AGRICOLE MUTUEL D AQUITAINE Eléments d appréciation du prix de rachat des CCI émis par la CRCAM d Aquitaine dans le cadre de l approbation par l'assemblée générale des sociétaires,
Plus en détailLa survie nette actuelle à long terme Qualités de sept méthodes d estimation
La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg
Plus en détailQue faire lorsqu on considère plusieurs variables en même temps?
Chapitre 3 Que faire lorsqu on considère plusieurs variables en même temps? On va la plupart du temps se limiter à l étude de couple de variables aléatoires, on peut bien sûr étendre les notions introduites
Plus en détailL allocataire dans un couple : l homme ou la femme?
L allocataire dans un couple : l homme ou la femme? par Alain Jacquot CNAF-Bureau des Prévisions Les CAF versent une trentaine de prestations (prestations familiales stricto sensu, aides au logement, et
Plus en détail