Découverte du logiciel Stata
|
|
- Fabien Lecompte
- il y a 7 ans
- Total affichages :
Transcription
1 Découverte du logiciel Stata Mesures et tests d association Christophe Lalanne
2 Synopsis Tests de comparaison de deux moyennes Tests de comparaison de k moyennes Tests de comparaison de deux proportions Analyse d un tableau de contingence Mesures d association en épidémiologie d2e5ca9 2 / 47
3 Données d illustration Enquête socio-économique allemande réalisée en 2009 : «GSOEP» (3). ybirth hhnr2009 sex mar edu yedu voc Données socio-démographiques année de naissance foyer résidentiel sexe statut marital niveau d éducation nombre d années de formation niveau secondaire ou université Emploi et revenu emp type d emploi egp catégorie socio professionnelle income revenus ( ) hhinc revenus du foyer ( ) Logement size hhsize taille du logement nombre de personnes dans habitation d2e5ca9 3 / 47
4 Fichier de données : gsoep09.dta. use data/gsoep09 (SOEP 2009 (Kohler/Kreuter)) Pré-traitements :. gen age = ybirth. mvdecode income, mv(0=.c) income: 1369 missing values generated. gen lincome = log(income) (2001 missing values generated) d2e5ca9 4 / 47
5 Tests de comparaison de deux moyennes d2e5ca9 5 / 47
6 Comparaison de deux moyennes Le test de Student, via la commande ttest, s utilise dans le cas des comparaisons de moyennes pour un échantillon (H 0 : µ = 0) ou deux échantillons (indépendants ou non). Illustration : le revenu moyen diffère-t-il selon le sexe?. bysort sex: summarize lincome > sex = Male Variable Obs Mean Std. Dev. Min Max lincome > sex = Female Variable Obs Mean Std. Dev. Min Max lincome d2e5ca9 6 / 47
7 . graph box lincome, over(sex) ytitle("income (log(2)") Income (log(2) Male Female d2e5ca9 7 / 47
8 Test de Student Statistics Summaries, tables, and tests Classical tests of hypotheses t test. ttest lincome, by(sex) Two-sample t test with equal variances Group Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] Male Female combined diff diff = mean(male) - mean(female) t = Ho: diff = 0 degrees of freedom = 3408 Ha: diff < 0 Ha: diff!= 0 Ha: diff > 0 Pr(T < t) = Pr( T > t ) = Pr(T > t) = d2e5ca9 8 / 47
9 Test de Student (bis) Sans supposer l égalité des variances parentes (correction de Satterthwaite, option unequal) (5) :. ttest lincome, by(sex) welch Two-sample t test with unequal variances Group Obs Mean Std. Err. Std. Dev. [95% Conf. Interval] Male Female combined diff diff = mean(male) - mean(female) t = Ho: diff = 0 Welch's degrees of freedom = Ha: diff < 0 Ha: diff!= 0 Ha: diff > 0 Pr(T < t) = Pr( T > t ) = Pr(T > t) = Si l on souhaite vraiment comparer deux variances, la commande sdtest offre la même syntaxe que ttest. d2e5ca9 9 / 47
10 Intervalles de confiance La commande ci permet de construire des intervalles de fluctuation pour un certain niveau de confiance (level()) :. bysort sex: ci lincome > sex = Male Variable Obs Mean Std. Err. [95% Conf. Interval] lincome > sex = Female Variable Obs Mean Std. Err. [95% Conf. Interval] lincome Commande additionnelle : mean (idem, utilisation de la loi normale pour les IC à 95 %). d2e5ca9 10 / 47
11 . mean lincome if sex == 1 Mean estimation Number of obs = Mean Std. Err. [95% Conf. Interval] lincome Manuellement :. local zc = 1-invnormal(0.95). display `zc'/2 * Si l on souhaite construire des intervalles de confiance basés sur une distribution de Student, on utilisera plutôt invt (tprob fournit les valeurs de probabilités au lieu des fractiles) :. display invt(1745, 0.975) * d2e5ca9 11 / 47
12 Alternative non-paramétrique Le test de Wilcoxon (différent de median) constitue une alternative non-paramétrique au test de Student.. ranksum lincome, by(sex) Two-sample Wilcoxon rank-sum (Mann-Whitney) test sex obs rank sum expected Male Female combined unadjusted variance 8.258e+08 adjustment for ties adjusted variance 8.258e+08 Ho: lincome(sex==male) = lincome(sex==female) z = Prob > z = d2e5ca9 12 / 47
13 Tests de comparaison de k moyennes d2e5ca9 13 / 47
14 Analyse de variance à un facteur L analyse de variance (ANOVA) est utilisée pour comparer plus de 2 moyennes (H 0 : µ 1 = µ 2 = = µ k ). Stata offre deux commandes (sans passer par le modèle linéaire) : oneway et anova. Illustration : le revenu moyen diffère-t-il selon le type d emploi?. recode egp (1/2=1) (3/5=2) (8/9=3) (15/18=.), /// gen ( egp4 ). label define egp4 1 " Service class 1/2" /// 2 "Non - manuals & self - employed " 3 " Manuals ". label values egp4 egp4 (4435 differences between egp and egp4) d2e5ca9 14 / 47
15 Distributions par groupe. histogram lincome, by(egp4, col(3)) freq Service class 1/2 Non manuals & self employed Manuals Frequency lincome Graphs by RECODE of egp (Social Class (EGP)) d2e5ca9 15 / 47
16 . twoway (kdensity lincome), by(egp4).8 Service class 1/2 Non manuals & self employed.6.4 kdensity lincome Manuals x Graphs by RECODE of egp (Social Class (EGP)) d2e5ca9 16 / 47
17 . graph box lincome, over(egp4) ytitle("income (log(2)") Income (log(2) Service class 1/2 Non manuals & self employed Manuals d2e5ca9 17 / 47
18 Moyennes conditionnelles. tabstat lincome, by(egp4) stats(mean sd count) Summary for variables: lincome by categories of: egp4 (RECODE of egp (Social Class (EGP))) egp4 mean sd N Service class 1/ Non-manuals & se Manuals Total d2e5ca9 18 / 47
19 Tableau d ANOVA Statistics Linear models and related ANOVA/MANOVA Oneway ANOVA. oneway lincome egp4 Analysis of Variance Source SS df MS F Prob > F Between groups Within groups Total Bartlett's test for equal variances: chi2(2) = Prob>chi2 = oneway [response_var] [factor_var] [if] [in] [, options] tabulate : affichage des moyennes, écarts-type et effectifs bonferroni : comparaison des paires de moyennes avec correction de Bonferroni d2e5ca9 19 / 47
20 Vérification des conditions d application indépendance des observations normalité des résidus égalité des variances (parentes) d2e5ca9 20 / 47
21 Normalité des résidus La commande swilk fournit le test de Shapiro-Wilks. Mais en règle générale, les méthodes graphiques sont préférables :. quietly: anova lincome egp4. predict r, resid. qnorm r (2356 missing values generated) 4 2 Residuals Inverse Normal d2e5ca9 21 / 47
22 Égalité des variances Stata fournit le résultat du test de Bartlett pour l égalité des variances avec la commande oneway. Le test de Levenne s obtient avec la commande robvar (W0) :. robvar lincome, by(egp4) RECODE of egp (Social Class Summary of lincome (EGP)) Mean Std. Dev. Freq Service c Non-manua Manuals Total W0 = df(2, 3052) Pr > F = W50 = df(2, 3052) Pr > F = W10 = df(2, 3052) Pr > F = d2e5ca9 22 / 47
23 Comparaison de paires de moyennes Option de correction pour les tests post-hoc : bonferroni, scheffe ou sidak.. oneway lincome egp4, bonferroni noanova Comparison of lincome by RECODE of egp (Social Class (EGP)) (Bonferroni) Row Mean- Col Mean Service Non-manu Non-manu Manuals On arrive à des conclusions similaires en appliquant la correction de Bonferroni sur les résultats de simples tests de Student.. quietly: ttest lincome if egp4!= 1, by(egp4). display r(p)* d2e5ca9 23 / 47
24 Alternative à oneway La commande oneway est limité au cas à un facteur explicatif. La commande anova est plus générale et couvre : les plans factoriels et emboîtés, les plans équilibrés ou non (cf. calcul des sommes de carrés), les mesures répétées, l analyse de covariance.. anova lincome egp4 Number of obs = 3055 R-squared = Root MSE = Adj R-squared = Source Partial SS df MS F Prob > F Model egp Residual Total d2e5ca9 24 / 47
25 Comparaisons multiples En utilisant anova, les comparaisons par paires de moyennes s obtiennent à l aide de pwcompare, commande plus générale que pwmean. Les options de correction (mcompare()) incluent en plus : tukey, snk, duncan et dunnett.. pwcompare egp4, cformat(%3.2f) Pairwise comparisons of marginal linear predictions Margins : asbalanced Unadjusted Contrast Std. Err. [95% Conf. Interval] egp4 Non-manuals & self-employed vs Service class 1/ Manuals vs Service class 1/ Manuals d2e5ca9 vs 25 / 47
26 Tests de comparaison de deux proportions d2e5ca9 26 / 47
27 Tests de proportion exact et approché Outre le test du χ 2 de Pearson dans le cas du croisement de deux variables binaires, Stata dispose des commandes bitest (test binomial) et prtest (test reposant sur l approximation normale). Dans le cas univarié, la variable binaire doit être codée en 0/1. Plusieurs types d intervalles de confiance sont disponibles (4). Illustration : distribution équilibrée des deux sexes dans l échantillon.. generate sexb = sex - 1. tabulate sexb sexb Freq. Percent Cum , , Total 5, d2e5ca9 27 / 47
28 Test binomial Statistics Summaries, tables, and tests Classical tests of hypotheses Proportion test. bitest sexb == 0.5 Variable N Observed k Expected k Assumed p Observed p sexb Pr(k >= 2826) = (one-sided test) Pr(k <= 2826) = (one-sided test) Pr(k <= 2585 or k >= 2826) = (two-sided test). ci sexb, binomial -- Binomial Exact -- Variable Obs Mean Std. Err. [95% Conf. Interval] sexb d2e5ca9 28 / 47
29 Test de proportion pour un échantillon Statistics Summaries, tables, and tests Classical tests of hypotheses Binomial probability test. prtest sexb == 0.5 One-sample test of proportion sexb: Number of obs = Variable Mean Std. Err. [95% Conf. Interval] sexb p = proportion(sexb) z = Ho: p = 0.5 Ha: p < 0.5 Ha: p!= 0.5 Ha: p > 0.5 Pr(Z < z) = Pr( Z > z ) = Pr(Z > z) = d2e5ca9 29 / 47
30 Test de proportion pour deux échantillons. generate egpb = egp4 == 1. prtest egpb, by(sexb) Two-sample test of proportions 0: Number of obs = : Number of obs = Variable Mean Std. Err. z P> z [95% Conf. Interval] diff under Ho: diff = prop(0) - prop(1) z = Ho: diff = 0 Ha: diff < 0 Ha: diff!= 0 Ha: diff > 0 Pr(Z < z) = Pr( Z > z ) = Pr(Z > z) = d2e5ca9 30 / 47
31 Commandes immédiates Plusieurs commandes Stata acceptent des formes «immédiates». prtesti # obs1 #p1 # obs2 #p2 [, levels (#) count ] Statistics Summaries, tables, and tests Classical tests of hypotheses Proportion test calculator. prtesti L option count permet de travailler avec les effectifs observés plutôt que des fréquences relatives. d2e5ca9 31 / 47
32 Analyse d un tableau de contingence d2e5ca9 32 / 47
33 Construction d un tableau 2x2 Statistics Summaries, tables, and tests Frequency tables Two-way table with measures of association La commande tabulate (twoway) permet de construire un tableau d effectifs ou de fréquences relatives et dispose d options pour les statistiques de Pearson et de Fisher (1).. tabulate sex egp4 RECODE of egp (Social Class (EGP)) Gender Service c Non-manua Manuals Total Male ,576 Female , Total 1, ,113 3,088 d2e5ca9 33 / 47
34 Profils ligne et colonne. tabulate sex egp4, row Key frequency row percentage RECODE of egp (Social Class (EGP)) Gender Service c Non-manua Manuals Total Male , Female , Total 1, ,113 3, d2e5ca9 34 / 47
35 Test d association du χ 2. tabulate sex egp4, chi RECODE of egp (Social Class (EGP)) Gender Service c Non-manua Manuals Total Male ,576 Female , Total 1, ,113 3,088 Pearson chi2(2) = Pr = d2e5ca9 35 / 47
36 Effectifs théoriques L option expected fournit les effectifs théoriques.. tabulate sex egp4, expected Key frequency expected frequency RECODE of egp (Social Class (EGP)) Gender Service c Non-manua Manuals Total Male , , Female , , Total 1, ,113 3,088 1, , ,088.0 d2e5ca9 36 / 47
37 Test exact de Fisher. tabulate sex egp4, exact Enumerating sample-space combinations: stage 3: enumerations = 1 stage 2: enumerations = 351 stage 1: enumerations = 0 RECODE of egp (Social Class (EGP)) Gender Service c Non-manua Manuals Total Male ,576 Female , Total 1, ,113 3,088 Fisher's exact = d2e5ca9 37 / 47
38 Mesures d association en épidémiologie d2e5ca9 38 / 47
39 Mesures de risque Statistics Epidemiology and related Tables for epidemiologists Stata offre une grande variété de tests d association et de mesures de risque classiquement utilisées en épidémiologie. d2e5ca9 39 / 47
40 Odds-ratio La commande tabodds s utilise dans le cas des études castémoins ou des études transversales. Elle permet de calculer l odds-ratio et son intervalle de confiance asymptotique (autre option : cornfield ou woolf), ainsi que tester l homogénéité des OR entre strates (test de Mantel-Haenszel). Autres commandes disponibles : cc et mcc (étude cas-témoins), ir (étude de cohorte). Toutes ces commandes disposent d une forme «immédiate» alternative. Manuel : [ST] epitab d2e5ca9 40 / 47
41 Données d illustration Étude sur les poids de naisssance (2). low poids de naissance < 2,5 kg age âge de la mère lwt poids de la mère (livres) aux dernières règles race ethnicité de la mère («w», «b», «o») smoke statut fumeur de la mère pendant la grossesse ht antécédent d hypertension ui présence d irritabilité utérine ftv nb de visites chez le gynécologue 1 er trimestre ptl nb d accouchements pré terme antérieurs bwt poids du bébé (grammes) d2e5ca9 41 / 47
42 . clear all. webuse lbw (Hosmer & Lemeshow data). list in 1/ id low age lwt race smoke ptl ht ui ftv bwt black nonsmoker other nonsmoker white smoker white smoker white smoker d2e5ca9 42 / 47
43 Calcul de l odds-ratio. tabodds low smoke, or smoke Odds Ratio chi2 P>chi2 [95% Conf. Interval] nonsmoker smoker Test of homogeneity (equal odds): chi2(1) = 4.90 Pr>chi2 = Score test for trend of odds: chi2(1) = 4.90 Pr>chi2 = d2e5ca9 43 / 47
44 . cc low smoke, woolf smoked during pregnancy Proportion Exposed Unexposed Total Exposed Cases Controls Total Point estimate [95% Conf. Interval] Odds ratio (Woolf) Attr. frac. ex (Woolf) Attr. frac. pop chi2(1) = 4.92 Pr>chi2 = d2e5ca9 44 / 47
45 Calcul du risque relatif. cs low smoke smoked during pregnancy Exposed Unexposed Total Cases Noncases Total Risk Point estimate [95% Conf. Interval] Risk difference Risk ratio Attr. frac. ex Attr. frac. pop chi2(1) = 4.92 Pr>chi2 = d2e5ca9 45 / 47
46 Références I 1. I Campbell. Chi-squared and Fisher-Irwin tests of two-by-two tables with small sample recommendations. Statistics in Medicine, 26(19) : , D Hosmer and S Lemeshow. Applied Logistic Regression. New York : Wiley, U Kohler and F Kreuter. Data Analysis Using Stata. College Station : Stata Press, RG Newcombe. Two-sided confidence intervals for the single proportion : comparison of seven methods. Statistics in Medicine, 17(8) : , BL Welch. On the comparison of several mean values : An alternative approach. Biometrika, 38 : , d2e5ca9 46 / 47
47 Index des commandes anova, 24 bitest, 28 bysort, 6, 10 cc, 44 ci, 10, 28 clear, 42 cs, 45 display, 11, 23 generate, 4, 27, 30 graph box, 7, 17 histogram, 15 invt, 11 kdensity, 16 label define, 14 label values, 14 list, 42 local, 11 log, 4 mean, 11 mvdecode, 4 normal, 11 oneway, 19, 23 predict, 21 prtest, 29, 30 prtesti, 31 pwcompare, 25 pwmean, 25 qnorm, 21 quietly, 23 ranksum, 12 recode, 14 robvar, 22 sqrt, 11 summarize, 6 tabodds, 43 tabstat, 18 tabulate, 27, ttest, 8, 9, 23 twoway, 16 use, 4 webuse, 42 d2e5ca9 47 / 47
Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015
Exercices M1 SES 214-215 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 215 Les exemples numériques présentés dans ce document d exercices ont été traités sur le logiciel R, téléchargeable par
Plus en détaildistribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position
Arbre de NESI distribution quelconque Signe 1 échantillon distribution symétrique non gaussienne Wilcoxon gaussienne Student position appariés 1 échantillon sur la différence avec référence=0 2 échantillons
Plus en détailLire ; Compter ; Tester... avec R
Lire ; Compter ; Tester... avec R Préparation des données / Analyse univariée / Analyse bivariée Christophe Genolini 2 Table des matières 1 Rappels théoriques 5 1.1 Vocabulaire....................................
Plus en détailIntroduction aux Statistiques et à l utilisation du logiciel R
Introduction aux Statistiques et à l utilisation du logiciel R Christophe Lalanne Christophe Pallier 1 Introduction 2 Comparaisons de deux moyennes 2.1 Objet de l étude On a mesuré le temps de sommeil
Plus en détailUn exemple de régression logistique sous
Fiche TD avec le logiciel : tdr341 Un exemple de régression logistique sous A.B. Dufour & A. Viallefont Etude de l apparition ou non d une maladie cardiaque des coronaires 1 Présentation des données Les
Plus en détailAnalyse de la variance Comparaison de plusieurs moyennes
Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction
Plus en détailMODELE A CORRECTION D ERREUR ET APPLICATIONS
MODELE A CORRECTION D ERREUR ET APPLICATIONS Hélène HAMISULTANE Bibliographie : Bourbonnais R. (2000), Econométrie, DUNOD. Lardic S. et Mignon V. (2002), Econométrie des Séries Temporelles Macroéconomiques
Plus en détailDonnées longitudinales et modèles de survie
ANALYSE DU Données longitudinales et modèles de survie 5. Modèles de régression en temps discret André Berchtold Département des sciences économiques, Université de Genève Cours de Master ANALYSE DU Plan
Plus en détailAnalyse exploratoire des données
Analyse exploratoire des données Introduction à R pour la recherche biomédicale http://wwwaliquoteorg/cours/2012_biomed Objectifs Au travers de l analyse exploratoire des données, on cherche essentiellement
Plus en détailAnalyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9
Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9 L analyse de variance à un facteur permet de vérifier, moyennant certaines hypothèses, si un facteur (un critère de classification,
Plus en détailTABLE DES MATIERES. C Exercices complémentaires 42
TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence
Plus en détailExemple PLS avec SAS
Exemple PLS avec SAS This example, from Umetrics (1995), demonstrates different ways to examine a PLS model. The data come from the field of drug discovery. New drugs are developed from chemicals that
Plus en détailUtilisation du Logiciel de statistique SPSS 8.0
Utilisation du Logiciel de statistique SPSS 8.0 1 Introduction Etude épidémiologique transversale en population générale dans 4 pays d Afrique pour comprendre les différences de prévalence du VIH. 2000
Plus en détailModèles pour données répétées
Résumé Les données répétées, ou données longitudinales, constituent un domaine à la fois important et assez particulier de la statistique. On entend par données répétées des données telles que, pour chaque
Plus en détail1 Objectifs. Traitement statistique des données d enquête avec introduction à SPSS. Plan
1 Objectifs Traitement statistique des données d enquête avec introduction à SPSS Gilbert Ritschard Département d économétrie, Université de Genève gilbert.ritschard@themes.unige.ch Bamako, 7-11 octobre
Plus en détailChapitre 6 Test de comparaison de pourcentages χ². José LABARERE
UE4 : Biostatistiques Chapitre 6 Test de comparaison de pourcentages χ² José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Nature des variables
Plus en détailGestion de Portefeuille. Mesures de Performance Ajustées du Risque
Gestion de Portefeuille Mesures de Performance Ajustées du Risque Le Ratio de Sharpe La mesure de performance (ajustée du risque) la plus utilisée Rappel: Propriétés du ratio de Sharpe Mesure de la stratégie:
Plus en détailAnalyse statistique de données qualitatives et quantitatives en sciences sociales : TP RÉGRESSION LOGISTIQUE (MODÈLES CHAPITRE 1)
Analyse statistique de données qualitatives et quantitatives en sciences sociales : TP RÉGRESSION LOGISTIQUE (MODÈLES CHAPITRE 1) Modèles de régression logistique à réaliser Une explicative catégorielle
Plus en détailStatistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année 2010-2011
Master 1 Biologie et technologie du végétal Année 010-011 Statistiques Rappels de cours et travaux dirigés (Seul ce document sera autorisé en examen) auteur : Jean-Marc Labatte jean-marc.labatte@univ-angers.fr
Plus en détailPratique de l analyse de données SPSS appliqué à l enquête «Identités et Capital social en Wallonie»
Centre de recherche en démographie et sociétés UCL/IACCHOS/DEMO Pratique de l analyse de données SPSS appliqué à l enquête «Identités et Capital social en Wallonie» 1 2 3+ analyses univariées Type de variables
Plus en détailAnalyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés
Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent
Plus en détailCours I. Prise en main du logiciel
Cours I. Prise en main du logiciel Cours I. Prise en main du logiciel 1. Le logiciel Stata Traditionnellement, Stata est un logiciel qui fonctionne avec des lignes de commande tapées par l'utilisateur
Plus en détailUne introduction. Lionel RIOU FRANÇA. Septembre 2008
Une introduction INSERM U669 Septembre 2008 Sommaire 1 Effets Fixes Effets Aléatoires 2 Analyse Classique Effets aléatoires Efficacité homogène Efficacité hétérogène 3 Estimation du modèle Inférence 4
Plus en détailBiostatistiques : Petits effectifs
Biostatistiques : Petits effectifs Master Recherche Biologie et Santé P. Devos DRCI CHRU de Lille EA2694 patrick.devos@univ-lille2.fr Plan Données Générales : Définition des statistiques Principe de l
Plus en détailIntroduction à la statistique non paramétrique
Introduction à la statistique non paramétrique Catherine MATIAS CNRS, Laboratoire Statistique & Génome, Évry http://stat.genopole.cnrs.fr/ cmatias Atelier SFDS 27/28 septembre 2012 Partie 2 : Tests non
Plus en détailDidacticiel - Études de cas. Description de quelques fonctions du logiciel PSPP, comparaison des résultats avec ceux de Tanagra, R et OpenStat.
1 Objectif Description de quelques fonctions du logiciel PSPP, comparaison des résultats avec ceux de Tanagra, R et OpenStat. Tout le monde l aura compris, je passe énormément de temps à analyser les logiciels
Plus en détailÉtude de cas Assurance (d après une étude de Philippe Périé, CISIA)
Étude de cas Assurance (d après une étude de Philippe Périé, CISIA) I.1.Les données L échantillon est constitué de 1106 assurés Belges observés en 1992 et répartis en 2 groupes. - les assurés qui n ont
Plus en détailAIDE FINANCIÈRE POUR ATHLÈTES FINANCIAL ASSISTANCE FOR ATHLETES
AIDE FINANCIÈRE POUR ATHLÈTES FINANCIAL ASSISTANCE FOR ATHLETES FORMULAIRE DE DEMANDE D AIDE / APPLICATION FORM Espace réservé pour l utilisation de la fondation This space reserved for foundation use
Plus en détailPrincipe d un test statistique
Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre
Plus en détailLe chi carré. Le sommaire. Approche quantitative
Approche quantitative Le chi carré Les objectifs pédagogiques Définir le test du chi carré Déterminer la nature des données propres au chi carré Savoir calculer le chi carré Savoir déterminer les fréquences
Plus en détailWealth Effect on Labor Market Transitions
Wealth Effect on Labor Market Transitions Yann Algan EUREQua - Université de Paris I algan@univ-paris1.fr Arnaud Chéron GAINS - Université du Maine & Cepremap acheron@univ-lemans.fr Jean-Olivier Hairault
Plus en détailIntroduction au logiciel STATA
Introduction au logiciel STATA Antoine Bozio 28 janvier 2005 Table des matières 1 Les premiers pas 3 1.1 Les différentes fenêtres.................................. 3 1.2 Comment lire des données................................
Plus en détailUne variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants)
CIVILITE-SES.doc - 1 - Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants) 1 PRÉSENTATION DU DOSSIER CIVILITE On s intéresse
Plus en détailTableau récapitulatif de l analyse fréquentielle
Tableau récapitulatif de l analyse fréquentielle Très Plutôt Quelque Ni Quelque Plutôt Très TOTAL peu ni peu 1. L utilité du d inclure le contexte dans la note de stratégie 4% 4% 4% 8% 64% 16% 100% 2.
Plus en détailChapitre 3. Les distributions à deux variables
Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles
Plus en détailSAS de base : gestion des données et procédures élémentaires
1 SAS de base : gestion des données et procédures élémentaires SAS de base : gestion des données et procédures élémentaires Résumé Description des commandes (module SAS de base) les plus utiles de l étape
Plus en détaildonnées en connaissance et en actions?
1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)
Plus en détailGrégoire de Lassence. Copyright 2006, SAS Institute Inc. All rights reserved.
Grégoire de Lassence 1 Grégoire de Lassence Responsable Pédagogie et Recherche Département Académique Tel : +33 1 60 62 12 19 gregoire.delassence@fra.sas.com http://www.sas.com/france/academic SAS dans
Plus en détailExemples d application
AgroParisTech Exemples d application du modèle linéaire E Lebarbier, S Robin Table des matières 1 Introduction 4 11 Avertissement 4 12 Notations 4 2 Régression linéaire simple 7 21 Présentation 7 211 Objectif
Plus en détailChristophe CANDILLIER Cours de DataMining mars 2004 Page 1
Christophe CANDILLIER Cours de DataMining mars 2004 age 1 1. Introduction 2. rocessus du DataMining 3. Analyse des données en DataMining 4. Analyse en Ligne OLA 5. Logiciels 6. Bibliographie Christophe
Plus en détailCancer bronchique primitif: données épidémiologiques récentes
Cancer bronchique primitif: données épidémiologiques récentes Pr Jean Trédaniel Service de pneumologie et oncologie thoracique Groupe Hospitalier Paris Saint Joseph Université Paris Descartes Sources Données
Plus en détailCOMPARAISON DE LOGICIELS TESTANT L INDEPENDANCE DE VARIABLES BINAIRES
J. sci. pharm. biol., Vol.9, n - 00, pp. 9-0 EDUCI 00 9 VALLEE POLNEAU S.* DIAINE C. COMPARAISON DE LOGICIELS TESTANT L INDEPENDANCE DE VARIABLES BINAIRES Notre étude visait à comparer les résultats obtenus
Plus en détailIBM SPSS Regression 21
IBM SPSS Regression 21 Remarque : Avant d utiliser ces informations et le produit qu elles concernent, lisez les informations générales sous Remarques sur p. 46. Cette version s applique à IBM SPSS Statistics
Plus en détailStatistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier
Statistiques Appliquées à l Expérimentation en Sciences Humaines Christophe Lalanne, Sébastien Georges, Christophe Pallier Table des matières 1 Méthodologie expérimentale et recueil des données 6 1.1 Introduction.......................................
Plus en détailIntroduction à l approche bootstrap
Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?
Plus en détailÉtude des flux d individus et des modalités de recrutement chez Formica rufa
Étude des flux d individus et des modalités de recrutement chez Formica rufa Bruno Labelle Théophile Olivier Karl Lesiourd Charles Thevenin 07 Avril 2012 1 Sommaire Remerciements I) Introduction p3 Intérêt
Plus en détail1 Modélisation d être mauvais payeur
1 Modélisation d être mauvais payeur 1.1 Description Cet exercice est très largement inspiré d un document que M. Grégoire de Lassence de la société SAS m a transmis. Il est intitulé Guide de démarrage
Plus en détailTests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»
Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences
Plus en détailEVALUATION DE LA QUALITE DES SONDAGES EN LIGNE : CAS D UN SONDAGE D OPINION AU BURKINA FASO
EVALUATION DE LA QUALITE DES SONDAGES EN LIGNE : CAS D UN SONDAGE D OPINION AU BURKINA FASO Auteur Baguinébié Bazongo 1 Ingénieur Statisticien Economiste Chef de l Unité de recherche à l Institut national
Plus en détailLecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888
Lecture critique d article Rappels Bio statistiques Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888 Plan du cours Rappels fondamentaux Statistiques descriptives Notions de tests statistiques
Plus en détailAnalyse des correspondances avec colonne de référence
ADE-4 Analyse des correspondances avec colonne de référence Résumé Quand une table de contingence contient une colonne de poids très élevé, cette colonne peut servir de point de référence. La distribution
Plus en détailInitiation à l analyse en composantes principales
Fiche TD avec le logiciel : tdr601 Initiation à l analyse en composantes principales A.B. Dufour & J.R. Lobry Une première approche très intuitive et interactive de l ACP. Centrage et réduction des données.
Plus en détailLois de probabilité. Anita Burgun
Lois de probabilité Anita Burgun Problème posé Le problème posé en statistique: On s intéresse à une population On extrait un échantillon On se demande quelle sera la composition de l échantillon (pourcentage
Plus en détailMaster4Light. Caractérisation Optique et Electrique des Sources Lumineuses. Equipement 2-en-1 : source de courant et spectrophotomètre
DSF-M4L-Rev2.0-04/12 Master4Light Equipement 2-en-1 : source de courant et spectrophotomètre Interface graphique logicielle, connexion USB Configuration personnalisable : laboratoire et in-situ http://www.majantys.com
Plus en détailLa classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
Plus en détailÉquivalence et Non-infériorité
Équivalence et Non-infériorité Éléments d Introduction Lionel RIOU FRANÇA INSERM U669 Mars 2009 Essais cliniques de supériorité Exemple d Introduction Données tirées de Brinkhaus B et al. Arch Intern Med.
Plus en détailLe niveau de revenus des ménages est associé à la couverture vaccinale par le vaccin pneumocoque conjugué chez les enfants d'ile-de-france
Le niveau de revenus des ménages est associé à la couverture vaccinale par le vaccin pneumocoque conjugué chez les enfants d'ile-de-france Jean-Paul Guthmann, Pierre Chauvin, Yann Le Strat, Marion Soler,
Plus en détailÉvaluation de la régression bornée
Thierry Foucart UMR 6086, Université de Poitiers, S P 2 M I, bd 3 téléport 2 BP 179, 86960 Futuroscope, Cedex FRANCE Résumé. le modèle linéaire est très fréquemment utilisé en statistique et particulièrement
Plus en détailHENDRICH FALL RISK MODEL (HFRM)
HENDRICH FALL RISK MODEL (HFRM) Hendrich, A. L., Bender, P. S., & Nyhuis, A. (2003). Validation of the Hendrich II Fall Risk Model: a large concurrent case/control study of hospitalized patients. Appl.Nurs
Plus en détailValidation probabiliste d un Système de Prévision d Ensemble
Validation probabiliste d un Système de Prévision d Ensemble Guillem Candille, janvier 2006 Système de Prévision d Ensemble (EPS) (ECMWF Newsletter 90, 2001) Plan 1 Critères de validation probabiliste
Plus en détailIBM SPSS Statistics Base 20
IBM SPSS Statistics Base 20 Remarque : Avant d utiliser ces informations et le produit qu elles concernent, lisez les informations générales sous Remarques sur p. 316. Cette version s applique à IBM SPSS
Plus en détailLogiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS
Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence
Plus en détailProbabilités III Introduction à l évaluation d options
Probabilités III Introduction à l évaluation d options Jacques Printems Promotion 2012 2013 1 Modèle à temps discret 2 Introduction aux modèles en temps continu Limite du modèle binomial lorsque N + Un
Plus en détailBureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr
Dominique Muller Laboratoire Inter-universitaire de Psychologie Bureau : 238 Tel : 04 76 82 58 90 Email : dominique.muller@upmf-grenoble.fr Supports de cours : webcom.upmf-grenoble.fr/lip/perso/dmuller/m2r/acm/
Plus en détailL ANALYSE DU «PARC SOCIAL DE FAIT» PARISIEN EN 2003 : UNE ANALYSE TERRITORIALISÉE DES PROFILS D OCCUPATION DES PARCS ET DES QUARTIERS
ATELIER PARISIEN D URBANISME - 17, BD MORLAND 75004 PARIS TÉL : 01 42 71 28 14 FAX : 01 42 76 24 05 http://www.apur.org Observatoire de l'habitat de Paris L ANALYSE DU «PARC SOCIAL DE FAIT» PARISIEN EN
Plus en détailTableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1
UN GROUPE D INDIVIDUS Un groupe d individus décrit par une variable qualitative binaire DÉCRIT PAR UNE VARIABLE QUALITATIVE BINAIRE ANALYSER UN SOUS-GROUPE COMPARER UN SOUS-GROUPE À UNE RÉFÉRENCE Mots-clés
Plus en détailFORMULAIRE DE STATISTIQUES
FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)
Plus en détailValidation clinique des marqueurs prédictifs le point de vue du méthodologiste. Michel Cucherat UMR CNRS 5558 - Lyon
Validation clinique des marqueurs prédictifs le point de vue du méthodologiste Michel Cucherat UMR CNRS 5558 - Lyon Marqueur prédictif - Définition Un marqueur prédictif est un marqueur qui prédit le bénéfice
Plus en détailImputation du salaire d ego dans TeO
Imputation du salaire d ego dans TeO Objet de la note : linéariser la réponse en tranche du salaire, et imputer le salaire en cas de non réponse Champ et principe de la méthode Les individus qui se sont
Plus en détailSAS ENTERPRISE MINER POUR L'ACTUAIRE
SAS ENTERPRISE MINER POUR L'ACTUAIRE Conférence de l Association des Actuaires I.A.R.D. 07 JUIN 2013 Sylvain Tremblay Spécialiste en formation statistique SAS Canada AGENDA Survol d Enterprise Miner de
Plus en détailTD d économétrie appliquée : Introduction à STATA
Ecole normale supérieure (ENS) Département d économie TD d économétrie appliquée : Introduction à STATA Marianne Tenand marianne.tenand@ens.fr OBJECTIFS DU TD Découvrir le logiciel d économétrie STATA,
Plus en détailCours 9 : Plans à plusieurs facteurs
Cours 9 : Plans à plusieurs facteurs Table des matières Section 1. Diviser pour regner, rassembler pour saisir... 3 Section 2. Définitions et notations... 3 2.1. Définitions... 3 2.2. Notations... 4 Section
Plus en détailMémo d utilisation de ADE-4
Mémo d utilisation de ADE-4 Jérôme Mathieu http://www.jerome.mathieu.freesurf.fr 2003 ADE-4 est un logiciel d analyses des communautés écologiques créé par l équipe de biostatistiques de Lyon. Il propose
Plus en détailCahiers de l IMA. Fascicule SPSS
Octobre 2008 Numéro 41 Cahiers de l IMA Fascicule SPSS Ingrid Gilles Eva G. T. Green Paola Ricciardi Joos Régis Scheidegger Chiara Storari Thomas Tuescher Pascal Wagner-Egger Ricciardi-Joos Ricciardi-Joos
Plus en détailDensité de population et ingestion de nourriture chez un insecte vecteur de la maladie de Chagas
Fiche TD avec le logiciel : tdr335 Densité de population et ingestion de nourriture chez un insecte vecteur de la maladie de Chagas F. Menu, A.B. Dufour, E. Desouhant et I. Amat La fiche permet de se familiariser
Plus en détailLe risque Idiosyncrasique
Le risque Idiosyncrasique -Pierre CADESTIN -Magali DRIGHES -Raphael MINATO -Mathieu SELLES 1 Introduction Risque idiosyncrasique : risque non pris en compte dans le risque de marché (indépendant des phénomènes
Plus en détailApplication des courbes ROC à l analyse des facteurs pronostiques binaires
Application des courbes ROC à l analyse des facteurs pronostiques binaires Combescure C (1), Perneger TV (1), Weber DC (2), Daurès J P (3), Foucher Y (4) (1) Service d épidémiologie clinique et Centre
Plus en détailLe signal GPS. Les horloges atomiques à bord des satellites GPS produisent une fréquence fondamentale f o = 10.23 Mhz
Le signal GPS Les horloges atomiques à bord des satellites GPS produisent une fréquence fondamentale f o = 10.23 Mhz Deux signaux en sont dérivés: L1 (fo x 154) = 1.57542 GHz, longueur d onde = 19.0 cm
Plus en détailEconométrie et applications
Econométrie et applications Ecole des Ponts ParisTech Département Sciences Economiques Gestion Finance Nicolas Jacquemet (nicolas.jacquemet@univ-paris1.fr) Université Paris 1 & Ecole d Economie de Paris
Plus en détailMedication management ability assessment: results from a performance based measure in older outpatients with schizophrenia.
Medication Management Ability Assessment (MMAA) Patterson TL, Lacro J, McKibbin CL, Moscona S, Hughs T, Jeste DV. (2002) Medication management ability assessment: results from a performance based measure
Plus en détailNOM ENTREPRISE. Document : Plan Qualité Spécifique du Projet / Project Specific Quality Plan
Document : Plan Qualité Spécifique du Projet Project Specific Quality Plan Référence Reference : QP-3130-Rev 01 Date Date : 12022008 Nombre de Pages Number of Pages : 6 Projet Project : JR 100 Rédacteur
Plus en détailINTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES
INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine
Plus en détailExploiter les statistiques d utilisation de SQL Server 2008 R2 Reporting Services
Exploiter les statistiques d utilisation de SQL Server 2008 R2 Reporting Services Nous verrons dans cet article comment exploiter simplement les données de Log de SQL Server 2008 R2 Reporting Services
Plus en détailExemples d Analyses de Variance avec R
Exemples d Analyses de Variance avec R Christophe Pallier 5 août 00 Résumé R est un logiciel d analyse statistique qui fournit toutes les procédures usuelles (t-tests, anova, tests non paramétriques...)
Plus en détailStatistiques Descriptives à une dimension
I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des
Plus en détailBiostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke
www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3
Plus en détailK. Ammar, F. Bachoc, JM. Martinez. Séminaire ARISTOTE - 23 octobre 2014 - Palaiseau
Apport des modèles de krigeage à la simulation numérique K Ammar, F Bachoc, JM Martinez CEA-Saclay, DEN, DM2S, F-91191 Gif-sur-Yvette, France Séminaire ARISTOTE - 23 octobre 2014 - Palaiseau Apport des
Plus en détailSEMINAIRE SAS VISUAL ANALYTICS LAUSANNE, MARCH 18 : JÉRÔME BERTHIER VALERIE AMEEL
SEMINAIRE SAS VISUAL ANALYTICS LAUSANNE, MARCH 18 : JÉRÔME BERTHIER VALERIE AMEEL AGENDA 14:15-14:30 Bienvenue & Introduction Jérôme Berthier et Manuel Fucinos 14:30-14:45 Le concept de la Data Viz et
Plus en détailFrance SMS+ MT Premium Description
France SMS+ MT Premium Description Summary Subscription : kinematics Subscription via SMS (Kinematic + messages) Subscription via Wap (Kinematic + messages) Subscription via Mix SMS / WAP Subscription
Plus en détailInstrument testing Tests instrumentaux. Montpellier 23 juin - 4 juillet 2008 Gourlot J.-P.
Instrument testing Tests instrumentaux Montpellier 23 juin - 4 juillet 2008 Gourlot J.-P. Plan of presentation Plan de présentation Fiber development and measurement Length measurement Colour and trash
Plus en détailApproche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH
Approche par groupe de gènes pour les données longitudinales d expression génique avec une application dans un essai vaccinal contre le VIH Boris Hejblum 1,2,3 & Rodolphe Thiébaut 1,2,3 1 Inserm, U897
Plus en détailEvaluation des modèles non-linéaires à effets mixtes
Evaluation des effets mixtes INSERM UMR738 GDR Statistiques et Santé, 20 octobre 2009 Pharmacométrie Définition modélisation des données obtenues lors d essais cliniques sur des médicaments développement
Plus en détailPROGRAMME (Susceptible de modifications)
Page 1 sur 8 PROGRAMME (Susceptible de modifications) Partie 1 : Méthodes des revues systématiques Mercredi 29 mai 2013 Introduction, présentation du cours et des participants Rappel des principes et des
Plus en détailIntroduction à SPSS. Guy Mélard, U.L.B. Mars 2006 (gmelard@ulb.ac.be) Guy Mélard, ULB 1. Introduction à SPSS. Objectif de la leçon.
à SPSS Objectif de la leçon à SPSS Elle a pour but de fournir une introduction à ce logiciel statistique de manière à faciliter son utilisation en complément de SAS, avec l illustration sur des exemples
Plus en détailCALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING
CALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING SÉLECTION DES RISQUES PRÉVISION DES DÉFAUTS SUIVI ET CONTRÔLE Pierre-Louis GONZALEZ Différents types de
Plus en détail23. Interprétation clinique des mesures de l effet traitement
23. Interprétation clinique des mesures de l effet traitement 23.1. Critères de jugement binaires Plusieurs mesures (indices) sont utilisables pour quantifier l effet traitement lors de l utilisation d
Plus en détailEtude des propriétés empiriques du lasso par simulations
Etude des propriétés empiriques du lasso par simulations L objectif de ce TP est d étudier les propriétés empiriques du LASSO et de ses variantes à partir de données simulées. Un deuxième objectif est
Plus en détailLES MODELES DE SCORE
LES MODELES DE SCORE Stéphane TUFFERY CONFERENCE GENDER DIRECTIVE 31 mai 2012 31/05/2012 ActuariaCnam Conférence Gender Directive Stéphane Tufféry 1 Plan Le scoring et ses applications L élaboration d
Plus en détailExercice 3 du cours Management Bancaire : «Risque de crédit et scoring»
Exercice 3 du cours Management Bancaire : «Risque de crédit et scoring» Ce cas a pour objectif d étudier le risque de crédit d une entreprise à l aide de la méthode du scoring. Cette méthode statistique
Plus en détailINSTITUT MARITIME DE PREVENTION. For improvement in health and security at work. Created in 1992 Under the aegis of State and the ENIM
INSTITUT MARITIME DE PREVENTION For improvement in health and security at work Created in 1992 Under the aegis of State and the ENIM Maritime fishing Shellfish-farming Sea transport 2005 Le pilier social
Plus en détail