Analyse complète d un problème sous R
|
|
- Christophe Archambault
- il y a 6 ans
- Total affichages :
Transcription
1 Analyse complète d un problème sous R Thème de l étude : Projet d enfants chez des patients atteints de cancer à 2 ans du diagnostic Facteurs associés au d enfant chez des femmes de moins de 45 ans ///////////////////////// CORRECTION ///////////////////////// 1) Fichier Excel Importez sur votre disque dur le fichier «data44.xls» (qui est mis à votre disposition à partir du lien «Fichiers de données» dans la partie «Nota Bene / Boîte à outils»). a) Quelle est la nature des variables étudiées? Variables quantitatives : age, n_enfants. PCS, MCS Variables qualitatives : cancer, sexe, enfant, menopause, sterilite, fertilite, Remarque : enfant, menopause, sterilite, fertilite, sont des variables numériques qui prennent les valeurs 0 ou 1 qui correspondent aux valeurs qualitatives «Non» et «Oui». b) Que remarquez vous en survolant très rapidement le fichier.xls? Beaucoup de cases vides (= données manquantes) 281 lignes = 280 sujets 2) Vérification des données dans R a) Ouvrez le logiciel R et importez le fichier «data44». En affichant le tableau de données dans R que remarquez vous en le survolant très rapidement? Après avoir enregistré le fichier Excel au format.csv, ouvrir le fichier dans R data44 <- read.csv2("c:\\users\\p058571\\documents\\cours\\ \\masters EISIS MQERS SPSD\\STA- UNIV\\Data44.csv", header=true) Vérifier l affichage data44[,] Les cases vides sont remplacées dans R par NA (Not Available). Il y a bien 280 sujets. b) Vérifiez que la sélection des patientes à étudier selon les critères prévus (âge < 45 ans, sexe féminin) a été convenablement réalisée, à l aide de calcul et par méthode graphique? Attacher le fichier attach(data44) Descriptif simple des données et vérification de la cohérence pour sexe et age : summary(sexe) ou table(sexe) sexe F M summary(age) Graphiques possibles : pie(summary(sexe)) ou barplot(summary(sexe)) hist(age) ou boxplot(age) Problème pour les 2 variables : 1 homme et 1 sujet avec un âge > 45 ans. c) Recherchez la ligne de l individu trop âgé pour être inclus et affichez ses caractéristiques. data44[age>45,] ou subset(data44, age > 45) ou which.max(age) [1] 224 et data44[224,] n_ident cancer age sexe enfant n_enfants menopause sterilite fertilite PCS MCS Sein M 1 3 NA
2 ligne 224 :1 homme avec un cancer du sein âgé de 58 ans à exclure (n_ident = 4467) d) Sélectionnez un nouveau sous-tableau sans homme et vérifiez que les variables âge et sexe respectent maintenant les critères fixés. Création d un nouveau tableau en précisant la condition souhaitée entre crochet data44f <- data44[sexe=="f",] detach(data44) attach(data44f) summary(sexe) F M summary(age) OK : plus d homme et âge maximum = 44,96 e) Vérifiez la cohérence entre les variables enfant (Avez-vous des enfants?) et n_enfants (nombres d'enfants). table(enfant,n_enfants) n_enfants enfant Pas de problème : dans le tableau croisé, les sujets sans enfants n ont pas d enfants!!! 3) Statistiques Descriptives dans R a) Calculez la proportion de nullipares (0 enfant) et de primipares (1 seul enfant) dans l échantillon. table(enfant) enfant prop.table(table(enfant),) enfant Il y a 20% de nullipares Remarque : pour réduire le nombre de décimales : options(digits=3) table(n_enfants)/length(n_enfants) ou table(n_enfants)/279 n_enfants Il y a 23% de primipares (attention ici ne pas utiliser prop.table car la variable n_enfants n est renseignée que pour les 223 femmes ayant répondu oui à la question «avez-vous des enfants?») b) Quel est le nombre moyen d'enfants dans l'échantillon? Calculez la variance et proposez une représentation graphique. summary(n_enfants) NA's Le minimum pour la variable vaut 1. Il y a ici 56 données manquantes qui correspondent aux femmes sans enfants. Il faut donc créer une nouvelle variable : n_enfants2 <- n_enfants n_enfants2[enfant=="0"] <- 0 table(n_enfants2) n_enfants Ca marche!!! summary(n_enfants2) var(n_enfants2) [1] 1.44 Le nombre moyen d enfant est 1,67 avec une variance de 1,44. 2
3 Graphiques possibles : boxplot(n_enfants2, main="nombre d enfants") barplot(table(n_enfants2), xlab="nombre d enfants", ylab="fréquence absolue") barplot(prop.table(table(n_enfants2)), xlab="nombre d enfants", ylab="fréquence relative") pie(table(n_enfants2), main="nombre d enfants") c) Quelle est la localisation cancéreuse la plus fréquente? Proposez un graphique de l ensemble des localisations. table(cancer) Autres cancers Colon-Rectum Leucémies Lévres-Bouche-Pharynx; Larynx; Oesophage Lymphomes Myélomes Peau Sein Thyroïde Utérus;Ovaire Vessie; Rein 34 6 C est le cancer du sein le plus fréquent (n=135) pie(table(cancer), main="localisations cancéreuses") barplot(table(cancer), main="localisations cancéreuses", horiz=true, cex.names=0.7, las=2) Remarque : Les options de la commande barplot permettent de rendre plus lisibles l affichage des localisations cancéreuses. d) Combien de femmes expriment un de maternité future? Combien ont répondu à cette question? table() sum(table()) ou length(na.omit()) [1] femmes expriment ce de maternité parmi 175 répondantes e) Parmi les femmes qui ont répondu à la question sur le de maternité, quelle proportion exprime un futur? prop.table(table(),) % des femmes ayant répondu expriment ce de maternité f) Combien y a t il de données manquantes pour la variable (" d'enfants")? La variable fertilité permet-t elle d'expliquer ces données manquantes? Calcul des données manquantes : plusieurs méthodes possibles (la fonction is.na répond Vrai/Faux selon si une case est vide ou pas) length() - length(na.omit()) ou 279 sum(table()) ou 279 sum(table()) [1] 104 ou table(is.na()) FALSE TRUE ou summary() NA's Il y a 104 données manquantes table(,fertilite) fertilite Au vu du tableau croisé, la question sur un éventuel d enfant n était posée qu aux femmes ayant une fertilité préservée. 3
4 4) Analyse finale avec tests statistiques dans R a) Créez un nouveau sous-tableau des 175 femmes de moins de 45 ans ayant une fertilité préservée. Création d un nouveau sous-tableau des 175 femmes de moins de 45 ans fertiles data44ff <- data44f[fertilite=="1",] detach(data44f) attach(data44ff) summary() Il n y a plus de données manquantes pour la variable. Normalité des distributions : b) L âge est-il «normalement» distribué (test + illustration graphique)? ks.test(age,"pnorm",mean(age),sd(age)) One-sample Kolmogorov-Smirnov test data: age D = , p-value = alternative hypothesis: two-sided On ne peut pas considérer que l âge suit une loi normale. hist(age) ou qqnorm(age,col="blue"); qqline(age) ou boxplot(age) Graphiquement, il y a un décalage vers les âges plus élevés. Scores de qualité de vie physique et mentale (PCS/MCS) : c) Les 2 composantes de la qualité de vie (physique et mentale) sont-elles liées? plot(pcs, MCS); abline(lm(mcs~pcs)) cor.test(pcs, MCS, method="pearson") Pearson's product-moment correlation data: PCS and MCS t = 2.88, df = 173, p-value = alternative hypothesis: true correlation is not equal to cor La corrélation est positive, significativement différente de 0, mais faible (0,2) d) A 2 ans du diagnostic de cancer, y-a t il chez ces femmes une composante de qualité de vie plus altérée qu une autre (test apparié : «paired=true»)? summary(pcs) summary(mcs) t.test(mcs,pcs,paired=t) Paired t-test data: MCS and PCS t = -5.29, df = 174, p-value = 3.721e mean of the differences boxplot(pcs, MCS) La composante physique de la qualité de vie est moins altérée (significativement supérieure; p<0,001), le test statistique utilisé est apparié car on ne compare pas 2 groupes différents mais 2 groupes avec les mêmes sujets. e) La qualité de vie des patientes est-elle différente selon l existence d un futur d enfant? (2 séries d analyse pour les 2 composantes physique et mentale de la QDV) boxplot(pcs ~ ) var.test(pcs[==0], PCS[==1]) 4
5 F test to compare two variances data: PCS[ == 0] and PCS[ == 1] F = 1.23, num df = 128, denom df = 45, p-value = alternative hypothesis: true is not equal to t.test(pcs ~, var.equal=true) Two Sample t-test data: PCS by t = , df = 173, p-value = On ne met pas en évidence de différence significative pour la composante physique de qualité de vie entre les 2 groupes ( ou pas de maternité future). boxplot(mcs ~ ) var.test(mcs[==0], MCS[==1]) F test to compare two variances data: MCS[ == 0] and MCS[ == 1] F = 1.42, num df = 128, denom df = 45, p-value = alternative hypothesis: true is not equal to t.test(mcs ~, var.equal=true) Two Sample t-test data: MCS by t = -0.76, df = 173, p-value = On ne met pas non plus en évidence de différence significative pour la composante mentale de qualité de vie entre les 2 groupes ( ou pas de maternité future) Maternité préalable et souhaitée : f) Existe-t-il un lien entre le fait d avoir déjà des enfants et un futur de maternité? - En catégoriel (2 classes) table(enfant,) enfant prop.table(table(enfant,),1) enfant chisq.test(enfant,) Pearson's Chi-squared test with Yates' continuity correction data: enfant and X-squared = 20.5, df = 1, p-value = 5.86e-06 chisq.test(enfant,)$expected enfant
6 Test applicable (Cij>5) : Les femmes n ayant pas encore eu d enfant expriment plus souvent un d enfant (57% vs. 18% ; p<0,001). Graphique : old.par <- par(no.readonly = TRUE) par(mfrow = c(1, 2)) barplot(prop.table(table([enfant==0]),), ylim=c(0,1), ylab="fréquence relative", col="blue",main="enfant = 0", sub="projet : Non/Oui") barplot(prop.table(table([enfant==1]),), ylim=c(0,1), ylab=" Fréquence relative ",col="red",main="enfant >= 1", sub="projet : Non/Oui") par(mfrow = c(1, 1)) par(old.par) g) Les femmes qui expriment un futur de maternité ont-elles en moyenne le même âge que celles qui ne souhaitent plus d enfants? boxplot(age ~, main="age") var.test(age[==0], age[==1]) F test to compare two variances data: age[ == 0] and age[ == 1] F = , num df = 128, denom df = 45, p-value = alternative hypothesis: true is not equal to Egalité des variances non respectée (différence significative p<0.05), il faut utiliser test de Student avec variance inégale : t.test(age ~, var.equal=false) Welch Two Sample t-test data: age by t = 8.53, df = 60.1, p-value = 6.139e Les femmes qui ont un futur de maternité sont en moyenne plus jeunes (p<0.001) h) Existe-t-il un lien entre l âge des femmes le fait d avoir déjà un(des) enfant(s)? boxplot(age ~ enfant, main="age") var.test(age~ enfant) F test to compare two variances data: age by enfant F = , num df = 36, denom df = 137, p-value = 8.877e-06 alternative hypothesis: true is not equal to Egalité des variances non respectée (différence significative p<0.05), il faut utiliser test de Student avec variance inégale : t.test(age ~ enfant, var.equal=false) Welch Two Sample t-test data: age by enfant t = , df = , p-value = Les femmes qui n ont pas d enfant sont en moyenne plus jeunes (p<0.001) 6
7 Il est maintenant nécessaire de recourir à une stratification (ou à des méthodes multivariées) pour savoir qu estce qui «explique» le d enfant :l âge, le fait d avoir déjà des enfants ou les deux!!! i) En étudiant séparément les femmes n ayant pas d enfant et chez celles qui en ont au moins un. Les femmes qui expriment un futur de maternité ont-elles en moyenne le même âge que celles qui ne souhaitent plus d enfants? Il faut soit recréer encore 2 sous-tableaux (femmes sans enfant, femmes avec enfant), soit pouvoir donner des doubles conditions entre crochet (à l aide du ET qu on écrit «&» dans R), soit utiliser le «~». by(age[enfant=="0"],[enfant=="0"],summary) INDICES: INDICES: by(age[enfant=="1"],[enfant=="1"],summary) INDICES: INDICES: wilcox.test(age[enfant=="0" & =="0"], age[enfant=="0" & =="1"]) OU wilcox.test (age[enfant=="0"] ~ [enfant=="0"]) Wilcoxon rank sum test data: age[enfant == "0"] by [enfant == "0"] W = 268, p-value = alternative hypothesis: true location shift is not equal to 0 wilcox.test (age[enfant=="1"] ~ [enfant=="1"]) Wilcoxon rank sum test with continuity correction data: age[enfant == "1"] by [enfant == "1"] W = , p-value = 5.269e-10 alternative hypothesis: true location shift is not equal to 0 Qu elles aient déjà eu un enfant ou pas, les femmes qui ont un futur de maternité sont en moyenne plus jeunes (p<0.001) Il semble donc que le jeune âge et l absence d enfants préalables puisse être 2 facteurs indépendamment associés au futur d avoir un premier ou un nouvel enfant chez des patientes de moins de 45 ans atteintes d un cancer et ayant une fertilité préservée à 2 ans de leur diagnostic. 7
Lire ; Compter ; Tester... avec R
Lire ; Compter ; Tester... avec R Préparation des données / Analyse univariée / Analyse bivariée Christophe Genolini 2 Table des matières 1 Rappels théoriques 5 1.1 Vocabulaire....................................
Plus en détaildistribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position
Arbre de NESI distribution quelconque Signe 1 échantillon distribution symétrique non gaussienne Wilcoxon gaussienne Student position appariés 1 échantillon sur la différence avec référence=0 2 échantillons
Plus en détailIntroduction aux Statistiques et à l utilisation du logiciel R
Introduction aux Statistiques et à l utilisation du logiciel R Christophe Lalanne Christophe Pallier 1 Introduction 2 Comparaisons de deux moyennes 2.1 Objet de l étude On a mesuré le temps de sommeil
Plus en détailIntroduction à la statistique non paramétrique
Introduction à la statistique non paramétrique Catherine MATIAS CNRS, Laboratoire Statistique & Génome, Évry http://stat.genopole.cnrs.fr/ cmatias Atelier SFDS 27/28 septembre 2012 Partie 2 : Tests non
Plus en détailRAPPORT D ACTIVITE AIDEA 2008. Sommaire
Sommaire 1. Introduction 2. Attentes exprimées 3. Les questions fréquentes 4. Les statistiques 5. Les enquêtes 6. Retours et témoignages 7. Evaluations et indicateurs Notre MISSION : Informer, Conseiller
Plus en détailGestion des données avec R
Gestion des données avec R Christophe Lalanne & Bruno Falissard Table des matières 1 Introduction 1 2 Importation de fichiers CSV 1 2.1 Structure du fichier de données...................................
Plus en détailTP de Statistiques: Utilisation du logiciel R
TP de Statistiques: Utilisation du logiciel R Année 2006-2007 2 Table des matières Introduction i 1 Premiers pas avec R 1 1.1 R est une calculatrice............................................. 1 1.2 R
Plus en détailEXCEL et base de données
EXCEL et base de données 1. Variables et données 2. Saisie de données: quelques règles 3. EXCEL et saisie des données 4. Exemple de tableau EXCEL 5. Éviter d éventuels problèmes 1 1.1 Variables et données
Plus en détailInitiation à l analyse en composantes principales
Fiche TD avec le logiciel : tdr601 Initiation à l analyse en composantes principales A.B. Dufour & J.R. Lobry Une première approche très intuitive et interactive de l ACP. Centrage et réduction des données.
Plus en détailSAS de base : gestion des données et procédures élémentaires
1 SAS de base : gestion des données et procédures élémentaires SAS de base : gestion des données et procédures élémentaires Résumé Description des commandes (module SAS de base) les plus utiles de l étape
Plus en détailPremiers pas avec SES-Pegase (version 7.0) SES : Un Système Expert pour l analyse Statistique des données. Premiers pas avec SES-Pegase 1
Premiers pas avec SES-Pegase 1 Premiers pas avec SES-Pegase (version 7.0) SES : Un Système Expert pour l analyse Statistique des données www.delta-expert.com Mise à jour : Premiers pas avec SES-Pegase
Plus en détailStatistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année 2010-2011
Master 1 Biologie et technologie du végétal Année 010-011 Statistiques Rappels de cours et travaux dirigés (Seul ce document sera autorisé en examen) auteur : Jean-Marc Labatte jean-marc.labatte@univ-angers.fr
Plus en détailLogiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS
Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence
Plus en détailTABLE DES MATIERES. C Exercices complémentaires 42
TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence
Plus en détailDidacticiel - Études de cas. Description de quelques fonctions du logiciel PSPP, comparaison des résultats avec ceux de Tanagra, R et OpenStat.
1 Objectif Description de quelques fonctions du logiciel PSPP, comparaison des résultats avec ceux de Tanagra, R et OpenStat. Tout le monde l aura compris, je passe énormément de temps à analyser les logiciels
Plus en détailMicrosoft Excel : tables de données
UNIVERSITE DE LA SORBONNE NOUVELLE - PARIS 3 Année universitaire 2000-2001 2ème SESSION SLMD2 Informatique Les explications sur la réalisation des exercices seront fournies sous forme de fichiers informatiques.
Plus en détail.( /.*!0) %1 2"+ %#(3004) 05' 203 .(.*0"+ ) '!2"+ %#(30+ 0!"%) 4!%2) 3 .( @.*" '!%2"+ %#(30! &' 4!!% .+.*0%!!'!(!%2"+ 16 3047!
!"#! $ %#&' (!"#$!% & % ' (!%' ) )''! *)+* *! %#"+, ' ( ', -) " *.( /.*!0) %1 2"+ %#(3004) 05' 203.(.*0"+ ) '!2"+ %#(30+ 0!"%) 4!%2) 3.( -.* %)!(2"+ %#(30! &' 4!!%.+.*0%!!'!(!%2"+ 16 3047!%(%' 0.(89.*
Plus en détailAnalyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9
Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9 L analyse de variance à un facteur permet de vérifier, moyennant certaines hypothèses, si un facteur (un critère de classification,
Plus en détailExemples d Analyses de Variance avec R
Exemples d Analyses de Variance avec R Christophe Pallier 5 août 00 Résumé R est un logiciel d analyse statistique qui fournit toutes les procédures usuelles (t-tests, anova, tests non paramétriques...)
Plus en détail1 Introduction - Qu est-ce que le logiciel R?
Master 1 GSI - Mentions ACCIE et RIM - ULCO, La Citadelle, 2012/2013 Mesures et Analyses Statistiques de Données - Probabilités TP 1 - Initiation au logiciel R 1 Introduction - Qu est-ce que le logiciel
Plus en détailCours 1. I- Généralités sur R II- Les fonctions de R et autres objets III-Les vecteurs
Cours 1 I- Généralités sur R II- Les fonctions de R et autres objets III-Les vecteurs IV-Les facteurs I-1 Généralités sur R R (1995, AT&T Bell Laboratories) est un logiciel d analyse statistique et graphique,
Plus en détailStatistiques Canadiennes sur le Cancer, et HMR sur le poumon
Statistiques Canadiennes sur le Cancer, et HMR sur le poumon Bernard Fortin Mars 2014 Source: Comité consultatif de la Société canadienne du cancer : Statistiques canadiennes sur le cancer 2013. Toronto
Plus en détailÉtude des flux d individus et des modalités de recrutement chez Formica rufa
Étude des flux d individus et des modalités de recrutement chez Formica rufa Bruno Labelle Théophile Olivier Karl Lesiourd Charles Thevenin 07 Avril 2012 1 Sommaire Remerciements I) Introduction p3 Intérêt
Plus en détailVolume 1 : Epidémiologie - Etudes des facteurs de risques
2 V o l u m e Volume 1 : Epidémiologie - Etudes des facteurs de risques Volume 2 : Epidémiologie - Situation et actions Recherche des données d incidence estimée des cancers au Maroc Recherche des données
Plus en détailPartie II Cours 3 (suite) : Sécurité de bases de données
Partie II Cours 3 (suite) : Sécurité de bases de données ESIL Université de la méditerranée Odile.Papini@esil.univ-mrs.fr http://odile.papini.perso.esil.univmed.fr/sources/ssi.html Plan du cours 1 Introduction
Plus en détailExemple PLS avec SAS
Exemple PLS avec SAS This example, from Umetrics (1995), demonstrates different ways to examine a PLS model. The data come from the field of drug discovery. New drugs are developed from chemicals that
Plus en détailAnalyse de la variance Comparaison de plusieurs moyennes
Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction
Plus en détailTD : Codage des images
TD : Codage des images Les navigateurs Web (Netscape, IE, Mozilla ) prennent en charge les contenus textuels (au format HTML) ainsi que les images fixes (GIF, JPG, PNG) ou animée (GIF animée). Comment
Plus en détailCONFIGURATION DU SERVEUR DE MAILS EXIM. par. G.Haberer, A.Peuch, P.Saade
CONFIGURATION DU SERVEUR DE MAILS EXIM par G.Haberer, A.Peuch, P.Saade Table des matieres 1. Introduction........................................................................ 2 1.1. Objectifs....................................................................
Plus en détailAide-mémoire de statistique appliquée à la biologie
Maxime HERVÉ Aide-mémoire de statistique appliquée à la biologie Construire son étude et analyser les résultats à l aide du logiciel R Version 5(2) (2014) AVANT-PROPOS Les phénomènes biologiques ont cela
Plus en détailLes tableaux croisés dynamiques
Les tableaux croisés dynamiques Table des matières Les tableaux croisés dynamiques... 1 1. Les tutoriels... 1. Quelle est l'utilité d'un tableau croisé dynamique... 3. Vérifier les données de départ...
Plus en détailTABLEAU CROISE DYNAMIQUE
TABLEAU CROISE DYNAMIQUE Cours Excel 3 ème Partie LEA3 Page 1 Cours Excel 3 ème Partie LEA3 Page 2 FILTRER UN CHAMP Il y a des moments ou vous ne voulez pas avoir une vision globale des données mais plutôt
Plus en détailBiostatistiques : Petits effectifs
Biostatistiques : Petits effectifs Master Recherche Biologie et Santé P. Devos DRCI CHRU de Lille EA2694 patrick.devos@univ-lille2.fr Plan Données Générales : Définition des statistiques Principe de l
Plus en détailInstallation et utilisation de Cobian Backup 8
Installation et utilisation de Cobian Backup 8 Dernière mise à jour le 25/09/2007 Version utilisée : 8.4.0.198 Version du document : 1.0 Page 1 sur 12 SOMMAIRE 1. Téléchargement 2. Installation 3. Mise
Plus en détailEXCEL 2007. Les tableaux croisés dynamiques
EXCEL 2007 Les tableaux croisés dynamiques 1 La Fonction VPM... 3 La Valeur Cible... 4 Les Tableaux Croisés Dynamiques (T.C.D.)... 6 2 Fonction VPM Cette fonction d EXCEL permet de calculer le remboursement
Plus en détailLe Fax par Mail : Mode d emploi
Le : Mode d emploi Sommaire 1) Comment vous connecter à votre interface en ligne? 2) Comment configurer votre fax? 3) Comment envoyer un fax? 4) Comment recevoir un fax? 5) Comment envoyer un fax depuis
Plus en détailUFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES
Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,
Plus en détailRégression linéaire. Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr
Régression linéaire Nicolas Turenne INRA nicolas.turenne@jouy.inra.fr 2005 Plan Régression linéaire simple Régression multiple Compréhension de la sortie de la régression Coefficient de détermination R
Plus en détailAudit SEO. I / Les Tranquilles d Oléron
Audit SEO I / Les Tranquilles d Oléron Données relatives au domaine : Nom de domaine : www.lestranquillesdoleron.com Âge : Moins d un an Bilan : Référencement de base présent, mais il est possible de le
Plus en détailCOMPARAISON DE LOGICIELS TESTANT L INDEPENDANCE DE VARIABLES BINAIRES
J. sci. pharm. biol., Vol.9, n - 00, pp. 9-0 EDUCI 00 9 VALLEE POLNEAU S.* DIAINE C. COMPARAISON DE LOGICIELS TESTANT L INDEPENDANCE DE VARIABLES BINAIRES Notre étude visait à comparer les résultats obtenus
Plus en détailRecherche dans un tableau
Chapitre 3 Recherche dans un tableau 3.1 Introduction 3.1.1 Tranche On appelle tranche de tableau, la donnée d'un tableau t et de deux indices a et b. On note cette tranche t.(a..b). Exemple 3.1 : 3 6
Plus en détailQuelques précisions concernant les commandes de Ticket Restaurant électronique par fichier Excel
Quelques précisions concernant les commandes de Ticket Restaurant électronique par fichier Excel. Commande de cartes Afin de faciliter votre compréhension, les champs obligatoires sont surlignés en jaune
Plus en détailEncryptions, compression et partitionnement des données
Encryptions, compression et partitionnement des données Version 1.0 Grégory CASANOVA 2 Compression, encryption et partitionnement des données Sommaire 1 Introduction... 3 2 Encryption transparente des
Plus en détailINF6304 Interfaces Intelligentes
INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie
Plus en détailFORMULAIRE DE STATISTIQUES
FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)
Plus en détailModule 5 : Lier des classeurs
Module 5 : Lier des classeurs 5.0 Introduction Les feuilles de calcul contiennent des millions de cellules. Ces cellules peuvent être liées (ou connectées dans la terminologie Excel 2007) au sein d un
Plus en détailImporter un fichier CSV
Importer un fichier CSV Importer un fichier CSV - page 1 1 Qu'est ce que l'import d'un fichier CSV L'import d'un fichier CSV vous permet d'ajouter dans OBM les contacts et sociétés présents dans un fichier
Plus en détailGénéralités. Sans copie de sauvegarde sur support externe, vous ne pourrez jamais récupérer vos multiples encodages. 1.1 Sauvegarde des données
Généralités 1.1 Sauvegarde des données Pour disposer d une sauvegarde correcte, il vous faut la réaliser sur un support externe (cd, clé USB, disque dur externe ) Attention, cette copie doit être conservée
Plus en détailLa classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
Plus en détailSaisie et d analyse des questionnaires de sortie
Mode d emploi du site Ecoute Saisie et d analyse des questionnaires de sortie Version du 5 mars 2007 1 Notes préliminaires L utilisation du site est identique pour tous les établissements Générale de Santé.
Plus en détailExercices sur SQL server 2000
Exercices sur SQL server 2000 La diagramme de classe : Exercices sur SQL server 2000 Le modèle relationnel correspondant : 1 Créer les tables Clic-droit on Tables et choisir «New Table» Créer la table
Plus en détailLES TYPES DE DONNÉES DU LANGAGE PASCAL
LES TYPES DE DONNÉES DU LANGAGE PASCAL 75 LES TYPES DE DONNÉES DU LANGAGE PASCAL CHAPITRE 4 OBJECTIFS PRÉSENTER LES NOTIONS D ÉTIQUETTE, DE CONS- TANTE ET DE IABLE DANS LE CONTEXTE DU LAN- GAGE PASCAL.
Plus en détailRAPPELS SUR LES METHODES HERITEES DE LA CLASSE RACINE Object ET LEUR SPECIALISATION (i.e. REDEFINITION)
CLASSE RACINE Object ancêtre de toutes les classes RAPPELS SUR LES METHODES HERITEES DE LA CLASSE RACINE Object ET LEUR SPECIALISATION (i.e. REDEFINITION) définit donc des méthodes héritées par toutes
Plus en détailService d Hématologie clinique et Thérapie cellulaire Bâtiment Médico-Chirurgical - 3 ème et 4 ème étages
Centre Hospitalier Pontoise Service d Hématologie clinique et Thérapie cellulaire Bâtiment Médico-Chirurgical - 3 ème et 4 ème étages Chef de service : Dr Hugo GONZALEZ Accueil secrétariat 01 30 75 49
Plus en détailFIMA, 7 juillet 2005
F. Corset 1 S. 2 1 LabSAD Université Pierre Mendes France 2 Département de Mathématiques Université de Franche-Comté FIMA, 7 juillet 2005 Plan de l exposé plus court chemin Origine du problème Modélisation
Plus en détailStatistique Descriptive Élémentaire
Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Élémentaire (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219 Université Paul Sabatier
Plus en détailExploiter les statistiques d utilisation de SQL Server 2008 R2 Reporting Services
Exploiter les statistiques d utilisation de SQL Server 2008 R2 Reporting Services Nous verrons dans cet article comment exploiter simplement les données de Log de SQL Server 2008 R2 Reporting Services
Plus en détailDéfinition 0,752 = 0,7 + 0,05 + 0,002 SYSTÈMES DE NUMÉRATION POSITIONNELS = 7 10 1 + 5 10 2 + 2 10 3
8 Systèmes de numération INTRODUCTION SYSTÈMES DE NUMÉRATION POSITIONNELS Dans un système positionnel, le nombre de symboles est fixe On représente par un symbole chaque chiffre inférieur à la base, incluant
Plus en détailStatistiques avec la graph 35+
Statistiques avec la graph 35+ Enoncé : Dans une entreprise, on a dénombré 59 femmes et 130 hommes fumeurs. L entreprise souhaite proposer à ses employés plusieurs méthodes pour diminuer, voire arrêter,
Plus en détailRapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/2011. 1.1 Présentation. 1.2 Ressources
Master Maths Finances 2010/2011 Data Mining janvier 2011 RapidMiner 1 Introduction 1.1 Présentation RapidMiner est un logiciel open source et gratuit dédié au data mining. Il contient de nombreux outils
Plus en détail1 Modélisation d être mauvais payeur
1 Modélisation d être mauvais payeur 1.1 Description Cet exercice est très largement inspiré d un document que M. Grégoire de Lassence de la société SAS m a transmis. Il est intitulé Guide de démarrage
Plus en détailquelques Repères pour Doctorants
Gilles HUNAULT 2005 quelques Repères en STATISTIQUES pour Doctorants Université d Angers c gilles.hunault@univ-angers.fr http ://www.info.univ-angers.fr/pub/gh/ 3 Le principe consistant à ne pouvoir affirmer
Plus en détailExemples d application
AgroParisTech Exemples d application du modèle linéaire E Lebarbier, S Robin Table des matières 1 Introduction 4 11 Avertissement 4 12 Notations 4 2 Régression linéaire simple 7 21 Présentation 7 211 Objectif
Plus en détailUne introduction au langage R
Une introduction au langage R Faouzi LYAZRHI UP Biostatistique Ecole Nationale Vétérinaire, 23, chemin des Capelles, BP 87614, F-31076 Toulouse cédex email : f.lyazrhi@envt.fr 2005 1. INSTALLER R 3 2.
Plus en détailACTUARIAT 1, ACT 2121, AUTOMNE 2013 #4-5
ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #4-5 ARTHUR CHARPENTIER 1 Un certain test médical révèle correctement, avec probabilité 0.85, qu une personne a le sida lorsqu elle l a vraiment et révèle incorrectement,
Plus en détailLe PTI, cet incompris!
Le PTI, cet incompris! ou dix mythes à détruire pour simplifier le PTI Rencontre des partenaires de la formation 28 avril 2014 Joël Brodeur, infirmier-conseil Direction du développement et du soutien professionnel
Plus en détailCaisse Nationale de l'assurance Maladie des Travailleurs Salariés Sécurité Sociale
Caisse Nationale de l'assurance Maladie des Travailleurs Salariés Sécurité Sociale Circulaire CNAMTS MMES et MM les Directeurs Date : - des Caisses Régionales d'assurance Maladie 27/03/96 - des Caisses
Plus en détailFiche descriptive de l indicateur : Tenue du dossier anesthésique (DAN)
Définition Score individuel Score global Echantillon Critère d inclusion Fiche descriptive de l indicateur : Tenue du dossier anesthésique (DAN) Cet indicateur évalue la tenue du dossier anesthésique.
Plus en détailStatistiques Descriptives à une dimension
I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des
Plus en détailLe backup LOGOSw (Backup interne)
Le backup LOGOSw (Backup interne) LOGOSw est fourni avec son propre programme de backup Backup très performant utilisant le format PKZIP PKZIP = format industriel de compression de données, actuellement
Plus en détailLes ateliers du Resclin. Préparation des données issues d Epi-Info en utilisant le tableur Excel
Champagne-Ardenne Les ateliers du Resclin Préparation des données issues d Epi-Info en utilisant le tableur Excel Mars 2007 SOMMAIRE 1. RAPPEL 1.1.Qu'est ce qu'un chemin d'accès? 1.2.Qu'est ce qu'une base
Plus en détailUniversité Ibn Zohr Excel Résume de cours
Le logiciel Excel: Excel est un tableur qui permet de saisir des données, de les afficher et de faire des traitements sur ces données. Les originalités du tableur sont l'organisation des données et les
Plus en détailLa place de SAS dans l'informatique décisionnelle
La place de SAS dans l'informatique décisionnelle Olivier Decourt ABS Technologies - Educasoft Formations La place de SAS dans l'informatique décisionnelle! L'historique de SAS! La mécanique! La carrosserie
Plus en détailPrincipe d un test statistique
Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre
Plus en détailBibliothèque des sciences humaines. Guide d utilisation de la banque : TSX-CFMRC Summary Information Database
Bibliothèque des sciences humaines Guide d utilisation de la banque : TSX-CFMRC Summary Information Database Août 2005 Table des matières A- Description de la banque... 3 B- Accéder à la banque... 3 C-
Plus en détailM2-Images. Rendu Temps Réel - OpenGL 4 et compute shaders. J.C. Iehl. December 18, 2013
Rendu Temps Réel - OpenGL 4 et compute shaders December 18, 2013 résumé des épisodes précédents... création des objets opengl, organisation des données, configuration du pipeline, draw,... opengl 4.3 :
Plus en détailEq uip ez votre futu r
créateur d espace dentaire SAône et loire JurA Ain HAute-SAvoie Rhône Puy-de-dôme Loire SAvoie Isère HAute-Loire Ardèche HAutes-Alpes Drôme, bd Edmond Michelet 900 LYON Accès par périphérique EST Sortie
Plus en détailTechniques d interaction dans la visualisation de l information Séminaire DIVA
Techniques d interaction dans la visualisation de l information Séminaire DIVA Zingg Luca, luca.zingg@unifr.ch 13 février 2007 Résumé Le but de cet article est d avoir une vision globale des techniques
Plus en détailINTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES
INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine
Plus en détailUtilisation du Logiciel de statistique SPSS 8.0
Utilisation du Logiciel de statistique SPSS 8.0 1 Introduction Etude épidémiologique transversale en population générale dans 4 pays d Afrique pour comprendre les différences de prévalence du VIH. 2000
Plus en détailStatistiques canadiennes sur le cancer 2014 Sujet particulier : les cancers de la peau
Statistiques canadiennes sur le cancer 2014 Sujet particulier : les cancers de la peau Produit par : Société canadienne du cancer, Statistique Canada, Agence de la santé publique du Canada, Registres provinciaux
Plus en détail2 Serveurs OLAP et introduction au Data Mining
2-1 2 Serveurs OLAP et introduction au Data Mining 2-2 Création et consultation des cubes en mode client-serveur Serveur OLAP Clients OLAP Clients OLAP 2-3 Intérêt Systèmes serveurs et clients Fonctionnalité
Plus en détailSurveillance et maintenance prédictive : évaluation de la latence de fautes. Zineb SIMEU-ABAZI Univ. Joseph Fourier, LAG)
Surveillance et maintenance prédictive : évaluation de la latence de fautes Zineb SIMEU-ABAZI Univ. Joseph Fourier, LAG) SURVEILLANCE Analyser une situation et fournir des indicateurs! Détection de symptômes!
Plus en détailINTRODUCTION AU LOGICIEL R
INTRODUCTION AU LOGICIEL R Variables et mise en jambe Anne Dubois, Julie Bertrand, Emmanuelle Comets emmanuelle.comets@inserm.fr INSERM UMR738 (UMR738) 1 / 68 Sur le site www.cran.r-project.org : Ou trouver
Plus en détailNAS 254 Sauvegarde cloud
NAS 254 Sauvegarde cloud Utiliser la sauvegarde cloud pour sauvegarder vos données sur Amazon S3 U N I V E R S I T E A S U S T O R OBJECTIFS DU COURS À la fin de ce cours, vous pourrez : 1. Avoir une compréhension
Plus en détailGuide de l utilisateur. Synchronisation de l Active Directory
Guide de l utilisateur Synchronisation de l Active Directory Juin 2013 Guide de l utilisateur de Synchro AD de TELUS L outil Synchro AD doit être téléchargé dans le contrôleur de domaine de votre entreprise.
Plus en détailObjectif. Cette formation doit permettre au client d être autonome dans la création de ses rapports avancés en utilisant la fonctionnalité Excel +.
Excel + Objectif Cette formation doit permettre au client d être autonome dans la création de ses rapports avancés en utilisant la fonctionnalité Excel +. 2 Ordre du jour 1. Présentation générale d Excel
Plus en détailAnalyse des durées de vie avec le logiciel R
Analyse des durées de vie avec le logiciel R Ségolen Geffray Des outils ainsi que des données pour l analyse des durées de vie sont disponibles dans les packages survival MASS Il est nécessaire de charger
Plus en détailTD : Requêtes SQL (BDR.TD2-1) INSA 3IF 2008-2009
TD : Requêtes SQL (BDR.TD2-1) INSA 3IF 2008-2009 Loïc Maisonnasse 1 Objectif Ce TD a pour objectif de vous familiariser avec le langage de requêtes SQL. Et de vous apprendre à écrire des requêtes SQL pour
Plus en détailT de Student Khi-deux Corrélation
Les tests d inférence statistiques permettent d estimer le risque d inférer un résultat d un échantillon à une population et de décider si on «prend le risque» (si 0.05 ou 5 %) Une différence de moyennes
Plus en détailPrincipes de mathématiques 12 SÉRIE DE PROBLÈMES. Septembre 2001. Student Assessment and Program Evaluation Branch
Principes de mathématiques 12 SÉRIE DE PROBLÈMES Septembre 2001 Student Assessment and Program Evaluation Branch REMERCIEMENTS Le Ministère de l Éducation tient à remercier chaleureusement les professionnels
Plus en détailUne introduction. Lionel RIOU FRANÇA. Septembre 2008
Une introduction INSERM U669 Septembre 2008 Sommaire 1 Effets Fixes Effets Aléatoires 2 Analyse Classique Effets aléatoires Efficacité homogène Efficacité hétérogène 3 Estimation du modèle Inférence 4
Plus en détailR, Bonnes pratiques. Christophe Genolini
R, Bonnes pratiques Christophe Genolini 1 Table des matières 1 Des bonnes pratiques, pour quoi faire? 4 2 Choix de l éditeur de texte 4 3 Architecture du code 6 4 Variables 10 5 Commentaires et documentation
Plus en détailLa version 3: 100% conforme aux dernières exigences de la DGI au Maroc. Edition Déclaration Télé-déclaration des liasses fiscales
Sage Simpl-ECF 2014 La version 3: 100% conforme aux dernières exigences de la DGI au Maroc. Edition Déclaration Télé-déclaration des liasses fiscales Octobre 2013 1 Sommaire Introduction Page 1 Rappel
Plus en détailUtilisation de l outil lié à MBKSTR 9
Utilisation de l outil lié à MBKSTR 9 Avec MBKSTR, vous disposez d un outil fonctionnant sous Excel (version 97 au minimum) et permettant de faire les études financières suivantes : Aide à la vente avec
Plus en détailLE GRAND LIVRE Du. Pr Jean-Jacques Altman Dr Roxane Ducloux Dr Laurence Lévy-Dutel. Prévenir les complications. et surveiller la maladie
Pr Jean-Jacques Altman Dr Roxane Ducloux Dr Laurence Lévy-Dutel LE GRAND LIVRE Du diabète Vivre avec le diabète à tout âge Traiter et surveiller la maladie Prévenir les complications, 2012 ISBN : 978-2-212-55509-7
Plus en détailFaire un semi variograme et une carte krigée avec surfer
Faire un semi variograme et une carte krigée avec surfer Jérôme Mathieu http://www.jerome.mathieu.freesurf.fr avril 2004 Fichier de données Faire un fichier excel avec les données organisée en colonnes:
Plus en détailAnalyse Concurrentielle Retrospect et ses concurrents
Analyse Concurrentielle et ses concurrents Mars 2014 Analyse concurrentielle : pour Windows et nos principaux concurrents Nous avons étudié attentivement nos concurrents pour savoir comment nous rivalisons
Plus en détailSaisie de la déclaration de cotisations FSPOEIE
Saisie de la déclaration de cotisations FSPOEIE Mise à jour : juin 2012 Sommaire Rappel réglementaire. page 3 Accès au service. page 4 Créer et saisir une déclaration de cotisations page 8 Transmettre
Plus en détail