UTILISATION PRATIQUE DU LOGICIEL STATISTIQUE «R»



Documents pareils
Présentation du logiciel

R00 Installation du logiciel R sous Windows

Lire ; Compter ; Tester... avec R

Logiciel XLSTAT version rue Damrémont PARIS

Jérôme Mathieu janvier Débuter avec R. Ce document est disponible sur le site web :

Travail personnel sur ordinateur

Introduction aux Statistiques et à l utilisation du logiciel R

La place de SAS dans l'informatique décisionnelle

Premiers pas avec SES-Pegase (version 7.0) SES : Un Système Expert pour l analyse Statistique des données. Premiers pas avec SES-Pegase 1

Statistique Descriptive Élémentaire

Séries Statistiques Simples

MANIPULATION ET VISUALISATION DE GROSSES BASES DE DONNÉES AVEC R

Aide-mémoire de statistique appliquée à la biologie

TABLE DES MATIERES. C Exercices complémentaires 42

Tests statistiques et régressions logistiques sous R, avec prise en compte des plans d échantillonnage complexes

1 Introduction - Qu est-ce que le logiciel R?

Méthode de préparation du fichier texte d import depuis Excel, via Access jusqu à Drupal.

données en connaissance et en actions?

Mises en relief. Information supplémentaire relative au sujet traité. Souligne un point important à ne pas négliger.

Examen de Logiciels Statistiques

Package TestsFaciles

LE RÔLE DE LA STATISTIQUE DANS UN PROCESSUS DE PRISE DE DÉCISION

Une introduction au langage R

LA MULTIPLICATION DES PLATEFORMES DANS L INDUSTRIE DU JEU VIDÉO

Introduction à l informatique en BCPST

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Accéder à ZeCoffre via FTP

IBM SPSS Statistics Base 20

Gestion des données avec R

CAHIER DES CLAUSES TECHNIQUES PARTICULIERES (CCTP)

Exercices M1 SES Ana Fermin ( fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

Guide d installation de L A TEX

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

WinReporter Guide de démarrage rapide. Version 4

L assistant Boot Camp pour utiliser aussi Windows sur un Mac sous OS X Yosemite

Plateforme académique de partage de documents - owncloud

Migration de Kaspersky Vers Trend OfficeScan 10 dans une Ecole

Exemples d Analyses de Variance avec R

Statistique : Résumé de cours et méthodes

Principe d un test statistique

Eclipse atelier Java

BUREAU VIRTUEL. Utilisation de l application sur ipad. Guide utilisateur. Sciences Po Utilisation du bureau virtuel sur ipad 1 / 6

MODE D EMPLOI DU MODULE D E-COMMERCE

Logiciel Le Sphinx Plus 2 version 5. Le Sphinx Développement Chavanod

Evaluation de la variabilité d'un système de mesure

INDUSTRIALISATION ET RATIONALISATION

Spécifications d'impression Jusqu'à 12 ppm

Downgrade Windows 7 FAQ. 8 mars 2013

Tutoriel Création d une source Cydia et compilation des packages sous Linux

Annexe commune aux séries ES, L et S : boîtes et quantiles

CHECKLIST : OUVERTURE DES OFFRES

TP2_1 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3

Statistiques à une variable

UNE FORMATION POUR APPRENDRE À PRÉSENTER DES DONNÉES CHIFFRÉES : POUR QUI ET POURQUOI? Bénédicte Garnier & Elisabeth Morand

Travailler à l'ensimag avec son matériel personnel

Anne Tasso. Java. Le livre de. premier langage. 10 e édition. Avec 109 exercices corrigés. Groupe Eyrolles, , ISBN :

Extraction d informations stratégiques par Analyse en Composantes Principales

INFORMATIONS CONCERNANT L UTILISATION DES CAMÉRAS À DISTANCE POUR L HÔTEL BALTO

Poste virtuel. Installation du client CITRIX RECEIVER

SPHINX Logiciel de dépouillement d enquêtes

Quelques conseils de sécurité informatique

Migration de Kaspersky Vers Trend OfficeScan 10 dans une Ecole

Les nouveautés de FME 2014

Introduction à l analyse des statistiques des données : travaux pratiques avec le logiciel R.

1 Importer et modifier des données avec R Commander

Dive Center Manager. Outil de gestion clients pour Centre de plongée

Sauvegarde d'une base de données SQL Server Express 2005

Séance 0 : Linux + Octave : le compromis idéal

Open Source Professional Training

Guide d installation de MySQL

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Tutoriel : Utilisation du serveur de calcul à distance de PSE

Programmation Mobile Android Master CCI

Cours 1. I- Généralités sur R II- Les fonctions de R et autres objets III-Les vecteurs

Régression linéaire. Nicolas Turenne INRA

Avantages. Protection des réseaux corporatifs de gestion centralisée

Guide d installation

Votre plateforme vers l information instantanée

BACCALAURÉAT PROFESSIONNEL SUJET

Prise en main d une Cyberclasse

REMISE A NIVEAU DES SAVOIRS DE BASE INFORMATIQUE

Biostatistiques : Petits effectifs

INSTALLATION DE L AGENT CT EASY BACKUP LAN REV 1.0/

et de suivi de la corpulence des enfants

Guide d utilisation. Version document 0.8. Trouver toute la documentation sur :

Gestion commerciale et administrative de l'entreprise Avec Microsoft Office 2010

NOUVEAU COMPATIBLE COFRAC. Validez la conformité de vos échantillons en un seul geste. Le tube témoin enregistreur de température

PARAGON - Sauvegarde système

Configuration requise pour l utilisation de la plateforme EnlightKS Online Certification Management Services ET2.13 Juin 2011

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

FORMULAIRE DE STATISTIQUES

INITIATION AU LOGICIEL SAS

Groupe Eyrolles, 2005,

Leçon N 4 : Statistiques à deux variables

Mendeley, pour gérer sa bibliographie et la partager. Patricia Volland-Nail

Traitement des données avec Microsoft EXCEL 2010

Chapitre 3 : INFERENCE

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année

Transcription:

TP STA-MQGR UTILISATION PRATIQUE DU LOGICIEL STATISTIQUE «R» Seydou Barro SESSTIM, UMR 912, Aix-Marseille Université golo-seydou.barro@univ-amu.fr 1

INTRODUCTION R est un logiciel libre distribué gratuitement Il est très puissant et fournit les procédures usuelles pour l'analyse statistique des données Il possède des possibilités graphiques performantes pour explorer les données Il peut être utilisé aussi bien en mode interactif qu'en mode batch Il est multiplateforme (utilisable sur Linux, Windows et Mac OS) 2

Installation de R DECOUVERTE DE R Site principal: www.r-project.org Le téléchargement: à partir d'un des sites du ``Comprehensive R archive Network'' (CRAN) Téléchacharger et installer la version récente compatible avec l environnement de votre ordi Download R for Linux Download R for (Mac) OS X Download R for Windows 3

LANCEMENT DU LOGICIEL Invite de commandes Environnement de travail: Console 4

Premiers essais sur R R Comme calculatrice: > 4+4 [1] 8 Notion d objet: > x<-5 : (X = l objet, 5= la valeur de l objet) > x [1] 5 Notion de vecteur: Ensemble de valeur contenues dans un opérateur Exemple de relevés de chiffres de la TA: > TA<-c(10,11,8,13,15,11,16,9,19,26) > TA [1] 1011 813151116 91926 C = Vecteur 10, 11,8,... = Valeurs du vecteur 5

Saisir des données dans R On peut saisir des données directement dans R à partir du clavier. On peut le faire avec les commandes scan() ou data.frame() Exemple: on dispose de deux variables, taille en cm et poids en kg, mesurées chez 6 individus taille: 176; 185; 162; 188; 155 poids: 76; 65; 79; 84; 58 6

Saisir des données dans R Avec la commandes scan() > taille <-scan () 176 185 162 188 155 > poids <-scan () 76 65 79 84 58 >donnees <-data.frame(taille, poids) > edit(donnees) Avec data.frame () : data.frame() fait appel à la commande c(): > data.frame(taille=c(176 185 162 188 155), poids=c(76 65 79 84 58)) 7

UTILISATION DES DONNEES Utilisation de données externes: Importation de «Fichier Excel» Sauvegarde du fichier sous format.csv 8

Lire le fichier excel.csv avec R >donnut<-read.csv2("c:\\users\\seydou\\desktop\\sta-mqgr\\donnut.csv",sep=";",header=true) > 9

Vérification de l intégrité des données Colonnes Lignes 10

STATISTIQUES DE BASE Commande attach() Permet de manipuler les variables facilement >donnut<-read.csv2("c:\\users\\seydou\\desktop\\ STA-MQGR \\donnut.csv",sep=";",header=true) >attach(donnut) >poids [1] 85676471636780695581745473657479 [17] 75657070 11

STATISTIQUES DE BASE > mean(age) = Age moyen [1] 38.55 > median(poids) = Poids médian [1] 70 > var(taille) = Variance des tailles [1] 86.02895 > sd(taille) = Ecart-type des tailles [1] 9.275179 > min(taille) = Taille minimale [1] 154 > max(taille) = Taille maximale [1] 185 12

STATISTIQUE DE BASE Fonction summary() summary() donne les statistiques élémentaires >summary(donnut) = commentaires Commande tapply() Stratifie les statistiques par groupe Exple: statistiques élémentaires par sexe: >tapply(poids,sexe,summary) = commentaires Commande subset() selectionne un groupe Exple: données concernant les hommes > subset(donnut,sexe=="homme") = commentaire 13

TEST STATISTIQUES COURANTS (tests paramétriques) Comparaison de deux moyennes Cas 1: Variance homogènes (test de Student) >t.test(taille[sexe=="homme"],taille[sexe=="fe mme"],var.equal=true) Cas 2: Variance non homogène (test d Aspin-welch) >t.test(taille[sexe=="homme"],taille[sexe=="fe mme"]) Commentaires et différence entre ces 2 tests 14

TESTS STATISTIQUES Comparaison de deux variances Test de Bartlett Dispersion de la taille par sexe > bartlett.test(taille,sexe) Comparaison de deux pourcentages Test du Khi-deux Comparer le % de malades en fonction du sexe: >chisq.test(table(sexe,signe)) 15

TESTS NON PARAMETRIQUES Pour plus de 2 échantillons indépendants >kruskal.test(taille,sexe) Test de conformité (test de shapiro-wilks) Tester si un échantillon provient bien d une loi de probabilité donnée Test de kolmogorov-smirnov (KS) Peut être utilisé aussi pour d autres lois > ks.test(taille,"pnorm",mean(taille),sd(taille)) >shapiro.test(taille) 16

Quelques graphiques avec R Nuage de points Taille en fonction du poids > plot(taille, poids,xlab="taille(en cm)",ylab="poids(en kg)",col="blue",main="taille en fonction du poids") Nuage de points avec droite de régression > plot(poids~taille) > abline(lm(poids~taille)) Boxplot (boîte à moustaches) > boxplot(taille,horizontal=true,col="lightblue",main="boxplotdes tailles") Boxplot par groupe > boxplot(taille~sexe,col="lightblue",main="box plot des tailles en fonction du sexe") 17

R COMMANDER: package Rcmdr Interface graphique de R Sans programmation par ligne de commande 18

Quelques liens utiles Ressources sur le Web http://www.r-project.org/ http://cran.r-project.org/manuals.html http://cran.r-project.org/doc/manuals/r-intro.html http://cran.r-project.org/doc/manuals/r-data.html http://cran.r-project.org/faqs.html http://wiki.r-project.org/ https://stat.ethz.ch/mailman/listinfo/r-announce http://journal.r-project.org/ http://cran.r-project.org/doc/contrib/verzani-simpler.pdf http://rforsasandspssusers.com/ http://www.statmethods.net/ http://www.jstatsoft.org/ Ressources francophones http://cran.r-project.org/doc/contrib/paradis-rdebuts_fr.pdf http://pbil.univ-lyon1.fr/r/enseignement.html http://pbil.univ-lyon1.fr/r/html/cours1 http://zoonek2.free.fr/unix/48_r_2004/all.html http://www.r-project.org/mail.html 19