Initiation à l analyse statistique des données expérimentales



Documents pareils
Introduction à l analyse des statistiques des données : travaux pratiques avec le logiciel R.

Exemples d Analyses de Variance avec R

Introduction à R. Florence Yerly. Dept. de mathématiques, Université de Fribourg (CH) SP 2011

Cours 1. I- Généralités sur R II- Les fonctions de R et autres objets III-Les vecteurs

Introduction aux Statistiques et à l utilisation du logiciel R

Séance 0 : Linux + Octave : le compromis idéal

La place de SAS dans l'informatique décisionnelle

Introduction à MATLAB R

Présentation du logiciel

Pourquoi R devient incontournable en recherche, enseignement et développement

1 Introduction - Qu est-ce que le logiciel R?

Studio. HERITIER Emmanuelle PERSYN Elodie. SCHMUTZ Amandine SCHWEITZER Guillaume

Fiche d utilisation du logiciel. 1 - Installation. J. Thioulouse & D. Chessel

Je participe à la société branchée

URECA Initiation Matlab 2 Laurent Ott. Initiation Matlab 2

Statistiques à une variable

Guide plate-forme irptesting.com

Une introduction au langage R

L informatique en BCPST

Tivoli Endpoint Manager Introduction IBM Corporation

Université du Québec à Chicoutimi. Département d informatique et de mathématique. Plan de cours. Titre : Élément de programmation.

Calcul Formel et Numérique, Partie I

Bases de données documentaires et distribuées Cours NFE04

BUREAU VIRTUEL. Utilisation de l application sur ipad. Guide utilisateur. Sciences Po Utilisation du bureau virtuel sur ipad 1 / 6

Guide d installation de MySQL

Crédits photos Philippe Montigny, Christophe Lepetit, Pascal Bourguignon, Julien-René Jacque, Cédric Hesly.

MATLAB : COMMANDES DE BASE. Note : lorsqu applicable, l équivalent en langage C est indiqué entre les délimiteurs /* */.

STAGE IREM 0- Premiers pas en Python

BIRT (Business Intelligence and Reporting Tools)

Lire ; Compter ; Tester... avec R

Tutoriel code::blocks

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

Introduction à la présentation graphique avec xmgrace

MetaTrader pour IPhone. Guide d utilisation

A. À propos des annuaires

Distributeur des solutions ESET et 8MAN en France

Statistique : Résumé de cours et méthodes

Introduction à l informatique en BCPST

Remise à niveau d un programme JAVA du domaine public

Supervision et optimisation des licences

1. Présentation du TP

Calcul Scientifique avec 3

Informatique & Systèmes de Communication. Stages de 12 à 16 semaines aux Etats-Unis

Ce document a pour but de montrer comment installer votre plateforme de Trading MetaTrader4 sur Mac OS.

Bon ben voilà c est fait!

Service Informatique et Télématique (SITEL), Emile-Argand 11, 2009 Neuchâtel, Tél ,

Sécurité Informatique

Principes de mathématiques 12 SÉRIE DE PROBLÈMES. Septembre Student Assessment and Program Evaluation Branch

TP1 : LOGICIEL R ET PRÉDICTION DE L EFFLORESCENCE ALGALE

HTTP Commander. Table des matières. 1-Présentation de HTTP Commander

CREG : versailles.fr/spip.php?article803

Documents et démarches

Aide-mémoire de statistique appliquée à la biologie

ECLIPSE ET PDT (Php development tools)

Accéder à ZeCoffre via FTP

Initiation au logiciel R

TP 1 Introduction à Matlab Février 2009

Séries Statistiques Simples

Tutoriel Création d une source Cydia et compilation des packages sous Linux

Cours Numération Mathématique de base 1 MAT-B Alphabétisation

Cyberclasse L'interface web pas à pas

Tutoriel Mathematica Les graphiques

TP 1 Prise en main de l environnement Unix

Atelier Le gestionnaire de fichier

Comment accéder à d Internet Explorer

NiceLabel pour Services Microsoft Windows Terminal Serveur et Citrix MetaFrame

CAPTURE DES PROFESSIONNELS

PRISES DE VUE MUSEALES

ATELIERS WEB : création d'un site web enfants de CM2

Solution de Mobilité SAP SUP & AFARIA. Meltz Jérôme

Les bases de données Page 1 / 8

Module : Informatique Générale 1. Les commandes MS-DOS

Installer Office sur Ordinateur / Tablette / Smartphone

L analyse d images regroupe plusieurs disciplines que l on classe en deux catégories :

Système clients serveur Kwartz Vulgarisation, identification, dossier personnel

Bulletins de notes électroniques avec Nota Bene

Bases de données. Table des matières. Introduction. (ReferencePlus.ca)

Guide d utilisation de la clé USB pour login ebanking

Environnements de développement (intégrés)

TangibleData. Manipulation tangible et multitouch de bases de données

PRESENTATION RESSOURCES. Christian Dupaty BTS Systèmes Numériques Lycée Fourcade Gardanne Académie d Aix Marseille

VERSION 64 BITS DE SAS ET VOS FICHIERS MICROSOFT OFFICE 32-BITS

MetaTrader 4/5 pour Android. Guide de l utilisateur

Maintenabilité d un parc applicatif

Quantification Scalaire et Prédictive

Eclipse atelier Java

La version 3.0 de Corman S

La diffusion des résultats statistiques du recensement de la population

Recommendations de MetaQuotes pour utiliser MetaTrader 4 sur Mac

Comment créer des rapports de test professionnels sous LabVIEW? NIDays 2002

Introduction à la Visualisation Scientifique

IBM Tivoli Compliance Insight Manager

R00 Installation du logiciel R sous Windows

NOS FORMATIONS EN BUREAUTIQUE

Notes de cours Statistique avec le logiciel R

T500 DUAlTACH. JAQUET T500 DualTach Instrument de mesure et de surveillance équipé de 2 entrées fréquence TACHYMETRE 2 CANAUX

Introduction à la statistique non paramétrique

SPHINX Logiciel de dépouillement d enquêtes

E.N.T. Espace Numérique de Travail

Installation. Notes de Cours sur le logiciel R. Plan. Au démarrage

Transcription:

Initiation à l analyse statistique des données expérimentales Christophe Pallier et Christophe Lalanne christophe.pallier@m4x.org / christophe.lalanne@gmx.net Mastère de Sciences Cognitives, EHESS Paris 5 ENS Stats avec R p. 1

But du cours et Méthode Amener les étudiants au point d être capable de réaliser des analyses de données simples (comparaisons de moyennes, détection de corrélation,...) en comprenant ce qu ils font. Enseigner en parallèle les concepts théoriques et la pratique d un logiciel de statistique ( R ) Transmettre de bonnes habitudes : exploration graphique et descriptive des données. Travailler avec des jeux de données simulés et pas seulement des données réelles Stats avec R p. 2

Choix du logiciel de statistique R Avantages: logiciel très flexible et très puissant. Permettant de réaliser de une analyse de données de A à Z: 1. manipulations et transformation des données brutes 2. analyses statistique 3. génération de graphiques prêts à publiés. logiciel libre (et donc gratuit...) multiplateformes (Linux, MacOSX, Windows,...) de nombreuses documentations existent Particularité: R est un langage, ce qui rend son apprentissage plus difficile qu un logiciel cliquodrôme. Stats avec R p. 3

Ressources Livres conseillés: Howell, D.C. (1998). Méthodes Statistiques en Sciences Humaines. De Boeck Université. Crawley, M.J. (2005). Statistics An Introduction using R. Wiley. Sur le site de R (www.r-project.org) voir la rubrique Documentation/Other/Contributed. A signaler: R pour les débutants (pdf) Notes on the use of R for psychology experiments and questionnaires (pdf) Sur le Web: http://www.pallier.org/ressources/tp.stats/ (cours 2005 2006) www.aliquote.org/cours/index 2006.html (cours 2006 2007) zoonek2.free.fr/unix/48 R 2004/all.html (Statistiques avec R) Stats avec R p. 4

Démarrage de R, Accéder à l aide Ouvrir un terminal et entrer R. L interaction avec R se fait en tapant des commandes. Entrer les commandes suivantes: demo(graphics) demo(persp) help.start() help.search( Student )?t.test q() Stats avec R p. 5

Utiliser R comme une calculatrice opérations arithmétiques 3.14*5 1.05^6 (1+1i) * (5+6i) fonctions sin(pi/4) log10(20) lfactorial(100) variables a <- 34 a a + 1/a Stats avec R p. 6

Le vecteur, objet de base de R b <- c(1,10,20,50) # assignement b 1+b # opérations 2*b a <- c(0,1,0,1) a+b a %*% b # produit scalaire sqrt(b) log(b) mean(b) plot(b) plot(b,type= l ) # fonctions Stats avec R p. 7

Créer des vecteurs dat <- scan( ) dat (dat<-c(alpha=1,beta=3,delta=8)) dat <- runif(100,min=0,max=10) seq(1,10) 1:10 seq(1,10,by=2) # séries c(b,b) c(b,0,b,a) # concaténation rep(b,10) # répétitions rep(a,c(5,4,3,5)) gl(3,10) Stats avec R p. 8

Exercices Calculer la somme des nombres de 1 à 100 Calculer le produit des nombres de 1 à 100 Créer un vecteur contenant 10 1 suivi de 10 2 Créer un vecteur contenant 10 fois la série de nombre 1 à 10 Créer un vecteur contenant 1 1, puis 2 2, puis 3 3, jusqu à 20. Afficher la fonction log de factoriel sur l intervalle [1,100] Afficher la fonction sinus(x)/x sur l intervalle [-6π, 6π] Stats avec R p. 9

Quitter R, Workspace Quitter R: q() Redémarrer R, puis entrer: ls() history() Utiliser un éditeur de texte pour sauver les commandes suivantes dans un fichier monscript.r # monscript.r a<-scan( http://www.pallier.org/misc/a.dat ) max(a) Puis exécuter dans R: source( monscript.r,echo=t) Et, en ligne de commande unix: R -q --vanilla <monscript.r Stats avec R p. 10

fonctions graphiques Stats avec R p. 11

fonctions graphiques 1. Exécuter les lignes suivantes: a=rnorm(100,mean=100, sd=10) plot(a) boxplot(a) hist(a) rug(a) hist(a,breaks=20) plot(density(a)) qqnorm(a) 2. Jouer avec la taille de l échantillon alétoire (10, 20, 1000). 3. Essayer d autres lois: runif, rbinom, rcauchy 4. Afficher, côte à côte, 20 boxplots d échantillons normaux (N(0,1)) de 10 éléménts, puis de 100 éléments, puis de 1000 éléments 5. Créer un vecteur mixture (50 échantillons N(0,1) et 50 échantillons N(2,3)) et afficher son histogramme et sa densité estimée. Stats avec R p. 12

Exploration de données data(iris) help(iris) head(iris) summary(iris) attach(iris) plot(iris) plot(iris, col=as.numeric(iris$species)) boxplot(petal.length) boxplot(iris[,1:4]) boxplot(petal.width~species) Stats avec R p. 13

Exploration de données sujet=gl(10,10) condition=gl(5,2,100) y=rnorm(100,mean=10)+rep(rnorm(10,sd=2),rep(10,10))+ \ rep(rep(rnorm(5),2),10) d<-data.frame(sujet,condition,y) d table(a,b) par(mfrow=c(2,2)) plot(y~sujet) barplot(tapply(y,sujet,mean)) plot(y~condition) barplot(tapply(y,condition,mean)) x11() interaction.plot(condition,sujet,y) l=aov(y~condition+error(sujet/condition)) summary(l) Stats avec R p. 14

Résumé des commandes graphiques de base univarié: continue: hist(x), rug(x), plot(density(x)), boxplot(x) discrete: barplot(table(x)) bivarié (2 variables) continues: plot(x, y), qqplot(x, y) discretes: mosaicplot(x, y) 1 continue, 1 discrete: boxplot(x a) multivariées: matplot, pairs, ggobi Stats avec R p. 15