INTRODUCTION AU LOGICIEL R

Dimension: px
Commencer à balayer dès la page:

Download "INTRODUCTION AU LOGICIEL R"

Transcription

1 INTRODUCTION AU LOGICIEL R 2., lois de probabilité. Anne Dubois, Julie Bertrand, Emmanuelle Comets emmanuelle.comets@inserm.fr INSERM UMR738 E. Comets (UMR738) Introduction à R - Novembre / 46

2 Plan Dataframe Format d un dataframe Ecriture et lecture de fichiers Manipulation d un dataframe Tri Moyenne et variance Corrélation et covariance Quantiles Exercice Lois de probabilité Tirage d échantillons aléatoires Principales distributions statistiques E. Comets (UMR738) Introduction à R - Novembre / 46

3 Remise en jambe (1) Dataframe 1 À l aide des fonctions rep, seq et c seulement, générer les séquences suivantes : a) b) c) d) e) f) g) Générer les suites de nombres suivantes à l aide des fonctions : et rep seulement, donc sans utiliser la fonction seq : a) b) c) d) e) E. Comets (UMR738) Introduction à R - Novembre / 46

4 Remise en jambe (2) Dataframe 3 Reprendre la séquence (d) précédente remplacer toutes les valeurs négatives par NA compter le nombre de valeurs NA remplacer les valeurs négatives par -10 E. Comets (UMR738) Introduction à R - Novembre / 46

5 Remise en jambe (3) Dataframe 4 Soit la matrice : x<-matrix(1:120,ncol=12) Affichez toutes les lignes de la matrice commençant par un nombre pair Affichez toutes les lignes de la matrice dont la moyenne est inférieure à 60 Affichez toutes les colonnes de la matrice dont la somme est inférieure à 500 Sélectionnez la sous-matrice formée des lignes de la matrice dont la moyenne est inférieure à 60 et des colonnes dont la somme est inférieure à 500 Sélectionnez la même sous-matrice, sauf la troisième ligne Bien sûr, une seule ligne est nécessaire à chaque fois pour effectuer ces opérations... E. Comets (UMR738) Introduction à R - Novembre / 46

6 Plan Dataframe Format d un dataframe Ecriture et lecture de fichiers Manipulation d un dataframe Tri Dataframe Format d un dataframe Ecriture et lecture de fichiers Manipulation d un dataframe Tri Moyenne et variance Corrélation et covariance Quantiles Exercice Lois de probabilité Tirage d échantillons aléatoires Principales distributions statistiques E. Comets (UMR738) Introduction à R - Novembre / 46

7 Les dataframes Dataframe Format d un dataframe Ecriture et lecture de fichiers Manipulation d un dataframe Tri format de jeu de données structuré un jeu de données réelles a naturellement le format d un dataframe nombreux jeux de données structurés disponibles sous R Exemple : jeu de données pressure sur la relation entre la température en degrés et la pression en millimètres de mercure : > pressure temperature pressure E. Comets (UMR738) Introduction à R - Novembre / 46

8 Manipulation d un dataframe Format d un dataframe Ecriture et lecture de fichiers Manipulation d un dataframe Tri Pour récupérer une variable on utilise le caractère $ : > pressure$temperature [1] On peut aussi référencer la colonne comme pour une matrice: > pressure[,1] Ou encore les appeler par le nom de la colonne : > pressure[,"temperature"] Les 2 premiers éléments de temperature s écriront indifféremment : > pressure$temperature[1:2] > pressure[1:2,1] > pressure[1:2,"temperature"] E. Comets (UMR738) Introduction à R - Novembre / 46

9 Attacher un jeu de données Format d un dataframe Ecriture et lecture de fichiers Manipulation d un dataframe Tri On peut aussi "attacher" le jeu de données pour avoir un accès direct aux variables : > attach(pressure) > temperature [1] Attention : on peut modifier le vecteur temperature mais ça ne change rien au dataframe test. C est comme si on avait une copie des variables. Par contre si on travaille sur test$temperature on modifie bien test. Pour "détacher" le dataframe, on utilise : detach(test) E. Comets (UMR738) Introduction à R - Novembre / 46

10 Ecriture de fichiers Dataframe Format d un dataframe Ecriture et lecture de fichiers Manipulation d un dataframe Tri pressure est disponible sous R dans la librairie datasets. Pour sauver le jeu de données dans un fichier essai.dat : > write.table(pressure,"essai.dat",row.names=f) L option row.names=f est nécessaire pour éviter d écrire un numéro au début de chaque ligne. La fonction sink permet de rediriger la sortie (normalement à l écran) vers un fichier : > sink("essai.dat") > print(pressure) > sink() Elle donne ici un résultat similaire à : > write.table(pressure,"essai.dat") E. Comets (UMR738) Introduction à R - Novembre / 46

11 Lecture de fichiers (1) Format d un dataframe Ecriture et lecture de fichiers Manipulation d un dataframe Tri Pour lire le dataframe test à partir du fichier essai.dat : > test <- read.table("essai.dat",header=t) La table contient un en-tête (header) avec le nom des variables (les colonnes). Ces fonctions lisent des formats bien tabulés sans trous. Des options existent pour spécifier le séparateur de champs, le nombre de lignes lues, le nombre de lignes à sauter avant de commencer la lecture,... E. Comets (UMR738) Introduction à R - Novembre / 46

12 Lecture de fichiers (2) Format d un dataframe Ecriture et lecture de fichiers Manipulation d un dataframe Tri Fonction la plus générale pour la lecture de fichiers : scan > namcol<-scan("essai.dat",nlines=1,what="char") > test <- scan("essai.dat",skip=1) > test<-matrix(test,ncol=4,byrow=t,dimnames=list(c(),namcol)) > test temperature pressure Nécessite de spécifier le type (si différent de "numeric"). Permet de lire certaines lignes seulement d un fichier. Permet de gérer des fichiers de structure particulière (ex : "parser" un fichier texte). E. Comets (UMR738) Introduction à R - Novembre / 46

13 Lecture au clavier Dataframe Format d un dataframe Ecriture et lecture de fichiers Manipulation d un dataframe Tri scan peut aussi être utilisé pour la lecture au clavier (input). Au lieu d un nom de fichier, on utilise "" : > x<-scan("",nlines=2) 1: 2 2: 3.2 Read 2 items > x [1] Par défaut, la fonction attend un nombre, mais le type de données attendu peut être modifié : > noms<-scan("",nlines=2,what=character()) 1: Paul 2: Pierre Read 2 items > noms [1] "Paul" "Pierre" E. Comets (UMR738) Introduction à R - Novembre / 46

14 Extraction d une sous-base Format d un dataframe Ecriture et lecture de fichiers Manipulation d un dataframe Tri On utilise la base airquality, disponible dans R. Si l on veut extraire la sous-base pour laquelle la température est > 92 F : > air1 <- subset(airquality, Temp > 92) > air1 Ozone Solar.R Wind Temp Month Day 42 NA On peut également utiliser : > air1<-airquality[airquality$temp>92,] E. Comets (UMR738) Introduction à R - Novembre / 46

15 Transformation de données (1) Format d un dataframe Ecriture et lecture de fichiers Manipulation d un dataframe Tri Pour ajouter dans air1 la variable logtemp, log de la température, on a également plusieurs choix : >air1<-transform(air1,logtemp=log(temp)) > air1 Ozone Solar.R Wind Temp Month Day logtemp 42 NA ou : >air1$logtemp<-log(air1$temp) ou encore: >air1<-cbind(air1,logtemp=log(air1$temp)) E. Comets (UMR738) Introduction à R - Novembre / 46

16 Transformation de données (2) Format d un dataframe Ecriture et lecture de fichiers Manipulation d un dataframe Tri On peut créer une variable indicatrice à l aide de la fonction ifelse. On souhaite par exemple créer la variable ftemp qui vaut 1 si Temp > 94 F, 0 sinon : > air1<-transform(air1,ftemp=ifelse(temp>94,1,0)) > air1 Ozone Solar.R Wind Temp Month Day ftemp 42 NA ou encore : > air1$ftemp<-ifelse(air1$temp>94,1,0) E. Comets (UMR738) Introduction à R - Novembre / 46

17 Extraction de données : exercice Format d un dataframe Ecriture et lecture de fichiers Manipulation d un dataframe Tri Créer à partir de air1 le dataframe air2, où : 1) la variable Ozone n est pas manquante 2) la température est 94 F Créer à partir de airquality le dataframe air3, où la variable Ozone n est pas manquante. Ajouter une colonne à air3 représentant une variable valant 1 si : 1) on est dans les 6 premiers mois de l année 2) la température est supérieure à 80 F et 0 sinon. E. Comets (UMR738) Introduction à R - Novembre / 46

18 Ordonner selon une variable Format d un dataframe Ecriture et lecture de fichiers Manipulation d un dataframe Tri Pour effectuer l équivalent de la Proc sort de SAS, on utilise la fonction order. Pour ordonner air1 selon la valeur de Temp : > air1[order(air1$temp),] Ozone Solar.R Wind Temp Month Day ftemp 42 NA On peut trier sur plusieurs variables : > air1[order(air1$month,air1$day),] Ozone Solar.R Wind Temp Month Day 42 NA E. Comets (UMR738) Introduction à R - Novembre / 46

19 La fonction match Dataframe Format d un dataframe Ecriture et lecture de fichiers Manipulation d un dataframe Tri match teste si un élément est présent dans un vecteur. > month.name [1] "January" "February" "March" "April" "May"... > match(c("mai","may"),month.name,nomatch=0) [1] 0 5 Application : rajouter une colonne avec le nom du mois à air1 > NamMon<-month.name[match(air1$Month,1:12)] > transform(air1,nammon=nammon) Ozone Solar.R Wind Temp Month Day NamMon 42 NA June August September Outil très puissant pour manipuler plusieurs bases de données avec un identifiant commun (ex : le numéro d identification du patient). E. Comets (UMR738) Introduction à R - Novembre / 46

20 Exercice Dataframe Format d un dataframe Ecriture et lecture de fichiers Manipulation d un dataframe Tri On vous donne un relevé des profondeurs de glace relevées dans une station météo avec les dates correspondantes : dates<-c(" "," "," ", " "," "," "," ", " "," "," "," ", " "," "," "," ", " "," ") mesure<-c(64,69,71,71,71,32,42,28,32,18,25,29,34,36,42, 50,61) Extraire de ce vecteur la première incidence de chaque profondeur mesurée, en utilisant la fonction match. Trier les mesures de glace dans l ordre croissant et créer une matrice avec comme première colonne les mesures triées et comme deuxième colonne les dates correspondantes (nécessite un tri simultané!) E. Comets (UMR738) Introduction à R - Novembre / 46

21 Plan Dataframe Moyenne et variance Corrélation et covariance Quantiles Exercice Dataframe Format d un dataframe Ecriture et lecture de fichiers Manipulation d un dataframe Tri Moyenne et variance Corrélation et covariance Quantiles Exercice Lois de probabilité Tirage d échantillons aléatoires Principales distributions statistiques E. Comets (UMR738) Introduction à R - Novembre / 46

22 Moyenne et médiane Dataframe Moyenne et variance Corrélation et covariance Quantiles Exercice Moyenne : fonction mean Médiane : fonction median > x<-c(4,6,2,9,0,1,2) > x [1] > mean(x) [1] > median(x) [1] 2 E. Comets (UMR738) Introduction à R - Novembre / 46

23 Moyenne et variance Corrélation et covariance Quantiles Exercice Moyenne et médiane en présence de valeurs manquantes Option na.rm=t pour ignorer les valeurs manquantes > x[3]<-na > x [1] 4 6 NA > mean(x) [1] NA > mean(x,na.rm=t) [1] > median(x) [1] NA > median(x,na.rm=t) [1] 3 E. Comets (UMR738) Introduction à R - Novembre / 46

24 Moyenne et variance Corrélation et covariance Quantiles Exercice Moyenne en enlevant les valeurs extrêmes Autre option utile trim=f : où f [0,0.5] enlève un pourcentage d observations égal à f de part et d autre avant de calculer la moyenne peut être utilisé pour calculer une moyenne robuste > x<-c(4,6,2,9,0,1,2) > mean(x,trim=0.2) [1] 3 E. Comets (UMR738) Introduction à R - Novembre / 46

25 Variance et écart-type Moyenne et variance Corrélation et covariance Quantiles Exercice Variance : fonction var Ecart-type : fonction sd On a la même option pour ignorer les valeurs manquantes : > x<-c(4,6,2,9,0,1,2) > var(x) [1] > sd(x) [1] > sqrt(var(x)) [1] > x[3]<-na > var(x) Erreur dans var(x) : observations manquantes dans cov / cor > var(x,na.rm=t) [1] E. Comets (UMR738) Introduction à R - Novembre / 46

26 Corrélation (1) Dataframe Moyenne et variance Corrélation et covariance Quantiles Exercice Fonction cor(x,y) : coefficient de corrélation entre x et y Par défaut, calcul du coefficient de corrélation de Pearson : ΣX ΣY ΣXY r = N (ΣX 2 (ΣX)2 )( ΣY 2 (ΣY)2 ) N N (1) > x<-c(4,6,2,9,0,1,2) > y<-c(9,2,5,1,6,0,3) > cor(x,y) [1] E. Comets (UMR738) Introduction à R - Novembre / 46

27 Corrélation (2) Dataframe Moyenne et variance Corrélation et covariance Quantiles Exercice Options method : deux autres coefficients de corrélation (association basée sur les rangs) method="kendall" : τ de Kendall (coefficient de corrélation des rangs de Kendall) method="spearman" : ρ de Spearman use="c" : pour ignorer les valeurs manquantes Calcul des coefficients de corrélation non-paramétriques > x<-c(4,6,2,9,0,1,2) > y<-c(9,2,5,1,6,0,3) > cor(x,y,method="spearman") [1] > cor(x,y,method="k") [1] Note : on peut juste écrire la première lettre de la méthode E. Comets (UMR738) Introduction à R - Novembre / 46

28 Covariance Dataframe Moyenne et variance Corrélation et covariance Quantiles Exercice Fonction cov(x,y) : covariance entre x et y. > x<-c(4,6,2,9,0,1,2) > y<-c(9,2,5,1,6,0,3) > cov(x,y) [1] Notes : mêmes options que pour cor method, na.rm=t x et y peuvent être des matrices cov renvoie alors la matrice de variance-covariance entre les colonnes de x et de y E. Comets (UMR738) Introduction à R - Novembre / 46

29 Quantiles Dataframe Moyenne et variance Corrélation et covariance Quantiles Exercice On peut obtenir les quantiles empiriques d un vecteur > quantile(x) 0% 25% 50% 75% 100% Par défaut, on a le min, le max, et les 3 quartiles (0.25, 0.5 et 0.75 quantiles). Pour obtenir les autres quantiles, par exemple les déciles: > dec<-seq(0,1,0.1) > dec [1] > quantile(x,dec) 0% 10% 20% 30% 40% 50% % 70% 80% 90% 100% E. Comets (UMR738) Introduction à R - Novembre / 46

30 Moyenne et variance Corrélation et covariance Quantiles Exercice Attention aux fonctions appliquées à un tableau Comme la plupart des fonctions, quantile ne calcule pas les statistiques d un tableau ou d un data.frame colonne par colonne mais le considère comme un grand vecteur : > x=matrix(seq(1:100),ncol=4) > quantile(x) 0% 25% 50% 75% 100% La fonction summary est utilisée pour préserver cette structure. > summary(x) X1 X2 X3 X4 Min. : 1 Min. :26 Min. :51 Min. : 76 1st Qu.: 7 1st Qu.:32 1st Qu.:57 1st Qu.: 82 Median :13 Median :38 Median :63 Median : 88 Mean :13 Mean :38 Mean :63 Mean : 88 3rd Qu.:19 3rd Qu.:44 3rd Qu.:69 3rd Qu.: 94 Max. :25 Max. :50 Max. :75 Max. :100 E. Comets (UMR738) Introduction à R - Novembre / 46

31 Plus généralement Dataframe Moyenne et variance Corrélation et covariance Quantiles Exercice La fonction apply sert à appliquer une autre fonction de façon répétée sur les lignes ou les colonnes d un tableau. Par exemple : > apply(x,2,quantile) [,1] [,2] [,3] [,4] 0% % % % % calcule les quantiles par défaut pour les 4 colonnes de la matrice x (avec 1 à la place de 2, ce serait pour les lignes). Il est possible de spécifier des options pour la fonction appelée par apply : > apply(x,2,quantile,c(0.05,0.95)) [,1] [,2] [,3] [,4] 5% % E. Comets (UMR738) Introduction à R - Novembre / 46

32 Moyenne et variance Corrélation et covariance Quantiles Exercice Vue d ensemble d un jeu de données La fonction summary donne un résumé quantitatif. Une vue d ensemble de la structure d un jeu de données est fournie par str : > str(airquality) data.frame : 153 obs. of 6 variables: $ Ozone : int NA NA... $ Solar.R: int NA NA $ Wind : num $ Temp : int $ Month : int $ Day : int E. Comets (UMR738) Introduction à R - Novembre / 46

33 Exercice Dataframe Moyenne et variance Corrélation et covariance Quantiles Exercice Créez une matrice x portant les chiffres de 1 à 100, en 4 colonnes Calculer les quantiles 0.1 et 0.9 de chaque colonne Calculer les quantiles 0.1 et 0.9 de chaque ligne E. Comets (UMR738) Introduction à R - Novembre / 46

34 Moyenne et variance Corrélation et covariance Quantiles Exercice comme en SAS (1) Il existe une version de summary produisant des tableaux de statistiques descriptives ressemblant à ceux de SAS. Elle est définie dans la librairie Hmisc : > library(hmisc) > options(digits=3) > sex <- factor(sample(c("m","f"), 500, rep=true)) > age <- rnorm(500, 50, 5) > treatment <- factor(sample(c("drug","placebo"), 500, rep=true)) > db<-data.frame(npat=factor(1:500),sex,age,treatment) > summary(age~factor(sex)) age N= N age factor(sex) f m Overall E. Comets (UMR738) Introduction à R - Novembre / 46

35 Moyenne et variance Corrélation et covariance Quantiles Exercice comme en SAS (2) On peut demander des statistiques plus élaborées en définissant des fonctions adaptées : > g<-function(x){ > c(smean.sd(x),median(x),quantile(x,prob=c(0.25,0.75))) > } > f<-summary(age~factor(sex),fun=g) > f age N= N Mean SD 25% 75% factor(sex) f m Overall E. Comets (UMR738) Introduction à R - Novembre / 46

36 Exercice Dataframe Moyenne et variance Corrélation et covariance Quantiles Exercice Créez une matrice x portant les chiffres de 1 à 100, en 4 colonnes Calculez la moyenne et la variance de x des colonnes de x des 3 premières lignes de x Prendre le jeu de données interne à R appelé ToothGrowth le visualiser pour se faire une idée de son contenu (utilisez l aide) la première colonne représente la longueur des dents de cochons d inde soumis à différents régimes ranger la première colonne par colonnes dans une matrice à 6 colonnes mat calculer la matrice de corrélations entre les colonnes de mat E. Comets (UMR738) Introduction à R - Novembre / 46

37 Lois de probabilité Tirage d échantillons aléatoires Principales distributions statistiques Plan Dataframe Format d un dataframe Ecriture et lecture de fichiers Manipulation d un dataframe Tri Moyenne et variance Corrélation et covariance Quantiles Exercice Lois de probabilité Tirage d échantillons aléatoires Principales distributions statistiques E. Comets (UMR738) Introduction à R - Novembre / 46

38 Lois de probabilité Tirage d échantillons aléatoires Principales distributions statistiques Loi normale Pour chaque distribution qu il connait, R va en général définir 4 fonctions associées. Pour la loi normale, le suffixe général est norm et il va être précédé de 4 lettres, d, p, q ou r pour définir 4 fonctions : dnorm(x,µ,σ) : densité pnorm(x,µ,σ) : probabilité (x µ)2 f(x) = 1 e 2σ 2 2πσ F(x) = Z x f(u) du qnorm(α q,µ,σ) : quantile correspondant de la distribution, c est-à-dire pour α q donné la valeur de x pour laquelle F(x) =P(X x) = α q rnorm(n,µ,σ) : échantillon aléatoire de taille n E. Comets (UMR738) Introduction à R - Novembre / 46

39 Lois de probabilité Tirage d échantillons aléatoires Principales distributions statistiques Quantiles d une loi normale On utilise la fonction qnorm() pour connaître les valeurs seuils pour la distribution considérée. Par exemple, pour la loi normale, les bornes de l intervalle de confiance à 95% sont données par les valeurs correspondant aux quantiles à 2.5 et 97.5% : > qnorm(0.025) [1] > qnorm(0.975) [1] soit si on arrondit [-1.96; 1.96]. E. Comets (UMR738) Introduction à R - Novembre / 46

40 Lois de probabilité Tirage d échantillons aléatoires Principales distributions statistiques Exemple Probabilité d observer une réalisation de la variable inférieure à une valeur donnée si X est tirée dans une loi normale ℵ(0,1) : pnorm() > 1-pnorm(1) [1] > 1-pnorm(1.96) [1] Probabilité d observer les mêmes valeurs si X est tirée dans une loi du χ 2 à 1 degré de liberté : pchisq() > 1-pchisq(1,1) [1] > 1-pchisq(1.96,1) [1] E. Comets (UMR738) Introduction à R - Novembre / 46

41 Lois de probabilité Tirage d échantillons aléatoires Principales distributions statistiques Tirage dans une loi normale Utilisation de la fonction rnorm() : > rnorm(10,5,1) [1] [9] Par défaut, tirage dans une loi normale ℵ(0,1) > rnorm(10) [1] [7] E. Comets (UMR738) Introduction à R - Novembre / 46

42 Lois de probabilité Tirage d échantillons aléatoires Principales distributions statistiques Tirage d échantillons avec ou sans remise La fonction sample() est utilisée. Sa syntaxe est la suivante : sample(x, size, replace = FALSE, prob = NULL) Par exemple : > x<-1:10 > sample(x,3) [1] Par défaut, il est effectué un tirage sans remise. Pour demander un tirage avec remise, utiliser replace=t : > sample(x,7,replace=t) [1] Cette fonction sera très utile pour faire du rééchantillonnage (bootstrap). E. Comets (UMR738) Introduction à R - Novembre / 46

43 Lois de probabilité Tirage d échantillons aléatoires Principales distributions statistiques Exercice Créer un vecteur de 10 valeurs en tirant : les 6 premières dans ℵ(2, 5) les 4 suivantes dans ℵ( 1,4) Tirer un vecteur v1 de 10 valeurs dans une mixture de 2 lois normales : ℵ(2, 5) ℵ( 1, 4) avec une probabilité Calculez la moyenne de v1 répétez l opération 10 fois en conservant les moyennes des 10 échantillons v1 successifs dans un vecteur Recommencez la même opération en tirant un échantillon v2 dans une mixture avec une probabilité comparez les moyennes obtenues pour v1 et v2 E. Comets (UMR738) Introduction à R - Novembre / 46

44 Lois de probabilité Tirage d échantillons aléatoires Principales distributions statistiques Exercice Dans un essai clinique, on suppose que la clairance à la créatinine des patients recrutés suit une loi normale de moyenne 120 ml/min, avec un écart-type de 40 ml/min. Si on prend 10 patients au hasard, quelle est la probabilité p1 que la clairance moyenne soit inférieure à 130? Quelle est la probabilité qu elle soit comprise entre 120 et 130? Combien de sujets faudrait-il prendre pour que la probabilité p1 soit d au moins 95%? E. Comets (UMR738) Introduction à R - Novembre / 46

45 Lois de probabilité Tirage d échantillons aléatoires Principales distributions statistiques Principales distributions statistiques (1) Nom Distribution Paramètres par défaut dnorm() normale N (µ= 0,σ = 1) dlnorm() log-normale LN (µ= 0,σ = 1) dunif() uniforme U(a = 0,b = 1) dpois() Poisson P(λ) dexp() exponentielle E(λ = 1) dbinom() binômiale B(n, p) dnbinom() binômiale négative BN (n, p) dchisq() chi-deux χ 2 (n) ( ) df() F F (n 1,n 2 ) E. Comets (UMR738) Introduction à R - Novembre / 46

46 Lois de probabilité Tirage d échantillons aléatoires Principales distributions statistiques Principales distributions statistiques (2) Nom Distribution Paramètres par défaut dt() Student T (df,δ ) dlogis() logistique L(α = 0, β = 1) dgeom() géométrique G(p) dweibull() Weibull W (γ,β = 1) dhyper() hypergéométrique H (m, n, k) dbeta() Beta β(α, β) dgamma() Gamma Γ(γ, β = 1) dcauchy() Cauchy C(α = 0,β = 1) δ : paramètre de non-centralité, optionnel E. Comets (UMR738) Introduction à R - Novembre / 46

Lire ; Compter ; Tester... avec R

Lire ; Compter ; Tester... avec R Lire ; Compter ; Tester... avec R Préparation des données / Analyse univariée / Analyse bivariée Christophe Genolini 2 Table des matières 1 Rappels théoriques 5 1.1 Vocabulaire....................................

Plus en détail

TABLE DES MATIERES. C Exercices complémentaires 42

TABLE DES MATIERES. C Exercices complémentaires 42 TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence

Plus en détail

Introduction à R. Florence Yerly. Dept. de mathématiques, Université de Fribourg (CH) SP 2011

Introduction à R. Florence Yerly. Dept. de mathématiques, Université de Fribourg (CH) SP 2011 Dept. de mathématiques, Université de Fribourg (CH) SP 2011 Qu est ce que R? Un logiciel de statistiques libre et gratuit ; Un logiciel multi-plateforme (UNIX, Windows MacOS X) R permet de faire des calculs

Plus en détail

Introduction à la statistique non paramétrique

Introduction à la statistique non paramétrique Introduction à la statistique non paramétrique Catherine MATIAS CNRS, Laboratoire Statistique & Génome, Évry http://stat.genopole.cnrs.fr/ cmatias Atelier SFDS 27/28 septembre 2012 Partie 2 : Tests non

Plus en détail

Introduction aux Statistiques et à l utilisation du logiciel R

Introduction aux Statistiques et à l utilisation du logiciel R Introduction aux Statistiques et à l utilisation du logiciel R Christophe Lalanne Christophe Pallier 1 Introduction 2 Comparaisons de deux moyennes 2.1 Objet de l étude On a mesuré le temps de sommeil

Plus en détail

Fiche d utilisation du logiciel. 1 - Installation. J. Thioulouse & D. Chessel

Fiche d utilisation du logiciel. 1 - Installation. J. Thioulouse & D. Chessel Fiche d utilisation du logiciel 1 - Installation J. Thioulouse & D. Chessel Résumé Cette fiche est une introduction à l'utilisation du logiciel R pour les trois environnements Unix, Windows et MacOS. Plan

Plus en détail

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

Extraction d informations stratégiques par Analyse en Composantes Principales

Extraction d informations stratégiques par Analyse en Composantes Principales Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 dousset@irit.fr 1 Introduction

Plus en détail

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

La survie nette actuelle à long terme Qualités de sept méthodes d estimation La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg

Plus en détail

Annexe commune aux séries ES, L et S : boîtes et quantiles

Annexe commune aux séries ES, L et S : boîtes et quantiles Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans

Plus en détail

TSTI 2D CH X : Exemples de lois à densité 1

TSTI 2D CH X : Exemples de lois à densité 1 TSTI 2D CH X : Exemples de lois à densité I Loi uniforme sur ab ; ) Introduction Dans cette activité, on s intéresse à la modélisation du tirage au hasard d un nombre réel de l intervalle [0 ;], chacun

Plus en détail

Actuariat I ACT2121. septième séance. Arthur Charpentier. Automne 2012. charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free.

Actuariat I ACT2121. septième séance. Arthur Charpentier. Automne 2012. charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free. Actuariat I ACT2121 septième séance Arthur Charpentier charpentier.arthur@uqam.ca http ://freakonometrics.blog.free.fr/ Automne 2012 1 Exercice 1 En analysant le temps d attente X avant un certain événement

Plus en détail

Tests statistiques et régressions logistiques sous R, avec prise en compte des plans d échantillonnage complexes

Tests statistiques et régressions logistiques sous R, avec prise en compte des plans d échantillonnage complexes , avec prise en compte des plans d échantillonnage complexes par Joseph LARMARANGE version du 29 mars 2007 Ce cours a été développé pour une formation niveau M2 et Doctorat des étudiants du laboratoire

Plus en détail

Estimation et tests statistiques, TD 5. Solutions

Estimation et tests statistiques, TD 5. Solutions ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études

Plus en détail

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques

Plus en détail

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques. 14-3- 214 J.F.C. p. 1 I Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques. Exercice 1 Densité de probabilité. F { ln x si x ], 1] UN OVNI... On pose x R,

Plus en détail

INTRODUCTION AU LOGICIEL R

INTRODUCTION AU LOGICIEL R INTRODUCTION AU LOGICIEL R Variables et mise en jambe Anne Dubois, Julie Bertrand, Emmanuelle Comets emmanuelle.comets@inserm.fr INSERM UMR738 (UMR738) 1 / 68 Sur le site www.cran.r-project.org : Ou trouver

Plus en détail

Statistiques Descriptives à une dimension

Statistiques Descriptives à une dimension I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des

Plus en détail

Initiation au logiciel R

Initiation au logiciel R Université Paris Dauphine Année 2005 2006 U.F.R. Mathématiques de la Décision MAT-6-3 : Statistique exploratoire et numérique (NOISE) Initiation au logiciel R Jean-Michel MARIN Ce document a pour objectif

Plus en détail

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre. Université de Nantes Année 2013-2014 L3 Maths-Eco Feuille 6 : Tests Exercice 1 On cherche à connaître la température d ébullition µ, en degrés Celsius, d un certain liquide. On effectue 16 expériences

Plus en détail

Simulation de variables aléatoires

Simulation de variables aléatoires Chapter 1 Simulation de variables aléatoires Références: [F] Fishman, A first course in Monte Carlo, chap 3. [B] Bouleau, Probabilités de l ingénieur, chap 4. [R] Rubinstein, Simulation and Monte Carlo

Plus en détail

Gestion des données avec R

Gestion des données avec R Gestion des données avec R Christophe Lalanne & Bruno Falissard Table des matières 1 Introduction 1 2 Importation de fichiers CSV 1 2.1 Structure du fichier de données...................................

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

Relation entre deux variables : estimation de la corrélation linéaire

Relation entre deux variables : estimation de la corrélation linéaire CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence

Plus en détail

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction

Plus en détail

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #16

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #16 ACTUARIAT 1, ACT 2121, AUTOMNE 201 #16 ARTHUR CHARPENTIER 1 Dans une petite compagnie d assurance le nombre N de réclamations durant une année suit une loi de Poisson de moyenne λ = 100. On estime que

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

Aide-mémoire de statistique appliquée à la biologie

Aide-mémoire de statistique appliquée à la biologie Maxime HERVÉ Aide-mémoire de statistique appliquée à la biologie Construire son étude et analyser les résultats à l aide du logiciel R Version 5(2) (2014) AVANT-PROPOS Les phénomènes biologiques ont cela

Plus en détail

Cours 1. I- Généralités sur R II- Les fonctions de R et autres objets III-Les vecteurs

Cours 1. I- Généralités sur R II- Les fonctions de R et autres objets III-Les vecteurs Cours 1 I- Généralités sur R II- Les fonctions de R et autres objets III-Les vecteurs IV-Les facteurs I-1 Généralités sur R R (1995, AT&T Bell Laboratories) est un logiciel d analyse statistique et graphique,

Plus en détail

Statistique Descriptive Élémentaire

Statistique Descriptive Élémentaire Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Élémentaire (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219 Université Paul Sabatier

Plus en détail

SAS de base : gestion des données et procédures élémentaires

SAS de base : gestion des données et procédures élémentaires 1 SAS de base : gestion des données et procédures élémentaires SAS de base : gestion des données et procédures élémentaires Résumé Description des commandes (module SAS de base) les plus utiles de l étape

Plus en détail

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent

Plus en détail

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Yves Aragon, David Haziza & Anne Ruiz-Gazen GREMAQ, UMR CNRS 5604, Université des Sciences

Plus en détail

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé A. P. M. E. P. Exercice 1 5 points 1. Réponse d. : 1 e Le coefficient directeur de la tangente est négatif et n est manifestement pas 2e

Plus en détail

Une introduction au langage R

Une introduction au langage R Une introduction au langage R Faouzi LYAZRHI UP Biostatistique Ecole Nationale Vétérinaire, 23, chemin des Capelles, BP 87614, F-31076 Toulouse cédex email : f.lyazrhi@envt.fr 2005 1. INSTALLER R 3 2.

Plus en détail

I3, Probabilités 2014 Travaux Dirigés F BM F BM F BM F BM F B M F B M F B M F B M 20 20 80 80 100 100 300 300

I3, Probabilités 2014 Travaux Dirigés F BM F BM F BM F BM F B M F B M F B M F B M 20 20 80 80 100 100 300 300 I3, Probabilités 2014 Travaux Dirigés TD 1 : rappels. Exercice 1 Poker simplié On tire 3 cartes d'un jeu de 52 cartes. Quelles sont les probabilités d'obtenir un brelan, une couleur, une paire, une suite,

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

Précision d un résultat et calculs d incertitudes

Précision d un résultat et calculs d incertitudes Précision d un résultat et calculs d incertitudes PSI* 2012-2013 Lycée Chaptal 3 Table des matières Table des matières 1. Présentation d un résultat numérique................................ 4 1.1 Notations.........................................................

Plus en détail

Traitement des données avec Microsoft EXCEL 2010

Traitement des données avec Microsoft EXCEL 2010 Traitement des données avec Microsoft EXCEL 2010 Vincent Jalby Septembre 2012 1 Saisie des données Les données collectées sont saisies dans une feuille Excel. Chaque ligne correspond à une observation

Plus en détail

FIMA, 7 juillet 2005

FIMA, 7 juillet 2005 F. Corset 1 S. 2 1 LabSAD Université Pierre Mendes France 2 Département de Mathématiques Université de Franche-Comté FIMA, 7 juillet 2005 Plan de l exposé plus court chemin Origine du problème Modélisation

Plus en détail

Réseau SCEREN. Ce document a été numérisé par le CRDP de Bordeaux pour la. Base Nationale des Sujets d Examens de l enseignement professionnel.

Réseau SCEREN. Ce document a été numérisé par le CRDP de Bordeaux pour la. Base Nationale des Sujets d Examens de l enseignement professionnel. Ce document a été numérisé par le CRDP de Bordeaux pour la Base Nationale des Sujets d Examens de l enseignement professionnel. Campagne 2013 Ce fichier numérique ne peut être reproduit, représenté, adapté

Plus en détail

Cours d algorithmique pour la classe de 2nde

Cours d algorithmique pour la classe de 2nde Cours d algorithmique pour la classe de 2nde F.Gaudon 10 août 2009 Table des matières 1 Avant la programmation 2 1.1 Qu est ce qu un algorithme?................................. 2 1.2 Qu est ce qu un langage

Plus en détail

1. Introduction...2. 2. Création d'une requête...2

1. Introduction...2. 2. Création d'une requête...2 1. Introduction...2 2. Création d'une requête...2 3. Définition des critères de sélection...5 3.1 Opérateurs...5 3.2 Les Fonctions...6 3.3 Plusieurs critères portant sur des champs différents...7 3.4 Requête

Plus en détail

L'évaluation par les pairs dans un MOOC. Quelle fiabilité et quelle légitimité? Rémi Bachelet Ecole Centrale de Lille 24 novembre 2014, Université

L'évaluation par les pairs dans un MOOC. Quelle fiabilité et quelle légitimité? Rémi Bachelet Ecole Centrale de Lille 24 novembre 2014, Université L'évaluation par les pairs dans un MOOC. Quelle fiabilité et quelle légitimité? Rémi Bachelet Ecole Centrale de Lille 24 novembre 2014, Université Paris-Est séminaire annuel IDEA Les diapos seront tweetées

Plus en détail

VI. Tests non paramétriques sur un échantillon

VI. Tests non paramétriques sur un échantillon VI. Tests non paramétriques sur un échantillon Le modèle n est pas un modèle paramétrique «TESTS du CHI-DEUX» : VI.1. Test d ajustement à une loi donnée VI.. Test d indépendance de deux facteurs 96 Différentes

Plus en détail

TP 1. Prise en main du langage Python

TP 1. Prise en main du langage Python TP. Prise en main du langage Python Cette année nous travaillerons avec le langage Python version 3. ; nous utiliserons l environnement de développement IDLE. Étape 0. Dans votre espace personnel, créer

Plus en détail

Programmes des classes préparatoires aux Grandes Ecoles

Programmes des classes préparatoires aux Grandes Ecoles Programmes des classes préparatoires aux Grandes Ecoles Filière : scientifique Voie : Biologie, chimie, physique et sciences de la Terre (BCPST) Discipline : Mathématiques Seconde année Préambule Programme

Plus en détail

Chapitre 7 : Intégration sur un intervalle quelconque

Chapitre 7 : Intégration sur un intervalle quelconque Universités Paris 6 et Paris 7 M1 MEEF Analyse (UE 3) 2013-2014 Chapitre 7 : Intégration sur un intervalle quelconque 1 Fonctions intégrables Définition 1 Soit I R un intervalle et soit f : I R + une fonction

Plus en détail

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels Etab=MK3, Timbre=G430, TimbreDansAdresse=Vrai, Version=W2000/Charte7, VersionTravail=W2000/Charte7 Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

Plus en détail

Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015 Exercices M1 SES 214-215 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 215 Les exemples numériques présentés dans ce document d exercices ont été traités sur le logiciel R, téléchargeable par

Plus en détail

Analyse des durées de vie avec le logiciel R

Analyse des durées de vie avec le logiciel R Analyse des durées de vie avec le logiciel R Ségolen Geffray Des outils ainsi que des données pour l analyse des durées de vie sont disponibles dans les packages survival MASS Il est nécessaire de charger

Plus en détail

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position Arbre de NESI distribution quelconque Signe 1 échantillon distribution symétrique non gaussienne Wilcoxon gaussienne Student position appariés 1 échantillon sur la différence avec référence=0 2 échantillons

Plus en détail

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur

Plus en détail

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #12

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #12 ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #12 ARTHUR CHARPENTIER 1 Une compagnie d assurance modélise le montant de la perte lors d un accident par la variable aléatoire continue X uniforme sur l intervalle

Plus en détail

Principe d un test statistique

Principe d un test statistique Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre

Plus en détail

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3

Plus en détail

Exercice : la frontière des portefeuilles optimaux sans actif certain

Exercice : la frontière des portefeuilles optimaux sans actif certain Exercice : la frontière des portefeuilles optimaux sans actif certain Philippe Bernard Ingénierie Economique & Financière Université Paris-Dauphine Février 0 On considère un univers de titres constitué

Plus en détail

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT Ces exercices portent sur les items 2, 3 et 5 du programme d informatique des classes préparatoires,

Plus en détail

Nouveau Barème W.B.F. de points de victoire 4 à 48 donnes

Nouveau Barème W.B.F. de points de victoire 4 à 48 donnes Nouveau Barème W.B.F. de points de victoire 4 à 48 donnes Pages 4 à 48 barèmes 4 à 48 donnes Condensé en une page: Page 2 barèmes 4 à 32 ( nombre pair de donnes ) Page 3 Tous les autres barèmes ( PV de

Plus en détail

Présentation du langage et premières fonctions

Présentation du langage et premières fonctions 1 Présentation de l interface logicielle Si les langages de haut niveau sont nombreux, nous allons travaillé cette année avec le langage Python, un langage de programmation très en vue sur internet en

Plus en détail

STATISTIQUES DESCRIPTIVES

STATISTIQUES DESCRIPTIVES 1 sur 7 STATISTIQUES DESCRIPTIVES En italien, «stato» désigne l état. Ce mot à donné «statista» pour «homme d état». En 1670, le mot est devenu en latin «statisticus» pour signifier ce qui est relatif

Plus en détail

LES TYPES DE DONNÉES DU LANGAGE PASCAL

LES TYPES DE DONNÉES DU LANGAGE PASCAL LES TYPES DE DONNÉES DU LANGAGE PASCAL 75 LES TYPES DE DONNÉES DU LANGAGE PASCAL CHAPITRE 4 OBJECTIFS PRÉSENTER LES NOTIONS D ÉTIQUETTE, DE CONS- TANTE ET DE IABLE DANS LE CONTEXTE DU LAN- GAGE PASCAL.

Plus en détail

LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples.

LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples. LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples. Pré-requis : Probabilités : définition, calculs et probabilités conditionnelles ; Notion de variables aléatoires, et propriétés associées : espérance,

Plus en détail

1 Importer et modifier des données avec R Commander

1 Importer et modifier des données avec R Commander Université de Nantes 2015/2016 UFR des Sciences et Techniques Département de Mathématiques TP1 STATISTIQUE DESCRIPTIVE Frédéric Lavancier Avant propos Ouvrir l application R Saisir dans la console library(rcmdr)

Plus en détail

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et

Plus en détail

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé Baccalauréat S ntilles-guyane 11 septembre 14 Corrigé EXERCICE 1 6 points Commun à tous les candidats Une entreprise de jouets en peluche souhaite commercialiser un nouveau produit et à cette fin, effectue

Plus en détail

3. Caractéristiques et fonctions d une v.a.

3. Caractéristiques et fonctions d une v.a. 3. Caractéristiques et fonctions d une v.a. MTH2302D S. Le Digabel, École Polytechnique de Montréal H2015 (v2) MTH2302D: fonctions d une v.a. 1/32 Plan 1. Caractéristiques d une distribution 2. Fonctions

Plus en détail

Package TestsFaciles

Package TestsFaciles Package TestsFaciles March 26, 2007 Type Package Title Facilite le calcul d intervalles de confiance et de tests de comparaison avec prise en compte du plan d échantillonnage. Version 1.0 Date 2007-03-26

Plus en détail

Séries Statistiques Simples

Séries Statistiques Simples 1. Collecte et Représentation de l Information 1.1 Définitions 1.2 Tableaux statistiques 1.3 Graphiques 2. Séries statistiques simples 2.1 Moyenne arithmétique 2.2 Mode & Classe modale 2.3 Effectifs &

Plus en détail

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes IUT HSE Probabilités et Statistiques Feuille : variables aléatoires discrètes 1 Exercices Dénombrements Exercice 1. On souhaite ranger sur une étagère 4 livres de mathématiques (distincts), 6 livres de

Plus en détail

Analyse exploratoire des données

Analyse exploratoire des données Analyse exploratoire des données Introduction à R pour la recherche biomédicale http://wwwaliquoteorg/cours/2012_biomed Objectifs Au travers de l analyse exploratoire des données, on cherche essentiellement

Plus en détail

Introduction à MATLAB R

Introduction à MATLAB R Introduction à MATLAB R Romain Tavenard 10 septembre 2009 MATLAB R est un environnement de calcul numérique propriétaire orienté vers le calcul matriciel. Il se compose d un langage de programmation, d

Plus en détail

Moments des variables aléatoires réelles

Moments des variables aléatoires réelles Chapter 6 Moments des variables aléatoires réelles Sommaire 6.1 Espérance des variables aléatoires réelles................................ 46 6.1.1 Définition et calcul........................................

Plus en détail

BACCALAURÉAT PROFESSIONNEL SUJET

BACCALAURÉAT PROFESSIONNEL SUJET SESSION 203 Métropole - Réunion - Mayotte BACCALAURÉAT PROFESSIONNEL ÉPREUVE E4 CULTURE SCIENTIFIQUE ET TECHNOLOGIQUE : MATHÉMATIQUES Toutes options Durée : 2 heures Matériel(s) et document(s) autorisé(s)

Plus en détail

Architecture des ordinateurs TD1 - Portes logiques et premiers circuits

Architecture des ordinateurs TD1 - Portes logiques et premiers circuits Architecture des ordinateurs TD1 - Portes logiques et premiers circuits 1 Rappel : un peu de logique Exercice 1.1 Remplir la table de vérité suivante : a b a + b ab a + b ab a b 0 0 0 1 1 0 1 1 Exercice

Plus en détail

Correction du baccalauréat ES/L Métropole 20 juin 2014

Correction du baccalauréat ES/L Métropole 20 juin 2014 Correction du baccalauréat ES/L Métropole 0 juin 014 Exercice 1 1. c.. c. 3. c. 4. d. 5. a. P A (B)=1 P A (B)=1 0,3=0,7 D après la formule des probabilités totales : P(B)=P(A B)+P(A B)=0,6 0,3+(1 0,6)

Plus en détail

Lois de probabilité. Anita Burgun

Lois de probabilité. Anita Burgun Lois de probabilité Anita Burgun Problème posé Le problème posé en statistique: On s intéresse à une population On extrait un échantillon On se demande quelle sera la composition de l échantillon (pourcentage

Plus en détail

Centre d'etudes Nucléaires de Fontenay-aux-Roses Direction des Piles Atomiques Département des Etudes de Piles

Centre d'etudes Nucléaires de Fontenay-aux-Roses Direction des Piles Atomiques Département des Etudes de Piles CEA-N-1195 Note CEA-N-1195 Centre d'etudes Nucléaires de Fontenay-aux-Roses Direction des Piles Atomiques Département des Etudes de Piles Service d'etudes de Protections de Piles PROPAGATION DES NEUTRONS

Plus en détail

La simulation probabiliste avec Excel

La simulation probabiliste avec Excel La simulation probabiliste avec Ecel (2 e version) Emmanuel Grenier emmanuel.grenier@isab.fr Relu par Kathy Chapelain et Henry P. Aubert Incontournable lorsqu il s agit de gérer des phénomènes aléatoires

Plus en détail

(51) Int Cl.: H04L 29/06 (2006.01) G06F 21/55 (2013.01)

(51) Int Cl.: H04L 29/06 (2006.01) G06F 21/55 (2013.01) (19) TEPZZ 8 8 4_A_T (11) EP 2 838 241 A1 (12) DEMANDE DE BREVET EUROPEEN (43) Date de publication: 18.02.1 Bulletin 1/08 (1) Int Cl.: H04L 29/06 (06.01) G06F 21/ (13.01) (21) Numéro de dépôt: 141781.4

Plus en détail

STAGE IREM 0- Premiers pas en Python

STAGE IREM 0- Premiers pas en Python Université de Bordeaux 16-18 Février 2014/2015 STAGE IREM 0- Premiers pas en Python IREM de Bordeaux Affectation et expressions Le langage python permet tout d abord de faire des calculs. On peut évaluer

Plus en détail

URECA Initiation Matlab 2 Laurent Ott. Initiation Matlab 2

URECA Initiation Matlab 2 Laurent Ott. Initiation Matlab 2 Initiation Matlab 2 1 Chaînes de caractères (string) Une chaîne de caractères (string en anglais) est une suite ordonnée de caractères (du texte, par exemple). Sous matlab, les chaînes de caractères sont

Plus en détail

Chapitre 3. Mesures stationnaires. et théorèmes de convergence

Chapitre 3. Mesures stationnaires. et théorèmes de convergence Chapitre 3 Mesures stationnaires et théorèmes de convergence Christiane Cocozza-Thivent, Université de Marne-la-Vallée p.1 I. Mesures stationnaires Christiane Cocozza-Thivent, Université de Marne-la-Vallée

Plus en détail

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,

Plus en détail

Manipuler des données calendaires

Manipuler des données calendaires Fiche TD avec le logiciel : tdr1b Manipuler des données calendaires D. Chessel La fiche contient quelques exercices élémentaires pour lire, éditer et manipuler des dates d événements. On pourra y revenir

Plus en détail

Chapitre 2 Le problème de l unicité des solutions

Chapitre 2 Le problème de l unicité des solutions Université Joseph Fourier UE MAT 127 Mathématiques année 2011-2012 Chapitre 2 Le problème de l unicité des solutions Ce que nous verrons dans ce chapitre : un exemple d équation différentielle y = f(y)

Plus en détail

SEMIN. Données sous R : stockage et échange. Julio PEDRAZA ACOSTA

SEMIN. Données sous R : stockage et échange. Julio PEDRAZA ACOSTA SEMIN Données sous R : stockage et échange Julio PEDRAZA ACOSTA UMR 5202 Origine Structure et Evolution de la Biodiversité Département Systématique et Evolution, MNHN pedraza@mnhn.fr SEMIN R du MNHN 10

Plus en détail

Méthodes de Simulation

Méthodes de Simulation Méthodes de Simulation JEAN-YVES TOURNERET Institut de recherche en informatique de Toulouse (IRIT) ENSEEIHT, Toulouse, France Peyresq06 p. 1/41 Remerciements Christian Robert : pour ses excellents transparents

Plus en détail

TD3: tableaux avancées, première classe et chaînes

TD3: tableaux avancées, première classe et chaînes TD3: tableaux avancées, première classe et chaînes de caractères 1 Lestableaux 1.1 Élémentsthéoriques Déclaration des tableaux Pour la déclaration des tableaux, deux notations sont possibles. La première

Plus en détail

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN Table des matières. Introduction....3 Mesures et incertitudes en sciences physiques

Plus en détail

Biostatistiques : Petits effectifs

Biostatistiques : Petits effectifs Biostatistiques : Petits effectifs Master Recherche Biologie et Santé P. Devos DRCI CHRU de Lille EA2694 patrick.devos@univ-lille2.fr Plan Données Générales : Définition des statistiques Principe de l

Plus en détail

Variables Aléatoires. Chapitre 2

Variables Aléatoires. Chapitre 2 Chapitre 2 Variables Aléatoires Après avoir réalisé une expérience, on ne s intéresse bien souvent à une certaine fonction du résultat et non au résultat en lui-même. Lorsqu on regarde une portion d ADN,

Plus en détail

Apprentissage par renforcement (1a/3)

Apprentissage par renforcement (1a/3) Apprentissage par renforcement (1a/3) Bruno Bouzy 23 septembre 2014 Ce document est le chapitre «Apprentissage par renforcement» du cours d apprentissage automatique donné aux étudiants de Master MI, parcours

Plus en détail

Représentation d une distribution

Représentation d une distribution 5 Représentation d une distribution VARIABLE DISCRÈTE : FRÉQUENCES RELATIVES DES CLASSES Si dans un graphique représentant une distribution, on place en ordonnées le rapport des effectifs n i de chaque

Plus en détail

1 Complément sur la projection du nuage des individus

1 Complément sur la projection du nuage des individus TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent

Plus en détail

1 Recherche en table par balayage

1 Recherche en table par balayage 1 Recherche en table par balayage 1.1 Problème de la recherche en table Une table désigne une liste ou un tableau d éléments. Le problème de la recherche en table est celui de la recherche d un élément

Plus en détail

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences

Plus en détail

Séance 0 : Linux + Octave : le compromis idéal

Séance 0 : Linux + Octave : le compromis idéal Séance 0 : Linux + Octave : le compromis idéal Introduction Linux est un système d'exploitation multi-tâches et multi-utilisateurs, basé sur la gratuité et développé par une communauté de passionnés. C'est

Plus en détail

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence

Plus en détail

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre : Terminale STSS 2 012 2 013 Pourcentages Synthèse 1) Définition : Calculer t % d'un nombre, c'est multiplier ce nombre par t 100. 2) Exemples de calcul : a) Calcul d un pourcentage : Un article coûtant

Plus en détail