INTRODUCTION AU LOGICIEL R
|
|
- Geoffroy Philippe Sévigny
- il y a 8 ans
- Total affichages :
Transcription
1 INTRODUCTION AU LOGICIEL R 2., lois de probabilité. Anne Dubois, Julie Bertrand, Emmanuelle Comets emmanuelle.comets@inserm.fr INSERM UMR738 E. Comets (UMR738) Introduction à R - Novembre / 46
2 Plan Dataframe Format d un dataframe Ecriture et lecture de fichiers Manipulation d un dataframe Tri Moyenne et variance Corrélation et covariance Quantiles Exercice Lois de probabilité Tirage d échantillons aléatoires Principales distributions statistiques E. Comets (UMR738) Introduction à R - Novembre / 46
3 Remise en jambe (1) Dataframe 1 À l aide des fonctions rep, seq et c seulement, générer les séquences suivantes : a) b) c) d) e) f) g) Générer les suites de nombres suivantes à l aide des fonctions : et rep seulement, donc sans utiliser la fonction seq : a) b) c) d) e) E. Comets (UMR738) Introduction à R - Novembre / 46
4 Remise en jambe (2) Dataframe 3 Reprendre la séquence (d) précédente remplacer toutes les valeurs négatives par NA compter le nombre de valeurs NA remplacer les valeurs négatives par -10 E. Comets (UMR738) Introduction à R - Novembre / 46
5 Remise en jambe (3) Dataframe 4 Soit la matrice : x<-matrix(1:120,ncol=12) Affichez toutes les lignes de la matrice commençant par un nombre pair Affichez toutes les lignes de la matrice dont la moyenne est inférieure à 60 Affichez toutes les colonnes de la matrice dont la somme est inférieure à 500 Sélectionnez la sous-matrice formée des lignes de la matrice dont la moyenne est inférieure à 60 et des colonnes dont la somme est inférieure à 500 Sélectionnez la même sous-matrice, sauf la troisième ligne Bien sûr, une seule ligne est nécessaire à chaque fois pour effectuer ces opérations... E. Comets (UMR738) Introduction à R - Novembre / 46
6 Plan Dataframe Format d un dataframe Ecriture et lecture de fichiers Manipulation d un dataframe Tri Dataframe Format d un dataframe Ecriture et lecture de fichiers Manipulation d un dataframe Tri Moyenne et variance Corrélation et covariance Quantiles Exercice Lois de probabilité Tirage d échantillons aléatoires Principales distributions statistiques E. Comets (UMR738) Introduction à R - Novembre / 46
7 Les dataframes Dataframe Format d un dataframe Ecriture et lecture de fichiers Manipulation d un dataframe Tri format de jeu de données structuré un jeu de données réelles a naturellement le format d un dataframe nombreux jeux de données structurés disponibles sous R Exemple : jeu de données pressure sur la relation entre la température en degrés et la pression en millimètres de mercure : > pressure temperature pressure E. Comets (UMR738) Introduction à R - Novembre / 46
8 Manipulation d un dataframe Format d un dataframe Ecriture et lecture de fichiers Manipulation d un dataframe Tri Pour récupérer une variable on utilise le caractère $ : > pressure$temperature [1] On peut aussi référencer la colonne comme pour une matrice: > pressure[,1] Ou encore les appeler par le nom de la colonne : > pressure[,"temperature"] Les 2 premiers éléments de temperature s écriront indifféremment : > pressure$temperature[1:2] > pressure[1:2,1] > pressure[1:2,"temperature"] E. Comets (UMR738) Introduction à R - Novembre / 46
9 Attacher un jeu de données Format d un dataframe Ecriture et lecture de fichiers Manipulation d un dataframe Tri On peut aussi "attacher" le jeu de données pour avoir un accès direct aux variables : > attach(pressure) > temperature [1] Attention : on peut modifier le vecteur temperature mais ça ne change rien au dataframe test. C est comme si on avait une copie des variables. Par contre si on travaille sur test$temperature on modifie bien test. Pour "détacher" le dataframe, on utilise : detach(test) E. Comets (UMR738) Introduction à R - Novembre / 46
10 Ecriture de fichiers Dataframe Format d un dataframe Ecriture et lecture de fichiers Manipulation d un dataframe Tri pressure est disponible sous R dans la librairie datasets. Pour sauver le jeu de données dans un fichier essai.dat : > write.table(pressure,"essai.dat",row.names=f) L option row.names=f est nécessaire pour éviter d écrire un numéro au début de chaque ligne. La fonction sink permet de rediriger la sortie (normalement à l écran) vers un fichier : > sink("essai.dat") > print(pressure) > sink() Elle donne ici un résultat similaire à : > write.table(pressure,"essai.dat") E. Comets (UMR738) Introduction à R - Novembre / 46
11 Lecture de fichiers (1) Format d un dataframe Ecriture et lecture de fichiers Manipulation d un dataframe Tri Pour lire le dataframe test à partir du fichier essai.dat : > test <- read.table("essai.dat",header=t) La table contient un en-tête (header) avec le nom des variables (les colonnes). Ces fonctions lisent des formats bien tabulés sans trous. Des options existent pour spécifier le séparateur de champs, le nombre de lignes lues, le nombre de lignes à sauter avant de commencer la lecture,... E. Comets (UMR738) Introduction à R - Novembre / 46
12 Lecture de fichiers (2) Format d un dataframe Ecriture et lecture de fichiers Manipulation d un dataframe Tri Fonction la plus générale pour la lecture de fichiers : scan > namcol<-scan("essai.dat",nlines=1,what="char") > test <- scan("essai.dat",skip=1) > test<-matrix(test,ncol=4,byrow=t,dimnames=list(c(),namcol)) > test temperature pressure Nécessite de spécifier le type (si différent de "numeric"). Permet de lire certaines lignes seulement d un fichier. Permet de gérer des fichiers de structure particulière (ex : "parser" un fichier texte). E. Comets (UMR738) Introduction à R - Novembre / 46
13 Lecture au clavier Dataframe Format d un dataframe Ecriture et lecture de fichiers Manipulation d un dataframe Tri scan peut aussi être utilisé pour la lecture au clavier (input). Au lieu d un nom de fichier, on utilise "" : > x<-scan("",nlines=2) 1: 2 2: 3.2 Read 2 items > x [1] Par défaut, la fonction attend un nombre, mais le type de données attendu peut être modifié : > noms<-scan("",nlines=2,what=character()) 1: Paul 2: Pierre Read 2 items > noms [1] "Paul" "Pierre" E. Comets (UMR738) Introduction à R - Novembre / 46
14 Extraction d une sous-base Format d un dataframe Ecriture et lecture de fichiers Manipulation d un dataframe Tri On utilise la base airquality, disponible dans R. Si l on veut extraire la sous-base pour laquelle la température est > 92 F : > air1 <- subset(airquality, Temp > 92) > air1 Ozone Solar.R Wind Temp Month Day 42 NA On peut également utiliser : > air1<-airquality[airquality$temp>92,] E. Comets (UMR738) Introduction à R - Novembre / 46
15 Transformation de données (1) Format d un dataframe Ecriture et lecture de fichiers Manipulation d un dataframe Tri Pour ajouter dans air1 la variable logtemp, log de la température, on a également plusieurs choix : >air1<-transform(air1,logtemp=log(temp)) > air1 Ozone Solar.R Wind Temp Month Day logtemp 42 NA ou : >air1$logtemp<-log(air1$temp) ou encore: >air1<-cbind(air1,logtemp=log(air1$temp)) E. Comets (UMR738) Introduction à R - Novembre / 46
16 Transformation de données (2) Format d un dataframe Ecriture et lecture de fichiers Manipulation d un dataframe Tri On peut créer une variable indicatrice à l aide de la fonction ifelse. On souhaite par exemple créer la variable ftemp qui vaut 1 si Temp > 94 F, 0 sinon : > air1<-transform(air1,ftemp=ifelse(temp>94,1,0)) > air1 Ozone Solar.R Wind Temp Month Day ftemp 42 NA ou encore : > air1$ftemp<-ifelse(air1$temp>94,1,0) E. Comets (UMR738) Introduction à R - Novembre / 46
17 Extraction de données : exercice Format d un dataframe Ecriture et lecture de fichiers Manipulation d un dataframe Tri Créer à partir de air1 le dataframe air2, où : 1) la variable Ozone n est pas manquante 2) la température est 94 F Créer à partir de airquality le dataframe air3, où la variable Ozone n est pas manquante. Ajouter une colonne à air3 représentant une variable valant 1 si : 1) on est dans les 6 premiers mois de l année 2) la température est supérieure à 80 F et 0 sinon. E. Comets (UMR738) Introduction à R - Novembre / 46
18 Ordonner selon une variable Format d un dataframe Ecriture et lecture de fichiers Manipulation d un dataframe Tri Pour effectuer l équivalent de la Proc sort de SAS, on utilise la fonction order. Pour ordonner air1 selon la valeur de Temp : > air1[order(air1$temp),] Ozone Solar.R Wind Temp Month Day ftemp 42 NA On peut trier sur plusieurs variables : > air1[order(air1$month,air1$day),] Ozone Solar.R Wind Temp Month Day 42 NA E. Comets (UMR738) Introduction à R - Novembre / 46
19 La fonction match Dataframe Format d un dataframe Ecriture et lecture de fichiers Manipulation d un dataframe Tri match teste si un élément est présent dans un vecteur. > month.name [1] "January" "February" "March" "April" "May"... > match(c("mai","may"),month.name,nomatch=0) [1] 0 5 Application : rajouter une colonne avec le nom du mois à air1 > NamMon<-month.name[match(air1$Month,1:12)] > transform(air1,nammon=nammon) Ozone Solar.R Wind Temp Month Day NamMon 42 NA June August September Outil très puissant pour manipuler plusieurs bases de données avec un identifiant commun (ex : le numéro d identification du patient). E. Comets (UMR738) Introduction à R - Novembre / 46
20 Exercice Dataframe Format d un dataframe Ecriture et lecture de fichiers Manipulation d un dataframe Tri On vous donne un relevé des profondeurs de glace relevées dans une station météo avec les dates correspondantes : dates<-c(" "," "," ", " "," "," "," ", " "," "," "," ", " "," "," "," ", " "," ") mesure<-c(64,69,71,71,71,32,42,28,32,18,25,29,34,36,42, 50,61) Extraire de ce vecteur la première incidence de chaque profondeur mesurée, en utilisant la fonction match. Trier les mesures de glace dans l ordre croissant et créer une matrice avec comme première colonne les mesures triées et comme deuxième colonne les dates correspondantes (nécessite un tri simultané!) E. Comets (UMR738) Introduction à R - Novembre / 46
21 Plan Dataframe Moyenne et variance Corrélation et covariance Quantiles Exercice Dataframe Format d un dataframe Ecriture et lecture de fichiers Manipulation d un dataframe Tri Moyenne et variance Corrélation et covariance Quantiles Exercice Lois de probabilité Tirage d échantillons aléatoires Principales distributions statistiques E. Comets (UMR738) Introduction à R - Novembre / 46
22 Moyenne et médiane Dataframe Moyenne et variance Corrélation et covariance Quantiles Exercice Moyenne : fonction mean Médiane : fonction median > x<-c(4,6,2,9,0,1,2) > x [1] > mean(x) [1] > median(x) [1] 2 E. Comets (UMR738) Introduction à R - Novembre / 46
23 Moyenne et variance Corrélation et covariance Quantiles Exercice Moyenne et médiane en présence de valeurs manquantes Option na.rm=t pour ignorer les valeurs manquantes > x[3]<-na > x [1] 4 6 NA > mean(x) [1] NA > mean(x,na.rm=t) [1] > median(x) [1] NA > median(x,na.rm=t) [1] 3 E. Comets (UMR738) Introduction à R - Novembre / 46
24 Moyenne et variance Corrélation et covariance Quantiles Exercice Moyenne en enlevant les valeurs extrêmes Autre option utile trim=f : où f [0,0.5] enlève un pourcentage d observations égal à f de part et d autre avant de calculer la moyenne peut être utilisé pour calculer une moyenne robuste > x<-c(4,6,2,9,0,1,2) > mean(x,trim=0.2) [1] 3 E. Comets (UMR738) Introduction à R - Novembre / 46
25 Variance et écart-type Moyenne et variance Corrélation et covariance Quantiles Exercice Variance : fonction var Ecart-type : fonction sd On a la même option pour ignorer les valeurs manquantes : > x<-c(4,6,2,9,0,1,2) > var(x) [1] > sd(x) [1] > sqrt(var(x)) [1] > x[3]<-na > var(x) Erreur dans var(x) : observations manquantes dans cov / cor > var(x,na.rm=t) [1] E. Comets (UMR738) Introduction à R - Novembre / 46
26 Corrélation (1) Dataframe Moyenne et variance Corrélation et covariance Quantiles Exercice Fonction cor(x,y) : coefficient de corrélation entre x et y Par défaut, calcul du coefficient de corrélation de Pearson : ΣX ΣY ΣXY r = N (ΣX 2 (ΣX)2 )( ΣY 2 (ΣY)2 ) N N (1) > x<-c(4,6,2,9,0,1,2) > y<-c(9,2,5,1,6,0,3) > cor(x,y) [1] E. Comets (UMR738) Introduction à R - Novembre / 46
27 Corrélation (2) Dataframe Moyenne et variance Corrélation et covariance Quantiles Exercice Options method : deux autres coefficients de corrélation (association basée sur les rangs) method="kendall" : τ de Kendall (coefficient de corrélation des rangs de Kendall) method="spearman" : ρ de Spearman use="c" : pour ignorer les valeurs manquantes Calcul des coefficients de corrélation non-paramétriques > x<-c(4,6,2,9,0,1,2) > y<-c(9,2,5,1,6,0,3) > cor(x,y,method="spearman") [1] > cor(x,y,method="k") [1] Note : on peut juste écrire la première lettre de la méthode E. Comets (UMR738) Introduction à R - Novembre / 46
28 Covariance Dataframe Moyenne et variance Corrélation et covariance Quantiles Exercice Fonction cov(x,y) : covariance entre x et y. > x<-c(4,6,2,9,0,1,2) > y<-c(9,2,5,1,6,0,3) > cov(x,y) [1] Notes : mêmes options que pour cor method, na.rm=t x et y peuvent être des matrices cov renvoie alors la matrice de variance-covariance entre les colonnes de x et de y E. Comets (UMR738) Introduction à R - Novembre / 46
29 Quantiles Dataframe Moyenne et variance Corrélation et covariance Quantiles Exercice On peut obtenir les quantiles empiriques d un vecteur > quantile(x) 0% 25% 50% 75% 100% Par défaut, on a le min, le max, et les 3 quartiles (0.25, 0.5 et 0.75 quantiles). Pour obtenir les autres quantiles, par exemple les déciles: > dec<-seq(0,1,0.1) > dec [1] > quantile(x,dec) 0% 10% 20% 30% 40% 50% % 70% 80% 90% 100% E. Comets (UMR738) Introduction à R - Novembre / 46
30 Moyenne et variance Corrélation et covariance Quantiles Exercice Attention aux fonctions appliquées à un tableau Comme la plupart des fonctions, quantile ne calcule pas les statistiques d un tableau ou d un data.frame colonne par colonne mais le considère comme un grand vecteur : > x=matrix(seq(1:100),ncol=4) > quantile(x) 0% 25% 50% 75% 100% La fonction summary est utilisée pour préserver cette structure. > summary(x) X1 X2 X3 X4 Min. : 1 Min. :26 Min. :51 Min. : 76 1st Qu.: 7 1st Qu.:32 1st Qu.:57 1st Qu.: 82 Median :13 Median :38 Median :63 Median : 88 Mean :13 Mean :38 Mean :63 Mean : 88 3rd Qu.:19 3rd Qu.:44 3rd Qu.:69 3rd Qu.: 94 Max. :25 Max. :50 Max. :75 Max. :100 E. Comets (UMR738) Introduction à R - Novembre / 46
31 Plus généralement Dataframe Moyenne et variance Corrélation et covariance Quantiles Exercice La fonction apply sert à appliquer une autre fonction de façon répétée sur les lignes ou les colonnes d un tableau. Par exemple : > apply(x,2,quantile) [,1] [,2] [,3] [,4] 0% % % % % calcule les quantiles par défaut pour les 4 colonnes de la matrice x (avec 1 à la place de 2, ce serait pour les lignes). Il est possible de spécifier des options pour la fonction appelée par apply : > apply(x,2,quantile,c(0.05,0.95)) [,1] [,2] [,3] [,4] 5% % E. Comets (UMR738) Introduction à R - Novembre / 46
32 Moyenne et variance Corrélation et covariance Quantiles Exercice Vue d ensemble d un jeu de données La fonction summary donne un résumé quantitatif. Une vue d ensemble de la structure d un jeu de données est fournie par str : > str(airquality) data.frame : 153 obs. of 6 variables: $ Ozone : int NA NA... $ Solar.R: int NA NA $ Wind : num $ Temp : int $ Month : int $ Day : int E. Comets (UMR738) Introduction à R - Novembre / 46
33 Exercice Dataframe Moyenne et variance Corrélation et covariance Quantiles Exercice Créez une matrice x portant les chiffres de 1 à 100, en 4 colonnes Calculer les quantiles 0.1 et 0.9 de chaque colonne Calculer les quantiles 0.1 et 0.9 de chaque ligne E. Comets (UMR738) Introduction à R - Novembre / 46
34 Moyenne et variance Corrélation et covariance Quantiles Exercice comme en SAS (1) Il existe une version de summary produisant des tableaux de statistiques descriptives ressemblant à ceux de SAS. Elle est définie dans la librairie Hmisc : > library(hmisc) > options(digits=3) > sex <- factor(sample(c("m","f"), 500, rep=true)) > age <- rnorm(500, 50, 5) > treatment <- factor(sample(c("drug","placebo"), 500, rep=true)) > db<-data.frame(npat=factor(1:500),sex,age,treatment) > summary(age~factor(sex)) age N= N age factor(sex) f m Overall E. Comets (UMR738) Introduction à R - Novembre / 46
35 Moyenne et variance Corrélation et covariance Quantiles Exercice comme en SAS (2) On peut demander des statistiques plus élaborées en définissant des fonctions adaptées : > g<-function(x){ > c(smean.sd(x),median(x),quantile(x,prob=c(0.25,0.75))) > } > f<-summary(age~factor(sex),fun=g) > f age N= N Mean SD 25% 75% factor(sex) f m Overall E. Comets (UMR738) Introduction à R - Novembre / 46
36 Exercice Dataframe Moyenne et variance Corrélation et covariance Quantiles Exercice Créez une matrice x portant les chiffres de 1 à 100, en 4 colonnes Calculez la moyenne et la variance de x des colonnes de x des 3 premières lignes de x Prendre le jeu de données interne à R appelé ToothGrowth le visualiser pour se faire une idée de son contenu (utilisez l aide) la première colonne représente la longueur des dents de cochons d inde soumis à différents régimes ranger la première colonne par colonnes dans une matrice à 6 colonnes mat calculer la matrice de corrélations entre les colonnes de mat E. Comets (UMR738) Introduction à R - Novembre / 46
37 Lois de probabilité Tirage d échantillons aléatoires Principales distributions statistiques Plan Dataframe Format d un dataframe Ecriture et lecture de fichiers Manipulation d un dataframe Tri Moyenne et variance Corrélation et covariance Quantiles Exercice Lois de probabilité Tirage d échantillons aléatoires Principales distributions statistiques E. Comets (UMR738) Introduction à R - Novembre / 46
38 Lois de probabilité Tirage d échantillons aléatoires Principales distributions statistiques Loi normale Pour chaque distribution qu il connait, R va en général définir 4 fonctions associées. Pour la loi normale, le suffixe général est norm et il va être précédé de 4 lettres, d, p, q ou r pour définir 4 fonctions : dnorm(x,µ,σ) : densité pnorm(x,µ,σ) : probabilité (x µ)2 f(x) = 1 e 2σ 2 2πσ F(x) = Z x f(u) du qnorm(α q,µ,σ) : quantile correspondant de la distribution, c est-à-dire pour α q donné la valeur de x pour laquelle F(x) =P(X x) = α q rnorm(n,µ,σ) : échantillon aléatoire de taille n E. Comets (UMR738) Introduction à R - Novembre / 46
39 Lois de probabilité Tirage d échantillons aléatoires Principales distributions statistiques Quantiles d une loi normale On utilise la fonction qnorm() pour connaître les valeurs seuils pour la distribution considérée. Par exemple, pour la loi normale, les bornes de l intervalle de confiance à 95% sont données par les valeurs correspondant aux quantiles à 2.5 et 97.5% : > qnorm(0.025) [1] > qnorm(0.975) [1] soit si on arrondit [-1.96; 1.96]. E. Comets (UMR738) Introduction à R - Novembre / 46
40 Lois de probabilité Tirage d échantillons aléatoires Principales distributions statistiques Exemple Probabilité d observer une réalisation de la variable inférieure à une valeur donnée si X est tirée dans une loi normale ℵ(0,1) : pnorm() > 1-pnorm(1) [1] > 1-pnorm(1.96) [1] Probabilité d observer les mêmes valeurs si X est tirée dans une loi du χ 2 à 1 degré de liberté : pchisq() > 1-pchisq(1,1) [1] > 1-pchisq(1.96,1) [1] E. Comets (UMR738) Introduction à R - Novembre / 46
41 Lois de probabilité Tirage d échantillons aléatoires Principales distributions statistiques Tirage dans une loi normale Utilisation de la fonction rnorm() : > rnorm(10,5,1) [1] [9] Par défaut, tirage dans une loi normale ℵ(0,1) > rnorm(10) [1] [7] E. Comets (UMR738) Introduction à R - Novembre / 46
42 Lois de probabilité Tirage d échantillons aléatoires Principales distributions statistiques Tirage d échantillons avec ou sans remise La fonction sample() est utilisée. Sa syntaxe est la suivante : sample(x, size, replace = FALSE, prob = NULL) Par exemple : > x<-1:10 > sample(x,3) [1] Par défaut, il est effectué un tirage sans remise. Pour demander un tirage avec remise, utiliser replace=t : > sample(x,7,replace=t) [1] Cette fonction sera très utile pour faire du rééchantillonnage (bootstrap). E. Comets (UMR738) Introduction à R - Novembre / 46
43 Lois de probabilité Tirage d échantillons aléatoires Principales distributions statistiques Exercice Créer un vecteur de 10 valeurs en tirant : les 6 premières dans ℵ(2, 5) les 4 suivantes dans ℵ( 1,4) Tirer un vecteur v1 de 10 valeurs dans une mixture de 2 lois normales : ℵ(2, 5) ℵ( 1, 4) avec une probabilité Calculez la moyenne de v1 répétez l opération 10 fois en conservant les moyennes des 10 échantillons v1 successifs dans un vecteur Recommencez la même opération en tirant un échantillon v2 dans une mixture avec une probabilité comparez les moyennes obtenues pour v1 et v2 E. Comets (UMR738) Introduction à R - Novembre / 46
44 Lois de probabilité Tirage d échantillons aléatoires Principales distributions statistiques Exercice Dans un essai clinique, on suppose que la clairance à la créatinine des patients recrutés suit une loi normale de moyenne 120 ml/min, avec un écart-type de 40 ml/min. Si on prend 10 patients au hasard, quelle est la probabilité p1 que la clairance moyenne soit inférieure à 130? Quelle est la probabilité qu elle soit comprise entre 120 et 130? Combien de sujets faudrait-il prendre pour que la probabilité p1 soit d au moins 95%? E. Comets (UMR738) Introduction à R - Novembre / 46
45 Lois de probabilité Tirage d échantillons aléatoires Principales distributions statistiques Principales distributions statistiques (1) Nom Distribution Paramètres par défaut dnorm() normale N (µ= 0,σ = 1) dlnorm() log-normale LN (µ= 0,σ = 1) dunif() uniforme U(a = 0,b = 1) dpois() Poisson P(λ) dexp() exponentielle E(λ = 1) dbinom() binômiale B(n, p) dnbinom() binômiale négative BN (n, p) dchisq() chi-deux χ 2 (n) ( ) df() F F (n 1,n 2 ) E. Comets (UMR738) Introduction à R - Novembre / 46
46 Lois de probabilité Tirage d échantillons aléatoires Principales distributions statistiques Principales distributions statistiques (2) Nom Distribution Paramètres par défaut dt() Student T (df,δ ) dlogis() logistique L(α = 0, β = 1) dgeom() géométrique G(p) dweibull() Weibull W (γ,β = 1) dhyper() hypergéométrique H (m, n, k) dbeta() Beta β(α, β) dgamma() Gamma Γ(γ, β = 1) dcauchy() Cauchy C(α = 0,β = 1) δ : paramètre de non-centralité, optionnel E. Comets (UMR738) Introduction à R - Novembre / 46
Lire ; Compter ; Tester... avec R
Lire ; Compter ; Tester... avec R Préparation des données / Analyse univariée / Analyse bivariée Christophe Genolini 2 Table des matières 1 Rappels théoriques 5 1.1 Vocabulaire....................................
Plus en détailTABLE DES MATIERES. C Exercices complémentaires 42
TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence
Plus en détailIntroduction à R. Florence Yerly. Dept. de mathématiques, Université de Fribourg (CH) SP 2011
Dept. de mathématiques, Université de Fribourg (CH) SP 2011 Qu est ce que R? Un logiciel de statistiques libre et gratuit ; Un logiciel multi-plateforme (UNIX, Windows MacOS X) R permet de faire des calculs
Plus en détailIntroduction à la statistique non paramétrique
Introduction à la statistique non paramétrique Catherine MATIAS CNRS, Laboratoire Statistique & Génome, Évry http://stat.genopole.cnrs.fr/ cmatias Atelier SFDS 27/28 septembre 2012 Partie 2 : Tests non
Plus en détailIntroduction aux Statistiques et à l utilisation du logiciel R
Introduction aux Statistiques et à l utilisation du logiciel R Christophe Lalanne Christophe Pallier 1 Introduction 2 Comparaisons de deux moyennes 2.1 Objet de l étude On a mesuré le temps de sommeil
Plus en détailFiche d utilisation du logiciel. 1 - Installation. J. Thioulouse & D. Chessel
Fiche d utilisation du logiciel 1 - Installation J. Thioulouse & D. Chessel Résumé Cette fiche est une introduction à l'utilisation du logiciel R pour les trois environnements Unix, Windows et MacOS. Plan
Plus en détailIntroduction à l approche bootstrap
Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?
Plus en détailExtraction d informations stratégiques par Analyse en Composantes Principales
Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 dousset@irit.fr 1 Introduction
Plus en détailLa survie nette actuelle à long terme Qualités de sept méthodes d estimation
La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg
Plus en détailAnnexe commune aux séries ES, L et S : boîtes et quantiles
Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans
Plus en détailTSTI 2D CH X : Exemples de lois à densité 1
TSTI 2D CH X : Exemples de lois à densité I Loi uniforme sur ab ; ) Introduction Dans cette activité, on s intéresse à la modélisation du tirage au hasard d un nombre réel de l intervalle [0 ;], chacun
Plus en détailActuariat I ACT2121. septième séance. Arthur Charpentier. Automne 2012. charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free.
Actuariat I ACT2121 septième séance Arthur Charpentier charpentier.arthur@uqam.ca http ://freakonometrics.blog.free.fr/ Automne 2012 1 Exercice 1 En analysant le temps d attente X avant un certain événement
Plus en détailTests statistiques et régressions logistiques sous R, avec prise en compte des plans d échantillonnage complexes
, avec prise en compte des plans d échantillonnage complexes par Joseph LARMARANGE version du 29 mars 2007 Ce cours a été développé pour une formation niveau M2 et Doctorat des étudiants du laboratoire
Plus en détailEstimation et tests statistiques, TD 5. Solutions
ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études
Plus en détailChapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens
Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques
Plus en détailExercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.
14-3- 214 J.F.C. p. 1 I Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques. Exercice 1 Densité de probabilité. F { ln x si x ], 1] UN OVNI... On pose x R,
Plus en détailINTRODUCTION AU LOGICIEL R
INTRODUCTION AU LOGICIEL R Variables et mise en jambe Anne Dubois, Julie Bertrand, Emmanuelle Comets emmanuelle.comets@inserm.fr INSERM UMR738 (UMR738) 1 / 68 Sur le site www.cran.r-project.org : Ou trouver
Plus en détailStatistiques Descriptives à une dimension
I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des
Plus en détailInitiation au logiciel R
Université Paris Dauphine Année 2005 2006 U.F.R. Mathématiques de la Décision MAT-6-3 : Statistique exploratoire et numérique (NOISE) Initiation au logiciel R Jean-Michel MARIN Ce document a pour objectif
Plus en détailFeuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.
Université de Nantes Année 2013-2014 L3 Maths-Eco Feuille 6 : Tests Exercice 1 On cherche à connaître la température d ébullition µ, en degrés Celsius, d un certain liquide. On effectue 16 expériences
Plus en détailSimulation de variables aléatoires
Chapter 1 Simulation de variables aléatoires Références: [F] Fishman, A first course in Monte Carlo, chap 3. [B] Bouleau, Probabilités de l ingénieur, chap 4. [R] Rubinstein, Simulation and Monte Carlo
Plus en détailGestion des données avec R
Gestion des données avec R Christophe Lalanne & Bruno Falissard Table des matières 1 Introduction 1 2 Importation de fichiers CSV 1 2.1 Structure du fichier de données...................................
Plus en détailLA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
Plus en détailRelation entre deux variables : estimation de la corrélation linéaire
CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence
Plus en détailChapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE
UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction
Plus en détailACTUARIAT 1, ACT 2121, AUTOMNE 2013 #16
ACTUARIAT 1, ACT 2121, AUTOMNE 201 #16 ARTHUR CHARPENTIER 1 Dans une petite compagnie d assurance le nombre N de réclamations durant une année suit une loi de Poisson de moyenne λ = 100. On estime que
Plus en détaildonnées en connaissance et en actions?
1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)
Plus en détailAide-mémoire de statistique appliquée à la biologie
Maxime HERVÉ Aide-mémoire de statistique appliquée à la biologie Construire son étude et analyser les résultats à l aide du logiciel R Version 5(2) (2014) AVANT-PROPOS Les phénomènes biologiques ont cela
Plus en détailCours 1. I- Généralités sur R II- Les fonctions de R et autres objets III-Les vecteurs
Cours 1 I- Généralités sur R II- Les fonctions de R et autres objets III-Les vecteurs IV-Les facteurs I-1 Généralités sur R R (1995, AT&T Bell Laboratories) est un logiciel d analyse statistique et graphique,
Plus en détailStatistique Descriptive Élémentaire
Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Élémentaire (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219 Université Paul Sabatier
Plus en détailSAS de base : gestion des données et procédures élémentaires
1 SAS de base : gestion des données et procédures élémentaires SAS de base : gestion des données et procédures élémentaires Résumé Description des commandes (module SAS de base) les plus utiles de l étape
Plus en détailAnalyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés
Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent
Plus en détailLes simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R
Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Yves Aragon, David Haziza & Anne Ruiz-Gazen GREMAQ, UMR CNRS 5604, Université des Sciences
Plus en détailBaccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé
Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé A. P. M. E. P. Exercice 1 5 points 1. Réponse d. : 1 e Le coefficient directeur de la tangente est négatif et n est manifestement pas 2e
Plus en détailUne introduction au langage R
Une introduction au langage R Faouzi LYAZRHI UP Biostatistique Ecole Nationale Vétérinaire, 23, chemin des Capelles, BP 87614, F-31076 Toulouse cédex email : f.lyazrhi@envt.fr 2005 1. INSTALLER R 3 2.
Plus en détailI3, Probabilités 2014 Travaux Dirigés F BM F BM F BM F BM F B M F B M F B M F B M 20 20 80 80 100 100 300 300
I3, Probabilités 2014 Travaux Dirigés TD 1 : rappels. Exercice 1 Poker simplié On tire 3 cartes d'un jeu de 52 cartes. Quelles sont les probabilités d'obtenir un brelan, une couleur, une paire, une suite,
Plus en détailLa classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
Plus en détailPrécision d un résultat et calculs d incertitudes
Précision d un résultat et calculs d incertitudes PSI* 2012-2013 Lycée Chaptal 3 Table des matières Table des matières 1. Présentation d un résultat numérique................................ 4 1.1 Notations.........................................................
Plus en détailTraitement des données avec Microsoft EXCEL 2010
Traitement des données avec Microsoft EXCEL 2010 Vincent Jalby Septembre 2012 1 Saisie des données Les données collectées sont saisies dans une feuille Excel. Chaque ligne correspond à une observation
Plus en détailFIMA, 7 juillet 2005
F. Corset 1 S. 2 1 LabSAD Université Pierre Mendes France 2 Département de Mathématiques Université de Franche-Comté FIMA, 7 juillet 2005 Plan de l exposé plus court chemin Origine du problème Modélisation
Plus en détailRéseau SCEREN. Ce document a été numérisé par le CRDP de Bordeaux pour la. Base Nationale des Sujets d Examens de l enseignement professionnel.
Ce document a été numérisé par le CRDP de Bordeaux pour la Base Nationale des Sujets d Examens de l enseignement professionnel. Campagne 2013 Ce fichier numérique ne peut être reproduit, représenté, adapté
Plus en détailCours d algorithmique pour la classe de 2nde
Cours d algorithmique pour la classe de 2nde F.Gaudon 10 août 2009 Table des matières 1 Avant la programmation 2 1.1 Qu est ce qu un algorithme?................................. 2 1.2 Qu est ce qu un langage
Plus en détail1. Introduction...2. 2. Création d'une requête...2
1. Introduction...2 2. Création d'une requête...2 3. Définition des critères de sélection...5 3.1 Opérateurs...5 3.2 Les Fonctions...6 3.3 Plusieurs critères portant sur des champs différents...7 3.4 Requête
Plus en détailL'évaluation par les pairs dans un MOOC. Quelle fiabilité et quelle légitimité? Rémi Bachelet Ecole Centrale de Lille 24 novembre 2014, Université
L'évaluation par les pairs dans un MOOC. Quelle fiabilité et quelle légitimité? Rémi Bachelet Ecole Centrale de Lille 24 novembre 2014, Université Paris-Est séminaire annuel IDEA Les diapos seront tweetées
Plus en détailVI. Tests non paramétriques sur un échantillon
VI. Tests non paramétriques sur un échantillon Le modèle n est pas un modèle paramétrique «TESTS du CHI-DEUX» : VI.1. Test d ajustement à une loi donnée VI.. Test d indépendance de deux facteurs 96 Différentes
Plus en détailTP 1. Prise en main du langage Python
TP. Prise en main du langage Python Cette année nous travaillerons avec le langage Python version 3. ; nous utiliserons l environnement de développement IDLE. Étape 0. Dans votre espace personnel, créer
Plus en détailProgrammes des classes préparatoires aux Grandes Ecoles
Programmes des classes préparatoires aux Grandes Ecoles Filière : scientifique Voie : Biologie, chimie, physique et sciences de la Terre (BCPST) Discipline : Mathématiques Seconde année Préambule Programme
Plus en détailChapitre 7 : Intégration sur un intervalle quelconque
Universités Paris 6 et Paris 7 M1 MEEF Analyse (UE 3) 2013-2014 Chapitre 7 : Intégration sur un intervalle quelconque 1 Fonctions intégrables Définition 1 Soit I R un intervalle et soit f : I R + une fonction
Plus en détailDirection des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels
Etab=MK3, Timbre=G430, TimbreDansAdresse=Vrai, Version=W2000/Charte7, VersionTravail=W2000/Charte7 Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels
Plus en détailExercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015
Exercices M1 SES 214-215 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 215 Les exemples numériques présentés dans ce document d exercices ont été traités sur le logiciel R, téléchargeable par
Plus en détailAnalyse des durées de vie avec le logiciel R
Analyse des durées de vie avec le logiciel R Ségolen Geffray Des outils ainsi que des données pour l analyse des durées de vie sont disponibles dans les packages survival MASS Il est nécessaire de charger
Plus en détaildistribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position
Arbre de NESI distribution quelconque Signe 1 échantillon distribution symétrique non gaussienne Wilcoxon gaussienne Student position appariés 1 échantillon sur la différence avec référence=0 2 échantillons
Plus en détailLa problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites
La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur
Plus en détailACTUARIAT 1, ACT 2121, AUTOMNE 2013 #12
ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #12 ARTHUR CHARPENTIER 1 Une compagnie d assurance modélise le montant de la perte lors d un accident par la variable aléatoire continue X uniforme sur l intervalle
Plus en détailPrincipe d un test statistique
Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre
Plus en détailBiostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke
www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3
Plus en détailExercice : la frontière des portefeuilles optimaux sans actif certain
Exercice : la frontière des portefeuilles optimaux sans actif certain Philippe Bernard Ingénierie Economique & Financière Université Paris-Dauphine Février 0 On considère un univers de titres constitué
Plus en détailExercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT
Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT Ces exercices portent sur les items 2, 3 et 5 du programme d informatique des classes préparatoires,
Plus en détailNouveau Barème W.B.F. de points de victoire 4 à 48 donnes
Nouveau Barème W.B.F. de points de victoire 4 à 48 donnes Pages 4 à 48 barèmes 4 à 48 donnes Condensé en une page: Page 2 barèmes 4 à 32 ( nombre pair de donnes ) Page 3 Tous les autres barèmes ( PV de
Plus en détailPrésentation du langage et premières fonctions
1 Présentation de l interface logicielle Si les langages de haut niveau sont nombreux, nous allons travaillé cette année avec le langage Python, un langage de programmation très en vue sur internet en
Plus en détailSTATISTIQUES DESCRIPTIVES
1 sur 7 STATISTIQUES DESCRIPTIVES En italien, «stato» désigne l état. Ce mot à donné «statista» pour «homme d état». En 1670, le mot est devenu en latin «statisticus» pour signifier ce qui est relatif
Plus en détailLES TYPES DE DONNÉES DU LANGAGE PASCAL
LES TYPES DE DONNÉES DU LANGAGE PASCAL 75 LES TYPES DE DONNÉES DU LANGAGE PASCAL CHAPITRE 4 OBJECTIFS PRÉSENTER LES NOTIONS D ÉTIQUETTE, DE CONS- TANTE ET DE IABLE DANS LE CONTEXTE DU LAN- GAGE PASCAL.
Plus en détailLEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples.
LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples. Pré-requis : Probabilités : définition, calculs et probabilités conditionnelles ; Notion de variables aléatoires, et propriétés associées : espérance,
Plus en détail1 Importer et modifier des données avec R Commander
Université de Nantes 2015/2016 UFR des Sciences et Techniques Département de Mathématiques TP1 STATISTIQUE DESCRIPTIVE Frédéric Lavancier Avant propos Ouvrir l application R Saisir dans la console library(rcmdr)
Plus en détailL ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ
L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et
Plus en détailBaccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé
Baccalauréat S ntilles-guyane 11 septembre 14 Corrigé EXERCICE 1 6 points Commun à tous les candidats Une entreprise de jouets en peluche souhaite commercialiser un nouveau produit et à cette fin, effectue
Plus en détail3. Caractéristiques et fonctions d une v.a.
3. Caractéristiques et fonctions d une v.a. MTH2302D S. Le Digabel, École Polytechnique de Montréal H2015 (v2) MTH2302D: fonctions d une v.a. 1/32 Plan 1. Caractéristiques d une distribution 2. Fonctions
Plus en détailPackage TestsFaciles
Package TestsFaciles March 26, 2007 Type Package Title Facilite le calcul d intervalles de confiance et de tests de comparaison avec prise en compte du plan d échantillonnage. Version 1.0 Date 2007-03-26
Plus en détailSéries Statistiques Simples
1. Collecte et Représentation de l Information 1.1 Définitions 1.2 Tableaux statistiques 1.3 Graphiques 2. Séries statistiques simples 2.1 Moyenne arithmétique 2.2 Mode & Classe modale 2.3 Effectifs &
Plus en détailProbabilités et Statistiques. Feuille 2 : variables aléatoires discrètes
IUT HSE Probabilités et Statistiques Feuille : variables aléatoires discrètes 1 Exercices Dénombrements Exercice 1. On souhaite ranger sur une étagère 4 livres de mathématiques (distincts), 6 livres de
Plus en détailAnalyse exploratoire des données
Analyse exploratoire des données Introduction à R pour la recherche biomédicale http://wwwaliquoteorg/cours/2012_biomed Objectifs Au travers de l analyse exploratoire des données, on cherche essentiellement
Plus en détailIntroduction à MATLAB R
Introduction à MATLAB R Romain Tavenard 10 septembre 2009 MATLAB R est un environnement de calcul numérique propriétaire orienté vers le calcul matriciel. Il se compose d un langage de programmation, d
Plus en détailMoments des variables aléatoires réelles
Chapter 6 Moments des variables aléatoires réelles Sommaire 6.1 Espérance des variables aléatoires réelles................................ 46 6.1.1 Définition et calcul........................................
Plus en détailBACCALAURÉAT PROFESSIONNEL SUJET
SESSION 203 Métropole - Réunion - Mayotte BACCALAURÉAT PROFESSIONNEL ÉPREUVE E4 CULTURE SCIENTIFIQUE ET TECHNOLOGIQUE : MATHÉMATIQUES Toutes options Durée : 2 heures Matériel(s) et document(s) autorisé(s)
Plus en détailArchitecture des ordinateurs TD1 - Portes logiques et premiers circuits
Architecture des ordinateurs TD1 - Portes logiques et premiers circuits 1 Rappel : un peu de logique Exercice 1.1 Remplir la table de vérité suivante : a b a + b ab a + b ab a b 0 0 0 1 1 0 1 1 Exercice
Plus en détailCorrection du baccalauréat ES/L Métropole 20 juin 2014
Correction du baccalauréat ES/L Métropole 0 juin 014 Exercice 1 1. c.. c. 3. c. 4. d. 5. a. P A (B)=1 P A (B)=1 0,3=0,7 D après la formule des probabilités totales : P(B)=P(A B)+P(A B)=0,6 0,3+(1 0,6)
Plus en détailLois de probabilité. Anita Burgun
Lois de probabilité Anita Burgun Problème posé Le problème posé en statistique: On s intéresse à une population On extrait un échantillon On se demande quelle sera la composition de l échantillon (pourcentage
Plus en détailCentre d'etudes Nucléaires de Fontenay-aux-Roses Direction des Piles Atomiques Département des Etudes de Piles
CEA-N-1195 Note CEA-N-1195 Centre d'etudes Nucléaires de Fontenay-aux-Roses Direction des Piles Atomiques Département des Etudes de Piles Service d'etudes de Protections de Piles PROPAGATION DES NEUTRONS
Plus en détailLa simulation probabiliste avec Excel
La simulation probabiliste avec Ecel (2 e version) Emmanuel Grenier emmanuel.grenier@isab.fr Relu par Kathy Chapelain et Henry P. Aubert Incontournable lorsqu il s agit de gérer des phénomènes aléatoires
Plus en détail(51) Int Cl.: H04L 29/06 (2006.01) G06F 21/55 (2013.01)
(19) TEPZZ 8 8 4_A_T (11) EP 2 838 241 A1 (12) DEMANDE DE BREVET EUROPEEN (43) Date de publication: 18.02.1 Bulletin 1/08 (1) Int Cl.: H04L 29/06 (06.01) G06F 21/ (13.01) (21) Numéro de dépôt: 141781.4
Plus en détailSTAGE IREM 0- Premiers pas en Python
Université de Bordeaux 16-18 Février 2014/2015 STAGE IREM 0- Premiers pas en Python IREM de Bordeaux Affectation et expressions Le langage python permet tout d abord de faire des calculs. On peut évaluer
Plus en détailURECA Initiation Matlab 2 Laurent Ott. Initiation Matlab 2
Initiation Matlab 2 1 Chaînes de caractères (string) Une chaîne de caractères (string en anglais) est une suite ordonnée de caractères (du texte, par exemple). Sous matlab, les chaînes de caractères sont
Plus en détailChapitre 3. Mesures stationnaires. et théorèmes de convergence
Chapitre 3 Mesures stationnaires et théorèmes de convergence Christiane Cocozza-Thivent, Université de Marne-la-Vallée p.1 I. Mesures stationnaires Christiane Cocozza-Thivent, Université de Marne-la-Vallée
Plus en détailUFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES
Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,
Plus en détailManipuler des données calendaires
Fiche TD avec le logiciel : tdr1b Manipuler des données calendaires D. Chessel La fiche contient quelques exercices élémentaires pour lire, éditer et manipuler des dates d événements. On pourra y revenir
Plus en détailChapitre 2 Le problème de l unicité des solutions
Université Joseph Fourier UE MAT 127 Mathématiques année 2011-2012 Chapitre 2 Le problème de l unicité des solutions Ce que nous verrons dans ce chapitre : un exemple d équation différentielle y = f(y)
Plus en détailSEMIN. Données sous R : stockage et échange. Julio PEDRAZA ACOSTA
SEMIN Données sous R : stockage et échange Julio PEDRAZA ACOSTA UMR 5202 Origine Structure et Evolution de la Biodiversité Département Systématique et Evolution, MNHN pedraza@mnhn.fr SEMIN R du MNHN 10
Plus en détailMéthodes de Simulation
Méthodes de Simulation JEAN-YVES TOURNERET Institut de recherche en informatique de Toulouse (IRIT) ENSEEIHT, Toulouse, France Peyresq06 p. 1/41 Remerciements Christian Robert : pour ses excellents transparents
Plus en détailTD3: tableaux avancées, première classe et chaînes
TD3: tableaux avancées, première classe et chaînes de caractères 1 Lestableaux 1.1 Élémentsthéoriques Déclaration des tableaux Pour la déclaration des tableaux, deux notations sont possibles. La première
Plus en détailNombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN
Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN Table des matières. Introduction....3 Mesures et incertitudes en sciences physiques
Plus en détailBiostatistiques : Petits effectifs
Biostatistiques : Petits effectifs Master Recherche Biologie et Santé P. Devos DRCI CHRU de Lille EA2694 patrick.devos@univ-lille2.fr Plan Données Générales : Définition des statistiques Principe de l
Plus en détailVariables Aléatoires. Chapitre 2
Chapitre 2 Variables Aléatoires Après avoir réalisé une expérience, on ne s intéresse bien souvent à une certaine fonction du résultat et non au résultat en lui-même. Lorsqu on regarde une portion d ADN,
Plus en détailApprentissage par renforcement (1a/3)
Apprentissage par renforcement (1a/3) Bruno Bouzy 23 septembre 2014 Ce document est le chapitre «Apprentissage par renforcement» du cours d apprentissage automatique donné aux étudiants de Master MI, parcours
Plus en détailReprésentation d une distribution
5 Représentation d une distribution VARIABLE DISCRÈTE : FRÉQUENCES RELATIVES DES CLASSES Si dans un graphique représentant une distribution, on place en ordonnées le rapport des effectifs n i de chaque
Plus en détail1 Complément sur la projection du nuage des individus
TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent
Plus en détail1 Recherche en table par balayage
1 Recherche en table par balayage 1.1 Problème de la recherche en table Une table désigne une liste ou un tableau d éléments. Le problème de la recherche en table est celui de la recherche d un élément
Plus en détailTests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique»
Tests de comparaison de moyennes Dr Sahar BAYAT MASTER 1 année 2009-2010 UE «Introduction à la biostatistique» Test de Z ou de l écart réduit Le test de Z : comparer des paramètres en testant leurs différences
Plus en détailSéance 0 : Linux + Octave : le compromis idéal
Séance 0 : Linux + Octave : le compromis idéal Introduction Linux est un système d'exploitation multi-tâches et multi-utilisateurs, basé sur la gratuité et développé par une communauté de passionnés. C'est
Plus en détailLogiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS
Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence
Plus en détailt 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :
Terminale STSS 2 012 2 013 Pourcentages Synthèse 1) Définition : Calculer t % d'un nombre, c'est multiplier ce nombre par t 100. 2) Exemples de calcul : a) Calcul d un pourcentage : Un article coûtant
Plus en détail