Fonctions R. Pascal Bessonneau, Christophe Pallier 16 janvier 2010

Dimension: px
Commencer à balayer dès la page:

Download "Fonctions R. Pascal Bessonneau, Christophe Pallier 16 janvier 2010"

Transcription

1 Fonctions R Pascal Bessonneau, Christophe Pallier 16 janvier Recherche de l aide sur R La recherche s effectue sur 4 niveaux sur R. 1.1 help Le premier niveau consiste à rechercher de l aide sur une fonction précise. Il faut donc connaître exactement le nom de la fonction. Cette recherche a un autre inconvénient. Elle nécessite que la fonction soit en mémoire. Si cette fonction se trouve dans un paquet il faut avoir chargé ce paquet en mémoire. La récompense est une documentation riche qui détaille (en théorie) l ensemble du comportement de la fonction. La syntaxe permettant d accéder à cette aide est (fonction) ou fonction. La réalité est plus triviale... Trois complications principales : En effet la documentation renseigne rarement le comportement des objets S3 et S4. Un exemple sera plus parlant : par exemple l aide de la fonction plot n indique pas le fait qu on peut plotter un objet de la classe lm. En fait il taper?plot.lm. Il faut connaître donc l existence de la fonction plot.lm d où le fait qu il est important de connaître la syntaxe methods(class= lm ). Les fonctions ne sont pas très détaillées. Par exemple les détails théoriques ne sont généralement pas abordés contrairement à certains autres logiciels. Certains élements ne sont pas abordés. C est notamment le cas quand la fonction invisible est utilisé. Un exemple tout simple est la fonction boxplot. Les valeurs renvoyées dans une variable à gauche de la fonction boxplot ne sont décrites nulle part. 1.2 help.search Cette fonction permet une recherche plus large. En effet on peut chercher des fonctions par des mots-clefs. Par exemple si on tape ( Student ) on trouve les fonctions dont le nom et la description contient le mot Student. Il est à noter que la recherche est casse indépendante : les mêmes résultats sont trouvés si on tape Student, student, student,... 1

2 Cette fonction ne permet que de chercher parmi les documentations des fonctions dans les paquets installés sur l ordinateur. La présentation des résultats varie en fonction des plateformes. Sous Mac OS X le nom des fonctions et des paquets sont clairement indiqués. Sous Linux et sous Windows, le nom de la fonction est préfixé par le nom du paquet : paquet : :fonction. 1.3 Le site de R et les vignettes Sur le site de R, on trouve de multiples sources d informations. Les premières sont les différents tutoriaux, les questions fréquentes,... disponibles à cette adresse : Les autres informations sont sur la page des packages qui permet de trouver des fonctions à partir des descriptions : Pour tous les paquets la documentation sous format PDF est disponible en suivant les liens. Pour certains paquets il y a des vignettes qui sont des formes plus conviviales, sous forme de tutoriaux, des documentations des fonctions. Enfin il existe des vues. Ce sont des ensembles de paquets qui portent tous sur le même domaine : sciences sociales, design expériementaux, écologie,... Ces listes de paquets sont maintenus par des gens du domaine et les paquets fournis sont d une grande qualité. Ils sont disponibles à cette adresse : http: //cran.cict.fr/web/views/. 1.4 Rseek et les newsgroups Le niveau suivant pour trouver des informations est d utiliser les moteurs de recherche. Un moteur de recherche qui ne cherchent que dans les pages qui concernent R existe à cet adresse : Ce moteur cherche également dans les newsgroup qui sont très riches en renseignements. La souscription aux newsgroup se fait sur cette page : org/mail.html. Certaines mailings lists concernent des domaines particuliers comme pour les vues. Sans s abonner les archives des newsgroup sont disponibles là : stat.ethz.ch/mailman/listinfo. 2 Fonctions de base 2.1 aggregate La fonction permet de calculer une statistique sur une variable qualitatives pour des sous échantillons défini par une ou plusieurs variables qualitatives. Avec une variable qualitative la valeur retournée est un vecteur. Avec deux une data.frame... Pour spécifier les variables qualitatives on passe par une liste : > aggregate(iris$sepal.length,list(species=iris$species,random=gl(2,75)), mean ) 2

3 Species Random x 1 setosa versicolor versicolor virginica apply La fonction permet de réaliser très rapidement des calculs sur des data.frames. La fonction prend comme argument : le nom de la data.frame le sens dans lequel est appliqué la fonction : 1 par ligne, 2 par colonne et c(1,2) cellule par cellule. le nom ou la fonction à appliquer. La fonction ne doit rendre qu une valeur unique On peut après ces trois arguments donné des arguments pour la fonction. > apply(iris[,1:4],1,mean,na.rm=t) [1] [13] [25] [37] [49] [61] [73] [85] [97] [109] [121] [133] [145] > a=matrix(1,ncol=4,nrow=4) > apply(a,c(1,2),runif) [,1] [,2] [,3] [,4] [1,] [2,] [3,] [4,] attach La fonction permet de ne pas avoir à préfixer les noms des colonnes d une data.frame par le nom de la data.frame. La fonction with est plus interessante car les variables ne sont accessibles que pendant l exécution d une expression. 3

4 > attach(iris) > mean(sepal.length) [1] > detach(iris) 2.4 by La fonction permet d appliquer une fonction pour chaque sous ensemble défini par une variable qualitative. Elle est différente des fonctions des autres fonctions d aggrégation. En effet alors qu on obtient un objet pour les autres fonctions d aggrégation, cette fonction est destinée à afficher du texte seulement. > by( iris, iris$species, summary ) iris$species: setosa Sepal.Length Sepal.Width Petal.Length Petal.Width Min. :4.300 Min. :2.300 Min. :1.000 Min. : st Qu.: st Qu.: st Qu.: st Qu.:0.200 Median :5.000 Median :3.400 Median :1.500 Median :0.200 Mean :5.006 Mean :3.428 Mean :1.462 Mean : rd Qu.: rd Qu.: rd Qu.: rd Qu.:0.300 Max. :5.800 Max. :4.400 Max. :1.900 Max. :0.600 Species setosa :50 versicolor: 0 virginica : iris$species: versicolor Sepal.Length Sepal.Width Petal.Length Petal.Width Species Min. :4.900 Min. :2.000 Min. :3.00 Min. :1.000 setosa : 0 1st Qu.: st Qu.: st Qu.:4.00 1st Qu.:1.200 versicolor:50 Median :5.900 Median :2.800 Median :4.35 Median :1.300 virginica : 0 Mean :5.936 Mean :2.770 Mean :4.26 Mean : rd Qu.: rd Qu.: rd Qu.:4.60 3rd Qu.:1.500 Max. :7.000 Max. :3.400 Max. :5.10 Max. : iris$species: virginica Sepal.Length Sepal.Width Petal.Length Petal.Width Min. :4.900 Min. :2.200 Min. :4.500 Min. : st Qu.: st Qu.: st Qu.: st Qu.:1.800 Median :6.500 Median :3.000 Median :5.550 Median :

5 Mean :6.588 Mean :2.974 Mean :5.552 Mean : rd Qu.: rd Qu.: rd Qu.: rd Qu.:2.300 Max. :7.900 Max. :3.800 Max. :6.900 Max. :2.500 Species setosa : 0 versicolor: 0 virginica : colnames La fonction colnames permet de nommer les colonnes d une matrice ou d un data.frame. Inversement elle renvoie les noms affectés aux colonnes. > colnames(iris) [1] "Sepal.Length" "Sepal.Width" "Petal.Length" "Petal.Width" "Species" > colnames(iris) <- c( "P.L", "P.W", "S.L", "S.W", "S" ) > str(iris) 'data.frame': 150 obs. of 5 variables: $ P.L: num $ P.W: num $ S.L: num $ S.W: num $ S : Factor w/ 3 levels "setosa","versicolor",..: data La fonction permet d accéder à des datasets exemple qui font partie de R ou qui sont fournis avec les paquets que l on installe au fur et à mesure. Si on tape data() permet d avoir la liste des datasets disponibles. Pour le charger en mémoire il suffit d appeler data(nomdudataset). 2.7 detach La fonction permet de supprimer de l environnement une data.frame accessible après l appel de attach. > attach(iris) > mean(sepal.length) [1] > detach(iris) 5

6 2.8 dim La fonction permet de connaitre la taille d une data.frame. Elle renvoie un vecteur de longueur 2 avec en premier le nombre de lignes et en second le nombre de colonnes. Lorsque l objet n est pas de dimension 2 alors la valeur renvoyée est NULL. 2.9 Fonctions mathématiques La liste des commandes mathématiques les plus courantes sont : : prend le log en base 1. : prend le log en base 10, et : cosinus, sinus et tangente. : factoriel d un nombre. : prend la racine carrée d un nombre 2.10 Fonctions génériques is.object et as.object Les fonctions génériques is.object et as.object permettent de faire des tests et des conversions explicites. La commande,,... font des conversions explicites. Certains comme sont l équivalent de la fonction utilisée pour créer l objet. D autres plus complexes sont des conversions implémentées au niveau du langage S3 et S4. Les commandes,,... sont des fonctions renvoyant vrai si l objet est effectivement du type précisé gl La fonction permet de créer une variable de type factor. Les arguments sont les suivants : le premier argument est le nombre de modalités le deuxième est le nombre d élements pour chaque modalité Si on utilise comme argument length alors R replique les modalités de façon à les répartir de fonction homogène dans un vecteur de taille length. > gl(2,4) [1] Levels: 1 2 > gl(3,3,length=18) [1] Levels:

7 2.12 head La fonction permet de lister les 6 premières lignes d une data.frame. Cela permet d avoir un aperçu du contenu. Le nombre de lignes affichées peut être modifié à l aide de l argument n=nblignes. On peut omettre de mettre n= et spécifier directement le nombre de lignes. La fonction fait l inverse et donne les n dernières lignes. Exemple : > head(iris,3) Sepal.Length Sepal.Width Petal.Length Petal.Width Species setosa setosa setosa 2.13 ifelse Cette fonction permet de faire un test et de renvoyer une valeur définie en fonction du résultat du test. Le premier argument est une expression renvoyant vrai ou faux et le second argument est la valeur à renvoyer quand l expression est vrai. Enfin le troisième argument donne la valeur à renvoyer si l expression est fausse. > ifelse( c(2,6,4,7,9)%%2 == 0, "Vrai", "Faux" ) [1] "Vrai" "Vrai" "Vrai" "Faux" "Faux" 2.14 is.na La fonction permet de tester si une ou plusieurs valeurs sont NA. En effet on ne peut pas comparer directement une valeur avec NA. Le résultat est toujours NA. Il faut donc passer par le biais de cette fonction tester la présence dans un vecteur de NA. > is.na( c(3,na,4,5) ) [1] FALSE TRUE FALSE FALSE 2.15 is.null La fonction permet de tester si une ou plusieurs valeurs, un objet ou toute autre expression est NULL. Par exemple cette fonction est utilisée pour tester si un objet existe. > is.null(iris$quelquechose) [1] TRUE > is.null( c( 3, NULL, 4, 5 ) ) [1] FALSE 7

8 2.16 q La fonction permet de quitter R. Si on passe comme argument yes alors l environnement est sauvegardé. Si no alors l environnement n est pas sauvegardé ls La fonction permet de faire la liste des objets en mémoire length La fonction est plus complexe qu il n y parait. Mais on l utilisera dans ce cours que pour deux choses : Pour connaitre la longueur d un vecteur. Pour connaître le nombre d élements d une liste. > length(c(3,4,5)) [1] 3 > length(list(a=1,b=2)) [1] names La fonction permet de définir ou de retourner les noms d un vecteur. > tmp <- c( 1, 2, 3 ) > names(tmp) <- c( "A", "B", "C" ) > tmp A B C > names(tmp) [1] "A" "B" "C" 2.20 ncol La fonction renvoie le nombre de colonnes d une matrice ou d une data.frame nrow La fonction renvoie le nombre de lignes d une matrice ou d une data.frame. 8

9 2.22 order La fonction renvoie les indices i d un vecteur tel que le vecteur[i] est ordonné dans l ordre croissant. L option la plus courante est decreasing=t pour renvoyer dans l ordre décroissant. La fonction order renvoie donc des indices qui correspondent aux positions dans le vecteur. La fonction ne doit pas être confondue avec sort qui elle renvoie les valeurs contenues dans le vecteur ordonnées. > head(iris[order(iris$sepal.length),]) Sepal.Length Sepal.Width Petal.Length Petal.Width Species setosa setosa setosa setosa setosa setosa 2.23 rep La fonction permet de créer un vecteur en répétant une valeur quelconque n fois. > rep(na,3) [1] NA NA NA > rep(2,5) [1] > rep("c",4) [1] "C" "C" "C" "C" 2.24 read.table La fonction permet de lire un fichier texte et renvoie une data.frame. Le fichier texte doit être un fichier avec des séparateurs : c est-à-dire que chaque champ est séparé par un caractère spécial et il y a un enregistrement par ligne. Le premier argument obligatoire est le nom du fichier. Les options à connaître sont les suivantes : header=t. Dans ce cas le nom des colonnes se trouve en tête de fichier (1ère ligne lue). skip : nombre de lignes à ignorer en tête du fichier 9

10 sep : le séparateur entre chaque champ. dec : séparateur de décimales na.strings : c est un vecteur qui indique quelles valeurs considérées comme NA dans le fichier. La fonction read.table a plusieurs en fonction des paramètres par défaut. Nom sep dec header read.table espace. Faux read.delim tabulation. Vrai read.delim2 tabulation, Vrai read.csv ;. Vrai read.csv2 ;, Vrai Tab. 1: Alias de la fonction read.table Les fonctions write.table, write.delim, write.csv,... permettent d écrire des fichiers CSVs au format décris précedemment replicate La fonction permet de répéter une opération n fois. Pour ça on précise en premier argument le nombre de répétitions en premier argument l expression à executer en deuxième argument. > replicate( 5, rnorm(1) ) [1] > replicate( 5, rnorm(6) ) [,1] [,2] [,3] [,4] [,5] [1,] [2,] [3,] [4,] [5,] [6,] rownames La fonction permet de définir ou de retourner les noms attribués aux observations (à chaque ligne). > rownames(iris)[1:5] [1] "1" "2" "3" "4" "5" 10

11 > rownames(iris) <- paste( "A", 1:nrow(iris) ) > rownames(iris)[1:5] [1] "A 1" "A 2" "A 3" "A 4" "A 5" 2.27 rm La fonction permet de supprimer un objet en mémoire. Son utilisation est très simple puis qu il suffit de donner le nom de l objet en argument. > a <- 5 > rm(a) 2.28 sample La fonction permet de tirer aléatoirement un échantillon. il renvoie des valeurs tirés au hasard dans un vecteur qui est le premier argument. Le deuxième argument est le nombre d élements à tirer dans le vecteur. L argument permet d indiquer si le tirage se fait sans (FALSE)ou avec remise (TRUE). > iris[sample(1:nrow(iris),5),] Sepal.Length Sepal.Width Petal.Length Petal.Width Species A versicolor A setosa A virginica A setosa A setosa > table(sample(c(true,false),1000,replace=t)) FALSE TRUE scan La fonction permet de lire un fichier. Par défaut il lit un fichier avec des séparateurs. Cette fonction peut lire une plus grande diversité de fichier mais elle est de plus bas niveau que read.table et demande plus de paramètres à l utilisateur seq La fonction permet de créer des suites de nombre. Les arguments sont les suivantes : le minimum de la suite. 11

12 le maximum de la suite le pas entre deux valeurs. si le troisième argument est nommé length.out R génère un vecteur de longueur donné. > seq(-1,1,0.5) [1] > seq(1,5,length.out=5) [1] source La fonction permet d executer un script R contenu dans un fichier texte. En premier argument la fonction prend le nom du fichier texte. En second argument on peut spécifier si l execution se fait sans affichage echo=f ou avec avec echo=t sort La fonction renvoie les valeurs contenues dans un vecteur dans l ordre croissant. Comme option on a decreasing=t qui renvoie le vecteur dans l ordre décroissant. > sort(rnorm(5)) [1] sum La fonction permet de sommer tous les élements d un vecteur. Dans le cas où il y a une valeur NA alors la somme est NA. Pour éviter cela il faut préciser na.rm=t. > sum(1:5,na.rm=t) [1] str La fonction renvoit la structure d un objet. Par exemple sur une data.frame il renvoie les différentes colonnes ainsi que leur type. > str(iris) 12

13 'data.frame': 150 obs. of 5 variables: $ Sepal.Length: num $ Sepal.Width : num $ Petal.Length: num $ Petal.Width : num $ Species : Factor w/ 3 levels "setosa","versicolor",..: Cette fonction est précieuse dans le cas d objet plus complexe. Il permet de contourner l affichage de l objet par les fonctions dédiées et de donner les différentes variables contenu dans l objet. Cela est plus simple à comprendre par un exemple. > t <- t.test( rnorm(1000), rnorm(1000,2) ) > t Welch Two Sample t-test data: rnorm(1000) and rnorm(1000, 2) t = , df = , p-value < 2.2e-16 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: sample estimates: mean of x mean of y > str(t) List of 9 $ statistic : Named num attr(*, "names")= chr "t" $ parameter : Named num attr(*, "names")= chr "df" $ p.value : num 8.41e-308 $ conf.int : atomic [1:2] attr(*, "conf.level")= num 0.95 $ estimate : Named num [1:2] attr(*, "names")= chr [1:2] "mean of x" "mean of y" $ null.value : Named num 0..- attr(*, "names")= chr "difference in means" $ alternative: chr "two.sided" $ method : chr "Welch Two Sample t-test" $ data.name : chr "rnorm(1000) and rnorm(1000, 2)" - attr(*, "class")= chr "htest" 2.35 table La fonction permet de faire des tables de contingence. Par table de contingence on entend des tableaux indiquant le nombre de modalités dans l échan- 13

14 tillon d une ou plusieurs variables qualitatives. Pour croiser plusieurs variables, il suffit de les ajouter dans l appel de la fonction. L objet retourné est de type table. Il peut être converti en data.frame à l aide de la fonction as.data.frame. On peut aussi garder la structure de la table en forçant la classe du résultat. > tmp <- table( gl( 2, 15 ), gl( 3, 10 ) ) > as.data.frame(tmp) Var1 Var2 Freq > class(tmp) <- "matrix" > as.data.frame(tmp) tapply tapply est une des fonctions permettant l aggrégation des données qu il faut connaître... Elle permet d appliquer et de retourner les résultats de l application d une fonction pour des sous ensembles définies par les modalités d une autre variable. La fonction retourne un vecteur. Elle prend en argument obligatoires : le vecteur pour lequel on veut les résultats le vecteur permettant de découper le vecteur initial qui doit être qualitatif (character ou factor). la fonction à appliquer au premier vecteur La fonction utilisée ne doit rendre qu un vecteur de longueur. Le résultat est vecteur de longueur égale à celle du nombre de modalité. Les noms des valeurs sont ceux des modalités. Par exemple : > tapply( iris$petal.length, iris$species, mean ) setosa versicolor virginica

15 2.37 with La fonction permet de ne pas avoir à préfixer le nom des variables par le nom de la data.frame pour une expression. Pour cela la fonction prend en argument obligatoires : premier argument : le nom de la data.frame deuxième argument : l expression dont on veut le résultat En théorie, on accède à la variable Petal.Length de la data.frame iris en tapant la commande : > mean(iris$petal.length) [1] Avec with cela devient : > with( iris, mean(petal.length) ) [1] Fonctions liées aux distributions statistiques Pour chaque distribution il existe une série de fonctions spécifiques. Elle sont préfixés par leur rôle : p<distribution> : Elle permet de récupérer la fonction de répartition. En entrée on donne la valeur x de l évènement en retour elle donne la probabilité que P (X x). d<distribution> : Elle correspond à la densité de la distribution. La densité est pour une distribution continue la dérivée de la fonction de répartition. Elle se comprend plus aisement pour une fonction discrète. Pour une fonction discrète elle pour x est P (X = x). Pour une fonction continue on peut la même analogie avec P (X = x + ɛ) avec ɛ infiniment proche de zéro. q<distribution> : Cette fonction donne le quantile. Le quantile est la fonction inverse de la fonction de répartition. Elle est à utiliser quand on dispose de la probabilité P (X x) et que l on veut la valeur de x correspondante. r<distribution> : elle permet de générer aléatoirement des nombres dans un échantillon dont la fonction de distribution est définie. Elle prend en premier argument le nombre de valeurs à calculer. Toutes les fonctions prennent comme arguments supplémentaires les paramètres des lois. Ces paramètres varient. Ils sont parfois obligatoires comme pour les degrés de liberté pour la loi de Student, Fisher,... Les fonctions p<distribution>, d<distribution> et q<distribution> ont la possibilité d absorber et de rendre un vecteur de même taille que l argument. Par exemple : 15

16 > # On demande la densité pour 5 valeurs > # et on récupère les 5 valeurs de densité. > dnorm( c(-2,-1,0,1,2) ) [1] Les fonctions permettant la génération de données sont fondamentales. Elles prennent comme premier argument le nombre aléatoire qui l ont veut. > rnorm(10) [1] [7] Distribution normale Pour la distribution normale on a quatre fonctions associées :,, et. Leurs documentations est disponible par la commande?normal. Les arguments supplémentaires sont : mean : il permet de modifier la moyenne de la loi normale. sd : il permet de modifier l écart-type de la loi normale. Exemple : > normal <- rnorm(1000) > hist( normal, freq=f ) Histogram of student Density student 16

17 > x <- seq(-6,6,0.1) > plot( x, dnorm( x, mean=-2, sd=2 ), type="l", col="red", ylim=c(0,1) ) > points( x, pnorm( x, mean=-2, sd=2 ), type="l", col="blue" ) > normal <- sort(runif(1000)) > points( qnorm( normal, mean=1, sd=2 ), normal, type="l", col="green" ) dt(x, 15) x 3.2 Loi de Student La loi de Student dispose de quatre fonctions dédiées :,, et. Elle prend en second paramètre obligatoire le nombre de degrés de liberté. L aide sur ces fonctions est disponible via la commande?tdist. Exemple : > student <- rt(1000,10) > hist( student, freq=f ) 17

18 Histogram of student Density student > x <- seq(-6,6,0.1) > plot( x, dt( x, 15 ), type="l", col="red", ylim=c(0,1) ) > points( x, pt( x, 15 ), type="l", col="blue" ) > student <- sort(runif(1000)) > points( qt( student, 1 ), student, type="l", col="green" ) 18

19 dt(x, 15) x 3.3 Loi uniforme Les fonctions liées à la loi uniforme sont au nombre de 4 :,, et. La distribution normale est particulière car elle assume que la probabilité d évènement est constant sur un intervalle. Par défaut elle est définie sur l intervalle [0 ;1]. Sinon elle peut prendre deux arguments : min : le début de l intervalle de définition max : la fin de l intervalle de définition L aide est obtenue par la commande?uniform. > uniform <- runif(1000,min=10,max=100) > hist( uniform, freq=f ) 19

20 Histogram of uniform Density uniform > x <- seq(0,15,0.1) > plot( x, dunif( x, min=0, max=15 ), type="l", col="red", ylim=c(0,1) ) > points( x, punif( x, min=0,max=15 ), type="l", col="blue" ) > uniform <- sort(runif(1000)) > points( qunif( uniform, min=2,max=10 ), uniform, type="l", col="green" ) 20

21 dunif(x, min = 0, max = 15) x 4 Fonctions statistiques 4.1 aov La fonction permet de réaliser une analyse de la variance ou ANOVA. Le premier argument est une formule. Les arguments suivants ne seront pas vus. L objet créé est de type aov et est relativement complexe. Pour visualiser les résultats on peut afficher l objet créé ou utiliser la fonction summary. Pour les comparaisons paire à paire on peut utiliser la fonction TukeyHSD. > (a <- aov( Sepal.Length ~ Species, data=iris )) Call: aov(formula = Sepal.Length ~ Species, data = iris) Terms: Species Residuals Sum of Squares Deg. of Freedom

22 Residual standard error: Estimated effects may be unbalanced > summary(a) Df Sum Sq Mean Sq F value Pr(>F) Species < 2.2e-16 *** Residuals Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' cor La fonction calcule le coefficient de corrélation de Bravais Pearson qui traduit l intensité d une relation linéaire entre deux variables quantitatives. il suffit de passer les deux variables en argument. Si des variables manquantes sont présentes par défaut la corrélation sera comme les variables manquantes c est à dire à NA. Pour calculer la corrélation il faut utiliser use= complete.obs ou use= na.or.complete. > cor(iris$sepal.length,iris$petal.length) [1] cor.test La fonction permet de faire un test de nullité du coefficient de corrélation. L hyopthèse nulle est que la corrélation est nulle. On peut passer les deux échantillons en argument ou bien une fonction. > cor.test(iris$sepal.length,iris$petal.width) Pearson's product-moment correlation data: iris$sepal.length and iris$petal.width t = , df = 148, p-value < 2.2e-16 alternative hypothesis: true correlation is not equal to 0 95 percent confidence interval: sample estimates: cor binom.test La fonction permet de réaliser un test où l hypothèse nulle est une que la distribution est binomiale. 22

23 En premier il faut donner le nombre de succès et en deuxième le nombre d essais. La probabilité peut être donnée dans un troisième argument. L objet retourné est de classe htest. > binom.test( 10, 20, 0.5 ) Exact binomial test data: 10 and 20 number of successes = 10, number of trials = 20, p-value = 1 alternative hypothesis: true probability of success is not equal to percent confidence interval: sample estimates: probability of success ks.test Cette fonction permet de réaliser des tests d adéquation entre deux échantillons ou un échantillon et une distribution théorique. Cette fonction n est pas à connaître car non vu en cours. Pour l utiliser il faut passer l échantillon en premier argument puis l autre échantillon ou une fonction donnant la fonction de répartition. > ks.test(rnorm(1000), pnorm) One-sample Kolmogorov-Smirnov test data: rnorm(1000) D = 0.024, p-value = alternative hypothesis: two-sided 4.6 quantile La fonction donne les quantiles du vecteur ou de la data.frame qui est passé en argument. Le deuxième argument, probs, indique à R quels quantiles utilisés. Les quantiles sont à indiquer en proportion. Par défaut les quantiles sont 0, 1 et Dans le cas où il y a au moins une seule valeur NA alors la fonction renvoie NA. Pour modifier ce comportement et faire les calculs en excluant les NA il faut préciser l argument na.rm=true. > quantile(iris$petal.length,c(0,0.25,0.5,0.75,1)) 0% 25% 50% 75% 100%

24 4.7 lm La fonction est une abbréviation de linear models. Elle permet de réaliser une regression d une ou plusieurs variables sur une variable tierce. On utilise une formule pour définir le modèle. La fonction renvoie un objet de type lm. On peut l afficher et utiliser la summary. Des graphiques de diagnostic peuvent être obtenus en passant l objet à la fonction plot. > a = lm( Sepal.Length ~ Sepal.Width + Petal.Length + Petal.Width, data = iris ) > summary(a) Call: lm(formula = Sepal.Length ~ Sepal.Width + Petal.Length + Petal.Width, data = iris) Residuals: Min 1Q Median 3Q Max Coefficients: Estimate Std. Error t value Pr(> t ) (Intercept) e-12 *** Sepal.Width < 2e-16 *** Petal.Length < 2e-16 *** Petal.Width e-05 *** --- Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Residual standard error: on 146 degrees of freedom Multiple R-squared: , Adjusted R-squared: F-statistic: on 3 and 146 DF, p-value: < 2.2e max La fonction donne la valeur maximale du vecteur ou de la data.frame qui est passé en argument. Dans le cas où il y a au moins une seule valeur NA alors la fonction renvoie NA. Pour modifier ce comportement et faire les calculs en excluant les NA il faut préciser l argument na.rm=true. 4.9 mean La fonction donne la moyenne des valeurs dans le vecteur ou la data.frame qui est passé en argument. 24

25 Dans le cas où il y a au moins une seule valeur NA alors la fonction renvoie NA. Pour modifier ce comportement et faire les calculs en excluant les NA il faut préciser l argument na.rm=true median La fonction donne la médiane (valeur pour lequel 50% des observations sont inférieurs à la valeur) du le vecteur ou de la data.frame qui est passé en argument. Dans le cas où il y a au moins une seule valeur NA alors la fonction renvoie NA. Pour modifier ce comportement et faire les calculs en excluant les NA il faut préciser l argument na.rm=true median La fonction donne la médiane (valeur pour lequel 50% des observations sont inférieurs à la valeur) du le vecteur ou de la data.frame qui est passé en argument. Dans le cas où il y a au moins une seule valeur NA alors la fonction renvoie NA. Pour modifier ce comportement et faire les calculs en excluant les NA il faut préciser l argument na.rm=true min La fonction donne la valeur minimale des valeurs dans le vecteur ou la data.frame qui est passé en argument. Dans le cas où il y a au moins une seule valeur NA alors la fonction renvoie NA. Pour modifier ce comportement et faire les calculs en excluant les NA il faut préciser l argument na.rm=true range La fonction donne dans un vecteur de taille 2 la valeur minimale puis la valeur maximale du vecteur ou de la data.frame qui est passé en argument. Dans le cas où il y a au moins une seule valeur NA alors la fonction renvoie NA. Pour modifier ce comportement et faire les calculs en excluant les NA il faut préciser l argument na.rm=true summary La fonction permet d obtenir rapidement un résumé des données. Il donne un résumé adapté au type de données qu on lui passe. Typiquement pour une data.frame il va faire un résumé pour chaque variable. Pour les variables facteurs et qualitatives il donne la fréquence des principales modalités et pour les variables quantitatives il donne les quantiles et la moyenne. Pour un objet d une autre classe que data.frame il est possible qu une fonction summary existe et renvoie un aperçu de l objet. C est notamment le cas pour les objets de classe lm et aov. 25

26 4.15 power.t.test La fonction est un des rares cas où la puissance d un test peut être estimée. En l occurence c est la puissance d un test de Student. Les arguments sont les suivants : n : nombre d observations dans les deux groupes delta : la différence entre les deux moyennes sig.level : l erreur de type I power : la puissance du test type : le type du test (moyenne contre valeur fixée, deux échantillons, appariés,...) alternative : two.sided ou one.sided > power.t.test(50,2) Two-sample t test power calculation n = 50 delta = 2 sd = 1 sig.level = 0.05 power = 1 alternative = two.sided NOTE: n is number in *each* group 4.16 prop.test La fonction prop.test permet de faire un test en comparant deux proportions. Il faut passer en premier et deuxième arguments un vecteur de longueur 2 indiquant les deux proportions observées : dans le premier vecteur les deux proportions chiffres observés et dans le vecteur 2 les deux chiffres maximums. > prop.test( c(10,20), c(100,100) ) 2-sample test for equality of proportions with continuity correction data: c(10, 20) out of c(100, 100) X-squared = , df = 1, p-value = alternative hypothesis: two.sided 95 percent confidence interval: sample estimates: prop 1 prop

27 4.17 shapiro.test Le test de Shapiro & Wilks n a été que survolé... C est un test posant comme hypothèse nulle que les données sont distribuées selon une loi normale. Il suffit de de passer l échantillon en premier argument. Les informations affichées sont retournées silencieusement dans un objet. > shapiro.test(rnorm(100)) Shapiro-Wilk normality test data: rnorm(100) W = , p-value = > shapiro.test(rexp(100)) Shapiro-Wilk normality test data: rexp(100) W = , p-value = 6.222e t.test La fonction permet de réaliser un test de Student. Ce test permet la comparaison de la moyenne d un échantillon par rapport à une valeur théorique ou à un autre échantillon. Le test est robuste mais repose sur la normalité des distributions. Sous R par défaut est appliqué une correction qui suppose que les variances sont inégales. Si on souhaite faire le test pour des variances égales il faut préciser var.equal=t. Pour la comparaison par rapport à une valeur de référence on donne l échantillon comme premier argument et et on précise mu=<valeur>. Par défaut mu est égal à zéro. L intervalle de confiance se modifie avec l argument conf.level. Pour comparer deux échantillons on peut donner en premier et deuxième argument les deux échantillons. On peut aussi fournir une formule : > t.test( rnorm(1000), rnorm(1000,2) ) Welch Two Sample t-test data: rnorm(1000) and rnorm(1000, 2) t = , df = , p-value < 2.2e-16 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: sample estimates: mean of x mean of y

28 > a=gl(2,50) > b=c( rnorm(50), rnorm(50,2) ) > t.test( b~a ) Welch Two Sample t-test data: b by a t = , df = , p-value < 2.2e-16 alternative hypothesis: true difference in means is not equal to 0 95 percent confidence interval: sample estimates: mean in group 1 mean in group La fonction renvoie silencieusement les valeurs affichées par la commande print. > str(t.test( b~a )) List of 9 $ statistic : Named num attr(*, "names")= chr "t" $ parameter : Named num attr(*, "names")= chr "df" $ p.value : num 2.28e-22 $ conf.int : atomic [1:2] attr(*, "conf.level")= num 0.95 $ estimate : Named num [1:2] attr(*, "names")= chr [1:2] "mean in group 1" "mean in group 2" $ null.value : Named num 0..- attr(*, "names")= chr "difference in means" $ alternative: chr "two.sided" $ method : chr "Welch Two Sample t-test" $ data.name : chr "b by a" - attr(*, "class")= chr "htest" 4.19 TukeyHSD La fonction permet de faire des comparaisons paire à paire dans une ANOVA en tenant compte des risques résultants des tests multiples. La fonction prend comme argument un objet de type aov. L objet retourné par cette fonction peut être passé à la fonction plot. > (a <- aov( Sepal.Length ~ Species, data=iris )) 28

29 Call: aov(formula = Sepal.Length ~ Species, data = iris) Terms: Species Residuals Sum of Squares Deg. of Freedom Residual standard error: Estimated effects may be unbalanced > summary(a) Df Sum Sq Mean Sq F value Pr(>F) Species < 2.2e-16 *** Residuals Signif. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 > TukeyHSD(a) Tukey multiple comparisons of means 95% family-wise confidence level Fit: aov(formula = Sepal.Length ~ Species, data = iris) $Species diff lwr upr p adj versicolor-setosa virginica-setosa virginica-versicolor > plot(tukeyhsd(a)) 5 Fonctions graphiques 5.1 barplot La fonction barplot a été peu abordée. En effet elle est surtout utile dans le cas de l étude des variables qualitatives. Elle trace un diagramme en batons : c est à dire des barres proportionnelles au valeurs définis. Contrairement à la fonction hist la fonction barplot ne réalise aucun calcul : la hauteur des barres et le nombre de barres dépend du vecteur passé en premier argument. Le premier argument peut être un tableau. Dans ce cas la hauteur par colonne est la somme marginale par colonne et chaque ligne correspond à une couleur. Typiquement elle permet de visualiser des tables de contingence. 29

30 > barplot( table(iris$species) ) setosa versicolor virginica 5.2 boxplot La fonction permet de tracer un graphique en boite à moustaches. Ces graphiques permettent d apprécier graphiquement les quantiles associés à une variable quantitative. La fonction retourne silencieusement de nombreuses informations statistiques sur les variables. On peut utiliser des formules ce qui permet de tracer une boite à moustache par modalités d une variable qualitative ou une boite par colonne d une data.frame. > boxplot(iris$sepal.length~iris$species) 30

31 setosa versicolor virginica > boxplot(iris[,1:4]) 31

32 Sepal.Length Sepal.Width Petal.Length Petal.Width 5.3 hist La fonction permet de tracer un histogramme. Un histogramme représente les effectifs ou la fréquence à laquelle apparait les valeurs comprises dans un intervalle. Le calcul des intervalles se fait par la fonction hist elle même. Elle renvoie ces informations lorsqu on affecte la fonction à une variable. Les paramètres facultatifs sont : freq : indique si l échelle est en effectif (TRUE par défaut) ou en proportions (FALSE). Pour superposer à une fonction density il faut utiliser l argument freq=false breaks : entier positif qui indique le nombre d intervalles à considérer. En pratique R ne découpe pas à plus de 25 intervalles. main : le titre du graphique. Exemple : > norm <- rnorm(1000) > hist(norm,freq=false) > lines(density(norm)) 32

33 5.4 identify La fonction permet de repérer les points atypiques par exemple en cliquant sur le graphique. On passe en argument les coordonnées en x, en y puis les étiquettes des points. Il suffit alors d activer le graphique et de cliquer sur les points interessants. L étiquette du point s affiche alors. > a <- qqnorm(iris$sepal.length) > qqline(iris$sepal.length) 5.5 interaction.plot La fonction permet d étudier l effet sur une estimation d une variable quantitative en fonction de deux variables qualitatives. En abscisse il y a les modalités d une variable qualitative et plusieurs courbes sont générées en fonction des modalités d une deuxième variable. En ordonnées on trouve les valeurs prises par la fonction de la valeur quantitative : le croisement des deux variables fournis des vecteurs qui passés à la fonction et qui renvoie une valeur. Les valeurs obtenus sont alors donnés. Les arguments sont les suivants : la première variable qualitative la deuxième variable qualitative la variable quantitative étudiée. une fonction qui réalise le calcul sur la variable quantitative. Un exemple type : > interaction.plot( + esoph$alcgp, + esoph$tobgp, + esoph$ncases/esoph$ncontrols, + mean + ) 33

34 mean of esoph$ncases/esoph$ncontrols esoph$tobgp g/day g/day esoph$alcgp Dans une analyse il pourrait être intéressant d utiliser une autre fonction que la moyenne. Par exemple : > interaction.plot( + esoph$alcgp, + esoph$tobgp, + esoph$ncases/esoph$ncontrols, + sd + ) 5.6 lines La fonction permet de tracer une courbe passant par les points spécifiés avec comme premier argument les abscisses et en second les coordonnées. La fonction lines permet également de tracer des lignes à partir d objet tel que density. La fonction n est pas capable d initier un graphique. Il faut qu un graphique existe pour superposer la ligne. La fonction est complètement équivalente à la commande plot(...,type= l ) > plot( 0,0, xlim=c(-pi,pi), ylim=c(-1,1) ) > x <- seq(-pi,pi,0.01) > lines(x,sin(x)) 34

35 5.7 pairs La fonction permet de créer des graphiques de corrélation pour les variables quantitatives. Pour tous les couples de variable elle crée un graphique d une variable en fonction de l autre. Cela aboutit à un tableau de taille k par k avec k le nombre de variables. > pairs(iris[,1:4]) 5.8 par La fonction est relativement complexe. Elle permet de modifier les paramètres graphiques de la fenêtre créée. Son usage est dual. Si on tape par() on récupére les paramètres graphiques. Inversement si on passe un argument à la fonction par on peut modifier les paramètres. Les paramètres les plus utilisés dans le cadre de ce cours sont : no.readonly=t : permet de récupérer les paramètres que l utilisateur peut modifier. Cela permet de sauvegarder les paramètres par défaut avant de les modifier. mar : fixe les marges des graphiques. Il peut être utile de les modifier dans le cas où les étiquettes des axes sont trop grandes. mfrow : ce paramètre prend comme argument un vecteur de taille 2 donnant le nombre de graphiques que l on peut réaliser sur une même fenêtre. Le premier nombre donne le nombre de lignes et le deuxième le nombre de colonnes. mfcol : exactement l inverse de mfrow. > old.par <- par(no.readonly=t) > par(mar=c(10,4,4,2)) > par(mfrow=c(1,2)) > hist(iris$sepal.length) > hist(iris$petal.length) > par(old.par) 35

36 Histogram of iris$sepal.length Histogram of iris$petal.length Frequency Frequency iris$sepal.length iris$petal.length 5.9 plot La fonction est une des plus longues et plus dures à expliquer. Cette fonction est une fonction générique c est-à-dire qu elle est capable de réaliser différentes opérations en fonction du type d objet en argument. Dans le premier cas de figure on ne passe qu un vecteur numérique. Dans ce cas, pour un vecteur a, c est équivalent à la fonction plot(1 :length(a),a). Dans le cas ou on passe deux arguments qui sont des vecteurs numériques alors la fonction utilise le premier pour les coordonnées sur l axe des x et le deuxième pour les coordonnées sur l axe des ordonnées : plot(x,y). On peut également passer une formule à la fonction. Typiquement la formule passée est plot( y x ). Dans ce cas on peut passer un argument supplémentaire data=truc pour dire à R que les variables x et ysont contenues dans la data.frame truc. Dans le cas où l on ne passe qu un argument et que l argument est d un type particulier de classe S3 ou S4 alors la fonction peut avoir un comportement particulier. Par exemple si on fait plot(reg) avec reg un objet de type lm alors on obtient les graphiques de diagnostic d une régression linéaire. On peut accéder à toutes les fonctions plot disponibles quand on tape la commande : methods(plot). Les arguments supplémentaires sont légions. On notera les plus importants : 36

37 xlim et ylim : ces arguments prennent comme argument un vecteur numérique de longueur deux. Le premier définit le minimum et le second le maximum. xlim pour l axe des abscisses et ylim pour l axe des ordonnées. type : permet de définir le type de graphiques. La valeur p pour des points, b pour des points et des lignes, l pour des lignes. D autres valeurs sont possibles. xlab et ylab : pour la légende d l axe des x et des y. main : pour le titre général du graphique points La fonction est en tout points identique à la fonction plot à une exception. Elle ne crée pas de nouveau graphique et superpose donc les points au graphique existant qqnorm La fonction permet de réaliser un graphique quantile-quantile de la loi normale. Cela permet de comparer la distribution par rapport à une loi normale de variance et de moyenne estimé sur l échantillon. Il suffit de passer l échantillon en premier argument. Silencieusement la fonction renvoie les coordonnées en x et y. Son utilisation avec la fonction qqline est presque systématique. > tmp <- rnorm(100) > qqnorm(tmp) > qqline(tmp) 5.12 qqline La fonction permet de tracer sur un graphique quantile-quantile la droite indiquant l équivalence entre les distributions. Pour une loi normale, on appele parfois cette droite droite de Henry. Il suffit de passer l échantillon en premier argument. > tmp <- rexp(100) > qqnorm(tmp) > qqline(tmp) 37

38 Index?, 1 aggregate, 2 aov, 21 apply, 3 as.character, 6 as.factor, 6 as.numeric, 6 attach, 3 binom.test, 22 boxplot, 30 by, 4 cor, 22 cor.test, 22 cos, 6 data, 5 detach, 5 dim, 6 dnorm, 16 dt, 17 dunif, 19 factorial, 6 gl, 6 head, 7 help, 1 help.search, 1 hist, 32 identify, 33 ifelse, 7 interaction.plot, 33 is.data.frame, 6 is.na, 7 is.null, 7 is.numeric, 6 ks.test, 23 length, 8 lines, 34 lm, 24 log, 6 log10, 6 ls, 8 max, 24 mean, 24 median, 25 min, 25 names, 8 ncol, 8 nrow, 8 order, 9 pairs, 35 par, 35 plot, 36 pnorm, 16 points, 37 power.t.test, 26 pt, 17 punif, 19 q, 8 qnorm, 16 qqline, 37 qqnorm, 37 qt, 17 quantile, 23 qunif, 19 range, 25 read.table, 9 rep, 9 replace, 11 replicate, 10 rm, 11 rnorm, 16 rownames, 10 rt, 17 runif, 19 38

39 sample, 11 scan, 11 seq, 11 sin, 6 sort, 12 source, 12 sqrt, 6 str, 12 sum, 12 summary, 25 t.test, 27 table, 13 tail, 7 tan, 6 TukeyHSD, 28 with, 15 39

Introduction aux Statistiques et à l utilisation du logiciel R

Introduction aux Statistiques et à l utilisation du logiciel R Introduction aux Statistiques et à l utilisation du logiciel R Christophe Lalanne Christophe Pallier 1 Introduction 2 Comparaisons de deux moyennes 2.1 Objet de l étude On a mesuré le temps de sommeil

Plus en détail

Lire ; Compter ; Tester... avec R

Lire ; Compter ; Tester... avec R Lire ; Compter ; Tester... avec R Préparation des données / Analyse univariée / Analyse bivariée Christophe Genolini 2 Table des matières 1 Rappels théoriques 5 1.1 Vocabulaire....................................

Plus en détail

Introduction à la statistique non paramétrique

Introduction à la statistique non paramétrique Introduction à la statistique non paramétrique Catherine MATIAS CNRS, Laboratoire Statistique & Génome, Évry http://stat.genopole.cnrs.fr/ cmatias Atelier SFDS 27/28 septembre 2012 Partie 2 : Tests non

Plus en détail

Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015 Exercices M1 SES 214-215 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 215 Les exemples numériques présentés dans ce document d exercices ont été traités sur le logiciel R, téléchargeable par

Plus en détail

Introduction à R. Florence Yerly. Dept. de mathématiques, Université de Fribourg (CH) SP 2011

Introduction à R. Florence Yerly. Dept. de mathématiques, Université de Fribourg (CH) SP 2011 Dept. de mathématiques, Université de Fribourg (CH) SP 2011 Qu est ce que R? Un logiciel de statistiques libre et gratuit ; Un logiciel multi-plateforme (UNIX, Windows MacOS X) R permet de faire des calculs

Plus en détail

Exemples d Analyses de Variance avec R

Exemples d Analyses de Variance avec R Exemples d Analyses de Variance avec R Christophe Pallier 5 août 00 Résumé R est un logiciel d analyse statistique qui fournit toutes les procédures usuelles (t-tests, anova, tests non paramétriques...)

Plus en détail

Cours 1. I- Généralités sur R II- Les fonctions de R et autres objets III-Les vecteurs

Cours 1. I- Généralités sur R II- Les fonctions de R et autres objets III-Les vecteurs Cours 1 I- Généralités sur R II- Les fonctions de R et autres objets III-Les vecteurs IV-Les facteurs I-1 Généralités sur R R (1995, AT&T Bell Laboratories) est un logiciel d analyse statistique et graphique,

Plus en détail

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position Arbre de NESI distribution quelconque Signe 1 échantillon distribution symétrique non gaussienne Wilcoxon gaussienne Student position appariés 1 échantillon sur la différence avec référence=0 2 échantillons

Plus en détail

Annexe commune aux séries ES, L et S : boîtes et quantiles

Annexe commune aux séries ES, L et S : boîtes et quantiles Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans

Plus en détail

Densité de population et ingestion de nourriture chez un insecte vecteur de la maladie de Chagas

Densité de population et ingestion de nourriture chez un insecte vecteur de la maladie de Chagas Fiche TD avec le logiciel : tdr335 Densité de population et ingestion de nourriture chez un insecte vecteur de la maladie de Chagas F. Menu, A.B. Dufour, E. Desouhant et I. Amat La fiche permet de se familiariser

Plus en détail

TP de Statistiques: Utilisation du logiciel R

TP de Statistiques: Utilisation du logiciel R TP de Statistiques: Utilisation du logiciel R Année 2006-2007 2 Table des matières Introduction i 1 Premiers pas avec R 1 1.1 R est une calculatrice............................................. 1 1.2 R

Plus en détail

Aide-mémoire de statistique appliquée à la biologie

Aide-mémoire de statistique appliquée à la biologie Maxime HERVÉ Aide-mémoire de statistique appliquée à la biologie Construire son étude et analyser les résultats à l aide du logiciel R Version 5(2) (2014) AVANT-PROPOS Les phénomènes biologiques ont cela

Plus en détail

INTRODUCTION À L'ENVIRONNEMENT DE PROGRAMMATION STATISTIQUE R

INTRODUCTION À L'ENVIRONNEMENT DE PROGRAMMATION STATISTIQUE R INTRODUCTION À L'ENVIRONNEMENT DE PROGRAMMATION STATISTIQUE R Y. BROSTAUX (1) RÉSUMÉ Cette note constitue une introduction au langage et à l'environnement de programmation 5 dans sa version 1.4.1 pour

Plus en détail

Gestion des données avec R

Gestion des données avec R Gestion des données avec R Christophe Lalanne & Bruno Falissard Table des matières 1 Introduction 1 2 Importation de fichiers CSV 1 2.1 Structure du fichier de données...................................

Plus en détail

R01 Import de données

R01 Import de données R01 Import de données A partir du package de base, R peut lire les données stockées dans des fichiers texte, à partir notamment des fonctions read.table, read.csv, read.delim, read.csv2, read.delim2, et

Plus en détail

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année 2010-2011

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année 2010-2011 Master 1 Biologie et technologie du végétal Année 010-011 Statistiques Rappels de cours et travaux dirigés (Seul ce document sera autorisé en examen) auteur : Jean-Marc Labatte jean-marc.labatte@univ-angers.fr

Plus en détail

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence

Plus en détail

Une introduction. Lionel RIOU FRANÇA. Septembre 2008

Une introduction. Lionel RIOU FRANÇA. Septembre 2008 Une introduction INSERM U669 Septembre 2008 Sommaire 1 Effets Fixes Effets Aléatoires 2 Analyse Classique Effets aléatoires Efficacité homogène Efficacité hétérogène 3 Estimation du modèle Inférence 4

Plus en détail

SEMIN. Données sous R : stockage et échange. Julio PEDRAZA ACOSTA

SEMIN. Données sous R : stockage et échange. Julio PEDRAZA ACOSTA SEMIN Données sous R : stockage et échange Julio PEDRAZA ACOSTA UMR 5202 Origine Structure et Evolution de la Biodiversité Département Systématique et Evolution, MNHN pedraza@mnhn.fr SEMIN R du MNHN 10

Plus en détail

INTRODUCTION AU LOGICIEL R

INTRODUCTION AU LOGICIEL R INTRODUCTION AU LOGICIEL R Variables et mise en jambe Anne Dubois, Julie Bertrand, Emmanuelle Comets emmanuelle.comets@inserm.fr INSERM UMR738 (UMR738) 1 / 68 Sur le site www.cran.r-project.org : Ou trouver

Plus en détail

Analyse de la variance Comparaison de plusieurs moyennes

Analyse de la variance Comparaison de plusieurs moyennes Analyse de la variance Comparaison de plusieurs moyennes Biostatistique Pr. Nicolas MEYER Laboratoire de Biostatistique et Informatique Médicale Fac. de Médecine de Strasbourg Mars 2011 Plan 1 Introduction

Plus en détail

TABLE DES MATIERES. C Exercices complémentaires 42

TABLE DES MATIERES. C Exercices complémentaires 42 TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence

Plus en détail

Package TestsFaciles

Package TestsFaciles Package TestsFaciles March 26, 2007 Type Package Title Facilite le calcul d intervalles de confiance et de tests de comparaison avec prise en compte du plan d échantillonnage. Version 1.0 Date 2007-03-26

Plus en détail

Séance 0 : Linux + Octave : le compromis idéal

Séance 0 : Linux + Octave : le compromis idéal Séance 0 : Linux + Octave : le compromis idéal Introduction Linux est un système d'exploitation multi-tâches et multi-utilisateurs, basé sur la gratuité et développé par une communauté de passionnés. C'est

Plus en détail

1 Introduction - Qu est-ce que le logiciel R?

1 Introduction - Qu est-ce que le logiciel R? Master 1 GSI - Mentions ACCIE et RIM - ULCO, La Citadelle, 2012/2013 Mesures et Analyses Statistiques de Données - Probabilités TP 1 - Initiation au logiciel R 1 Introduction - Qu est-ce que le logiciel

Plus en détail

Didacticiel - Études de cas. Description de quelques fonctions du logiciel PSPP, comparaison des résultats avec ceux de Tanagra, R et OpenStat.

Didacticiel - Études de cas. Description de quelques fonctions du logiciel PSPP, comparaison des résultats avec ceux de Tanagra, R et OpenStat. 1 Objectif Description de quelques fonctions du logiciel PSPP, comparaison des résultats avec ceux de Tanagra, R et OpenStat. Tout le monde l aura compris, je passe énormément de temps à analyser les logiciels

Plus en détail

LES TYPES DE DONNÉES DU LANGAGE PASCAL

LES TYPES DE DONNÉES DU LANGAGE PASCAL LES TYPES DE DONNÉES DU LANGAGE PASCAL 75 LES TYPES DE DONNÉES DU LANGAGE PASCAL CHAPITRE 4 OBJECTIFS PRÉSENTER LES NOTIONS D ÉTIQUETTE, DE CONS- TANTE ET DE IABLE DANS LE CONTEXTE DU LAN- GAGE PASCAL.

Plus en détail

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT Ces exercices portent sur les items 2, 3 et 5 du programme d informatique des classes préparatoires,

Plus en détail

Introduction à l approche bootstrap

Introduction à l approche bootstrap Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?

Plus en détail

Loi binomiale Lois normales

Loi binomiale Lois normales Loi binomiale Lois normales Christophe ROSSIGNOL Année scolaire 204/205 Table des matières Rappels sur la loi binomiale 2. Loi de Bernoulli............................................ 2.2 Schéma de Bernoulli

Plus en détail

MATLAB : COMMANDES DE BASE. Note : lorsqu applicable, l équivalent en langage C est indiqué entre les délimiteurs /* */.

MATLAB : COMMANDES DE BASE. Note : lorsqu applicable, l équivalent en langage C est indiqué entre les délimiteurs /* */. Page 1 de 9 MATLAB : COMMANDES DE BASE Note : lorsqu applicable, l équivalent en langage C est indiqué entre les délimiteurs /* */. Aide help, help nom_de_commande Fenêtre de travail (Command Window) Ligne

Plus en détail

Introduction à MATLAB R

Introduction à MATLAB R Introduction à MATLAB R Romain Tavenard 10 septembre 2009 MATLAB R est un environnement de calcul numérique propriétaire orienté vers le calcul matriciel. Il se compose d un langage de programmation, d

Plus en détail

Tests statistiques et régressions logistiques sous R, avec prise en compte des plans d échantillonnage complexes

Tests statistiques et régressions logistiques sous R, avec prise en compte des plans d échantillonnage complexes , avec prise en compte des plans d échantillonnage complexes par Joseph LARMARANGE version du 29 mars 2007 Ce cours a été développé pour une formation niveau M2 et Doctorat des étudiants du laboratoire

Plus en détail

Analyse exploratoire des données

Analyse exploratoire des données Analyse exploratoire des données Introduction à R pour la recherche biomédicale http://wwwaliquoteorg/cours/2012_biomed Objectifs Au travers de l analyse exploratoire des données, on cherche essentiellement

Plus en détail

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites

La problématique des tests. Cours V. 7 mars 2008. Comment quantifier la performance d un test? Hypothèses simples et composites La problématique des tests Cours V 7 mars 8 Test d hypothèses [Section 6.1] Soit un modèle statistique P θ ; θ Θ} et des hypothèses H : θ Θ H 1 : θ Θ 1 = Θ \ Θ Un test (pur) est une statistique à valeur

Plus en détail

Une introduction au langage R

Une introduction au langage R Une introduction au langage R Faouzi LYAZRHI UP Biostatistique Ecole Nationale Vétérinaire, 23, chemin des Capelles, BP 87614, F-31076 Toulouse cédex email : f.lyazrhi@envt.fr 2005 1. INSTALLER R 3 2.

Plus en détail

Un exemple de régression logistique sous

Un exemple de régression logistique sous Fiche TD avec le logiciel : tdr341 Un exemple de régression logistique sous A.B. Dufour & A. Viallefont Etude de l apparition ou non d une maladie cardiaque des coronaires 1 Présentation des données Les

Plus en détail

Fiche d utilisation du logiciel. 1 - Installation. J. Thioulouse & D. Chessel

Fiche d utilisation du logiciel. 1 - Installation. J. Thioulouse & D. Chessel Fiche d utilisation du logiciel 1 - Installation J. Thioulouse & D. Chessel Résumé Cette fiche est une introduction à l'utilisation du logiciel R pour les trois environnements Unix, Windows et MacOS. Plan

Plus en détail

Traitement des données avec Microsoft EXCEL 2010

Traitement des données avec Microsoft EXCEL 2010 Traitement des données avec Microsoft EXCEL 2010 Vincent Jalby Septembre 2012 1 Saisie des données Les données collectées sont saisies dans une feuille Excel. Chaque ligne correspond à une observation

Plus en détail

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p. STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,

Plus en détail

Analyse discriminante et régression logistique: application au cas de l innovation pour les entreprises du Canton du Tessin

Analyse discriminante et régression logistique: application au cas de l innovation pour les entreprises du Canton du Tessin Analyse discriminante et régression logistique: application au cas de l innovation pour les entreprises du Canton du Tessin Sandro Petrillo Université de Neuchâtel - Diplôme Postgrade en Statistique Projet

Plus en détail

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Chapitre 5 UE4 : Biostatistiques Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés.

Plus en détail

Les concepts de base, l organisation des données

Les concepts de base, l organisation des données Chapitre 1 Les concepts de base, l organisation des données Objectif Ce chapitre présente les concepts de base du logiciel R (mode calculatrice, opérateur d affectation, variables, utilisation de fonctions,

Plus en détail

Cours 7 : Utilisation de modules sous python

Cours 7 : Utilisation de modules sous python Cours 7 : Utilisation de modules sous python 2013/2014 Utilisation d un module Importer un module Exemple : le module random Importer un module Exemple : le module random Importer un module Un module est

Plus en détail

Relation entre deux variables : estimation de la corrélation linéaire

Relation entre deux variables : estimation de la corrélation linéaire CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence

Plus en détail

Gestion obligataire passive

Gestion obligataire passive Finance 1 Université d Evry Séance 7 Gestion obligataire passive Philippe Priaulet L efficience des marchés Stratégies passives Qu est-ce qu un bon benchmark? Réplication simple Réplication par échantillonnage

Plus en détail

1. Vocabulaire : Introduction au tableau élémentaire

1. Vocabulaire : Introduction au tableau élémentaire L1-S1 Lire et caractériser l'information géographique - Le traitement statistique univarié Statistique : le terme statistique désigne à la fois : 1) l'ensemble des données numériques concernant une catégorie

Plus en détail

Statistiques Descriptives à une dimension

Statistiques Descriptives à une dimension I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des

Plus en détail

Installation. Notes de Cours sur le logiciel R. Plan. Au démarrage

Installation. Notes de Cours sur le logiciel R. Plan. Au démarrage Installation Notes de Cours sur le logiciel R Anne PHILIPPE Université de Nantes, UFR des Sciences et Techniques Laboratoire de Mathématiques Jean Leray email : Anne.philippe@math.univ-nantes.fr 1 er octobre

Plus en détail

Rappels sur les suites - Algorithme

Rappels sur les suites - Algorithme DERNIÈRE IMPRESSION LE 14 septembre 2015 à 12:36 Rappels sur les suites - Algorithme Table des matières 1 Suite : généralités 2 1.1 Déition................................. 2 1.2 Exemples de suites............................

Plus en détail

Présentation du logiciel

Présentation du logiciel Chapitre A Présentation du logiciel R Pré-requis et objectif La lecture du chapitre sur l installation de R dans les Annexes peut se révéler utile. Ce chapitre présente les origines, l objectif et les

Plus en détail

Chapitre 3. Les distributions à deux variables

Chapitre 3. Les distributions à deux variables Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles

Plus en détail

Statistique : Résumé de cours et méthodes

Statistique : Résumé de cours et méthodes Statistique : Résumé de cours et méthodes 1 Vocabulaire : Population : c est l ensemble étudié. Individu : c est un élément de la population. Effectif total : c est le nombre total d individus. Caractère

Plus en détail

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent

Plus en détail

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN Table des matières. Introduction....3 Mesures et incertitudes en sciences physiques

Plus en détail

1 Recherche en table par balayage

1 Recherche en table par balayage 1 Recherche en table par balayage 1.1 Problème de la recherche en table Une table désigne une liste ou un tableau d éléments. Le problème de la recherche en table est celui de la recherche d un élément

Plus en détail

Modèles pour données répétées

Modèles pour données répétées Résumé Les données répétées, ou données longitudinales, constituent un domaine à la fois important et assez particulier de la statistique. On entend par données répétées des données telles que, pour chaque

Plus en détail

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE UE4 : Biostatistiques Chapitre 3 : Principe des tests statistiques d hypothèse José LABARERE Année universitaire 2010/2011 Université Joseph Fourier de Grenoble - Tous droits réservés. Plan I. Introduction

Plus en détail

SINE QUA NON. Découverte et Prise en main du logiciel Utilisation de bases

SINE QUA NON. Découverte et Prise en main du logiciel Utilisation de bases SINE QUA NON Découverte et Prise en main du logiciel Utilisation de bases Sine qua non est un logiciel «traceur de courbes planes» mais il possède aussi bien d autres fonctionnalités que nous verrons tout

Plus en détail

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007 Vision industrielle et télédétection - Détection d ellipses Guillaume Martinez 17 décembre 2007 1 Table des matières 1 Le projet 3 1.1 Objectif................................ 3 1.2 Les choix techniques.........................

Plus en détail

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre : Terminale STSS 2 012 2 013 Pourcentages Synthèse 1) Définition : Calculer t % d'un nombre, c'est multiplier ce nombre par t 100. 2) Exemples de calcul : a) Calcul d un pourcentage : Un article coûtant

Plus en détail

2010 Minitab, Inc. Tous droits réservés. Version 16.1.0 Minitab, le logo Minitab, Quality Companion by Minitab et Quality Trainer by Minitab sont des

2010 Minitab, Inc. Tous droits réservés. Version 16.1.0 Minitab, le logo Minitab, Quality Companion by Minitab et Quality Trainer by Minitab sont des 2010 Minitab, Inc. Tous droits réservés. Version 16.1.0 Minitab, le logo Minitab, Quality Companion by Minitab et Quality Trainer by Minitab sont des marques déposées de Minitab, Inc. aux Etats-Unis et

Plus en détail

Maple: premiers calculs et premières applications

Maple: premiers calculs et premières applications TP Maple: premiers calculs et premières applications Maple: un logiciel de calcul formel Le logiciel Maple est un système de calcul formel. Alors que la plupart des logiciels de mathématiques utilisent

Plus en détail

TSTI 2D CH X : Exemples de lois à densité 1

TSTI 2D CH X : Exemples de lois à densité 1 TSTI 2D CH X : Exemples de lois à densité I Loi uniforme sur ab ; ) Introduction Dans cette activité, on s intéresse à la modélisation du tirage au hasard d un nombre réel de l intervalle [0 ;], chacun

Plus en détail

MODELE A CORRECTION D ERREUR ET APPLICATIONS

MODELE A CORRECTION D ERREUR ET APPLICATIONS MODELE A CORRECTION D ERREUR ET APPLICATIONS Hélène HAMISULTANE Bibliographie : Bourbonnais R. (2000), Econométrie, DUNOD. Lardic S. et Mignon V. (2002), Econométrie des Séries Temporelles Macroéconomiques

Plus en détail

IBM SPSS Statistics Base 20

IBM SPSS Statistics Base 20 IBM SPSS Statistics Base 20 Remarque : Avant d utiliser ces informations et le produit qu elles concernent, lisez les informations générales sous Remarques sur p. 316. Cette version s applique à IBM SPSS

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

Présentation du langage et premières fonctions

Présentation du langage et premières fonctions 1 Présentation de l interface logicielle Si les langages de haut niveau sont nombreux, nous allons travaillé cette année avec le langage Python, un langage de programmation très en vue sur internet en

Plus en détail

VI. Tests non paramétriques sur un échantillon

VI. Tests non paramétriques sur un échantillon VI. Tests non paramétriques sur un échantillon Le modèle n est pas un modèle paramétrique «TESTS du CHI-DEUX» : VI.1. Test d ajustement à une loi donnée VI.. Test d indépendance de deux facteurs 96 Différentes

Plus en détail

CAPTEURS - CHAINES DE MESURES

CAPTEURS - CHAINES DE MESURES CAPTEURS - CHAINES DE MESURES Pierre BONNET Pierre Bonnet Master GSI - Capteurs Chaînes de Mesures 1 Plan du Cours Propriétés générales des capteurs Notion de mesure Notion de capteur: principes, classes,

Plus en détail

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES

UFR de Sciences Economiques Année 2008-2009 TESTS PARAMÉTRIQUES Université Paris 13 Cours de Statistiques et Econométrie I UFR de Sciences Economiques Année 2008-2009 Licence de Sciences Economiques L3 Premier semestre TESTS PARAMÉTRIQUES Remarque: les exercices 2,

Plus en détail

L informatique en BCPST

L informatique en BCPST L informatique en BCPST Présentation générale Sylvain Pelletier Septembre 2014 Sylvain Pelletier L informatique en BCPST Septembre 2014 1 / 20 Informatique, algorithmique, programmation Utiliser la rapidité

Plus en détail

Guide d utilisation commandes des pièces de rechange Rev.1.0.3

Guide d utilisation commandes des pièces de rechange Rev.1.0.3 SECLI Ver.2.3 Guide d utilisation commandes des pièces de rechange Rev.1.0.3 Ce document est constamment actualisé: vérifiez le n de la version pour savoir s il existe d éventuelles mises à jour Futura

Plus en détail

Introduction à l analyse des statistiques des données : travaux pratiques avec le logiciel R.

Introduction à l analyse des statistiques des données : travaux pratiques avec le logiciel R. Introduction à l analyse des statistiques des données : travaux pratiques avec le logiciel R. Christophe Pallier 1 Christophe Lalanne 2 25 février 2005 1 www.pallier.org 2 christophe.lalanne.free.fr Résumé

Plus en détail

FORMULAIRE DE STATISTIQUES

FORMULAIRE DE STATISTIQUES FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)

Plus en détail

TP 1. Prise en main du langage Python

TP 1. Prise en main du langage Python TP. Prise en main du langage Python Cette année nous travaillerons avec le langage Python version 3. ; nous utiliserons l environnement de développement IDLE. Étape 0. Dans votre espace personnel, créer

Plus en détail

Table des matières. I Mise à niveau 11. Préface

Table des matières. I Mise à niveau 11. Préface Table des matières Préface v I Mise à niveau 11 1 Bases du calcul commercial 13 1.1 Alphabet grec...................................... 13 1.2 Symboles mathématiques............................... 14 1.3

Plus en détail

Étude des flux d individus et des modalités de recrutement chez Formica rufa

Étude des flux d individus et des modalités de recrutement chez Formica rufa Étude des flux d individus et des modalités de recrutement chez Formica rufa Bruno Labelle Théophile Olivier Karl Lesiourd Charles Thevenin 07 Avril 2012 1 Sommaire Remerciements I) Introduction p3 Intérêt

Plus en détail

http://cermics.enpc.fr/scilab

http://cermics.enpc.fr/scilab scilab à l École des Ponts ParisTech http://cermics.enpc.fr/scilab Introduction à Scilab Graphiques, fonctions Scilab, programmation, saisie de données Jean-Philippe Chancelier & Michel De Lara cermics,

Plus en détail

Découverte du logiciel ordinateur TI-n spire / TI-n spire CAS

Découverte du logiciel ordinateur TI-n spire / TI-n spire CAS Découverte du logiciel ordinateur TI-n spire / TI-n spire CAS Mémento Ouvrir TI-Nspire CAS. Voici la barre d outils : L insertion d une page, d une activité, d une page où l application est choisie, pourra

Plus en détail

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3

Plus en détail

Statistique Descriptive Élémentaire

Statistique Descriptive Élémentaire Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Élémentaire (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219 Université Paul Sabatier

Plus en détail

Biostatistiques : Petits effectifs

Biostatistiques : Petits effectifs Biostatistiques : Petits effectifs Master Recherche Biologie et Santé P. Devos DRCI CHRU de Lille EA2694 patrick.devos@univ-lille2.fr Plan Données Générales : Définition des statistiques Principe de l

Plus en détail

Données longitudinales et modèles de survie

Données longitudinales et modèles de survie ANALYSE DU Données longitudinales et modèles de survie 5. Modèles de régression en temps discret André Berchtold Département des sciences économiques, Université de Genève Cours de Master ANALYSE DU Plan

Plus en détail

UEO11 COURS/TD 1. nombres entiers et réels codés en mémoire centrale. Caractères alphabétiques et caractères spéciaux.

UEO11 COURS/TD 1. nombres entiers et réels codés en mémoire centrale. Caractères alphabétiques et caractères spéciaux. UEO11 COURS/TD 1 Contenu du semestre Cours et TDs sont intégrés L objectif de ce cours équivalent a 6h de cours, 10h de TD et 8h de TP est le suivant : - initiation à l algorithmique - notions de bases

Plus en détail

Utilisation du Logiciel de statistique SPSS 8.0

Utilisation du Logiciel de statistique SPSS 8.0 Utilisation du Logiciel de statistique SPSS 8.0 1 Introduction Etude épidémiologique transversale en population générale dans 4 pays d Afrique pour comprendre les différences de prévalence du VIH. 2000

Plus en détail

BIRT (Business Intelligence and Reporting Tools)

BIRT (Business Intelligence and Reporting Tools) BIRT (Business Intelligence and Reporting Tools) Introduction Cette publication a pour objectif de présenter l outil de reporting BIRT, dans le cadre de l unité de valeur «Data Warehouse et Outils Décisionnels»

Plus en détail

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

NOTE SUR LA MODELISATION DU RISQUE D INFLATION NOTE SUR LA MODELISATION DU RISQUE D INFLATION 1/ RESUME DE L ANALYSE Cette étude a pour objectif de modéliser l écart entre deux indices d inflation afin d appréhender le risque à très long terme qui

Plus en détail

Évaluation de la régression bornée

Évaluation de la régression bornée Thierry Foucart UMR 6086, Université de Poitiers, S P 2 M I, bd 3 téléport 2 BP 179, 86960 Futuroscope, Cedex FRANCE Résumé. le modèle linéaire est très fréquemment utilisé en statistique et particulièrement

Plus en détail

Leslie REGAD ; Gaëlle LELANDAIS. leslie.regad@univ- paris- diderot.fr ; gaelle.lelandais@univ- paris- diderot.fr

Leslie REGAD ; Gaëlle LELANDAIS. leslie.regad@univ- paris- diderot.fr ; gaelle.lelandais@univ- paris- diderot.fr Programmation avec R Polycopié d exercices Leslie REGAD ; Gaëlle LELANDAIS leslie.regad@univ- paris- diderot.fr ; gaelle.lelandais@univ- paris- diderot.fr Ce polycopié rassemble différents exercices vous

Plus en détail

Première session de travail

Première session de travail Fiche TD avec le logiciel : tdr12 Première session de travail D. Chessel, A.B. Dufour & J.R. Lobry Table des matières 1 Importer des données 2 2 Consulter la documentation 4 3 Le passage des paramètres

Plus en détail

Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9

Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9 Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9 L analyse de variance à un facteur permet de vérifier, moyennant certaines hypothèses, si un facteur (un critère de classification,

Plus en détail

STAGE IREM 0- Premiers pas en Python

STAGE IREM 0- Premiers pas en Python Université de Bordeaux 16-18 Février 2014/2015 STAGE IREM 0- Premiers pas en Python IREM de Bordeaux Affectation et expressions Le langage python permet tout d abord de faire des calculs. On peut évaluer

Plus en détail

Travaux pratiques avec RapidMiner

Travaux pratiques avec RapidMiner Travaux pratiques avec RapidMiner Master Informatique de Paris 6 Spécialité IAD Parcours EDOW Module Algorithmes pour la Fouille de Données Janvier 2012 Prise en main Généralités RapidMiner est un logiciel

Plus en détail

INF6304 Interfaces Intelligentes

INF6304 Interfaces Intelligentes INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

F7n COUP DE BOURSE, NOMBRE DÉRIVÉ

F7n COUP DE BOURSE, NOMBRE DÉRIVÉ Auteur : S.& S. Etienne F7n COUP DE BOURSE, NOMBRE DÉRIVÉ TI-Nspire CAS Mots-clés : représentation graphique, fonction dérivée, nombre dérivé, pente, tableau de valeurs, maximum, minimum. Fichiers associés

Plus en détail

Représentation d un entier en base b

Représentation d un entier en base b Représentation d un entier en base b 13 octobre 2012 1 Prérequis Les bases de la programmation en langage sont supposées avoir été travaillées L écriture en base b d un entier est ainsi défini à partir

Plus en détail

DÉRIVÉES. I Nombre dérivé - Tangente. Exercice 01 (voir réponses et correction) ( voir animation )

DÉRIVÉES. I Nombre dérivé - Tangente. Exercice 01 (voir réponses et correction) ( voir animation ) DÉRIVÉES I Nombre dérivé - Tangente Eercice 0 ( voir animation ) On considère la fonction f définie par f() = - 2 + 6 pour [-4 ; 4]. ) Tracer la représentation graphique (C) de f dans un repère d'unité

Plus en détail

Initiation à l analyse en composantes principales

Initiation à l analyse en composantes principales Fiche TD avec le logiciel : tdr601 Initiation à l analyse en composantes principales A.B. Dufour & J.R. Lobry Une première approche très intuitive et interactive de l ACP. Centrage et réduction des données.

Plus en détail