Introduction au logiciel R

Dimension: px
Commencer à balayer dès la page:

Download "Introduction au logiciel R"

Transcription

1 Introduction au logiciel R janvier 2013 Unité Méthodologique et de Qualité de Vie en Cancérologie Amélie ANOTA

2 Table des matières 1. Présentation générale Téléchargement et installation de R La console Fichier script de R (fichier.r) Installation et chargement d'un package Changer le répertoire des données L'aide de R Importer un fichier/exporter une table Présentation des principaux objets de R La calculatrice Les opérateurs Les vecteurs Les matrices Les listes Une structure importante sous R: les data frames Analyse générale d'un fichier de données Description générale du fichier de données La commande summary() Quelques statistiques Connaître le type d'une variable: commandes class() et mode() Modifier le type d'une variable Les données manquantes Sélection ou suppression de données ou de variables Sélection d'observations Suppression d'observations Réordonner un fichier selon les valeurs d'une variable: commande order() Modifier le nom d'une variable Extraire une chaîne de caractères Gestion des dates Création et manipulation du contenu de variables Création de variables booléennes Création de variables dichotomiques Création de variables en classes

3 5.4. Création de n variables quantitatives en fonction d'autres variables Combiner des fichiers de données: commande merge() Ajouter des observations Ajouter des variables Transposer un fichier/échange des lignes et des colonnes: commande reshape() Passer du format "long" au format "wide" Passer du format "wide" au format "long" Les tests statistiques Tableaux à plat, tableaux croisés Test de comparaison de deux proportions Test d'une corrélation significative Test de comparaison de variances: test de Fisher Snedecor Test de comparaison de deux moyennes Les variables aléatoires et échantillonnages Loi uniforme et autres lois de probabilités Les modèles de régression Régression logistique: fonction glm() Régression linéaire: fonction lm() Analyses de variance Analyse de survie L'interface graphique de R Overview des paramètres de base pour faire un graphe Ajouter des éléments sur un graphe Découpage de la fenêtre graphique Représentation variable quantitative en fonction d'une variable qualitative: boxplot Histogramme Par appel de la fonction plot() Les boucles et exécutions conditionnelles sous R Les boucles "for" Les boucles "while" Instructions conditionnelles Créer ses propres fonctions

4 4

5 1. Présentation générale R est un logiciel libre, donc gratuit, spécialisé dans l'analyse statistique et la représentation graphique des données. C'est un outil très dynamique, il y a constamment de nouvelles versions et donc de nouveaux packages (correspond à des bibliothèques confectionnées par les utilisateurs de R) Téléchargement et installation de R Le logiciel R se télécharge depuis le site du CRAN ("The Comprehensive R Archive Network"): Comme nous venons de le dire, il y a régulièrement de nouvelles versions du logiciel. Aujourd'hui, il s'agit de la versions Même si vous disposez d'une version antérieure de R, cela ne pose pas de problèmes majeurs pour l'utilisation du logiciel. Cependant, lors de l'installation d'un nouveau package (bibliothèque), vous risquez de voir apparaître le message d'alerte suivant : warning: le package nom_package a été compilé avec la version R " si vous disposez d'une version antérieure à celle de la création du package La console La console de R constitue la fenêtre principale. C'est dans cette fenêtre que l'on va soumettre une commande ou un ensemble de commandes à R. On peut rappeler une commande antérieure en utilisant la "flèche vers le haut". On soumet une ligne de commande écrite dans la console par la touche "entrée". 5

6 curseur indiquant que R est prêt à recevoir une nouvelle ligne de commande 1.3. Fichier script de R (fichier.r) Les lignes de commandes de R peuvent être écrites directement dans la console ou bien dans un script qui est un fichier.r. Pour créer un script, rien de plus simple: Fichier Nouveau script. Lorsque vous êtes dans votre fichier script, vous pouvez soumettre une ligne de commande ou bien une sélection de lignes de commandes avec la touche ou bien le raccourcis clavier CTRL + R (évidemment, on est dans R!!) Installation et chargement d'un package La plupart des packages R sont disponibles sur le site du CRAN. Il en existe plus de 4000 à ce jour. Il se télécharge soit en fichier.zip, soit depuis un miroir CRAN, soit directement dans la console par l'instruction install.package pour les fichier.tar.gz. Je vous recommande l'installation depuis un fichier.zip pour les utilisateurs de Windows. Enregistrer le fichier.zip obtenu sur le site du CRAN puis: Packages Installer des packages depuis des fichiers.zip Ensuite, à chaque nouvelle session, il faut charger le package en mémoire avec la commande library(nom_package) ou dans le volet Packages Charger le package... Attention, l'installation d'un package nécessite souvent l'installation d'autres packages. Un exemple de page d'accueil du package vous est donné ci-après. 6

7 Exemple: pour le package xlsx: nécessite l'installation des package xlsxjars et rjava fichier à télécharger pour une installation depuis fichier.zip aide de l'ensemble des fonctions du package en format pdf article avec présentation et utilisation du package liste des packages qui dépendent du présent package 7

8 1.5. Changer le répertoire des données Pour charger un ou plusieurs fichiers de données, il est recommandé de changer le répertoire de travail dès le début d'une nouvelle session R. Ceci évitera de devoir toujours repréciser le répertoire dans lequel se trouve vos données. De plus, lors de l'enregistrement de vos fichier.r, vous accéderez directement à votre répertoire courant. Pour se faire, volet Fichier Changer le répertoire courant... Ensuite indiquez le répertoire dans lequel vous avez enregistré vos données ou vous souhaitez travailler L'aide de R Pour accéder à l'aide d'une fonction R, il suffit d'écrire dans la console: > help(nom_fonction) ou bien: >?nom_fonction Pour accéder à l'aide d'une fonction, il est nécessaire de connaître son nom exact, ou du moins le début. L'utilisation de la touche tabulation sur votre clavier vous donnera alors la liste de l'ensemble des fonctions qui commencent par votre expression. Toute documentation sur une fonction est constituée de la même structure. Un exemple vous est donnée ci-après pour la fonction summary (très utile pour décrire vos variables). 8

9 fait partie du package base description brève de ce que fait la (les) fonction(s) titre de la fonction synopsis de la fonction et des variables. Montre la façon dont il faut écrire la fonction détails des arguments et options possibles de la fonction donne des informations supplémentaires sur la façon dont opère la fonction détails des sorties de la fonctions lien vers d'autres fonctions pouvant compléter votre analyse (très utile) 1.7. Importer un fichier/exporter une table Il est possible d'importer plusieurs type de données sous R à partir de fonctions présentes dans la version de base (donc sans importation de package). Pour cela, il suffit d'utiliser la fonction read.table dont vous pouvez accéder à l'aide par la commande: >?read.table - importation de fichiers excel de type.csv (comma separated values) > nom_tabler=read.table("nom_fichier.csv",sep=";",header=t) > nom_tabler=read.csv("nom_fichier.csv",sep=";",header=t) Par défaut, header=t pour TRUE. Cette option permet de garder les noms des colonnes présent dans le fichier d'origine comme nom de variable dans la table R. On peut aussi spécifier à R que 9

10 toutes les données présentes dans le fichier d'origine doivent être considérées comme des observations avec header=f ou header=false. L'option sep=";" permet de préciser le séparateur décimal. - importation de fichier texte.txt > nom_tabler=read.table("nom_fichier.txt",sep="\t",header=t) Pour importer/exporter des fichiers Excel sous format.xls ou.xlsx (format Excel 2007 et plus), il faut utiliser les packages xlsreadwrite et xlsx respectivement. Les fonctions permettant d'importer des fichiers.xls et.xlsx sont read.xls et read.xlsx respectivement. Voici un exemple d'écriture pour la lecture d'un fichier excel 2007 ou plus: > read.xlsx("nom.fichier.xlsx",1)7 > ## on précise que l'on veut la première feuille (sheet) du classeur Il est possible d'importer/exporter des données entre R et d'autres logiciels statistiques (SAS, STATS,...) avec l'utilisation du package foreign. Une illustration de l'utilisation de ce package est faite en section 4.5 avec le chargement d'un fichier STATA. L'exportation d'objets de R vers Excel sous format.csv se fait à l'aide de la fonction write.table(): > write.table(nom_objet,"nom fichier de destination.csv","sep=";",row.names=false) De même on peut exporter un fichier.txt: > write.table(nom_objet,"nom fichier de destination.txt","sep="\t",row.names=false) 2. Présentation des principaux objets de R 2.1. La calculatrice R est avant toute chose une calculatrice. Tout calcul peut être fait sous R. > 1.5+3*6/9 [1] 3.5 > sqrt(1.5+3*6/9) # sqrt: racine carrée [1] > (1.5+3*6/9)^5 [1] > sin((1.5+3*6/9)^5) [1] > sin(pi) [1] e-16 > cos(pi) [1] -1 > log(3) [1] > exp(1.5) [1]

11 Les commentaires sous R s'obtiennent avec la touche dièse (#). Tout ce qui apparaît après cette touche est considérée comme un commentaire et n'est donc pas pris en compte dans la console. Pour écrire plusieurs lignes de commentaires, il est nécessaire de reproduire le signe # en début de chaque ligne Les opérateurs - opérateurs logiques: & pour "et"; (Alt Gr +6) pour "ou" -opérateurs de comparaison: <, <=, >, >=, == (pour tester l'égalité),!= (différent de) 2.3. Les vecteurs Les vecteurs et les matrices sont les objets de base de R. Intéressons tout d'abord aux vecteurs. Il y a une multitude de façon de créer un vecteur. La façon la plus commune de créer un vecteur est la suivante: > c(1,2,3,6,5) [1] Cette commande crée un vecteur de taille 5 ayant pour premier élément la valeur 1, pour deuxième élément la valeur 2,..., et pour dernier élément la valeur 5. Cependant, si l'on veut pouvoir travailler sur ce vecteur ultérieurement, il est recommandé de lui attribuer un nom: > vecteur=c(1,2,3,6,5) > vecteur # pour voir le contenu de vecteur [1] La commande vecteur[i] vous permet d'accéder à la i ème composante de votre vecteur vecteur. > vecteur[1]#vous donne la première composante du vecteur [1] 1 > vecteur[3]#vous donne la quatrième composante du vecteur [1] 6 > length(vecteur)#vous donne la longueur de votre vecteur [1] 6 On peut alors modifier le contenu de ce vecteur par diverses opérations: > vecteur=vecteur+1# on incrémente de 1 toutes les composantes du vecteur > vecteur [1] > vecteur+3 # vous donne la valeur de vecteur incrémenté de 3 sans pour autant modifier la valeur de vecteur [1] > vecteur [1] > vecteur=vecteur/6 # division par 6 [1] > exp(vecteur) [1]

12 Un vecteur peut aussi bien contenir des données numériques que des données caractères. > vect2=c("age","sexe","adresse") > vect2 [1] "age" "sexe" "adresse" On peut aussi créer un vecteur logique (booléen): > (vect4=c(true,false,true)) [1] TRUE FALSE TRUE A noter la petite astuce: mettre des parenthèses sur l'affectation globale permet de créer le vecteur et de connaître sa valeur directement. La fonction c() permet aussi de concaténer deux vecteurs: > c(vecteur,vect2) [1] "2" "3" "4" "7" "6" "age" "sexe" "adresse" Il existe d'autres façon de créer un vecteur: > 1:5 [1] > 5:-6 [1] > seq(1,10,0.5) #crée une suite de points équidistants entre 1 et 10 de pas 0.5 [1] [17] > rep(1,10)# pour répliquer la valeur 1 dix fois [1] > rep(1:5,4)# pour répliquer la séquence 1:5 quatre fois [1] On peut aussi créer un vecteur de taille donnée mais vide au départ et dont on rempli au fur et à mesure divers éléments. On peut même augmenter la taille de ce vecteur petit à petit. Les données manquantes sous R sont notées NA pour (Not Applicable). > vect=rep(na,5) > vect [1] NA NA NA NA NA > vect[1] [1] NA > vect[1]=3 > vect [1] 3 NA NA NA NA > vect[3]=2 > vect [1] 3 NA 2 NA NA > length(vect) [1] 5 > vect[length(vect)+1]=-1 > vect [1] 3 NA 2 NA NA -1 > length(vect) [1] 6 Une fois notre ou nos vecteurs crées, on peut réaliser des opérations sur ces vecteurs. > vect3=c(6,5,-1,2,3) > vecteur*vect3 # multiplication entre vecteurs [1] > sort(vect3) # trie le vecteur [1] > sort(vect3,decreasing=t) # trie le vecteur par ordre décroissant [1] > order(vect3)# indique l'ordre des éléments [1]

13 > vect3[order(vect3)] [1] De façon générale: - la commande vecteur[n] vous permet d'accéder à la n ième composante du vecteur - la commande vecteur[condition]vous permet d'afficher les éléments de votre vecteur qui respectent la condition. > vect3=c(6,5,-1,2,3) # Création d'un vecteur booléen: > vect3>2 [1] TRUE TRUE FALSE FALSE TRUE > vect3[vect3>2] [1] On peut ainsi modifier la valeur des éléments d'un vecteur par l'intermédiaire d'un booléen. Ainsi, si la condition est respectée pour l'élément i du vecteur, on applique la modification proposée. Sinon, l'élément i du vecteur reste inchangé: > vect7=c(t,f,t,f,t,t,t) > vect7 [1] TRUE FALSE TRUE FALSE TRUE TRUE TRUE > vect8=rep(na,length(vect7))# création d'un vecteur vide de taille égale à celle de vect7 > vect8 [1] NA NA NA NA NA NA NA > vect8[vect7]=3 > vect8 [1] 3 NA 3 NA > vect8[!vect7]=-4 > vect8 [1] Les matrices Les matrices sont crées à partir des vecteurs. Il s'agit de séries de valeurs à deux dimensions. Les numéros des lignes et des colonnes sont représentés par des chiffres entre crochets. Le chiffre avant la virgule indique le numéro de la ligne et celui après la virgule indique le numéro de la colonne. Une matrice est crée à l'aide de la fonction matrix(). exemple: Création d'une matrice à 5 lignes et 10 colonnes contenant la séquence 1:10 et dont le remplissage se fait par ligne > (mat1=matrix(1:10,ncol=10,nrow=5,byrow=t)) [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [1,] [2,] [3,] [4,] [5,] Par défaut, si on ne précise pas le nombre de colonnes à créer, ncol=2 ici: 13

14 > (mat1=matrix(1:10,nrow=5,byrow=t)) [,1] [,2] [1,] 1 2 [2,] 3 4 [3,] 5 6 [4,] 7 8 [5,] 9 10 > (mat1=matrix(1:10,byrow=t)) [,1] [1,] 1 [2,] 2 [3,] 3 [4,] 4 [5,] 5 [6,] 6 [7,] 7 [8,] 8 [9,] 9 [10,] 10 Création d'une matrice diagonale avec l'instruction diag(): > diag(3)# matrice diagonale de taille 3 [,1] [,2] [,3] [1,] [2,] [3,] De la même façon que pour les vecteurs: - matrice[i,]:permet d'afficher la i ème ligne de votre matrice - matrice[,j]: permet d'afficher la j ème colonne de votre matrice - matrice[i,j]: permet d'afficher l'élément placé à la i ème ligne j ème colonne - matrice[condition lignes,]: permet d'afficher uniquement les lignes de la matrice respectant la condition - matrice[,condition colonne]: permet d'afficher uniquement les colonnes de la matrice respectant la condition Pour connaître la dimension d'une matrice, on utilise l'instruction dim(). De même pour connaître le nombre de ligne avec l'instruction nrow() et le nombre de colonne avec ncol(). On peut aussi effectuer des opérations sur les matrices: > (mat=matrix(1:9,nrow=3,byrow=t)) [,1] [,2] [,3] [1,] [2,] [3,] > t(mat)# transposée de la matrice [,1] [,2] [,3] [1,] [2,] [3,] > mat*3# multiplication de chaque élément de la matrice par 3 [,1] [,2] [,3] [1,] [2,] [3,] > t(mat)*mat #multiplication terme à terme [,1] [,2] [,3] [1,]

15 [2,] [3,] > t(mat)%*%mat # produit matriciel [,1] [,2] [,3] [1,] [2,] [3,] > cbind(mat,t(mat))#concaténation par colonne [,1] [,2] [,3] [,4] [,5] [,6] [1,] [2,] [3,] > rbind(mat,t(mat))#concaténation par ligne [,1] [,2] [,3] [1,] [2,] [3,] [4,] [5,] [6,] > mat[1,1] [1] 1 > mat[1,1]=6 > mat [,1] [,2] [,3] [1,] [2,] [3,] > solve(mat)# inverse de la matrice [,1] [,2] [,3] [1,] [2,] [3,] > round(mat%*%solve(mat)) [,1] [,2] [,3] [1,] [2,] [3,] > diag(mat)# diagonale de la matrice [1] Les listes Les listes sont des collections d'objets (vecteurs, matrices) qui ne sont pas nécessairement du même type. Elles sont utilisées par de nombreuses fonctions pour retourner les résultats et permettent en particulier de stocker et manipuler simplement des objets de longueurs différentes dans une même structure. On crée une liste avec la fonction list(). Chaque élément de la liste peut être appelé soit en utilisant: - son nom précédé de $ - son indice entre double crochet [[.]]. > x=4 > hauteur=c(130,300,170) > matrice=matrix(1:15,ncol=3) > couleur=c("rouge","vert","jaune","blanc") > liste1=list(x,hauteur,matrice,couleur) > liste1 15

16 > names(liste1)=c("a","b","c","d") > liste1 $a [1] 4 $b [1] $c [,1] [,2] [,3] [1,] [2,] [3,] [4,] [5,] $d [1] "Rouge" "Vert" "Jaune" "Blanc" 2.6. Une structure importante sous R: les data frames Les data frame se présentent sous la forme d'une matrice dont les colonnes sont des variables et peuvent être de différents types (numérique, caractère, logique...). Ce format est bien adapté au stockage de données statistiques ou les individus sont en lignes et les variables sont en colonnes. Chaque variable a un nom. Par défaut, le nom de chaque variable est X ou V suivi du numéro de colonne. Pour créer un data frame, il suffit d'utiliser la fonction data.frame(). On peut créer un data frame à partir d'une matrice et modifier le nom des variables à l'aide de l'instruction colnames(). > data.frame(mat) X1 X2 X > data=data.frame(mat) > colnames(data) [1] "X1" "X2" "X3" > colnames(data)=c("var1","var2","var3") > data var1 var2 var Les data frame se manipulent à la fois comme des matrices et comme des listes. Les instructions dim(), nrow() et ncol() restent valables. Plusieurs façons pour accéder au contenu d'une variable: data$nom_var data[,position_var]# comme pour les matrices data[,c("nom_var"] Une fois le data frame crée, on peut le modifier, ajouter/supprimer des variables, modifier le contenu des variables... 16

17 Création de variables supplémentaires: > data$var4=na > data var1 var2 var3 var NA NA NA > (data$var4=c(1,3,4)) var1 var2 var3 var > data$var5=na > data$var5=c("femme","homme","femme") > data var1 var2 var3 var4 var femme homme femme > colnames(data) [1] "var1" "var2" "var3" "var4" "var5" > colnames(data)=c("var1", "var2", "var3", "var4", "sexe") > data var1 var2 var3 var4 sexe femme homme femme > data=data[,-2] > data var1 var3 var4 sexe femme homme femme Lorsque l'on importe un fichier sous R, celui-ci est automatiquement convertit en data frame. La suite de cette présentation concerne principalement le traitement et l'analyse de ce type de données. 3. Analyse générale d'un fichier de données 3.1. Description générale du fichier de données Nous allons travailler avec plusieurs fichiers de données. Pour commencer, nous allons travailler sur une base de données contenue dans le package MASS. Pour cela il faut d'abord charger la librairie en mémoire. Le package MASS fait partie des packages contenu par défaut dans R lors de son installation. Le fichier est Aids2. Toute base de données d'un package se charge avec la commande data(). Cette base contient des données sur 2843 patients chez lesquels on a diagnostiqué le SIDA en Australie avant le 1er juillet Descriptif du fichier de données (que vous pouvez aussi obtenir avec?aids2): state: Grouped state of origin: "NSW "includes ACT and "other" is WA, SA, NT and TAS. 17

18 sex: Sex of patient. diag: (Julian) date of diagnosis. death: (Julian) date of death or end of observation. status: "A" (alive) or "D" (dead) at end of observation. T.categ: Reported transmission category. age: Age (years) at diagnosis. > library(mass) # chargement de la librairie MASS > data(aids2) # chargement de la base Aids2 > colnames(aids2) # noms des variables du data frame Aids2 [1] "state" "sex" "diag" "death" "status" "T.categ" "age" > dim(aids2) [1] > head(aids2) # affichage des 6 premières lignes du fichier, permet de voir la tête de Aids2 state sex diag death status T.categ age 1 NSW M D hs 35 2 NSW M D hs 53 3 NSW M D hs 42 4 NSW M D haem 44 5 NSW M D hs 39 6 NSW M D hs 36 Pour connaître la class d'un objet (son type), on utilise l'instruction class(): > class(aids2) [1] "data.frame" On peut aussi utiliser la fonction str() pour avoir une description rapide des données. Cette fonction donne - le type de l'objet considéré (ici, un data frame) - la dimension du data frame (nombre de variables et d'observations) - le nom de chaque variable du data frame avec son type et ses premières valeurs > str(aids2) 'data.frame': 2843 obs. of 7 variables: $ state : Factor w/ 4 levels "NSW","Other",..: $ sex : Factor w/ 2 levels "F","M": $ diag : int $ death : int $ status : Factor w/ 2 levels "A","D": $ T.categ: Factor w/ 8 levels "hs","hsid","id",..: $ age : int La commande summary() La commande summary() est très utile pour obtenir un résumé de chaque variable du data frame. Les informations fournies par cette commande dépendent du type de variable. Par exemple, pour les variables sex et status de type qualitatives, elle nous fournit les effectifs de chaque modalité. Pour la variable age de type numérique, elle nous fournit la moyenne, médiane, premier et troisième quartile, et l'étendue des valeurs. S'il y avait des données manquantes, leur nombre serait aussi précisé. > summary(aids2) state sex diag death status T.categ age NSW :1780 F: 89 Min. : 8302 Min. : 8469 A:1082 hs :2465 Min. :

19 Other: 249 M:2754 1st Qu.: st Qu.:10672 D:1761 blood : 94 1st Qu.:30.00 QLD : 226 Median :10665 Median :11235 hsid : 72 Median :37.00 VIC : 588 Mean :10584 Mean :10990 other : 70 Mean : rd Qu.: rd Qu.:11504 id : 48 3rd Qu.:43.00 Max. :11503 Max. :11504 haem : 46 Max. :82.00 (Other): 48 Ici, les dates diag et death sont exprimées en nombre de jour depuis le 1er janvier Elles sont considérées comme des variables numériques. Nous verrons comment modifier le format d'affichage de ces dates. La variable T.categ a huit modalités: la fonction summary() ne permet d'afficher que 6 modalités maximum (les plus fréquentes), les autres apparaissent dans (Other). Si l'on veut connaître l'occurrence de chaque modalité, on utilise la commande table(). La commande nlevels() permet de connaître le nombre de niveaux d'une variable qualitative et la commande levels() le nom de chaque niveau. >table(aids2$t.categ) hs hsid id het haem blood mother other >levels(aids2$t.categ) [1] "hs" "hsid" "id" "het" "haem" "blood" "mother" "other" > nlevels(aids$t.categ) # pour connaître le nombre de niveaux [1] Quelques statistiques Pour les variables quantitatives, on peut vouloir connaître la moyenne, écart-type, quantiles, min et max de manière séparée de la commande summary(). Pour la variable age, par exemple: > mean(aids2$age) [1] > median(aids2$age) [1] 37 > var(aids2$age) [1] > sd(aids2$age) [1] > min(aids2$age) [1] 0 > max(aids2$age) [1] 82 > quantile(aids2$age) 0% 25% 50% 75% 100% > range(aids2$age) [1] Connaître le type d'une variable: commandes class() et mode() Les instructions class() et mode() permettent de connaître le type d'un objet. Elles sont complémentaires. > class(aids2) [1] "data.frame" > class(aids2$t.categ) 19

20 [1] "factor" > class(aids2$sex) [1] "factor" > class(aids2$age) [1] "integer" > mode(aids2$age) [1] "numeric" On peut aussi tester si une variable est de type numérique ou catégorielle par exemple. Ces fonctions renvoient un booléen prenant la valeur TRUE si la condition est vérifiée et FALSE sinon. Les fonctions avec le préfixe "is." teste si une condition est respectée (similaire au langage C). > is.numeric(aids2$sex) [1] FALSE > is.factor(aids2$sex) [1] TRUE > is.factor(aids2$t.categ) [1] TRUE > is.character(aids2$t.categ) [1] FALSE 3.5. Modifier le type d'une variable De façon complémentaire, les fonctions avec le préfixe "as." permettent de modifier le type d'une variable. > class(aids1$age) [1] "integer" > mode(aids1$age) [1] "numeric" > AIDS1$age=as.factor(AIDS1$age)## modification de la variable age en facteur > levels(aids1$age) [1] "0" "1" "3" "5" "6" "9" "11" "12" "13" "14" "15" "16" "17" "18" "19" "20" "21" "22" "23" "24" "25" "26" "27" "28" "29" "30" "31" "32" "33" "34" "35" "36" "37" "38" "39" "40" "41" "42" "43" "44" "45" "46" "47" "48" "49" "50" "51" "52" "53" "54" "55" "56" "57" "58" "59" "60" "61" "62" "63" "64" "65" "66" "67" "68" "69" "70" "71" "72" "73" "74" "77" "78" "80" "82" 3.6. Les données manquantes La table Aids2 ne contient pas de données manquantes, sinon la commande summary() nous aurait donné le nombre de données manquantes pour chaque variable. On va introduire quelques données manquantes dans la variable age à l'aide de l'éditeur (commande fix()). Pour pouvoir calculer la moyenne ou obtenir d'autres statistique sur la variable âge, on est obligé de spécifier l'option na.rm=true. > fix(aids) > mean(aids$age) [1] NA >?mean > mean(aids$age,na.rm=true) [1] Pour savoir quels éléments de Aids2$age sont manquants: on crée un booléen avec la commande is.na(). Cette commande renvoi TRUE si l'élément i est manquant et FALSE sinon. Ensuite, on affiche la position des éléments pour lesquels la donnée de l'âge est manquante: 20

21 > which(is.na(aids2$age)) [1] Sélection ou suppression de données ou de variables 4.1. Sélection d'observations Comme pour les vecteurs et les matrices, on peut ne vouloir afficher que certaines observations du data frame: - Pour n'afficher que certaines observations d'une variable, plusieurs façons: 1. nom_dataframe$nom_variable[condition]. 2. nom_dataframe[condition,"nom_variable"] 3.. nom_dataframe[condition,position variable]. Pour n'afficher que certaines observations du data frame: nom_data[condition,]. Par exemple, - sélection des données de la table Aids2 relatives aux femmes: > AIDS_select=Aids2[Aids2$sex=="F",] > dim(aids_select) [1] sélection des données relatives aux femmes de moins de 35 ans: > AIDS_select=Aids2[(Aids2$sex=="F")&(Aids2$age<35),] > dim(aids_select) [1] sélection des données relatives aux hommes de moins de 35 ans et encore en vie à la fin de l'étude: > AIDS_select=Aids2[(Aids2$sex=="M")&(Aids2$age<35)&(Aids2$status=="A"),] > dim(aids_select) [1] Pour afficher la variable status du data frame pour les femmes uniquement: > Aids2[(Aids2$sex=="F"),"status"] ou bien, de façon équivalente: > Aids2$status[(Aids2$sex=="F")] 4.2. Suppression d'observations Ici, on souhaite supprimer les observations respectant une condition. Pour n'afficher que certaines observations d'une variable: nom_dataframe$nom_var[!condition]. Pour n'afficher que certaines observations du data frame: nom_data[!condition,]. Par exemple, - suppression des données relatives aux femmes: > AIDS_select=Aids2[Aids2$sex!="F",] > dim(aids_select) [1]

22 - suppression des données relatives aux femmes de moins de 35 ans: > AIDS_select=Aids2[!((Aids2$sex=="F")&(Aids2$age<35)),] > dim(aids_select) [1] # vérification: AIDS_select$age[AIDS_select$sex=="F"]<35 # [1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE - suppression des données relatives aux hommes et des personnes (hommes ou femmes) de moins de 40 ans: AIDS_select=Aids2[!(Aids2$sex=="M")&!(Aids2$age<40),] dim(aids_select) #[1] suppression des données relatives aux hommes de moins de 35 ans et des personnes encore en vie à la fin de l'étude: > AIDS_select=Aids2[!((Aids2$sex=="M")&(Aids2$age<35))&!(Aids2$status=="A"),] > dim(aids_select) [1] # vérification: > AIDS_select$status[AIDS_select$age[AIDS_select$sex=="M"]<35] > which(aids_select$age[aids_select$sex=="m"]<35) > which(aids_select$status=="a") La commande which() nous permet de connaître quels patients (quelles observations) vérifient la condition i.e. pour lesquels la condition = TRUE. Cette fonction peut être très utile pour connaitre l'identifiant ligne des patients pour lesquels une condition est respectée Réordonner un fichier selon les valeurs d'une variable: commande order() Pour réordonner un fichier selon les valeurs prises par une variable, il suffit d'utiliser la fonction order() sur cette variable. Cette fonction renvoie les numéro des observations triées par ordre croissant. Pour les avoir par ordre décroissant, il suffit de spécifier l'option decreasing=true. > AIDS=Aids2 > AIDS=AIDS[order(AIDS$age),] > AIDS$age 4.4. Modifier le nom d'une variable Les noms des variables sont accessibles par l'instruction colnames(). Cette fonction renvoyant un vecteur avec le nom de chaque variable du data frame, il est possible de modifier le nom de l'ensemble des variables ou d'un sous-ensemble. > colnames(aids) [1] "state" "sex" "diag" "death" "status" "T.categ" "age" Modifier le nom de la variable diagnostic: 22

23 1. par l'appel de sa position: > colnames(aids)[3]="diagnostic" > colnames(aids) [1] "state" "sex" "diagnostic" "death" "status" "T.categ" "age" 2. par recherche de sa position colnames(aids)[names(aids)=="diag"]="diagnostic" 4.5. Extraire une chaîne de caractères Pour cela, on utilise la fonction substr(var,start,stop) où start est la position de départ et stop la position finale que l'on extrait. Pour illustrer cette fonction, on va utiliser la base villes.dta de la formation STATA contenant des codes postaux. S'agissant d'un fichier STATA, nous devons utiliser le package foreign pour pouvoir charger le fichier dans R. Ce package ne faisant pas partie des librairies contenues par défaut dans R, il faut soit télécharger le fichier.zip sur le site dans CRAN et l'installer depuis les fichiers.zip, soit le télécharger depuis un miroir CRAN. Une fois le package installé, il faut charger la librairie en mémoire avec l'instruction library(). La lecture de la table se fait avec l'instruction read.dta(). Si vous n'avez pas modifié le répertoire courant en choisissant le dossier où le fichier villes.dta est enregistré, vous devez préciser le chemin d'accès du fichier dans l'instruction read.dta(). # Chargement du package foreign > library(foreign) # Lecture du fichier villes.dta et création du data frame villes > villes=read.dta("villes.dta") # Le fichier villes contient 63 observations et 4 variables > dim(villes) [1] 63 4 # Nom des variables: > colnames(villes) [1] "num_patient" "adresse1" "cp1" "ville1" # Les premières lignes du fichier: > head(villes) num_patient adresse1 cp1 ville RUE DES CARRONS ST EDOUART RUE DES GRANGES ST MARCELIN RUE DES CERISIERS ST AGNAN RUE DE ROSSEY DAMBELIN RUE DES CHAMPS DAMBENOIS RUE DES AIGUILLOTTES DASLE Une fois le fichier chargé, nous souhaiterions créer une variable dep qui correspondra au numéro de département du patient. Pour cela, on souhaite extraire les deux premiers chiffres du code postal de la variable cp1: > villes$dep=substr(villes$cp1,1,2) > class(villes$dep) [1] "character" 23

24 La variable ainsi crée est de type caractère, si on veut qu'elle soit de type facteur il faut réaliser l'instruction suivante: > villes$dep=as.factor(villes$dep) > table(villes$dep) # niveau # nombre de patients par niveau 4.6. Gestion des dates Variables caractère en format date reconnu par R: > mini=read.dta("base_registre.dta") > dim(mini) [1] > colnames(mini) [1] "id" "i_sexe" "t_diag_topo "t_diag_morpho" "morphostr" "loc" "anais" "mnais" "jnais" "adiag" "mdiag" "jdiag" "datediag" "datediagstr" > head(mini) > class(mini$datediagstr) [1] "character" > mini$date_diag=as.date(mini$datediagstr,"%d/%m/%y") Variable numérique (nombre de jours depuis le 1er janvier 1960) en format date: > AIDS=Aids2 > head(aids2) state sex diag death status T.categ age 1 NSW M D hs 35 2 NSW M D hs 53 3 NSW M D hs 42 4 NSW M D haem 44 5 NSW M D hs 39 6 NSW M D hs 36 > mode(aids$diag) [1] "numeric" > AIDS$diag=as.Date(AIDS$diag,origin=" ") > AIDS$death=as.Date(AIDS$death,origin=" ") 5. Création et manipulation du contenu de variables 5.1. Création de variables booléennes On travaille ici avec le fichier Aids2 de la librairie MASS. Nous allons créer une variable sexe_female qui sera une variable booléenne, i.e. si le patient est une femme, alors sexe_female=true, sinon, sexe_female=false. Cette variable sera un vecteur qui n'appartiendra pas au data frame. > sex_female=(aids2$sex=="f") On vérifie que l'on n'a pas fait d'erreur: > sex_female[1:10] [1] FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE FALSE > Aids2$sex[1:10] [1] M M M M M M M M M M 24

25 Levels: F M On a bien les dix premiers éléments de sex_female qui sont FALSE et les 10 premiers patients de Aids2 sont bien des hommes. Si l'on veut connaître la position des valeurs TRUE de sex_female, on utilise la commande which(): > which(sex_female==true) [1] [16] [31] [46] [61] [76] > length(which(sex_female==true)) [1] 89 On peut ensuite vérifier que les patients pour lesquels sex_female == TRUE sont bien des femmes: > Aids2$sex[sex_female==T] [1] F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F [39] F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F F [77] F F F F F F F F F F F F F Levels: F M 5.2. Création de variables dichotomiques Nous allons ensuite créer une variable female qui sera une variable dichotomique. Cette variable prendra la modalité 1 si le patient est une femme et 0 si c'est un homme. Cette variable sera un vecteur qui n'appartiendra pas au data frame. Pour cela, le plus simple est de créer un vecteur de la taille voulue et prenant la valeur 0. Ensuite, on attribue la valeur 1 aux patients respectant la condition donnée entre crochets. Enfin, on impose que cette variable soit catégorielle. > female=rep(0,length(sex_female)) > female[sex_female]=1 > mode(female) [1] "numeric" > female=as.factor(female) > levels(female) [1] "0" "1" Pour intégrer cette variable au data frame, il suffit d'exécuter l'instruction suivante: > AIDS$ind_sexF=female Cette instruction crée automatiquement la variable ind_sexf et lui attribue la valeur de female pour chaque individu. 25

26 5.3. Création de variables en classes Maintenant, nous allons créer une variable age_c qui aura 4 modalités selon la classe d'âge de l'individus en prenant les valeurs des quartiles. Cette variable sera une variable supplémentaire dans le data frame et sera de type facteur. Tout d'abord on crée une variable age_c qui est manquante initialement. > AIDS=Aids2 # copie de la table Aids2 > AIDS$age_c=NA # création d'une variable age_c qui est manquante initialement > summary(aids$age) Min. 1st Qu. Median Mean 3rd Qu. Max Ensuite, il y a plusieurs possibilités: 1. en précisant la création de chaque niveau un par 1 (un peu lourd et fastidieux): > AIDS$age_c[AIDS$age<=30]=1 > AIDS$age_c[AIDS$age>43]=4 > AIDS$age_c[(AIDS$age<=37)&(AIDS$age>30)]=2 > AIDS$age_c[(AIDS$age<=43)&(AIDS$age>37)]=3 > summary(aids$age_c) Min. 1st Qu. Median Mean 3rd Qu. Max > AIDS$age_c=as.factor(AIDS$age_c) > levels(aids$age_c) [1] "1" "2" "3" "4" 2. Autre possibilité beaucoup plus simple: utilisation de l'instruction cut() > AIDS$agec [cut(aids$age,4)] On précise ainsi que l'on veut 4 classes ici et la variable en classe d'âge est directement crée Création de n variables quantitatives en fonction d'autres variables On peut par exemple vouloir créer une variable qui soit constante et égale à la moyenne d'une variable quantitative du fichier. Pour cela, on peut réaliser les opérations suivantes: > AIDS$moy_age=mean(AIDS$age) > AIDS$moy_age=round(AIDS$moy_age,2)# pour prendre la valeur arrondie à la 2ème décimale Ensuite, on peut vouloir créer une variable qui soit égale à la différence de deux variables quantitatives du fichier. > AIDS$age_diff=AIDS$age-AIDS$moy_age 6. Combiner des fichiers de données: commande merge() 26

27 Lorsque l'on veut fusionner deux fichiers, on utilise la commande merge(). Cette commande permet à la fois de rajouter des observations, donc des lignes dans un data frame, et de rajouter des variables, donc des colonnes. Pour illustrer cette commande, nous allons utiliser le fichier Aids Ajouter des observations Pour illustrer l'utilisation de cette commande, on va séparer le fichier Aids2 en deux fichiers: le premier contenant les données relatives aux hommes et le second celles relatives aux femmes. Ensuite, on utilise la commande merge() pour fusionner les deux fichiers ainsi crées: > AIDS_Hommes=AIDS[AIDS$sex=="M",] > AIDS_Femmes=AIDS[AIDS$sex=="F",] > AIDS_merge=merge(AIDS_Hommes,AIDS_Femmes,all=TRUE) > dim(aids_hommes) [1] > dim(aids_femmes) [1] 89 7 > dim(aids_merge) [1] > dim(aids) [1] Le fichier fusionné contient bien 2843 observations, comme le fichier d'origine Ajouter des variables Pour illustrer l'ajout de variables avec la commande merge(), on sélectionne dans un premier fichier l'identifiant patient, le sexe et l'âge et dans un second l'identifiant patient, la date de diagnostic et la date de dernières nouvelles. Ensuite, on réalise la fusion en précisant la variable identifiant. > AIDS_1=AIDS[,c("id_pat","sex","age")] > AIDS_2=AIDS[,c("id_pat","diag","death")] > AIDS_3=merge(AIDS_1,AIDS_2,by.x="id_pat") 7. Transposer un fichier/échange des lignes et des colonnes: commande reshape() Que ce soit pour passer du format long au format wide ou inversement, on utilise la commande reshape(). Cette commande est très utile lorsque l'on veut pouvoir modifier l'apparence d'un fichier de données. Pour illustrer cette commande, on va utiliser une partie d'un fichier de données qdv.dta qui est un fichier STATA. S'agissant d'un fichier STATA, il est nécessaire de charger librairie foreign si ce n'est pas encore fait. Chargement de la librairie foreign et du fichier de données et sélection des variables d'intérêt: 27

28 > library(foreign) > qdv=read.dta("qdv.dta") On Sélectionne les variables tumeur (identifiant du patient), suivi (indicateur du temps de mesure), rt, ct, stade qui nous indique si le patient est sous radiothérapie, chimiothérapie et le stade de la maladie ainsi que quelques scores de qualité de vie du QLQ-C30 mesuré à plusieurs temps (suivi). Les variables rt, ct, stade et tumeur restent identique au cours du temps pour un même patient, en revanche, les scores varient au cours du temps. > ## sélection des variables que l'on souhaite garder > qdv_s=qdv[,c(1,2,7,8,10,29:38)] > colnames(qdv_s) [1] "tumeur" "suivi" "rt" "ct" "stade" "gh" "pf" "rf" "ef" "cf" "sf" "fa" "na" "pa" "a" 7.1. Passer du format "long" au format "wide" reshape(data,timevar="identifiant_temps",idvar=c("var_constante1","v ar_constante2"), direction="wide") Pour commencer, on va faire une transposition en gardant uniquement les variables: - tumeur: identique au cours du temps pour un même patient -suivi: indicateur du temps de mesure -gh: score de qualité de vie/santé globale, varie au cours du temps pour un même patient > qdv_long1=qdv_s[,c(1,2,6)] > qdv_wide=reshape(qdv_long1,timevar="suivi",idvar="tumeur",direction="wide") > colnames(qdv_wide) > head(qdv_wide) Ensuite, on va faire une transposition en gardant les variables: - tumeur, rt, ct, stade: identiques au cours du temps pour un même patient -suivi: indicateur du temps de mesure -gh: score de qualité de vie/santé globale, varie au cours du temps pour un même patient > qdv_long2=qdv_s[,c(1:6)] > colnames(qdv_long2) >qdv_wide2=reshape(qdv_long2,v.names="gh",timevar="suivi",idvar=c("tumeur","rt","ct","stade"), direction="wide") > colnames(qdv_wide2) > head(qdv_wide2) Maintenant, on va faire une transposition en gardant les variables: - tumeur, rt, ct, stade (identiques au cours du temps pour un même patient) -suivi (indicateur du temps de mesure) -gh, pf, rf (scores de qualité de vie, varient au cours du temps pour un même patient) > qdv_long3=qdv_s[,c(1:8)] > colnames(qdv_long3) >qdv_wide3=reshape(qdv_long3,v.names=c("gh","pf","rf"),timevar="suivi",idvar=c("tumeur","rt"," ct","stade"),direction="wide") > colnames(qdv_wide3) > head(qdv_wide3) 28

29 Pour finir, on va faire une transposition sur l'ensemble des variables du fichier: > colnames(qdv_s) [1] "tumeur" "suivi" "rt" "ct" "stade" "gh" "pf" "rf" [9] "ef" "cf" "sf" "fa" "na" "pa" "a" > qdv_wide4=reshape(qdv_s,,timevar="suivi",idvar=c("tumeur","rt","ct","stade"),direction="wide") > colnames(qdv_wide4) [1] "tumeur" "rt" "ct" "stade" "gh.0" "pf.0" "rf.0" "ef.0" [9] "cf.0" "sf.0" "fa.0" "na.0" "pa.0" "a.0" "gh.1" "pf.1" [17] "rf.1" "ef.1" "cf.1" "sf.1" "fa.1" "na.1" "pa.1" "a.1" [25] "gh.2" "pf.2" "rf.2" "ef.2" "cf.2" "sf.2" "fa.2" "na.2" [33] "pa.2" "a.2" "gh.3" "pf.3" "rf.3" "ef.3" "cf.3" "sf.3" [41] "fa.3" "na.3" "pa.3" "a.3" > ############################### > # on vérifie pour le premier patient "T " qu'il n'y pas eu d'erreur: > ############################### > qdv_s[(qdv_s$tumeur=="t "),] tumeur suivi rt ct stade gh pf rf ef cf 1 T non non I T non non I T non non I T non non I sf fa na pa a > qdv_wide4[(qdv_wide4$tumeur=="t "),] tumeur rt ct stade gh.0 pf.0 rf.0 ef.0 cf.0 sf.0 fa.0 na.0 pa.0 1 T non non I a.0 gh.1 pf.1 rf.1 ef.1 cf.1 sf.1 fa.1 na.1 pa a.1 gh.2 pf.2 rf.2 ef.2 cf.2 sf.2 fa.2 na.2 pa a.2 gh.3 pf.3 rf.3 ef.3 cf.3 sf.3 fa.3 na pa.3 a Passer du format "wide" au format "long" reshape(data,timevar="identifiant_temps",idvar=c("var_constante1","v ar_constante2"), varying="position des variables qui varient au cours du temps",direction="long") Maintenant, on réalise l'étape inverse. Tout d'abord avec la table qdv_wide dans laquelle on avait gardé tumeur, suivi et gh. > colnames(qdv_wide) [1] "tumeur" "gh.0" "gh.1" "gh.2" "gh.3" >qdv_long_after_wide=reshape(qdv_wide,v.names="gh",timevar="suivi",idvar="tumeur",direction="l ong") > colnames(qdv_long_after_wide) [1] "tumeur" "suivi" "gh.0" > head(qdv_long_after_wide) tumeur suivi gh.0 T T T T NA T T

30 T T NA T T NA T T Ensuite sur la table qdv_wide3 dans laquelle on avait gardé tumeur, suivi et les scores gh, pf et rf. > colnames(qdv_wide3) [1] "tumeur" "rt" "ct" "stade" "gh.0" "pf.0" "rf.0" "gh.1" [9] "pf.1" "rf.1" "gh.2" "pf.2" "rf.2" "gh.3" "pf.3" "rf.3" > qdv_long_3=reshape(qdv_wide3,varying=5:16,idvar=c("tumeur","rt","ct","stade"),direction="long") > colnames(qdv_long_3) [1] "tumeur" "rt" "ct" "stade" "time" "gh" "pf" "rf" > dim(qdv_long_3) [1] > dim(qdv_wide3) [1] Etape de vérification: > qdv_s[(qdv_s$tumeur=="t "),c("tumeur","gh","pf","rf")] tumeur gh pf rf 1 T T T T > qdv_long_3[(qdv_long_3$tumeur=="t "),] tumeur rt ct stade time gh pf rf T non.non.I.0 T non non I T non.non.I.1 T non non I T non.non.I.2 T non non I T non.non.I.3 T non non I Les tests statistiques 8.1. Tableaux à plat, tableaux croisés Un tableau à plat, de même qu'un tableau croisé s'obtient avec la commande table(). # tableau à plat table(qdv$rt) non oui # tableau croisé > table(qdv[,c("ct","rt")]) rt ct non oui non oui > addmargins(table(qdv[,c("ct","rt")])) rt ct non oui Sum 30

31 non oui Sum > margin.table(addmargins(table(qdv[,c("ct","rt")]))) [1] 1008 > prop.table(addmargins(table(qdv[,c("ct","rt")]))) rt ct non oui Sum non oui Sum Test de comparaison de deux proportions chisq.test(data$varcat1,data$varcat2,correct=false) fisher.test(data$varcat1,data$varcat2) > chisq.test(qdv$rt,qdv$ct,correct=false) Pearson's Chi-squared test data: qdv$rt and qdv$ct X-squared = , df = 1, p-value = > fisher.test(qdv$rt,qdv$ct) Fisher's Exact Test for Count Data data: qdv$rt and qdv$ct p-value = alternative hypothesis: true odds ratio is not equal to 1 95 percent confidence interval: sample estimates: odds ratio Test d'une corrélation significative cor.test(table$var1,table$var2) > cor.test(qdv$spitzer,qdv$gh) Pearson's product-moment correlation data: qdv$spitzer and qdv$gh t = , df = 100, p-value = 2.075e-07 alternative hypothesis: true correlation is not equal to 0 95 percent confidence interval: sample estimates: cor Conclusion: l'hypothèse H0 peut être rejetée au seuil 5%. Corrélation significative. 31

32 8.4. Test de comparaison de variances: test de Fisher Snedecor var.test(table$var1,table$var2) 8.5. Test de comparaison de deux moyennes Tests paramètriques: 1. Comparaison d'une moyenne à une moyenne théorique: t.test(data$varcont, mu=moyenne) 2. Comparaison de deux moyennes observées: t.test(data$varcont1~data$varbin1, var.equal=true) t.test(data$varcont1~data$varbin1, var.equal=false) 3. Comparaison de deux moyennes observées sur échantillons appariés: t.test(data$varcont1~data$varbin1, paired=true) Tests non paramétriques: wilcox.test(data$varcont1~data$varbin1) > wilcox.test(aids2$age~aids2$sex) Wilcoxon rank sum test with continuity correction data: Aids2$age by Aids2$sex W = , p-value = alternative hypothesis: true location shift is not equal to Les variables aléatoires et échantillonnages Voici quelques éléments pour créer des variables aléatoires et des séquences alétoires. > sample(1:20,5)# crée un échantillon aléatoire de la séquence 1:20 de taille 5 [1] > sample(1:20)# permutation aléatoire de la séquence 1:20 [1] n réalisations d'une loi de Bernoulli (tirage de pile ou face): > sample(c(0,1), 50, replace = TRUE) [1] [39] Tirage aléatoire de 0/1 avec ou sans remise (replace=false par défaut). > sample(c(0,1), replace = FALSE) [1] 0 1 > sample(c(0,1), replace = FALSE) [1] 1 0 > sample(c(0,1), replace = FALSE) 32

33 [1] 0 1 > sample(c(0,1), replace = FALSE) [1] 0 1 > sample(c(0,1), replace = TRUE) [1] 0 0 > sample(c(0,1), replace = TRUE) [1] 1 0 > sample(c(0,1), replace = TRUE) [1] Loi uniforme et autres lois de probabilités # 20 réalisations d'une loi uniforme entre 0 et 1: > runif(20) [1] [7] [13] [19] # 20 réalisations d'une loi uniforme entre 1 et 20: > runif(20,min=1,max=20) [1] [8] [15] Autres lois de probabilités: Loi binomiale :binom Loi mulitnomiale: multinom Loi normale; norm Loi de poisson: pois Loi de fisher: f() Loi de student: t() Pour chacune de ces lois, on peux vouloir simuler n réalisations de ces lois (utilisation du préfixe r), connaître la densité de probabilité (préfixe d), la fonction de répartition (préfixe p= ou les quantiles (préfixe q). 9. Les modèles de régression Pour illustrer les modèles de régression, on va utiliser la table lwb.csv. S'agissant d'un fichier.csv, on utilise toujours la commande read.csv() ou read.table()pour charger le fichier, en précisant que le séparateur est un point-virgule (sep=";"). Ce fichier provient d'une étude portant sur les facteurs de risques associés à un faible poids à la naissance. Il contient les variables suivantes: id : identification code low : birth weight<2500g age : age of mother lwt : weight at last menstrual period race : race 33

Lire ; Compter ; Tester... avec R

Lire ; Compter ; Tester... avec R Lire ; Compter ; Tester... avec R Préparation des données / Analyse univariée / Analyse bivariée Christophe Genolini 2 Table des matières 1 Rappels théoriques 5 1.1 Vocabulaire....................................

Plus en détail

Gestion des données avec R

Gestion des données avec R Gestion des données avec R Christophe Lalanne & Bruno Falissard Table des matières 1 Introduction 1 2 Importation de fichiers CSV 1 2.1 Structure du fichier de données...................................

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

Cours 1. I- Généralités sur R II- Les fonctions de R et autres objets III-Les vecteurs

Cours 1. I- Généralités sur R II- Les fonctions de R et autres objets III-Les vecteurs Cours 1 I- Généralités sur R II- Les fonctions de R et autres objets III-Les vecteurs IV-Les facteurs I-1 Généralités sur R R (1995, AT&T Bell Laboratories) est un logiciel d analyse statistique et graphique,

Plus en détail

SHERLOCK 7. Version 1.2.0 du 01/09/09 JAVASCRIPT 1.5

SHERLOCK 7. Version 1.2.0 du 01/09/09 JAVASCRIPT 1.5 SHERLOCK 7 Version 1.2.0 du 01/09/09 JAVASCRIPT 1.5 Cette note montre comment intégrer un script Java dans une investigation Sherlock et les différents aspects de Java script. S T E M M E R I M A G I N

Plus en détail

Tests statistiques et régressions logistiques sous R, avec prise en compte des plans d échantillonnage complexes

Tests statistiques et régressions logistiques sous R, avec prise en compte des plans d échantillonnage complexes , avec prise en compte des plans d échantillonnage complexes par Joseph LARMARANGE version du 29 mars 2007 Ce cours a été développé pour une formation niveau M2 et Doctorat des étudiants du laboratoire

Plus en détail

Introduction à R. Florence Yerly. Dept. de mathématiques, Université de Fribourg (CH) SP 2011

Introduction à R. Florence Yerly. Dept. de mathématiques, Université de Fribourg (CH) SP 2011 Dept. de mathématiques, Université de Fribourg (CH) SP 2011 Qu est ce que R? Un logiciel de statistiques libre et gratuit ; Un logiciel multi-plateforme (UNIX, Windows MacOS X) R permet de faire des calculs

Plus en détail

R01 Import de données

R01 Import de données R01 Import de données A partir du package de base, R peut lire les données stockées dans des fichiers texte, à partir notamment des fonctions read.table, read.csv, read.delim, read.csv2, read.delim2, et

Plus en détail

Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

Exercices M1 SES 2014-2015 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 2015 Exercices M1 SES 214-215 Ana Fermin (http:// fermin.perso.math.cnrs.fr/ ) 14 Avril 215 Les exemples numériques présentés dans ce document d exercices ont été traités sur le logiciel R, téléchargeable par

Plus en détail

Premiers pas avec SES-Pegase (version 7.0) SES : Un Système Expert pour l analyse Statistique des données. Premiers pas avec SES-Pegase 1

Premiers pas avec SES-Pegase (version 7.0) SES : Un Système Expert pour l analyse Statistique des données. Premiers pas avec SES-Pegase 1 Premiers pas avec SES-Pegase 1 Premiers pas avec SES-Pegase (version 7.0) SES : Un Système Expert pour l analyse Statistique des données www.delta-expert.com Mise à jour : Premiers pas avec SES-Pegase

Plus en détail

IMPORTATION, CRÉATION, MANIPULATION, EXPORTATION DE DONNÉES STATISTIQUES

IMPORTATION, CRÉATION, MANIPULATION, EXPORTATION DE DONNÉES STATISTIQUES IMPRTATIN, CRÉATIN, MANIPULATIN, EXPRTATIN DE DNNÉES STATISTIQUES Bernard Dupont Bernard.Dupont@univ-lille1.fr ahm.bahah@yahoo.fr Bien que l'analyse et le traitement des données ne soient pas sa vocation

Plus en détail

Introduction aux Statistiques et à l utilisation du logiciel R

Introduction aux Statistiques et à l utilisation du logiciel R Introduction aux Statistiques et à l utilisation du logiciel R Christophe Lalanne Christophe Pallier 1 Introduction 2 Comparaisons de deux moyennes 2.1 Objet de l étude On a mesuré le temps de sommeil

Plus en détail

1 Introduction - Qu est-ce que le logiciel R?

1 Introduction - Qu est-ce que le logiciel R? Master 1 GSI - Mentions ACCIE et RIM - ULCO, La Citadelle, 2012/2013 Mesures et Analyses Statistiques de Données - Probabilités TP 1 - Initiation au logiciel R 1 Introduction - Qu est-ce que le logiciel

Plus en détail

Introduction à MATLAB R

Introduction à MATLAB R Introduction à MATLAB R Romain Tavenard 10 septembre 2009 MATLAB R est un environnement de calcul numérique propriétaire orienté vers le calcul matriciel. Il se compose d un langage de programmation, d

Plus en détail

EXCEL PERFECTIONNEMENT SERVICE INFORMATIQUE. Version 1.0 30/11/05

EXCEL PERFECTIONNEMENT SERVICE INFORMATIQUE. Version 1.0 30/11/05 EXCEL PERFECTIONNEMENT Version 1.0 30/11/05 SERVICE INFORMATIQUE TABLE DES MATIERES 1RAPPELS...3 1.1RACCOURCIS CLAVIER & SOURIS... 3 1.2NAVIGUER DANS UNE FEUILLE ET UN CLASSEUR... 3 1.3PERSONNALISER LA

Plus en détail

Introduction à la statistique non paramétrique

Introduction à la statistique non paramétrique Introduction à la statistique non paramétrique Catherine MATIAS CNRS, Laboratoire Statistique & Génome, Évry http://stat.genopole.cnrs.fr/ cmatias Atelier SFDS 27/28 septembre 2012 Partie 2 : Tests non

Plus en détail

Auguria_PCM Product & Combination Manager

Auguria_PCM Product & Combination Manager Auguria_PCM Product & Combination Manager Guide utilisateurs v1.5 Auguria 9, rue Alfred Kastler 44300 NANTES FRANCE +33251135012 contact@auguria.net Plan 1 Description générale du module...3 2 Mise en

Plus en détail

TP n 2 Concepts de la programmation Objets Master 1 mention IL, semestre 2 Le type Abstrait Pile

TP n 2 Concepts de la programmation Objets Master 1 mention IL, semestre 2 Le type Abstrait Pile TP n 2 Concepts de la programmation Objets Master 1 mention IL, semestre 2 Le type Abstrait Pile Dans ce TP, vous apprendrez à définir le type abstrait Pile, à le programmer en Java à l aide d une interface

Plus en détail

Les concepts de base, l organisation des données

Les concepts de base, l organisation des données Chapitre 1 Les concepts de base, l organisation des données Objectif Ce chapitre présente les concepts de base du logiciel R (mode calculatrice, opérateur d affectation, variables, utilisation de fonctions,

Plus en détail

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position Arbre de NESI distribution quelconque Signe 1 échantillon distribution symétrique non gaussienne Wilcoxon gaussienne Student position appariés 1 échantillon sur la différence avec référence=0 2 échantillons

Plus en détail

Séance 0 : Linux + Octave : le compromis idéal

Séance 0 : Linux + Octave : le compromis idéal Séance 0 : Linux + Octave : le compromis idéal Introduction Linux est un système d'exploitation multi-tâches et multi-utilisateurs, basé sur la gratuité et développé par une communauté de passionnés. C'est

Plus en détail

SAS de base : gestion des données et procédures élémentaires

SAS de base : gestion des données et procédures élémentaires 1 SAS de base : gestion des données et procédures élémentaires SAS de base : gestion des données et procédures élémentaires Résumé Description des commandes (module SAS de base) les plus utiles de l étape

Plus en détail

1. Introduction... 2. 2. Création d'une macro autonome... 2. 3. Exécuter la macro pas à pas... 5. 4. Modifier une macro... 5

1. Introduction... 2. 2. Création d'une macro autonome... 2. 3. Exécuter la macro pas à pas... 5. 4. Modifier une macro... 5 1. Introduction... 2 2. Création d'une macro autonome... 2 3. Exécuter la macro pas à pas... 5 4. Modifier une macro... 5 5. Création d'une macro associée à un formulaire... 6 6. Exécuter des actions en

Plus en détail

I. Introduction aux fonctions : les fonctions standards

I. Introduction aux fonctions : les fonctions standards Chapitre 3 : Les fonctions en C++ I. Introduction aux fonctions : les fonctions standards A. Notion de Fonction Imaginons que dans un programme, vous ayez besoin de calculer une racine carrée. Rappelons

Plus en détail

TP 1. Prise en main du langage Python

TP 1. Prise en main du langage Python TP. Prise en main du langage Python Cette année nous travaillerons avec le langage Python version 3. ; nous utiliserons l environnement de développement IDLE. Étape 0. Dans votre espace personnel, créer

Plus en détail

Guide d'utilisation. OpenOffice Calc. AUTEUR INITIAL : VINCENT MEUNIER Publié sous licence Creative Commons

Guide d'utilisation. OpenOffice Calc. AUTEUR INITIAL : VINCENT MEUNIER Publié sous licence Creative Commons Guide d'utilisation OpenOffice Calc AUTEUR INITIAL : VINCENT MEUNIER Publié sous licence Creative Commons 1 Table des matières Fiche 1 : Présentation de l'interface...3 Fiche 2 : Créer un nouveau classeur...4

Plus en détail

LES TYPES DE DONNÉES DU LANGAGE PASCAL

LES TYPES DE DONNÉES DU LANGAGE PASCAL LES TYPES DE DONNÉES DU LANGAGE PASCAL 75 LES TYPES DE DONNÉES DU LANGAGE PASCAL CHAPITRE 4 OBJECTIFS PRÉSENTER LES NOTIONS D ÉTIQUETTE, DE CONS- TANTE ET DE IABLE DANS LE CONTEXTE DU LAN- GAGE PASCAL.

Plus en détail

EXCEL TUTORIEL 2012/2013

EXCEL TUTORIEL 2012/2013 EXCEL TUTORIEL 2012/2013 Excel est un tableur, c est-à-dire un logiciel de gestion de tableaux. Il permet de réaliser des calculs avec des valeurs numériques, mais aussi avec des dates et des textes. Ainsi

Plus en détail

URECA Initiation Matlab 2 Laurent Ott. Initiation Matlab 2

URECA Initiation Matlab 2 Laurent Ott. Initiation Matlab 2 Initiation Matlab 2 1 Chaînes de caractères (string) Une chaîne de caractères (string en anglais) est une suite ordonnée de caractères (du texte, par exemple). Sous matlab, les chaînes de caractères sont

Plus en détail

Le générateur d'activités

Le générateur d'activités Le générateur d'activités Tutoriel Mise à jour le 09/06/2015 Sommaire A. Mise en route du Générateur d'activité... 2 1. Installation de Page... 2 2. Création des bases du générateur d'activités... 3 3.

Plus en détail

Initiation au logiciel R

Initiation au logiciel R Université Paris Dauphine Année 2005 2006 U.F.R. Mathématiques de la Décision MAT-6-3 : Statistique exploratoire et numérique (NOISE) Initiation au logiciel R Jean-Michel MARIN Ce document a pour objectif

Plus en détail

Jérôme Mathieu janvier 2007. Débuter avec R. Ce document est disponible sur le site web : http://www.jerome.mathieu.freesurf.

Jérôme Mathieu janvier 2007. Débuter avec R. Ce document est disponible sur le site web : http://www.jerome.mathieu.freesurf. Jérôme Mathieu janvier 2007 Débuter avec R Ce document est disponible sur le site web : http://www.jerome.mathieu.freesurf.fr - 1 - Sommaire 1 Principes de base pour utiliser R... 3 $$$ Démarrer R pour

Plus en détail

Plan du cours 2014-2015. Cours théoriques. 29 septembre 2014

Plan du cours 2014-2015. Cours théoriques. 29 septembre 2014 numériques et Institut d Astrophysique et de Géophysique (Bât. B5c) Bureau 0/13 email:.@ulg.ac.be Tél.: 04-3669771 29 septembre 2014 Plan du cours 2014-2015 Cours théoriques 16-09-2014 numériques pour

Plus en détail

1. LA GESTION DES BASES DE DONNEES RELATIONNELLES

1. LA GESTION DES BASES DE DONNEES RELATIONNELLES Dossier G11 - Interroger une base de données La base de données Facturation contient tout un ensemble d'informations concernant la facturation de la SAFPB (société anonyme de fabrication de produits de

Plus en détail

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence

Plus en détail

Débuter avec OOo Base

Débuter avec OOo Base Open Office.org Cyril Beaussier Débuter avec OOo Base Version 1.0.7 Novembre 2005 COPYRIGHT ET DROIT DE REPRODUCTION Ce support est libre de droit pour une utilisation dans un cadre privé ou non commercial.

Plus en détail

Une fois votre tableau excel complet, cliquer sur fichier enregistrer sous type de fichier (menu déroulant) csv (séparateur : point virgule).

Une fois votre tableau excel complet, cliquer sur fichier enregistrer sous type de fichier (menu déroulant) csv (séparateur : point virgule). La fonction Annuaire Dans ce document : - Importer un annuaire - Exporter un annuaire en.csv - Modifier un annuaire Importer un annuaire Un annuaire est un module qui regroupe des informations (nom, adresse,

Plus en détail

BADPLUS V5 MANUEL D'UTILISATION. Imports de données joueurs à partir de la base fédérale en ligne Poona. Stéphan KIEFFER - Dominique BOSSERT

BADPLUS V5 MANUEL D'UTILISATION. Imports de données joueurs à partir de la base fédérale en ligne Poona. Stéphan KIEFFER - Dominique BOSSERT BADPLUS V5 Imports de données joueurs à partir de la base fédérale en ligne Poona MANUEL D'UTILISATION Stéphan KIEFFER - Dominique BOSSERT Sommaire Pages RECHERCHE DE JOUEURS...- 3-1. RECHERCHE A PARTIR

Plus en détail

Cours Informatique Master STEP

Cours Informatique Master STEP Cours Informatique Master STEP Bases de la programmation: Compilateurs/logiciels Algorithmique et structure d'un programme Programmation en langage structuré (Fortran 90) Variables, expressions, instructions

Plus en détail

Traitement des données avec Microsoft EXCEL 2010

Traitement des données avec Microsoft EXCEL 2010 Traitement des données avec Microsoft EXCEL 2010 Vincent Jalby Septembre 2012 1 Saisie des données Les données collectées sont saisies dans une feuille Excel. Chaque ligne correspond à une observation

Plus en détail

LES DECIMALES DE π BERNARD EGGER

LES DECIMALES DE π BERNARD EGGER LES DECIMALES DE π BERNARD EGGER La génération de suites de nombres pseudo aléatoires est un enjeu essentiel pour la simulation. Si comme le dit B Ycard dans le cours écrit pour le logiciel SEL, «Paradoxalement,

Plus en détail

CAPTURE DES PROFESSIONNELS

CAPTURE DES PROFESSIONNELS CAPTURE DES PROFESSIONNELS 2 Téléchargement 3 Installation 8 Prise en main rapide 10 Lancement Recherche 14 Gestion des fichiers 23 Compare et Sépare 24 Fichiers annexes 2/ Le menu Utilitaires 32 Internet

Plus en détail

Aide-mémoire de statistique appliquée à la biologie

Aide-mémoire de statistique appliquée à la biologie Maxime HERVÉ Aide-mémoire de statistique appliquée à la biologie Construire son étude et analyser les résultats à l aide du logiciel R Version 5(2) (2014) AVANT-PROPOS Les phénomènes biologiques ont cela

Plus en détail

MEDIAplus elearning. version 6.6

MEDIAplus elearning. version 6.6 MEDIAplus elearning version 6.6 L'interface d administration MEDIAplus Sommaire 1. L'interface d administration MEDIAplus... 5 2. Principes de l administration MEDIAplus... 8 2.1. Organisations et administrateurs...

Plus en détail

CRÉER UNE BASE DE DONNÉES AVEC OPEN OFFICE BASE

CRÉER UNE BASE DE DONNÉES AVEC OPEN OFFICE BASE CRÉER UNE BASE DE DONNÉES AVEC OPEN OFFICE BASE 2 ème partie : REQUÊTES Sommaire 1. Les REQUÊTES...2 1.1 Créer une requête simple...2 1.1.1 Requête de création de listage ouvrages...2 1.1.2 Procédure de

Plus en détail

Création d'un site dynamique en PHP avec Dreamweaver et MySQL

Création d'un site dynamique en PHP avec Dreamweaver et MySQL Création d'un site dynamique en PHP avec Dreamweaver et MySQL 1. Création et configuration du site 1.1. Configuration de Dreamweaver Avant de commencer, il est nécessaire de connaître l'emplacement du

Plus en détail

Initiation à la programmation en Python

Initiation à la programmation en Python I-Conventions Initiation à la programmation en Python Nom : Prénom : Une commande Python sera écrite en caractère gras. Exemples : print 'Bonjour' max=input("nombre maximum autorisé :") Le résultat de

Plus en détail

v7.1 SP2 Guide des Nouveautés

v7.1 SP2 Guide des Nouveautés v7.1 SP2 Guide des Nouveautés Copyright 2012 Sage Technologies Limited, éditeur de ce produit. Tous droits réservés. Il est interdit de copier, photocopier, reproduire, traduire, copier sur microfilm,

Plus en détail

TABLEAU CROISE DYNAMIQUE

TABLEAU CROISE DYNAMIQUE EXCEL NIVEAU III Mireille DUCELLIER MARS 2003 BASE DE DONNEES RAPPEL Une base de données est une plage de cellules contiguës située sur une la feuille 1. Elle commence en A1. On parle alors de champs,

Plus en détail

Serveur Acronis Backup & Recovery 10 pour Linux. Update 5. Guide d'installation

Serveur Acronis Backup & Recovery 10 pour Linux. Update 5. Guide d'installation Serveur Acronis Backup & Recovery 10 pour Linux Update 5 Guide d'installation Table des matières 1 Avant l'installation...3 1.1 Composants d'acronis Backup & Recovery 10... 3 1.1.1 Agent pour Linux...

Plus en détail

INTRODUCTION AU LOGICIEL R

INTRODUCTION AU LOGICIEL R INTRODUCTION AU LOGICIEL R Variables et mise en jambe Anne Dubois, Julie Bertrand, Emmanuelle Comets emmanuelle.comets@inserm.fr INSERM UMR738 (UMR738) 1 / 68 Sur le site www.cran.r-project.org : Ou trouver

Plus en détail

Programmation Objet - Cours II

Programmation Objet - Cours II Programmation Objet - Cours II - Exercices - Page 1 Programmation Objet - Cours II Exercices Auteur : E.Thirion - Dernière mise à jour : 05/07/2015 Les exercices suivants sont en majorité des projets à

Plus en détail

Les tableaux croisés dynamiques

Les tableaux croisés dynamiques Les tableaux croisés dynamiques Table des matières Les tableaux croisés dynamiques... 1 1. Les tutoriels... 1. Quelle est l'utilité d'un tableau croisé dynamique... 3. Vérifier les données de départ...

Plus en détail

Cours 7 : Utilisation de modules sous python

Cours 7 : Utilisation de modules sous python Cours 7 : Utilisation de modules sous python 2013/2014 Utilisation d un module Importer un module Exemple : le module random Importer un module Exemple : le module random Importer un module Un module est

Plus en détail

Importer les fichiers élèves - professeurs du secrétariat

Importer les fichiers élèves - professeurs du secrétariat Importer les fichiers élèves - professeurs du secrétariat Fiche technique PMB n 3.1. Objectif : Récupérer la base de données élèves (et professeurs) du secrétariat avec le numéro de code Aplon (établi

Plus en détail

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

La survie nette actuelle à long terme Qualités de sept méthodes d estimation La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg

Plus en détail

Logiciel Le Sphinx Plus 2 version 5. Le Sphinx Développement 74650 Chavanod

Logiciel Le Sphinx Plus 2 version 5. Le Sphinx Développement 74650 Chavanod Logiciel Le Sphinx Plus 2 version 5 Le Sphinx Développement 74650 Chavanod 2005-2006 Plan Présentation générale du logiciel Stade Élaboration du questionnaire Stade Collecte des réponses Stade Traitements

Plus en détail

Recherche dans un tableau

Recherche dans un tableau Chapitre 3 Recherche dans un tableau 3.1 Introduction 3.1.1 Tranche On appelle tranche de tableau, la donnée d'un tableau t et de deux indices a et b. On note cette tranche t.(a..b). Exemple 3.1 : 3 6

Plus en détail

Présentation du langage et premières fonctions

Présentation du langage et premières fonctions 1 Présentation de l interface logicielle Si les langages de haut niveau sont nombreux, nous allons travaillé cette année avec le langage Python, un langage de programmation très en vue sur internet en

Plus en détail

1. Structure d'un programme FORTRAN 95

1. Structure d'un programme FORTRAN 95 FORTRAN se caractérise par la nécessité de compiler les scripts, c'est à dire transformer du texte en binaire.(transforme un fichier de texte en.f95 en un executable (non lisible par un éditeur) en.exe.)

Plus en détail

TeamViewer 7 Manuel Manager

TeamViewer 7 Manuel Manager TeamViewer 7 Manuel Manager TeamViewer GmbH Kuhnbergstraße 16 D-73037 Göppingen teamviewer.com Présentation Sommaire Sommaire... 2 1 Présentation... 4 1.1 À propos de TeamViewer Manager... 4 1.2 À propos

Plus en détail

SOMMAIRE. Travailler avec les requêtes... 3

SOMMAIRE. Travailler avec les requêtes... 3 Access Les requêtes SOMMAIRE Travailler avec les requêtes... 3 A) Créer une requête sélection en mode QBE... 3 B) Exécuter une requête à partir du mode Modifier (QBE)... 3 C) Passer du mode Feuille de

Plus en détail

LibreOffice Calc : introduction aux tableaux croisés dynamiques

LibreOffice Calc : introduction aux tableaux croisés dynamiques Fiche logiciel LibreOffice Calc 3.x Tableur Niveau LibreOffice Calc : introduction aux tableaux croisés dynamiques Un tableau croisé dynamique (appelé Pilote de données dans LibreOffice) est un tableau

Plus en détail

Manuel d utilisation email NETexcom

Manuel d utilisation email NETexcom Manuel d utilisation email NETexcom Table des matières Vos emails avec NETexcom... 3 Présentation... 3 GroupWare... 3 WebMail emails sur internet... 4 Se connecter au Webmail... 4 Menu principal... 5 La

Plus en détail

L'explorateur de fichier de Windows 8.1

L'explorateur de fichier de Windows 8.1 Une documentation Côtière Informatique L'explorateur de fichier de Windows 8.1 Mise à jour du 01/10/2014 Sommaire Préambule page 1 Cours 1 1) Le matériel servant au stockage des données. page 2 2) Reconnaître

Plus en détail

SAP Lumira Version du document : 1.23 2015-03-06. Guide de l'utilisateur de SAP Lumira

SAP Lumira Version du document : 1.23 2015-03-06. Guide de l'utilisateur de SAP Lumira SAP Lumira Version du document : 1.23 2015-03-06 Contenu 1 A propos de SAP Lumira....6 2 Guide de démarrage de SAP Lumira.... 7 2.1 Menus sur la page d'accueil.... 7 2.2 Étapes générales pour la visualisation

Plus en détail

Microsoft Excel 2007. Présentation du tableur Excel

Microsoft Excel 2007. Présentation du tableur Excel Microsoft Excel 2007 Présentation du tableur Excel 1 Interface d'excel 2007 Excel 2007 se distingue des versions précédentes par son interface plus intuitive et accessible. Les nouveautés sont multiples

Plus en détail

Localisation des fonctions

Localisation des fonctions MODALISA 7 Localisation des fonctions Vous trouverez dans ce document la position des principales fonctions ventilées selon l organisation de Modalisa en onglets. Sommaire A. Fonctions communes à tous

Plus en détail

1. Qu'est-ce que SQL?... 2. 2. La maintenance des bases de données... 2. 3. Les manipulations des bases de données... 5

1. Qu'est-ce que SQL?... 2. 2. La maintenance des bases de données... 2. 3. Les manipulations des bases de données... 5 1. Qu'est-ce que SQL?... 2 2. La maintenance des bases de données... 2 2.1 La commande CREATE TABLE... 3 2.2 La commande ALTER TABLE... 4 2.3 La commande CREATE INDEX... 4 3. Les manipulations des bases

Plus en détail

Créer une base de données

Créer une base de données Access Créer une base de données SOMMAIRE Généralités sur les bases de données... 3 Création de la base de données... 4 A) Lancement d'access... 4 B) Enregistrement de la base de données vide... 4 Création

Plus en détail

Le langage SQL Rappels

Le langage SQL Rappels Le langage SQL Rappels Description du thème : Présentation des principales notions nécessaires pour réaliser des requêtes SQL Mots-clés : Niveau : Bases de données relationnelles, Open Office, champs,

Plus en détail

Ref : Résolution problème d'accès aux supports de cours

Ref : Résolution problème d'accès aux supports de cours PLATE FORME e-learning LLMS Pôle national de compétences FOAD (Formation Ouverte et A Distance) Ref : Résolution problème d'accès Pôle compétences FOAD SIGAT http://foad.ac-toulouse.fr/ Page 2 SOMMAIRE

Plus en détail

LE TABLEUR OPENOFFICE CALC : CONTRÔLES DE FORMULAIRES ACCÈS AUX BASES DE DONNÉES

LE TABLEUR OPENOFFICE CALC : CONTRÔLES DE FORMULAIRES ACCÈS AUX BASES DE DONNÉES LE TABLEUR OPENOFFICE CALC : CONTRÔLES DE FORMULAIRES ACCÈS AUX BASES DE DONNÉES 1. Les bases de données dans OpenOffice CALC Dans OpenOffice Calc une base de données désigne simplement un tableau de valeurs.

Plus en détail

1. Introduction...2. 2. Création d'une requête...2

1. Introduction...2. 2. Création d'une requête...2 1. Introduction...2 2. Création d'une requête...2 3. Définition des critères de sélection...5 3.1 Opérateurs...5 3.2 Les Fonctions...6 3.3 Plusieurs critères portant sur des champs différents...7 3.4 Requête

Plus en détail

Python - introduction à la programmation et calcul scientifique

Python - introduction à la programmation et calcul scientifique Université de Strasbourg Environnements Informatique Python - introduction à la programmation et calcul scientifique Feuille de TP 1 Avant de commencer Le but de ce TP est de vous montrer les bases de

Plus en détail

Microsoft Excel. Tableur

Microsoft Excel. Tableur Microsoft Excel Tableur 1 Introduction à la notion du tableur Un tableur est un logiciel permettant de manipuler des données numériques et d'effectuer automatiquement des calculs sur des nombres stockés

Plus en détail

Manuel d'utilisation d'apimail V3

Manuel d'utilisation d'apimail V3 Manuel d'utilisation d'apimail V3 I Préambule Page 3 II Présentation Page 4 III Mise en route Configuration Page 5 Messagerie Serveur smtp Serveur pop Compte pop Mot de passe Adresse mail Laisser les messages

Plus en détail

Automatisation d'une Facture 4. Liste Déroulante Remises Case à cocher Calculs

Automatisation d'une Facture 4. Liste Déroulante Remises Case à cocher Calculs Dans la série Les tutoriels libres présentés par le site FRAMASOFT Automatisation d'une Facture 4 Liste Déroulante Remises Case à cocher Calculs Logiciel: Version: Licence: Site: OpenOffice.org Calc :

Plus en détail

Création de Sous-Formulaires

Création de Sous-Formulaires Création de Sous-Formulaires Révision 1.01 du 02/01/04 Réalisé avec : OOo 1.1.0 Plate-forme / Os : Toutes Distribué par le projet Fr.OpenOffice.org Table des Matières 1 But de ce how-to...3 2 Pré-requis...3

Plus en détail

A.-M. Cubat PMB - Import de notices à partir d un tableur Page 1 Source : http://amcubat.be/docpmb/import-de-notices

A.-M. Cubat PMB - Import de notices à partir d un tableur Page 1 Source : http://amcubat.be/docpmb/import-de-notices A.-M. Cubat PMB - Import de notices à partir d un tableur Page 1 Comme beaucoup de personnes, j'ai voulu récupérer les notices de mon ancien logiciel de gestion de bibliothèque. Vu qu'il ne prévoyait pas

Plus en détail

Publipostage avec Calc

Publipostage avec Calc Auto-formation sur OpenOffice.org 2.0 par Cyril Beaussier Version 1.0.2 - Avril 2006 Publipostage avec Calc Sommaire Introduction... 2 Présentation... 3 Notions... 4 Les données... 5 Lettre type... 7 Création

Plus en détail

SEMIN. Données sous R : stockage et échange. Julio PEDRAZA ACOSTA

SEMIN. Données sous R : stockage et échange. Julio PEDRAZA ACOSTA SEMIN Données sous R : stockage et échange Julio PEDRAZA ACOSTA UMR 5202 Origine Structure et Evolution de la Biodiversité Département Systématique et Evolution, MNHN pedraza@mnhn.fr SEMIN R du MNHN 10

Plus en détail

Analyse tarifaire en ligne (TAO) de l'omc

Analyse tarifaire en ligne (TAO) de l'omc Analyse tarifaire en ligne (TAO) de l'omc L'analyse tarifaire en ligne (TAO) permet d'effectuer des recherches et d'analyser les données tarifaires conservées dans deux bases de données de l'omc, à savoir

Plus en détail

REALISER UN SITE INTERNET AVEC IZISPOT SOMMAIRE

REALISER UN SITE INTERNET AVEC IZISPOT SOMMAIRE REALISER UN SITE INTERNET AVEC IZISPOT Voici un tutoriel pour vous aider à réaliser un petit site internet (4 pages) à l'aide du logiciel gratuit IZISPOT. Dans l'exemple qui suit, il s'agit de mettre en

Plus en détail

TABLE DES MATIERES. C Exercices complémentaires 42

TABLE DES MATIERES. C Exercices complémentaires 42 TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence

Plus en détail

SAUVEGARDER SES DONNEES PERSONNELLES

SAUVEGARDER SES DONNEES PERSONNELLES SAUVEGARDER SES DONNEES PERSONNELLES Il est important de sauvegarder son environnement système Windows ainsi que ses données personnelles. Nous verrons dans ce tutorial comment créer un point de restauration

Plus en détail

FileSender par RENATER - Guide utilisateur

FileSender par RENATER - Guide utilisateur FileSender par RENATER - Guide utilisateur Filesender par RENATER est un service de transfert sécurisé de fichiers volumineux à disposition des utilisateurs de la communauté de l'enseignement supérieur

Plus en détail

Le meilleur de l'open source dans votre cyber cafe

Le meilleur de l'open source dans votre cyber cafe Le meilleur de l'open source dans votre cyber cafe Sommaire PRESENTATION...1 Fonctionnalités...2 Les comptes...3 Le système d'extensions...4 Les apparences...5 UTILISATION...6 Maelys Admin...6 Le panneau

Plus en détail

Fonctionnement général de Tiny ERP

Fonctionnement général de Tiny ERP 1 of 18 17.01.2007 01:34 Fonctionnement général de Tiny ERP La fenêtre principale Après avoir été identifié, la fenêtre principale de Tiny ERP apparaît devant vous. Cette fenêtre comporte plusieurs sections

Plus en détail

Guide d utilisation de fonctionnalités avancées de Beyond 20/20 (application à des données départementales issues de Sit@del2)

Guide d utilisation de fonctionnalités avancées de Beyond 20/20 (application à des données départementales issues de Sit@del2) Guide d utilisation de fonctionnalités avancées de Beyond 20/20 (application à des données départementales issues de Sit@del2) Les indications ci-dessous ont pour objectif de guider la personnalisation

Plus en détail

YAPBA M. Logiciel libre de suivi de vos comptes

YAPBA M. Logiciel libre de suivi de vos comptes YAPBA M Logiciel libre de suivi de vos comptes Premières opérations A l'ouverture la première fois, on obtient cet écran. La première opération va être la création d'un compte. Comme aucun compte n'est

Plus en détail

Tutorial Ophcrack. I) Ophcrack en API. (ou comment utiliser Ophcrack pour recouvrir un mot de passe sous Windows XP et Windows Vista)

Tutorial Ophcrack. I) Ophcrack en API. (ou comment utiliser Ophcrack pour recouvrir un mot de passe sous Windows XP et Windows Vista) Tutorial Ophcrack (ou comment utiliser Ophcrack pour recouvrir un mot de passe sous Windows XP et Windows Vista) Ophcrack est un utilitaire gratuit permettant de cracker les mots de passe des sessions

Plus en détail

Microsoft OSQL OSQL ou l'outil de base pour gérer SQL Server

Microsoft OSQL OSQL ou l'outil de base pour gérer SQL Server Microsoft OSQL OSQL ou l'outil de base pour gérer SQL Server Suite à mon précédent article concernant MSDE, je me suis rendu compte à partir des commentaires que de nombreux utilisateurs avaient des problèmes

Plus en détail

MATLAB : COMMANDES DE BASE. Note : lorsqu applicable, l équivalent en langage C est indiqué entre les délimiteurs /* */.

MATLAB : COMMANDES DE BASE. Note : lorsqu applicable, l équivalent en langage C est indiqué entre les délimiteurs /* */. Page 1 de 9 MATLAB : COMMANDES DE BASE Note : lorsqu applicable, l équivalent en langage C est indiqué entre les délimiteurs /* */. Aide help, help nom_de_commande Fenêtre de travail (Command Window) Ligne

Plus en détail

Foire aux Questions Note: Les réponses aux questions correspondent à la version 3.73.2212 Mise en route

Foire aux Questions Note: Les réponses aux questions correspondent à la version 3.73.2212 Mise en route Foire aux Questions Note: Les réponses aux questions correspondent à la version 3.73.2212 Mise en route Q. Je crois que le logiciel du SISA serait un bon choix pour mon organisation. Quels sont les étapes

Plus en détail

Stockage du fichier dans une table mysql:

Stockage du fichier dans une table mysql: Stockage de fichiers dans des tables MYSQL avec PHP Rédacteur: Alain Messin CNRS UMS 2202 Admin06 30/06/2006 Le but de ce document est de donner les principes de manipulation de fichiers dans une table

Plus en détail

Aide à l'utilisation de l'application 'base de données communales' intégrée à la plate-forme PEGASE. Interface 'Front-Office'

Aide à l'utilisation de l'application 'base de données communales' intégrée à la plate-forme PEGASE. Interface 'Front-Office' DREAL POITOU CHARENTE Aide à l'utilisation de l'application 'base de données communales' intégrée à la plate-forme PEGASE Interface 'Front-Office' Base de données communales Poitou- Charentes Alkante 2013

Plus en détail

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, 2011-2012 LES STATISTIQUES INFERENTIELLES LES STATISTIQUES INFERENTIELLES (test de Student) L inférence statistique est la partie des statistiques qui, contrairement à la statistique descriptive, ne se contente pas de décrire des observations,

Plus en détail