Travaux dirigés. Introduction à R 1



Documents pareils
1 Introduction - Qu est-ce que le logiciel R?

Présentation du langage et premières fonctions

Présentation du logiciel

Lire ; Compter ; Tester... avec R

EXCEL TUTORIEL 2012/2013

Annexe commune aux séries ES, L et S : boîtes et quantiles

Introduction à MATLAB R

Cours d introduction à l informatique. Partie 2 : Comment écrire un algorithme? Qu est-ce qu une variable? Expressions et instructions

MO-Call pour les Ordinateurs. Guide de l utilisateur

BIRT (Business Intelligence and Reporting Tools)

Gestion des données avec R

GUIDE D UTILISATION DU CENTRE DE DONNÉES DE L ISU

8. Gestionnaire de budgets

TP 1. Prise en main du langage Python

Statistique : Résumé de cours et méthodes

La Clé informatique. Formation Excel XP Aide-mémoire

Démonstration d utilisation De NesmaCom

CAPTURE DES PROFESSIONNELS

Note de cours. Introduction à Excel 2007

Avertissement : Nos logiciels évoluent rendant parfois les nouvelles versions incompatibles avec les anciennes.

1 Presentation du bandeau. 2 Principe de création d un projet : C2 industrialisation Apprendre Gantt project Ver 2.6 planifier

Séries Statistiques Simples

MAÎTRISE DE L ENVIRONNEMENT WINDOWS VISTA

Licence de Biologie, 1ère année. Aide. [Aide 1] Comment utiliser l'explorateur Windows? Comment créer des dossiers?

LES TYPES DE DONNÉES DU LANGAGE PASCAL

EXCEL et base de données

Guide d'utilisation. OpenOffice Calc. AUTEUR INITIAL : VINCENT MEUNIER Publié sous licence Creative Commons

Guide de l utilisateur Mikogo Version Windows

L espace de travail de Photoshop

URECA Initiation Matlab 2 Laurent Ott. Initiation Matlab 2

Vous venez d acquérir un fichier de données issues de la Base de données SIRENE. Comment utiliser votre fichier?

FAIRE UN PAIEMENT TIPI

SINE QUA NON. Découverte et Prise en main du logiciel Utilisation de bases

Python - introduction à la programmation et calcul scientifique

1. Introduction Création d'une requête...2

Comment utiliser FileMaker Pro avec Microsoft Office

Avant-propos FICHES PRATIQUES EXERCICES DE PRISE EN MAIN CAS PRATIQUES

Services bancaires par Internet aux entreprises. Guide pratique pour : Rapports de solde Version

Business Intelligence

SAP BusinessObjects Web Intelligence (WebI) BI 4

Comment accéder à d Internet Explorer

1) Installation de Dev-C++ Téléchargez le fichier devcpp4990setup.exe dans un répertoire de votre PC, puis double-cliquez dessus :

Traitement des données avec Microsoft EXCEL 2010

SOMMAIRE. Présentation assistée sur ordinateur. Collège F.Rabelais 1/10

RÉALISATION DE GRAPHIQUES AVEC OPENOFFICE.ORG 2.3

STAGE IREM 0- Premiers pas en Python

Initiation à la programmation en Python

FACTURATION. Menu. Fonctionnement. Allez dans le menu «Gestion» puis «Facturation» 1 Descriptif du dossier (onglet Facturation)

Évaluation des compétences. Identification du contenu des évaluations. Septembre 2014

Formation Word/Excel. Présentateur: Christian Desrochers Baccalauréat en informatique Clé Informatique, 15 février 2007

Importer un fichier CSV

1 CRÉER UN TABLEAU. IADE Outils et Méthodes de gestion de l information

UEO11 COURS/TD 1. nombres entiers et réels codés en mémoire centrale. Caractères alphabétiques et caractères spéciaux.

RACCOURCIS CLAVIERS. DEFINITION : Une «combinaison de touches» est un appui simultané sur plusieurs touches.

Initiation à Excel. Frédéric Gava (MCF)

Solutions en ligne Guide de l utilisateur

Créer le schéma relationnel d une base de données ACCESS

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique

Installation du logiciel Windows Suivant Démarrer Tous les programmes Démarrer Tous les programmes Marketing Manager Marketing Manager Linux ici Mac

Styler un document sous OpenOffice 4.0

Didacticiel Études de cas. Description succincte de Pentaho Data Integration Community Edition (Kettle).

Découverte du logiciel ordinateur TI-n spire / TI-n spire CAS

KIELA CONSULTING. Microsoft Office Open Office Windows - Internet. Formation sur mesure

Statistique Descriptive Élémentaire

Activité 11 : Nuage de points ou diagramme de dispersion

Les concepts de base, l organisation des données

Classe de première L

MUNIA Manuel de l'utilisateur

Extraction d informations stratégiques par Analyse en Composantes Principales

ENVOI EN NOMBRE DE MESSAGES AUDIO

Infolettre #18 : Les graphiques avec Excel 2010

PRISE EN MAIN D UN TABLEUR. Version OPEN OFFICE

Séance 0 : Linux + Octave : le compromis idéal

Cours 1. I- Généralités sur R II- Les fonctions de R et autres objets III-Les vecteurs

Aide-mémoire de statistique appliquée à la biologie

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Formation. Module WEB 4.1. Support de cours

GUIDE DES PROFESSEURS(ES) POUR LÉA Version du 27 janvier 2009

POUR ALLER UN PEU PLUS LOIN SUR UN TABLEUR. Version EXCEL

Première étape : créer le fichier de données - extraire les données de PMB et les transférer dans Excel

Manuel d utilisation 26 juin Tâche à effectuer : écrire un algorithme 2

LE RÔLE DE LA STATISTIQUE DANS UN PROCESSUS DE PRISE DE DÉCISION

Premiers pas avec SES-Pegase (version 7.0) SES : Un Système Expert pour l analyse Statistique des données. Premiers pas avec SES-Pegase 1

LES TOUT PREMIERS PAS

Administration du site (Back Office)

1 Recherche en table par balayage

Initiation à l analyse en composantes principales

MANUEL POUR L UTILISATION DE L APPLICATION EN LIGNE DU SYSTÈME DE NOTIFICATION DES ACCIDENTS INDUSTRIELS

C est quoi un tableur?

TUTORIAL REUTERS. Utilisation de l'utilitaire de recherche Reuters

GUIDE D UTILISATION CHRONOTRACE Pour suivre vos envois dans le monde entier

7. Configuration du mail-client IMAP IMAP4 dans Outlook Express IMAP4 dans Netscape Messenger...6

Statistiques Descriptives à une dimension

Utiliser un tableau de données

Le cas «BOURSE» annexe

ENVOI EN NOMBRE DE SMS

EXCEL PERFECTIONNEMENT SERVICE INFORMATIQUE. Version /11/05

Automatisation d'une Facture 4. Liste Déroulante Remises Case à cocher Calculs

L informatique en BCPST

Transcription:

Introduction à R 1 1 Introduction : pourquoi R? R est un logiciel pour l analyse statistique. C est un logiciel libre ; il est disponible gratuitement et tourne sur différents systèmes (PC Linux, PC Windows, Mac). Vous pouvez le télécharger ici : http ://cran.r-project.org/ si vous voulez l installer chez vous. R permet de tracer toute sorte de graphiques (histogramme, camembert,...), de calculer différents paramètres (moyenne, écart type,...) et de réaliser les tests statistiques. R «connaît» les formules pour effectuer ces tests statistiques, en revanche c est à vous de lui dire quel test utiliser! R est un programme en ligne de commande : l utilisateur (c est à dire vous!) donne des ordres au programme en tapant des commandes au clavier. Ces commandes doivent être entrées dans un langage spécifique que nous allons étudier. 2 Démarrer R Pour démarrer R au lycée, aller dans le menu démarrer, puis choisir le menu mathématiques et le programme R 2.9.2. Le signe «>» en début de ligne est «l invite de commande» de R : le programme vous demande d entrer une commande. La commande suivante (à taper au clavier ; le «>» est l invite de commande et ne doit pas être tapé) permet de quitter R : > q() Astuce : lorsque l on utilise R, il est possible de reprendre la ligne de commande tapée précédemment en appuyant sur la flèche du haut du clavier. Appuyer plusieurs fois permet de récupérer des lignes plus anciennes. 3 Syntaxe 3.1 Commentaires Dans R, tout ce qui suit le caractère # (= dièse) est un commentaire et n est pas pris en compte par R : > # Ceci est du baratin qui n est pas pris en compte par R! 3.2 Variables R étant prévu pour faire des calculs statistiques, il ne manipule que des tableaux de données. Ces tableaux sont stockés dans des variables, ce qui permet de leur donner un nom. Le nom des variables doit commencer par une lettre et peut contenir des lettres, des chiffres, des points et des caractères de soulignement (_), mais surtout pas d espace. L opérateur=est utilisé pour donner une valeur à une variable ; il peut se lire «prend la valeur de» (NB : on trouve aussi l opérateur<- («flèche» ) qui a exactement la même signification). Pour afficher la valeur de la variable âge, il suffit de taper le nom de la variable : > age = 28 > age [1] 28 La variable «age» est ici un tableau avec une seule case, qui contient le chiffre 28. Le 1 entre crochet indique qu il s agit de la case n 1. R numérote les cases des tableaux en commençant à 1. 4 Types de donnée > age = 28 # Entier > poids = 64.5 # Flottant > nom = "Jean-Baptiste Lamy" # Chaîne de caractère > enseignant = TRUE # Booléen > etudiant = FALSE # Booléen R peut manipuler des nombres entiers, des flottants (= nombres à virgule), des chaînes de caractère et des booléens (valeur vraie ou fausse). Enfin, la valeur spéciale NA (non available = non disponible) est utilisée lorsqu une donnée est inconnue. 1. D après les TDs de Jean-Baptiste Lamy : http ://laterrevuedailleurs.fdn.org/fr/boulot/enseignement/logiciel_r statistique en_biologie/index.html

BTS ACSE/GPN/TV 5 Tableaux R définit plusieurs types de tableaux que nous allons voir ; il y a peu de différences entre eux et tous s utilisent de la même manière. 5.1 Vecteurs Un vecteur est un tableau à une dimension. Toutes les cases du vecteur doivent contenir des données du même type (des entiers, des chaînes de caractère,...). La fonctionc() permet de créer un vecteur : > ages=c(28,25,23,24,26,23,21,22,24,29,24,26,31,28,27,24,23,25,27,25,24,21,24,23,25,31) > ages [1] 28 25 23 24 26 23 21 22 24 29 24 26 31 28 27 24 23 25 27 25 24 21 24 23 25 [26] 31 «[1]» indique que ce qui suit est la première valeur du vecteur, et «[26]» que la deuxième ligne commence à la 26 e valeur ; «[1]» et «[26]» ne sont pas des éléments du vecteur. > hba1c_groupe_temoin = c(75.0, 69.2, 75.4, 87.3) > hba1c_groupe_intervention = c(70.5, 64.2, 76.4, 81.6) > hba1c = c(hba1c_groupe_temoin, hba1c_groupe_intervention) > hba1c [1] 75.0 69.2 75.4 87.3 70.5 64.2 76.4 81.6 La fonction c() permet aussi de concaténer (= mettre bout à bout) des vecteurs. > hba1c[2] [1] 69.2 Il est possible d accéder à un élément du vecteur avec des crochets. Par exemple pour accéder au second élément du vecteur poids. > hba1c[hba1c > 70.0] [1] 75.0 75.4 87.3 70.5 76.4 81.6 > length(hba1c) [1] 8 > length(hba1c[hba1c > 70.0]) [1] 6 Il est aussi possible d accéder à l ensemble des poids répondant à une condition, par exemple l ensemble des poids supérieurs à 70.0. Enfin, la fonction length() permet de récupérer le nombre d éléments d un tableau. > seq(1, 10) [1] 1 2 3 4 5 6 7 8 9 10 > seq(1, 10, by = 0.5) [1] 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5 5.0 5.5 6.0 6.5 7.0 7.5 8.0 [16] 8.5 9.0 9.5 10.0 Il est possible de créer un vecteur contenant une suite de nombres entiers avec la fonction seq. 5.2 Matrices Une matrice est un tableau à deux dimensions, c est à dire avec des lignes et des colonnes. Comme pour les vecteurs, toutes les cases d une matrice doivent contenir des données du même type. Une matrice est créée à partir d un vecteur contenant les valeurs, et d un nombre de ligne et de colonne. > ma_matrice = matrix(c(1.5, 2.1, 3.2, 1.6, 1.4, 1.5),nr=3, nc=2) > ma_matrice [,1] [,2] [1,] 1.5 1.6 [2,] 2.1 1.4 [3,] 3.2 1.5 nr, pour Number of Row nc, pour Number of Column > ma_matrice[1, 1] [1] 1.5 Les éléments de la matrice peuvent être accédés en donnant entre crochets le numéro de la ligne puis celui de la colonne.

> ma_matrice[1,] [1] 1.5 1.6 Il est aussi possible de récupérer une ligne ou une colonne entière, en omettant le numéro correspondant. 5.3 Listes > ma_liste = list("jb", 28) Une liste est un tableau à une dimension, qui peut contenir des données de différents types (contrairement au vecteur). 5.4 Tableaux de donnée (data frame en anglais) Un tableau de donnée est un tableau où chaque colonne correspond à un attribut différents (âge, taille, poids par exemple) et chaque ligne à un individu différent. Voici un exemple : nom taille poids Jean-Baptiste Lamy 1.70 64.0 Bertrand Lamy 1.80 63.0......... Il est possible de créer des tableaux de données dans R, cependant il est beaucoup plus facile de les charger à partir d un fichier. On utilise pour cela la fonctionread.table(). Voici le fichier taille_poids.csv : nom,taille,poids Jean-Baptiste Lamy,1.70,64.0 Bertand Lamy,1.80,63.0 M. X,1.67,70.5 M. Y,1.69,95.0 M. Z,1.75,NA tableau = read.table("taille_poids.csv", sep=",", header=true) Ce fichier peut être chargé ainsi dans R. sep=«,» indique que dans le fichier les différentes colonnes sont séparées par des virgules, et header=true indique que la première ligne du fichier contient les noms des colonnes. > tableau nom taille poids 1 Jean-Baptiste Lamy 1.70 64.0 2 Bertand Lamy 1.80 63.0 3 M. X 1.67 70.5 4 M. Y 1.69 95.0 5 M. Z 1.75 NA > names(tableau) [1] "nom" "taille" "poids" Ces valeurs correspondent aux fichiers CSV (Comma- Separated Value file : fichier dont les valeurs sont séparées par des virgules) qui peuvent être généré facilement, par exemple en exportant depuis un tableur comme OpenOffice ou Excel. Les noms des colonnes sont disponibles via la fonctionnames(). Comme pour les matrices, il est possible d accéder aux cases, lignes et colonnes d un tableau. Les noms des colonnes peuvent être utilisés à la place de leurs index : > tableau[1, 2] # Première ligne, deuxième colonne : taille du premier individu [1] 1.7 > tableau[1, "taille"] # Première ligne, colonne taille : pareil [1] 1.7 > tableau[1,] # Première ligne nom taille poids IMC 1 Jean-Baptiste Lamy 1.7 64 22.14533 > tableau[,"taille"] # Colonne taille [1] 1.70 1.80 1.67 1.69 1.75

BTS ACSE/GPN/TV > tableau[tableau["taille"]> 1.7,] nom taille poids IMC 2 Bertand Lamy 1.80 63 19.44444 5 M. Z 1.75 NA NA > attach(tableau) Il est aussi possible d indexer avec une condition : par exemple, pour obtenir un tableau avec seulement les individus dont la taille est supérieure à 1m70 (ne pas oublier la virgule, qui sert à indiquer que l on veut récupérer des lignes!). La fonction attach() permet de définir le tableau «par défaut» sur lequel porte les analyses suivantes. > taille [1] 1.70 1.80 1.67 1.69 1.75 Ensuite, il est possible d accéder au colonne du tableau directement par leur nom. Enfin, la fonction write.table() permet d enregistrer un tableau de donnée (row.names = FALSE permet de désactiver les numéros de colonne). write.table(tableau, "taille_poids_2.csv", sep = ",", row.names = FALSE) Ce fichier pourra ensuite être rechargé avecread.table() comme ci-dessus. 6 Opérateur et calcul 6.1 6.1 Opérations > 2 * 3 + 1 [1] 7 R permet de réaliser la plupart des opérations courantes à l aide des opérateurs suivants : + (addition), (soustraction), (multiplication),/(division), ˆ (puissance). > imc = poids / (taille ˆ 2) > imc [1] 22.14533 19.44444 25.27878 33.26214 NA > tableau["imc"] = imc > tableau nom taille poids IMC 1 Jean-Baptiste Lamy 1.70 64.0 22.14533 2 Bertand Lamy 1.80 63.0 19.44444 3 M. X 1.67 70.5 25.27878 4 M. Y 1.69 95.0 33.26214 5 M. Z 1.75 NA NA Les opérations sont réalisées sur chaque élément des tableaux. Par exemple, pour calculer l Indice de Masse Corporelle (IMC) sur chaque individu du tableau de donnée chargé précédemment, en appliquant la formule IMC= poids taille 2. R a calculé l IMC pour chacun des 5 individus! Notez que la donnée manquante (NA) se «propage», ce qui est logique : si le poids de M. Z est manquant, il n est pas possible de calculer son IMC, qui est donc manquant lui aussi. Il est possible d ajouter une quatrième colonne avec l IMC à notre tableau de la manière ci-contre. 6.2 Tests > 1 < 3 [1] TRUE > imc > 25 [1] FALSE FALSE TRUE TRUE NA Les tests se font avec les opérateurs<,>,<= (inférieur ou égal), >= (supérieur ou égal),== (égal),!= (différent de). Ils retournent une (ou plusieurs) valeur(s) booléenne(s). Il est possible de combiner plusieurs tests avec des & (et) ou des (ou). 7 Fonctions R définit un grand nombre de fonctions ; nous en avons déjà vu quelques unes. help(mean) La fonctionhelp() permet d obtenir de l aide sur une fonction. Voici une liste des principales fonctions : summary(tableau) affiche un résumé du tableau length(vecteur) retourne le nombre de case d un vecteur ncol(tableau) retourne le nombre de colonne d un tableau

nrow(tableau) retourne le nombre de ligne d un tableau q() quitte R min(vecteur) retourne la plus petite valeur d un vecteur max(vecteur) retourne la plus grande valeur d un vecteur sort(vecteur) retourne une copie d un vecteur après l avoir trié mean(vecteur) calcule la moyenne median(vecteur) calcule la médiane var(vecteur) calcule la variance sd(vecteur) calcule la déviation standard (l écart type) sqrt(nombre) retourne la racine carré d un nombre sum(vecteur) retourne la somme de toutes les valeurs du vecteur round(flottant) arrondit un nombre rank(vecteur) retourne un vecteur avec les rangs (c est à dire avec 1 pour la plus petite valeur, 2 pour la seconde, etc) quantile(vecteur) affichage par quantile > mean(poids) [1] NA Nous avons vu que les valeurs NA se propagent. Cela est parfois gênant, par exemple lorsque l on calcule une moyenne. > mean(poids, na.rm = TRUE) [1] 73.125 Dans ce cas, il faut demander à R de ne pas tenir compte des valeurs NA pour ce calcul. 8 Introduction aux graphiques avec R Faire un graphique pour représenter ses données permet de compléter l information de la statistique descriptive. La visualisation des données est une information en soi et ouvre des pistes de travail dans l analyse de ses données. Il existe des représentations graphiques de données très nombreuses et R offre une variété de graphiques remarquables. Pour avoir une petite idée des possibilités offertes, il est possible de taper la commande > demo(graphics) Il n est pas possible ici de détailler tous ces graphiques et les options dans les fonctions qui les utilisent. Nous nous limiterons aux principales fonctions et aux plus intéressantes. 9 Graphiques à une variable 9.1 Diagramme de dispersion (stripchart) : 1 variable numérique > stripchart(variable_numérique) Un premier graphique consiste tout simplement à mettre sur un axe des données quantitatives ordonnées : c est le diagramme de dispersion (stripchart en anglais). 9.2 Représentation point par point (dotchart) : 1 variable numérique > dotchart(variable_numérique) > dotchart(sort(variable_numérique)) Le dotchart est similaire au diagramme de dispersion, mais chaque donnée est représentée sur une ligne différente. Il peut être utile de trier les données pour faciliter la lecture du graphique. 9.3 Boites à moustaches simple : 1 variable numérique > boxplot(variable_numérique) Pour afficher une boîte à moustache simple. Lorsque l on a plusieurs variables INDÉPENDANTES, il est possible de placer plusieurs boîtes à moustaches les unes à côté des autres, en séparant les variables par des virgules : > boxplot(variable1_numérique, variable2_numérique, variable3_numérique,...)

BTS ACSE/GPN/TV 9.4 Histogramme : 1 variable numérique > hist(variable_numérique) C est une représentation plus classique et très utile. Par défaut R applique la loi de Sturges pour déterminer le nombre de barres. > hist(variable_numérique, breaks = 3) il est possible de préciser le nombre de barres manuellement (ici, 3). > hist(variable_numérique, breaks = c(0.0, 0.2, 0.5, 0.6, 1.0)) 9.5 Camembert : 1 variable qualitative > pie(variable_numérique) Un camembert se fait avec la commande pie. ou bien les valeurs auxquelles auront lieu les coupures. > pie(summary(variable_qualitative)) Pour faire un camembert à partir d une donnée qualitative, il faut d abord stratifier celle-ci avec la commande summary. 10 Graphiques à deux variables En biologie, il est très fréquent d étudier une variable en fonction d une (ou plusieurs) autres variables : par exemple la réponse biologique d un organisme à une substance en fonction de la dose de substance,... Nous allons maintenant voir comment étudier deux variables simultanément. 10.1 Boîtes à moustaches : 1 variable numérique+1variable qualitative > boxplot(variable_numérique) Pour afficher une boîte à moustache simple. Pour afficher une boîte à moustache de la variable 1 pour chaque valeur possible de la variable 2 (la variable 1 est numérique et en général la variable 2 est qualitative). > boxplot(variable1_numérique variable2_qualitative) NB : On comprend mieux cette appellation de > boxplot(len, range = 0, horizontal = TRUE) boîte à moustache si on la représente horizontalement. 10.2 Graphique à deux dimensions(x, Y) : 2 variables numériques La première variable est placée en X, la seconde en Y. Il est possible d utiliser des variables numériques ou qualitatives, cependant ce type de graphique est surtout utile avec des variables qualitatives. > plot(variable_numerique1, variable_numerique2) 10.3 Barre cumulée : 2 variables qualitatives > plot(variable_qualitative1, variable_qualitative2) Un diagramme en «barre cumulée» permet d étudier 2 variables qualitatives. 11 Mise en forme des graphiques Il existe de nombreuses options pour mettre en forme les graphiques. En voici quelques-unes : main titre du graphique sub sous-titre du graphique xlab titre de l axe X ylab titre de l axe Y D autres options sont disponibles ; pour les obtenir, consultez l aide, par exemple pour les histogrammes : > help(hist)

12 Exercices 12.1 Herbicides Nous souhaitons étudier l efficacité de trois herbicides sur trois plantes : blé, chiendent et liseron. Pour cela, des cultures de ces plantes ont été mises en présence de l un des trois herbicides, ou d aucun d entre eux. Le nombre de plants vivants dans la culture a été compté avant l expérience, et 10 jours après. Chaque combinaison plante - herbicide a fait l objet de 20 expérimentations, plus un témoin sans herbicide (soit 240 expérimentations en tout). Le tableau de donnée est disponible dans le fichier herbicide.csv. 1. Charger le fichier herbicide.ods et le convertir en herbicide.csv puis afficher les données. 2. Calculer la moyenne du nombre de plants initial, sa variance, son écart type, ainsi que les valeurs minimum et maximum. 3. Calculer le pourcentage de plantes ayant survécu, pour chaque expérimentation, et l ajouter dans une nouvelle colonne du tableau. 4. Combien d expérimentations ont donné lieu à moins de 5% de plants survivants? 5. Le témoin correspond à l absence d herbicide. Extraire les lignes du tableau qui correspondent au témoin et les mettre dans une nouvelle variable que l on appellera «temoin». 6. Calculer la moyenne et l écart type du pourcentage de plants ayant survécus, sur le témoin (Astuce : pensez à «attacher» le tableau témoin avecattach()!). 7. De la même manière, calculer la moyenne et l écart type du pourcentage de plants ayant survécus pour chacun des trois herbicides. Quel herbicide vous semble le plus efficace globalement? 8. Quelle plante est celle qui a le mieux résisté aux herbicides, dans l ensemble? 9. Quels sont les variables dans cette étude? De quel type sont-elles? 10. Tracer un diagramme de dispersion représentant le taux de plantes survivantes. 11. Tracer un histogramme représentant le taux de plantes survivantes. Quel graphique vous semble le plus lisible : le diagramme de dispersion ou l histogramme? 12. Tracer un camembert représentant la proportion des différentes plantes dans l étude. 13. Tracer un graphique représentant le taux de survivants en fonction de l espèce de plante. Dans l ensemble, quelle espèce résiste le mieux aux trois herbicides? 14. Tracer un graphique représentant le taux de survivants en fonction de l herbicide. Dans l ensemble, quel herbicide semble le plus efficace? 15. Pour tracer un graphique représentant le taux de survivants en fonction de l herbicide et de l espèce de plante, on entre les commandes suivantes : > require(lattice) > levelplot(survivants plante herbicide) Commenter l efficacité de chaque herbicide sur chaque type de plante. 16. En vous aidant du graphique précédent, répondre aux questions suivantes : (a) Quel herbicide est le plus approprié pour appliquer sur une route, où l on souhaite qu aucune plante ne pousse? (b) Quel herbicide est le plus approprié pour appliquer sur un champ de blé, où l on souhaite que le blé pousse, mais pas le chiendent ni le liseron? 12.2 Poulpes On s intéresse aux poids de poulpes femelles au stade adulte. Nous disposons pour cela d un échantillon de données de 240 poulpes femelles pêchées au large des côtes mauritaniennes. 1. Importer les données (le fichier est poulpef.csv et le séparateur est la virgule) 2. Donner un résumé. 3. Construire un histogramme.