Master Biologie Intégrative Biostatistiques avancées. Travaux Dirigés n o 1



Documents pareils
Introduction aux Statistiques et à l utilisation du logiciel R

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

FAQ Conditions de candidature... 2 Procédure de candidature et remise de prix... 2 Le dossier de candidature... 3

CAPTEURS - CHAINES DE MESURES

Aide-mémoire de statistique appliquée à la biologie

Introduction à la statistique non paramétrique

L ANALYSE COUT-EFFICACITE

Lire ; Compter ; Tester... avec R

Création d entreprise «Survey_Economy»

Evaluation de la variabilité d'un système de mesure

CREER UNE ENTREPRISE A JERSEY

VI. Tests non paramétriques sur un échantillon

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année

Exercices M1 SES Ana Fermin ( fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

Exemples d utilisation de G2D à l oral de Centrale

PROGRAMME (Susceptible de modifications)

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

Jean-Pierre Lovinfosse. En finir. avec les virus. Groupe Eyrolles,2004 ISBN

Notre planète mobile : Canada

LES GENERATEURS DE NOMBRES ALEATOIRES

Document d orientation sur les allégations issues d essais de non-infériorité

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

MATHÉMATIQUES APPLIQUÉES S4 Exercices

Comparer l intérêt simple et l intérêt composé

Optimisation Combinatoire (Méthodes approchées) II. Recherche Locale simple (Les bases)

ASR1 TD7 : Un microprocesseur RISC 16 bits

Annexe commune aux séries ES, L et S : boîtes et quantiles

Principes de mathématiques 12 SÉRIE DE PROBLÈMES. Septembre Student Assessment and Program Evaluation Branch

Probabilités (méthodes et objectifs)

LIVRET DE SUIVI DE STAGE

Organiser des séquences pédagogiques différenciées. Exemples produits en stage Besançon, Juillet 2002.

MASTER SIS PRO : logique et sécurité DÉTECTION D INTRUSIONS. Odile PAPINI, LSIS. Université de Toulon et du Var. papini@univ-tln.

Estimation et tests statistiques, TD 5. Solutions

PRENOM NOM DE L ENTREPRISE DATE DU STAGE METIER

RapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/ Présentation. 1.2 Ressources

La méthode de régression par discontinuité et l évaluation des politiques de l emploi

VI- Exemples de fiches pédagogiques en 3 ème année primaires

Identifier et comprendre vos clients

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Biostatistiques : Petits effectifs

INDEX Fonctionnement Schéma de câblage... 24

Une introduction. Lionel RIOU FRANÇA. Septembre 2008

ACT3284 Modèles en assurance IARD Examen Final - 14 décembre 2011

Première installation : comment réussir en temps de crise?

- Ressources pour les classes

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options

Évaluations aléatoires : Comment tirer au sort?

Pourquoi l apprentissage?

DÉRIVÉES. I Nombre dérivé - Tangente. Exercice 01 (voir réponses et correction) ( voir animation )

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux

TSTI 2D CH X : Exemples de lois à densité 1

Modèle de calcul des paramètres économiques

Date : Tangram en carré page

Créer votre propre modèle

Activité 4. Tour de cartes Détection et correction des erreurs. Résumé. Liens pédagogiques. Compétences. Âge. Matériels

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Mathématiques 6 ème Grade Unité 1 (exemple)

Formulaire d'évaluation du séjour hors Québec

PROBLEME(12) Première partie : Peinture des murs et du plafond.

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

Nom Prénom :... Mon livret de stage

Développer, factoriser pour résoudre

- Le Diagramme de Gantt. - Le Diagramme de Pert - La Méthode QQCQCCP - La Méthode MOSI - Cahier des charges fonctionnel

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

A. Protocole de recherche (ainsi que l abrégé en langue française)

Solution logicielle pour le pilotage et l ERM. Journées d études IARD 26 mars mars 2010

Logiciel XLSTAT version rue Damrémont PARIS

Avec le pare-feu Windows Vista, vous protégez votre ordinateur contre les attaques provenant d'internet.

La Transparence des Coûts en Microfinance Mise en oeuvre de la Transparence en Afrique de L Ouest

Questionnaire à destination des élèves 4 e -2 de à remplir avant ou après la visite aux Archives

CHAPITRE 3. Application à la Mutualisation des Risques & à la Demande d Assurance

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

Evaluation générale de la qualité des données par âge et sexe

Optimiser ses graphiques avec R

SONDAGES RELATIFS AUX SERVICES D INFORMATION ET DE RÉFÉRENCE OFFERTS PAR LA DIRECTION GÉNÉRALE DE LA DIFFUSION DE BANQ

Exo7. Calculs de déterminants. Fiche corrigée par Arnaud Bodin. Exercice 1 Calculer les déterminants des matrices suivantes : Exercice 2.

modélisation solide et dessin technique

Responsabilité en matière de santé et d'environnement

Description du procédé de remplacement des appareils. Description du procédé de remplacement des appareils. 1) Choix de l appareil de remplacement B

Les probabilités. Chapitre 18. Tester ses connaissances

Guide de configuration de SQL Server pour BusinessObjects Planning

LES NOMBRES DECIMAUX. I. Les programmes

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

Options et Swap sur intérêt

Régression linéaire. Nicolas Turenne INRA

Plan de notre intervention 1. Pourquoi le test de charge? 2. Les différents types de tests de charge 1.1. Le test de performance 1.2.

Présentation des Services Storissime aux Utilisateurs

PRÉPARATION AU TEST! CULTURE INTERNATIONAL CLUB

STRICTEMENT CONFIDENTIEL

Logiciel EV3 LEGO MINDSTORMS Education

12. Le système monétaire

BACCALAUREAT GENERAL MATHÉMATIQUES

Principe d un test statistique

Transcription:

Master Biologie Intégrative 2016-2017 Biostatistiques avancées Responsable du cours : Yves Desdevises Travaux Dirigés n o 1 Corrigé Exercice 1 Dans une ferme aquacole, on veut étudier l'effet d'un nouveau type de nourriture sur la croissance d'ombles de fontaine (Salvelinus fontinalis) et savoir s'il est plus performant que la nourriture habituellement utilisée. Il faut pour cela élaborer un plan d expérience. On dispose de 16 bassins (chaque bassin peut recevoir un type de nourriture) et de 112 poissons. Ces poissons sont élevés depuis plusieurs générations dans la ferme, en milieu fermé et en conditions contrôlées (aquaculture intensive). On mesure la longueur moyenne des poissons dans chaque bassin, au début de l'expérience et après 3 mois. 1. Quelle est la variable? Posez les hypothèses nulles et contraires. Le test est-il uni ou bilatéral? Justifiez votre réponse. La variable est la longueur mesurée après 3 mois moins la longueur initiale (croissance). H 0 : le nouveau type de nourriture n'influence pas la croissance des poissons H 1 : le nouveau type de nourriture améliore la croissance des poissons Le test est unilatéral car on pense que le nouveau type de nourriture améliore la croissance des poissons. 2. Quelle est l'unité d'expérimentation? Le bassin. 3. Identifiez l'élément d'observation. L'élément d'observation est le poisson. 4. Identifiez le facteur et ses niveaux. Il y a un facteur, la nourriture (ou l alimentation), à deux niveaux: nourriture habituelle et nouvelle nourriture. 1

5. Que pensez-vous de simplement prendre 2 bassins avec 56 poissons dans chaque bassin, et un type de nourriture par bassin? Expliquez brièvement les avantages et les inconvénients de ce plan d'expérience (5 lignes maximum). Inconvénients: Ce plan d'expérience ne comporte que deux unités d'expérimentations, donc on compare deux points. Il n'y a pas de répétitions. Ça ne permet pas de contrôler la variation intrinsèque du système. Avantages: c'est moins casse-tête!! [Attention : ce n'est pas un problème de pseudoréplication] 6. On choisi un plan d'expérience de randomisation par blocs, avec 4 blocs. Qu est-ce que cela signifie et quel est l'intérêt de ce plan d'expérience? 4 groupes définis a priori (différents critères possibles), avec 4 bassins par groupes, dont 2 sont sélectionnés aléatoirement pour recevoir chaque traitement. Ce plan permet une bonne répartition (et la répétition) des unités d'expérimentation dans l'aire d'étude (par exemple), et favorise une allocation optimale des niveaux de traitement. 7. Combien y a-t-il de répétitions par niveau dans le plan ci-dessus? Il y a huit répétitions. Exercice 2 La tableau ci-dessous présente 3 échantillons tirés aléatoirement de la même population (la distribution de la variable montrée est normale). Pour chaque échantillon, calculer la moyenne, l écart-type, l erreur-type, et représentez ces paramètres graphiquement par l intermédiaire de points et de barres d erreurs. 2

n = 4 n = 12 n = 20 80 80 80 92 85 86 105 84 111 120 100 110 118 120 120 89 80 113 90 120 95 80 109 80 116 110 120 120 90 90 80 120 114 87 80 120 1. Quel est l effet de la taille n de l échantillon sur les paramètres calculés? ech1=c(80,92,105,120) ech2=c(80,85,84,100,118,120,80,90,95,109,116,120) ech3=c(80,86,111,110,120,89,113,120,80,80,110,120,90,90,80,120,11 4,87,80,120) length(ech1);length(ech2);length(ech3) mean(ech1);mean(ech2);mean(ech3) sd(ech1);sd(ech2);sd(ech3) sd(ech1)/sqrt(length(ech1));sd(ech2)/sqrt(length(ech2));sd(ech3)/ sqrt(length(ech3)) On trouve : n = 4 n = 12 n = 20 Moyenne 99,25 99,75 100 Ecart-type 17,193 16,142 16,815 Erreur-type 8,596 4,660 3,760 La moyenne et la dispersion (écart-type) autour sont similaires dans les trois cas, mais l erreurtype diminue avec la taille de l échantillon 3

2. Quelles conséquences la taille d échantillon a-t-elle sur la qualité de l estimation des paramètres? La précision de l estimation (reflétée par l erreur-type, qui prend en compte n) augmente avec la taille de l échantillon. Les paramètres sont donc mieux estimés, et l inférence statistique (e.g. comparaisons) sera plus précise avec de plus grands échantillons. Exercice 3 Le nématode Haemonchus contortus est un parasite interne des ruminants. Le tableau suivant présente la quantité de parasites par hôte, pour 31 moutons : Hôte Nombre de parasites Hôte Nombre de parasites Hôte Nombre de parasites 1 0 12 7 23 2 2 10 13 11 24 8 3 14 14 3 25 4 4 17 15 7 26 3 5 7 16 12 27 3 6 27 17 1 28 1 7 2 18 6 29 14 8 8 19 4 30 0 9 3 20 6 31 5 10 16 21 3 11 3 22 8 1. Tracez la boîte à moustaches (boxplot) de cet échantillon. Ab=c(0,10,14,17,7,27,2,8,3,16,3,7,11,3,7,12,1,6,4,6,3,8,2,8,4,3,3,1,14,0,5) boxplot(ab) 0 5 10 15 20 25 4

2. Tracer l'histogramme représentant le nombre d'hôtes en fonction de la quantité de parasites par hôte à l aide la commande. A la vue de cet histogramme, pensez-vous qu'il soit possible d'effectuer des tests paramétriques en utilisant ces données? Justifiez votre réponse. hist(ab) Intervalle de classe : 27/6 = 4,5 6 classes : 0-4,5; 4,5-9; 9-13,5; 13,5-18; 18-22,5; 22,5-27 Nombre d'observations par classe : Classe 1: 14 Classe 2: 9 Classe 3: 3 Classe 4: 4 Classe 5: 0 Classe 6: 1 Histogram of Ab Frequency 0 5 10 15 0 5 10 15 20 25 30 Ab À l'évidence, cette distribution ne correspond pas à une distribution Normale. Elle est très asymétrique. Il n'est pas possible d'utiliser ces données telles quelles pour des tests paramétriques. 3. À partir de la distribution observée, de quelle façon peut-on décrire la répartition de Haemonchus contortus chez les moutons? Cette distribution correspond à une distribution agrégée ou contagieuse. 5

Cela signifie que peu d'hôtes contiennent une grande quantité de parasites, alors que de nombreux hôtes ne sont pas ou peu infectés. Ce type de distribution suggère une transformation en logarithme afin de les rendre plus conformes à une distribution Normale. 4. Transformez les données (à vous de choisir une transformation) et tracez à nouveau un histogramme représentant le nombre d'hôtes parasités en fonction de l'abondance transformée. À l'œil (ne faites ni test ni calcul), les données transformées se prêtent-elles mieux à des tests paramétriques? Vous pouvez essayer diverses transformations. LnAb=log(Ab+1,base=exp(1)) hist(lnab,breaks=c(0,0.555,1.111,1.666,2.221,2.777,3.3325)) Intervalle de classe : 3,332/6 = 0,555 6 classes: 0-0,555; 0,555-1,111; 1,111-1,666; 1,666-2,221; 2,221-2,777; 2,777-3,332 Nombre d'observations par classe : Classe 1: 2 Classe 2: 4 Classe 3: 8 Classe 4: 9 Classe 5: 5 Classe 6: 3 Histogram of LnAb Density 0.0 0.1 0.2 0.3 0.4 0.5 0.0 0.5 1.0 1.5 2.0 2.5 3.0 LnAb Visuellement, les données se distribuent d'une façon plus conforme à une loi Normale, et se prêtent mieux à des tests paramétriques. 5. Réalisez maintenant un graphique quantile-plot (et afin de vérifier les observations précédentes. Interprétez ce résultat. 6

qqnorm(ab) qqline(ab) Normal Q-Q Plot Sample Quantiles 0 5 10 15 20 25-2 -1 0 1 2 qqnorm(lnab) qqline(lnab) Theoretical Quantiles Normal Q-Q Plot Sample Quantiles 0.0 0.5 1.0 1.5 2.0 2.5 3.0-2 -1 0 1 2 Theoretical Quantiles Vérification : shapiro.test(ab) W = 0.87137, p-value = 0.001497 shapiro.test(lnab) W = 0.9691, p-value = 0.4946 7