Pratique des tests en A.P.A.

Documents pareils
distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

Un exemple de régression logistique sous

Densité de population et ingestion de nourriture chez un insecte vecteur de la maladie de Chagas

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Introduction à la statistique non paramétrique

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année

Lire ; Compter ; Tester... avec R

Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Analyse de la variance Comparaison de plusieurs moyennes

Exercices M1 SES Ana Fermin ( fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

RAPPELS SUR LES METHODES HERITEES DE LA CLASSE RACINE Object ET LEUR SPECIALISATION (i.e. REDEFINITION)

Introduction aux Statistiques et à l utilisation du logiciel R

Une introduction. Lionel RIOU FRANÇA. Septembre 2008

Algorithmique I. Algorithmique I p.1/??

Examen de Logiciels Statistiques

La valeur présente (ou actuelle) d une annuité, si elle est constante, est donc aussi calculable par cette fonction : VA = A [(1-1/(1+k) T )/k]

Docteur José LABARERE

Probabilités sur un univers fini

MODELE A CORRECTION D ERREUR ET APPLICATIONS

Auto-Entreprise : Activités : Eric SOTY - Siret n Formation Bureautique, continue d'adultes. Tél : Fax :

INVESTISSEMENTS D AVENIR

Calcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes.

Didacticiel - Études de cas. Description de quelques fonctions du logiciel PSPP, comparaison des résultats avec ceux de Tanagra, R et OpenStat.

Déroulement. Evaluation. Préambule. Définition. Définition. Algorithmes et structures de données 28/09/2009

FIMA, 7 juillet 2005

DANS QUELLE MESURE LA CROISSANCE ECONOMIQUE PERMET-ELLE LE DEVELOPPEMENT?

LES FACTEURS DE RISQUE

PROGRAMME (Susceptible de modifications)

Épreuve collaborative

Fiche TD avec le logiciel. Courbes de niveau. D. Chessel

TP de Statistiques: Utilisation du logiciel R

Fonctions homographiques

Introduction. Nicolas Phalippon IR3. Source: rapport commandé par le Congrès américain. Présentation du 24/10/02

Génie Logiciel avec Ada. 4 février 2013

Intégration et probabilités TD1 Espaces mesurés Corrigé

Recherche dans un tableau

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

MIS 102 Initiation à l Informatique

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

OBESITE ET EPS. Cf national, nutrition santé, courbe de corpulence)

Appel d offre Introduction

Cancer bronchique primitif: données épidémiologiques récentes

THEME 2 : CORPS HUMAIN ET SANTE : L EXERCICE PHYSIQUE

ntred 2007 Résultats de l étude Description des personnes diabétiques

da Vinci Pontage gastrique

IFT3902 : (Gestion de projet pour le) développement, (et la) maintenance des logiciels

Solution A La Gestion Des Objets Java Pour Des Systèmes Embarqués

Auto-évaluation Programmation en Java

Théorie et Codage de l Information (IF01) exercices Paul Honeine Université de technologie de Troyes France

Initiation à l analyse en composantes principales

FOIRE AUX QUESTIONS. Le Conseil Général de l Oise précise qu à ce jour, aucune donnée chiffrée n est disponible pour répondre à cette question.

DÉRIVÉES. I Nombre dérivé - Tangente. Exercice 01 (voir réponses et correction) ( voir animation )

Ma conciliation bancaire ne balance pas

TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options

Arbres binaires de recherche

M2-Images. Rendu Temps Réel - OpenGL 4 et compute shaders. J.C. Iehl. December 18, 2013

TD 11. Les trois montages fondamentaux E.C, B.C, C.C ; comparaisons et propriétés. Association d étages. *** :exercice traité en classe.

L obésité et le diabète de type 2 en France : un défi pour la prochaine décennie. DANIEL RIGAUD CHU de Dijon

Corrigés des premiers exercices sur les classes

Chap 2 : Noyaux, masse, énergie.

Étalonnage Consolidation au Québec

Chapitre 4 : Édition de fichiers texte - Vi

Probabilités III Introduction à l évaluation d options

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

Consignes pour les travaux d actualité Premier quadrimestre

Cohorte Observatoire Musculosquelettique (COMETT) Pénibilité et Vieillissement

Evaluation générale de la qualité des données par âge et sexe

APPROUVE l acte constitutif du groupement de commandes pour l achat d électricité coordonné par le Syndicat d Energie des Yvelines.

Utilisation du Logiciel de statistique SPSS 8.0

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

REPOUSSER LES LIMITES DE LA CHIRURGIE BARIATRIQUE DANS LES OBESITES MASSIVES AVEC COMORBIDITES

Étude des flux d individus et des modalités de recrutement chez Formica rufa

WEB et Industries de Santé Industrie Pharmaceutique, Dispositifs Médicaux, Imagerie, Diagnostic in vitro et Matériel Médical

données en connaissance et en actions?

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

Table des matières. Relation entre le syndrome d'apnées du sommeil et les maladies. But de l'étude, hypothèses de recherche et objectifs 46

Le coût social du jeu excessif

as Architecture des Systèmes d Information

Exemple PLS avec SAS

Limites finies en un point

Réseau de Santé du Pays des Vals de Saintonge Pôle de santé du Canton d Aulnay de Saintonge MSP Aulnay et Néré PROJET D AULNAY PSP

I3, Probabilités 2014 Travaux Dirigés F BM F BM F BM F BM F B M F B M F B M F B M

Si la source se rapproche alors v<0 Donc λ- λo <0. La longueur d onde perçue est donc plus petite que si la source était immobile

Analyse de données linguistiques

CHAPITRE 2 : Structure électronique des molécules

Stock-options comparaison et questions pratiques

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Enquête auprès des parents

LE PSORIASIS ET SES CO-MORBIDITES PARTICULIEREMENT LE DIABETE

2 e partie de la composante majeure (8 points) Les questions prennent appui sur six documents A, B, C, D, E, F (voir pages suivantes).

SOLUTION DE GESTION COMMERCIALE POUR IMPRIMEURS

MEMOIRE DE SPÉCIALISATION

Théorie des sondages : cours 5

Transcription:

Fiche TD avec le logiciel : tdr211 Pratique des tests en A.P.A. A.B. Dufour & T. Jombart La fiche contient quelques exercices portant sur les tests clasiques de comparaison d une valeur observée à une valeur théorique ; de deux valeurs observées. Table des matières 1 Latéralisation et sport d opposition 2 2 Etudiants du campus de la Doua et groupes sanguins 2 3 Rugby et recettes 2 4 Indice de Quételet et Syndrôme de Turner [1] 4 5 Tabac et Cancer 5 6 Lecture et Apprentissage 6 7 Retard de croissance et Indice de Quételet 6 8 Dépense énergétique et poids 7 Références 7 1

1 Latéralisation et sport d opposition Les études statistiques portant sur la latéralisation permettent d estimer à environ 10% de la population la proportion d individus qui, dans nos sociétés, utilisent préférentiellement leur main gauche dans les tâches motrices et dans l écriture en particulier. Parmi les meilleurs tennismen et escrimeurs mondiaux, on a dénombré 18 gauchers sur 64. Peut-on admettre que les gauchers sont plus nombreux dans ces sports d opposition que dans la population totale? z = f p 0 ( p 0(1 p 0) n z <- (((18/64) - 0.1)/sqrt(0.1 * 0.9/64))^2 z [1] 23.36111 2 * (1 - pnorm(z)) [1] 0 Il existe une procédure dans proportion théorique. pour comparer une proportion observée à une prop.test(18, 64, 0.1, correct = F, alternative = "two.sided") 1-sample proportions test without continuity correction data: 18 out of 64, null probability 0.1 X-squared = 23.3611, df = 1, p-value = 1.343e-06 alternative hypothesis: true p is not equal to 0.1 0.1859337 0.4013393 p 0.28125 La fonction donne la proportion observée dans l échantillon (sample estimates). 18/64 [1] 0.28125 2 Etudiants du campus de la Doua et groupes sanguins Les centres de transfusion sanguine ont diffusé le tableau des répartitions, en France, des principaux groupes sanguins. La proportion de O et O + est de 0.44. Une collecte de sang est organisée sur le campus de la Doua. Sur 356 étudiants, 148 sont de type O. Quelle conclusion pouvez-vous tirer de cette étude? 3 Rugby et recettes Le journal l équipe donne les recettes (en francs) de 14 matches de rugby joués au cours de la journée du 13 janvier 1991 : Logiciel R version 2.7.2 (2008-08-25) tdr211.rnw Page 2/7 Compilé le 2008-10-24

22550 22180 25000 38580 41860 39800 178525 31670 75785 17680 62595 23825 40550 144000 recette <- c(22550, 22180, 25000, 38580, 41860, 39800, 178525, 31670, 75785, 17680, 62595, 23825, 40550, 144000) 1) Calculer la moyenne, la variance et l écart-type des recettes de la journée du 13 janvier. 2) En 1990, la recette moyenne d un match a été de 65 000 F. Peut-on considérer que la recette de cette journée du 13 janvier 1991 est comparable à la recette moyenne de l année précédente? mean(recette) [1] 54614.29 var(recette) [1] 2345251411 sd(recette) [1] 48427.8 t = x µ 0 cσ 2 n vt <- (mean(recette) - 65000)/sqrt(var(recette)/length(recette)) vt [1] -0.8024273 2 * pt(vt, length(recette) - 1) [1] 0.4367301 Il existe une procédure dans proportion théorique. t.test(recette, mu = 65000) One Sample t-test data: recette t = -0.8024, df = 13, p-value = 0.4367 alternative hypothesis: true mean is not equal to 65000 26652.91 82575.66 mean of x 54614.29 pour comparer une proportion observée à une N oubliez pas que les graphiques contribuent toujours à bien comprendre les données. dotchart(recette) abline(v = mean(recette), lty = 2) abline(v = 65000, lwd = 2) Logiciel R version 2.7.2 (2008-08-25) tdr211.rnw Page 3/7 Compilé le 2008-10-24

50000 100000 150000 4 Indice de Quételet et Syndrôme de Turner [1] On a mesuré l indice de Quételet chez 13 jeunes filles âgées de 14 ans, atteintes du syndrôme de Turner. On a : quetelet <- c(16.67, 18.32, 18.15, 18.65, 19.1, 18.38, 20.21, 17.72, 16.31, 19.05, 16.57, 15.33, 18.47) 1) Calculer la moyenne, la variance et l écart-type. 2) Sachant que l indice moyen de référence pour des jeunes filles du même âge est de 19.39, peut-on conclure que l indice de Quételet moyen de l échantillon est identique à l indice moyen de référence? 3) Quelle conclusion en tirez-vous? 16 17 18 19 20 Logiciel R version 2.7.2 (2008-08-25) tdr211.rnw Page 4/7 Compilé le 2008-10-24

5 Tabac et Cancer On a suivi, sur une période de 20 ans, deux cohortes : 200 sujets fumeurs et 200 sujets non fumeurs. On a noté le nombre d apparition de cancer dans chacune des cohortes : 40 chez les fumeurs ; 20 chez les non fumeurs. La différence d apparition de cancer dans les deux cohortes est-elle significative? tabac <- matrix(c(40, 160, 20, 180), 2) colnames(tabac) = c("coh1", "coh2") rownames(tabac) = c("fumeur", "non_fumeur") tabac coh1 coh2 fumeur 40 20 non_fumeur 160 180 f 1 f 2 z = ( ) 1 ˆpˆq n 1 + 1 n 2 avec ˆp = k1+k2 n 1+n 2 et ˆq = 1 ˆp. f1 <- 40/200 f1 [1] 0.2 f2 <- 20/200 f2 [1] 0.1 pest <- (40 + 20)/(200 + 200) pest [1] 0.15 z <- (f1 - f2)/sqrt(pest * (1 - pest) * ((1/200) + (1/200))) z [1] 2.80056 2 * (1 - pnorm(z)) [1] 0.0051014 La procédure dans pour comparer deux proportions observées est : prop.test(c(40, 20), c(200, 200), correct = F) 2-sample test for equality of proportions without continuity correction data: c(40, 20) out of c(200, 200) X-squared = 7.8431, df = 1, p-value = 0.005101 alternative hypothesis: two.sided 0.03070481 0.16929519 prop 1 prop 2 0.2 0.1 Le lien entre les deux est donné par z 2 = χ 2. z^2 [1] 7.843137 Logiciel R version 2.7.2 (2008-08-25) tdr211.rnw Page 5/7 Compilé le 2008-10-24

6 Lecture et Apprentissage Deux institutrices spécialisées désirent comparer deux méthodes d apprentissage de lecture différentes M1 et M2. Elles choisissent chacune une méthode qu elles appliquent dans leurs classes respectives. Pour la méthode M1, sur 25 enfants, l institutrice compte 60 % d enfants ayant bien appris à lire ; pour la méthode M2, sur 20 enfants, on en a compté 50%. Que peut-on conclure sur l efficacité de ces deux méthodes? 7 Retard de croissance et Indice de Quételet Précédemment, nous avons comparé la moyenne de l indice de Quételet chez 13 jeunes filles atteintes du syndrôme de Turner. turner <- quetelet Nous possédons également l indice de Quételet chez 8 jeunes filles atteintes d un déficit en hormone de croissance. deficit <- c(16.79, 19.22, 23, 20.52, 16.06, 20, 16.61, 17.81) deficit [1] 16.79 19.22 23.00 20.52 16.06 20.00 16.61 17.81 Existe-t-il une différence, en moyenne, de l indice de Quételet entre ces deux pathologies de croissance? avec t = x 1 x 2 ( ) ˆσ 2 1 n 1 + 1 n 2 σ 2 = (n 1 1) σ 2 1 + (n 2 1) σ 2 2 n 1 + n 2 2 valt <- (mean(turner) - mean(deficit))/sqrt((12 * var(turner) + 7 * var(deficit))/(13 + 8-2) * (1/13 + 1/8)) valt [1] -1.031742 2 * pt(valt, 13 + 8-2) [1] 0.3151481 t.test(turner, deficit, var.eq = T) Two Sample t-test data: turner and deficit t = -1.0317, df = 19, p-value = 0.3151 alternative hypothesis: true difference in means is not equal to 0-2.524538 0.857423 mean of x mean of y 17.91769 18.75125 σ Le dernier argument porte sur l égalité des variances F = c 1 2. cσ 2 2 Logiciel R version 2.7.2 (2008-08-25) tdr211.rnw Page 6/7 Compilé le 2008-10-24

var.test(turner, deficit) F test to compare two variances data: turner and deficit F = 0.3232, num df = 12, denom df = 7, p-value = 0.08294 alternative hypothesis: true ratio of variances is not equal to 1 0.06927673 1.16574614 ratio of variances 0.3232334 8 Dépense énergétique et poids Les données proviennent du package ISwR et contiennent les dépenses énergétiques sur une période de 24 heures (en MJ) en fonction du statut pondéral obèse (obese) ou mince (lean) de 22 femmes. Peut-on mettre en évidence une différence de dépense énergétique selon le statut pondéral? depenergie <- c(9.21, 7.53, 7.48, 8.08, 8.09, 10.15, 8.4, 10.88, 6.13, 7.9, 11.51, 12.79, 7.05, 11.85, 9.97, 7.48, 8.79, 9.69, 9.68, 7.58, 9.19, 8.11) statpond <- c("obese", "lean", "lean", "lean", "lean", "lean", "lean", "lean", "lean", "lean", "obese", "obese", "lean", "obese", "obese", "lean", "obese", "obese", "obese", "lean", "obese", "lean") statpond <- factor(statpond) Références [1] A.B. Dufour, M. Pagès, and M. Sempé. L analyse de la variance utilisée pour étudier l évolution de l indice de corpulence avec l âge selon les différentes pathologies de croissance. Cahiers d Anthropologie et Biométrie Humaine, 14(1-2) :79 89, 1996. Logiciel R version 2.7.2 (2008-08-25) tdr211.rnw Page 7/7 Compilé le 2008-10-24