R-Commander : Notions du chapitre 3. Estimation et tests d hypothèses : problèmes à un échantillon. 1) Présentation du jeu de données 2

Documents pareils
Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Allegroupe. Système de gestion des paiements préautorisés

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Analyse de la variance Comparaison de plusieurs moyennes

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

TABLE DES MATIERES. C Exercices complémentaires 42

Les tableaux croisés dynamiques

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Étape 1 : Création d une adresse courriel GMAIL

FICHE 17 : CREER UN SITE WEB

1. Aménagements technologiques 2. Installation de Microsoft SQL Server 2012

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux

Unity Real Time 2.0 Service Pack 2 update

Biostatistiques : Petits effectifs

CTIconnect PRO. Guide Rapide

SPHINX Logiciel de dépouillement d enquêtes

La Clé informatique. Formation Internet Explorer Aide-mémoire

Logiciel XLSTAT version rue Damrémont PARIS

Introduction à la Statistique Inférentielle

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

GUIDE POUR RESERVER UN TERRAIN

DE CENTRALISE FACTURE CRE ATION

MANUEL D UTILISATION DES OUTILS «MapCERN»

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

Cours de Tests paramétriques

dmp.gouv.fr Pour en savoir plus DMP Info Service : 24h/24 7j/7

Introduction aux Statistiques et à l utilisation du logiciel R

MODULES 3D TAG CLOUD. Par GENIUS AOM

Principe d un test statistique

Manuel d installation de Business Objects Web Intelligence Rich Client.

Notice d utilisation de la carte interactive de l EQUIRANDO 2015

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

Document d orientation sur les allégations issues d essais de non-infériorité

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

WHS ProRealTime. édition

Guide d'utilisation. Centre des ressources Demande électronique de matériel publicitaire. Juin 2005

Poll-O Guide de l utilisateur. Pierre Cros

Annexe commune aux séries ES, L et S : boîtes et quantiles

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année

LES REGLEMENTS AVEC SOCIEL.NET DERNIERE MISE A JOUR : le 14 juin 2010

AGASC / BUREAU INFORMATION JEUNESSE Saint Laurent du Var - E mail : bij@agasc.fr / Tel : CONSIGNE N 1 :

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Réévaluation des devises

GUIDE D INSTALLATION INTERNET haute vitesse

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

Lire ; Compter ; Tester... avec R

LOGICIEL KIPICAM : Manuel d installation et d utilisation

Probabilités III Introduction à l évaluation d options

Matérialiser les données d une BdD : créer une carte de densité de points par maillage

Guide d installation du logiciel HI Version 2.7. Guide d installation du logiciel HI Version 9.4

Gestion de photos avec Picasa

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Création WEB avec DreamweaverMX

Comment se connecter au VPN ECE sous vista

Achat V9.7 Dématérialisation des Achats et des Marchés Publics

Partager mes photos sur internet

VTX FTP. Transfert de fichiers business par FTP - Manuel de l'utilisateur. Informations complémentaires : info@vtx.

Online Workflow. Approbation factures

GUIDE D UTILISATION LE PRESENT DOCUMENT VISE A FACILITER LA PRISE EN MAIN DE L@GOON CLOUD. * Synchroniser votre entreprise

Manuel d installation Lenovo LJ2050N

Écriture de journal. (Virement de dépense)

Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants)

Au préalable, nous nous plaçons dans l espace au sein duquel nous allons créer notre raccourci vers l ENTG.

Création du projet : 1 sur 13

Smart Pix SOFTWARE. Manuel d utilisation

Gestion électronique des procurations

3. Caractéristiques et fonctions d une v.a.

PROCEDURE D EXPORT-IMPORT DU CERTIFICAT InVS INTERNET EXPLORER

CHECKLIST : OUVERTURE DES OFFRES

Vous pouvez à présent à reconfigurer votre messagerie en cliquant ici.

Aide pour configurer un ordinateur sur le Wi Fi de l'université avec Windows Vista

8. Gestionnaire de budgets

Utilisation de l outil lié à MBKSTR 9

Exporter des écritures. Importer des écritures. Depuis EBP Comptabilité.

But du papier : Paramétrer WSUS pour récupérer les mises à jour et administrer le serveur WSUS

Notice d'utilisation Site Internet administrable à distance

Mode Opératoire Ciel Gestion commerciale V 12 et s (2006)

Asset Management Software Client Module. Manuel d utilisation

I DIFACT. COGESTIB SA I DIFACT (Facturation Diverse) Page 1 / 22

Chapitre 6. Fonction réelle d une variable réelle

La pratique du coaching en France. Baromètre 2010

Ces Lettres d informations sont envoyées aux extranautes inscrits et abonnés sur le site assistance (voir point N 3).

Comment insérer une image de fond?

Service des ressources informatiques - Conseil Scolaire de District Catholique Centre-Sud Page 1

Configuration pour la connexion au réseau eduroam sous l environnement Windows XP (SP3) et Windows 7&8 au personnel de l IN2P3

Webmail Login avec autre Browser qu IE INDEX

Uniformiser la mise en forme du document. Accélère les mises à jour. Permets de générer des tables de matières automatiquement.

Mode d emploi Télésauvegarde de données SecureSafe

Fidélité Type 3 Carte de points et cartes cadeaux avec

Création d'un site dynamique en PHP avec Dreamweaver et MySQL

GUIDE D UTILISATION 1

Manuel SIMBA Courtage Prêt Immobilier (Nouveautés)

Précision d un résultat et calculs d incertitudes

Faire de la déformation interactive avec GIMP

Système de vidéosurveillance pour Pocket PC

FctsAffines.nb 1. Mathématiques, 1-ère année Edition Fonctions affines

Transcription:

R-Commander : Notions du chapitre 3 Estimation et tests d hypothèses : problèmes à un échantillon 1) Présentation du jeu de données ) Estimation et test sur une moyenne μ..3 a) Test bilatéral et intervalle de confiance.3 b) Tests unilatéraux 4 c) Quantiles et probabilités de la loi de Student.5 d) Vérification de la normalité...7 Graphique quantile-quantile Test de Shapiro et Wilk 3) Estimation d une variance σ...8 a) Estimation ponctuelle.8 b) Quantiles de la loi du khi-deux...8 4) Estimation et test sur une proportion p....10 a) Test bilatéral et intervalle de confiance.10 b) Tests unilatéraux...1 c) Quantiles et probabilités de la loi normale...1 1

1) Présentation du jeu de données Considérons le jeu de données Oiseaux.xls utilisé dans les exercices du chapitre 3. Il est constitué de diverses mesures sur un échantillon de 49 oiseaux : - la survie ou non à un traitement - la longueur de l'oiseau - l'étendue des ailes - la longueur de la tête - la longueur de l'humérus - la longueur du sternum. En voici un aperçu. À l aide des statistiques descriptives (voir chapitre 1), on peut calculer la moyenne et l écart type des variables continues : On pourrait éventuellement construire des graphiques pour illustrer la dispersion de chaque variable. Il est important de faire une bonne exploration des données avant de se lancer dans l analyse ou l inférence sur les paramètres.

) Estimation et test sur une moyenne μ Les tests d hypothèses et les intervalles de confiance s obtiennent à partir des mêmes fenêtres de commandes. Dans le cas d une moyenne μ, le seul test disponible est le test utilisant la loi de Student (appelé t-test univarié), pour lequel on suppose que les données sont issues d une loi normale dont on ignore la variance σ (cette dernière est estimée par la variance échantillonnale S ). a) Test bilatéral et intervalle de confiance L intervalle de confiance et le test bilatéral pour l étendue moyenne μ s obtiennent par la même série de commandes. sélectionner la variable d intérêt ; spécifier l hypothèse alternative Moyenne de la population = mu0 (on devrait lire Moyenne de la population mu0 pour bien représenter H 1 ) ; préciser la valeur de μ 0 dans la case Hypothèse nulle (ceci influence le test seulement, et non l intervalle de confiance) ; spécifier la valeur de 1-α désirée dans la case Niveau de confiance (ainsi la valeur du seuil α en sera automatiquement déduite) ; cliquer sur OK. Testons par exemple si l étendue moyenne diffère de 40 mm, au seuil de 1%. 3

Les résultats apparaissent dans la fenêtre de sortie : L intervalle de confiance à 99% est [39.38 ; 43,7]. Pour réaliser le test bilatéral, la valeur observée de la statistique T obs doit être positionnée par rapport à la loi de Student à 48 degrés de liberté. x μ0 41.365 40 T obs = = = 1.833 s / n 5.0678 / 49 Puisque le test est bilatéral et que T obs est positif, le p-value a été obtenu en calculant la quantité suivante : P( t > T ) = P( t > 1.833) = 0.03656 0.0731 n 1 obs 48 =. L hypothèse H 0 : μ = 40 n est pas rejetée au seuil de α = 0.01, car le p-value est supérieur à 0.01. (H 0 ne serait pas rejetée à 5% non plus, mais serait rejetée à 10%.) b) Tests unilatéraux Les commandes à entrer sont presque les mêmes que pour les tests bilatéraux, à l exception de l hypothèse alternative, qui doit cette fois être spécifiée selon le test : Moyenne de la population < mu0 pour un test unilatéral à gauche (H 1 : μ < μ 0 ) Moyenne de la population > mu0 pour un test unilatéral à droite (H 1 : μ > μ 0 ) On montre ci-dessous un exemple pour tester si l étendue moyenne est supérieure à 40, au seuil de 1%. (H 0 : μ=40 versus H 1 : μ > 40, avec α = 0.01). Remarquons que le seuil observé est la moitié du seuil pour le test bilatéral : P( t 48 > 1.833). Notons que l intervalle de confiance calculé ici n est pas l intervalle dont nous avons discuté. Nous n en tiendrons pas compte. 4

c) Quantiles et probabilités de la loi de Student On peut aussi calculer séparément les quantités formant l intervalle de confiance : s x ± tn 1, α / n La moyenne, l écart-type et la taille d échantillon s obtiennent en calculant les statistiques descriptives. Il ne manque que le quantile d ordre 1-α/ de la loi de Student à n-1 degrés de liberté, t n-1,α/. On montre ci-dessous que, pour l intervalle de confiance à 99%, t 48, 0.005 =.68. 5

De même, on peut calculer la probabilité associée au p-value d un test, une fois que la statistique T obs est calculée. Voici comment obtenir P( t 48 > 1.833) (le p- value est le double de cette probabilité pour le test bilatéral). 6

d) Vérification de la normalité Le test de Student a comme postulat la normalité des observations. Pour s assurer de la validité des conclusions, il est bon de vérifier si nos données sont normales. Nous avons vu 3 techniques pour poser un diagnostic : l histogramme, le graphique quantile-quantile et le test de Shapiro et Wilk. Graphique quantile-quantile Un tel graphique peut servir à vérifier l adéquation des données à n importe quel modèle statistique. Celui qui nous intéresse est la loi normale. Il suffit donc de cocher la distribution normale et de juger si le graphique forme bien une droite ou non. 7

Test de Shapiro et Wilk On effectue le test par la série de commandes Statistiques Résumés Test de normalité Shapiro-Wilk. On rejettera la normalité des données si le p-value est inférieur au seuil α que l on se fixe pour ce test (qui peut être différent du α choisi pour le test de Student). Ici, on accepterait le modèle normal pour nos données pour tous les choix raisonnables de α. 3) Estimation d une variance σ L intervalle de confiance et les tests sur une variance ne sont pas disponibles dans R- Commander. Il faut donc calculer les quantités séparément. a) Estimation ponctuelle La variance de la population, σ, est estimée par la variance échantillonnale S. On obtient cette valeur via les statistiques descriptives. Dans le cas de la variable Étendue, l écart-type s = 5.0678, donc l estimation de la variance est s = 5.683. b) Quantiles de la loi du khi-deux L intervalle de confiance pour σ de niveau 1- α contient les quantiles d ordre α/ et 1-α / de la loi du khi-deux à n-1 degrés de liberté. ( n 1) S χ n 1, α /, ( n 1) S χ n 1,1 α / 8

On montre ci-dessous comment obtenir ces quantiles pour n=49 et α = 0.05 : On a calculé : χ n α = χ 30.75 et χn α = χ 69. 0 1,1 / 48, 0.975 = 1, / 48,0.05 = L intervalle de confiance à 95% serait alors : ( n 1) S χ n 1, α /, ( n 1) S χ n 1,1 α / = 48 5.683 48 5.683, 69.0 30.75 = [ 17.86, 40.09] 9

4) Estimation et test sur une proportion p Les tests d hypothèses et les intervalles de confiance s obtiennent à partir des mêmes fenêtres de commandes. Dans le cas d une proportion, le test dont nous avons discuté est le test approximatif utilisant le théorème limite central, donc valide pour les grandes tailles d échantillon. a) Test bilatéral et intervalle de confiance On s intéresse à la proportion de décès après un traitement dans la population : p. sélectionner la variable binaire d intérêt (SURVIE) ; spécifier l hypothèse alternative Proportion de la population = p0 (on devrait lire Proportion de la population p0 pour bien représenter H 1 ); préciser la valeur de p 0 dans la case Hypothèse nulle (ceci influence le test seulement, et non sur l intervalle de confiance) ; spécifier la valeur de 1-α désirée dans la case Niveau de confiance (ainsi la valeur du seuil α sera automatiquement déduite) ; préciser que l on souhaite le test avec approximation normale ; cliquer sur OK. 10

Les résultats apparaissent dans la fenêtre de sortie : On précise d abord le nombre de oui et de non dans l échantillon. La proportion échantillonnale de non (i.e. de décès) est pˆ = 8 / 49 = 0.5714. L intervalle de confiance à 95% (en jaune) est [0.433 ; 0.700]. Pour le test bilatéral (en vert), la valeur observée de la statistique Z obs est présentée au carré, identifiée X-squared en référence à la loi du khi-deux. Z obs = ( = 0. = χobs ) pˆ p0 0.5714 0.6 = = 0.408 1667 p0(1 p0 ) 0.6(1 0.6) n 49 Puisque le test est bilatéral et que Z obs est négatif, le p-value a été obtenu en calculant la quantité suivante : P( Z < Zobs ) = P( Z < 0.408) = 0.3415 = 0.683. L hypothèse H 0 : p = 0.6 n est pas rejetée au seuil de α = 0.05, car le p-value est supérieur à 0.05. 11

b) Tests unilatéraux Les commandes à entrer sont presque les mêmes que pour le test bilatéral, à l exception de l hypothèse alternative, qui doit cette fois être spécifiée selon le test : Proportion de la population < p0 pour un test unilatéral à gauche (H 1 : p < p 0 ) Proportion de la population > p0 pour un test unilatéral à droite (H 1 : p > p 0 ) On montre ci-dessous un exemple pour tester si la proportion de décès est inférieure à 0.6, au seuil de 5%. (H 0 : p=0.6 versus H 1 :p < 0.6, avec α = 0.05). Remarquons que le seuil observé est la moitié du seuil pour le test bilatéral : P( Z < 0.408) = 0.3415. Notons que l intervalle de confiance calculé ici n est pas l intervalle dont nous avons discuté. Nous n en tiendrons pas compte. c) Quantiles et probabilités de la loi normale Comme pour les autres tests, les quantités requises pour conduire un test d hypothèses ou pour construire un intervalle de confiance peuvent être calculées séparément. Pour obtenir les quantiles ou les probabilités associées à la loi normale, voir le document sur le chapitre. 1