REVUE DE STATISTIQUE APPLIQUÉE

Documents pareils
Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

FORMULAIRE DE STATISTIQUES

Analyse de la variance Comparaison de plusieurs moyennes

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Introduction à la théorie des files d'attente. Claude Chaudet

Programmation linéaire

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique

MATHÉMATIQUES ET SCIENCES HUMAINES

Suites numériques 3. 1 Convergence et limite d une suite

Principe d un test statistique

Introduction aux Statistiques et à l utilisation du logiciel R

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

TSTI 2D CH X : Exemples de lois à densité 1

Lois de probabilité. Anita Burgun

Exo7. Calculs de déterminants. Fiche corrigée par Arnaud Bodin. Exercice 1 Calculer les déterminants des matrices suivantes : Exercice 2.

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

C. C. F TECHNOLOGIES CATALOGUE. Nos solutions pour le contrôle de la chaîne du froid

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

Limites finies en un point

(51) Int Cl.: H04L 29/06 ( ) G06F 21/55 ( )

Feuille d exercices 2 : Espaces probabilisés

Chapitre 3. Les distributions à deux variables

I - PUISSANCE D UN POINT PAR RAPPORT A UN CERCLE CERCLES ORTHOGONAUX POLES ET POLAIRES

PROBABILITES ET STATISTIQUE I&II

Précision d un résultat et calculs d incertitudes

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

LE RÔLE DE LA STATISTIQUE DANS UN PROCESSUS DE PRISE DE DÉCISION

Pourquoi l apprentissage?

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

1 Définition de la non stationnarité

Stratégie d assurance retraite

< _17_0>

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

L import : Mise à jour rapide de votre catalogue

1. Vocabulaire : Introduction au tableau élémentaire

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

Probabilités III Introduction à l évaluation d options

Présentation du logiciel

DETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES

Fonctions de plusieurs variables

Biostatistiques : Petits effectifs

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Relation entre deux variables : estimation de la corrélation linéaire

L exclusion mutuelle distribuée

6 ème. Rallye mathématique de la Sarthe 2013/ ère épreuve de qualification : Problèmes Jeudi 21 novembre 2013

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #12

EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG

Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants)

TABLE DES MATIERES. C Exercices complémentaires 42

Cours d initiation à la programmation en C++ Johann Cuenin

OutilsMathematiques-L1-2004/2005-D.Brito.&G.Legaut.

Les Différents types de Requêtes dans Access

Econométrie et applications

Parallélisme et Répartition

Lire ; Compter ; Tester... avec R

Statistiques Descriptives à une dimension

Mesures de Risque Multipériodes Cohérentes Appliquées au Compte à Terme

La simplification du dossier de candidature

LES DECIMALES DE π BERNARD EGGER

Examen optimisation Centrale Marseille (2008) et SupGalilee (2008)

rf( 1 f(x)x dx = O. ) U concours externe de recrutement de professeurs agreg6s composition d analyse

Cours de Tests paramétriques

Exercices du Cours de la programmation linéaire donné par le Dr. Ali DERBALA

Exercices Corrigés Premières notions sur les espaces vectoriels

Corrigé des TD 1 à 5

1 Première section: La construction générale

données en connaissance et en actions?

TESTS D'HYPOTHESES Etude d'un exemple

Améliorer la Performance des Fournisseurs

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

Probabilités. Rappel : trois exemples. Exemple 2 : On dispose d un dé truqué. On sait que : p(1) = p(2) =1/6 ; p(3) = 1/3 p(4) = p(5) =1/12

Evaluation de la variabilité d'un système de mesure

MT940-MultiLine. Formats. Version 3.02 du 17/01/2013. Sommaire: Extraits de compte (Formats utilisés) 2

CHARTE ETHIQUE ACHATS

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

Exercice du cours Gestion Financière à Court Terme : «Analyse d un reverse convertible»

NOTICE TELESERVICES : Payer un impôt et gérer les contrat de paiement des impôts professionnels

Bureau : 238 Tel : dominique.muller@upmf-grenoble.fr

Value at Risk. CNAM GFN 206 Gestion d actifs et des risques. Grégory Taillard. 27 février & 13 mars 20061

Efficacité des Modules Maintenance dans les ERP.

Clôture des comptes de la coopérative scolaire OCCE Liste des opérations à effectuer

Bloc 1 U. E. Automobile H/an CR Quadrimestres

Chapitre 2 Les ondes progressives périodiques

Examen de Logiciels Statistiques

RESULTATS D ENQUÊTE: LES SALAIRES DES DIPLÔMÉS DE L EPFL

BAREME sur 40 points. Informatique - session 2 - Master de psychologie 2006/2007

Actuariat I ACT2121. septième séance. Arthur Charpentier. Automne charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free.

Introduction à la Statistique Inférentielle

Calcul élémentaire des probabilités

L outil de réservation en ligne de Carlson Wagonlit Travel dédié aux PME. Guide utilisateur

Aide-mémoire de statistique appliquée à la biologie

Loi binomiale Lois normales

Pilotage de la masse salariale Déploiement de l outil de budgétisation

M2 IAD UE MODE Notes de cours (3)

Transcription:

REVUE DE STATISTIQUE APPLIQUÉE DARMOIS Comparaison des moyennes de deux populations normales d écarts-types inconnus et différents. Test de Darmois Revue de statistique appliquée, tome 2, n o 3 (1954), p. 37-41 <http://www.numdam.org/item?id=rsa_1954 2_3_37_0> Société française de statistique, 1954, tous droits réservés. L accès aux archives de la revue «Revue de statistique appliquée» (http://www. sfds.asso.fr/publicat/rsa.htm) implique l accord avec les conditions générales d utilisation (http://www.numdam.org/legal.php). Toute utilisation commerciale ou impression systématique est constitutive d une infraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright. Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques http://www.numdam.org/

COMPARAISON DES MOYENNES DE DEUX POPULATIONS NORMALES D ÉCARTS-TYPES INCONNUS ET DIFFÉRENTS TEST DE DARMOIS 1. - BUT DU TEST. Comparaison de 2 populations normales, P1 de moyenne m1 et d écart-type 0 1 inconnus ; P2 de moyenne m2 et d écart-type 0"2 inconnus. On désire tester (sur échantillons) l hypothèse d égalité des moyennes : (H) : m1 - m 2.. Il. - PRINCIPE DU TEST. Sous des réserves très larges - en ce qui concerne la distribution des populations - on sait que si : x est la moyenne d un échantillon de n1 observations provenant d une population Pl, Y est la moyenne d un échantillon de n2 observations provenant d une population P2 la variable aléatoire d - X 2013y est normalement distribuée autour de m, - m2 avec une variance : Le test d hypothèse m 1 m2se fera donc aisément utilisant en la table de Ici loi normale pour -- la variable t -~.-- ad Si les variances cr, et 0: sont inconnues mais si les échantillons sont importants, il suffira de remplacer lui eto2 par leurs estimations faites à partir des échantillons. Si par contre - ce qui est fréquemment le cas - les échantillons sont peu importants, l utilisation de la loi normale n est plus acceptable. Dans ce cas, si l on a des raisons valables d admettre que les deux populations ont la même variance (y 2 : une estimation correcte de cette variance commune pourra être faite à partir de l ensemble des deux échantillons :, La variance de la différence d sera alors estimée par : 37

et H*rxn* v La variable aléatoire t d est alors distribuée suivant la loi de Student-Fisher. Sd L étude du cas général (variances inconnues et différentes) a donné lieu à de nombreux travaux (Test de Behrens ; test de Welch). Une solution particulièrement simple a été étudiée par M. le Professeur G. Darmois. Le test est basé sur la construction de régions de confiance pour le couple de paramètres (m,, m2). On considère 2 échantillons extraits indépendamment chacun d une des populations : Échantillon 1 extrait de P, : Effectif : n, observations : xi moyenne : 3Z - 20132013L Échuntillon extrait de P2 : ; variance : s2013 * ~. n, n, Effectif : n observations : yi moyenne. n2 variance 2 n,. 2 nz 1) Construction de domaines de confiance pour (m,, mj : Les caractéristiques de Student : suivent les lois de Student avec respectivement : v, = n,- 1 et v 2 --:: n2-1 degrés de liberté. Dans le plan (t" tz), la densité de probabilité est :.,~ Cette densité étant indépendante des paramètres m,, mt 0 1,d~ et t1 et t 2 dépendant des par mètres m, et mz seulement, à tout domaine A (oc) du plan (t,, tt) de probabilité 1 - :-. correspond dans le plan paramètre (m,, m2) un domaine de confiance D (ex) de coefficient 1 2013a. Ce domaine aléatoire puisque dépendant des valeurs observées de X, /, s, s2, a une probabilité 1 -oc de contenir le point paramètre M (m,, m2), m, et m2, étant les valeurs effectives des moyennes de P, et P1. 2) Choix du domaine l1 (a) La forme de à (a) est arbitraire. Pour des raisons de simplicité et d efficacité, M. Darmois a été amené à considérer des domaines circulaires, centrés à l origine. A (a) est le domaine intérieur au cercle = t~ + t2 R 2 ( (X ), R (oc) étant défini par : 3) Domaines de confiance D (a) correspondanl~âux cercles de probabilité 1 -a.: L inégalité t*2 - t2 R2 s écrit, en remplaçant t1 et t2 par leur valeur : 38

Le domaine de confiance, de coefficient 1 2013a, pour (m,, m2) est l intérieur de l ellipse C (ex) de centre le point (X, ), de directions d axes les directions des axes de coordonnées, de longueurs des 1/2 axes : La probabilité que cette ellipse contienne en son intérieur le point paramètre effectif (m,, mj est égale à 1 -a. 4) Tests basés sur ces domaines de confiance : a) Test d une hypothèse de la forme : m1 m, ai a, } a, et 02 sont des valeurs numériques données. m2 = a2 Rejeter l hypothèse au niveau cc. si l ellipse C (a) ne contient pas point A (ai, a~). en son intérieur le ot est le niveau significatif du test, c est-à-dire le risque que l on court de rejeter l hypothèse lorsqu elle est vraie. b) Test de l hypothèse (H) : m, m2(populations de même = moyenne non spécifiée) : Il est togique de considérer que l hypothèse (H) est peu vraisemblable si l ellipse C (a), pour a petit, ne contient aucun point de la première bissectrice (lieu des points m, = m2). Test de Darmois : Rejeter l hypothèse m, = m2 si l ellipse de conf iance C (a) ne coupe pas la première bissectrice. Cette condition s exprime analytiquement par :. Niveau significatif du test : Le niveau du test (risque de conclure à la non égalité des moyennes lorsqu en fait ces moyennes sont égales) n est pas égal àa.. Il a une valeur a inférieure à a. La valeura, qui sert de base au calcul de R (a), donc au test, est une limite supérieure de ce risque (erreur de 1 re espèce). 39

III. - EXAMEN DU TEST DANS LE CAS OU LES EFFECTIFS n, ET n2 DES ÉCHAN- TILLONS SONT ÉLEVÉS. n, s; et n2 s2 sont les estimations convergentes sans biais des variances ": etc et la n,-1 i n2-1 quantité d sur laquelle est basée le test est pratiquement égale à : "1..z c est-à-dire à la quantité utilisée pour le test classique de nil -- connues. Il m2lorsque les variances sont peut être intéressant, à titre indicatif, de comparer dans ce casa. au niveau significatif réel oc du test. t, et t2 sont asymptotiquement des variables normales réduites et, par suite, R2 (a) est la valeur d un"f. 1. à 2 degrés de liberté correspondant à la valeur 1 -oc de la fonction de répartition. d est par ailleurs une variable normale réduite. Le niveau a est donc donné par : usuelles : Le tableau ci-dessous donne la correspondance (1,xI) pour un certain nombre de valeurs oc est en gros de l ordre de 3. On est par suite amené à penser que, quels que soient n, et nt, le t est utilisé pour x-= 0,05 === 5 00 par exemple correspondra un niveau de l ordre de 1 à 3 *~. Utilisation du test de Darmois. On trouvera ci-après une table donnant R (oc) en fonction de : Cette table a été calculée au Laboratoire de Calcul de l Institut Henri Poincaré sous la direction de M. Erokin. Mode d emploi : Extraire : un échantillon d effectif n, de P~ : x,, x2... un échantillon d effectif n2 de Pt : y,, y2... Calculer : 40

1 Lire R (a) à l intersection de la ligne " 1 == n, - 1 et de la colonne B1 ~ n2-1 (ou == colonne n, - et de la ligne n 2 - l, la table étant symétrique). Rejeter l hypothèse d égalité des moyennes si : d > R (oc) de la 41