Test de Poisson à 1 échantillon et à 2 échantillons



Documents pareils
2010 Minitab, Inc. Tous droits réservés. Version Minitab, le logo Minitab, Quality Companion by Minitab et Quality Trainer by Minitab sont des

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

Microsoft Project UNIVERSITÉ HASSAN II AIN CHOCK

Evaluation de la variabilité d'un système de mesure

Estimation et tests statistiques, TD 5. Solutions

Valeur cible et solveur. Les calculs effectués habituellement avec Excel utilisent des valeurs numériques qui constituent les données d'un problème.

PRÉSENTÉ PAR : NOVEMBRE 2007

Les tableaux croisés dynamiques

Guide de développement de «WorkFLows» avec SharePoint Designer 2013

MS PROJECT Prise en main. Date: Mars Anère MSI. 12, rue Chabanais PARIS E mail : jcrussier@anere.com Site :

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

WinReporter Guide de démarrage rapide. Version 4

Document fonctionnel Prêts hypothécaires variables : évaluations des versements et les hypothèses

Traitement par lot conversion de plusieurs images en JPEG

LE TABLEUR OPENOFFICE CALC : CONTRÔLES DE FORMULAIRES ACCÈS AUX BASES DE DONNÉES

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

TSTI 2D CH X : Exemples de lois à densité 1

Uniformiser la mise en forme du document. Accélère les mises à jour. Permets de générer des tables de matières automatiquement.

DOCM Solutions officielles = n 2 10.

Statistiques Descriptives à une dimension

Découvrir la messagerie électronique et communiquer entre collègues. Entrer dans le programme Microsoft Outlook Web Access

Asset Management Software Client Module. Manuel d utilisation

SUPPORT DE COURS ACCESS 2010

Fonctions pour la France

Traitement par lot redimensionner des images

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Comment utiliser mon compte alumni?

POUR ALLER UN PEU PLUS LOIN SUR UN TABLEUR. Version EXCEL

Calc 2 Avancé. OpenOffice.org. Guide de formation avec exercices et cas pratiques. Philippe Moreau

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

Logiciel XLSTAT version rue Damrémont PARIS

Début de la procédure

Actuariat I ACT2121. septième séance. Arthur Charpentier. Automne charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free.

Windows Serveur 2012 : DHCP. Installation et mise en place

GUIDE DE DEMARRAGE RAPIDE:

1. Introduction Création d'une requête...2

Chapitre 3 : INFERENCE

Traitement des données avec Microsoft EXCEL 2010

LES GENERATEURS DE NOMBRES ALEATOIRES

Vue d'ensemble OBJECTIFS

Solutions du chapitre 4

Module 1 : Tableau de bord Excel * 2010 incl.*

Sauvegarde des données d affaires de Bell Guide de démarrage. Vous effectuez le travail Nous le sauvegarderons. Automatiquement

My.tentoo tel. 02/

Développement décimal d un réel

Les tâches d un projet

Norme comptable internationale 33 Résultat par action

:...2 I.6. :... 2 I.7. :... 2 I.8. :...3 I.9. :... 3 I.10. :... 3 II. 4 II.1.

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

GESTION DU LOGO. 1. Comment gérer votre logo? Format de l image Dimensions de l image Taille de l image 9

TESTS D'HYPOTHESES Etude d'un exemple

M-Budget Mobile Internet. M-Budget Mobile Connection Manager pour Mac OS

Lois de probabilité. Anita Burgun

Placez vous au préalable à l endroit voulu dans l arborescence avant de cliquer sur l icône Nouveau Répertoire

Veuillez noter que vous devez changer de Code d Accès Internet tous les 60 jours pour des raisons de sécurité.

Initiation à LabView : Les exemples d applications :

Cours pratique Excel. Dans chacune des feuilles, les donnés sont déjà entrées afin de gagner du temps.

Introduction à la Statistique Inférentielle

Designer d escalier GUIDE DE L UTILISATEUR. Stair Designer-1

Unité E Variation et analyse statistique

IBM SPSS Direct Marketing 21

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Fidélité Type 3 Carte de points et cartes cadeaux avec

Le pare-feu de Windows 7

Fonctions pour la Suisse

12 Tableaux croisés dynamiques

TUTORIEL RADIUS. I. Qu est-ce que RADIUS? II. Création d un groupe et d utilisateur

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

1- Enregistrer le nouveau planning

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT

Introduction à l approche bootstrap

MISE AU POINT FINANCIÈRE GUIDE DE L UTILISATEUR. Le logiciel MISE AU POINT FINANCIÈRE est offert sous licence par EquiSoft.

PUBLIPOSTAGE DANS WRITER

Guide de configuration. Logiciel de courriel

1- Enregistrer le nouveau planning

VI. Tests non paramétriques sur un échantillon

Calcul élémentaire des probabilités

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Séries Statistiques Simples

Comment utiliser la feuille de style «CMLF2010.dot»

LE RÔLE DE LA STATISTIQUE DANS UN PROCESSUS DE PRISE DE DÉCISION

Utilisation du logiciel ModellingSpace

Volet de visualisation

Freeway 7. Nouvelles fonctionnalités

CAPTEURS - CHAINES DE MESURES

Comment insérer une image de fond?

PARAMETRER LA MESSAGERIE SOUS THUNDERBIRD

Le modèle de données

2010 Ing. Punzenberger COPA-DATA GmbH. Tous droits réservés.

Microsoft Excel. Tableur

OSIRIS/ Valorisation des données PORTAIL BO MANUEL UTILISATEUR

FANTEC DB-229US Manuel de l'utilisateur

3. Caractéristiques et fonctions d une v.a.

Notice d utilisation

Securexam Consignes pour l EFU Les 2, 3 et 4 juin 2015

AFTEC SIO 2. Christophe BOUTHIER Page 1

1. Entrez le code client dans le champ << Code client >> si requis. Le code client est optionnel, on peut donc entrer simplement le nom du client.

TABLEAU CROISE DYNAMIQUE

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

GUIDE D INSTALLATION INTERNET haute vitesse

Transcription:

Test de Poisson à 1 échantillon et à 2 échantillons Sous-menus de Minitab 15 : Stat>Statistiques élémentaires>test de Poisson à 1 échantillon Stat>Statistiques élémentaires>test de Poisson à 2 échantillons Ces nouvelles fonctionnalités de Minitab 15 sont des tests d hypothèses pour les lois de Poisson. Elles sont similaires, l une concernant un échantillon l autre deux. Ces tests permettent d effectuer une inférence statistique sur des données issues de lois de Poisson : - Le test à 1 échantillon calcule un intervalle de confiance et un test d hypothèse pour le taux et la moyenne des données issues d une loi de Poisson. - Le test à 2 échantillons calcule un intervalle de confiance et un test d hypothèse pour la différence entre les moyennes et les taux de 2 processus de Poisson. Propriétés de la loi de Poisson Qu est-ce que la loi de Poisson? C est une distribution de données qui représente le nombre d occurrences d'un événement dans un espace d observation fini. Le nombre d appels quotidiens vers un centre d appels, par exemple, suit une loi de Poisson. Etant donné qu un événement ne peut pas se produire un nombre de fois négatif, ou un nombre de fois non- entier, des données de Poisson doivent être des nombres entiers non-négatifs sans borne supérieure. Le nombre de défauts de peinture sur un capot de voiture constitue des données de Poisson, en raison de l absence de borne supérieure pour le décompte. De plus, l espace d observation doit être fini : le nombre de défauts de peinture sur un capot de voiture; le nombre de clients pour un jour ouvrable, etc. Comme pour la distribution normale, il y a un nombre infini de lois de Poisson. Une distribution normale est définie par deux paramètres (la moyenne mu, et la variance sigma 2 ), alors qu'une loi de Poisson est définie par un seul paramètre lambda, qui correspond au nombre d occurrences prévues d un événement pendant la période d'observation donnée. Supposons, par exemple, qu un événement se produise deux fois toutes les 5 minutes en moyenne. Si vous dénombrez des événements pour un intervalle de 10 minutes, vous utiliserez une loi de Poisson avec lambda = 4 car l événement devrait se produire quatre fois en 10 minutes.

Calcul des probabilités avec la loi de Poisson Les données de Poisson sont des nombres entiers non-négatifs. Les lois de Poisson sont donc discrètes, la probabilité d une valeur individuelle 1 peut être calculée. La probabilité selon laquelle il y a exactement k occurrences = P(x=k) = 1 Avec des distributions continues, la probabilité de n importe quelle valeur est zéro. Par conséquent, les probabilités de variables aléatoires continues sont exprimées sous forme d inégalités, comme P(X > 0). Relation avec une distribution normale Lorsque la valeur de lambda augmente, une loi de Poisson se rapproche d une distribution normale, la moyenne et la variance (non pas l écart type) étant égales à lambda : N(lambda, lambda). Cette propriété permet des approximations normales lors de l exécution de tests d hypothèses. Lorsque la valeur de lambda augmente, les lois de Poisson se rapprochent de N(lambda, lambda). La loi de Poisson discrète (lambda = 100) est presque identique à la distribution continue N(100 100).

Qu est-ce qu un processus de Poisson? Un processus de Poisson décrit le nombre d'occurrences d un événement pour une durée, une surface, un volume, etc. donné. En d autres termes, il s agit d une situation dans laquelle on dénombre des événements dans un espace d observation fini, sans limite supérieure pour le dénombrement. Longueur de l observation La période d observation doit être finie. Toutefois, cette «période d observation» peut avoir n importe quelle forme : - temporelle (combien de clients se rendent dans un bureau de poste en 1 jour) - espace bidimensionnel (dénombrement des défauts de peinture sur un capot de voiture) - espace tridimensionnel (dénombrement des poissons dans un kilomètre cube d eau de mer) - etc. Les dimensions de la période d observation sont importantes pour les calculs des tests. Minitab désigne cette valeur sous le nom de «longueur» de l observation. L exemple suivant illustre l importance de la «longueur» pour l'analyse d'un processus de Poisson : Supposons que vous dénombriez le nombre de défauts de peinture sur un capot de voiture. Il ne sera pas nécessaire de spécifier les dimensions du capot si vous comparez des capots de type et de taille identiques. Ainsi, si vous comparez les défauts de peinture sur les capots de 2 véhicules du même modèle A, vous n aurez pas à spécifier les dimensions car celles-ci sont identiques. Par contre, si vous comparez des capots d un modèle A de citadine et d un modèle B de tout terrain, vous devrez convertir le nombre moyen de défauts en un taux de défauts. Par exemple, si des citadines présentent, en moyenne, 9 défauts sur un capot de 12 pieds carrés [1,12 m2], et des 4x4 15 défauts sur un capot de 25 pieds carrés [2,32 m2], vous devrez normaliser les résultats pour pouvoir effectuer une comparaison. Les 4x4 ont une moyenne plus élevée, mais un taux inférieur : 0,6 comparé à 0,752. Dans ce calcul, les dimensions 12 et 25 sont des valeurs de «longueur». Vous pouvez spécifier la «longueur» en cliquant sur le bouton «Options» de la boîte de dialogue du test de Poisson à un échantillon ou celui de Poisson à deux échantillons. Autre exemple : Vous comparez deux centres d appels pour déterminer quel est celui qui traite le plus d'appels. Un centre dénombre les appels hebdomadaires; l autre dénombre les appels quotidiens. Vous ne pouvez pas comparer ces chiffres bruts, et vous devez donc les normaliser à des fins de comparaison en entrant des valeurs de «longueur». Pour exprimer ces deux observations en tant que taux quotidien, entrez des valeurs de longueur de 7 et 1 en cliquant sur le bouton «Options» de la boîte de dialogue du test de Poisson à un échantillon ou celui de Poisson à deux échantillons.

Distinction entre «taux» et «moyenne» Lorsque vous entrez une valeur dans le champ «longueur», le logiciel Minitab ajoute une deuxième section aux résultats, section dont la structure est semblable à celle de la première. Une section analyse le «taux» et l autre analyse la «moyenne». Moyenne : Le nombre moyen d occurrences d un événement dans l espace d observation total. Moyenne = Nombre total d occurrences effectif de l'échantillon. Exemple : Vous dénombrez les arrivées de clients dans un bureau de poste pendant 5 jours consécutifs. Vous dénombrez 5, 10, 15, 20, et 25 clients, respectivement. Moyenne = (5 + 10 + 15 + 20 + 25) 5 = 15 Taux = Moyenne longueur - Lorsque la longueur = 1 (défaut), Taux = Moyenne, et on utilise l'étiquette «taux». - Lorsque la longueur 1, Minitab affiche le taux et la moyenne. Retour au logiciel Minitab! Test de Poisson à 1 échantillon La boîte de dialogue accepte les formats de données suivants : - colonnes de données brutes - colonnes de données d effectifs - données résumées Comme d autres commandes pour 1 échantillon, si vous entrez plusieurs échantillons, le logiciel Minitab exécute plusieurs tests à 1 échantillon. Longueur pour test à 1 échantillon Dans le cas d un test à 1 échantillon, vous ne comparez pas 2 populations, mais vous devrez peut-être spécifier la longueur pour une mise à l échelle appropriée de vos résultats. La longueur est toujours pertinente car vous devrez peut-être comparer le taux de votre population simple à une moyenne historique ou à une norme industrielle. Approximation normale Etant donné la relation entre les lois de Poisson et les distributions normales, on peut calculer le test et l intervalle de confiance avec une approximation normale. Cette méthode n est valide que si le nombre total d'événements est suffisamment élevé. Lorsque ce total est inférieur à 11, le logiciel Minitab affiche la mise en garde suivante : * REMARQUE * L'approximation selon la loi normale risque de ne pas être exacte pour les nombres totaux d'occurrences trop faibles. L approximation normale intéressera probablement plus particulièrement les universitaires, qui l utiliseront à des fins d'enseignement.

L'exemple suivant s applique à un Test de Poisson à 1 échantillon qui utilise des données résumées et l'option longueur. Supposons que 30 capots de voiture, de 5 pieds carrés [0,46 m2] chacun, soient inspectés et que l on constate 535 défauts. Votre objectif est de tester : taux =3 comparé à taux 3. Choisissez Stat>Statistiques Elémentaires>Test de Poisson à 1 échantillon. Renseignez la boîte de dialogue comme illustré ci-dessous. N oubliez pas que la notion d «effectif de l échantillon» [sample size] signifie le nombre de fois que vous avez dénombré des événements. Si vous dénombrez vos appels téléphoniques pendant 7 jours, l'effectif de votre échantillon est 7. Toutefois, si vous dénombrez vos appels téléphoniques hebdomadaires pendant une semaine, l'effectif de votre échantillon est 1. Cliquez ensuite sur Options et renseignez la boîte de dialogue comme suit afin de tenir compte des dimensions du capot de voiture. Cliquez sur OK dans chaque boîte de dialogue.

Résultats pour l échantillon Les résultats permettent de tirer les conclusions suivantes : Sur la base de votre échantillon, vous pouvez être sûr à 95% que le taux d occurrence vrai pour la population ou l occurrence moyenne se situe dans les plages fournies. Dans le cas de l utilisation d un seuil de signification alpha de 0,05, vous pouvez rejeter l hypothèse nulle selon laquelle le taux = 3. Test de Poisson à 2 échantillons La boîte de dialogue accepte les formats de données suivants : - colonnes de données brutes, empilées ou désempilées - colonnes de données d effectifs, empilées ou désempilées - données résumées Longueurs pour test à 2 échantillons Si les périodes d observation pour vos échantillons sont différentes, vous devez entrer des valeurs de longueur pour que vos comparaisons soient significatives. Si vous entrez une valeur, Minitab applique cette valeur aux deux échantillons. Si vous entrez deux valeurs, chacune s applique à son échantillon respectif. L option «Utiliser l estimation de regroupement du taux pour tester une différence de zéro» Cochez cette case pour calculer une valeur lambda de regroupement à utiliser pour les deux échantillons. Cette option n est disponible que lorsque Test de différence [Test difference] est égal à zéro. L hypothèse de lambdas égaux, alors que la raison même d un test à 2 échantillons est de montrer qu ils sont différents, peut sembler contradictoire. Toutefois, il n y a pas contradiction mathématique. Tous les tests supposent que H0 est vrai, et le regroupement du taux reflète simplement l hypothèse nulle. Autrement dit, si vous n utilisez pas un taux de regroupement lorsque H0 indique que les taux sont égaux, vous n utilisez que la moitié de vos données pour estimer le taux pour chaque échantillon.

Si vous avez 2 échantillons à effectifs de 10, vous pouvez estimer le taux de chacun séparément à l aide de 10 observations, ou vous pouvez combiner les échantillons et calculer un taux à partir de 20 observations, que vous utiliserez pour les deux échantillons d origine. Vous avez supposé que les taux sont égaux dans H0, donc le regroupement du taux reflète ce choix. L'exemple suivant s applique à un Taux de Poisson à 2 échantillons qui utilise des données résumées et l'option longueur. Supposons que vous vouliez effectuer un test pour déterminer s'il y a une différence entre le nombre de défauts constatés sur des capots de citadines et de 4x4. Sur l échantillon de 80 citadines, 720 défauts constatés sur des capots de 12 pieds carrés [1,12 m2]. Sur l échantillon de 72 tout terrain, 1080 défauts constatés sur des capots de 25 pieds carrés [2,32 m2]. Cet exemple illustrera également un test d hypothèse unilatéral. Choisissez Stat>Statistiques Elémentaires>Test de Poisson à 2 échantillons. Renseignez la boîte de dialogue comme illustré ci-dessous. Cliquez ensuite sur le bouton Options et renseignez la boîte de dialogue comme suit. Cliquez sur OK dans chaque boîte de dialogue.

Résultats pour l échantillon Etant donné que des valeurs ont été entrées pour «Longueur» [Length ], Minitab exécute des tests sur le taux et la moyenne. On remarquera également qu un test unilatéral est choisi. Les résultats indiquent que le test pour le taux est significatif, mais que le test pour la moyenne ne l est pas. Ceci est dû au fait que Taux1> Taux2, alors que Moyenne1< Moyenne2. Ceci vous montre que vous devez comprendre la signification de la notion de «longueur» pour pouvoir tirer les conclusions correctes de vos données.