Statistiques inférentielles



Documents pareils
Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux

DIRECTEUR ADJOINT DES VENTES

Lois de probabilité. Anita Burgun

choisir H 1 quand H 0 est vraie - fausse alarme

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

Renseignements fiscaux de NexGen :

Nouveau Barème W.B.F. de points de victoire 4 à 48 donnes

INSTRUCTION DE CRÉATION D UN COMPTE CLIENT

Estimation et tests statistiques, TD 5. Solutions

TESTS D HYPOTHÈSE FONDÉS SUR LE χ².

LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples.

Plan d études. Traitement visuel 2D. Techniques d intégration multimédia HU. legault/2d/ 1-2-2

La facturation à l acte

PUIS-JE DONNER UN REIN?

Introduction à la statistique non paramétrique

Tests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision

Résumé du Cours de Statistique Descriptive. Yves Tillé

Estimation: intervalle de fluctuation et de confiance. Mars IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

SE PREPARER A GERER UNE CRISE SOCIALE... Exoteam - Déjeuner MEFPVSG - 10/04/12

Instructions et spécifications pour la transmission en format XML de déclarations par lots. 30 mai 2015 MODULE 1

Annexe commune aux séries ES, L et S : boîtes et quantiles

PUIS-JE DONNER UN REIN?

OCS Inventory & GLPI V.2

PROVINCE DE QUÉBEC MUNICIPALITÉ DE BOLTON-OUEST AUX CONTRIBUABLES DE LA SUSDITE MUNICIPALITÉ AVIS PUBLIC

Lire ; Compter ; Tester... avec R

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

HELPDESK IMAGINLAB GUIDE UTILISATION POUR IMAGINEURS. : Guide HelpDesk pour les Imagineurs-v1.2.docx. Date :

Registre de donneurs vivants jumelés par échange de bénéficiaires. Qu est-ce qu une greffe de rein par échange de bénéficiaires?

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

CESSATION DES OPÉRATIONS D ASSURANCE AU CANADA DES SOCIÉTÉS D ASSURANCES ÉTRANGÈRES

où «p» représente le nombre de paramètres estimés de la loi de distribution testée sous H 0.

SDLS08 - Modes propres d'une plaque carrée calculés sur base réduite

Types d ordres particuliers

Calcul élémentaire des probabilités

TABLE DES MATIERES. C Exercices complémentaires 42

PORTEFEUILLES SYMÉTRIE. Solution de placement façon fonds de pension

La fumée de tabac secondaire (FTS) en Mauricie et au Centre-du- Québec, indicateurs du plan commun tirés de l ESCC de

Tableau de Bord. Clas 1.1 Conduite d'un projet de communication

TESTS D'HYPOTHESES Etude d'un exemple

APPLICATION POUR FRANCHISÉ

La réforme du permis de construire et des autorisations d urbanisme

RÈGLEMENT DE PARTICIPATION «En mode Subito»

FORMULAIRE DE DEMANDE D AIDE NON REMBOURSABLE POUR PETITS PROJETS LOCAUX. Libreville - GABON. Tel. : (241) / Fax : (241)

Chapitre 3: TESTS DE SPECIFICATION

La NP-complétude. Johanne Cohen. PRISM/CNRS, Versailles, France.

Projet L1, S2, 2015: Simulation de fourmis, Soutenance la semaine du 4 mai.

Fiche d utilisation du logiciel. 1 - Installation. J. Thioulouse & D. Chessel

Visual Taxe 4.1.0B04 minimum

Procédure d'authentification sur Extradoc

PROPOSITION ASSURANCE DES SPORTS

Techniques d interaction dans la visualisation de l information Séminaire DIVA

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année

C11.2 Identifier les solutions à mettre en œuvre C11.3 Préparer le cahier des charges

Déclaration du Rapprochement annuel des soldes

Exercices M1 SES Ana Fermin ( fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

prévoyance Assurance Autonomie CHOISIR AUJOURD HUI COMMENT VIVRE DEMAIN

Création d une SIGNATURE ANIMÉE avec PHOTOFILTRE 7

PRECISION - REJET DE PERTURBATIONS T.D. G.E.I.I.

Tests statistiques et régressions logistiques sous R, avec prise en compte des plans d échantillonnage complexes

Concours $ de prix en argent offerts par le Programme d assurance automobile et habitation CIBC (le «Concours»)

Analyse exploratoire des données

Statistiques descriptives

Comment configurer. le web.

Vous y trouverez notamment les dernières versions Windows, MAC OS X et Linux de Thunderbird.

Faire un semi variograme et une carte krigée avec surfer

Attirez les meilleurs employés et consolidez votre entreprise

QUESTIONNAIRE SUR L ADMISSIBILITÉ AU SARPA

Correction du baccalauréat STMG Polynésie 17 juin 2014

Latitude N Longitude E Altitude 376 m RÉSUMÉ MENSUEL DU TEMPS DE JANVIER 2014

FINANCE Mathématiques Financières

La simulation probabiliste avec Excel

Les ACL Cisco. F. Nolot Master 2 Professionnel STIC-Informatique 1

Emprunter un livre numérique avec une tablette Surface ou un téléphone Windows

STATISTIQUES. UE Modélisation pour la biologie

CONCOURS «Du bonheur dans votre frigo!» RÈGLEMENTS

Qu est-ce que l adaptation au changement climatique?

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

ACT3284 Modèles en assurance IARD Examen Final - 14 décembre 2011

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

La plateforme Cloud Supply Chain. Présentation de GT Nexus

L Entreprise, première valeur de notre gestion

Activité des programmes de médicaments

Méthodologie du calcul de la VaR de marché : revue de l approche basée sur des simulations historiques

Bienvenue à l historien virtuel 2.0

Créer son propre site Internet formation WordPress 2015

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Indépendance Probabilité conditionnelle. Chapitre 3 Événements indépendants et Probabilités conditionnelles

Dossier Technologies. 16 Assurance

Objectifs du cours d aujourd hui. Informatique II : Cours d introduction à l informatique et à la programmation objet. Complexité d un problème (2)

Cours d algorithmique pour la classe de 2nde

Tableau de bord des communautés de l Estrie DEUXIÈME ÉDITION INDICATEURS DÉMOGRAPHIQUES ET SOCIOÉCONOMIQUES

exigences des standards ISO 9001: 2008 OHSAS 18001:2007 et sa mise en place dans une entreprise de la catégorie des petites et moyennes entreprises.

Coût de la rentrée universitaire à Poitiers

Veuillez utiliser la liste de vérification ci-dessous pour vous assurer de ne rien oublier. Les demandes incomplètes ne seront pas étudiées.

D r o i t s D r o i t s Q u i z z : i n t e r n e t t e x t e

Technique BENO, Je vais vous montrer ici, comment gagner pas mal d'argent.

Charte des valeurs NIEDAX GROUP - Code de Conduite -

Logiciel de Base. I. Représentation des nombres

Titre Présentation du 3 Mai 2012

TP 1 : 1 Calculs en binaire, octal et hexadécimal

Transcription:

Introduction Chapitre 4 : Test du khi-deux d ajustement Télécom Saint-Étienne 2015

Sommaire 1 Introduction 2 3

Plan 1 Introduction 2 3

Introduction - 1 Soit X une variable aléatoire définie sur un univers Ω.

Introduction - 1 Soit X une variable aléatoire définie sur un univers Ω. Lorsqu on recueille des données statistiques sur une variable dans une population, on les présente souvent sous la forme d un tableau des effectifs répartis en classes. On suppose que les observations sont faites de façon indépendante et dans les mêmes conditions.

Introduction - 1 Soit X une variable aléatoire définie sur un univers Ω. Lorsqu on recueille des données statistiques sur une variable dans une population, on les présente souvent sous la forme d un tableau des effectifs répartis en classes. On suppose que les observations sont faites de façon indépendante et dans les mêmes conditions. Remarque Une classe est ici entendue au sens large et peut aussi bien représenter un intervalle de valeurs (pour une variable quantitative continue) qu une modalité unique (pour une variable qualitative ou quantitative discrète). Le nombre de classes r est cependant fini.

Introduction - 1 Soit X une variable aléatoire définie sur un univers Ω. Lorsqu on recueille des données statistiques sur une variable dans une population, on les présente souvent sous la forme d un tableau des effectifs répartis en classes. On suppose que les observations sont faites de façon indépendante et dans les mêmes conditions. Remarque Une classe est ici entendue au sens large et peut aussi bien représenter un intervalle de valeurs (pour une variable quantitative continue) qu une modalité unique (pour une variable qualitative ou quantitative discrète). Le nombre de classes r est cependant fini. On souhaite tester si la distribution expérimentale observée correspond à une distribution théorique donnée.

Introduction - 2 Introduction Les r classes numérotées 1,2,,r sont représentées dans la population selon certains effectifs notés respectivement n 1,n 2,,n r avec la condition n 1 + +n r = n. Ainsi, à chaque classe, on associe un évènement E i et (E 1,,E r ) forme un système complet d évènements. Dans le modèle théorique, on note p 1,p 2,,p r les probabilités de ces évènements.

Introduction - 2 Introduction Les r classes numérotées 1,2,,r sont représentées dans la population selon certains effectifs notés respectivement n 1,n 2,,n r avec la condition n 1 + +n r = n. Ainsi, à chaque classe, on associe un évènement E i et (E 1,,E r ) forme un système complet d évènements. Dans le modèle théorique, on note p 1,p 2,,p r les probabilités de ces évènements. On va comparer les effectifs théoriques np 1,np 2,,np r obtenus pour un échantillon de taille n.

Introduction - 2 Introduction Les r classes numérotées 1,2,,r sont représentées dans la population selon certains effectifs notés respectivement n 1,n 2,,n r avec la condition n 1 + +n r = n. Ainsi, à chaque classe, on associe un évènement E i et (E 1,,E r ) forme un système complet d évènements. Dans le modèle théorique, on note p 1,p 2,,p r les probabilités de ces évènements. On va comparer les effectifs théoriques np 1,np 2,,np r obtenus pour un échantillon de taille n. Définition [Hypothèse nulle] L hypothèse H 0 est ici : la distribution observée est conforme à la distribution théorique choisie.

Introduction - 2 Introduction Les r classes numérotées 1,2,,r sont représentées dans la population selon certains effectifs notés respectivement n 1,n 2,,n r avec la condition n 1 + +n r = n. Ainsi, à chaque classe, on associe un évènement E i et (E 1,,E r ) forme un système complet d évènements. Dans le modèle théorique, on note p 1,p 2,,p r les probabilités de ces évènements. On va comparer les effectifs théoriques np 1,np 2,,np r obtenus pour un échantillon de taille n. Définition [Hypothèse nulle] L hypothèse H 0 est ici : la distribution observée est conforme à la distribution théorique choisie. L hypothèse alternative est alors : la distribution observée n est pas conforme à la distribution théorique choisie.

Introduction - 2 Introduction Les r classes numérotées 1,2,,r sont représentées dans la population selon certains effectifs notés respectivement n 1,n 2,,n r avec la condition n 1 + +n r = n. Ainsi, à chaque classe, on associe un évènement E i et (E 1,,E r ) forme un système complet d évènements. Dans le modèle théorique, on note p 1,p 2,,p r les probabilités de ces évènements. On va comparer les effectifs théoriques np 1,np 2,,np r obtenus pour un échantillon de taille n. Définition [Hypothèse nulle] L hypothèse H 0 est ici : la distribution observée est conforme à la distribution théorique choisie. L hypothèse alternative est alors : la distribution observée n est pas conforme à la distribution théorique choisie. En général, un test qui répond à ce genre de question est appelé un test d ajustement.

Introduction - 3 Introduction On considère la statistique χ 2 c := r i=1 (N i np i ) np i, où N i est le nombre de réalisations de l évènement E i (nombre de réalisations dans la classe numéro i) sur un échantillon donné.

Introduction - 3 Introduction On considère la statistique χ 2 c := r i=1 (N i np i ) np i, où N i est le nombre de réalisations de l évènement E i (nombre de réalisations dans la classe numéro i) sur un échantillon donné. La valeur observée pour cette variable aléatoire est faible si les écarts entre les valeurs théoriques et les valeurs observées sont petits. Elle est grande dans le cas contraire.

Plan 1 Introduction 2 3

- 1 Théorème : Théorème de Pearson Si pour tout i [[1;r]], np i 5 alors sous l hypothèse H 0, la variable aléatoire χ 2 c suit approximativement une loi du khi-deux à r 1 degrés de liberté, χ 2 (r 1).

- 1 Théorème : Théorème de Pearson Si pour tout i [[1;r]], np i 5 alors sous l hypothèse H 0, la variable aléatoire χ 2 c suit approximativement une loi du khi-deux à r 1 degrés de liberté, χ 2 (r 1). Remarque On préfère que np i soit plus grand que 10 pour tout i [[1;r]]. Remarque Lorsque l effectif attendu d une classe est plus petit que 5, il est recommandé de regrouper cette classe avec une autre qui lui est adjacente avant de procéder au test du χ 2. Le test d ajustement porte alors sur la distribution dans les classes obtenues après le regroupement.

Introduction - 2 La constante c dans le test du khi-deux, appelée valeur critique, est alors donnée par l équation ( ) P χ 2 c > c = α, où α est le niveau du test. Une table partielle de la loi du khi-deux permet de déterminer c dans la plupart des cas pratiques.

Introduction - 3 Propriété [Règle de décision] Soit α ]0;1[. On teste l hypothèse (H 0 ) contre l hypothèse (H 1 ) au risque d erreur α.

Introduction - 3 Propriété [Règle de décision] Soit α ]0;1[. On teste l hypothèse (H 0 ) contre l hypothèse (H 1 ) au risque d erreur α. Soit χ 2 1 α (r 1) le quantile d ordre 1 α de la loi du Khi-deux à r 1 degrés de liberté. L intervalle d acceptation de (H 0 ) est :

Introduction - 3 Propriété [Règle de décision] Soit α ]0;1[. On teste l hypothèse (H 0 ) contre l hypothèse (H 1 ) au risque d erreur α. Soit χ 2 1 α (r 1) le quantile d ordre 1 α de la loi du Khi-deux à r 1 degrés de liberté. L intervalle d acceptation de (H 0 ) est : [ ] 0; χ 2 1 α(r 1).

Introduction - 3 Propriété [Règle de décision] Soit α ]0;1[. On teste l hypothèse (H 0 ) contre l hypothèse (H 1 ) au risque d erreur α. Soit χ 2 1 α (r 1) le quantile d ordre 1 α de la loi du Khi-deux à r 1 degrés de liberté. L intervalle d acceptation de (H 0 ) est : [ ] 0; χ 2 1 α(r 1). En d autres termes, on accepte (H 0 ) si χ 2 obs, valeur observée pour χ 2 c sur l échantillon, vérifie χ 2 obs χ 2 1 α(r 1),

Introduction - 3 Propriété [Règle de décision] Soit α ]0;1[. On teste l hypothèse (H 0 ) contre l hypothèse (H 1 ) au risque d erreur α. Soit χ 2 1 α (r 1) le quantile d ordre 1 α de la loi du Khi-deux à r 1 degrés de liberté. L intervalle d acceptation de (H 0 ) est : [ ] 0; χ 2 1 α(r 1). En d autres termes, on accepte (H 0 ) si χ 2 obs, valeur observée pour χ 2 c sur l échantillon, vérifie et sinon on refuse (H 0 ). χ 2 obs χ 2 1 α(r 1),

Plan 1 Introduction 2 3

- 1 Introduction Le Bureau de la statistique du gouvernement du Québec a dénombré 84 579 nouveau-nés dans la province du Québec en 1986. De ce nombre, 43220 étaient des garçons et 41359 des filles. En supposant que le genre d un nouveau-né est déterminé au hasard (hypothèse (H 0 )), on se serait attendu à avoir 84579 1 2 = 42289.5 garçons et le même nombre de filles. On trouve χ 2 = (43220 42289.5)2 42 289.5 + (41359 42289.5)2 42 289.5 = 40.95.

- 2 Introduction On a ici une loi du Khi-deux à 2 1 = 1 degré de liberté. Or, ( ) P χ 2 1 > 7.88 = 0.005, pù χ 2 1 est une variable aléatoire qui suit la loi du Khi-deux à 1 degré de liberté. Puis, comme 40.95 > 7.88, on rejette l hypothèse (H 0 ) même avec un niveau aussi bas que 0.5%.