STATISTICA Test d hypothèses Ajustement de distribution

Documents pareils
Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

TABLE DES MATIERES. C Exercices complémentaires 42

TESTS D'HYPOTHESES Etude d'un exemple

ACT3284 Modèles en assurance IARD Examen Final - 14 décembre 2011

FORMULAIRE DE STATISTIQUES

Chapitre 3 : INFERENCE

Représentation d une distribution

Loi binomiale Lois normales

FONCTION DE DEMANDE : REVENU ET PRIX

Statistique : Résumé de cours et méthodes

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

Annexe commune aux séries ES, L et S : boîtes et quantiles

TESTS D HYPOTHÈSE FONDÉS SUR LE χ².

VI. Tests non paramétriques sur un échantillon

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Catalogue des connaissances de base en mathématiques dispensées dans les gymnases, lycées et collèges romands.

TSTI 2D CH X : Exemples de lois à densité 1

Propriétés des options sur actions

Chapitre 2/ La fonction de consommation et la fonction d épargne

Statistiques Descriptives à une dimension

Raisonnement par récurrence Suites numériques

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples.

Le calcul du barème d impôt à Genève

1. Vocabulaire : Introduction au tableau élémentaire

Données longitudinales et modèles de survie

Modélisation et simulation du trafic. Christine BUISSON (LICIT) Journée Simulation dynamique du trafic routier ENPC, 9 Mars 2005

Chapitre 02. La lumière des étoiles. Exercices :

où «p» représente le nombre de paramètres estimés de la loi de distribution testée sous H 0.

Gestion de projet Agile. STS IRIS Module «Gérer et organiser un projet informatique»

Lois de probabilité. Anita Burgun

2010 Minitab, Inc. Tous droits réservés. Version Minitab, le logo Minitab, Quality Companion by Minitab et Quality Trainer by Minitab sont des

Evelyne GURFEIN Comptes consolidés IAS IFRS et conversion monétaire

Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier

Apprentissage incrémental par sélection de données dans un flux pour une application de sécurité routière

Mémoire d actuariat - promotion complexité et limites du modèle actuariel, le rôle majeur des comportements humains.

Programmation parallèle et distribuée

Chapitre 2 Le problème de l unicité des solutions

TP N 57. Déploiement et renouvellement d une constellation de satellites

Calcul élémentaire des probabilités

RapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/ Présentation. 1.2 Ressources

modélisation solide et dessin technique

O, i, ) ln x. (ln x)2

POUR ALLER UN PEU PLUS LOIN SUR UN TABLEUR. Version EXCEL

enquête pour les fautes sur le fond, ce qui est graves pour une encyclopédie.

Modélisation aléatoire en fiabilité des logiciels

Peut-on imiter le hasard?

Introduction à la Statistique Inférentielle

Présentation. (N.B. Ce système a été développé en «Easy Language» via Tradestation).

PROBABILITES ET STATISTIQUE I&II

Les réseaux cellulaires

Listes de fournitures du secondaire pour la rentrée

Math 5 Dallage Tâche d évaluation

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année

BTS Groupement A. Mathématiques Session Spécialités CIRA, IRIS, Systèmes électroniques, TPIL

Chapitre 3. Les distributions à deux variables

Variations du modèle de base

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux

IFT3245. Simulation et modèles

Introduction à la statistique descriptive

Former des enseignants à l intégration des TICE bilan des usages, perspectives et questionnement

Exo7. Probabilité conditionnelle. Exercices : Martine Quinio

Norme comptable internationale 33 Résultat par action

Des solutions éducatives dans l air du temps!

Unité E Variation et analyse statistique

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

Séries Statistiques Simples

La pratique du coaching en France. Baromètre 2010

Précision d un résultat et calculs d incertitudes

Logiciel XLSTAT version rue Damrémont PARIS

Analyse de la variance Comparaison de plusieurs moyennes

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Strasbourg. De la statistique. aux probabilités. en lycée. De la statistique. aux probabilités. en lycée. Octobre 2006

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

Fête de la science Initiation au traitement des images

BACCALAUREAT GENERAL MATHÉMATIQUES

responsable? Qui est Sinistres «Nous tenons compte des circonstances de chaque cas»

COMMISSION DES NORMES COMPTABLES. Avis CNC 2010/15 Méthodes d amortissement. Avis du 6 octobre 2010

Probabilité et Statistique pour le DEA de Biosciences. Avner Bar-Hen

Interface PC Vivago Ultra. Pro. Guide d'utilisation

6. Les différents types de démonstrations

TRACER LE GRAPHE D'UNE FONCTION

(Exemple ici de calcul pour une Ducati 748 biposto, et également pour un S2R1000, équipé d un disque acier en fond de cloche, et ressorts d origine)

Le PERCO Intégral Un nouveau mode de gestion dans le PERCO France Télécom

LES GENERATEURS DE NOMBRES ALEATOIRES

Exercices M1 SES Ana Fermin ( fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

Introduction à l approche bootstrap

Exemples de dynamique sur base modale

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Classe de première L

L assurance de la qualité à votre service

Cour d'appel de Bruxelles - Arrêt du 8 novembre

Note de cours. Introduction à Excel 2007

Analyse statistique de données qualitatives et quantitatives en sciences sociales : TP RÉGRESSION LOGISTIQUE (MODÈLES CHAPITRE 1)

EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG

Faire un semi variograme et une carte krigée avec surfer

23. Interprétation clinique des mesures de l effet traitement

Transcription:

Chapitre 9 STATISTICA Test d hypothèses But des tests d hypothèse: Les hypothèses sont des prévisions apriorique nous faisons sur lastructure des résultats. But des ajustement de distribution: Je souhaite savoir mon échantillon est semblable à une fonction mathématique connue (loi normal, par exemple). Cours réalisé par Benjamin Putois. 1

A quoi cela sert? Le module Ajustement de Distributions est utilisé pour évaluer l'ajustement des données observées à des distributions théoriques. Dans certains domaines de recherche, il est possible de formuler des hypothèses quant à la distribution spécifique de la variable étudiée. Par exemple, des variables dont les valeurs sont déterminées par un nombre infini d'événements aléatoires indépendants suivent la distribution normale : on peut penser que la taille d'un individu résulte d'une infinité de facteurs indépendants comme des prédispositions génétiques, des maladies infantiles, la nutrition, etc... En revanche, si les valeurs d'une variable résultent d'événements très rares, la variable sera distribuée selon la distribution de Poisson (parfois appelée distribution des événements rares). Par exemple, les accidents industriels peuvent être considérés comme la conjonction d'une suite d'événements malheureux (t (et peu probables), bbl et leur fé fréquence tend à être distribuée ib selon la distribution de Poisson. Les procédures d'ajustement de distributions sont également utilisées lorsque vous souhaitez vérifier l'hypothèse de normalité avant d'utiliser des tests non paramétriques. Par exemple, vous pouvez utiliser le test de normalité de Kolmogorov Smirnov ou le test Wde Shapiro Wilk afin de tester la normalité. Voir dans l aide les différents type de distribution Cours réalisé par Benjamin Putois. 2

Normal La distribution normale (la courbe en "cloche", qui est symétrique autour de la moyenne) est une fonction théorique fréquemment utilisée dans les statistiques inférentielles comme approximation des distributions d'échantillonnage (voir également la rubrique bi concepts élémentaires). En général, é la distribution ib ti normale fournit un bon modèle pour une variable aléatoire, lorsque : 1. La variable a une forte tendance à prendre la valeur centrale ; 2. Des écarts positifs et négatifs autour de cette valeur centrale ont la même probabilité ; 3. La fréquence des écarts diminue rapidement à mesure que les écarts deviennent plus grands. Tout comme un mécanisme sous jacent produit une distribution normale, on peut penser à un nombre infini d'événements aléatoires indépendants (binomiaux) induisant les valeurs d'une variable particulière. Par exemple, il y a probablement un nombre infini de facteurs qui déterminent la taille d'une personne (des milliers de gènes, la nutrition, les maladies, etc.). Par conséquent, on peut s'attendre à ce que la taille soit distribuée normalement dans la population. Vous donne la table des fréquences Vous donne le graphique des répartitionsde i fé fréquence Cours réalisé par Benjamin Putois. 3

Spécifiez le nombre de catégories pour la table de fréquence ou l'histogramme. Remarque : le nombre maximum de catégories autorisées est de 50. Déterminer les limites Paramètre de votre échantillon STATISTICA va calculer la statistique du D max à partir des données tabulées de la feuille de données. STATISTICA va passer une revue les données observées triées une à une, et calculer en chaque point la fréquence cumulée théorique ; la statistique du D max de Kolmogorov est la plus grande Sil' l'effectif théorique s'avère inférieur i ou égalà différence absolue entre la 5, STATISTICA va ajouter l'effectif théorique distribution cumulée pour la catégorie respective à la classe observée et théorique. adjacente. Le fait de combiner les effectifs va Paramètre du graphique se poursuivre jusqu'à atteindre un effectif cumulé théorique supérieur à 5. Cours réalisé par Benjamin Putois. 4

Interprétation des résultats: Si le test de Kolmogorov Smirnov est statistiquement significatif, l'hypothèse que les données observées suivent la distribution supposée est rejetée. Si le test du Chi² est statistiquement significatif, l'hypothèse que les données observées suivent la distribution supposée est rejetée. Parfois, les résultats de ces deux tests sont contradictoires: Ce type de résultat n'est pas rare parce que le test de Kolmogorov Smirnov n'est pas une procédure aussi précise qu'une technique de détection de grosses déviations par rapport à une distribution supposée. Fréquemment, la valeur du Chi deux est une valeur grandement affectée par la façon par laquelle la distribution est "découpée", c'est à dire, par le nombre de catégories, les valeurs minimum, et maximum que vous avez choisi. Interprétation des résultats: Ouvrez le fichier exemple 01.sta Nous avons un échantillon de 200 personnes dont on a testé le QI. La distribution s ajuste t elle à une distribution normale? Faites 10 catégories entre [50 150]. NiK S ni Chi² ne sont significatifs, alors on accepte que cet échantillon peut être ajusté à une loi normale. Cours réalisé par Benjamin Putois. 5

Exercice 1: Ouvrez le fichier exercice 08.sta Nous avons testé le QI d'un échantillon de 87 personnes, dont 39 femmes. Déterminer si l échantillon suit une distribution normale. (catégoriser entre 70 et 140; en 7 catégories puis en 14 catégories) Correction Exercice 1: K S est non significatif la distribution est normale Chi² significatif la distribution nestpas n est normale Si vous faites 14 catégories au lieu de 7: La distribution est normale Cours réalisé par Benjamin Putois. 6

Exercice 2: Ouvrez le fichier irisdat.sta Ce fichier comporte des données rapportées par Fisher (1936) sur les longueurs et largeurs des sépales (Lonsepal, Larsepal) et des pétales (Lonpetal, Larpetal) pour 50 fleurs de trois types d'iris différents. Les distributions des quatre variables décrivant les longueurs et largeurs des sépales et pétales vont à présent être examinées. Plus particulièrement, on s'attend à ce que ces mesures suivent la distribution normale. Reportez vous à Ajustement de Distributions Exemple dans l aide pour la correction. Acquis Ce que vous devez savoir faire à l issu de ce chapitre pour les ajustements de distribution: Différencier les distributions suivantes: loi normal, binomiale, Chi², Poisson, Bernoulli Effectuer un test d ajustement en gérant les paramètres de catégories (nombre, limites) Interpréter les résultats du K S et Chi² en fonction des graphiques. Cours réalisé par Benjamin Putois. 7