Formulaire de Statistiques

Documents pareils
Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

VI. Tests non paramétriques sur un échantillon

FORMULAIRE DE STATISTIQUES

Biostatistiques : Petits effectifs

Principe d un test statistique

Chapitre 3. Les distributions à deux variables

Analyse de la variance Comparaison de plusieurs moyennes

Relation entre deux variables : estimation de la corrélation linéaire

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

TABLE DES MATIERES. C Exercices complémentaires 42

1 Définition de la non stationnarité

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Introduction à l approche bootstrap

Estimation et tests statistiques, TD 5. Solutions

T de Student Khi-deux Corrélation

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

SPHINX Logiciel de dépouillement d enquêtes

Bureau : 238 Tel : dominique.muller@upmf-grenoble.fr

Lecture critique d article. Bio statistiques. Dr MARC CUGGIA MCU-PH Laboratoire d informatique médicale EA-3888

Limitations of the Playstation 3 for High Performance Cluster Computing

LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples.

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

Probabilité et Statistique pour le DEA de Biosciences. Avner Bar-Hen

BONUS MALUS. Voici, la façon de calculer la prime : Le montant de la prime à acquitter est égale à : P = PB. C où : P

Package TestsFaciles

Le risque Idiosyncrasique

Localisation des fonctions

1. Introduction Création d'une requête...2

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux

Lois de probabilité. Anita Burgun

Introduction aux Statistiques et à l utilisation du logiciel R

Statistiques Descriptives à une dimension

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

Équivalence et Non-infériorité

Mode Opératoire Ciel Gestion commerciale V 12 et s (2006)

M2 IAD UE MODE Notes de cours (3)

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Création d'un identifiant Apple sans carte bancaire

Alarme domestique- Présentation

Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants)

DETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES

Introduction à la Statistique Inférentielle

Optimisation Discrète

données en connaissance et en actions?

Fibonacci et les paquerettes

Utilisation de l outil lié à MBKSTR 9

EXCEL PERFECTIONNEMENT SERVICE INFORMATIQUE. Version /11/05

RECOPLUS LOGICIEL DE GESTION DES RECOMMANDES NOTICE D UTILISATION DE RECOPLUS RESEAU. N de série

Correction de l examen de la première session

Problème 1 : applications du plan affine

Cours de Tests paramétriques

Formulaire d abonnement au service e-bdl

1. Vocabulaire : Introduction au tableau élémentaire

Analyse statistique de données qualitatives et quantitatives en sciences sociales : TP RÉGRESSION LOGISTIQUE (MODÈLES CHAPITRE 1)

Guide d utilisation commandes des pièces de rechange Rev.1.0.3

Organigramme / Algorigramme Dossier élève 1 SI

FORMATION EXCEL NIVEAU 2

Systèmes de transmission

Trépier avec règle, ressort à boudin, chronomètre, 5 masses de 50 g.

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Cycle de formation certifiante Sphinx

Complexité. Licence Informatique - Semestre 2 - Algorithmique et Programmation

Régler les paramètres de mesure en choisissant un intervalle de mesure 10µs et 200 mesures.

Précision d un résultat et calculs d incertitudes

Intérêt du découpage en sous-bandes pour l analyse spectrale

TSTI 2D CH X : Exemples de lois à densité 1

Utiliser le service de messagerie électronique de Google : gmail (1)

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA

Modes Opératoires WinTrans Mai 13 ~ 1 ~

Français. Le produit vous offre un outil pratique de qualité supérieure pour. Introduction. Information de sécurité

Multichronomètre SA10 Présentation générale

TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options

La place de SAS dans l'informatique décisionnelle

Exo7. Calculs de déterminants. Fiche corrigée par Arnaud Bodin. Exercice 1 Calculer les déterminants des matrices suivantes : Exercice 2.

Logiciel XLSTAT version rue Damrémont PARIS

Figure 1a Wasmannia auropunctata (Ouvrière), morphologie. 1 millimètre

BIOSTATISTIQUES AVANCEES PLAN. Quelques références. Master Biologie Intégrative 1 ère année

Gestion réactive des opérations de maintien et d actualisation réglementaire et technologique des systèmes complexes.

Lire ; Compter ; Tester... avec R

Régression linéaire. Nicolas Turenne INRA

NOTICE D UTILISATION

Le logiciel : un outil de gestion des données, une aide pour le choix des techniques et un outil de communication pour le personnel de terrain

Utilisation du logiciel ModellingSpace

«Cours Statistique et logiciel R»

La conversion de données : Convertisseur Analogique Numérique (CAN) Convertisseur Numérique Analogique (CNA)

Essais précoces non comparatifs : principes et calcul du nombre de sujets nécessaire

Séries Statistiques Simples

Contrat de prélèvement automatique pour la restauration scolaire, et l'accueil de Loisirs Associées à l Ecole (A.L.A.E.) (exemplaire Mairie)

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année

Soutenance de stage Laboratoire des Signaux et Systèmes

Probabilités III Introduction à l évaluation d options

Etude des propriétés empiriques du lasso par simulations

Document d orientation sur les allégations issues d essais de non-infériorité

AC AB. A B C x 1. x + 1. d où. Avec un calcul vu au lycée, on démontre que cette solution admet deux solutions dont une seule nous intéresse : x =

Transcription:

Formulaire de Statistiques Table des matières Intervalles de confiance... 2 Variable quantitative... 2 Variable qualitative... 2 Comparaison observé/théorique... 2 Variable quantitative... 2 Variable qualitative... 3 Comparaison d échantillons indépendants... 3 Variable quantitative... 3 Cas n 1 : deux grands échantillons (n 1 et n 2 > 30)... 3 Cas n 2 : au moins un petit échantillon (n 1 et/ou n 2 > 30)... 4 Variable qualitative... 4 Test ε : utile si risque unilatéral, n 1 et n 2 > 30... 4 Test du ² d homogénéité : utile surtout si risque bilatéral... 5 Comparaison d échantillons appariés... 6 Variable quantitative... 6 Variable qualitative... 6 Test du ² de Mac Nemar : comparaison de fréquences appariées... 6 Corrélation et régression... 6 Covariance estimée cov(x ; y)... 6 Démontrer l existence ou l absence d une corrélation linéaire... 7 Calcul Coefficient de corrélation r... 7 Test de significativité du coefficient de corrélation... 7 Test du ² d indépendance... 7 Droite de régression... 7 Equation de la droite de régression y i=ax i+b... 7 Test de significativité de la pente a... 8 Intervalle de confiance de la pente a... 8 Laura RUESCHE - 2013. Page 1

Intervalles de confiance Variable quantitative Avec m : moyenne de l échantillon s : écart type estimé de l échantillon n : effectif de l échantillon ε α : 1.96 si α = 0.05 - X -> N(0;1) dans la population - Si n < 30 : utiliser t α (table de Student, ddl =n-1) à la place de ε α Variable qualitative Avec p : fréquence observée, q=1-p n : effectif de l échantillon ε α : 1.96 si α = 0.05 - np et nq >> 5 - np i, np s, nq i et nq s > 5 (bornes de l I c) Comparaison observé/théorique Variable quantitative Hypothèse nulle H 0 : m = μ Hypothèse alternative H 1 : m μ, au risque α (préciser si risque uni/bilatéral) Avec m : moyenne de l échantillon, μ : moyenne dans la population s : écart type estimé de l échantillon n : effectif de l échantillon - X -> N(0;1) dans la population - Si n < 30 : utiliser t α (table de Student, ddl =n-1) à la place de ε α Laura RUESCHE - 2013. Page 2

Interprétation : - Si > ε α on rejette H 0 - Si < ε α on ne peut pas rejeter H 0 (ne pas surtout écrire «on accepte H0») Variable qualitative Hypothèse nulle H 0 : p = p 0 Hypothèse alternative H 1 : p p 0, au risque α (préciser si risque uni/bilatéral) Avec : p : fréquence observée, p 0 : fréquence théorique dans la population n : effectif de l échantillon - np, nq, np 0, nq 0 > 5 - Si n < 30 : utiliser t α (table de Student, ddl =n-1) à la place de ε α Interprétation : - Si > ε α on rejette H 0 - Si < ε α on ne peut pas rejeter H 0 (ne pas surtout écrire «on accepte H0») Comparaison d échantillons indépendants Variable quantitative Cas n 1 : deux grands échantillons (n 1 et n 2 > 30) H 0 : m 1 = m 2 H 1 : m 1 m 2, au risque α (préciser si risque uni/bilatéral) Avec m 1 : moyenne de l échantillon 1 s² 1 : variance de l échantillon 1 n 1 : effectif de l échantillon 1 - X -> N(0;1) dans la population - Vérifier l hypothèse d identité des variances (homoscédasticité) par le test F de Fisher - n 1 et n 2 > 30 sinon, utiliser test T de Student (table de Student, ddl =n 1+n 2-2) à la place de ε α Test F de Fisher Laura RUESCHE - 2013. Page 3

Interprétation : H0 : s²1=s²2 H1 : s²1 s²2 au risque α=5% Calcul : avec s² 1> s² 2 Comparaison de F calculé avec F de la table de Fisher (si α = 5% prendre la table au point 2.5) ddl : ν 1=n 1-1 ; ν 2=n 2-1 - Si > ε α on rejette H 0 - Si < ε α on ne peut pas rejeter H 0 (ne pas surtout écrire «on accepte H0») Cas n 2 : au moins un petit échantillon (n 1 et/ou n 2 > 30) H 0 : m 1 = m 2 Test de Student H 1 : m 1 m 2, au risque α (préciser si risque uni/bilatéral) Avec s² c : variance estimée moyenne - Hypothèse d homoscédasticité vérifiée (test F) - Si test F OK : calculer la variance estimée moyenne ( ) ( ) Interprétation : - Si > t α on rejette H 0 - Si < t α on ne peut pas rejeter H 0 (ne pas surtout écrire «on accepte H0») - Avec t α = t de la table de Student, ddl =n 1+n 2-2 Variable qualitative Test ε : utile si risque unilatéral, n 1 et n 2 > 30 H 0 : p 1 = p 2 H 1 : p 1 > ou < p 2 au risque α unilatéral Avec : Laura RUESCHE - 2013. Page 4

- n, n, n, n, > 5 - Si n < 30 : utiliser le test de Student avec ddl = n 1+n 2-2 Interprétation : - Si > ε α on rejette H 0 - Si < ε α on ne peut pas rejeter H 0 (ne pas surtout écrire «on accepte H0») Test du ² d homogénéité : utile surtout si risque bilatéral NB : il est possible de comparer plus de 2 échantillons/classes grâce à ce test Hypothèses : - H0 : i pi = pi0 - H 1 : pi pi0 Tableau de contingence (exemple) : Fumeurs Non-fumeurs Total colonne Malades Oi 1 Ci 1 Oi 3 Ci 3 m Sains Oi 2 Ci 2 Oi 4 Ci 4 s Total ligne f nf Effectif global Avec : Oi : effectifs observés, Ci : effectifs théoriques calculés sous H0 : - Effectif global N > 20 - Si N ϵ ]20 ; 40] : faire la correction de Yates - Si N > 40 : pas de correction nécessaire même si certains C i <5 - Si certains Oi < 5 : faire un regroupement de classes si possible. Calcul : [ ( ) ] Avec la correction de Yates : [ ( ) ] Laura RUESCHE - 2013. Page 5

Interprétation : - Comparer ² c avec ² de la table : ddl = (nb de lignes -1)(nb de colonnes -1) - Si classes : ddl = nb de classes -1 - Si > ² α on rejette H 0 - Si < ² α on ne peut pas rejeter H 0 (ne pas surtout écrire «on accepte H0») Comparaison d échantillons appariés Variable quantitative 1) Calculer la série Z avec z i = x i - y i (différence relative entre les deux séries) 2) Calculer m z la moyenne des différences, et s² z la variance de différences 3) Effectuer un test de Student de comparaison de la moyenne des différences m z avec une moyenne théorique μ = 0, en posant l hypothèse que la série Z suit une distribution gaussienne dans la population ; Variable qualitative Test du ² de Mac Nemar : comparaison de fréquences appariées Soit : a = nombre d occurrences de A+/Bb= nombre d occurrences de A-/B+ a + b 10 Formule : ( ) A comparer avec ² de la table ddl = 1 Corrélation et régression Définitions : - Corrélation : deux variables => calcul d une covariance possible - Régression : une variable et un paramètre fixe Covariance estimée cov(x ; y) ( ) ( ) Laura RUESCHE - 2013. Page 6

Démontrer l existence ou l absence d une corrélation linéaire Calcul Coefficient de corrélation r NB : r ϵ ]-1 ; 1[ [ ( ) ] [ ( ) ] Test de significativité du coefficient de corrélation Test de Student à n-2 ddl - H0 : r = 0 : pas de liaison affine entre X et Y - H 1 : r 0 au risque α (préciser si risque uni/bilatéral) on suppose que X et Y -> N(0 ;1) dans la population Test du ² d indépendance - H0 : pas de liaison affine entre X et Y - H 1 : il existe une liaison affine au risque α Idem que le Test du ² d homogéneité Droite de régression Equation de la droite de régression y i=ax i+b Calcul de la pente a ( ) ( ) Calcul de l ordonnée à l origine b : Avec : Laura RUESCHE - 2013. Page 7

Test de significativité de la pente a Test de Student à n-2 ddl : comparaison de la pente à 0 - H0 : r = 0 - H 1 : r 0 au risque α Avec s² a : variance de la pente a Intervalle de confiance de la pente a Avec t α/2 : t de la table de Student correspondant au risque α/2 Laura RUESCHE - 2013. Page 8