Séminaire de statistique version 1.0



Documents pareils
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

TABLE DES MATIERES. C Exercices complémentaires 42

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

Document d orientation sur les allégations issues d essais de non-infériorité

Théorème du point fixe - Théorème de l inversion locale

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

Table des matières. I Mise à niveau 11. Préface

Estimation et tests statistiques, TD 5. Solutions

Probabilités et Statistiques. Feuille 2 : variables aléatoires discrètes

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Introduction à la statistique non paramétrique

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

Simulation de variables aléatoires

Estimation: intervalle de fluctuation et de confiance. Mars IREM: groupe Proba-Stat. Fluctuation. Confiance. dans les programmes comparaison

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes

TESTS D'HYPOTHESES Etude d'un exemple

Calcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes.

AICp. Vincent Vandewalle. To cite this version: HAL Id: inria

Biostatistiques : Petits effectifs

Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage

Introduction à l approche bootstrap

Théorie de l estimation et de la décision statistique

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Économetrie non paramétrique I. Estimation d une densité

Tests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Lois de probabilité. Anita Burgun

Programmes des classes préparatoires aux Grandes Ecoles

Correction du baccalauréat ES/L Métropole 20 juin 2014

Cours de Tests paramétriques

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

NON-LINEARITE ET RESEAUX NEURONAUX

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Principe d un test statistique

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Essais précoces non comparatifs : principes et calcul du nombre de sujets nécessaire

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

Chapitre 3. Les distributions à deux variables

Nombre dérivé et tangente

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

La Licence Mathématiques et Economie-MASS Université de Sciences Sociales de Toulouse 1

Trafic aérien de passagers au Canada : une analyse exploratoire du modèle origine-destination de Transports Canada pour le marché intérieur

Introduction à la Statistique Inférentielle

Analyse stochastique de la CRM à ordre partiel dans le cadre des essais cliniques de phase I

Développements limités, équivalents et calculs de limites

VI. Tests non paramétriques sur un échantillon

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG

Mises en relief. Information supplémentaire relative au sujet traité. Souligne un point important à ne pas négliger.

La fonction exponentielle

Évaluation de la régression bornée

Loi binomiale Lois normales

Probabilités III Introduction à l évaluation d options

IFT3245. Simulation et modèles

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Chapitre 4 : Régression linéaire

Actuariat I ACT2121. septième séance. Arthur Charpentier. Automne charpentier.arthur@uqam.ca. http ://freakonometrics.blog.free.

LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples.

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

Les modèles de choix binaire

Probabilité et Statistique pour le DEA de Biosciences. Avner Bar-Hen

Essais cliniques de phase 0 : état de la littérature

DM 10 : La fusion nucléaire, l énergie de l avenir? CORRECTION

BACCALAURÉAT GÉNÉRAL SESSION 2012 OBLIGATOIRE MATHÉMATIQUES. Série S. Durée de l épreuve : 4 heures Coefficient : 7 ENSEIGNEMENT OBLIGATOIRE

Baccalauréat ES Amérique du Nord 4 juin 2008

Polynômes à plusieurs variables. Résultant

Séminaire TEST. 1 Présentation du sujet. October 18th, 2013

1 Définition de la non stationnarité

Corrigé du baccalauréat S Asie 21 juin 2010

Modèle GARCH Application à la prévision de la volatilité

Probabilités conditionnelles Loi binomiale

Le modèle de régression linéaire

Chapitre 3 : INFERENCE

Construction de bases biométriques pour l assurance dépendance. SCOR inform - Novembre 2012

Équivalence et Non-infériorité

APPLICATION QMS AMIKACINE Système intégré Ortho Clinical Diagnostics VITROS 5600, systèmes de chimie VITROS 5,1 FS et 4600

SYSTEMES LINEAIRES DU PREMIER ORDRE

Modélisation aléatoire en fiabilité des logiciels

Raisonnement probabiliste

Principe de symétrisation pour la construction d un test adaptatif

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.

Exercices M1 SES Ana Fermin ( fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

Baccalauréat ES/L Métropole La Réunion 13 septembre 2013 Corrigé

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA

3 Approximation de solutions d équations

Baccalauréat ES Antilles Guyane 12 septembre 2014 Corrigé

Découverte du logiciel ordinateur TI-n spire / TI-n spire CAS

LE RÔLE DE LA STATISTIQUE DANS UN PROCESSUS DE PRISE DE DÉCISION

Cours de méthodes de scoring

Introduction aux Statistiques et à l utilisation du logiciel R

Problèmes arithmétiques issus de la cryptographie reposant sur les réseaux

C f tracée ci- contre est la représentation graphique d une

Transcription:

Séminaire de statistique version 1.0

Plan 1 2 3 4

Approche décisionnelle Test classique Choisir l une des 2 décisions suivantes :

Approche décisionnelle Test classique Choisir l une des 2 décisions suivantes : Hypothèse nulle H 0

Approche décisionnelle Test classique Choisir l une des 2 décisions suivantes : Hypothèse nulle H 0 Hypothèse alternative H 1

Approche décisionnelle Choisir l une des 3 décisions suivantes :

Approche décisionnelle Choisir l une des 3 décisions suivantes : Hypothèse nulle H 0

Approche décisionnelle Choisir l une des 3 décisions suivantes : Hypothèse nulle H 0 Hypothèse alternative H 1

Approche décisionnelle Choisir l une des 3 décisions suivantes : Hypothèse nulle H 0 Hypothèse alternative H 1 Information insuffisante, besoin de plus de données

Forme générale d un test statistique Tout test peut être exprimé en fonction de deux statistiques, obtenues à partir de la : une mesure de la différence Z une mesure de l information V

Forme générale d un test statistique Tout test peut être exprimé en fonction de deux statistiques, obtenues à partir de la : une mesure de la différence Z une mesure de l information V

Forme générale d un test statistique Tout test peut être exprimé en fonction de deux statistiques, obtenues à partir de la : une mesure de la différence Z une mesure de l information V

Quelques rappels La dépendant à la fois : des donnés X de paramètres d intérêt θ de paramètres de nuisance φ

Quelques rappels La dépendant à la fois : des donnés X de paramètres d intérêt θ de paramètres de nuisance φ

Quelques rappels La dépendant à la fois : des donnés X de paramètres d intérêt θ de paramètres de nuisance φ

Quelques rappels La dépendant à la fois : des donnés X de paramètres d intérêt θ de paramètres de nuisance φ

Quelques rappels En notant ˆφ(θ) l estimation du maximum de de φ pour une valeur de θ fixée, on a que l(θ, ˆφ(θ), X) est asymptotiquement une bonne approximation de la log- l(θ, φ, X) et qu elle ne dépendant que de θ.

Quelques rappels En notant ˆφ(θ) l estimation du maximum de de φ pour une valeur de θ fixée, on a que l(θ, ˆφ(θ), X) est asymptotiquement une bonne approximation de la log- l(θ, φ, X) et qu elle ne dépendant que de θ. On peut faire un développement limité à l ordre 2 de l(θ, ˆφ(θ), X) par rapport à θ l(θ, ˆφ(θ), X) = constante + θ Z 1 2 θ Vθ + o(θ θ)

Les termes du développement limité Z est la dérivée première de l(θ, ˆφ(θ), X) par rapport à θ V est la dérivée seconde de l(θ, ˆφ(θ), X) par rapport à θ Ce sont aussi les statistiques Z (le score) et V (la matrice d information de Fisher) que l on utilise dans l approche séquentielle Quand θ est petit, Z suit une loi normale N(θZ, V)

Les termes du développement limité Z est la dérivée première de l(θ, ˆφ(θ), X) par rapport à θ V est la dérivée seconde de l(θ, ˆφ(θ), X) par rapport à θ Ce sont aussi les statistiques Z (le score) et V (la matrice d information de Fisher) que l on utilise dans l approche séquentielle Quand θ est petit, Z suit une loi normale N(θZ, V)

Les termes du développement limité Z est la dérivée première de l(θ, ˆφ(θ), X) par rapport à θ V est la dérivée seconde de l(θ, ˆφ(θ), X) par rapport à θ Ce sont aussi les statistiques Z (le score) et V (la matrice d information de Fisher) que l on utilise dans l approche séquentielle Quand θ est petit, Z suit une loi normale N(θZ, V)

Les termes du développement limité Z est la dérivée première de l(θ, ˆφ(θ), X) par rapport à θ V est la dérivée seconde de l(θ, ˆφ(θ), X) par rapport à θ Ce sont aussi les statistiques Z (le score) et V (la matrice d information de Fisher) que l on utilise dans l approche séquentielle Quand θ est petit, Z suit une loi normale N(θZ, V)

Les statistiques Z et V en pratique Z = θ l(0, ˆφ(0), X) V = 2 θ θ l(0, ˆφ(0), X) + 2 «φ θ l(0, ˆφ(0), 2 «1 X) φ φ l(0, ˆφ(0), 2 «X) φ θ l(0, ˆφ(0), X)

Les statistiques Z et V en pratique Z = θ l(0, ˆφ(0), X) V = 2 θ θ l(0, ˆφ(0), X) + 2 «φ θ l(0, ˆφ(0), 2 «1 X) φ φ l(0, ˆφ(0), 2 «X) φ θ l(0, ˆφ(0), X)

1 Soit un échantillon d une loi normale N(µ, σ). La log- s écrit : l(µ, σ, x) = n 2 ln(2π)+ n 2 ln ( 1 σ 2 ) 1 2σ 2 x 2 i + 1 σ 2 µ x i n 2σ 2 µ2

1 Soit un échantillon d une loi normale N(µ, σ). La log- s écrit : l(µ, σ, x) = n 2 ln(2π)+ n 2 ln ( 1 σ 2 ) 1 2σ 2 x 2 i + 1 σ 2 µ x i n 2σ 2 µ2 Le paramètre d intérêt est la moyenne θ = µ et le paramètre de nuisance est la précision φ = 1, la log- s écrit σ2 alors : l(θ, φ, x) = n 2 ln(2π) + n 2 ln φ φ 2 x 2 i + φθ x i n 2 φθ2

1 Soit un échantillon d une loi normale N(µ, σ). La log- s écrit : l(µ, σ, x) = n 2 ln(2π)+ n 2 ln ( 1 σ 2 ) 1 2σ 2 x 2 i + 1 σ 2 µ x i n 2σ 2 µ2 Le paramètre d intérêt est la moyenne θ = µ et le paramètre de nuisance est la précision φ = 1, la log- s écrit σ2 alors : l(θ, φ, x) = n 2 ln(2π) + n 2 ln φ φ 2 x 2 i + φθ x i n 2 φθ2 ce qui donne : Z = ˆφ(0) x i V = ˆφ(0)n 2Z2 n

2 Soit deux échantillons respectivement de lois de Bernoulli B(m, p 1 ) et B(n, p 2 ). En prenant ( p1 θ = ln / p ) ( ) 2 p 1 p 2 et φ = ln 1 p 1 1 p 2 (1 p 1 )(1 p 2 ) on obtient Z = n x i1 m x j2 m + n V = mn( x i1 + x j2 ){(m x i1 )(n x j2 )} (m + n) 3

2 Soit deux échantillons respectivement de lois de Bernoulli B(m, p 1 ) et B(n, p 2 ). En prenant ( p1 θ = ln / p ) ( ) 2 p 1 p 2 et φ = ln 1 p 1 1 p 2 (1 p 1 )(1 p 2 ) on obtient Z = n x i1 m x j2 m + n V = mn( x i1 + x j2 ){(m x i1 )(n x j2 )} (m + n) 3

2 Soit deux échantillons respectivement de lois de Bernoulli B(m, p 1 ) et B(n, p 2 ). En prenant ( p1 θ = ln / p ) ( ) 2 p 1 p 2 et φ = ln 1 p 1 1 p 2 (1 p 1 )(1 p 2 ) on obtient Z = n x i1 m x j2 m + n V = mn( x i1 + x j2 ){(m x i1 )(n x j2 )} (m + n) 3

Liens entre l approche classique des tests et les statistiques Z et V En prenant un risque de première espèce α et un risque une puissance 1 α pour une valeur de référence θ R, pour une test unilatéral, on rejette l hypothèse nulle si Z k α, pour k α défini par P(Z k α ; θ = 0) = α P(Z k α ; θ = θ R ) = 1 α

Liens entre l approche classique des tests et les statistiques Z et V Comme Z(θ = 0) N(0, V) et Z(θ = θ R ) N(θ R V, V) cela revient à avoir : k α = 1 2 θ RV et V = ( ) 2 2ɛ1 α θ R

Représentaion d un test classique Z 1 2 θ RV rejeter H 0 accepter H 0 ( ) 2 2ɛ1 α θ R V

Plan 1 2 3 4

Avantages des plus éthiques que l approche classique ; nécessitent la plupart du temps moins de sujets.

Avantages des plus éthiques que l approche classique ; nécessitent la plupart du temps moins de sujets.

Inconvénients des la durée de l étude est aléatoire ; le nombre de sujets est aléatoire ; si la procédure s arrête rapidement, les estimations ponctuelles peuvent être très imprécises.

Inconvénients des la durée de l étude est aléatoire ; le nombre de sujets est aléatoire ; si la procédure s arrête rapidement, les estimations ponctuelles peuvent être très imprécises.

Inconvénients des la durée de l étude est aléatoire ; le nombre de sujets est aléatoire ; si la procédure s arrête rapidement, les estimations ponctuelles peuvent être très imprécises.

Test unilatéral du rapport de θ R Z rejeter H 0 continuer accepter H 0 θ 2 R V

Test unilatéral du rapport de θ R Z rejeter H 0 continuer accepter H 0 θ 2 R V

Test unilatéral du rapport de θ R Z rejeter H 0 continuer accepter H 0 θ 2 R V

Test unilatéral du rapport de θ R Z rejeter H 0 continuer accepter H 0 θ 2 R V

Test unilatéral du rapport de θ R Z rejeter H 0 continuer accepter H 0 θ 2 R V

Test unilatéral du rapport de θ R Z rejeter H 0 continuer accepter H 0 θ 2 R V

Test unilatéral du rapport de θ R Z rejeter H 0 continuer accepter H 0 θ 2 R V

Test unilatéral du rapport de θ R Z rejeter H 0 continuer accepter H 0 θ 2 R V

Test unilatéral du rapport de θ R Z rejeter H 0 continuer accepter H 0 θ 2 R V

Test bilatéral du rapport de θ R Z rejeter H 0 continuer accepter H 0 θr 2V continuer rejeter H 0

Test bilatéral du rapport de θ R Z rejeter H 0 continuer accepter H 0 θr 2V continuer rejeter H 0

Test bilatéral du rapport de θ R Z rejeter H 0 continuer accepter H 0 θr 2V continuer rejeter H 0

Inconvénients du test séquentiel du rapport de La probabilité que le chemin franchisse une frontière est de 1. Malgré cela l étude peut durer très longtemps.

Inconvénients du test séquentiel du rapport de La probabilité que le chemin franchisse une frontière est de 1. Malgré cela l étude peut durer très longtemps.

unilatéral θ R Z rejeter H 0 continuer accepter H 0 θ 2 R V

unilatéral θ R Z rejeter H 0 continuer accepter H 0 θ 2 R V

unilatéral θ R Z rejeter H 0 continuer accepter H 0 θ 2 R V

unilatéral θ R Z rejeter H 0 continuer accepter H 0 θ 2 R V

unilatéral θ R Z rejeter H 0 continuer accepter H 0 θ 2 R V

unilatéral θ R Z rejeter H 0 continuer accepter H 0 θ 2 R V

unilatéral θ R Z rejeter H 0 continuer accepter H 0 θ 2 R V

unilatéral θ R Z rejeter H 0 continuer accepter H 0 θ 2 R V

unilatéral θ R Z rejeter H 0 continuer accepter H 0 θ 2 R V

bilatéral θ R Z rejeter H 0 continuer accepter H 0 θr 2V continuer rejeter H 0

bilatéral θ R Z rejeter H 0 continuer accepter H 0 θr 2V continuer rejeter H 0

bilatéral θ R Z rejeter H 0 continuer accepter H 0 θr 2V continuer rejeter H 0

Propriétés du test triangulaire C est un plan fermé. On s arrête obligatoirement au plus tard à un temps fini maximal. S arrête souvent un peu plus tard que le test du rapport de.

Propriétés du test triangulaire C est un plan fermé. On s arrête obligatoirement au plus tard à un temps fini maximal. S arrête souvent un peu plus tard que le test du rapport de.

Test bilatéral restreint θ R Z rejeter H 0 continuer accepter H 0 θ 2 R V rejeter H 0

Test bilatéral restreint θ R Z rejeter H 0 continuer accepter H 0 θ 2 R V rejeter H 0

Test bilatéral restreint θ R Z rejeter H 0 continuer accepter H 0 θ 2 R V rejeter H 0

Propriétés du test restreint Ne s arrête plus tôt que si on accepte l hypothèse alternative H 1. Si on va jusqu au bout, il accepte plus souvent l hypothèse nulle H 0 que le test classique.

Propriétés du test restreint Ne s arrête plus tôt que si on accepte l hypothèse alternative H 1. Si on va jusqu au bout, il accepte plus souvent l hypothèse nulle H 0 que le test classique.

Test bilatéral répété ou groupé θ R Z rejeter H 0 continuer accepter H 0 θ 2 R V rejeter H 0

Test bilatéral répété ou groupé θ R Z rejeter H 0 continuer accepter H 0 θ 2 R V rejeter H 0

Test bilatéral répété ou groupé θ R Z rejeter H 0 continuer accepter H 0 θ 2 R V rejeter H 0

Propriétés des tests répétés ou groupés Le cadre séquentiel est naturel pour les tests répétés. Comme pour les tests restreints, on ne s arrête prématurément que pour refuser l hypothèse nulle H 0. Le test restreint est plus économique sous l hypothèse alternative H 1 et le test répété sous l hypothèse nulle H 0.

Propriétés des tests répétés ou groupés Le cadre séquentiel est naturel pour les tests répétés. Comme pour les tests restreints, on ne s arrête prématurément que pour refuser l hypothèse nulle H 0. Le test restreint est plus économique sous l hypothèse alternative H 1 et le test répété sous l hypothèse nulle H 0.

Propriétés des tests répétés ou groupés Le cadre séquentiel est naturel pour les tests répétés. Comme pour les tests restreints, on ne s arrête prématurément que pour refuser l hypothèse nulle H 0. Le test restreint est plus économique sous l hypothèse alternative H 1 et le test répété sous l hypothèse nulle H 0.

Le taux de signification à dépend de l endroit où l on sort. Quand on accepte l hypothèse alternative H 1, plus on sort tôt plus p est faible. Pour les tests du rapport de et triangulaires, quand on accepte l hypothèse nulle H 0, plus on sort tôt plus p est grand. Pour les tests restreints et répétés, quand on accepte l hypothèse nulle H 0, plus on sort près de l abscisse plus p est grand.

Le taux de signification à dépend de l endroit où l on sort. Quand on accepte l hypothèse alternative H 1, plus on sort tôt plus p est faible. Pour les tests du rapport de et triangulaires, quand on accepte l hypothèse nulle H 0, plus on sort tôt plus p est grand. Pour les tests restreints et répétés, quand on accepte l hypothèse nulle H 0, plus on sort près de l abscisse plus p est grand.

Le taux de signification à dépend de l endroit où l on sort. Quand on accepte l hypothèse alternative H 1, plus on sort tôt plus p est faible. Pour les tests du rapport de et triangulaires, quand on accepte l hypothèse nulle H 0, plus on sort tôt plus p est grand. Pour les tests restreints et répétés, quand on accepte l hypothèse nulle H 0, plus on sort près de l abscisse plus p est grand.

Le taux de signification à dépend de l endroit où l on sort. Quand on accepte l hypothèse alternative H 1, plus on sort tôt plus p est faible. Pour les tests du rapport de et triangulaires, quand on accepte l hypothèse nulle H 0, plus on sort tôt plus p est grand. Pour les tests restreints et répétés, quand on accepte l hypothèse nulle H 0, plus on sort près de l abscisse plus p est grand.

Tous les peuvent être adaptés au cas où il y a des facteurs régressifs ou pronostiques. Le test se fait conditionnellement aux valeurs des coefficients des facteurs de nuisance (facteurs pronostiques servant à l ajustement).

Tous les peuvent être adaptés au cas où il y a des facteurs régressifs ou pronostiques. Le test se fait conditionnellement aux valeurs des coefficients des facteurs de nuisance (facteurs pronostiques servant à l ajustement).

Plan 1 2 3 4

1 association maladie chronique du foie et lichen plan ; 2 association entre exposition aux acariens et sensibilisation ; 3 association entre anticorps antiphospholipides et prééclampsie.

1 association maladie chronique du foie et lichen plan ; 2 association entre exposition aux acariens et sensibilisation ; 3 association entre anticorps antiphospholipides et prééclampsie.

1 association maladie chronique du foie et lichen plan ; 2 association entre exposition aux acariens et sensibilisation ; 3 association entre anticorps antiphospholipides et prééclampsie.

1 association maladie chronique du foie et lichen plan ; 2 association entre exposition aux acariens et sensibilisation ; 3 association entre anticorps antiphospholipides et prééclampsie.

Plan 1 2 3 4

Armitage, P. Sequential medical trials. Blackwell, 2 e édition, 1975. Gosh, B.K. (rédacteur) Handbook of sequential analysis. Decker, 1991. Siegmund, D. Sequential analysis. Tests and confidence intervals. Springer, 1985. Wetherill, G.B. et K.D. Glazebrook Sequential methods in statistics. Chapman and Hall, 2 e édition, 1986. Whitehead, J. The design and analysis of sequential clinical trials. Ellis Horwood, 2 e édition, 1997.