Exemples de problématique

Documents pareils
Analyse de la variance Comparaison de plusieurs moyennes

Introduction aux Statistiques et à l utilisation du logiciel R

Lire ; Compter ; Tester... avec R

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

Biostatistiques : Petits effectifs

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Exemples d application

Principe d un test statistique

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

MODELE A CORRECTION D ERREUR ET APPLICATIONS

Cours 9 : Plans à plusieurs facteurs

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

2010 Minitab, Inc. Tous droits réservés. Version Minitab, le logo Minitab, Quality Companion by Minitab et Quality Trainer by Minitab sont des

Nouveau Barème W.B.F. de points de victoire 4 à 48 donnes

Une introduction. Lionel RIOU FRANÇA. Septembre 2008

Annexe commune aux séries ES, L et S : boîtes et quantiles

Introduction à la statistique non paramétrique

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

Introduction à l approche bootstrap

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Représentation d une distribution

distribution quelconque Signe 1 échantillon non Wilcoxon gaussienne distribution symétrique Student gaussienne position

La crise économique vue par les salariés français

Bureau : 238 Tel : dominique.muller@upmf-grenoble.fr

1 Définition de la non stationnarité

Statistiques. Rappels de cours et travaux dirigés. Master 1 Biologie et technologie du végétal. Année

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

Logiciel XLSTAT version rue Damrémont PARIS

TABLE DES MATIERES. C Exercices complémentaires 42

Estimation du coût de l incessibilité des BSA

FORMULAIRE DE STATISTIQUES

Le Modèle Linéaire par l exemple :

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

Evaluation de la variabilité d'un système de mesure

Estimation et tests statistiques, TD 5. Solutions

Exemples d Analyses de Variance avec R

Fitted Surface; Variable: Y_REND 2 factors, 1 Blocks, 13 Runs; MS Pure Error=.053 DV: Y_REND

Cours de méthodes de scoring

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN

Analyse de variance à deux facteurs (plan inter-sujets à deux facteurs) TP9

VI. Tests non paramétriques sur un échantillon

Exercices M1 SES Ana Fermin ( fermin.perso.math.cnrs.fr/ ) 14 Avril 2015

Chapitre 3. Les distributions à deux variables

Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants)

Le risque Idiosyncrasique

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Statistiques à une variable

La classification automatique de données quantitatives

Evaluation des modèles non-linéaires à effets mixtes

Analyse des correspondances avec colonne de référence

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Données longitudinales et modèles de survie

Exemple PLS avec SAS

23. Interprétation clinique des mesures de l effet traitement

La nouvelle planification de l échantillonnage

Modèles pour données répétées

IBM SPSS Regression 21

données en connaissance et en actions?

Introduction au pricing d option en finance

L'évaluation par les pairs dans un MOOC. Quelle fiabilité et quelle légitimité? Rémi Bachelet Ecole Centrale de Lille 24 novembre 2014, Université

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

Mesures et incertitudes

Définition 0,752 = 0,7 + 0,05 + 0,002 SYSTÈMES DE NUMÉRATION POSITIONNELS =

Efficience de l actif de l entreprise

Régression linéaire. Nicolas Turenne INRA

Cours de Structures en béton

Note de service À : De :

Resolution limit in community detection

Statistique : Résumé de cours et méthodes

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux

Notions de base sur l énergie solaire photovoltaïque

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

Un exemple de régression logistique sous

CAPTEURS - CHAINES DE MESURES

Exercice : la frontière des portefeuilles optimaux sans actif certain

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring

Value at Risk. CNAM GFN 206 Gestion d actifs et des risques. Grégory Taillard. 27 février & 13 mars 20061

TESTS D'HYPOTHESES Etude d'un exemple

Probabilité et Statistique pour le DEA de Biosciences. Avner Bar-Hen

afférent au projet de décret relatif aux obligations indexées sur le niveau général des prix

Localisation des fonctions

TD1 Signaux, énergie et puissance, signaux aléatoires

- MANIP 2 - APPLICATION À LA MESURE DE LA VITESSE DE LA LUMIÈRE

Application sur le Dispositif en Blocs Complètement Randomisés

Résumé du Cours de Statistique Descriptive. Yves Tillé

Leçon N 4 : Statistiques à deux variables

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

PROGRAMME (Susceptible de modifications)

Relation entre deux variables : estimation de la corrélation linéaire

STATISTIQUES. UE Modélisation pour la biologie

Data Mining. Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.

Etude des propriétés empiriques du lasso par simulations

Soutenance de stage Laboratoire des Signaux et Systèmes

Faire un semi variograme et une carte krigée avec surfer

Rapport. Mesures de champ de très basses fréquences à proximité d antennes de stations de base GSM et UMTS

INDICES DE PRIX EXPÉRIMENTAUX DES SERVICES FINANCIERS

CALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING

Probabilités III Introduction à l évaluation d options

LE COSMODETECTEUR : UN EXEMPLE DE CHAÎNE DE MESURE

Transcription:

Expériences comparatives avec un facteur Problématique facteur à 2 modalités ( niveaux ) - Test d hypothèse - Test t de Student - Intervalle de confiance facteur à 3 modalités et plus - Modèle d analyse de variance - Décomposition variabilité : ANOVA - Test F de Fisher - Analyse des résidus - Comparaisons a posteriori - Nombre de répétitions Exemples de problématique Exemple 2.- procédé de gravure chimique («wet etching») enlèvement du silicium sur des «wafers» avant métallisation variable de réponse : taux d enlèvement du procédé comparaison efficacité de 2 solutions (facteur) données : taux d enlèvement sur 0 «wafers» chaque solution solution : 9.9 0.6 9.4 0.3 9.3 0.0 9.6 0.3 0.2 0. solution 2 : 0.2 0.0 0.6 0.2 0.7 0.7 0.4 0.4 0.5 0.3 différence significative? Exemple 2.2 - effet du flux du C 2 F 6 sur l uniformité gravure «wafer» variable de réponse : uniformité ( % ) tranches («wafer») de silicium facteur à 3 modalités: taux du C 2 F 6 - modalités (niveaux) : 25-60-0 flux uniformité 25 2.7 4.6 2.6 3.0 3.2 3.8 60 4.9 4.6 5.0 4.2 3.6 4.2 0 4.6 3.4 2.9 3.5 4. 5. différences significatives? si oui, lesquelles? 2

Méthodes d analyse Ex 2. Test t de Student cadre pour des expériences de comparaison simple : facteur variant à 2 modalités utilisé dans tous les plans expérimentaux avec : plusieurs facteurs variant à 2 modalités Ex 2.2 ANOVA ANALSIS OF VARIANCE analyse de la variance - facteur avec k ( 3 et plus ) modalités - aussi avec plusieurs (2 et plus) facteurs - test t ne s applique pas directement - méthode d analyse : ANOVA - décomposition de la variabilité selon les sources - méthode d analyse fondamentale employée dans toutes les expériences industrielles / scientifiques 3 facteur à 2 niveaux : test t Student ( / 6 ) niveau facteur A niveau 2 0.4 0.4 ~N (µ 0.2, σ 2 ) Hypothèse nulle H 0.2 0 : µ = µ 2 ~N(µ 2, σ 2 ) 0.0 0.08 Hyp. alternative 0.0 H : µ µ 2 0.08 GAUSS 0.06 0.04 σ GAUSS 0.06 0.04 σ 0.02 0.00 0.00 µ µ 2-0.02-0.02-2 0 2 4 6 8 0 2 4 6 8 22 24 26-2 0 2 4 6 8 0 2 4 6 8 22 24 26 y U y 2 y n échantillon U y 2 y 22 y 2 n2 0.02 facteur A affecte t-il la variable de réponse? y = y i /n S 2 = ( y i y ) 2 /( n - ) moyennes variances y 2 = y 2i / n2 S 2 2 = ( y 2i y 2 ) 2 /( n2 - ) σ 2 =[(n ) s 2 + (n 2 ) s 2 2 ]/ (n + n 2-2) estimation erreur expérimentale σ décision basée sur écart y - y 2 4

facteur à 2 niveaux : test t Student (2 / 6 ) test de comparaison effet du facteur A t = différence des moyennes écart type (différences des moyennes ) Statistique t de Student t = loi Student avec y y 2 σ [ /n + /n 2 ] 0.5 df = n + n 2-2 degrés de liberté t t t t «près de zéro» supporte H 0 : pas de différence c-à-d facteur n affecte pas «très différente de zéro» supporte H : le facteur A affecte la moyenne de est un rapport signal / bruit distance entre les moyennes en unités d écart types 5 facteur à 2 niveaux : test t Student (3 / 6 ) procédure objective pour décider si t est «grand» En 908, W. S. Gosset ( pseudonyme Student ) obtient la distribution t appelé «Student» Tables logiciel statistique «p-value» distribution Student df >= 30 df =30 Student df =2 df = normale 6

facteur à 2 niveaux : test t Student (4 / 6 ) Ex 2. : analyse 0.8 0.6 Boîte à moustaches: taux etch Sol 2 y 9.97 0.40 S 0.42 0.23 taux etch 0.4 0.2 0.0 9.8 9.6 9.4 9.2 2 ty p e s o lu tio n Median 25% -75% Min-Max Tests t ; Classmt : type solution (Ex-2.-gravure.sta) Groupe: Groupe2: 2 Moyenne Moyenne Valeur t dl p N Actifs N Actifs Ecart- Type Ecart- Type Ratio F p taux etch 9.97000 0.4000-2.8278 8 0.05 0 0 0.42769 0.230940 3.3354 0.0873 p -value = risque rejeter faussement l hypothèse H 0 7 facteur à 2 niveaux : test t Student (5 / 6 ) vérification de la normalité des données 2.0 Droite de Henry Catégorisée : taux etch.5.0 Valeur Normale Théorique 0.5 0.0-0.5 -.0 -.5-2.0 9.2 9.4 9.6 9.8 0.0 0.2 0.4 0.6 0.8 9.2 9.4 9.6 9.8 0.0 0.2 0.4 0.6 0.8 type solution: ty pe solution: 2 8

facteur à 2 niveaux : test t Student (6 / 6 ) Méthode intervalles de confiance Forme générale : intervalle de confiance pour θ L θ U avec P ( L θ U ) = - α Intervalle de confiance à 00(- α )% différence entre 2 moyennes µ - µ 2 : ( y - y 2 ) ± σ * t df, α/2 * ( /n + /n 2 ) 0.5 percentile distribution Student df = n + n 2-2 Ex 2. : Intervalle différence de moyenne µ - µ 2 ( - 0.758 à - 0.05) coefficient confiance de 95% 9 facteur à k niveaux : ANOVA (/3 ) Exemple 2.3 : optimisation «larger the better» recherche nouvelle composition de fibres synthétique tissus facteur : % coton varie entre 5 et 35 réponse : force de tension tissu à maximiser 5 modalités de fixées à: 5 25 30 35 exécution : complètement aléatoire / n = 5 répétitions Données y ij tension 26 Boîtes à Moustaches Catég. : 24 i/j 2 3 4 5 moyenne 22 5 7 7 5 9 9.8 2 2 7 2 8 8 5.4 8 6 25 3 4 8 8 9 9 7.6 4 30 4 9 25 22 9 23 2.6 2 0 35 5 7 0 5 0.8 8 6 5 25 30 35 Median 25%-75% Min-Max 0

facteur à k niveaux : ANOVA (2/3 ) ANOVA : analyse de la variabilité Tableau des données niveau i observations y i j moyennes y y 2 y 3 y n y. facteur contrôlé 2 y 2 y 22 y 23. 2 n y 2 i y i y 2 y i3. y i n y i.. a y a y a2 y a3. y a n y a. a niveaux du facteur - a traitements à comparer n répétitions dans un ordre complètement aléatoire nombre total d essais (observations) : a n objectif : comparer les traitements (effet de sur ) hypothèse nulle = pas de différences n influence pas facteur à k niveaux : ANOVA (3/3 ) Modèle de classification simple ij = µ + τ i + ε ij i =, 2,,a j =, 2,..,n a : nombre de modalité du facteur j : nombre de répétitions µ : effet général τ i : effet différentiel i-ième traitement ε ij : erreur expérimentale ~ N ( 0, σ 2 ) autres modélisations si le facteur quantitatif : modèle polynomial exemple = β 0 + β + β 2 2 + ε 2

facteur à k niveaux : ANOVA (4/3 ) Décomposition de la variabilité SS T variabilité totale équation de décomposition a n SS = ( y y ) T i= j= a n a n 2 2 ( yij y.. ) = [( yi. y.. ) + ( yij yi.)] i= j= i= j= a a n 2 2 (...) i ( ij i. ) i= i= j= = n y y + y y SS = SS + SS T Treatments E ij.. 2 inter variabilité intra variabilité 3 facteur à k niveaux : ANOVA (5/3 ) Tableau d analyse de la variance Source Somme carrés Deg. lib. Carré moyen F Traitements SS trait =n ( y i. y.. ) 2 a MS trait F 0 = MS trait /MS E Résiduelle SS E = SS T -SS trait a(n-) MS E Totale SS T = (y ij y.. ) 2 an distribution de référence pour F 0 : distribution F de Fisher avec df = a degrés de liberté au numérateur et df 2 = a(n-) degrés de liberté au dénominateur Test de H 0 : µ = µ 2 =. = µ a F0 > F α, a, a( n ) Rejeter l hypothèse nulle au seuil α si 4

facteur à k niveaux : ANOVA (6/3 ) Distribution F de Fisher si suit une loi Khi-deux avec df ddl 2 suit une loi Khi-deux avec df2 ddl et 2 sont indépendantes alors ( / df ) / ( 2 / df2 ) suit une loi F( df,df2 ) t 2 df = F (, df ) : carré Student = Fisher F( df =, df2 = df ) distribution F est employée dans toutes les analyses de plans d expériences 5 facteur à k niveaux : ANOVA (7/3 ) Ex. 2.3 : analyse avec STATISTICA ord. origine SC 5655.040 475.760 Degr. De liberté 4 MC 5655.040 8.940 F 70.679 4.7568 p 0.000000 0.000009 différences significatives Erreur 6.0 8.060 lesquelles? {} {2} {3} {4} {5} 2 3 5 25 0.0385 0.0027 0.0386 0.7373 0.0027 0.7373 0.0005 0.090 0.202 0.9798 0.64 0.0092 Test de Tukey: compare toutes 4 30 0.0005 0.090 0.202 0.0002 les paires 5 35 0.9798 0.64 0.0092 0.0002 6

facteur à k niveaux : ANOVA (8/3 ) analyse des résidus important de faire une vérification a posteriori quand on ajuste un modèle statistique hypothèses de base - distribution normale? - variance constante? - indépendance observations? - modèle OK? Si hypothèses de base violées - quoi faire? - réponse : transformer transformation de Box-Cox λ - 2 < λ < 2 les plus importantes 7 facteur à k niveaux : ANOVA (9/3) Analyse des résidus Residual Plots for Normal Probability Plot of the Residuals 99 5.0 Residuals Versus the Fitted Values Percent 90 50 0 Residual 2.5 0.0-2.5-5.0-2.5 0.0 Residual 2.5 5.0-5.0 0.0 2.5 5.0 7.5 Fitted Value.0 6.0 Histogram of the Residuals 5.0 Residuals Versus the Order of the Data Frequency 4.5 3.0.5 Residual 2.5 0.0-2.5 0.0-4 -2 0 Residual 2 4-5.0 2 4 6 8 0 2 4 6 8 Observation Order 22 24 8

facteur à k niveaux : ANOVA (0/3 ) Modèle de régression si facteur quantitatif 30 25 Tracé des Moyennes & Intervalle de Confiance (95.00%) Valeurs 5 0 5 25 = 62.6-9.0 x + 0. 4 8 x**2-0.0076 x**3 0 S 3.04839 R-Sq 69.4% R-Sq(adj) 65.0% 5 25 30 35 5 0 5 5 25 30 35 9 facteur à k niveaux : ANOVA (/3) nombre de répétitions : n =? n dépend de alpha (α ) : taux de fausse détection risque de rejeter une hypothèse vraie beta (β ) : taux de manque de détection risque d accepter une hypothèse fausse σ : erreur expérimentale = λσ: écart de moyenne à détecter λ = /σ : facteur de proportionnalité k : nombre de modalités (groupes) à comparer n : nombre de répétitions de chaque sous groupe (modalité) n = fonction (α, β, σ, λ, k ) Cas des expériences avec plusieurs facteurs : n entre 2 et 5 est généralement suffisant consulter l annexe

facteur à k niveaux : ANOVA (2/3 ) nombre de répétitions : n =? k = 2 n alpha 0.0 0.05 0.0 beta 0.0 0.05 0.0 0.05 0.0 0.05 λ 0.5 70 88 86 * * *.0 8 23 23 27 32 38.6 8 0 0 2 4 6 2.0 6 7 7 8 0 3.0 3 4 4 5 6 6 *: > 00 k = 3 n alpha 0.0 0.05 0.0 beta 0.0 0.05 0.0 0.05 0.0 0.05 λ 0.5 85 * * * * *.0 22 27 27 32 37 43.6 0 2 4 6 8 2.0 7 8 8 9 2 3.0 4 4 5 5 6 7 *: > 00 2 facteur à k niveaux : ANOVA (3/3 ) nombre de répétitions : n =? k = 4 n alpha 0.0 0.05 0.0 beta 0.0 0.05 0.0 0.05 0.0 0.05 λ 0.5 70 88 86 * * *.0 25 30 30 36 40 47.6 3 3 5 7 2.0 7 9 9 0 2 3 3.0 4 5 5 5 6 7 *: > 00 k = 5 n alpha 0.0 0.05 0.0 beta 0.0 0.05 0.0 0.05 0.0 0.05 λ 0.5 85 * * * * *.0 27 33 32 39 43 50.6 4 4 6 8 2 2.0 8 9 9 2 4 3.0 4 5 5 6 7 7 *: > 00 k = 6, 7, 8, 9 consulter le site http://www.cours.polymtl.ca/mth630 22