Expériences comparatives avec un facteur Problématique facteur à 2 modalités ( niveaux ) - Test d hypothèse - Test t de Student - Intervalle de confiance facteur à 3 modalités et plus - Modèle d analyse de variance - Décomposition variabilité : ANOVA - Test F de Fisher - Analyse des résidus - Comparaisons a posteriori - Nombre de répétitions Exemples de problématique Exemple 2.- procédé de gravure chimique («wet etching») enlèvement du silicium sur des «wafers» avant métallisation variable de réponse : taux d enlèvement du procédé comparaison efficacité de 2 solutions (facteur) données : taux d enlèvement sur 0 «wafers» chaque solution solution : 9.9 0.6 9.4 0.3 9.3 0.0 9.6 0.3 0.2 0. solution 2 : 0.2 0.0 0.6 0.2 0.7 0.7 0.4 0.4 0.5 0.3 différence significative? Exemple 2.2 - effet du flux du C 2 F 6 sur l uniformité gravure «wafer» variable de réponse : uniformité ( % ) tranches («wafer») de silicium facteur à 3 modalités: taux du C 2 F 6 - modalités (niveaux) : 25-60-0 flux uniformité 25 2.7 4.6 2.6 3.0 3.2 3.8 60 4.9 4.6 5.0 4.2 3.6 4.2 0 4.6 3.4 2.9 3.5 4. 5. différences significatives? si oui, lesquelles? 2
Méthodes d analyse Ex 2. Test t de Student cadre pour des expériences de comparaison simple : facteur variant à 2 modalités utilisé dans tous les plans expérimentaux avec : plusieurs facteurs variant à 2 modalités Ex 2.2 ANOVA ANALSIS OF VARIANCE analyse de la variance - facteur avec k ( 3 et plus ) modalités - aussi avec plusieurs (2 et plus) facteurs - test t ne s applique pas directement - méthode d analyse : ANOVA - décomposition de la variabilité selon les sources - méthode d analyse fondamentale employée dans toutes les expériences industrielles / scientifiques 3 facteur à 2 niveaux : test t Student ( / 6 ) niveau facteur A niveau 2 0.4 0.4 ~N (µ 0.2, σ 2 ) Hypothèse nulle H 0.2 0 : µ = µ 2 ~N(µ 2, σ 2 ) 0.0 0.08 Hyp. alternative 0.0 H : µ µ 2 0.08 GAUSS 0.06 0.04 σ GAUSS 0.06 0.04 σ 0.02 0.00 0.00 µ µ 2-0.02-0.02-2 0 2 4 6 8 0 2 4 6 8 22 24 26-2 0 2 4 6 8 0 2 4 6 8 22 24 26 y U y 2 y n échantillon U y 2 y 22 y 2 n2 0.02 facteur A affecte t-il la variable de réponse? y = y i /n S 2 = ( y i y ) 2 /( n - ) moyennes variances y 2 = y 2i / n2 S 2 2 = ( y 2i y 2 ) 2 /( n2 - ) σ 2 =[(n ) s 2 + (n 2 ) s 2 2 ]/ (n + n 2-2) estimation erreur expérimentale σ décision basée sur écart y - y 2 4
facteur à 2 niveaux : test t Student (2 / 6 ) test de comparaison effet du facteur A t = différence des moyennes écart type (différences des moyennes ) Statistique t de Student t = loi Student avec y y 2 σ [ /n + /n 2 ] 0.5 df = n + n 2-2 degrés de liberté t t t t «près de zéro» supporte H 0 : pas de différence c-à-d facteur n affecte pas «très différente de zéro» supporte H : le facteur A affecte la moyenne de est un rapport signal / bruit distance entre les moyennes en unités d écart types 5 facteur à 2 niveaux : test t Student (3 / 6 ) procédure objective pour décider si t est «grand» En 908, W. S. Gosset ( pseudonyme Student ) obtient la distribution t appelé «Student» Tables logiciel statistique «p-value» distribution Student df >= 30 df =30 Student df =2 df = normale 6
facteur à 2 niveaux : test t Student (4 / 6 ) Ex 2. : analyse 0.8 0.6 Boîte à moustaches: taux etch Sol 2 y 9.97 0.40 S 0.42 0.23 taux etch 0.4 0.2 0.0 9.8 9.6 9.4 9.2 2 ty p e s o lu tio n Median 25% -75% Min-Max Tests t ; Classmt : type solution (Ex-2.-gravure.sta) Groupe: Groupe2: 2 Moyenne Moyenne Valeur t dl p N Actifs N Actifs Ecart- Type Ecart- Type Ratio F p taux etch 9.97000 0.4000-2.8278 8 0.05 0 0 0.42769 0.230940 3.3354 0.0873 p -value = risque rejeter faussement l hypothèse H 0 7 facteur à 2 niveaux : test t Student (5 / 6 ) vérification de la normalité des données 2.0 Droite de Henry Catégorisée : taux etch.5.0 Valeur Normale Théorique 0.5 0.0-0.5 -.0 -.5-2.0 9.2 9.4 9.6 9.8 0.0 0.2 0.4 0.6 0.8 9.2 9.4 9.6 9.8 0.0 0.2 0.4 0.6 0.8 type solution: ty pe solution: 2 8
facteur à 2 niveaux : test t Student (6 / 6 ) Méthode intervalles de confiance Forme générale : intervalle de confiance pour θ L θ U avec P ( L θ U ) = - α Intervalle de confiance à 00(- α )% différence entre 2 moyennes µ - µ 2 : ( y - y 2 ) ± σ * t df, α/2 * ( /n + /n 2 ) 0.5 percentile distribution Student df = n + n 2-2 Ex 2. : Intervalle différence de moyenne µ - µ 2 ( - 0.758 à - 0.05) coefficient confiance de 95% 9 facteur à k niveaux : ANOVA (/3 ) Exemple 2.3 : optimisation «larger the better» recherche nouvelle composition de fibres synthétique tissus facteur : % coton varie entre 5 et 35 réponse : force de tension tissu à maximiser 5 modalités de fixées à: 5 25 30 35 exécution : complètement aléatoire / n = 5 répétitions Données y ij tension 26 Boîtes à Moustaches Catég. : 24 i/j 2 3 4 5 moyenne 22 5 7 7 5 9 9.8 2 2 7 2 8 8 5.4 8 6 25 3 4 8 8 9 9 7.6 4 30 4 9 25 22 9 23 2.6 2 0 35 5 7 0 5 0.8 8 6 5 25 30 35 Median 25%-75% Min-Max 0
facteur à k niveaux : ANOVA (2/3 ) ANOVA : analyse de la variabilité Tableau des données niveau i observations y i j moyennes y y 2 y 3 y n y. facteur contrôlé 2 y 2 y 22 y 23. 2 n y 2 i y i y 2 y i3. y i n y i.. a y a y a2 y a3. y a n y a. a niveaux du facteur - a traitements à comparer n répétitions dans un ordre complètement aléatoire nombre total d essais (observations) : a n objectif : comparer les traitements (effet de sur ) hypothèse nulle = pas de différences n influence pas facteur à k niveaux : ANOVA (3/3 ) Modèle de classification simple ij = µ + τ i + ε ij i =, 2,,a j =, 2,..,n a : nombre de modalité du facteur j : nombre de répétitions µ : effet général τ i : effet différentiel i-ième traitement ε ij : erreur expérimentale ~ N ( 0, σ 2 ) autres modélisations si le facteur quantitatif : modèle polynomial exemple = β 0 + β + β 2 2 + ε 2
facteur à k niveaux : ANOVA (4/3 ) Décomposition de la variabilité SS T variabilité totale équation de décomposition a n SS = ( y y ) T i= j= a n a n 2 2 ( yij y.. ) = [( yi. y.. ) + ( yij yi.)] i= j= i= j= a a n 2 2 (...) i ( ij i. ) i= i= j= = n y y + y y SS = SS + SS T Treatments E ij.. 2 inter variabilité intra variabilité 3 facteur à k niveaux : ANOVA (5/3 ) Tableau d analyse de la variance Source Somme carrés Deg. lib. Carré moyen F Traitements SS trait =n ( y i. y.. ) 2 a MS trait F 0 = MS trait /MS E Résiduelle SS E = SS T -SS trait a(n-) MS E Totale SS T = (y ij y.. ) 2 an distribution de référence pour F 0 : distribution F de Fisher avec df = a degrés de liberté au numérateur et df 2 = a(n-) degrés de liberté au dénominateur Test de H 0 : µ = µ 2 =. = µ a F0 > F α, a, a( n ) Rejeter l hypothèse nulle au seuil α si 4
facteur à k niveaux : ANOVA (6/3 ) Distribution F de Fisher si suit une loi Khi-deux avec df ddl 2 suit une loi Khi-deux avec df2 ddl et 2 sont indépendantes alors ( / df ) / ( 2 / df2 ) suit une loi F( df,df2 ) t 2 df = F (, df ) : carré Student = Fisher F( df =, df2 = df ) distribution F est employée dans toutes les analyses de plans d expériences 5 facteur à k niveaux : ANOVA (7/3 ) Ex. 2.3 : analyse avec STATISTICA ord. origine SC 5655.040 475.760 Degr. De liberté 4 MC 5655.040 8.940 F 70.679 4.7568 p 0.000000 0.000009 différences significatives Erreur 6.0 8.060 lesquelles? {} {2} {3} {4} {5} 2 3 5 25 0.0385 0.0027 0.0386 0.7373 0.0027 0.7373 0.0005 0.090 0.202 0.9798 0.64 0.0092 Test de Tukey: compare toutes 4 30 0.0005 0.090 0.202 0.0002 les paires 5 35 0.9798 0.64 0.0092 0.0002 6
facteur à k niveaux : ANOVA (8/3 ) analyse des résidus important de faire une vérification a posteriori quand on ajuste un modèle statistique hypothèses de base - distribution normale? - variance constante? - indépendance observations? - modèle OK? Si hypothèses de base violées - quoi faire? - réponse : transformer transformation de Box-Cox λ - 2 < λ < 2 les plus importantes 7 facteur à k niveaux : ANOVA (9/3) Analyse des résidus Residual Plots for Normal Probability Plot of the Residuals 99 5.0 Residuals Versus the Fitted Values Percent 90 50 0 Residual 2.5 0.0-2.5-5.0-2.5 0.0 Residual 2.5 5.0-5.0 0.0 2.5 5.0 7.5 Fitted Value.0 6.0 Histogram of the Residuals 5.0 Residuals Versus the Order of the Data Frequency 4.5 3.0.5 Residual 2.5 0.0-2.5 0.0-4 -2 0 Residual 2 4-5.0 2 4 6 8 0 2 4 6 8 Observation Order 22 24 8
facteur à k niveaux : ANOVA (0/3 ) Modèle de régression si facteur quantitatif 30 25 Tracé des Moyennes & Intervalle de Confiance (95.00%) Valeurs 5 0 5 25 = 62.6-9.0 x + 0. 4 8 x**2-0.0076 x**3 0 S 3.04839 R-Sq 69.4% R-Sq(adj) 65.0% 5 25 30 35 5 0 5 5 25 30 35 9 facteur à k niveaux : ANOVA (/3) nombre de répétitions : n =? n dépend de alpha (α ) : taux de fausse détection risque de rejeter une hypothèse vraie beta (β ) : taux de manque de détection risque d accepter une hypothèse fausse σ : erreur expérimentale = λσ: écart de moyenne à détecter λ = /σ : facteur de proportionnalité k : nombre de modalités (groupes) à comparer n : nombre de répétitions de chaque sous groupe (modalité) n = fonction (α, β, σ, λ, k ) Cas des expériences avec plusieurs facteurs : n entre 2 et 5 est généralement suffisant consulter l annexe
facteur à k niveaux : ANOVA (2/3 ) nombre de répétitions : n =? k = 2 n alpha 0.0 0.05 0.0 beta 0.0 0.05 0.0 0.05 0.0 0.05 λ 0.5 70 88 86 * * *.0 8 23 23 27 32 38.6 8 0 0 2 4 6 2.0 6 7 7 8 0 3.0 3 4 4 5 6 6 *: > 00 k = 3 n alpha 0.0 0.05 0.0 beta 0.0 0.05 0.0 0.05 0.0 0.05 λ 0.5 85 * * * * *.0 22 27 27 32 37 43.6 0 2 4 6 8 2.0 7 8 8 9 2 3.0 4 4 5 5 6 7 *: > 00 2 facteur à k niveaux : ANOVA (3/3 ) nombre de répétitions : n =? k = 4 n alpha 0.0 0.05 0.0 beta 0.0 0.05 0.0 0.05 0.0 0.05 λ 0.5 70 88 86 * * *.0 25 30 30 36 40 47.6 3 3 5 7 2.0 7 9 9 0 2 3 3.0 4 5 5 5 6 7 *: > 00 k = 5 n alpha 0.0 0.05 0.0 beta 0.0 0.05 0.0 0.05 0.0 0.05 λ 0.5 85 * * * * *.0 27 33 32 39 43 50.6 4 4 6 8 2 2.0 8 9 9 2 4 3.0 4 5 5 6 7 7 *: > 00 k = 6, 7, 8, 9 consulter le site http://www.cours.polymtl.ca/mth630 22