TP N 54. Estimation d un intervalle de confiance 1

TP N 54 Estimation d un intervalle de confiance objet de ce TP est d estimer un intervalle de confiance lors de la résolution de diverses problématiques rencontrées par le fiabiliste. ----- Estimer la durée de réparation d un matériel à 60 % de confiance à partir de 0 observations en supposant que la durée de réparation est distribuée selon une loi normale. Un fusible mécanique a pour fonction de rompre lorsque qu une force comprise entre 50 et 70 newtons lui est appliquée. a conformité de chaque lot de production que l on suppose suivre une loi gaussienne est testée par échantillonnage en utilisant la règle des 3 sigmas afin de garantir un taux de composants défectueux inférieur à 3 /000. Associer à ce taux de défaillance une confiance à 60 %. 3 Estimer la probabilité d erreur de pixel à partir de l analyse de 0 images de 000 pixels chacune. 4 Donner un intervalle de confiance sur la moyenne des résultats d une simulation de Monte- Carlo. 5 Estimer la disponibilité d un système à partir de résultats de simulation de Monte-Carlo. 6 Estimer les paramètres d une loi de Weibull à 60 % de confiance à partir d observations de durée de fonctionnement. 7 Estimer le MTBF à 60% d un composant électronique à l issue d un essai de fiabilité de 50 pièces pendant 000 heures durant lequel pièces sont tombées en panne à 5 450 et 7 800 heures. 8 Estimer le taux de défaut à 60% de confiance d un lot de composants sachant que 3 composants d un échantillon de 00 pièces de ce même lot se sont révélés défectueux. 9 Trouver des majorants du quantile d ordre 90% à partir d un échantillon de 0 valeurs. 0 Déterminer le nombre minimum de simulations nécessaires à l obtention d un majorant de la valeur du quantile 95 à 95 % de confiance. Ce TP a été élaboré en collaboration avec Marion Soussens étudiante en master MSID Méthodes Stochastiques et Informatiques pour la Décision à l'université de Pau et des Pays de l'adour.

/3 Intervalle de confiance estimation est à la base de la notion d intervalle de confiance. C est pourquoi il est important de rappeler en premier lieu les principales caractéristiques des estimateurs. Un estimateur sert à estimer un paramètre caractéristique d une population à partir d un échantillon. C est une variable aléatoire qui est fonction de l échantillon et ne dépend pas d autres paramètres. Sa valeur observée l estimation est la valeur calculée sur un échantillon particulier et que l on espère être une bonne évaluation de la valeur qu on aurait calculé sur la population totale. Il est donc important que l échantillon soit le plus représentatif possible de la population. estimation obtenue est ponctuelle et n est qu une valeur possible pour ce paramètre sans aucune évaluation de l erreur d estimation commise. Par ailleurs l estimateur a ses caractéristiques propres. Il peut être : - Convergent si l estimation tend vers quand la taille de l échantillon tend vers l infini - Sans biais si à partir de différents échantillons l espérance des estimations est - Efficace si la variance des estimations est faible intérêt d un intervalle de confiance est d obtenir à partir d un échantillon observé x x x n un intervalle de valeurs possibles pour le paramètre inconnu de la population avec une certaine probabilité niveau de confiance que sa valeur réelle se trouve bien dans cet intervalle. On appelle intervalle de confiance pour Ө de niveau de confiance β ou de niveau de risque α tout intervalle C tel que : P C = β = - α intervalle C ainsi défini est aléatoire : il dépend en effet de l échantillon sur lequel on travaille et ses bornes varient d un échantillon à un autre. Pour un échantillon observé donné le paramètre Ө appartient ou n appartient pas à avec des probabilités respectives β et α. Sur un grand nombre d échantillons observés et donc un grand nombre d intervalles créés appartient à C dans - α 00% des cas. Selon que l on cherche à encadrer un paramètre ou à estimer un majorant ou un minorant de celui-ci l intervalle sera bilatéral ou unilatéral. Toutefois l essentiel des problématiques d estimation rencontrées par le fiabiliste concerne des intervalles unilatéraux temps moyen de fonctionnement min taux de défaillance max durée de réparation min etc..

3/3 Intervalle bilatéral : Avec α + α = α intervalle bilatéral peut être symétrique : α = α = α/ ou dissymétrique : α α Intervalle unilatéral : interface de confiance le plus connu encadre la moyenne dans le cas d une population gaussienne. Il résulte directement du théorème central limite qui affirme que la moyenne d un échantillon varie selon une loi normale : Intervalle bilatéral : σ ± Z / Intervalle unilatéral : n µ α µ ± Z α σ n Avec µ : moyenne de l échantillon Z -α/ : Quantile de la loi normale centrée réduite d ordre - α/ σ : Ecart type de la population n : Taille de l échantillon Mais l écart type de la population σ est dans les faits rarement connu.

4/3 e schéma ci-dessous présente les différents types d intervalle de confiance sous forme d organigramme. Intervalle de confiance Population gaussienne Approximatif Asymptotique Exact Autre Moyenne Variance inconnue Variance Moyenne inconnue Binomiale Moyenne Proportion Paramètres Fisher Cas a Cas b Cas c Cas d Cas e Exponentielle Binomiale Bolshev Clopper Pearson Quantile Wilks Cas f Cas g Cas a : intervalle de confiance pour la moyenne dans le cas d une population gaussienne de variance inconnue Partant du théorème central limite = ~ on estime la variance σ de la population au moyen de l estimateur : =. Cet estimateur est sans biais et peut être approché au moyen d un loi du khi- : ~. Ces deux résultats permettent d affirmer que la variable aléatoire suit une loi de Student à n- degrés de liberté cf. définition de la loi de Student. a loi de Student étant symétrique par rapport à l origine on obtient un intervalle de confiance bilatéral symétrique de la manière suivante :!" # $ & " # $ '= + & " # $ + & " # $ -=. # =/ & " # $ ; + & " # $ Avec " # $ le quantile d ordre $ de la loi de Student à & degrés de liberté. Dans le cas unilatéral les intervalles deviennent : 345&67&8é576:56 / & " α 345&6 <:=é576:56 /+ & " α

5/3 Exemple : durée de réparation d un matériel à 60 % de confiance à partir de 0 observations a distribution est ici caractérisée par une loi normale bien qu une loi lognormale soit généralement utilisée pour une durée de réparation. Intervalle de confiance de la moyenne d'une population gaussienne de variance inconnue Durées de réparation i Bêta : 60% 940 n : 0 8 Moyenne échantillon : 0409759 04 Ecart-type débiaisé : 697847 80 887 Bilatéral 984 Durée moyenne min : 99480344 99480344 065 Durée moyenne max : 08938484 896 77 Unilatéral 339 Durée moyenne min : 08905 Durée moyenne max : 0560663 à 60% de confiance Ouverture du fichier Excel par double clic sur l icône : Moyenne Cas b : intervalle de confiance pour la variance dans le cas d une population gaussienne de moyenne inconnue Un intervalle de confiance bilatéral symétrique peut être obtenu à partir de l estimateur de la variance. = ~ ~ + # $ & > # $ -=. # > =? & # # $ & ; & $ &@ Avec ABCDE F le quantile d ordre =54GH de la loi du Chi-Deux à F degré de liberté. Dans le cas unilatéral les intervalles deviennent : 345&6 7&8é576:56? & α & @ Borne supérieure? & α & @

6/3 Exemple : Intervalle de confiance à 3 σ à 60 % de confiance Intervalle de confiance de la variance d'une population gaussienne de moyenne inconnue Force i Bêta : 60% 58 n : 0 5693 Moyenne échantillon : 5989 5986 Ecart-type débiaisé: 3036939 6487 63 Bilatéral 6465 V min : 67770448 609 V max : 5408573 σ 3σ 5683 Taux de composants défectueux 5874 Unilatéral 07% 567 Variance min : 88340955 Variance max : 77337 Intervalle à 3 sigma à 60% de confiance : 498005 699608868 Intervalle à 3 sigma : 50777879 689950354 imites de fonctionnement : 50 70 Variance Cas c : intervalle de confiance approximatif 'intervalle de confiance est dit approximatif s il se base sur l approximation d une loi par une autre. C est par exemple le cas d une loi binomiale de paramètres n p qui peut être approximée par une loi normale de moyenne m = np et de variance σ = np-p si n est assez grand et p pas trop proche de 0 ou de. Exemple 3 : Intervalle de confiance sur la probabilité d erreur de pixel à partir de 0 images Intervalle de confiance approximatif loi binomiale Nb pixels affectés Nb pixels par image : 000 0 Bêta : 60% N : 0 3 Moyenne échantillon : 7 Ecart-type débiaisé: 773386 8 5 Unilatéral 3 Moyenne à 60% : 3300973 8 Proba d erreur de pixel à 60% : 003300 9 7 Approximatif

7/3 Cas d : Intervalle de confiance asymptotique pour la moyenne dans le cas d une population non gaussienne e Théorème Central imite n est alors valide que pour un échantillon de grande taille n>30. En utilisant l estimateur non biaisé de la variance = > on obtient l intervalle de confiance bilatéral symétrique suivant pour la moyenne : + & S # $ + & S # $ - T UVVW. # =/ & S # $ ; + & S # $ Dans le cas unilatéral les intervalles deviennent : Borne inférieure / & S α 345&6 <:=é576:56 / + & S α Exemple 4 : intervalle de confiance sur la moyenne des résultats d une simulation de Monte-Carlo. Intervalle de confiance asymptotique de la moyenne d'une population quelconque Résultat i Bêta : 60% 4 n : 40 806 Moyenne échantillon : 49935958 85 Ecart-type débiaisé: 5683085 88 857 Bilatéral 67 Moyenne min : 4657605 50 Moyenne max : 53359865 84 049 Unilatéral 550 Moyenne min : 489064933 805 Moyenne max : 509640983 808 645 7 65 Moyenne asymptotique Dans le cas d une proportion une loi de Bernouilli de paramètres p peut être approchée par une loi normale de moyenne m = p et de variance σ = p-p. Par ailleurs une proportion étant une moyenne entre des valeurs 0 et un intervalle de confiance asymptotique peut être défini pour p.

8/3 Exemple 5 : intervalle de confiance sur la disponibilité d un système à partir de résultats de simulation de Monte-Carlo. Bêta : 60% 0 N : 38 Proportion échantillon : 0563579 Unilatéral minorant Disponibilité à 60% : 05055965 0 Intervalle de confiance d'une proportion Proportion Cas e : Intervalle de confiance asymptotique pour les paramètres d une loi quelconque : méthode de Fisher A l issue d un ajustement par la méthode du maximum de vraisemblance des intervalles de confiance asymptotiques peuvent être calculés à partir de l'information de Fisher : Ε = n I n = = 3 3 3 3 3 n n n n n n n n n I F n 'inverse de la matrice de Fisher est la matrice de variance-covariance Pour chacun des paramètres de la loi des intervalles de confiance peuvent alors être calculés à partir de leur variance éléments diagonaux de la matrice en considérant des lois normales. De même un intervalle de confiance peut être calculé pour une fonction des différents paramètres quantile 90 par exemple en considérant que la variance de cette fonction est égale à : Avec le gradient et le transposée de g et l inverse de la matrice de Fisher.

9/3 Exemple 6 : intervalle de confiances sur les paramètres d une loi de Weibull Ajustement Maximum de vraissemblance oi de probabilité : WEIBU 3 paramètres Bêta : 67956456 Sigma : 438 Gamma : 935836 Taux de confiance : 60% N Vraisemblance -4300003 Min Max Bêta : 679565 346538 059 Non censurées N K non censurées Sigma : 438 353967 479595-4300003 Gamma : 9358 55435 766 Min Max Variable Taux : λti Rti = -Fti Densité : fti nfti Quantile 90 : 8703 8086896 93576 8783058 00053956 03365665 00007-73473454 83778476 0005534 098759 000066068-73450 457655 0000557 09673065 00009904-69574939 Matrice de Fisher : 39995-00344 06995 554559 00035947 049650699 00074744-6349603 -00344 0000595 000058 463466 00030446 0630539 00086646-683746 06995 000058 00039 3096055 00073776 08848389 00053759-647753644 34836059 0000685 08084 0007305-63595447 Matrice de variance-covariance : 056575 3743-38 6848795 0004577 0657477 0000068-67486668 3743 505388-47 4995588 0003337 054570 00080769-6357033 -38-47 88577 7089899 000469476 0399877 000669-67884757 5796768 000346567 05096636 00076633-63388578 85535943 0005673 00879 0000607-740769 574780 000386056 0447854 000609-64369473 335673 000085748 09788703 000083936-70886554 487948 0003403 056507034 00083-63089475 Fischer Remarques : - Dans le cas d un estimateur asymptotique la confiance n est véritablement garantie que lorsque la taille de l'échantillon tend vers l infini sans réelle maîtrise de la vitesse de convergence. En pratique ces estimateurs sont utilisés quand n > 30. - outil Gencab utilisé ici calcule la matrice de Fischer par une méthode générique discrète permettant de s affranchir des expressions analytiques des dérivées de la log vraisemblance. Cas f : Intervalle de confiance «exact» 'intervalle de confiance est dit exact s il est fondé sur la distribution d une loi de probabilité connue telle que l exponentielle ou la binomiale par opposition à un intervalle de confiance approximatif. Cela ne préjuge en rien de la justesse de l intervalle de confiance. Un intervalle de confiance peut être calculé par les méthodes de Bolshev ou de Clopper-Pearson 3 pour la loi binomiale qui ne sont pas développées ici. Bagdonavičius V.Nikoulina V. and Nikulin M. 998. Bolshev s method of confidence interval construction; Qüestiió #3 549-56 3 C. J. Clopper and E. S. Pearson Biometrika Vol. 6 No. 4 Dec. 934 pp. 404-43 The Use of Confidence or Fiducial imits Illustrated in the Case of the Binomial

0/3 oi exponentielle o Cas non censuré : l observation est menée jusqu à la défaillance de n équipements et T correspond à la durée de fonctionnement cumulée.. # Y=/ Z ; Z [ \]^/ [^/ Bilatéral 345&67&8é576:56 ` Z a [ \]^ unilatéral o Cas tronqué : l observation est menée pendant un temps défini à l avance b CDc. On observe alors r B défaillances 5 & et le temps de fonctionnement cumulé est b B = +&5b CDc où correspond aux instants de défaillances.. # Y=? Z d ; Z d [ \]^ Be $ [^ $ @ B Bilatéral 345&67&8é576:56 ` Z d a Be unilatéral [ \]^ Exemple 7 : MTBF à 60% d un composant électronique à l issue d un essai de fiabilité de 50 pièces pendant 000 heures durant lequel pièces sont tombées en panne à 5 450 et 7 800 heures. oi exponentielle Confiance : 60% Tobs : 0000 hrs Nb pièces : 50 Nb défaillances r : Instants de défaillance : 5450 hrs 7800 hrs Tr : 49350 hrs MTTF à 60% : 58837 hrs ambda à 60% : 696 fits hrs - * 0 9 Exponentielle

/3 oi binomiale o Méthode de Clopper & Pearson : es intervalles sont obtenus par résolution des équations suivantes : f = f = f = # fg et h & = h = &h = h=0 bilatéral fg f = f = f =α et h h=0 & = h = &h =α unilatéral o Méthode Bolshev : es intervalles sont de la forme :. # ==`j # $ &h+;h; j# $ &h;h+a bilatéral Où j ABCDE H;Gest le =54GH-quantile d une loi beta de paramètres H et G. 345&6 7&8 kj α &h+;hl 345&6 <:= kj α &h;h+l unilatéral Exemple 8 : Taux de défaut à 60% de confiance d un lot de composants sachant que 3 composants d un échantillon de 00 pièces de ce même lot se sont révélés défectueux oi Binomiale taille échantillon n : 00 nb pannes 0 00447009 0064377 03383037 3 08939957 Confiance : 60% Clopper-Pearson total 04 Risque = 40% p 00450748 Erreur quadratique : 78886E-3 quant. beta 09584957 Bolshev p 00450748 Binomiale

Cas g : Estimation d un quantile avec un niveau de confiance méthode de Wilks /3 A partir d un échantillon la méthode de Wilks permet de déterminer un majorant ou un minorant de la valeur d un quantile α au niveau de confiance β noté T α β α n est pas le niveau de risque. estimateur est la valeur extrême de rang r d un échantillon de taille N satisfaisant à la condition suivante : N N r+ i i C α α n N i β Exemple 9 : Trouver des majorants du quantile d ordre 90 % à partir d un échantillon de 0 valeurs Estimation d un quantile Méthode de Wilks N r + i i C α α α : 90% Data Rang N : 0 046639779 8 0797864 5 r Quantile 90 β 074833 6 0976658 8784% 05676439 9 0953468569 6083% 095346857 9 3 093859054 33% 0976658 0 069763368 4 0693549 3 0 0576655 057665 08438978 7 07070344 039747 06498 08579807 0676968 060035385 0 3 090987 086704668 06457667 4 008977888 0956855 09385905 8 5 003936 098874687 079088837 6 6 0008867045 0997639 008373 3 7 000970454 099958436 0305657 7 8 0000355776 09999404 07840843 5 9 57076E-05 09999985 00765 0 64404E-06 09999999 06997993 4 6507E-07 099999994 0048005 546E-08 3 370776E-09 N n N i β Quantile Exemple 0 : Taille minimale d un échantillon permettant l obtention d un majorant de la valeur du quantile 95 à 95 % de confiance estimation du quartile T 9595 est donnée par la valeur extrême obtenue au cours d au moins N simulations r = avec N donné par l expression : - α N β soit α N β- ou N lnβ- / lnα N ln005 / ln095 = 584039748 N 59 Ce même quartile peut être estimé par la plus grande valeur à l exclusion de la valeur extrême r = avec N donné par l expression :

3/3 - N * α N - α + α N β soit N 93 Ou par la plus grande valeur à l exclusion des valeurs extrêmes r = 3 si N 4 a résolution de la formule de Wilks est traitée ci-dessous au moyen de l outil GENCAB. Taille d un échantillon permettant l obtention d un quantile Méthode de Wilks α : 95% β : 95% r : 3 N : 4 N N r + i i C α α n N i β 0950470 095 0 0007873 0007873 0083 0030096 0036588 00495978 3 00786307 076985 4 0444384 053669 5 0579 0409389 6 0640866 05734553 7 0455806 0789964 8 005876 08305489 9 00760647 09070736 0 004600997 09530833 00509635 09787767 00438 09906577 3 000563995 0996557 4 0003535 09986093 Wilks