REVUE DE STATISTIQUE APPLIQUÉE

Documents pareils
Cours Fonctions de deux variables

I - PUISSANCE D UN POINT PAR RAPPORT A UN CERCLE CERCLES ORTHOGONAUX POLES ET POLAIRES

Chapitre 1 Cinématique du point matériel

Fonctions de plusieurs variables

Cours de Mécanique du point matériel

Limites finies en un point

Angles orientés et fonctions circulaires ( En première S )

Développements limités, équivalents et calculs de limites

Calcul intégral élémentaire en plusieurs variables

Chafa Azzedine - Faculté de Physique U.S.T.H.B 1

Comparaison de fonctions Développements limités. Chapitre 10

Fonctions de plusieurs variables, intégrales multiples, et intégrales dépendant d un paramètre

Chapitre 0 Introduction à la cinématique

Chapitre 1 Régime transitoire dans les systèmes physiques

Fonctions de deux variables. Mai 2011

Chapitre 6. Fonction réelle d une variable réelle

LE PRODUIT SCALAIRE ( En première S )

TSTI 2D CH X : Exemples de lois à densité 1

Continuité et dérivabilité d une fonction

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable T : pour travailler et mémoriser le cours

OM 1 Outils mathématiques : fonction de plusieurs variables

Sur certaines séries entières particulières

Exercices - Fonctions de plusieurs variables : corrigé. Pour commencer

FONCTIONS DE PLUSIEURS VARIABLES (Outils Mathématiques 4)

FORMULAIRE DE STATISTIQUES

Statistiques Descriptives à une dimension

Mesure d angles et trigonométrie

F411 - Courbes Paramétrées, Polaires

PROBABILITES ET STATISTIQUE I&II

DOCM Solutions officielles = n 2 10.

Calcul différentiel sur R n Première partie

Théorème du point fixe - Théorème de l inversion locale

Algorithmes pour la planification de mouvements en robotique non-holonome

Chapitre 3. Quelques fonctions usuelles. 1 Fonctions logarithme et exponentielle. 1.1 La fonction logarithme

Intégrales doubles et triples - M

CHAPITRE 10. Jacobien, changement de coordonnées.

La fonction exponentielle

Repérage d un point - Vitesse et

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

TD1 Signaux, énergie et puissance, signaux aléatoires

Image d un intervalle par une fonction continue

Corrigé du baccalauréat S Asie 21 juin 2010

Probabilités sur un univers fini

Géométrie dans l espace Produit scalaire et équations

Université Paris-Dauphine DUMI2E 1ère année, Applications

MESURE ET PRECISION. Il est clair que si le voltmètre mesure bien la tension U aux bornes de R, l ampèremètre, lui, mesure. R mes. mes. .

Continuité en un point

Baccalauréat S Antilles-Guyane 11 septembre 2014 Corrigé

Moments des variables aléatoires réelles

Calculs de probabilités avec la loi normale

Bac Blanc Terminale ES - Février 2011 Épreuve de Mathématiques (durée 3 heures)

Correction du baccalauréat S Liban juin 2007

Texte Agrégation limitée par diffusion interne

Commun à tous les candidats

M2 IAD UE MODE Notes de cours (3)

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable

Planche n o 22. Fonctions de plusieurs variables. Corrigé

Calcul élémentaire des probabilités

Enoncé et corrigé du brevet des collèges dans les académies d Aix- Marseille, Montpellier, Nice Corse et Toulouse en Énoncé.

Les travaux doivent être remis sous forme papier.

Le calcul du barème d impôt à Genève

Fonctions de plusieurs variables

Cours3. Applications continues et homéomorphismes. 1 Rappel sur les images réciproques

Factorisation Factoriser en utilisant un facteur commun Fiche méthode

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

STATIQUE GRAPHIQUE ET STATIQUE ANALYTIQUE

8.1 Généralités sur les fonctions de plusieurs variables réelles. f : R 2 R (x, y) 1 x 2 y 2

Introduction à l approche bootstrap

CNAM UE MVA 210 Ph. Durand Algèbre et analyse tensorielle Cours 4: Calcul dierentiel 2

EXPLOITATIONS PEDAGOGIQUES DU TABLEUR EN STG

Famille continue de courbes terminales du spiral réglant pouvant être construites par points et par tangentes

Etude de fonctions: procédure et exemple

Représentation géométrique d un nombre complexe

Résolution d équations non linéaires

Exercices - Nombres complexes : corrigé. Formes algébriques et trigonométriques, module et argument

Plus courts chemins, programmation dynamique

Correction du Baccalauréat S Amérique du Nord mai 2007

I. Polynômes de Tchebychev

1 radian. De même, la longueur d un arc de cercle de rayon R et dont l angle au centre a pour mesure α radians est α R. R AB =R.

Travaux dirigés d introduction aux Probabilités

= constante et cette constante est a.

III- Raisonnement par récurrence

Exo7. Probabilité conditionnelle. Exercices : Martine Quinio

Chapitre 2 Le problème de l unicité des solutions

Quantification Scalaire et Prédictive

Fonctions de plusieurs variables. Sébastien Tordeux

Equations différentielles linéaires à coefficients constants

= 1 si n = m& où n et m sont souvent des indices entiers, par exemple, n, m = 0, 1, 2, 3, 4... En fait,! n m

Loi binomiale Lois normales

NOMBRES COMPLEXES. Exercice 1 :

Pour l épreuve d algèbre, les calculatrices sont interdites.

Les indices à surplus constant

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

Cours d Analyse. Fonctions de plusieurs variables

Suites numériques 3. 1 Convergence et limite d une suite

Précision d un résultat et calculs d incertitudes

Correction de l examen de la première session

TD: Cadran solaire. 1 Position du problème

De même, le périmètre P d un cercle de rayon 1 vaut P = 2π (par définition de π). Mais, on peut démontrer (difficilement!) que

Transcription:

REVUE DE STATISTIQUE APPLIQUÉE PHILIPPE FORMERY Probabilité pour que simultanément (X soit superieur à A - Y soit supérieur à B) dans une loi de Laplace- Gauss à deux variables X et Y Revue de statistique appliquée, tome 8, n o 2 (1960), p. 87-98 <http://www.numdam.org/item?id=rsa_1960 8_2_87_0> Société française de statistique, 1960, tous droits réservés. L accès aux archives de la revue «Revue de statistique appliquée» (http://www. sfds.asso.fr/publicat/rsa.htm) implique l accord avec les conditions générales d utilisation (http://www.numdam.org/legal.php). Toute utilisation commerciale ou impression systématique est constitutive d une infraction pénale. Toute copie ou impression de ce fichier doit contenir la présente mention de copyright. Article numérisé dans le cadre du programme Numérisation de documents anciens mathématiques http://www.numdam.org/

PROBABILITÉ POUR QUE SIMULTANÉMENT ( X soit superieur à A 2014 Y soit supérieur à B ) DANS UNE LOI DE LAPLACE-GAUSS A DEUX VARIABLES X ET Y par Philippe FORMERY ingénieur civil des mines I - POSITION DU PROBLEME - On se propose de calculer la probabilité pour que le point aléatoire (x, y) se trouve dans le domaine : x supérieur à a, y supérieur à b. Afin de simplifier les notations, prenons l origine des axes au centre distribution. La loi de probabilité de Laplace-Gauss est alors de la forme : de la que l on peut écrire : Faisons le changement de variables défini par la droite de régression de y en x : Le nouvel élément d aire est : et la fonction devient : à intégrer dans le domaine défini par les deux droites : 87

II - DEFINITION DU DOMAINE D INTEGRATION - Soit - OH : OX le demi-axe orienté d angle polaire i. Définissons la droite D par et la droite D par i et OK : L équation de D peut s écrire : D où: On a en outre, en projetant le contour OHIK sur OX : OH cos i + HI sin i = OK et en projetant le contour OHIK sur OX : OH + IK sin i = OK cos i On remarque que : OH est la valeur réduite de a dans la loi marginale des x, soit a OK est la valeur réduite de b dans la loi marginale des y, soit b HI est la valeur réduite de b dans la loi marginale de y lié par x = a, soit : 88

K I est la valeur réduite de a dans la loi de x lié par y = b, soit soit La probabilité pour que x supérieur à a, y supérieur à b s exprime au moyen de trois paramètres seulement : les variables réduites a et b et le coefficient de corrélation r. Ceci posé, la Probabilité pour que x soit supérieur à a, y supérieur à b dans la loi de Laplace-Gauss est mesurée par la valeur de l intégrale: dans le domaine (D ID) ou encore par la somme de l intégrale de : dans le domaine (ZIZ ) et de l intégrale de : dans le domaine (D IZ). On est donc amené à définir et à étudier l intégrale de dans le domaine (ZIZ ) défini par les coordonnées cartésiennes p et q de I, ou par l abscisse p de I et l angle polaire a de 01. On désignera par V(p, q) ou V(pa) la fonction du point 1 me surant l intégrale : dx dy. Afin que soit vraie, quel que soit le cas de figure, la formule énoncée plus bas, on envisagera toujours l angle ZIZ inférieur à 03C0. On affectera du signe + la fonction V (p, q) ou V(p, a ) si l angle ZIZ est direct, du signe - dans le cas contraire, ce qui revient à affecter la fonction du signe de p. D où : 89

90

On notera en outre que : Moyennant ces hypothèses, et à l aide de la remarque ci-dessus, on a, quels que soient les signes de a, b, b1 et at, l expression : III - EXPRESSION DE LA FONCTION V(p, a ) OU V(p, q) - 1/ p > 0. On suppose tout d abord p > 0. V(p, q) ou V(p, a ) r dr d a On a déjà noté que V(p, -q) = S(p) - V(p, q). 2/ p 0. On attribue, par définition à V(p, q) ou à V(p, oc le signe de p. En conséquence, si p est négatif, la fonction sera définie par : V(p, q) = -V(-p, q) ou V(p, a) -V(-P, 03B1) Nota - V(p, q) et V(p, 03B1) désignent la même fonction, à savoir la mesure du volume algébrique du secteur (ZIZ ), le point I étant caractérisé soit par ses coordonnées cartésiennes (p, q), soit par son abscisse p et son angle polaire a. IV - METHODE D ETABLISSEMENT NUMERIQUE DE LA FONCTION V(p, a ) OU V(p, q) q = ptga - (voir le faisceau de courbes joint à la note). On utilisera constamment le s fonctions: 91

1/ a > 0. V(p, a ) est défini par : On note que V(p, 0) = 1 S(p). a) 03B1 03C0/4. La fonction est approximativement représentée (à 1/1 000 près) par les premiers termes de son développement (voir plus loin l établissement du développement) (paragraphe V) b) a =?t/4. Une considération géométrique simple montre que : c) 03B1 > 03C0/4. Une remarque géométrique analogue permet de se rattacher au cas 03B103C0/4. Cependant, lorsque a est assez voisin de 03C0/2, on obtient une expression approchée plus pratique, en assimilant cos a à Tt/2 -a et V(p, a ) à l intégrale : que l on sait exprimer au moyen des fonctions Y et S (par intégration par parties). avec une erreur relative positive et inférieure à 1 - sin a. 2/ a 0. On définit V(p, a) par : V - DEVELOPPEMENT DE LA FONCTION V(p, a ) EN SERIE ENTIERE DE a - Si on désigne par u u" u(3) u(4)... les dérivées successives de tga 92

Soit : u o = 1, u(3)o = 2, u(5)o = 16, u(7)o = 272, u(9)o = 7 936... les dérivées pour a = 0, les dérivées successives d ordre pair sont nulles. Les premiers coefficients sont : On peut noter que 3 p4-8p2 120 Y(p) 203C0 est borné supérieurement par 4/ 1000. Pour a = 03C0/4, l erreur maxima est de l ordre de 4/3 000. Si l on n exige pa s une très grande précision, on pe ut s e limite r à : 93

VI - DEVELOPPEMENT DE LA FONCTION V(p,03B1) EN SERIE ENTIERE DE p2 2=z- Le développement de V(p,03B1) en série de E2 entière = z, peut-être moins pratique dans l établissement des courbes, donne naissance cependant à une série plus remarquable. On a : que l on peut écrire en posant p2 2 = z et en introduisant la fonction auxiliaire A(z,t). Cherchons à développer en série entière la fonction A(z, t). D où Donnant à z la valeur 0 94

A, A (2) A(n) ne sont autres que les expressions du développement en série entière de Arc tg t limitées respectivement aux premier, second, n ième terme. D où le développement : valable quels que soient t et z car le reste de la série de Mac Laurin tend vers 0 lorsque n tend vers l infini (bien que le développement de Arc tg t ne soit convergent que pour t 1). Il serait cependant préférable dans les applications de se borner au cas t 1 puisque l on sait, dans le calcul de V, ramener le cas t > 1 au cas t 1 comme on a vu plus haut. t étant inférieur à 1, on borne supérieurement A(n+1), A(n+2) etc. par t le reste de la série exponentielle par zn+1 (n+1)!(1 1-z n+1) et limite supérieure de l erreur sur la fonction V(p, a ) et on obtient ainsi une Conclusion. Si on désigne par An la somme des n premiers termes de la série a = Arc tg t, on obtient pour V(p, a ) le développement en série entière de = p2 2. z Pour 03B103C0 4 V(p, 03B1)=1 2S(p)-03B1 203C0+e-z 203C003A3 Anzn n! + 03B5+zn+1e-z 203C0n!(n-z+1) 003B51 si on se limite aux fonctions p > 2; les fonctions p 2 étant toujours inférieures à 0,01 Pour a > 03C0 4 on se ramène au cas précédent par la formule VII - UNE INTERPRETATION GEOMETRIQUE DE LA FONCTION V(p, 03B1) - Si on effectue sur l intégrale le changement de variable a 2 95

D où On voit sous cette forme que 2n V(p, a) s interprète comme l aire du secteur défini par les rayons d angles polaires 2 a et 1t et la courbe : r = e-p transformée de la parabole (p) foyer 0 et de paramètre z par une transformation exponentielle négative sur le rayon vecteur p. En particulier, on pourra remarquer que cette courbe transformée a pour aire totale : 203C0S(p) L aire des deux quadrants postérieurs est : VIII - APPLICATIONS - 203C0S2(p) 1/ Calcul du volume compris entre le plan horizontal XOY et la surface de Laplace-Gauss à l aplomb d un domaine angulaire quelconque. La solution découle immédiatement de la théorie précédente ( II). Le domaine étant défini par les deux droites D et D dont les distances à l origine sont : et dont l angle est i, le volume est donné par la formule : 2/ Double discrimination dans une population d individus gigognes. On envisage une population d individus désignés par (x), de valeur aléatoire x, normalement répartis autour d une moyenne m(x) avec une variance s2x. On imagine ensuite que chaque individu (x) est constitué par une population d éléments (y) de valeur aléatoire y normalement répartis au sein de l individu (x) et assujettis aux deux conditions : - la à la différence de la variance de l ensemble des y relatifs à tous les (x) et de la variance des x; variance de y au sein de (x) est constante et égale - la valeur moyenne des éléments (y) est égale à la valeur de (x) : moyenne liée 96

On peut alors admettre que le couple (x, y) suit une loi de Laplace-Gauss à deux variables, ainsi définie. valeurs moyennes ffix = my = m variance de y lié par x droite de régression de y en x : y = x variances s2x et S2 c est-à-dire coefficient de corrélation Ceci posé, on appellera double discrimination l opération qui consiste à sélectionner les éléments (y) dont la valeur est supérieure à une grandeur b et qui soient en outre situés au sein d individus (x) dont la valeur est supérieure à a. Le résultat de cette opération de double discrimination n est autre que la probabilité pour que x soit supérieur à a et y supérieur à b dans une loi Laplace- Gauss définie comme il précède. En conséquence, désignant comme plus haut par a et b les variables réduites de a et b, le rendement de la double discrimination peut se calculer par la formule : soit Corollaire - Cas d une répartition log-normale des individus (x) et d une répartition lognormale des individus (y) au sein des individus (x). Ce corollaire présente un certain intérêt en statistique des gisements : Le raisonnement précédent subsiste intégralement, les variables réduites prennent toutefois la forme : Remarque - Si x et y désignent des teneurs en métal de masses de minerai, la proportion en métal contenu dans les wagonnets sélectionnées sera donnée par 97

la formule précédente avec : Les variables réduites du métal contenu dans le minerai sont en effet inférieures d un écart-type à celle du minerai. 3/ Calcul approximatif d un coefficient de corrélation expérimentale. En se reportant au deuxième paragraphe de cette note et à la première figure, on note que : - la probabilité pour que (x supérieur à a et y inférieur à b) est donnée par le volume relatif au domaine (Z"IZ). En particulier, la probabilité Po pour que (x supérieur à sa moyenne mx et y inférieur à sa moyenne my) est égale à i/2?t. Or, on a vu dans le premier paragraphe que : D où On peut obtenir ainsi une évaluation rapide d un coefficient de corrélation expérimentale à partir de la proportion P des points expérimentaux situés dans le quatrième quadrant ayant pour sommet le point moyen (mx, my) de la distribution. On a retrouvé une formule classique sous une forme un peu différente. 98