DES DISTRIBUTIONS DE PROBABILITÉ SINGULIÈRES. Marc BARBUT 1



Documents pareils
Développement décimal d un réel

Chapitre 2 Le problème de l unicité des solutions

Rappels sur les suites - Algorithme

De même, le périmètre P d un cercle de rayon 1 vaut P = 2π (par définition de π). Mais, on peut démontrer (difficilement!) que

Arithmétique binaire. Chapitre. 5.1 Notions Bit Mot

Image d un intervalle par une fonction continue

Intégration et probabilités TD1 Espaces mesurés Corrigé

Intégration et probabilités TD1 Espaces mesurés

UNE REPRESENTATION GRAPHIQUE DE LA LIAISON STATISTIQUE ENTRE DEUX VARIABLES ORDONNEES. Éric TÉROUANNE 1

Moments des variables aléatoires réelles

Limites finies en un point

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

Continuité et dérivabilité d une fonction

Cours d Analyse. Fonctions de plusieurs variables

Cours d introduction à l informatique. Partie 2 : Comment écrire un algorithme? Qu est-ce qu une variable? Expressions et instructions

n N = u N u N+1 1 u pour u 1. f ( uv 1) v N+1 v N v t

Programmes des classes préparatoires aux Grandes Ecoles

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.

Calcul matriciel. Définition 1 Une matrice de format (m,n) est un tableau rectangulaire de mn éléments, rangés en m lignes et n colonnes.

La mesure de Lebesgue sur la droite réelle

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT

TSTI 2D CH X : Exemples de lois à densité 1

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Précision d un résultat et calculs d incertitudes

UEO11 COURS/TD 1. nombres entiers et réels codés en mémoire centrale. Caractères alphabétiques et caractères spéciaux.

IV- Equations, inéquations dans R, Systèmes d équations

* très facile ** facile *** difficulté moyenne **** difficile ***** très difficile I : Incontournable T : pour travailler et mémoriser le cours

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.

Séminaire TEST. 1 Présentation du sujet. October 18th, 2013

Université Paris-Dauphine DUMI2E 1ère année, Applications

Intégrale de Lebesgue

DOCM Solutions officielles = n 2 10.

Représentation géométrique d un nombre complexe

Fonctions de plusieurs variables

1. Vocabulaire : Introduction au tableau élémentaire

AC AB. A B C x 1. x + 1. d où. Avec un calcul vu au lycée, on démontre que cette solution admet deux solutions dont une seule nous intéresse : x =

Définition 0,752 = 0,7 + 0,05 + 0,002 SYSTÈMES DE NUMÉRATION POSITIONNELS =

M2 IAD UE MODE Notes de cours (3)

1 Définition et premières propriétés des congruences

a et b étant deux nombres relatifs donnés, une fonction affine est une fonction qui a un nombre x associe le nombre ax + b

Raisonnement par récurrence Suites numériques

Licence Sciences et Technologies Examen janvier 2010

Continuité en un point

Statistiques Descriptives à une dimension

Complément d information concernant la fiche de concordance

Notion de fonction. Résolution graphique. Fonction affine.

Annexe commune aux séries ES, L et S : boîtes et quantiles

LES TYPES DE DONNÉES DU LANGAGE PASCAL

Théorie de la Mesure et Intégration

La persistance des nombres

Cours de Probabilités et de Statistique

Nombre dérivé et tangente

Objets Combinatoires élementaires

Introduction à l étude des Corps Finis

Chapitre 6. Fonction réelle d une variable réelle

Calculer avec Sage. Revision : 417 du 1 er juillet 2010

Algorithme. Table des matières

Principe de symétrisation pour la construction d un test adaptatif

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN

CCP PSI Mathématiques 1 : un corrigé

Équation de Langevin avec petites perturbations browniennes ou

MESURE ET INTÉGRATION EN UNE DIMENSION. Notes de cours

BACCALAURÉAT GÉNÉRAL SESSION 2012 OBLIGATOIRE MATHÉMATIQUES. Série S. Durée de l épreuve : 4 heures Coefficient : 7 ENSEIGNEMENT OBLIGATOIRE

Sur certaines séries entières particulières

La question est : dans 450 combien de fois 23. L opération est donc la division. Le diviseur. Le quotient

V- Manipulations de nombres en binaire

Priorités de calcul :

I. Polynômes de Tchebychev

3. Conditionnement P (B)

DÉRIVÉES. I Nombre dérivé - Tangente. Exercice 01 (voir réponses et correction) ( voir animation )

Mesure et Intégration (Notes de cours de L3)

Chp. 4. Minimisation d une fonction d une variable

Représentation d un entier en base b

Introduction. Mathématiques Quantiques Discrètes

CORRIGE LES NOMBRES DECIMAUX RELATIFS. «Réfléchir avant d agir!»

Probabilités sur un univers fini

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Logique. Plan du chapitre

Définitions. Numéro à préciser. (Durée : )

Calculs de probabilités

Exercices Alternatifs. Une fonction continue mais dérivable nulle part

Modélisation aléatoire en fiabilité des logiciels

Chapitre 3. Quelques fonctions usuelles. 1 Fonctions logarithme et exponentielle. 1.1 La fonction logarithme

Qu est-ce qu une probabilité?

Coefficients binomiaux

ÉVALUATION FORMATIVE. On considère le circuit électrique RC représenté ci-dessous où R et C sont des constantes strictement positives.

Première partie. Préliminaires : noyaux itérés. MPSI B 6 juin 2015

Structures algébriques

3. Caractéristiques et fonctions d une v.a.

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA

SINE QUA NON. Découverte et Prise en main du logiciel Utilisation de bases

Cours3. Applications continues et homéomorphismes. 1 Rappel sur les images réciproques

Conversion d un entier. Méthode par soustraction

Méthodes de quadrature. Polytech Paris-UPMC. - p. 1/48

Table des matières. I Mise à niveau 11. Préface

Seconde Généralités sur les fonctions Exercices. Notion de fonction.

Chapitre 0 Introduction à la cinématique

Petit lexique de calcul à l usage des élèves de sixième et de cinquième par M. PARCABE, professeur au collège Alain FOURNIER de BORDEAUX, mars 2007

Economie de l incertain et de l information Partie 1 : Décision en incertain probabilisé Chapitre 1 : Introduction à l incertitude et théorie de

Transcription:

Math. Sci. hum / Mathematics and Social Sciences (48 e année, n 9, 2(2), p. -8) DES DISTRIBUTIONS DE PROBABILITÉ SINGULIÈRES Marc BARBUT RÉSUMÉ Ce texte n a rien d original. Son objectif est seulement pédagogique. On montre comment peuvent se construire des fonctions de répartition continues non dérivables et des fonctions de sauts de support partout dense sur l intervalle de définition. MOTS-CLÉS Cantor, Continu, Dense, Discret, Fonction de répartition, Lévy, Saut SUMMARY Strange probability distributions This paper is in no way original. Its aim is purely pedagogical. We show how to construct continuous cumulative distribution functions without density function and discontinuous ones with a set of discontinuities that are dense over their interval of definition. KEYWORDS Cantor, Continuous, Cumulative distribution function, Dense, Discrete, Lévy, Saltus Le premier livre publié par Bruno Leclerc est Distributions statistiques et lois de probabilité, paru en 972 aux éditions Gauthier-Villars et Mouton, dans la collection «Mathématiques et Sciences de l Homme», fasc. XV, série «Cahiers mathématiques» (fasc. IV). Dans cet ouvrage tout à fait remarquable, ne serait-ce que du point de vue pédagogique, B. Leclerc présente une bonne quinzaine de distributions de probabilité (la Normale, bien sûr, mais aussi celles de Fisher, Pareto, Halphen, Polya, lois gamma, binomiale négative, etc ), dont certaines peu usuelles. Et pour chacune, il fournit plusieurs exemples d applications statistiques, avec références précises aux articles originaux. Ainsi, ce livre a été un outil irremplaçable pour de nombreux chercheurs ou ingénieurs lorsqu ils rencontraient des problèmes statistiques nouveaux pour lesquels des méthodes originales de résolution devaient être trouvées. Ici, mon objectif est de souligner que la définition toute simple de la fonction de répartition d une variable aléatoire réelle : que : Fonction F à valeurs réelles, monotone non décroissante, continue à droite et telle F("#) = et F(+") = Centre d Analyse et de Mathématique Sociales, EHESS, 54 bd Raspail 7527 Paris cedex 6, mbarbut@ehess.fr

2 M. BARBUT que cette définition, donc, est compatible avec des cas singuliers de distributions de peu d intérêt, il est vrai, pour les applications à la statistique mais de grand intérêt pour comprendre l extrême diversité des lois de probabilité possibles. LA DÉCOMPOSITION DE PAUL LÉVY Au début des «années 92», Paul Lévy a montré que toute fonction de répartition F était la somme de trois termes, soit : () F = F ac + F s + F c Dans cette expression, F ac est proportionnelle à une fonction de répartition x «absolument continue», c est-à-dire qu elle est de la forme $ "# f (t) dt, où f est positive et intégrable ; f x est appelée sa densité. La plupart des distributions utilisées en statistique sont de ce type. Le terme F s de () est une fonction de sauts, telles que les classiques loi de Poisson ou loi de Pascal. Ces fonctions de saut sont discontinues et le nombre des sauts est fini ou dénombrable: en effet, ils sont positifs et leur somme vaut au plus ; donc, quel que soit l entier naturel n, il n y en a qu un nombre fini d amplitude supérieure ou égale à /n. Dans les deux exemples évoqués ci-dessus (Poisson et Pascal) le support de la distribution est discret ; c est même l ensemble des entiers positifs ou nul. Nous verrons que les choses peuvent ne pas être aussi simples. Quant au troisième terme F c de l expression (), c est une fonction de répartition continue partout mais non dérivable en une infinité de ses points. DISTRIBUTION UNIFORME ET ÉCRITURE DES NOMBRES Partons de la banale distribution uniforme sur l intervalle [,] (cf. Figure ). Pour tout x de cet intervalle, on a : (2) F(x) = x Pour ceux des x qui sont décimaux, on a ainsi, par exemple : F(,5) = 2 F(,673) = 67,3 %, etc L ordre des décimaux est l ordre lexicographique (i.e., alphabétique), l alphabet étant constitué des chiffres, par exemple :,673 <,673 <,6735 C est un ordre dense en soi : entre deux décimaux on peut toujours en intercaler un autre, et donc une infinité d autres.

DES DISTRIBUTIONS DE PROBABILITÉ SINGULIÈRES 3 Pour les non-décimaux, l écriture décimale se ferait avec une infinité de chiffres après la virgule. Revenons aux décimaux ; il y a une ambiguïté. Chacun peut s écrire de deux façons dont l une avec une infinité de chiffres. Par exemple :,673 =, 672999 C est cette ambiguïté qu on va essayer de lever. Pour simplifier l exposé, nous supposons désormais que les nombres sont exprimés en écriture binaire, les deux chiffres étant et, avec l ordre «alphabétique» : < Notre problème est de faire correspondre à chaque écriture d un nombre au moyen d une suite de chiffres et, un point x et un seul du segment de droite unitaire [,] (noté AB sur les figures). L écriture peut être figurée par une arborescence. À chaque bifurcation, le chiffre envoie à gauche et le chiffre à droite. Ainsi, la Figure représente les 8 nombres binaires à 3 chiffres, engendrés par ce procédé et rangés dans l ordre lexicographique, c est-à-dire alphabétique, comme pour les mots d un dictionnaire ou d un annuaire. FIGURE La position sur le segment unitaire du point correspondant à chaque écriture va être déterminée par une suite de partitions de ce segment emboîtées les unes dans les autres, selon la correspondance : Chiffre Chiffre " segment de gauche " segment de droite. La Figure 2 représente ainsi la partition en 4 sous-segments correspondant aux deux premiers chiffres : à un nombre commençant par correspond un point du

4 M. BARBUT segment AA ; de même, si le nombre commence par, le point appartient au segment MB ; etc e façon à avoir une partition du segment unitaire, il faut préciser à quel intervalle correspondent les points de division. Ici, tous nos intervalles seront fermés à gauche et ouverts à droite. A A M B B FIGURE 2 Il est clair qu à chaque nouveau chiffre de l écriture correspond un intervalle emboîté dans le précédent et que l intersection de cette suite d intervalles emboîtés, prolongée indéfiniment, converge vers un point x et un seul du segment unitaire. Dans le cas des points de division, qui représentent les nombres binaires (i.e. ceux qui peuvent s écrire avec un nombre fini de chiffres), il y a deux écritures possibles. Par exemple, pour le point B, on écrira soit : (sous-entendu ), soit (avec ici, explicitement, une suite infinie de après les deux premiers chiffres ), comme illustré par la Figure 3. Ainsi, pour ces points, il y a ambiguïté : à chacun correspondent deux écritures, et non une seule, comme pour les points images de nombres non-décimaux. A A 2 M B 2 B FIGURE 3

DES DISTRIBUTIONS DE PROBABILITÉ SINGULIÈRES 5 LA CONSTRUCTION DE CANTOR Georg Cantor a imaginé une façon simple de lever cette ambiguïté : à chaque étape du processus dichotomique, enlever du segment unitaire un intervalle ouvert dont chacune des extrémités correspond à l une des deux écritures. Par exemple (Figure 4), à l écriture correspond l extrémité gauches B de l intervalle ouvert B B et à l écriture l extrémité droite B. < > < > < > A A A M M B B B FIGURE 4 L ensemble fermé des points subsistant après une infinité d itérations, souvent appelé ensemble ternaire (également dénommé triadique) de Cantor, est en correspondance biunivoque avec les écritures. Il a donc le même cardinal א (on dit encore «la puissance du continu») que le segment unitaire AB de départ. LA FONCTION DE RÉPARTITION ASSOCIÉE Comment le procédé de Cantor modifie-t-il la distribution uniforme sur le segment [,]? Supposons pour simplifier qu à chaque itération la k ième par exemple, chacun des 2k nouveaux «trous» soit centré au milieu de l intervalle troué et mesure le tiers de sa longueur. Ainsi, à la première étape, le «trou» MM (Figure 5(a)), qui est un intervalle ouvert, est centré au point d abscisse /2 et a pour longueur /3.

6 M. BARBUT /3 2/3 A < > M M B FIGURE 5(a) Or, il y a (distribution uniforme) une même probabilité /2 pour qu un point se trouve soit à gauche, soit à droite du milieu de l intervalle unitaire [,]. Donc la fonction de répartition correspondante a un «plateau» d ordonnée /2 et de longueur /3 sur l intervalle MM. On devra ensuite compléter la définition de la fonction de répartition F à cette première étape par interpolation linéaire (distribution uniforme) sur chacun des deux intervalles AM et M B (Figure 5(b)). /2 /3 2/3 FIGURE 5(b). La fonction de répartition F De même, à la deuxième itération, chacun des deux intervalles AM et M B est amputé d un «trou» de longueur /9, centrés aux points d abscisse /6 pour le premier A A, 5/6 pour le second B B (cf. Figure 4). À chacun de ces deux nouveaux trous

DES DISTRIBUTIONS DE PROBABILITÉ SINGULIÈRES 7 correspondent des «plateaux» d ordonnées /4 et 3/4 respectivement de la fonction de répartition F 2, complétée par interpolation linéaire (Figure 6). 3/4 /2 /4 /9 2/9 /3 2/3 7/9 8/9 FIGURE 6. La fonction de répartition F 2 On remarquera d ailleurs que l on a uniformément l inégalité : () F 2 " F # 4 D une façon générale, à la kième itération, on aura pour la fonction de répartition 2n " F k, 2k nouveaux «plateaux», chacun de longueur et d ordonnées, avec 3 k 2 k n =,2,3,, 2k-. Par construction, on a uniformément : (2) F k " F k" # 2 k d où, pour tout couple d entiers k et h : Comme h F k+h " F k < # (3) i= F k+i " F k+i" # $ F k+h " F k < 2 k h i= = h " < # " 2 k+i 2 k 2 i 2 k 2 i " # =, nous avons finalement, quels que soient les entiers positifs k et h : i= 2 i i= i= De (3), il résulte que la suite des fonctions de répartition F m converge uniformément vers une fonction de répartition limite F ; comme chacune des F m est continue, leur limite uniforme l est également. Nous avons ainsi l exemple d une fonction de répartition continue, presque partout dérivable de dérivée nulle, mais non dérivable sur son support (qui est de mesure linéaire nulle) : la pente des segments de droite d interpolation tend évidemment vers l infini lors des itérations successives.

8 M. BARBUT N.B. On peut généraliser. À chaque itération, les 2k nouveaux «trous» peuvent être de longueur arbitraire et centrés où l on veut, pourvu qu ils soient tous ouverts et strictement intérieurs à l intervalle duquel ils sont ôtés. De même, les ordonnées des nouveaux «plateaux» correspondants de la fonction de répartition F k peuvent être à des ordonnées arbitraires mais distinctes de celles des plateaux de F k- et intercalées entre celles-ci. Dans ce dernier cas, la fonction de répartition limite continue F ne procède plus de la distribution uniforme, comme dans la construction qui a été détaillée supra. DE SINGULIÈRES FONCTIONS DE SAUTS Si maintenant nous inversons la fonction de répartition F, en échangeant le rôle des abscisses et des ordonnées, qu obtenons-nous? Encore un objet bien singulier : une fonction " de sauts, mais dont les sauts, d amplitudes (k entier positif quelconque) 3k forment un ensemble dénombrable mais partout dense sur l intervalle [,]. On est bien loin de la représentation habituelle de fonctions de sauts dont le support, comme dans la distribution de Poisson ou celle de Pascal, est un ensemble dénombrable discret. N.B. Ici aussi, on peut généraliser. PS. Les rapporteurs anonymes sur ce texte, outre plusieurs remarques fort judicieuses dont ils sont remerciés, suggèrent d indiquer des références bibliographiques pour le lecteur qui désirerait en savoir plus. Ils proposent : BILLINGSLEY P., (995), Probability and Measure, John Wiley and Sons, chapitre 3. LEBESGUE H., (94), Leçons sur l intégration et la recherche des fonctions primitives, Paris, Gauthiers-Villars, [2 e édition 928, chap. IV, p. 56-57]. LÉVY P., (937), Théorie de l addition des variables aléatoires, Paris, Gauthier-Villars, chapitre III,.2.