Statistiques des lois à queue régulière avec l application sur les perturbations des comètes Shuyan LIU Université Paris - SAMM Youri DAVYDOV et Radu STOICA Université Lille - Laboratoire Paul Painlevé 8 mai 04, Maths en mouvement 04, Paris
La vente de livres sur Amazon a une longue traîne (Brynjolfsson, Erik et al., Management Science, 49 (), November 003)
Divergence d utilisation du terme lois à queue lourde lim x eλx P(X > x) =, λ > 0 p entier positif t.q. E(X n ) =, n > p E(X ) = lim P(X > x + t X > x) =, t > 0 x (Lois à longue traîne/queue) a > 0 t.q. P(X > x) x a pour x suffisamment grand (Lois à queue épaisse)
Statistiques des lois à queue régulière avec l application sur les perturbations des comètes Lois à queue régulière Estimation des paramètres 3 Application aux données des perturbations planétaires 4 Conclusion et perspectives
Définition de lois à queue régulière Une v.a. X R a la loi à queue régulière d indice α > 0 si p, q 0, et une fonction à variation lente L(x), tels que P(X > x) pl(x)x α et P(X < x) ql(x)x α si x +. (Fonction à variation lente : L(λx) L(x) lorsque x, λ > 0.)
Les lois α-stables n ont pas d expression explicite pour la densité Exemple : Lois α-stables Fonction caractéristique : ( exp{ γ α t α iβ( sign t) tan πα E exp itx = exp{ γ t ) + iµt}, α, ( + iβ π ( sign t) ln t ) + iµt}, α =. Paramètres : α (0, ], γ = p + q (0, ), β = p q p+q [, ], µ R. Exemples : α = : lois gaussiennes, p(x) = α = : lois de Cauchy, p(x) = σ α = / : lois de Lévy, p(x) = ( σ π σ x π e 4σ. π(x +σ ). ) / x 3/ exp ( σ x ).
La densité de lois stables dépend de quatre paramètres Dépendance de β Dépendance de α, γ et µ
Statistiques des lois à queue régulière avec l application sur les perturbations des comètes Lois à queue régulière Estimation des paramètres 3 Application aux données des perturbations planétaires 4 Conclusion et perspectives
Un exemple de données simulées Densité de loi S(.5, 0.5,, 0)
Un exemple de données simulées Données simulées de loi S(.5, 0.5,, 0), N = 500
Un exemple de données simulées Histogrammes
Un exemple de données simulées Diviser l échantillon en 80 groupes, chacun contient 8 éléments..
Un exemple de données simulées Diviser l échantillon en 80 groupes, chacun contient 8 éléments..
Un exemple de données simulées Calculer les valeurs de ˆα N, ˆβ N et ˆγ N :.78, 0.4 et 0.77.. M () m, = 4.6 M () 8.70 = 0.53 m, θ m, = M () m, = 3. M () 3.44 = 0.9 m, θ m, =. M () m,80 M () m,80 =.46.86 = 0.86 θ m,80 =
Algorithme d estimation Soit ξ,..., ξ N des v.a. i.i.d. suivant une loi à queue régulière. Étape On divise l échantillon en n groupes disjoints, chacun contient m éléments, i.e. ξ,..., ξ m, ξ } {{ } m+,..., ξ } {{ m },......, ξ (n )m+,..., ξ nm. } {{ } G m, G m, G m,n En pratique on choisit n = [N r ] et m = [N r ], r (0, ). Étape Notons M () m,i = max{ ξ : ξ G m,i }, ξ m,i : l élément dans G m,i tel que ξ m,i = M () m,i, M () m,i = max{ ξ : ξ G m,i \{ξ m,i }}, i =,..., n. Étape 3 Calculons S n = n M (), θ m,i = ξ m,i m,i i= m,i M () m,i ξ m,i, q m,i = M() m /α, ˆα N = Sn n S n, (.) ˆβ N = n n i= δ θ ()., (.) ( m,i ) α t γ N =, t > 0. (.3) nγ( t α ) n i= qt m,i
Consistance des estimateurs Soient ξ, ξ,..., ξ N des v.a. i.i.d. suivant une loi à queue régulière. Si S n et ˆβ N sont défini par (.) et (.) avec n N r, 0 < r <, alors on a et ˆβ N n S n p.s. N α + α. p.s. β quand N. N Si la condition de régularité est satisfaite avec L(x) = et ˆγ N est défini par (.3) avec n N r, 0 < r <, et 0 < t < αr, alors on a ˆγ N γ p.s. N 0.
Influence du regroupement d échantillon 3 0.6.5 0.5 0.4 0.3.5 0. 0. 0 0.5 0. 0. 0.3 0.4 0.5 0.6 0.7 0.8 0.9 0. 0. 0. 0.3 0.4 0.5 0.6 0.7 0.8 0.9 N = 00 000, α =.75 N = 00 000, β = 0.5 Fig. Diagrammes des points ( r, ˆα N ) et ( r, ˆβ N ) estimés de loi S(.75, 0.5, ).
Statistiques des lois à queue régulière avec l application sur les perturbations des comètes Lois à queue régulière Estimation des paramètres 3 Application aux données des perturbations planétaires 4 Conclusion et perspectives
Un jeu de données des perturbations planétaires Les données sont composées d un ensemble des triplets (cos i, q, z), z = /a : l inverse de demi-grand axe, z = z f z i : la marque de perturbation.
QQ-plot des données dans une cellule autour de Jupiter 0.0 QQ Plot of Sample Data versus Normal 0.05 0.0 Quantiles of Input Sample 0.005 0 0.005 0.0 0.05 0.0 4 3 0 3 4 Normal Quantiles
Comportement de type queue lourde autour des orbites des grandes planètes Calculons dans chaque cellule l indicateur de queue lourde : ẑ 0.99 ˆn 0.99. Effectuons le test de normalité des quantiles empiriques ẑ 0.95. 8 8 7 6 7 0.99 6 5 6 0.75 5 4 5 4 3 4 0.5 3 3 0.5.6e 00 0 0 0.8 0.6 0.4 0. 0 0. 0.4 0.6 0.8 0.0 0.8 0.6 0.4 0. 0.0 0. 0.4 0.6 0.8.0
Résultats d estimation des paramètres pour les perturbations α β 8 8 0.5 7 5 7 0.4 6 4.5 6 0.3 5 4 5 0. 4 3.5 4 0. 3 0 3.5 3 0. 0..5 0.3 0 0 0.8 0.6 0.4 0. 0 0. 0.4 0.6 0.8 0.8 0.6 0.4 0. 0 0. 0.4 0.6 0.8 γ µ x 0 5 8 8 0.4 x 0 4 9.5 7 8 7 6 7 6.5 5 6 5 4 5 4 0.5 3 4 3 0 3 0.5.5 0 0.8 0.6 0.4 0. 0 0. 0.4 0.6 0.8 0 0.8 0.6 0.4 0. 0 0. 0.4 0.6 0.8
Le modèle de lois à queue régulière donne un meilleur ajustement 8 8 7 0.9 7 0.9 0.8 0.8 6 0.7 6 0.7 5 0.6 5 0.6 4 0.5 4 0.5 3 0.4 3 0.4 0.3 0.3 0. 0. 0 a) b) 0.8 0.6 0.4 0. 0 0. 0.4 0.6 0.8 a) α <, H 0 : loi stable, b) α >, H 0 : loi alternative de densité définie par f (z) = 0. 0 0 0.8 0.6 0.4 0. 0 0. 0.4 0.6 0.8 C κ,α + κ z ω α+, 0.
Statistiques des lois à queue régulière avec l application sur les perturbations des comètes Lois à queue régulière Estimation des paramètres 3 Application aux données des perturbations planétaires 4 Conclusion et perspectives
Conclusion et perspectives CONCLUSION Généralisation aux lois à queue régulière Vitesse de convergence des estimateurs optimisée Modélisation des données réelles PERSPECTIVES Choix de r La loi qui ajuste au mieux un jeu de données Simulation...
Merci!