Projet : Recherche de source d onde gravitationnelle (analyse de données Metropolis Hastings Markov Chain) 1

Dimension: px
Commencer à balayer dès la page:

Download "Projet : Recherche de source d onde gravitationnelle (analyse de données Metropolis Hastings Markov Chain) 1"

Transcription

1 Université Paris Diderot Physique L Simulations Numériques SN4 Projet : Recherche de source d onde gravitationnelle (analyse de données Metropolis Hastings Markov Chain) 1 Objectifs : Simuler le signal gravitationnel monochromatique correspondant à une binaire de naines blanches puis le cacher dans le bruit de l interféromètre spatial elisa. Rechercher dans ces données simulées la source avec une méthode Metropolis Hasting Markov Chain simplifiée et caractériser la précision sur les paramètres obtenus. Introduction Les ondes gravitationnelles sont des déformations de l espace-temps qui se propagent à travers l Univers. Prédite par la relativité générale, elles sont émises par une large gamme de sources astrophysiques et cosmologiques. Ces ondes induisent des phénomènes observables au niveau de la Terre dont l intensité est si faible que leur observation est extrêmement difficile. Néanmoins les performances technologiques actuelles permettent d envisager leur détection. Ainsi différents détecteurs terrestres commencent à être opérationnels dans le domaine des hautes fréquences. Pour accéder aux ondes à basse fréquence telles que celles émises par les binaires de trous noirs supermassifs (10 5 à 10 7 masses solaires), ou encore les binaires d objets compacts (naine blanche ou étoile à neutrons ; une masse solaire), il est nécessaire de disposer d un détecteur spatial : c est la mission Large L3 de l ESA, elisa (Laser Interferometer Space Antenna) qui sera lancer vers 2030 et qui ouvrira une nouvelle fenêtre sur l Univers. elisa est formé de trois satellites contenant des masses uniquement sensibles à la gravité et qui s échangent des faisceaux lasers afin de former un ou plusieurs interféromètres. Le triangle constitué par ces satellites distants d un million de kilomètres (L = 10 9 m) suit la Terre sur son orbite autour du Soleil. Modélisation du signal Une source binaire monochromatique est décrite par les 7 paramètres suivants : 1. Référent : mailto :petiteau@apc.univ-paris7.fr 1

2 θ [0, π] la colatitude de la source dans le ciel, λ [0, 2π] la longitude de la source dans le ciel, i [ π, π] l inclinaison du plan de l orbite, ψ [0, 2π] la polarisation (qui est en quelque sorte l orientation de l orbite), f la fréquence de l onde gravitationnelle qui est le double de la fréquence orbitale, φ 0 [0, 2π] la phase initiale, A l amplitude qui dépend des masses m 1 et m 2, de la distance de la source D et de la fréquence par la relation : A = 2 G m 1 m 2 (G(m 1 + m 2 )πf) 2/3 c 4 (1) m 1 + m 2 D L onde gravitationnelle émise est décrite par deux composantes qui varie temporellement : { h+ (t) = A(1 + cos 2 i) cos(4πft + φ 0 ) h (t) = 2A cos i sin(4πft + φ 0 ) Si on considère que la fréquence de la source est basse ( f < 10 mhz ) le signal en sortie du détecteur peut s approximer comme : X(t, θ, λ, i, ψ, φ 0, f, A) = 2 ω(f)l ( ) ω(f)l sin (3) c c [h +0 (A, i) (F + (t, θ, λ) cos(2ψ) F (t, θ, λ) sin(2ψ)) cos φ(t, f, θ, λ)(4) +h 0 (A, i) (F + (t, θ, φ) sin(2ψ) F (t, θ, λ) cos(2ψ)) sin φ(t, f, θ, λ)] (5) (2) avec : la pulsation ω = 2πft la phase : ( ) k. r0 (t, θ, λ) φ(t, f, θ, λ) = ω(f) t L + φ 0 (6) c c le produit scalaire entre la direction de propagation de la source k et le vecteur position du détecteur dans le système solaire r 0 : k. r0 (t, θ, λ) = R sin θ cos (Φ T (t) λ) (7) l angle annuelle : Φ T (t) = 2πt 1 an R la distance entre le Soleil et le centre du détecteur, égale à la distance Soleil-Terre ; les amplitudes : h +0 (A, i) = A(1 + cos 2 i) et h 0 (A, i) = 2A cos i (9) les fonctions de réponse du détecteur en fonction de la direction de la source pour les deux composantes de l onde gravitationnelle : F + (t, θ, λ) = 1 32 [6 sin 2θ (3 sin (Φ T (t) + λ) sin (3Φ T (t) λ)) 18 3 sin 2 θ sin 2Φ T (t) 3 ( 1 + cos 2 θ ) ] (sin (4Φ T (t) 2λ) + 9 sin (2λ)) (10) F (t, θ, λ) = 1 [ 3 cos θ (cos (4ΦT (t) 2λ) 9 cos (2λ)) sin θ (cos (3Φ T (t) λ) + 3 cos (Φ T (t) + λ))] (11) (8) 2

3 Méthode de recherche On considère des données temporelles x qui contiennent du bruit n et potentiellement un signal h true dont on ignore les paramètres µ true = [θ, λ, i, ψ, f, φ 0, A]. L objectif de l analyse de données est de trouver le jeu de paramètres µ best décrivant le signal h best s ajustant le mieux avec les données puis d évaluer avec quelle précision chaque paramètre est estimé. Pour cela, on va tester un grand nombre de jeu de paramètres µ en mesurant pour chacun la qualité de son ajustement aux données. Autrement dit, on veut évaluer la densité de probabilité (PDF - probability density function) a posteriori p( µ x) du signal h décrit par les paramètres µ sachant les données x. D après le théorème de Bayes, cette quantité est donnée par : p( µ d) = L(x µ)π( µ), (12) p(x) où π( µ) est notre connaissance a priori sur les paramètres µ, p(x) est la probabilité d avoir ces données (aussi appelée évidence) et L(x µ) est la vraisemblance des données x sachant le signal h décrit par les paramètres µ. Dans notre cas, le logarithme de la vraisemblance est : [ fmax ( x(f) ln L(x µ) = 2 R h(f, µ))( x(f) h(f, ] µ)) 2 t σn 2 df (13) f min où σ n est l écart-type du bruit qu on suppose blanc, c est-à-dire de distribution gaussienne, [f min, f max ] est l intervalle en fréquence contenant le signal h(f) et ỹ(f) est le transformée de Fourier (décomposition en fréquences) des données temporelles y(t). Les séries de données étant discrètes en temps, leur transformée de Fourrier seront discrètes en fréquence. Du fait de cette nature discrète, le logarithme de la vraisemblance correspond à la somme suivante : i fmax ln L(x µ) = 2 f R ( x i hi ( µ))( x i hi ( µ)) 2 t σ 2 (14) i n fmin Si on suppose π( µ) et p(x) constant, il est possible d évaluer la densité de probabilité qui nous intéresse, p( µ x), directement à partir du calcul de la vraisemblance (14) pour une liste, ou chaîne, de points µ déterminée en utilisant l algorithme Metropolis Hastings Markov Chain (MHMC). Cet algorithme itératif détermine si un nouveau point µ test est ajouté ou non à la chaîne sachant la position µ i du dernier point accepté et la vraisemblance de µ test et µ i. Plus précisément on choisit une variable aléatoire α entre 0 et 1. Si α < min(1, exp(ln L(x µ j ) ln L(x µ i ))) le point est accepté et on l ajoute alors à la chaîne, sinon il est rejeté et on ajoute une nouvelle fois à la chaîne le points µ i. Algorithme de recherche On suppose que les données x sont disponibles sous la forme d un tableau de points régulièrement échantillonné avec un pas de temps t, qu on dispose d une fonction qui permet de remplir le tableau de points h(t) à partir d un ensemble de 7 paramètres µ = [θ, λ, i, ψ, f, φ 0, A] et qu on connait l écarttype du bruit σ n et l intervalle fréquentielle [f min, f max ] qui contient le signal. 1. Créer un tableau contenant la transformée de Fourier x des données. Conseil : utiliser simplement la fonction numpy.fft.rfft() en multipliant le résultat par le pas de temps pour avoir une normalisation correcte. La fonction numpy.fft.fftfreq() permet de créer le tableau des fréquences correspondantes ce qui peut être utile pour calculer les indices ifmin et ifmax correspondant à f min et f max. 2. Choisir un point de départ µ 0 aléatoirement, c est-à-dire choisir une valeur pour chacun des 7 paramètres dans l intervalle des valeurs possibles. Ajouter ce point dans le tableau contenant la chaîne (qui est en fait une matrice 7 nombre de points dans la chaîne MHMC). 3

4 3. Faire la transformée de Fourrier h 0 du signal h Calculer le logarithme de la vraisemblance ln L 0 à partir de x, h 0 et σ n. 5. Choisir un nouveau point µ test à partir du dernier point de la chaîne µ i. 6. Calculer le signal temporel h correspondant aux paramètres µ i. 7. Faire la transformée de Fourrier h test du signal h test 8. Calculer le logarithme de la vraisemblance ln L test à partir de x, h test et σ n. 9. Tirer une variable aléatoire α. Si α < min(1, exp(ln L test ln L i ))), ajouter ce point dans le tableau de la chaîne. Sinon ajouter le point µ i dans le tableau de la chaîne. 10. Recommencer à l étape 5 tant que le nombre de point tester est inférieur au nombre de points désiré dans la chaîne moins 1 (pour tenir compte du point de départ). La densité de probabilité pour chacun des paramètres est donnée par l histogramme des valeurs correspondantes dans la chaîne. Cette densité de probabilité permet de caractériser la précision sur l estimation des paramètres. En particulier si la forme de la distribution est une gaussienne, l erreur sera donné par l écart-type de cette gaussienne. Travaux à effectuer Simulation de données Simuler des données contenant la même source dans différents niveaux de bruit. Pour commencer il est conseillé de fixer la fréquence à 1 mhz et l amplitude à Le bruit est un bruit blanc qui peut être généré avec la fonction numpy.random.randn(). Le signal sera pris sur une durée de 1 an avec un pas de temps de 100 secondes. Pour comparer le signal au données, on pourra superposer le signal (sans bruit) sur les données. Les équations étant assez longues et complexes, vous pourrez les tester sur le cas suivant : pour θ = 0.5 rad, λ = 1 rad, i = 0.2 rad, ψ = 0.8 rad, f = 10 3, φ 0 = 2 rad, A = , on trouve à t = 100s, h +0 = , h 0 = , Φ T = , k. r 0 /c = s, F + = , F = et X = Vraisemblance Implémenter le calcul du logarithme de la vraisemblance ln L. Calculer ln L true pour les vrais paramètres. Calculer ln L i pour d autres valeurs de paramètres et vérifier que ln L i ln L true lorsque le bruit est beaucoup plus faible que le signal. Recherche d un ou deux paramètre de la source : l inclinaison 1. Tirage aléatoire du nouveau point : Implémenter l algorithme MHMC. Pour choisir le nouveau point (étape 5), fixer tous les paramètres de la source aux vraies valeurs sauf l inclinaison qui sera choisi aléatoirement dans son intervalle de définition. Executer l algorithme de recherche MHMC sur itérations. Tracer l évolution de l inclinaison en fonction de l itération ainsi que l histogramme des valeurs de la chaîne. 2. Tirage gaussien du nouveau point : Faire la même chose que précédemment en tirant cette fois le nouveau point (étape 5) dans une gaussienne centrée sur la valeur du point précédent et d écart-type

5 Executer l algorithme de recherche MHMC sur itérations. Tracer l évolution de l inclinaison en fonction de l itération ainsi que l histogramme des valeurs de la chaîne. Comparer la vitesse de convergence avec le cas précédent. Recherche de la source 1. Implémenter le tirage gaussien pour l ensemble des paramètres 2. Faire une recherche sur l inclinaison et l orientation (les autres paramètres étant fixés à leur vraie valeur). Faire un histogramme à deux dimensions pour observer la corrélation. 3. Faire une recherche sur les deux paramètres donnant la position de la source dans le ciel et estimer la résolution angulaire de l instrument pour cette source. 4. Faire une recherche sur l ensemble des paramètres. 5. Si le temps le permet, contacter le référent pour l étude de cas plus réaliste. 5