Les processus d évolution génétique en filtrage de signaux et en analyse de risques P. Del Moral IRIA Centre Bordeaux-Sud Ouest Séminaire de Stat. et Santé Publique de l IFR 99, décembre 08 qq-références : Feynman-Kac formulae. Genealogical and interacting particle systems, Springer (2004), + Réfs + Doucet, Jasra. SMC Samplers. JRSS B (2006). + Kallel, Rowe, Modelling genetic models with IPS, Theoretical Aspects of Evolutionary Computing (2000) P. Del Moral (IRIA) IRIA Centre Bordeaux-Sud Ouest, France 1 / 30
Outline 1 Les processus d évolution génétique 2 Évolution d arbres généalogiques 3 QQ domaines d application 4 Les intégrales de chemins de Feynman 5 Théorie champ moyen P. Del Moral (IRIA) IRIA Centre Bordeaux-Sud Ouest, France 2 / 30
Summary 1 Les processus d évolution génétique Dynamique adaptative des populations Les processus de mutation et sélection QQ exemples 2 Évolution d arbres généalogiques 3 QQ domaines d application 4 Les intégrales de chemins de Feynman 5 Théorie champ moyen P. Del Moral (IRIA) IRIA Centre Bordeaux-Sud Ouest, France 3 / 30
Dynamique adaptative des populations (temps discret) Population d individus évoluant en interaction selon des mécanismes de mutation/exploration coupl/ es à des processus de naissance et mort et/ou de branchements spatiaux-temporel. Processus stochastique formalisé : (taille fixe pour simplifier) Population = individus ξ i n dans un espace d état E n Indice-Label de l individu : i {1,..., } Paramètre temporel : n 0 (temps discret). Exemples d espace d états : Gènes (séquences adn, allèles), positions, vitesses, accélérations, permutations, sous-espaces de points, codes génétiques, traits d individus, age, taille, poids, communautés, nationalité, lignes ancestrales, excursions trajectorielles,... P. Del Moral (IRIA) IRIA Centre Bordeaux-Sud Ouest, France 4 / 30
2 mécanismes d adaptation naturelle Sélection & Mutation Sélection (=naissance/mort=clonage=branchements) : ( ξ 1 n,..., ξn ) E n ( ξ1 n,..., ξ ) n En } {{ } individus sélectionnés Potentiel d adaptation G n : x n E n G n (x n ) [0, 1] 1 Acceptation ξ i n = ξ i n avec une proba G n (ξ i n) 2 Sinon saut sur le j-ième ξ i n = ξ j n avec une proba QQ exemples académiques élémentaires: G n(ξ j n ) P k=1 Gn(ξk n ) G n (x n ) = 1 An (x n ), e 1 2 (yn xn)2 avec y n référence fixée ou encore en trajectoriel sélection de trajectoires x n = (x 0,..., x n) G n (x n ) = 1 (x p x q, p<q<n) P. Del Moral (IRIA) IRIA Centre Bordeaux-Sud Ouest, France 5 / 30
2 mécanismes d adaptation naturelle Sélection & Mutation Mutation (=exploration=proposition=prédiction) : ( ξ1 n,..., ξ ) n En ( ξn+1, 1..., ξn+1) E n+1 Indépendamment les uns des autres, chaque individu sélectionné ξ i n explore l espace en mimant les transitions X n = ξ n i X n+1 = ξn+1 i d une chaîne de Markov X n E n X n+1 = E n+1. QQ exemples académiques élémentaires: X n = marche aléa. sur Z, processus X n = F n (X n 1, W n ) sur R d ou encore en trajectoriel extension locale de trajectoires X n = (X 0,..., X n) X n+1 = ((X 0,..., X n), X n+1) P. Del Moral (IRIA) IRIA Centre Bordeaux-Sud Ouest, France 6 / 30
Algorithme d évolution génétique Exemples : ξ 1 ṇ. ξ i ṇ. ξ n Sélection ξ 1 n. ξ i n. ξ n Mutation X n marche aléatoire sur Z & G n (X n ) = 1 A (X n ). ξ 1 n+1. ξ i n+1. ξ n+1 X n = F n (X n 1, W n ) dyn. aléa sur R d & G n (X n ) = e 1 2 (Yn Hn(Xn))2. X n = X [T n 1,T n] excursion inter-niveaux & G n(x n ) = 1 Bn (X T n ). X n = X [0,n] traject. aléa. sur Z2 & G n (X n ) = 1 (X p X q, p<q n). Modèles trajectoriels X n = X [0,n] & G n (X n ) = G n (X n ). P. Del Moral (IRIA) IRIA Centre Bordeaux-Sud Ouest, France 7 / 30
Summary 1 Les processus d évolution génétique 2 Évolution d arbres généalogiques Processus historiques et lignes ancestrales Les 3 types de mesures d occupation 3 QQ domaines d application 4 Les intégrales de chemins de Feynman 5 Théorie champ moyen P. Del Moral (IRIA) IRIA Centre Bordeaux-Sud Ouest, France 8 / 30
(Sélection & Mutation) trajectorielle Arbres généalogiques Mutation = extension locale des trajectoires Proc. trajectoriel X n = (X 0,..., X n) X n+1 = ((X 0,..., X n), X n+1) Sélection=clonage=sauts des trajectoires Potentiel trajectoriel G n (X n ) = G n (X 0,..., X n) Arbre généalogique Individus trajectoriels ξn i := ( ξ0,n, i ξ1,n, i..., ξn,n i ) } {{ } =ligne ancestrale Arbre généalogique = ( ξ0,n i, ξi 1,n,..., ) ξi n,n 1 i P. Del Moral (IRIA) IRIA Centre Bordeaux-Sud Ouest, France 9 / 30
Processus naissance/mort G n -adaptatif 3 types de mesures ( = 3) = = = Population courante η n := 1 δ ξ i n i-ième individu au temps n Arbre généalogique 1 δ (ξ i 0,n,ξ i 1,n,...,ξi n,n) i-ième ligne ancestrale Arbre généalogique complet 1 δ (ξ i 0,ξi 1,...,ξi n) Potentiels moyens [% de succès (G n = 1 A )] 1 G n (ξn) i P. Del Moral (IRIA) IRIA Centre Bordeaux-Sud Ouest, France 10 / 30
Summary 1 Les processus d évolution génétique 2 Évolution d arbres généalogiques 3 QQ domaines d application Confinement de processus Marches aléatoires répulsives Processus de ruine Filtrage de signaux 4 Les intégrales de chemins de Feynman 5 Théorie champ moyen P. Del Moral (IRIA) IRIA Centre Bordeaux-Sud Ouest, France 11 / 30
Confinement absorption Quantum & Diffusion Monte Carlo X n marche aléatoire sur Z & G n (X n ) = 1 A (X n ). et et 1 η n := 1 0 p<n 1 δ ξ i n Loi(X n 0 p<n X p A) := η n ( ) 1 A ξ i p P ( 0 p<n X p A) δ (ξ i 0,n,ξ i 1,n,...,ξi n,n) Loi((X 0,..., X n ) 0 p<n X p A) Remarque : idem avec des mutation-sélection données par ( X n transition locales A) & (Ĝn(x n ) = P(X n+1 A X n = x n )) P. Del Moral (IRIA) IRIA Centre Bordeaux-Sud Ouest, France 12 / 30
Comparaisons & Convergence Méthode de Monte Carlo usuelle copies iid X i de X (1) (2) 1 0 p<n 0 p<n 1 1 A ( X i p ) ( ) 1 A ξ i p P ( 0 p<n X p A) P ( 0 p<n X p A) Est. sans biais de variances : [P n = P ( 0 p<n X p A) e a n ] Var(1) = 1 P n (1 P n ) & Var(2) c n P2 n de plus (sous qq hyp. de regularité) ( η sup E n (f ) η n (f ) p) 1/p c/ n 0 P. Del Moral (IRIA) IRIA Centre Bordeaux-Sud Ouest, France 13 / 30
Marches aléatoires répulsives prune-enriched Rosenbluth method X n = X [0,n] traject. aléa. sur Z2 & G n (X n ) = 1 (X p X q, p<q n). et 1 0 p<n δ (ξ i 0,n,ξ i 1,n,...,ξi n,n) Loi((X 0,..., X n) p < q<n X p X q) 1 1 (ξ i k,p ξl,p i, k<l p) P ( p < q < n X p X q ) Remarque : idem avec des mutation-sélection données par ( X n transition locales sans intersections) & (Ĝn(x n ) = P(X n+1 intersecte le passé X n = x n )) P. Del Moral (IRIA) IRIA Centre Bordeaux-Sud Ouest, France 14 / 30
Processus de ruine = excursions/branchements sur des niveaux X n = X [T n 1,T n] excursion inter-niveaux & G n(x n ) = 1 Bn (X T n ). T n =temps d atteinte du niveau B n ou d un ensemble attractif C et 1 0 p n δ ligne ancestralen (i) Loi(excursions de X B n atteint avant C) (% de succès au temps p) P (B n atteint avant C) P. Del Moral (IRIA) IRIA Centre Bordeaux-Sud Ouest, France 15 / 30
Filtrage de processus filtres particulaires X n = F n (X n 1, W n ) dyn. aléa sur R d & G n (X n ) = e 1 2 (Yn Hn(Xn))2. Processus d observations : Y n = H n (X n ) + V n avec V n bruits de mesure (0, 1) Fonctions de vraisemblance locale : P (Y n dy X n = x) = 1 2π e 1 2 (y Hn(x))2 dy 1 δ ligne ancestralen (i) Loi((X 0,..., X n ) (Y 0,..., Y n )) P. Del Moral (IRIA) IRIA Centre Bordeaux-Sud Ouest, France 16 / 30
Summary 1 Les processus d évolution génétique 2 Évolution d arbres généalogiques 3 QQ domaines d application 4 Les intégrales de chemins de Feynman Lois de processus de Markov pondérés Formules de normalisation Processus historiques et lignes ancestrales 5 Théorie champ moyen P. Del Moral (IRIA) IRIA Centre Bordeaux-Sud Ouest, France 17 / 30
Mesures de Feynman-Kac (Fonctions test f : E n R) X -explorations & G n -selection avec = η n (f ) := 1 γ n (f ) := E f n (X n ) f (ξ i n) η n (f ) := γ n(f ) γ n (1) 0 p<n G p (X p ) Ex. : Confinement G n = 1 A γ n (1) = P ( 0 p < n X p A) & η n = Law (X n 0 p < n X p A) P. Del Moral (IRIA) IRIA Centre Bordeaux-Sud Ouest, France 18 / 30
Ctes de normalisation Formule produit : γ n (1) := E G p (X p ) = η p (G p ) 0 p<n 0 p<n Estimations non biaisées : γn (1) := ηp (G p ) γ n (1) = 0 p<n 0 p<n η p (G p ) Ex. : Confinement G n = 1 A (proportion de succès tps p) P ( 0 p < n X p A) 0 p<n P. Del Moral (IRIA) IRIA Centre Bordeaux-Sud Ouest, France 19 / 30
Processus historique et arbres généalogiques Mutation et selection de trajectoires : X n := (X 0,..., X n) E n := (E 0... E n) Population courante trajectorielle=lignes ancestrales : avec η n (f n ) := 1 ( f n ξ i 0,n, ξ1,n, i..., ξn,n i ) η n (f n ) := γ n(f n ) γ n (1) γ n (f n ) := E f n (X 0,..., X n) Ex. : Confinement G n = 1 A 0 p<n G p (X 0,..., X p) η n = Loi ( (X 0,..., X n) 0 p < n X p A ) P. Del Moral (IRIA) IRIA Centre Bordeaux-Sud Ouest, France 20 / 30
Arbres généalogiques complets algo. génétique sans proba. d acceptation 1 F n ( ξ i 0, ξ i 1,..., ξ i n) (η 0... η n ) (F n ) avec les mesures produits (η 0... η n ) (F n ) =... η 0 (dx 0 )... η n (dx n ) F n (x 0,..., x n ) E 0 E n Avec proba. d acceptation Mesures de McKean : η n η n = Loi(X n ) avec des transitions Markov X n X n+1 Algorithme Génétique = Interprétation champ moyen de X n P. Del Moral (IRIA) IRIA Centre Bordeaux-Sud Ouest, France 21 / 30
Résumé-Conclusions Algorithme Génétique [X n -mutations G n -adaptation/selection/branchement] & Mesures de Feynman-Kac [X n -Markov de référence. G n -fonctions de potentiel]!!! Algorithme génétique Métaheuristique (cf. Wikipedia définition)!!!!! P. Del Moral (IRIA) IRIA Centre Bordeaux-Sud Ouest, France 22 / 30
Algorithmes stochastiques équivalents : Algorithmes génétiques, processus de branchements. Méthodes de Monte Carlo séquentielles. Algorithmes de population Monte Carlo, Diffusion Monte Carlo (DMC), Quantum Monte Carlo (QMC),... Botanique des processus d adaptation = domaines d applications : Bootstrapping, selection, pruning-enrichment, reconfiguration, cloning, go with the winner, spawning, condensation, grouping, rejuvenations, harmony searches, biomimetics,... P. Del Moral (IRIA) IRIA Centre Bordeaux-Sud Ouest, France 23 / 30
Summary 1 Les processus d évolution génétique 2 Évolution d arbres généalogiques 3 QQ domaines d application 4 Les intégrales de chemins de Feynman 5 Théorie champ moyen Chaines de Markov non linéaires Interprétations particulaires P. Del Moral (IRIA) IRIA Centre Bordeaux-Sud Ouest, France 24 / 30
Flot (non linéaires) de mesures de probabilités Flots non linéaires : [Φ n : Proba Proba] η n = Φ n (η n 1 ) Famille de transitions Markov K n,η (pas unique!) η n (dy) = Φ n (η n 1 ) (dy) = ( η n 1 K n,ηn 1 ) (dy) := η n 1 (dx) K n,ηn 1 (x, dy) P. Del Moral (IRIA) IRIA Centre Bordeaux-Sud Ouest, France 25 / 30
Ex. : Mesures de Feynman-Kac η n Correction Prédiction η n = Ψ Gn (η n ) η n+1 = η n M n+1 Transf. de Boltzmann-Gibbs : G n (x)=vraisemblance/qualité du site x avec le transport Ψ Gn (η n )(dx) := 1 η n (G n ) G n(x) η n (dx) = η n S n,ηn (dx) S n,ηn (x, dy) := G n (x) δ x (dy) + (1 G n (x)) Ψ n (η n )(dy) η n+1 = η n S n,ηn M n+1 P. Del Moral (IRIA) IRIA Centre Bordeaux-Sud Ouest, France 26 / 30
Chaines de Markov X n non linéaires t.q. η n = Loi(X n ) Transitions locales : P(X n dx n X n 1 ) = K n,η n 1 (X n 1, dx n ) Mesure de McKean (processus canonique) : P n (d(x 0,..., x n )) = η 0 (dx 0 ) K 1,η0 (x 0, dx 1 )... K n,ηn 1 (x n 1, dx n ) Interprétation particulaire de type champ moyen Chaine Markov ξ n = (ξn, 1..., ξn ) En t.q. η n := 1 δ ξ i n η n 1 i Transitions locales approchées ( 1 i ) ξn 1 i ξn i K n,η n 1 (ξn 1, i dx n ) P. Del Moral (IRIA) IRIA Centre Bordeaux-Sud Ouest, France 27 / 30
Modèle champ moyen temps discret Figure schématique : ξ n E n ξ n+1 E n+1 ξ 1 n. ξ i n. ξ n K n+1,η n ξ 1 n+1. ξn+1 i.. ξn+1 Idée intuitive : η n η n = K n+1,η n K n+1,ηn & les mesures de McKean trajectorielles : = ξ i n copies i.i.d. de X n 1 δ (ξ i 0,ξ i 1,...,ξi n) η 0 K 1,η0... K n,ηn 1 P. Del Moral (IRIA) IRIA Centre Bordeaux-Sud Ouest, France 28 / 30
QQ Avantages Modèle de champ moyen=linéarisation/perturbation stoch. : η n = η n 1K n,η n 1 + 1 W n avec Wn W n Champs gaussiens centrés et. η n = η n 1 K n,ηn 1 stable non propagation des erreurs locales = control uniforme des erreurs globales / temps Pas besoin d étudier la cv à l équilibre de modèles MCMC. Grille/Maillage stochastique adaptatif. on linéarité du syst. interactions bénéfiques. Algo. naturel et facile a simuler, etc. P. Del Moral (IRIA) IRIA Centre Bordeaux-Sud Ouest, France 29 / 30
Theorie asymptotique TCL,PGD, PDM,...(n,). QQ exemples : Mesure McKean particulaire 1 δ (ξ i 0,...,ξn i ) Loi(X 0,..., X n ) et ηn = 1 δ ξ i n η n Proc. empiriques : sup n 0 sup 1 E( η n η n p F n ) < Inégalités de concentration uniformes : supp( ηn (f n ) η n (f n ) > ɛ) c exp (ɛ 2 )/(2 σ 2 ) n 0 Propagations du chaos : P n,q := Loi(ξ 1 n,..., ξ q n) P n,q η q n + 1 1 P n,q +... + 1 k k P n,q + 1 k+1 k+1 P n,q avec sup 1 k+1 P n,q tv < et sup n 0 1 P n,q tv c q 2. P. Del Moral (IRIA) IRIA Centre Bordeaux-Sud Ouest, France 30 / 30