Estimation des paramètres d un modèle de dynamique de population structuré en longueur: maximum de vraisemblance et algorithme génétique

Documents pareils
Probabilités III Introduction à l évaluation d options

Soutenance de stage Laboratoire des Signaux et Systèmes

ALGORITHME GENETIQUE ET MODELE DE SIMULATION POUR L'ORDONNANCEMENT D'UN ATELIER DISCONTINU DE CHIMIE

Quantification Scalaire et Prédictive

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

ERRATA ET AJOUTS. ( t) 2 s2 dt (4.7) Chapitre 2, p. 64, l équation se lit comme suit : Taux effectif = 1+

COURS GESTION FINANCIERE SEANCE 4 CHOIX DU NIVEAU DU FONDS DE ROULEMENT PLANS DE TRESORERIE FINANCEMENTS ET PLACEMENTS A COURT TERME

Modélisation et simulation du trafic. Christine BUISSON (LICIT) Journée Simulation dynamique du trafic routier ENPC, 9 Mars 2005

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

MATHS FINANCIERES. Projet OMEGA

Exercice autour de densité, fonction de répatition, espérance et variance de variables quelconques.

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

TD1 Signaux, énergie et puissance, signaux aléatoires

Tableaux de bord de gestion du risque Rapport d audit permanent

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Une application de méthodes inverses en astrophysique : l'analyse de l'histoire de la formation d'étoiles dans les galaxies

Modélisation aléatoire en fiabilité des logiciels

Le modèle de Black et Scholes

Simulation de variables aléatoires

Master Modélisation Aléatoire Paris VII, Cours Méthodes de Monte Carlo en nance et C++, TP n 2.

Accélérer l agilité de votre site de e-commerce. Cas client

FORMULAIRE DE STATISTIQUES

chargement d amplitude variable à partir de mesures Application à l approche fiabiliste de la tolérance aux dommages Modélisation stochastique d un d

TSTI 2D CH X : Exemples de lois à densité 1

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring

Géométrie discrète Chapitre V


Contents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

«Cours Statistique et logiciel R»

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Introduction au Data-Mining

Que faire lorsqu on considère plusieurs variables en même temps?

LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples.

Variables Aléatoires. Chapitre 2

Ordonnancement robuste et décision dans l'incertain

TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options

3. Caractéristiques et fonctions d une v.a.

Approche modèle pour l estimation en présence de non-réponse non-ignorable en sondage

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

La base de données régionale sur les sols. d Alsace. La base de données régionale sur les sols d Alsace

Hedging delta et gamma neutre d un option digitale

Incertitude et variabilité : la nécessité de les intégrer dans les modèles

Mémoire d actuariat - promotion complexité et limites du modèle actuariel, le rôle majeur des comportements humains.

Introduction à l approche bootstrap

Visual Taxe 4.1.0B04 minimum

Introduction au datamining

Continuité et dérivabilité d une fonction

données en connaissance et en actions?

Logiciel XLSTAT version rue Damrémont PARIS

Mises en relief. Information supplémentaire relative au sujet traité. Souligne un point important à ne pas négliger.

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

Représentation d une distribution

Interception des signaux issus de communications MIMO

Economie de l incertain et de l information Partie 1 : Décision en incertain probabilisé Chapitre 1 : Introduction à l incertitude et théorie de

Statistiques Descriptives à une dimension

Statistique : Résumé de cours et méthodes

Mesure et gestion des risques d assurance

Chapitre 3. Les distributions à deux variables

de calibration Master 2: Calibration de modèles: présentation et simulation d

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

Le risque Idiosyncrasique

Moments des variables aléatoires réelles

Travail en collaboration avec F.Roueff M.S.Taqqu C.Tudor

TABLE DES MATIERES. C Exercices complémentaires 42

Introduction au Data-Mining

(51) Int Cl.: H04L 29/06 ( ) G06F 21/55 ( )

INF6304 Interfaces Intelligentes

Dans une année, il y a 12 mois. Dans une année, il y a 52 semaines. Dans une année, il y a 4 trimestres. Dans une année, il y a 365 jours.

Nouveau Barème W.B.F. de points de victoire 4 à 48 donnes

Echantillonnage Non uniforme

Assises Européennes du Bâtiment Basse Consommations. Frédéric ric FRUSTA. Président Directeur Général. ENERGIVIE 25 Juin 2010

Zéro Rupture - Mode d emploi. Trophée ECR 16 Octobre 2013

Théorie et Codage de l Information (IF01) exercices Paul Honeine Université de technologie de Troyes France

Best Styles ou comment capturer au mieux les primes de risque sur les marchés d actions

Chapitre 1 : Introduction au contrôle de gestion. Marie Gies - Contrôle de gestion et gestion prévisionnelle - Chapitre 1

Comment optimiser l utilisation des ressources Cloud et de virtualisation, aujourd hui et demain?

IdR Trading et Microstructure CA Cheuvreux. Charles-Albert Lehalle

LISTE D EXERCICES 2 (à la maison)

COURS GESTION FINANCIERE A COURT TERME SEANCE 2 COUVERTURE DU BESOIN DE FINANCEMENT CHOIX DU NIVEAU DU FONDS DE ROULEMENT

Efficacité énergétique des réseaux de cœur et d accès

ÉVALUATION DU DORÉ JAUNE (Sander vitreus) DU LAC TATHLINA, DANS LES TERRITOIRES DU NORD-OUEST

Processus aléatoires avec application en finance

La nouvelle planification de l échantillonnage

Programmes des classes préparatoires aux Grandes Ecoles

ROI et performance web

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

TESTS D HYPOTHÈSE FONDÉS SUR LE χ².

Mathématique et Automatique : de la boucle ouverte à la boucle fermée. Maïtine bergounioux Laboratoire MAPMO - UMR 6628 Université d'orléans

Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels

Nouvelles propositions pour la résolution exacte du sac à dos multi-objectif unidimensionnel en variables binaires

Cours des Méthodes de Résolution Exactes Heuristiques et Métaheuristiques

Laboratoire d informatique Gaspard-Monge UMR Journée Labex Bézout- ANSES

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

5. Matériaux en contact avec l eau

CONSEIL NATIONAL DE LA COMPTABILITÉ Remplacement d instruments

Transcription:

Estimation des paramètres d un modèle de dynamique de population structuré en longueur: maximum de vraisemblance et algorithme génétique DROUINEAU Hilaire MAHEVAS Stéphanie BERTIGNAC Michel

Introduction En halieutique, les modèles de dynamique des pop ont trois principaux objectifs: Améliorer la connaissance sur les espèces et leurs exploitations Réaliser des diagnostics de l état des stocks et de leur exploitation Prédire leur évolution sous différentes hypothèses

Introduction Modèles traditionnels sont: Structurés en âge: population divisée en classes d âge considérées homogènes + besoin de données structurées en âge Non spatialisés: la population et l activité de pêche sont considérés homogènement répartis dans l espace Souvent un pas de temps annuel Or: De nombreux processus sont plus liés à la taille du poisson qu à son âge + données disponibles en taille Des concentrations saisonnières de la population (reproduction, nourricerie ) et de la pêche Les processus (croissance, mortalité, pêche ) sont continus dans le temps

Introduction Donc: Structurés la population en taille en longueur plutôt qu en âge Spatialisé le modèle Mais: Nécessité d évaluer l impact de la discrétisation des longueurs et du temps Trouver des hypothèses rendant le modèle plus robuste

Introduction Modèle matriciel décrit les sous-processus guidant la dynamique de la population et de son exploitation Mais de nombreux paramètres inconnus Doivent être estimés Ajustement du modèle par maximum de vraisemblance sur des données observées (captures professionnelles, données de campagnes ) Optimisation d une fonction multi-dimensionnelle =>vers des algorithmes génétiques

Impact de la discrétisation du temps et de la longueur

Un modèle matriciel de croissance N(t+1)=G(t)N(t) G(t): matrice des probabilités de transition La croissance moyenne suit une loi de Von Bertalanffy: Incrément l=(linf-l(t))(1-exp(-k. t)) Les incréments de croissance suivent une loi de distribution autour de cette moyenne Quelles hypothèses? Quel pas de temps? 1 an, 1 trimestre, 1 mois Quelle taille de classe? 5cm, 1 cm Position des individus dans les classes? a b c d d a+ b 2 ( ) L a+ b 1 ( K t) P1 3= f x dx avec E X = ( ) ( ) exp 2 c a+ b 2 [ ]

Un modèle matriciel de croissance N(t+1)=G(t)N(t) G(t): matrice des probabilités de transition La croissance moyenne suit une loi de Von Bertalanffy: Incrément l=(linf-l(t))(1-exp(-k. t)) Les incréments de croissance suivent une loi de distribution autour de cette moyenne Quelles hypothèses? Quel pas de temps? 1 an, 1 trimestre, 1 mois Quelle taille de classe? 5cm, 1 cm Position des individus dans les classes? a b c d P1 3 b d y = f( x) dxdy avec E( X) = a c y ( L y) [ 1 exp( K t) ]

Un modèle matriciel de croissance N(t+1)=G(t)N(t) G(t): matrice des probabilités de transition La croissance moyenne suit une loi de Von Bertalanffy: Incrément l=(linf-l(t))(1-exp(-k. t)) Les incréments de croissance suivent une loi de distribution autour de cette moyenne Quelles hypothèses? Quel pas de temps? 1 an, 1 trimestre, 1 mois Quelle taille de classe? 5cm, 1 cm Position des individus dans les classes? Quelle loi de distribution des incréments? Normale, gamma, lognormale

Un modèle matriciel de croissance N(t+1)=G(t)N(t) G(t): matrice des probabilités de transition La croissance moyenne suit une loi de Von Bertalanffy: Incrément l=(linf-l(t))(1-exp(-k. t)) Les incréments de croissance suivent une loi de distribution autour de cette moyenne Quelles hypothèses? Quel pas de temps? 1 an, 1 trimestre, 1 mois Quelle taille de classe? 5cm, 1 cm Position des individus dans les classes? Quelle loi de distribution des incréments? Normale, gamma, lognormale Relation entre moyenne et variance des incréments? V=CE, V=CE²

Ajusté sur des données quasicontinues Pour quantifier l impact des différentes hypothèses: On simule la croissance de 10000 individus avec un pas de temps mensuel => données quasi-continues Hypothèses sur la loi des incréments, la variance, et le taux de croissance On ajuste le modèle matriciel à ces données On estime K et la variance des incréments Maximum de vraisemblance des fréquences «observées» et fréquences estimées Analyse statistique (modèles linéaires et arbre de régressions multiples) pour expliquer par les différentes hypothèses: L écart entre fréquences observées et estimées: BIC L écart entre taux de croissance estimé et observé: Kobs-Kest

Résultats Pas de temps courts et petites classes de longueur améliore l estimation des fréquences aux longueurs L estimation du taux de croissance est plus complexe un pas de temps court rend la probabilité de changer de classe trop faible => surestimation du taux de croissance Des hypothèses rendent le modèle plus robuste: distribution des des incréments, supposer que les individus sont uniformément distribués au sein des classes

Ajustement du modèle aux données observées

Présentation du modèle matriciel Pas de temps trimestriel et des classes de 1cm (120 classes) Correspond aux données dispo Cohérent avec l analyse de sensibilité Espace discrétisé en 7 zones FU Correspond aux données dispo Liées à l activité de pêche Liées à la biologie ede l espèce

Présentation du modèle matriciel N(t+1)=Sr(t)[Mig(t)G(t) (R(t)+ N(t))] effectifs survie migration croissance recrutement Quatre processus biologiques: Recrutement: un recrutement moyen et des effets aléatoires N + σ 2 1 2 () () recru t =N t +R exp ε with ε ~N( σ) recru recru 0,

Présentation du modèle matriciel N(t+1)=Sr(t)[Mig(t)G(t) (R(t)+ N(t))] effectifs survie migration croissance recrutement Quatre processus biologiques: Recrutement: un recrutement moyen et des effets aléatoires Croissance: (cf avant) on doit estimer un taux de croissance et une variance ( classe,zone ) = p ( ) c classen c, zone N2 1 c

Présentation du modèle matriciel N(t+1)=Sr(t)[Mig(t)G(t) (R(t)+ N(t))] effectifs survie migration croissance recrutement Quatre processus biologiques: Recrutement: un recrutement moyen et des effets aléatoires Croissance: (cf avant) on doit estimer un taux de croissance et une variance Migration: proportion d individus matures et immatures changeant de zones par saison ( t+ε,classe,zone ) = [ matclassn2( classe,z) migmature( z,zone ) + ( 1 matclasse) N ( class,z) migimmature( z, zone) ] N 2 z

Présentation du modèle matriciel N(t+1)=Sr(t)[Mig(t)G(t) (R(t)+ N(t))] effectifs survie migration croissance recrutement Quatre processus biologiques: Recrutement: un recrutement moyen et des effets aléatoires Croissance: (cf avant) on doit estimer un taux de croissance et une variance Migration: proportion d individus matures et immatures changeant de zones par saison Mortalité naturelle des matures et immatures à estimer +effectifs initiaux par classes et par zones à estimer

Présentation du modèle matriciel Dynamique de l activité de pêche permet de calculer la mortalité par pêche par classes, zone et pas de temps Repose sur des Fishery Units: 1 zone de pêche 1 sélectivité (fonction de la longeur): à estimer Composées de différentes flottilles dans chaque FU Effort (intensité de pêche) par pas de temps (connu) Capturabilité (proba qu un poisson soit capturé par une unité d effort) à estimer t+ t,classe,zone 1, =mat= Fclasse flot t,classe,zone N t+ε,classe,zone = sexp fu classe ( M mature +F q flot tot t,classe,zone an E flot zone ) t [ ] NF( tot( ) ( ( ) ) ( ) ( ) ( ) ) fleet flot + ( 1 mat ) N( t+ε,classe,zone) ( +F ( t,classe,zone ) t classe e Mimmature tot

Présentation du modèle matriciel Bilan: environ 1 millier des paramètres inconnus! (dont 7*120= 840 pour les effectifs initiaux) Quelles données disponibles? Captures par classes flottilles, classe de longueur et pas de temps Données de campagnes scientifiques On suppose que les observations suivent une loi de distribution de moyenne la valeur estimée par le modèle L( an, flot ) = f ( Cobs, flot( t, c) ) t an c CLASSE avec f une densité de probabilit é de moyenne C est, fleet ( t,c ) et de variance σ 2 fleet

Comment optimiser la fonction? La fonction à maximiser est multi-dimensionnelle, et ne peut être maximiser analytiquement Besoin d une optimisation numérique Au vu du nombre de paramètres inconnus, il faut Éviter les optima locaux Converger en un temps «raisonnable vers la solution» =>Essai d utilisation d algorithme génétique

Principe de l algorithme génétique Définitions: Gène: la valeur d un paramètre Chromosome: une solution potentielle: ensemble de gènes Fitness: «qualité» de la solution, ici Gène sa vraisemblance 1 0 1 Population: un ensemble de chromosomes, pool de diversité 0 Gène 2 1 1 0 1 0 Population Chromosome

Principe de l algorithme génétique Génération n Intermédiaire Génération n+1 Principe Faire évoluer la population Garder les meilleurs solutions: Sélection Entretenir de la diversité pour explorer tout l espace de recherche: reproduction mutation, croisement cross-over mutation

Principe de l algorithme génétique Sélection (de 2n à n): On tire deux chromosomes de la pop de départ, le meilleur est mis dans la pop intermédiaire Cross-over (de n à 2n): On appareille les n chromosomes 2 à 2 Le meilleur est copié une deuxième fois On fait une combinaison linéaire des deux chromosomes Mutation 1 et 2 (2n): Pour chaque gène, on tire un nombre aléatoire entre 0 et 1 Si le nombre est inférieur à une proba de mutation =>mute Mutation 1: On tire une valeur entre les bornes de recherche du paramètre Mutation 2: On tire une valeur dans un intervalle resserré autour de la valeur courante

Intérêts Bonne exploration de l univers de recherche évite bien les optima locaux Pas de calcul de dérivées Facilite le codage + vitesse de calcul Semble donner des résultats très satisfaisants!

Conclusion

Conclusion Analyse de l impact de la discrétisation a permis de choisir un modèle robuste Modèle complet comporte de nombreux paramètres inconnus: Étudier l identifiabilité des paramètres Réduire le nombre de paramètres en ajoutant des hypothèses supplémentaires Choisir un bon algorithme d optimisation vu la complexité de la fonction de vraisemblance