DESS SIAD - PROJET 2004 1 DESS Systèmes informatiques et aide à la décision. Module : Modélisation des Systèmes Biologiques Projet F. Goreaud (CEMAGREF / LISC) email : francois.goreaud@clermont.cemagref.fr Construction d'un modèle de compétition "arbre", et réalisation d'un simulateur. Introduction. Enjeux sociaux : Pour pouvoir gérer finement la production de bois en terme de taille des troncs à récolter, et de qualité du bois produit, les gestionnaires forestiers ont besoin d'outils qui prédisent l'accroissement individuel de chaque arbre du peuplement. Avec de tels outils, les forestiers souhaitent pouvoir simuler et comparer différents scénario sylvicoles (structure initiale des plantations, fréquence et intensité des éclaircies) de façon à optimiser leur mode de gestion par rapport à un objectif de production donné (Courbaud et al., 2000). Enjeux scientifiques : Pour prédire l'accroissement individuel des arbres, les dendrométriciens construisent des modèles à l'échelle de l'arbre, qui prennent en compte l'influence des voisins directs sur la croissance par le biais d'indices de compétition (Houllier et al., 1991). La construction, l'utilisation et la comparaison des indices de compétition pose encore de nombreux problèmes (Biging & Dobbertin, 1995). Objectif & stratégie : L'objectif de ce projet est de construire un tel modèle "arbre", pour des peuplements de Pin Sylvestre, en utilisant un modèle simple; et de réaliser un simulateur pour le rendre facilement utilisable par un utilisateur non-modélisateur, selon un cahier des charges précis correspondant à un cas d'application concret. Dans un premier temps, vous pourrez construire le modèle proprement dit à partir des indications présentées au chapitre 1, en respectant les étapes classiques de la modélisation (chapitre 2) : précision de l'objectif du modèle, récupération des données, choix de la forme du modèle, ajustement, validation. Ensuite, vous implémenterez un simulateur simple en respectant les contraintes liées au modèle (type de données, discrétisation, etc) et en réfléchissant aux besoins de l'utilisateur (chapitre 3).
DESS SIAD - PROJET 2004 2 Enfin (chapitre 4), vous testerez le simulateur pour répondre à une question pratique du gestionnaire. Cahier des charges : Un gestionnaire forestier veut optimiser son itinéraire sylvicole sur une période de 30 ans, pour une parcelle de 20ha de Pin Sylvestre en Sologne. A l'instant t=0, le peuplement âgé de 40 ans correspond au fichier "test.xls" disponible sur le serveur ftp du CEMAGREF (cf. 22). Le gestionnaire vous demande de construire un simulateur pour comparer 3 types d'éclaircies (cf. 5.). A) Ce travail doit être réalisé par un groupe de 3 à 4 étudiants. B) Pour l'évaluation de votre travail, vous rendrez un rapport synthétique qui mettra en valeur votre démarche, les choix que vous aurez fait, les résultats des tests effectués. Une attention particulière sera portée à la partie Discussion, où vous porterez un regard critique sur le modèle (ses limites, ses défauts) et sur vos hypothèses de travail. C) Vous fournirez également un listing des sources et un exécutable de votre simulateur, D) et vous préparerez pour le dernier cours (1/03/2004) une présentation orale de 10 à 15 minutes pour rendre compte de votre travail devant vos collègues (transparents ou démonstration). La grille d'évaluation est précisée au chapitre 6.
DESS SIAD - PROJET 2004 3 1. Le modèle proposé. 11. Présentation générale du modèle. Je vous propose dans ce projet de construire un modèle pour prédire l'accroissement en surface terrière 1 ( g i ) pour une période de 5 ans, en fonction de la taille initiale de l'arbre (en surface terrière g i ), et d'un indice de compétition simple (IC i ) qui rendra compte de l'intensité du voisinage. L'équation suivante résume la forme de ce modèle : où : g i = α + βg + γic + ε i i i g i est la surface terrière de l'arbre i (en cm²), g i est l'accroissement en surface terrière de l'arbre i pendant 5 ans, IC i est l'indice de compétition (cf. 12), ε i est le résidu du modèle. α,β,γ sont les paramètres du modèle. 12. Détails sur l'indice de compétition : Pour rendre compte de l'intensité de la compétition, vous allez utiliser comme indice de compétition le nombre de voisins dans un disque de rayon R m autour de chaque arbre. R est un paramètre qui correspond plus ou moins à la distance maximale de la compétition. IC i = Nombre de voisins à R m. Vous pourrez tester plusieurs valeurs de R : 4m, 6m, 8m, 10m, et choisir la distance R qui donne le meilleur résultat en prédiction. Pour calculer le nombre de voisins de l'arbre i, vous pourrez regarder successivement tous les autres arbres j, calculer la distance entre i et j, et augmenter IC i de 1 si cette distance est inférieure ou égale à R. 1 La surface terrière g est la surface d'une section de tronc à 1m30. On peut la calculer à partir de la circonférence à 1m30 c en considérant que l'arbre est cylindrique : c=2πr et g=πr², donc g=c²/(4π).
DESS SIAD - PROJET 2004 4 2. Construction du modèle : les étapes à respecter. Pour construire votre version du modèle, vous utiliserez les étapes suivantes : 21. Préciser l'objectif du modèle : Il vous suffit de lire et comprendre les enjeux et l'objectif du projet présentés en introduction, puis de reformuler l'objectif de votre modèle et de votre simulateur pour le rapport, en tenant compte du cahier des charges. Attention, il est inutile (et dangereux pour votre note!) de recopier le texte de ce document : vous serez jugés sur votre capacité à comprendre la question posée et à la reformuler, en intégrant éventuellement d'autres informations. 22. Récupérer les données et les adapter au problème : Je vous propose de travailler sur des données de peuplement de Pin Sylvestre en France, sur le dispositif de Lamotte Beuvron (Bouchon, 1977) déjà utilisé en cours. On supposera pour ce projet que, lors de son installation en 1965, les arbres du dispositif étaient âgés de 15 ans. Vous trouverez une description du dispositif ("lamotte.pdf"), ainsi que le fichier Excel correspondant ("lamotte.xls"), sur le site ftp du CEMAGREF : ftp.clermont.cemagref.fr/pub/lisc/goreaud/dess/projet/ Ce fichier est un fichier de données simplifiées afin de faciliter leur utilisation dans le cadre du projet. Vous trouverez les différentes colonnes suivantes : A) Le placeau : sert uniquement à situer la zone où se trouve l'arbre (cf. description du dispositif). Les placeaux finissant par "z" correspondent à des zones de bordure. Normalement vous n'avez pas besoin de cette information pour le projet. B) le numéro d'inventaire : sert à repérer l'arbre sur le terrain. Les arbres de zone n'ont pas de numéro d'inventaire. Normalement vous n'avez pas besoin de cette information pour le projet. C) et D) : coordonnées x et y des arbres dans le plan. Ces coordonnées vous seront utiles pour déterminer les voisins des arbres dans le calcul des indices de compétition. Pour vous faire une idée du dispositif, vous pouvez commencer par représenter la carte de position de l'ensemble des arbres. E), F) et G) : valeurs des circonférences mesurées sur les arbres du dispositif en 1988, 1993 et 1998. A partir de ces valeurs, vous pourrez calculer les surfaces terrières et les accroissements en surface terrière. Attention, pour certains arbres il n'y a pas de mesures en 1993. Dans ce cas, vous pouvez approcher la valeur manquante par la moyenne des valeurs de 1988 et 1998. Il peut
DESS SIAD - PROJET 2004 5 également arriver pour certains arbres qu'une mesure de circonférence soit inférieure à la mesure précédente : dans ce cas la corriger en attribuant la même valeur que la valeur précédente (on fait l'hypothèse qu'il y a eu une croissance nulle). 23. Choisir la forme du modèle : Je vous demande dans un premier temps d'utiliser le modèle proposé au chapitre 1. Vous pouvez ensuite si vous le souhaiter essayer d'autres formes de modèles. 24. Ajuster le modèle : Vous devrez réaliser l'ajustement du modèle sur une partie seulement des données, afin de conserver des données indépendantes pour la validation. Je vous propose de couper le dispositif en deux parties : la moitié gauche (x<=100) pour l'ajustement et la moitié droite (x>100) pour la validation. Comme vous avez les données de circonférence sur 3 dates, vous avez trois possibilités pour ajuster le modèle : sur la période 1988-1993, sur la période 1993-1998, ou sur la période 1988-1998. Vous choisirez l'option qui vous semble correspondre au mieux au cahier des charges. Pour les arbres de la moitié gauche du dispositif, vous allez devoir calculer pour chaque arbre les variables intermédiaires dont vous avez besoin pour ajuster le modèle : les surfaces terrières, l'accroissement en surface terrière sur la période considérée, et l'indices de compétition. Vous pourrez ensuite effectuer l'ajustement proprement dit, c'est à dire estimer la valeur des paramètres du modèle (cf. 11) en utilisant les outils classiques de régression linéaire. Si vous avez des difficultés pour accéder à des logiciels adaptés (SAS, Statlab, Statview) vous pouvez me contacter. 25. Valider le modèle : Pour la validation, vous utiliserez des données différentes de celles utilisées pour l'ajustement du modèle, à savoir la moitié droite du dispositif (x>100). Comme pour l'ajustement, il vous faudra calculer pour chaque arbre les variables intermédiaires utilisées par le modèle (cf. 24). Sur ces données, vous calculerez les critères classiques de qualité du modèle (biais, R², significativité) et vous pourrez aussi, si vous le désirer, imaginer d'autres critères. Pour faciliter la correction, vous fournirez le listing du programme utilisé pour calculer les variables intermédiaires, et en particulier l indice de compétition. Vous fournirez aussi un fichier Excel avec ces différentes variables calculées à la fois sur la moitié gauche et sur la moitié droite du dispositif.
DESS SIAD - PROJET 2004 6 3. Réalisation du simulateur. 31. Trame du simulateur : Pour la trame générale du simulateur, vous pouvez vous inspirer du premier TP : - une phase d'initialisation pour demander à l'utilisateur les paramètres de la simulation, et charger l'état initial. - une boucle principale qui effectue le nombre voulu d'itérations, - pour chaque itération, le calcul de l'indice de compétition, puis de l'accroissement pour chaque arbre du peuplement, - éventuellement, une éclaircie, - à la fin de la simulation, une sauvegarde des résultats. => Vous ferez en sorte qu'il soit possible de charger l'état initial à partir d'un fichier texte, dont le nom sera précisé par l'utilisateur, et qui contiendra, sous forme de colonnes séparées par des tabulations : x, y, circonférence. => De même, pour la sauvegarde des résultats, utiliser comme format un fichier texte, dont le nom sera précisé par l'utilisateur, et qui contiendra, sous forme de colonnes séparées par des tabulations : x, y, circonférence initiale, circonférence finale (0 si l'arbre a été éclairci). 32. Calcul de l'accroissement : Le calcul de l'accroissement est la partie du simulateur qui contient la traduction informatique du modèle de croissance. Attention à bien gérer la discrétisation (les pas de temps). Ce calcul va nécessiter un calcul de distance entre arbres pour déterminer les arbres voisins, puis calculer l'indice de compétition. Vous pouvez tester plusieurs stratégies pour diminuer le coût en terme de vitesse de calcul. 33. Interface : Si on souhaite obtenir un outil utilisable par un non-modélisateur, il faut penser l'interface en ce sens. Il n'est pas forcement nécessaire de passer beaucoup de temps sur la présentation graphique (ce n'est pas l'objet de ce projet, donc l'évaluation ne portera pas sur ce critère), mais il est plus important de réfléchir à l'ergonomie de l'interface : il faut que l'utilisateur comprenne facilement le fonctionnement du programme, puisse facilement entrer et corriger les paramètres de la simulation, récupérer les résultats, etc... Pensez également à vérifier que les paramètres entrés ne sont pas aberrants, pour éviter les plantages du simulateur. Il est également important d'informer l'utilisateur sur le domaine de validité du modèle simulé (espèce, âge des peuplements, zone géographique, etc...).
DESS SIAD - PROJET 2004 7 4. Utilisation du simulateur. Je vous propose d'utiliser votre simulateur sur un exemple d'application pratique correspondant au cahier des charges suivant : Un gestionnaire forestier veut optimiser son itinéraire sylvicole pour une parcelle de 20ha de Pin Sylvestre en Sologne. A l'instant t=0, le peuplement âgé de 40 ans correspond au fichier "test.xls" disponible sur le serveur ftp du CEMAGREF (cf. 22). Le gestionnaire souhaite utiliser votre simulateur pour comparer 3 options : scénario 1: 30 ans de croissance sans éclaircies; scénario 2 : 10 ans de croissance, puis une éclaircie de 30% des arbres aléatoirement, puis de nouveau 20 ans de croissance; scénario 3 : 10 ans de croissance, puis une éclaircie des 30% plus petits arbres, puis de nouveau 20 ans de croissance. Vous comparerez en particulier les distributions en classe de taille des arbres à la fin des 3 scénarios. Vous pouvez ensuite imaginer d'autres tests. 5. Références citées. Biging G.S., Dobbertin M. - 1995 : Evaluation of competition indices in individual tree growth models. Forest Science, 41 (2) : 360-377. Bouchon J. - 1977 : Réflexions sur les premiers résultats d'un dispositif d'éclaircies de pins sylvestres en forêt de Lamotte-Beuvron. Annales des Sciences Forestières, 34 (4) : 323-329. Courbaud B., Goreaud F., Dreyfus PH., Bonnet F.R. - 2000 : Sylviculture et modèle de croissance dépendant des distances : mise en oeuvre du logiciel CAPSIS 3.0 sur des pessières irrégulières de montagne. Revue Forestière Française, LII (5) : 425-440. Houllier F., Bouchon J., Birot Y. - 1991 : Modélisation de la dynamique des peuplements forestiers : état et perspectives. Revue Forestière Française, XLIII (2) : 87-108.
DESS SIAD - PROJET 2004 8 6. Grille d'évaluation du projet : La note attribuée au groupe sera calculée selon la grille suivante. Attention, si pour une partie vous ne faites que recopier le texte du projet, vous n'aurez pas les points correspondant! De plus, vous devez fournir un listing des sources et un exécutable, et suivre les indications de chargement et sauvegarde du paragraphe 31, faute de quoi votre projet ne sera pas corrigé. 61. Qualité du rapport (4 points) : - 1pt : Qualité de la rédaction, de la présentation, du sommaire, du plan. - 1pt : Qualité de l'introduction : enjeux sociaux et scientifiques, objectif, stratégie - 2pt : Qualité de la discussion : prise de recul, avantages et limites du modèle et du simulateur, améliorations possibles. 62. Construction du modèle (7 points) : - 1pt : Présentation du modèle : description du modèle, des indices, réflexion sur les limites... - 1pt : Présentation des données : dispositif, structure de données choisie, choix de la période... - 1pt : Phase de calcul de l'indice : explication de l'algorithme, justesse des résultats ATTENTION : pensez à donner le listing et un fichier Excel des données intermédiaires - 1pt : Phase d'ajustement du modèle, pour différents R : explication, choix des données, justesse du résultat, analyse critique des résultats. - 1pt : Choix de la distance de compétition par comparaison des différents résultats - 1pt : Phase de validation : explication, choix des données, justesse du calcul, méthodes utilisées, analyse critique des résultats - 1 pt : Conclusion partielle sur le modèle : évaluation, domaine de validité, etc. 63. Construction du simulateur (6 points) : - 1 pt : Présentation du simulateur : objectif, principe, différents scénarios - 1 pt : Explication de l'implémentation : structure de données, algorithme, justesse du calcul, optimisation de la vitesse de calcul... - 1 pt : Qualité des fichiers fournis : sources et exécutable, directement utilisables, bien organisés, documentés... - 1 pt : Le simulateur tourne-t-il? ou reste-t-il des bugs? ATTENTION : pensez à donner le listing, un exécutable en suivant le cahier des charges - 1 pt : Facilité pour utiliser, changer les paramètres, gestion des erreurs, interface, etc... - 1pt : Conclusion partielle sur l'intérêt du simulateur. 64. Application (3 points) - 1 pt : Présentation du cas d'étude - 1 pt : Justesse et qualité des résultats du travail de simulation, et de l'interprétation - 1 pt : Conclusion partielle sur le cas d'application. 65. Présentation orale (4 points bonus) : - 1pt : Qualité générale de l'exposé, répartition des tâches au sein du groupe. - 1pt : Qualité du support utilisé (transparents, démo, etc...) - 1pt : Qualité du plan de l'exposé, clarté du message. - 1pt : Intérêt et justesse des résultats présentés