Conservatisme phylogénétique des traits fonctionnels végétaux

Documents pareils
Traits fonctionnels : concepts et caractérisation exemples des prairies Marie-Laure Navas, Eric Garnier, Cyrille Violle, Equipe ECOPAR

Chapitre 1 Régime transitoire dans les systèmes physiques

4. Résultats et discussion

3 Les premiers résultats des plans d'actions

LE PROBLEME DU PLUS COURT CHEMIN

a) La technique de l analyse discriminante linéaire : une brève présentation. 3 étapes de la méthode doivent être distinguées :

1. Vocabulaire : Introduction au tableau élémentaire

Perrothon Sandrine UV Visible. Spectrophotométrie d'absorption moléculaire Étude et dosage de la vitamine B 6

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique

Observation des modalités et performances d'accès à Internet

Relation entre deux variables : estimation de la corrélation linéaire

CAPTEURS - CHAINES DE MESURES

Evaluation de la variabilité d'un système de mesure

Chapitre 3. Les distributions à deux variables

APPLICATION DU SCN A L'EVALUATION DES REVENUS NON DECLARES DES MENAGES

Évaluation de la régression bornée

ANTISELECTION ET CHOIX D'ASSURANCE : LE CAS DU VOL EN HABITATION UNE APPROCHE DE LA MESURE DU PHENOMENE

Degré de confiance pour les indicateurs de performance : degré de fiabilité du processus de production et écart significatif 1

Le test s'est déroulé en trois étapes successives

Introduction. I Étude rapide du réseau - Apprentissage. II Application à la reconnaissance des notes.

Régression linéaire. Nicolas Turenne INRA

Chapitre 1 : Introduction aux bases de données

Ebauche Rapport finale

PROBLEMES D'ORDONNANCEMENT AVEC RESSOURCES

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Travaux pratiques. Compression en codage de Huffman Organisation d un projet de programmation

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Recherche dans un tableau

RapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/ Présentation. 1.2 Ressources

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Item 169 : Évaluation thérapeutique et niveau de preuve

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

La conversion de données : Convertisseur Analogique Numérique (CAN) Convertisseur Numérique Analogique (CNA)

COMMENT MAITRISER LA GESTION DES APPROVISIONNEMENTS ET DES STOCKS DE MEDICAMENTS

MASTER (LMD) GESTION DE DONNEES ET SPATIALISATION EN ENVIRONNEMENT (GSE)

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

L'évolution de VISUAL MESSAGE CENTER Architecture et intégration

L évolution des indicateurs sur l enfance Identifier des indicateurs centrés sur l enfant pour élaborer les politiques de l enfance¹

4. Verdissement, une PAC plus verte

Le taux d'actualisation en assurance

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

DÉRIVÉES. I Nombre dérivé - Tangente. Exercice 01 (voir réponses et correction) ( voir animation )

A) Les modifications du champ d'application du Règlement n 1346

chapitre 4 Nombres de Catalan

Travaux pratiques avec RapidMiner

Répartition des coûts du compte de pass-on par catégorie de consommateurs

Contrôle interne et organisation comptable de l'entreprise

Quelles représentations des interactionsbiotiques dans les modèles?

La classification automatique de données quantitatives

8 Certifications Minergie

Conclusions du Conseil sur le financement pour la croissance et le financement à long terme de l'économie européenne

Fonctions de plusieurs variables

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN

Statistiques Descriptives à une dimension

Correction de l examen de la première session

Systèmes de transmission

Baccalauréat technologique

NOTATIONS PRÉLIMINAIRES

Mathématiques financières

Pratique des options Grecs et stratégies de trading. F. Wellers

SOMMAIRE INTRODUCTION... 3

Les indices à surplus constant

SDLV120 - Absorption d'une onde de compression dans un barreau élastique

Le calcul du barème d impôt à Genève

Publication de comptes financiers du secteur privé non-financier

Leçon N 4 : Statistiques à deux variables

Carl-Louis-Ferdinand von Lindemann ( )

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.

Chaînes de Markov au lycée

23. Interprétation clinique des mesures de l effet traitement

CONCEPTION Support de cours n 3 DE BASES DE DONNEES

Mesure de la dépense énergétique

Data issues in species monitoring: where are the traps?

PROJET DE GESTION PORTEFEUILLE. Evaluation d une Stratégie de Trading

Conception d un CD interactif : simulation d une sortie en écologie végétale

Algorithmes d'apprentissage

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

Brock. Rapport supérieur

Big Data et Graphes : Quelques pistes de recherche

Introduction à l approche bootstrap

Analyses Économiques 24 Janv. 2004

Master IMEA 1 Calcul Stochastique et Finance Feuille de T.D. n o 1

DETERMINATION DE L INCERTITUDE DE MESURE POUR LES ANALYSES CHIMIQUES QUANTITATIVES

Données longitudinales et modèles de survie

Note:... Q1 :... Q2 :... Q3 :... Q4 :... Bonus :... Total :...

professionnelle des jeunes adultes. Analyser les stratégies d'acteurs La méthode Mactor

NC 06 Norme comptable relative aux Immobilisations incorporelles

Modélisation aléatoire en fiabilité des logiciels

Cet article s attache tout d abord

Systèmes de transport public guidés urbains de personnes

COMMUNICATEUR BLISS COMMANDE PAR UN SENSEUR DE POSITION DE L'OEIL

Rapport d'analyse des besoins

Dans ce document, on décrit les indices des prix des biens de la TIC qui sont produits, ainsi que les sources de données et la méthodologie.

Complément d information concernant la fiche de concordance

STATISTIQUES. UE Modélisation pour la biologie

COMMISSION DES NORMES COMPTABLES. Avis CNC 138/5 Logiciels

Nom-Projet MODELE PLAN DE MANAGEMENT DE PROJET

Copropriété: 31, rue des Abondances Boulogne-Billancourt

Transcription:

Chalmandrier Loïc Rapport de stage Conservatisme phylogénétique des traits fonctionnels végétaux Un test utilisant un échantillon de la Flore Alpine Encadrant : Sébastien Lavergne Laboratoire d'acceuil : Laboratoire d'ecologie Alpine (UMR 5553) 1

Table des matières Introduction...3 Matériel et Méthode...6 I Acquisition des données sur les traits fonctionnels...6 II Analyse phylogénétique...6 1. Arbre...6 2. Outils statistiques...6 1. Le et (Pagel 1999, Verdù 2006) :...6 2. Orthogramme (Ollier et al. 2005)...7 3. Divergence et contribution des noeuds (Moles et al. 2005) :...8 4. Phylogenetic least squares model (Martins et Hansen 1997 ; Ross Ibarra 2007) ou PGLS...9 Résultats...10 I et de Pagel...10 II Orthogramme...11 1. SLA...11 2. LDMC...12 III Amplitude de divergence et contribution...13 IV Etude de la corrélation entre caractères...16 Discussion...17 Patron évolutif du SLA et du LDMC...17 Corrélation des deux patrons d'évolution...17 Critique de la démarche de Moles...17 Comparaison des trois méthodes...18 Conclusion...19 Bibliographie...20 Glossaire...21 Annexes...22 Annexe 1 : Démarche mathématique de Moles...22 1. Estimation des états ancestraux (Felsenstein 1985)...22 2. Calcul de l'amplitude de divergences...22 3.3 Calcul de la contribution...23 Annexe 2 : Noeuds mis en avant par la méthode d'ollier et de Moles...24 Annexe 3 : Scripts...26 Démarche de Pagel...26 Démarche de Moles...28 2

Introduction Face aux enjeux majeurs que représentent les changements environnementaux actuels (réchauffement climatique, modifications de l'usage des terres), il est important de décrire les êtres vivants en termes de traits fonctionnels afin de prédire les changements dans la distribution de la biodiversité et le fonctionnement des écosystèmes. En effet, les traits fonctionnels, en particulier chez les végétaux, permettent à la fois d étudier la réponse des espèces aux gradients environnementaux et leurs changements, et de prédire l effet de ces mêmes espèces sur le fonctionnement des écosystèmes (par exemple la production de biomasse ou la décomposition de la litière dans les communautés végétales...) Plus précisément, on peut définir un trait fonctionnel comme étant un trait morphologique, physiologique ou phénologique ayant un impact indirect sur la fitness de la plante via ses effets sur la croissance, la reproduction et la survie des individus (Violle et al. 2007). Il a été démontré (Díaz et al. 2004) que certains traits fonctionnels dits «soft», c'est à dire facilement mesurables et donc plus susceptibles de constituer de larges jeux de données, peuvent ainsi se corréler à des traits dits «hard» tel le taux de croissance ou le taux de azote par feuille, directement liés à la fitness des individus. Au sein des écosystèmes, la diversité fonctionnelle, c'est à dire la largeur du spectre des valeurs de traits de l'ensemble des individus de l'écosystème, constitue un élément essentiel de leur bon fonctionnement et de leur stabilité (Díaz et Cabido 2001). S il est maintenant à peu près établi que la diversité fonctionnelle joue un rôle important dans le fonctionnement des écosystèmes, les mécanismes évolutifs qui sont à l origine de la diversité fonctionnelle chez les végétaux sont encore mal connus. En particulier, l utilisation de phylogénies, c'est à dire d'arbres traduisant des relations de parenté entre espèces ayant donc un ancêtre commun hypothétique, permet de tester si les traits fonctionnels ont connu de fortes variations au cours de l histoire évolutive des espèces ou au contraire on été conservés, ainsi que d'établir les relations entre différents traits. Par exemple, des valeurs de traits similaires pour deux espèces ou des corrélations entre traits peuvent être dues à une origine évolutive commune ou au contraire à une convergence évolutive. De fait, des espèces fonctionnellement similaires peuvent appartenir au même clade ou au contraire être phylogénétiquement éloignées. De nombreux outils statistiques ont ainsi été développés pour évaluer la dépendance interspécifique des valeurs de traits dues à la phylogénie. Blomberg (2002) propose ainsi une méthode permettant de détecter et d'évaluer l'importance du «signal phylogénétique» (terme préféré à celui «d'inertie phylogénétique» plus ancien mais dont la signification conceptuelle est plus controversée selon lui) d'un trait au travers d'une phylogénie, c'est à dire la tendance pour des espèces phylogénétiquement proches à plus se ressembler que des espèces éloignées. Pagel (1999) s'est appuyé sur les transformations de longueur de branches pour comparer la vraisemblance d'un continuum de phylogénies modifiées selon différents paramètres et d'évaluer les grandes tendances du patron évolutif du trait. À l'inverse, Ollier (2005) a adopté une démarche se passant des longueurs de branches pour décomposer la variance d'un trait selon une base orthonormée reflétant la topologie de la phylogénie. Moles (2005) s'appuie sur la reconstruction de caractères ancestraux et l'étude de chaque noeud pour déterminer ceux à l'origine de fortes divergences évolutives et leur contribution à la variance actuelle. Enfin, Martins (1997) développa la méthode GLS (generalized least squares) pour remédier à la dépendance phylogénétique des valeurs interspécifiques de traits afin d'étudier les corrélations existant entre différents traits pour mettre en évidence une éventuelle évolution couplée des traits. Le but de ce travail est donc : 1 tester, comparer et évaluer les différentes méthodes. 3

2 tester le conservatisme phylogénétique et l'évolution corrélée de deux traits fonctionnels végétaux grâce à ces différentes méthodes Afin de réaliser ces objectifs, on s'intéressera à un échantillon d'espèces localisées de la vallée de la Guisane au col du Galibier (Hautes Alpes), zone caractérisée par de forts gradients environnementaux permettant ainsi de travailler sur un spectre large de valeurs de traits. Les données proviennent des campagnes de terrain réalisées par l'équipe TDE (Traits fonctionnels végétaux et Dynamique des Ecosystèmes alpins) du LECA (Laboratoire d'ecologie Alpine) dont les recherches portent sur le rôle des traits fonctionnels des végétaux dans la structure et la dynamique des écosystèmes alpins, et dans leurs réponses aux forçages environnementaux. Afin de réaliser les objectifs, les données utilisées sont celles collectées dans le cadre de projets précédents (notamment le projet européen VISTA) ainsi que celle effectuée en 2008 dans le cadre du projet Diversitalp financé par l ANR. On s'intéressera ainsi à deux traits foliaires qui bénéficient d'une attention particulière dans la littérature d'écologie fonctionnelle : l'indice SLA (specific leaf area), calculé comme étant la surface photosynthétique d'une feuille rapportée à sa masse sèche et l'indice LDMC (leaf dry matter content), calculé comme étant la masse sèche de la feuille rapportée à sa masse fraîche. Le SLA est un indice corrélé à la fonction d'acquisition des ressources et au taux de croissance tandis que le LDMC est un trait reflétant la capacité de stockage en matière organique au sein de la feuille et généralement à la durée de vie des feuilles. Ainsi des valeurs de SLA fortes, caractérisent des plantes à croissance rapide produisant de grandes feuilles mais dont la longévité est faible (Westoby 1999) ; de fortes valeurs de LDMC caractérisent des plantes dont les organes foliaires accumulent des nutriments et constituent d'importants pools de stockage donc avec un faible turn over des tissus. Non seulement, ces deux traits reflètent des stratégies écologiques divergentes en tant que traits foliaires reliés à la fonction d'acquisition et stockage des nutriments, mais de plus il est intéressant d'étudier leur relation afin de tester s il existe une relation de compensation entre ces deux traits et si cette corrélation existe toujours lorsque l on prend la phylogénie en compte (trade off évolutif). 4

Figure 1: Arbre phylogénétique de 208 espèces de la vallée de la Guisane (au niveau des ordres) 5

I Matériel et Méthode Acquisition des données sur les traits fonctionnels Le site d'étude est la vallée de la Guisane (Hautes Alpes, France) qui s'étend sur 20 km entre Briançon et le col du Lautaret. Cent sept communautés végétales ont été étudiées sur ce site, leur répartition se fait sur un large gradient d'altitude (1296 2947m). La stratégie d'échantillonnage et de mesures des traits fonctionnels a été élaborée pour compléter les bases de données du LECA déjà existantes de façon à obtenir une représentativité totale de 80% de couverture végétale. La campagne Diversitalp de l'été 2008 a ainsi échantillonné cent espèces végétales. Douze individus de chaque espèce ont été échantillonnés sur le terrain et conservé en milieu frais et humide afin de les préserver de la dessiccation. Les individus collectés étaient séparés de plusieurs mètres sur le site afin d'éviter d'échantillonner des clones ou des individus génétiquement proches, ainsi que des individus présents dans des conditions micro environnementales similaires (limitation de la pseudo réplication dans nos données). Les traits foliaires SLA (specific leaf area) et LDMC (leaf dry matter content) étaient ensuite estimés, à partir de la masse fraîche, de la surface foliaire mesurée en laboratoire par scanner HP grâce au logiciel MideBMP (entre 0 et 5% d'erreur) et la masse sèche foliaire mesurée sur une balance de précision (micro gramme) après quatre jours à l étuve (60 C). II Analyse phylogénétique 1. Arbre L'analyse a été effectuée à partir d'un super arbre (Figure 1) restreint aux espèces contenues dans la base de données et dont à la fois les valeurs de SLA et de LDMC étaient disponibles. L'arbre phylogénétique comporte ainsi 208 feuilles. De nombreux embranchements, notamment au niveau des genres ne sont pas résolus et sont donc polytomiques. L'arbre phylogénétique a été construit grâce à la compilation de phylogénies (approche du «superarbre» réalisées par différents partenaires du projet DIVERSITALP. L'élaboration de ce super arbre n'est pas le sujet de ce travail, ainsi je n'ai pas participé à son élaboration. 2. Outils statistiques Différentes méthodes ont été utilisées afin d'analyser les données de traits d'un point de vue phylogénétique. Toutes ont été appliquées grâce au logiciel R (Ihaca, R, Gentleman R., 1996. R : a language for data analysis and graphics. Journal of Computational and Graphical Statistics 5 299 314) 1. Le et (Pagel 1999, Verdù 2006) : La démarche consiste à appliquer différents modèles aux données phylogénétiques en faisant varier le paramètre concerné. Ce paramètre modifie les longueurs de branches pour arriver au modèle le plus vraisemblant*, c'est à dire celui prédisant au mieux le patron évolutif du trait.. Le paramètre est simil * aire à l'indice développé par Blomberg (2002) pour détecter un signal phylogénétique, c'est à dire la tendance pour des taxons proches d'avoir des caractères proches. Une * cf. Glossaire 6

valeur de nulle indique une absence de signal phylogénétique, cela indique que le trait a évolué comme sur une phylogénie en étoile (toutes les espèces sont équidistances entre elles, sans relations phylogénétiques). Une valeur de égale à 1 indique que le trait évalue exactement tel que la topologie originale de la phylogénie le suggérait. Le mode de l'évolution est mesurée par la comparaison des vraisemblances de modèles avec différentes valeurs de. Ce paramètre raccourcit ou étire individuellement les branches de l'arbre phylogénétique ; ainsi une valeur de supérieure à 1 indique que les longues branches ont besoin d'être plus étirées que les branches courtes, traduisant une accélération de l'évolution du trait le long des plus longues branches.. Une valeur inférieure à 1 traduisant plutôt une conservation du trait sur les branches plus longues (donc trait plutôt statique). Une valeur de nulle indique un cas de ponctualisme, c'est à dire un trait dont le changement est rapide sur une courte période de temps (évolution par paliers), tandis qu'une valeur de égale à 1 indique un cas de gradualisme, c'est àdire un trait dont la vitesse de changement est constante au cours du temps. Le tempo de l'évolution du caractère est mesuré par. Ce paramètre représente la puissance à laquelle sont élevées les chemins évolutifs (distance de la racine aux feuilles). Si ce paramètre est inférieur à 1, cela signifie que les chemins évolutifs courts contribuent plus à l'évolution du caractère que les chemins longs. Ce qui est cohérent avec des cas de divergences précoces du trait. Inversement, une valeur de supérieure à 1 traduit une radiation tardive du trait. Les vraisemblances associées à ces trois modèles ont été comparées à celles de modèles pour des valeurs de paramètre (, fixées à 0 ou à 1, ces valeurs de paramètre correspondant à des «valeurs frontière» (cf. paragraphe précédent). Les p values associées ont ensuite été calculées par approximation du ratio de vraisemblance* par la loi de chi2 à un degré de liberté *. Le script associé est disponible en annexe. Le script utilise notamment la fonction fitcontinuous contenue dans la librairie R «geiger» 2. Orthogramme (Ollier et al. 2005) Cette méthode consiste à traduire la topologie de l'arbre phylogénétique par une matrice et de déduire la base orthornomée associée.. Il convient de noter que la démarche ne prend pas en compte les longueurs de branches de la phylogénie et se focalise uniquement sur les noeuds (topologie). Au final, la base orthonormée résume ainsi chaque noeud de l'arbre par un ou plusieurs (dans le cas de polytomies) vecteurs de la base orthonormée (cf. Figure 1). La décomposition de la variance du trait selon Figure 2: Représentation des vecteurs de la base les vecteurs de la base orthonormée permet orthonormée pour un arbre fictif. Les vecteurs B donc de calculer la contribution de chaque i sont ceux de la base orthonormée et L vecteur de la base à la variabilité actuelle du i, ceux associés à chacune des feuilles de l'arbre. (Ollier et trait. Ces contributions sont comparées à un al. 2005) modèle nul (par randomisation des feuilles de l'arbre phylogénétique). La fonction orthogram() disponible sous R au sein de la librairie ade4, fournit également quelques * Cf. Glossaire 7

outils permettant d'interpréter cette décomposition. Elle renvoit l'orthogramme proprement dit, c'està dire la contribution de chaque vecteur à la variance du trait, ainsi que l'orthogramme cumulé. De plus, quatre indices sont calculés : Soit r i la composante du vecteur «trait» centré et standardisé (à partir du vecteur x contenant les valeurs de traits pour chacune des feuilles) le long du vecteur i (compris entre 1 et (t 1) où t est le nombre de feuilles de l'arbre phylogénétique) de la base orthonormée. R2max x =max r 1 2,...,r t 1 Cet indice permet de constater si un vecteur de la base contribue dans une large mesure à la variance totale, c'est à dire qu'un noeud de l'arbre contribue beaucoup à la variance du trait, ce dernier étant ensuite conservé dans les branches descendantes. m i= 1 r i 2 m t 1 Cet indice permet de constater une dépendance plus diffuse de la variance du trait dans l'arbre phylogénétique en calculant l'écart maximum de l'orthogramme cumulatif à la droite d'évolution moyenne. t 1 2 SkR2k x = ir i i=1 Cet indice permet de calculer une distribution de la variance plutôt au niveau de la racine ou au niveau des feuilles, c'est à dire de constater une divergence plutôt précoce ou tardive. t 1 SCE x = i=1 2 r 2 2 i r i 1 Cet indice permet de calculer la variation locale moyenne des valeurs de l'orthogramme. 3. Divergence et contribution des noeuds (Moles et al. 2005) : Un script (disponible en annexe) destiné à être utilisé sur R a été codé pour intégralement reprendre cette analyse. Moles passe par une estimation des caractères ancestraux utilisant la méthode des contrastes phylogénétiquement indépendants (PIC) de Felsenstein (1985), néanmoins cette étude lui a préféré la méthode GLS (generalized least squares, Martins et Hansen 1997) s'appuyant sur une hypothèse d'évolution brownienne* (ce qui revient à la méthode PIC). Ce choix s'est justifié par la comparaison de plusieurs méthodes d'évaluation * des caractères ancestraux et la constatation de la présence d'un outlayer* dans le set de caractères ancestraux évalué par la méthode PIC. De plus, le problème des polytomies* (que la méthode ne prend pas en charge) a été résolu par l'ajout d'embranchements aléatoires permettant d'obtenir un arbre phylogénétique entièrement dichotomique. Les branches supplémentaires sont alors de longueurs nulles. Afin d'évaluer l'impact de cette transformation sur la valeur de caractère ancestral attribuée à un noeud polytomique, un arbre polytomique (39 espèces et 9 noeuds internes)a été résolu cent fois en arbre dichotomique et la valeur du caractère ancestral de la racine a été évaluée. Cette dernière reste identique. On peut en déduire que cet ajout d'embranchement ne modifie pas l'évaluation du caractère ancestral, ce qui peut, par ailleurs, s'expliquer par la nullité des branches ajoutées. Par la suite, l'analyse a été conduite à partir de l'arbre original sans tenir compte des noeuds ajoutés pour les besoins du calcul des états ancestraux afin de ne pas sous estimer l'importance des noeuds polytomiques dans le calcul de leur divergence et leur contribution L'amplitude de divergence a ensuite été calculée pour chaque noeud, il s'agit de la racine carrée de * Cf. Glossaire 8

la somme des différences entre les valeurs de caractères des noeuds fils et du noeud père. La contribution de chaque noeud a également été déterminée, cet indice permet d'estimer la contribution du noeud à la variance actuelle du trait dans tout l'arbre. Les détails des calculs sont disponibles en annexe. Afin d'évaluer leur significativité, ces résultats ont été comparés avec ceux obtenus par 999 randomisations des feuilles de l'arbre phylogénétique. Cela constitue également une différence avec la démarche de Moles qui n'utilise ces randomisations que pour l'étude des amplitudes de divergence (voir discussion) Afin de pouvoir comparer les valeurs d'amplitude de divergence et de contribution, pour chaque noeud, la moyenne des contributions et des amplitudes de divergences obtenues lors des randomisations a été calculée. «L'anomalie» de divergence et de contribution a ensuite été calculée en soustrayant cette moyenne aux valeurs observées de divergence et de contribution. 4. Phylogenetic least squares model (Martins et Hansen 1997 ; Ross Ibarra 2007) ou PGLS Cette méthode permet, entre autres, de calculer la corrélation entre deux traits en prenant en compte des relations phylogénétiques qui relient les espèces. De plus, le modèle proposé par Martins permet d'évaluer le paramètre qui reflète la contrainte évolutive. Une valeur nulle illustre une croissance linéaire de la divergence phénotypique entre espèces avec la distance phylogénétique et revient à une hypothèse d'évolution brownienne (divergence aléatoire ou pression de sélection variable) et à la méthode PIC de Felsenstein. Un GLS avec une valeur de non nulle fait l'hypothèse d'une croissance exponentielle de la divergence phénotypique avec la distance phylogénétique. Le modèle GLS converge vers un modèle classique de corrélation entre valeurs indépendantes quand tend vers l'infini. Cette démarche a été effectuée avec le logiciel Compare (Martins 2004). 9

Résultats I et de Pagel Paramètre Valeur du paramètre log likelihood* AICc* p value par rapport à la valeur 0 p value par rapport à la valeur 1 0.4316 726.3123 1458.743 1.555e 01 2.109e 05 0.7722 734.1971 1474.512 0.000 0.126 2.999 725.7343 1457.587 0.000 1.138e 05 Tableau 1: Profil évolutif du SLA * Paramètre Valeur du paramètre log likelihood AICc p value par rapport à la valeur 0 p value par rapport à la valeur 1 0.892 290.074 574.031 0.000 0.0028 0.07785 304.223 602.3279 5.274e 01 1.028e 09 0.4754819 287.9637 569.8093 8.393e 06 2.915e 02 Tableau 2: Profil évolutif du LDMC Les indices de Pagel indique donc que le SLA et le LDMC ont deux patrons évolutifs distincts, en effet, on constate que le LDMC semble avoir subi une diversification ancienne et un mode évolutif de type ponctué (la valeur de kappa n'est pas significative par rapport à la valeur nulle). En revanche, le SLA bien que présentant un signal phylogénétique certain a plutôt subi une radiation tardive et présente un mode évolutif du type gradualisme* (la valeur de kappa n'est pas significativement différente de 1) et le paramètre lambda associé n'est pas significativement différent de 0. * Cf. Glossaire 10

II Orthogramme 1. SLA Figure 3: Orthogramme du SLA Test Valeur observée P value R2Max 0.06132704 0.809 SkR2k 93.78723743 0.094 Dmax 0.11010214 0.486 SCE 0.69118318 0.279 Tableau 3: Indicateurs statistiques de l'orthogramme du SLA 11

2. LDMC Figure 4: Orthogramme du LDMC Test Valeur observée P value R2Max 0.1545634 0.001 SkR2k 36.4954387 0.001 Dmax 0.5588514 0.001 SCE 27.9254471 0.001 Tableau 4: Indicateurs statistiques de l'orthogramme du LDMC La décomposition orthonormale d'ollier ne détecte pas de profil particulier dans le patron évolutif du SLA. On peut néanmoins noter quelques noeuds dont le coefficient élevé au carré, qui peut être interprété comme la contribution à la variance totale du trait, est significativement plus grand que ceux obtenus par les randomisations. En revanche, le profil du LDMC présente un profil très marqué indiquant une évolution concentrée dans les premiers noeuds de la phylogénie, ce qui visuellement est indiqué par la présence de pics très élevés dans les premiers vecteurs de l'orthogramme. Cela est confirmé par les quatre indices statistiques qui viennent corroborer cette proposition. 12

III Amplitude de divergence et contribution Figure 5: Amplitude de divergence et contribution des noeuds à la variance du SLA. L'anomalie représente l'écart de l'amplitude de divergence ou de la contribution à la moyenne des valeurs obtenues pour les 999 randomisations des valeurs de traits. Les résultats obtenus par la méthode de Moles semblent indiquer une absence de patron évolutif clair concernant l'évolution du SLA. Les amplitudes de divergences et les contributions semblent se répartir autour d'une valeur moyenne constante au cours du temps ; l'analyse détaillée indique peu de valeurs significatives par rapport aux randomisations y compris concernant les valeurs les plus élevées (cf. annexe). 13

Figure 6: Amplitude de divergence et contribution du LDMC Le premier graphe de la Figure 6 indique que les amplitudes de divergence diminuent quand la distance phylogénétique à la racine augmente. Cette tendance est encore plus marquée quand on s'intéresse à l'anomalie de divergence. L'amplitude des divergences prend ainsi des valeurs plus faibles que celles obtenues après randomisation (représentant l'hypothèse nulle) en approchant des feuilles de l'arbre phylogénétique. Les contributions indiquent une nette prédominance de la racine par rapport aux autres noeuds. Ces derniers noeuds ont ensuite des valeurs assez homogènes avec une certaine baisse observable en échelle logarithmique (Figure 7). 14

Figure 7: Corrélation entre les moyennes de randomisation des contributions et le nombre de noeuds fils et comparaison avec les contributions du SLA Ces résultats sont donc concordants avec l'idée d'une radiation précoce du LDMC et un conservatisme du trait dans les branches plus récentes. On notera néanmoins que comme pour les résultats du SLA, on observe que peu de valeurs significatives parmi les plus grandes valeurs de divergences. En revanche, les contributions indiquent des noeuds ayant une contribution importante et significative. Ces deux graphes (Figure 8) permettent d'apprécier un certain biais existant dans les valeurs de contribution. On voit en effet qu'il existe une corrélation élevée (0.9) entre la moyenne des randomisation qui est donc indépendante des valeurs de traits (on obtient ainsi les mêmes moyenne de randomisation pour le SLA et le LDMC) et le nombre de noeuds fils. Ce biais est par ailleurs important, car comme on peut le constater, il existe des valeurs élevées de contribution pour des noeuds possédant un grand nombre de noeuds fils, qui sont en réalité très proches de la moyenne de randomisation qui leur est associée. 15

IV Etude de la corrélation entre caractères Un premier aperçu de la relation entre SLA et LDMC indique une relation décroissante entre les deux traits. De plus, on constate qu'une relation linéaire significative (p value < 10 6 ) avec une corrélation de 0,35. Les plantes à fort LDMC et faible SLA sont des plantes à feuilles plus coriaces et comprennent les conifères (Pinus, Larix, Juniperus), des Ericacées (Vaccinium, Arctostaphylos) ainsi que dans une moindre ampleur certaines Poacées (Festuca, Nardus) et certains arbres typiques de milieux montagnards ou frais (Salix, Sorbus). A l'opposé, on trouve des plantes de type herbacé à fort SLA et faible LDMC. A l'écart de ces tendances (outliers), on trouve des plantes à feuilles charnues à faible LDMC et SLA, il s'agit de Crassulacées (Sempervivum). La méthode GLS nous permet de tester plusieurs modèles différents d évolution des traits. Le modèle brownien a été testé (équivalent à la méthode PIC de Felsenstein) ainsi que le modèle utilisant la matrice de variance/covariance d'ornstein Uhlnbeck, la Figure 8: Corrélation entre SLA et LDMC (en vraisemblance de ces deux modèles a ensuite bleu,corrélation classique ; en violet, corrélation par été comparée à celle du modèle non la méthode PGLS) phylogénétique pour obtenir une p value. Méthode PGLS Modèle brownien Modèle non phylogénétique 15,5 0 na Log likelihood 159.57 0 138.54 P value <10 10 0 / Pente 0.35 0.36 0.28 Ordonnée à l'origine 0.44 0.82 0.63 Coefficient de corrélation 0.46 0.51 0.35 Tableau 5: Corrélations obtenues par la méthode GLS On constate que le modèle PGLS est celle présentant la meilleure vraisemblance. Le coefficient de corrélation entre les deux traits est ainsi à 0.46 en prenant en compte l'information génétique. Néanmoins, cette augmentation de la corrélation grâce à l'intégration de la phylogénie n'est pas très importante ( 0.46 contre 0.35). La corrélation phylogénétique entre les deux caractères reste donc limitée 16

Discussion Patron évolutif du SLA et du LDMC Les différentes méthodes employées fournissent des réponses cohérentes. Il est ainsi net que le patron évolutif que semble suivre le LDMC est celui d'une radiation précoce (Tableau 2, Tableau 4 Figure 6). Cela entraîne un fort signal phylogénétique (Tableau 2)étant donné le fort conservatisme phylogénétique de ce trait dans les noeuds au delà des premières divergences. Cela se manifeste par les faibles valeurs d'amplitude de divergence des noeuds les plus récents, fait qui se retrouve aussi bien dans la méthode de Moles que d'ollier. De même, les trois méthodes semblent montrer que le SLA a un profil évolutif peu tranché. Les méthodes de Moles et d'ollier n'indiquent aucune tendance globale nette. La méthode de Pagel indique un signal phylogénétique moyen ainsi qu'un indice élevé. Cela signifie que le trait a subi une radiation tardive et donc un conservatisme phylogénétique faible, ce qui n'est en revanche pas détectée par les deux autres méthodes. La méthodes de Moles indiquent des contributions importantes de certains noeuds sans pour autant qu'il y ait de corrélation particulière avec la distance phylogénétique à la racine. Le profil de l'orthogramme d'ollier s'interprète comme un cas où la dépendance phylogénétique n'est pas significative, ce qui est confirmé avec la valeur du paramètre, non significativement différente de 0. Ceci indique un moins fort conservatisme phylogénétique. Le SLA semble donc être un trait fonctionnel plus labile et moins contraint par la sélection naturelle que le LDMC. Corrélation des deux patrons d'évolution Les deux traits présentent une corrélation significative qui indique que ces deux caractères sont liés, ce qui n'est guère étonnant étant donné qu'ils se rapportent tout deux au même organe végétatif. Les plantes à fort SLA possèdent un faible LDMC et inversement. On remarque que l'ajout de la contrainte phylogénétique par le biais du modèle d'ornstein Uhlnbeck améliore le coefficient de corrélation du modèle linéaire ce qui confirme la tendance globale que l'on a pu observer avec un modèle linéaire classique. Le modèle exponentiel se révèle plus approprié, ce qui concorde avec les conclusions précédentes indiquant que l'évolution des traits est soumis à des contraintes évolutives. Cela est cohérent avec les stratégies écologiques que reflètent ces traits fonctionnels. En effet, les végétaux à fort SLA et faible LDMC sont des plantes donc la croissance sera rapide et l'acquisition des ressources efficace à court terme par rapport à la matière organique investie. En revanche, les structures foliaires ont une moins grande longévité car plus fragiles (plus sensibles à la dessiccation par exemple). A l'inverse, les plantes à fort LDMC et faible SLA, présentent une croissance moins rapide mais des feuilles à plus grande longévité, ce qui permet à ces feuilles de stocker des nutriments notamment l'azote. (Westoby 1988). On remarque également que le paramètre est élevé, ce qui indique que l'autocorrélation phylogénétique donnant le modèle le plus vraisemblable n'est pas très importante, ce qui peut explique l'augmentation modérée de la valeur absolue du coefficient de corrélation. On peut relier cette faible autocorrélation au fait que les deux patrons évolutifs sont globalement découplés et que les fortes divergences évolutives ne correspondent pas. Critique de la démarche de Moles L'article de Moles indique l'utilisation de randomisations des valeurs de traits pour évaluer la significativité des résultats. Il apparaît que l'étude ici présente ne met en valeur que peu de valeurs 17

significatives (cf. Annexe) même parmi les noeuds les plus importants. Or une valeur de contribution ou d'amplitude de divergence même élevée et non significative indique qu'en moyenne, même après randomisation des valeurs et donc perte du lien phylogénétique entre celles ci, ce noeud possède encore une contribution ou une amplitude de divergence élevée ; ceci est d'autant plus gênant que l'analyse de Moles met en valeur les noeuds possédant les contributions ou divergences les plus élevées. On peut alors se demander si les indices de contribution et d'amplitude de divergence possèdent un biais qui les rend trop dépendants de la topologie de l'arbre phylogénétique par rapport aux valeurs de traits attribués aux feuilles. Il apparaît en effet que la moyenne des randomisations des contribution est variable selon le noeud (contrairement à ce que donne la méthode d'ollier) et se corrèle très bien au nombre de noeuds fils du noeud étudié (Figure 8), ce qui n'est pas surprenant, compte tenu de la formule de l'indice de contribution. Ce biais est donc particulièrement important pour des arbres comprenant de nombreuses polytomies comme celui étudié ici. Ceci justifie l'usage de «l'anomalie» en particulier pour l'indice de contribution. De plus, la démarche de Moles semble peu adaptée à l'étude de traits fonctionnels tel que le LDMC qui présente dans la phylogénie étudiée ici, un patron évolutif très marqué. En effet, l'estimation des caractères ancestraux reposent sur l'hypothèse d'une évolution brownienne du trait (Felsenstein 1985) ; hors ce modèle semble totalement inapproprié pour un trait tel que le LDMC dont le profil n'est clairement pas celui d'une évolution brownienne. Si on se reste dans le cadre d'étude proposé par Moles (reconstruction de caractères ancestraux), il pourrait être intéressant de comparer les résultats obtenus pour différents méthodes de calcul de caractères ancestraux notamment prenant en compte une sélection évolutive. Néanmoins, il n'existe que peu de méthodes de reconstruction de caractères ancestraux adaptés à cela. Comparaison des trois méthodes Les trois méthodes présentent des stratégies différentes. La méthode de Pagel s'appuie sur l'étude de la vraisemblance de différents modèles s'appuyant sur la modifications des longueurs de branches pour déterminer des profils évolutifs sur l'ensemble de l'arbre phylogénétique. Elle permet notamment également de quantifier le mode évolutif ainsi que le «signal phylogénétique» en plus du tempo. La démarche d'ollier et de Moles relèvent elles d'une analyse statistique qui permet de tirer des informations sur chacun des noeuds. L'orthogramme d'ollier présente la particularité de ne s'appuyer que sur les noeuds. Cela permet de se détacher de l'information parfois peu fiable selon l'auteur que donnent les longueurs de branches en particulier pour des super arbres, cela conduit néanmoins à une perte d'information. Ainsi l'étude d'arbres phylogénétiques présentant des longueurs de branches contrastées conduit à des résultats contradictoires entre la méthode d'ollier et de Pagel. Enfin la méthode de Moles s'appuie, elle, sur l'estimation de caractères ancestraux pour déterminer l'amplitude de divergence et la contribution de chaque noeud. Néanmoins, il apparaît que l'indice de contribution possède un biais intrinsèque qui conduit à sa surévaluation pour des noeuds polytomiques ce qui peut s'avérer gênant pour des arbres possédant des très fortes polytomies dues à une non résolution de certains embranchements. L'usage de «l'anomalie», c'est à dire de la différence entre la valeur de contribution ou de divergence et la moyenne obtenue par les randomisations (qui traduit le biais phylogénétique) permet de rendre plus comparables les valeurs attribuées aux différents noeuds. Il est finalement intéressant de constater que les grandes tendances données par ces trois méthodes 18