Des mathématiques pour expliquer le vivant? Annick LESNE CNRS UMR 7600 (LPTMC) & Institut des Hautes Études Scientifiques lesne@ihes.fr
Le grand livre de la Nature est écrit en langage mathématique (Galilée, dans L essayeur (Il saggiatore), 1623) il pensait aux phénomènes physiques (par exemple la gravité, en laissant tomber des pierres depuis la tour de Pise ou en les faisant rouler sur un plan incliné) une liste sans fin d exemples : mécanique des fluides de Vinci (15ème siècle), Galilée et Descartes (début 17ème) Newton et le début du calcul différentiel (fin 17ème)... jusqu à relativité générale d Einstein (20ème) et géométrie de l espace temps, la mécanique quantique etc etc La frontière est aujourd hui bien floue entre les maths et la physique!
Léonard de Vinci (1452-1519)
Et en biologie??? matière vivante et organismes ayant évolué par sélection naturelle Un succès moins flagrant... (presque) tout reste à faire! on choisit de faire de la bio quand ne se croit pas bon en maths... nombres, calcul, statistiques... mais les maths ce sont aussi des modes de raisonnement et des structures pour comprendre, ou même simplement voir et décrire, ce qui nous entoure Exemples : symétries, instabilités, probabilités
Un premier exemple : la morphogenèse origine des formes? comprendre les symétries et les brisures de symétrie
Une explication mathématique (Turing 1952) mécanisme de réaction-diffusion (équations aux dérivées partielles) la période est fixée par la dynamique la géométrie fixe seulement le type de motif
Un autre exemple (en cours... gardez votre sens critique!!!) 1) calcul de probabilités 2) théorie des réseaux pour comprendre ce qu est la prédisposition génétique à une maladie chronique (en l occurrence la maladie de Crohn) quelle part vient des gènes (hérités)? quelle part du mode de vie? d où : quelle marge de manoeuvre (thérapie)? quel type de prédiction (pronostic)? Collaboration avec Jean-Pierre Hugot (Hôpital R. Debré, Paris) Leigh Pascoe (CEPH, Paris), Gaëlle Debret and Jean-Marc Victor (LPTMC)
ADN et gènes molécule en double hélice quatre lettres A, T, G, C appariements A-T et G-C miroir ( réplication) ou patron ( transcription)... ATTGCGCTACGTATACCGATCGCG...... TAACGCGATGCATATGGCTAGCGC...
Le génome est hérité des parents les gènes contrôlent quelles protéines le corps fabrique, ce qui contrôle indirectement toutes les fonctions biologiques
De la variabilité d un individu à l autre : LE génome humain mais gènes, empreinte ADN, SNPs (Single Nucleotide Polymorphism) et génétique des populations LA question encore non résolue : le lien génotype-phénotype Une question subsidiaire : quelle est la part des gènes et quelle est la part de l environnement et du mode de vie... ce qui renouvelle le débat sur l inné et l acquis dans le développement de l embryon, mais aussi dans les maladies...
Les données génétiques : études d association sur le génome entier (300 000 SNPs) formes variantes plus fréquentes chez les malades la forme dite normale sera celle plus fréquente chez les gens sains, la forme dite variante sera celle plus fréquente chez les malades... relatif à une maladie!!! en un site polymorphe, lettre A ou G, 40%-60% chez les contrôles, 70%-30% chez les patients. La lettre A sera dite forme à risque par extension on parle de gène de susceptibilité En fait, il faut que la différence de pourcentage entre les individus sains et les malades soit statistiquement significative... le seuil dépend de la taille de la cohorte (importance des statistiques!) (combien de lancers faut-il faire pour être sûr qu un dé est pipé...)
L analyse génétique de la maladie provient donc de données statistiques, comparant une cohorte de malades à un groupe contrôle et montrant des corrélations Attention à ne pas confondre corrélations et relations causales! 80% des gens ayant des gros pulls vont au sports d hiver (causalité inversée) 50% des gens ayant des gros pulls chauffent bien leur maison (cause commune : ils sont frileux) les autres 50% des gens ayant des gros pulls ne chauffent pas beaucoup leur maison (causalité : ils ont assez chaud avec leurs gros pulls). Corrélation = conjonction statistique au niveau d une population ici pas de causalité claire : aucune forme à risque n est nécessaire ni suffisante pour être malade l exemple des vrais jumeaux et de leurs maladies
Histogramme (%) du nombre de sites génomiques variants chez les patients (en noir) et les contrôles (en gris)
Les données épidémiologiques : courbe d incidence pour chaque classe d âge, % de nouveaux cas (typiquement, au cours de l année) parmi l ensemble de personnes de cet âge
Notre objectif : comprendre le rôle des gènes à risque dans le développement de la maladie ( prédisposition génétique ) intégrer la connaissance des gènes à risque et les facteurs environnementaux ( interaction gène-environnement ) un modèle mathématique est ici nécessaire pour formuler les mécanismes d apparition de la maladie réconcilier le niveau de l individu et les observations statistiques
Réseaux : une nouvelle notion de cause, une nouvelle science des exemples innombrables : trafic routier ou aérien, internet, www, facebook mais aussi logistique et commerce, écologie (qui mange qui), métabolisme, cerveau... une causalité distribuée et dépendant du contexte
Notre hypothèse : structure en réseau des fonctions biologiques et notion de module fonctionnel
Nous proposons un modèle de panne : (penser à Internet!) au départ : modules potentiels et modules effectivement utilisés puis détérioration ou changement d utilisation la maladie se déclencherait quand tous les modules sont inactifs m input i 1 i 2 response i 3 i 4 i n k chaque module aurait une durée de vie dépendant du génotype de l individu mais aussi de son histoire et de son environnement
Du niveau de l individu à celui de la population : pour l individu : des modules dont l implication et la durée de vie dépendent du génotype, de l environnement, de l histoire, d une part aléatoire. Les gènes à risque contribuent en diminuant la durée de vie moyenne de certains modules. L environnement joue aussi, par exemple en privilégiant d autres fonctions plus essentielles. au niveau de la population : vision moyenne. Chaque module a une probabilité d être initialement utilisé, et une probabilité de panne pour la fonction considérée on prédit la courbe d incidence, le nombre et la durée de vie des modules, et l effet d un nouveau stress environnemental applicable à d autres maladies : sclérose en plaques, schizophrénie
Implications : un déterminisme génétique partiel dépendant de l histoire et de l environnement de l individu pas de bons et de mauvais gènes, mais des gènes adaptés ou non risque génétique dans un contexte donné pas de prédiction personnalisée et fiable des maladies à partir uniquement du profilage génétique pas d individus normaux et anormaux : des individus différents
Une approche systémique : exemple d utilisation des mathématiques pour formuler un mécanisme probabiliste au niveau de l individu et en déduire des prédictions statistiques fondé sur une vision en réseau des fonctions biologiques plus généralement modèles minimaux centrés sur les principes d organisation, de fonctionnement et de régulation, prenant en compte la variabilité individuelle et le rôle de l environnement Comprendre les compromis établis au cours de l évolution et permettant la coexistence d espèces en compétition. Statégies différentes suivant l environnement et sa variabilité. structure mathématique du vivant
En guise de conclusion... recherche en maths pour comprendre des questions sur le vivant, voire sur l humain? presque tout reste à faire! science normative? ici elle relativise la notion de norme qu est ce qui définit un individu du point de vue biologique ou médical? Ses gènes, mais aussi son histoire, son mode de vie, son environnement... Il faut donc soigner une personne! une démarche scientifique en médecine et en biologie ne peut se faire sans s accompagner d une réflexion philosophique et éthique