Gènes Diffusion - EPIC 2010 1. Contexte. 2. Notion de génétique animale. 3. Profil de l équipe plateforme. 4. Type et gestion des données biologiques. 5. Environnement Matériel et Logiciel. 6. Analyses et applications en animal. 7. Gestion des données de grandes dimensions.
La société Gènes Diffusion Un groupe coopératif international. Création, production et diffusion de la génétique animale. Reproduction assistée dans 4 espèces : Bovins Porcins Lapins Equins
USA Minesota Gènes Diffusion - international Madison 310 places Madison EUROPE CHINE Wisconsin Michigan Ommen Iowa Indianapolis 100 places Illinois Indiana Ohio Ostende Pologne Beijing Pologne 150 places Bureau Slovaquie 3 places Génisses Porcs Taureaux Roumanie 3 places Tchéquie 15 places Lleida 120 places Lleida Hongrie 20 places
Notions de génétique animale D une génération à l autre : sans aucune sélection. Pas d évolution génétique.
Notions de génétique animale Représentation d une étape de sélection. Evolution génétique sur les descendants.
Notions de génétique animale Aide à la sélection : AVANT L ADN : Sélection avec les mesures phénotypiques des animaux. AVEC l ADN : Sélection grâce à la génétique des animaux (avec parfois validation avec les données phénotypiques). Objectifs : Mettre à la disposition des filières un type d animaux adaptés à leurs besoins en exploitant des différences d origines génétiques. Moyens : Développement d outils et de techniques susceptibles d entraîner un progrès génétique. La plateforme génomique de Gènes Diffusion.
L équipe de la plateforme génomique 1 Manager 1 ingénieur en génétique animale (+1 doctorant) 1 ingénieur biomoléculaire 1 ingénieur en bioinformatique (+ 1 doctorant) 1 technicien de laboratoire 1 consultant en statistique et génétique quantitative Laboratoire transcriptomique et génomique appliquée
Les données animales : les phénotypes Nous possédons de grandes bases de données contenant : des informations mesurées sur nos animaux (les traits) : mesure de la production de lait pour les vaches poids des animaux, taille des jambons des informations sur la généalogie de ces animaux.
Les données génomiques Rappel : La génomique c est la discipline qui étudie les génomes (ensemble du matériel génétique d un individu ou d une espèce). Point de départ : Le séquençage du génome bovin et porcin. A G T C
Les données génomiques Le génotypage : c est une application du séquençage. Cette technologie est utilisable grâce à l augmentation spectaculaire du nombre de marqueurs disponibles. A A T T G G C C T T A C
Les données génomiques Dans notre laboratoire : utilisation des puces porcines 62 000 marqueurs et des puces bovines 54000 marqueurs.
Les données génomiques A quoi cela ressemble informatiquement?
L objectif général ANIMAUX (avec Généalogie) GENOTYPES Analyse (QTL mapping, sélection génomique ) RESULTS
Environnement matériel et logiciel Le minimum pour la gestion de fichiers génotypes et phénotypes : Un logiciel pour la gestion des échantillons biologiques LIMS : laboratory information management system. Sauvegarde/Archivage Des données : 2 serveurs à l IPL et à Gènes Diffusion.
Environnement logiciel RESULTATS GENOTYPES INDIVIDUS AVEC MESURES PHENOTYPIQUES PLINK Perl Formatage des données pour l analyse Contrôle Qualité des échantillons et des marqueurs (MAF, HWE ) ENVIRONNEMENT BIOINFORMATIQUE Construction du/des score(s) : Correction phénotypique (prise en compte de l âge, du sexe, du centre d appartenance) Environnement logiciel s fonctionnel : Construction d haplotypes Analyse QTL Déploiement sur architecture parallèle Résultats et rapport graphique
L analyse et l application en animal
La recherche de QTL QTL : Quantitative Trait Locus. Locus, une région du génome ne correspond pas forcément à un seul gène, peut impliquer plusieurs gènes. Les polymorphismes (tels que les SNPs) sur une région QTL sont une des causes de variation phénotypiques d un trait quantitatif.
Les objectives d une analyse QTL 1. Identifier des régions du génome contenant des QTL. 2. Estimer les effets de ce QTL sur notre trait : Quantifier en quoi la variation du trait est causée par cette region spécifique. Quel allèle de notre SNPs est associé avec un effet favorable? 3. Utilisation du QTL et des informations génétiques pour assigner des scores d index à nos animaux.
Utilisation des QTLs L ensemble des QTLs pour un trait donné (exemple : longévité,vitalités à la naissance ) est utilisé pour évaluer génétiquement nos animaux. Le modèle génétique se décompose comme tel : Gi : Ui : Hij1 : Hij2 : la valeur génétique. la composante polygénique : les gènes non suivis par nos marqueurs. l effet du QTLs paternels. l effet de QTLs maternels.
La sélection génomique (sg) Une évolution par rapport à l analyse QTLs. Utilisation, de façon optimale, les dernières technologies de génotypages (puce à haute-densité de marqueurs). Prédire la valeur génétique d un animal à partir de l ensemble des informations de son génome : à la naissance sur un embryon. Pour simplifier, on part du postulat de base que chaque marqueur est un QTL, et on calcule les effets de chaque marqueur pour obtenir la valeur génétique de l animal.
La sg : principe de base Publiée par Meuwissen et Goddard (2001, Genetics 157:1819). A partir d une population de référence P + P : quelques milliers d animaux avec génotypes (ex : puce 54000 à 800000) et phénotypes Grâce à une partie de P et P, on établit une équation de prédiction des phénotypes à partir des marqueurs On passe à une étape de validation de l équation sur P. On utilise cette équation pour obtenir les scores d index génomique de candidats C à la sélection par exemple à la naissance! P P C
Impact sur la diversité Il faut savoir que la SG peut être bien ou mal utilisée Impact sur la diversité a priori favorable : Minimisation du poids de l information familiale, minimisation de la diffusion des reproducteurs dit «d élite». Par conséquent : on obtient un grand nombre de reproducteurs «efficaces». On pourrait arriver à un «turn-over» rapides des taureaux (au bout d 1 an? De 10 000 doses produites?).
Grande dimension Les puces contiennent l information de 54000 marqueurs mais la nouvelle puce bovine sortie en septembre comprend 800 000 marqueurs. La sélection génomique nécessite une population de référence de plusieurs milliers d animaux (de 4000 à 8000 actuellement). On veut être capable d étudier d autres types d intéractions : Epistasie (comprendre les interactions entre gènes) Epigénétique (comprendre les régulations de l expression des gènes).
Grande dimension Nécessité d adaptation matérielle et logicielle face à ces masses de données. Il devient aujourd hui difficile de faire tourner des analyses marqueurs par marqueurs (temps de calcul +++ ).
Adaptation matérielle Plusieurs solutions existent : utilisation de Cluster de calcul utilisation de grille de calcul. Il est nécessaire d adapter les logiciels pour le déploiement sur ce type d architecture (Parallélisation ). Des solutions plus exploratoires : le GPU.
Adaptation logicielle & méthodologique Les approches Bayésiennes : Bayesian mapping : Chaine de Markov, stochastic search variable selection, shrinkage analysis Combiner méthodologies statistiques et algorithmes d optimisations.
Conclusion D énormes progrès techniques ces dernières années. Les enjeux : La bio-informatique, la bio-statistique et le développement de méthodologies nouvelles : pour gérer et valoriser la masse de données générées. Au niveau des éleveurs : La récolte des phénotypes est un point critique : toujours nécessaires pour mesurer l effet des marqueurs : les phénotypes doivent être définis précisément.
Merci de votre attention