Gènes Diffusion - EPIC 2010



Documents pareils
Génétique et génomique Pierre Martin

Etude, par simulations, de l intérêt d une sélection génomique dans une population porcine de type mâle

Première partie. Introduction Générale

Master de Bioinformatique et Biologie des Systèmes Toulouse Responsable : Pr. Gwennaele Fichant

Plateforme. DArT (Diversity Array Technology) Pierre Mournet

Actualités sur la sélection des pondeuses Prospections futures. Dr. Matthias Schmutz, Lohmann Tierzucht

Élevage Le bénéfice des Systèmes d information et des technologies numériques

GénoToul 2010, Hôtel de Région Midi Pyrénées, Toulouse, 10 décembre 2010

MABioVis. Bio-informatique et la

IV. La ressemblance entre apparentés

Introduction, présentation de la plateforme South Green. h"p://southgreen.cirad.fr/

Ingénieur R&D en bio-informatique

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

MASTER (LMD) MANAGEMENT DE PROJET ET INNOVATION EN BIOTECHNOLOGIE

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

Collecte et gestion de l information zootechnique

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

Premières estimations pour 2014 Le revenu agricole réel par actif en baisse de 1,7% dans l UE28

Mise en place de serveurs Galaxy dans le cadre du réseau CATI BBRIC

Bases de données des mutations

CHAPITRE 3 LA SYNTHESE DES PROTEINES

Réunion du réseau de génétique du Département EFPA

INFORMATION GÉNÉTIQUE et REPRODUCTION SEXUÉE

Mise en place d une solution automatique de stockage et de visualisation de données de capture des interactions chromatiniennes à l échelle génomique

Laboratoire d informatique Gaspard-Monge UMR Journée Labex Bézout- ANSES

Exercices de génétique classique partie II

1 les caractères des êtres humains.

La Performance Digitale en Business to Business

Big data et sciences du Vivant L'exemple du séquençage haut débit

Laboratoire d Informatique, de Traitement de l Information et des Systèmes EA établissements T. Paquet D. Olivier T. Lecroq A.

Les puces RFID en élevage

Algèbre 40 Analyse Stat. 1 - IES : Probabilités discrètes et calcul intégral 29,5 6 Stat. 2 - IES : Probabilités générales 54 8 UE1-02 M-E-IS

Environmental Research and Innovation ( ERIN )

ÉCOLE DE TECHNOLOGIE SUPÉRIEURE UNIVERSITÉ DU QUÉBEC RAPPORT DE PROJET PRÉSENTÉ À L ÉCOLE DE TECHNOLOGIE SUPÉRIEURE

Eco-système calcul et données

Au-delà du coalescent : quels modèles pour expliquer la di

RÉPERTOIRE RELÈVE SCIENTIFIQUE AU SERVICE DES ENTREPRISES AGROALIMENTAIRES. 2 e édition

& Que choisir. favoriser le bien-être

Présentation du dispositif collectif français d évaluation génétique porcin pour les caractères de production et de reproduction

e-biogenouest CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé

Détection et prise en charge de la résistance aux antirétroviraux

Une application des algorithmes génétiques à l ordonnancement d atelier

Bases de données et outils bioinformatiques utiles en génétique

Biomarqueurs en Cancérologie

Projet Xdata. Cinequant, Data Publica, EDF, ESRI, Hurence, INRIA, Institut Mines Telecom, La Poste, Orange, Veolia

ASA-Advanced Solutions Accelerator. Solution pour la gestion des données des laboratoires et des plateformes de service

Journée SITG, Genève 15 octobre Nicolas Lachance-Bernard M.ATDR Doctorant, Laboratoire de systèmes d information géographique

Big Data: développement, rôle des ARS?? Laurent Tréluyer, ARS Ile de France Alain Livartowski Institut Curie Paris 01/12/2014

Feuille d exercices 2 : Espaces probabilisés

Dr E. CHEVRET UE Aperçu général sur l architecture et les fonctions cellulaires

ARCHEOVISION. Centre de Ressources Numériques 3D. UMR 5607 du CNRS. R. Vergnieux IR-CNRS

Info0804. Cours 6. Optimisation combinatoire : Applications et compléments

12. Le système monétaire

Étude EcoVadis - Médiation Inter-Entreprises COMPARATIF DE LA PERFORMANCE RSE DES ENTREPRISES FRANCAISES AVEC CELLE DES PAYS DE L OCDE ET DES BRICS

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Physiopathologie : de la Molécule à l'homme

Exercice 3 (5 points) A(x) = 1-e -0039' e- 0,039x A '() -'-,..--,-,--,------:-- X = (l_e-0,039x)2

UNIVERSITE MONTPELLIER II

Isolement et Diversité Génétique des Dugongs de Nouvelle Calédonie

Les tests génétiques à des fins médicales

Marc VARCHAVSKY Conseil National CER FRANCE Olivier BOUCHONNEAU Président de CER FRANCE 49

IOC 2010 Support à destination des éleveurs caprins CR n

MAIDESC - KO 21 Novembre 2013 Etienne Wey Alexandre Boilley

Quel est le temps de travail des enseignants?

Masters OBSER VATOIRE. Sciences / Technologies / Santé OBSERVATOIRE CARREFOUR DES ÉTUDIANTS. Université de Limoges

Les 10 grands principes de l utilisation du data mining pour une gestion de la relation client réussie

E-BIOGENOUEST, VERS UN ENVIRONNEMENT VIRTUEL DE RECHERCHE (VRE) ORIENTÉ SCIENCES DE LA VIE? Intervenant(s) : Yvan Le Bras, Olivier Collin

Comment booster vos applications SAP Hana avec SQLSCRIPT

TerrOïko : JEU en collaboration avec la SEEM

SysFera. Benjamin Depardon

Qui sont les enseignants?

Programmation parallèle et distribuée (Master 1 Info )

Chapitre 3. Les distributions à deux variables

Montréal, 24 mars David Levine Président et chef de la direction DL Strategic Consulting. DL Consulting Strategies in Healthcare

Faculté des Sciences d ORSAY

A la découverte du Traitement. des signaux audio METISS. Inria Rennes - Bretagne Atlantique

INF6304 Interfaces Intelligentes

Master 2 Recherche Biologie Géosciences Agroressources Environnement Parcours Biodiversité Écologie Évolution Dounia SALEH

Possibilités offertes après la L2?

Revenu agricole 2013 : une année délicate pour les productions céréalières

Plateforme Transgenèse/Zootechnie/Exploration Fonctionnelle IBiSA. «Anexplo» Service Transgenèse. Catalogue des prestations

des banques pour la recherche

3: Clonage d un gène dans un plasmide

Les Maladies Tropicales, la Société de Pathologie Exotique. et l Institut Pasteur

Soutien pour la formation à la recherche translationnelle en cancérologie

Résolvez vos problèmes d énergie dédiée à l informatique

CONSERVATION DU PATRIMOINE VIVANT DU MARAIS POITEVIN ENJEUX ET PERSPECTIVES. CREGENE: 2 rue de l église COULON cregene@gmail.

Stages ISOFT : UNE SOCIETE INNOVANTE. Contact : Mme Lapedra, stage@isoft.fr

Panorama des solutions analytiques existantes

Programme "Conception et simulation" COSINUS Edition Projet

Conférence ALINE GRENIER, AGR. ET PIERRE MASSIE PROGRAMME D APPRENTISSAGE EN MILIEU DE TRAVAIL (PAMT)

Liste des matières enseignées

Organisation du parcours M2 IR Les unités d enseignements (UE) affichées dans la partie tronc commun sont toutes obligatoires, ainsi que le stage et

MÉTHODOLOGIE PROJET SYSTÈME D INFORMATION DÉCISIONNEL BI - BUSINESS INTELLIGENCE. En résumé :

Baromètre Santé & Société - Europ Assistance / CSA 2013 : 7 ème vague du baromètre. 15 octobre 2013

Gestion des risques de prix et de revenu en production porcine : diversité et intérêt des programmes canadiens

Revue des Marchés. Charles Gagné

Transcription:

Gènes Diffusion - EPIC 2010 1. Contexte. 2. Notion de génétique animale. 3. Profil de l équipe plateforme. 4. Type et gestion des données biologiques. 5. Environnement Matériel et Logiciel. 6. Analyses et applications en animal. 7. Gestion des données de grandes dimensions.

La société Gènes Diffusion Un groupe coopératif international. Création, production et diffusion de la génétique animale. Reproduction assistée dans 4 espèces : Bovins Porcins Lapins Equins

USA Minesota Gènes Diffusion - international Madison 310 places Madison EUROPE CHINE Wisconsin Michigan Ommen Iowa Indianapolis 100 places Illinois Indiana Ohio Ostende Pologne Beijing Pologne 150 places Bureau Slovaquie 3 places Génisses Porcs Taureaux Roumanie 3 places Tchéquie 15 places Lleida 120 places Lleida Hongrie 20 places

Notions de génétique animale D une génération à l autre : sans aucune sélection. Pas d évolution génétique.

Notions de génétique animale Représentation d une étape de sélection. Evolution génétique sur les descendants.

Notions de génétique animale Aide à la sélection : AVANT L ADN : Sélection avec les mesures phénotypiques des animaux. AVEC l ADN : Sélection grâce à la génétique des animaux (avec parfois validation avec les données phénotypiques). Objectifs : Mettre à la disposition des filières un type d animaux adaptés à leurs besoins en exploitant des différences d origines génétiques. Moyens : Développement d outils et de techniques susceptibles d entraîner un progrès génétique. La plateforme génomique de Gènes Diffusion.

L équipe de la plateforme génomique 1 Manager 1 ingénieur en génétique animale (+1 doctorant) 1 ingénieur biomoléculaire 1 ingénieur en bioinformatique (+ 1 doctorant) 1 technicien de laboratoire 1 consultant en statistique et génétique quantitative Laboratoire transcriptomique et génomique appliquée

Les données animales : les phénotypes Nous possédons de grandes bases de données contenant : des informations mesurées sur nos animaux (les traits) : mesure de la production de lait pour les vaches poids des animaux, taille des jambons des informations sur la généalogie de ces animaux.

Les données génomiques Rappel : La génomique c est la discipline qui étudie les génomes (ensemble du matériel génétique d un individu ou d une espèce). Point de départ : Le séquençage du génome bovin et porcin. A G T C

Les données génomiques Le génotypage : c est une application du séquençage. Cette technologie est utilisable grâce à l augmentation spectaculaire du nombre de marqueurs disponibles. A A T T G G C C T T A C

Les données génomiques Dans notre laboratoire : utilisation des puces porcines 62 000 marqueurs et des puces bovines 54000 marqueurs.

Les données génomiques A quoi cela ressemble informatiquement?

L objectif général ANIMAUX (avec Généalogie) GENOTYPES Analyse (QTL mapping, sélection génomique ) RESULTS

Environnement matériel et logiciel Le minimum pour la gestion de fichiers génotypes et phénotypes : Un logiciel pour la gestion des échantillons biologiques LIMS : laboratory information management system. Sauvegarde/Archivage Des données : 2 serveurs à l IPL et à Gènes Diffusion.

Environnement logiciel RESULTATS GENOTYPES INDIVIDUS AVEC MESURES PHENOTYPIQUES PLINK Perl Formatage des données pour l analyse Contrôle Qualité des échantillons et des marqueurs (MAF, HWE ) ENVIRONNEMENT BIOINFORMATIQUE Construction du/des score(s) : Correction phénotypique (prise en compte de l âge, du sexe, du centre d appartenance) Environnement logiciel s fonctionnel : Construction d haplotypes Analyse QTL Déploiement sur architecture parallèle Résultats et rapport graphique

L analyse et l application en animal

La recherche de QTL QTL : Quantitative Trait Locus. Locus, une région du génome ne correspond pas forcément à un seul gène, peut impliquer plusieurs gènes. Les polymorphismes (tels que les SNPs) sur une région QTL sont une des causes de variation phénotypiques d un trait quantitatif.

Les objectives d une analyse QTL 1. Identifier des régions du génome contenant des QTL. 2. Estimer les effets de ce QTL sur notre trait : Quantifier en quoi la variation du trait est causée par cette region spécifique. Quel allèle de notre SNPs est associé avec un effet favorable? 3. Utilisation du QTL et des informations génétiques pour assigner des scores d index à nos animaux.

Utilisation des QTLs L ensemble des QTLs pour un trait donné (exemple : longévité,vitalités à la naissance ) est utilisé pour évaluer génétiquement nos animaux. Le modèle génétique se décompose comme tel : Gi : Ui : Hij1 : Hij2 : la valeur génétique. la composante polygénique : les gènes non suivis par nos marqueurs. l effet du QTLs paternels. l effet de QTLs maternels.

La sélection génomique (sg) Une évolution par rapport à l analyse QTLs. Utilisation, de façon optimale, les dernières technologies de génotypages (puce à haute-densité de marqueurs). Prédire la valeur génétique d un animal à partir de l ensemble des informations de son génome : à la naissance sur un embryon. Pour simplifier, on part du postulat de base que chaque marqueur est un QTL, et on calcule les effets de chaque marqueur pour obtenir la valeur génétique de l animal.

La sg : principe de base Publiée par Meuwissen et Goddard (2001, Genetics 157:1819). A partir d une population de référence P + P : quelques milliers d animaux avec génotypes (ex : puce 54000 à 800000) et phénotypes Grâce à une partie de P et P, on établit une équation de prédiction des phénotypes à partir des marqueurs On passe à une étape de validation de l équation sur P. On utilise cette équation pour obtenir les scores d index génomique de candidats C à la sélection par exemple à la naissance! P P C

Impact sur la diversité Il faut savoir que la SG peut être bien ou mal utilisée Impact sur la diversité a priori favorable : Minimisation du poids de l information familiale, minimisation de la diffusion des reproducteurs dit «d élite». Par conséquent : on obtient un grand nombre de reproducteurs «efficaces». On pourrait arriver à un «turn-over» rapides des taureaux (au bout d 1 an? De 10 000 doses produites?).

Grande dimension Les puces contiennent l information de 54000 marqueurs mais la nouvelle puce bovine sortie en septembre comprend 800 000 marqueurs. La sélection génomique nécessite une population de référence de plusieurs milliers d animaux (de 4000 à 8000 actuellement). On veut être capable d étudier d autres types d intéractions : Epistasie (comprendre les interactions entre gènes) Epigénétique (comprendre les régulations de l expression des gènes).

Grande dimension Nécessité d adaptation matérielle et logicielle face à ces masses de données. Il devient aujourd hui difficile de faire tourner des analyses marqueurs par marqueurs (temps de calcul +++ ).

Adaptation matérielle Plusieurs solutions existent : utilisation de Cluster de calcul utilisation de grille de calcul. Il est nécessaire d adapter les logiciels pour le déploiement sur ce type d architecture (Parallélisation ). Des solutions plus exploratoires : le GPU.

Adaptation logicielle & méthodologique Les approches Bayésiennes : Bayesian mapping : Chaine de Markov, stochastic search variable selection, shrinkage analysis Combiner méthodologies statistiques et algorithmes d optimisations.

Conclusion D énormes progrès techniques ces dernières années. Les enjeux : La bio-informatique, la bio-statistique et le développement de méthodologies nouvelles : pour gérer et valoriser la masse de données générées. Au niveau des éleveurs : La récolte des phénotypes est un point critique : toujours nécessaires pour mesurer l effet des marqueurs : les phénotypes doivent être définis précisément.

Merci de votre attention