Cartographie génétique par analyse de liaison

Documents pareils
Première partie. Introduction Générale

Gènes Diffusion - EPIC 2010

Chapitre 6 Test de comparaison de pourcentages χ². José LABARERE

Analyse de la variance Comparaison de plusieurs moyennes

Biostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke

Tests paramétriques de comparaison de 2 moyennes Exercices commentés José LABARERE

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

TESTS D HYPOTHÈSE FONDÉS SUR LE χ².

Chapitre 3 : Principe des tests statistiques d hypothèse. José LABARERE

Cours (7) de statistiques à distance, élaboré par Zarrouk Fayçal, ISSEP Ksar-Said, LES STATISTIQUES INFERENTIELLES

FORMULAIRE DE STATISTIQUES

La problématique des tests. Cours V. 7 mars Comment quantifier la performance d un test? Hypothèses simples et composites

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

Etude, par simulations, de l intérêt d une sélection génomique dans une population porcine de type mâle

CHAPITRE 3 LA SYNTHESE DES PROTEINES

GénoToul 2010, Hôtel de Région Midi Pyrénées, Toulouse, 10 décembre 2010

IV. La ressemblance entre apparentés

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

DIOGENE. Un logiciel de Génétique & Amélioration des Plantes

Systèmes de transmission

Introduction à l approche bootstrap

Tests de comparaison de moyennes. Dr Sahar BAYAT MASTER 1 année UE «Introduction à la biostatistique»

Principe d un test statistique

MABioVis. Bio-informatique et la

Une variable binaire prédictrice (VI) et une variable binaire observée (VD) (Comparaison de pourcentages sur 2 groupes indépendants)

Probabilités III Introduction à l évaluation d options

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Biostatistiques : Petits effectifs

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Introduction au Data-Mining

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Evaluation de cépages résistants ou tolérants aux principales maladies cryptogamiques de la vigne

Master de Bioinformatique et Biologie des Systèmes Toulouse Responsable : Pr. Gwennaele Fichant

Soutenance de stage Laboratoire des Signaux et Systèmes

Optimisation du rééchantillonnage dans un logiciel d Amélioration des Plantes

LEÇON N 7 : Schéma de Bernoulli et loi binomiale. Exemples.

Les débuts de la génétique

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Génétique et génomique Pierre Martin

Bases de données des mutations

IFT3245. Simulation et modèles

Cours de méthodes de scoring

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

VI. Tests non paramétriques sur un échantillon

Modélisation et étude d un système de trading directionnel diversifié sur 28 marchés à terme

Feuille d exercices 2 : Espaces probabilisés

Exercices de génétique classique partie II

TESTS PORTMANTEAU D ADÉQUATION DE MODÈLES ARMA FAIBLES : UNE APPROCHE BASÉE SUR L AUTO-NORMALISATION

Une application des algorithmes génétiques à l ordonnancement d atelier

1 Définition de la non stationnarité

TD1 Signaux, énergie et puissance, signaux aléatoires

TABLE DES MATIERES. C Exercices complémentaires 42

MODELE A CORRECTION D ERREUR ET APPLICATIONS

Examen de Logiciels Statistiques

Formations EViews FORMATIONS GENERALES INTRODUCTIVES INTRO : INTRODUCTION A LA PRATIQUE DE L ECONOMETRIE AVEC EVIEWS

Probabilité. Table des matières. 1 Loi de probabilité Conditions préalables Définitions Loi équirépartie...

a. La masse de Jeans b. Le support des nuages moléculaires -Séquence Principale (PMS)

Tests non-paramétriques de non-effet et d adéquation pour des covariables fonctionnelles

Quantification Scalaire et Prédictive

Introduction à la statistique non paramétrique

Tests du χ 2. on accepte H 0 bonne décision erreur de seconde espèce on rejette H 0 erreur de première espèce bonne décision

CALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING

Economie de l incertain et de l information Partie 1 : Décision en incertain probabilisé Chapitre 1 : Introduction à l incertitude et théorie de

Séquence 6. Mais ces espèces pour autant ne sont pas identiques et parfois d ailleurs ne se ressemblent pas vraiment.

Relation entre deux variables : estimation de la corrélation linéaire

Estimation et tests statistiques, TD 5. Solutions

PROBABILITES ET STATISTIQUE I&II

Bureau : 238 Tel : dominique.muller@upmf-grenoble.fr

Statistiques Décisionnelles L3 Sciences Economiques & Gestion Faculté d économie, gestion & AES Université Montesquieu - Bordeaux

TP1 Méthodes de Monte Carlo et techniques de réduction de variance, application au pricing d options

Univers Vivant Révision. Notions STE

De la mesure à l analyse des risques

Hémochromatose génétique non liée à HFE-1 : quand et comment la rechercher? Cécilia Landman 11 décembre 2010

Méthodes de Simulation

Calculs Computional fluide dynamiques (CFD) des serres à membrane de Van der Heide

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

Réseau sur. Médicaments. l Innocuité et l Efficacité des. Document d orientation pour la présentation de requêtes au RIEM

Fig.1. Structure d un AGQ

Statistiques et traitement des données

Modélisation et simulation

Principes généraux de la modélisation de la dispersion atmosphérique

Dr E. CHEVRET UE Aperçu général sur l architecture et les fonctions cellulaires

Value at Risk. CNAM GFN 206 Gestion d actifs et des risques. Grégory Taillard. 27 février & 13 mars 20061

Accélération du vent solaire: revue des modèles exosphériques

Table des matières. I Mise à niveau 11. Préface

Application sur le Dispositif en Blocs Complètement Randomisés

LISACode. Un simulateur opérationnel pour LISA. Antoine PETITEAU LISAFrance - le 16 mai 2006

Présentation du dispositif collectif français d évaluation génétique porcin pour les caractères de production et de reproduction

Modélisation aléatoire en fiabilité des logiciels

Principes d implémentation des métaheuristiques

Probabilités. Rappel : trois exemples. Exemple 2 : On dispose d un dé truqué. On sait que : p(1) = p(2) =1/6 ; p(3) = 1/3 p(4) = p(5) =1/12

Equation LIDAR : exp 2 Equation RADAR :

Modélisation des risques

L approche de régression par discontinuité. Thomas Lemieux, UBC Atelier de formation du Congrès de l ASDEQ Le 18 mai 2011

Théorie et Codage de l Information (IF01) exercices Paul Honeine Université de technologie de Troyes France

TESTS D'HYPOTHESES Etude d'un exemple

Modèles et simulations informatiques des problèmes de coopération entre agents

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

Simulation de variables aléatoires

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

Transcription:

Cartographie génétique par analyse de liaison INRA, Brigitte Mangin Septembre 2016

1 Introduction 2 Modélisation Les phénotypes continus 3 Un QTL Le test du rapport de vraisemblance Quel seuil pour la détection d un QTL? 4 Pour aller plus loin D autres modélisations Pedigrees complexes Les logiciels

Introduction Qu est ce que l analyse de liaison? = C est l étude de la transmission allélique parmi des individus apparentés Que recherche-t on? = Des gènes causaux responsables d une maladie, caractère binaire ou = Des QTLs, c est-à-dire des loci du génome qui expliquent la variabilité d un caractère quantitatif.

Que cherche t-on à faire? = lier le caractère binaire ou quantitatif (phénotype) à un endroit du génome (génotype au gène ou au QTL)

Comment s y prend-t on? = suit la transmission allélique à l aide de marqueurs moléculaires

Modélisation La modélisation pour quoi faire? = décrire la relation entre le phénotype et le génotype En terme de probabilité pénétrance, phénotype binaire f dd = Prob( malade dd ) f Dd = Prob( malade Dd ) f DD = Prob( malade DD ) En terme de densité de probabilité L, phénotype continu Y f qq = L(Y qq) f Qq = L(Y Qq) f QQ = L(Y QQ)

Les phénotypes continus Modèle QTL simple dans un pedigree simple Nous allons nous restreindre à une modélisation simple qui postule la présence d un unique QTL à une descendance simple, le back-cross dans le cadre de la génétique mendélienne back-cross : 1/2 qq, 1/2 Qq ou 1/2 qq, 1/2 QQ

Les phénotypes continus Back-cross ou rétrocroisement La distribution du phénotype (courbe noire) et sont Gaussiennes est un mélange 1/2:1/2 entre les distributions du phénotype pour chaque génotype les distributions du phénotype pour chaque génotype ont la même variance, mais pas la même moyenne

Les phénotypes continus Données n observations quantitatives Y n n = 1,..., N M marqueurs M m n m = 1,..., M Paramètres du modèle variance résiduelle µ qq effet moyen du génotype qq au QTL µ QQ effet moyen du génotype QQ au QTL σ 2 Modèle de mélange { µqq + ɛ Y n = n si n a le génotype qq au QTL µ QQ + ɛ n si n a le génotype QQ au QTL

Les phénotypes continus Les paramètres génétiques Back-cross fond génétique effet de substitution allélique ou µ = µ QQ+µ Qq 2 α = µ QQ µ Qq α = µ qq µ Qq

Les phénotypes continus et les marqueurs à quoi y servent? à connaître le génotype au QTL lorsque le QTL et le marqueur sont au même locus à inférer le génotype au QTL, pseudo-marqueur en calculant la probabilité que l individu n soit de génotype qq ou QQ sachant ses marqueurs et la carte génétique ou à imputer le génotype au QTL, pseudo-marquage en tirant aléatoirement le génotype au QTL avec les probabilités que l individu n soit de génotype qq ou QQ sachant ses marqueurs et la carte génétique

Comment détecter un QTL? Détecter un QTL c est : prendre un risque et affirmer qu il y a un QTL c est donc une procédure de test Quelle est l hypothèse nulle? Quelle est l hypothèse alternative? Quelle statistique de test? le localiser sur le génome en répétant le test tout le long du génome c est donc une procédure de tests multiples Quel est le seuil de rejet de l hypothèse nulle? estimer les paramètres du modèle

Tester l effet du QTL Hypothèse nulle H 0 = { tous les génotypes au QTL ont la même moyenne } Hypothèse alternative H 1 = { l un au moins des génotypes au QTL a une moyenne différente des autres } Pour le Back-cross H 0 = {µ QQ = µ Qq } versus H 1 = {µ QQ µ Qq } ou H 0 = {α = 0} versus H 1 = {α 0}

Le cas idéal : un marqueur sur le locus du QTL Modèle linéaire : comparaison de moyennes ou ANOVA g = 1 Y 1k = µ + α 2 + ɛ 1k Y n g = 2 Y 2k = µ α 2 + ɛ 2k Source de ddl SCE CM= SCE ddl variation F QTL/marqueur 1 SCE M = g ng(yg. Y..)2 CM M CM M CM R résiduelle N 1 SCE R = gk (Y gk Y g.) 2 CM R

Le cas non idéal Se contenter de faire la comparaison de moyennes entre les et les c est perdre de la puissance. Les marqueurs flanquants le locus QTL vont être utilisés pour inférer le génotype aux QTL = c est la méthode appelée l interval mapping

Le test du rapport de vraisemblance l interval mapping au locus l Le test du rapport du maximum de vraisemblance au locus l RV(l) = maximum de la vraisemblance si α = 0 maximum de la vraisemblance si un QTL est en l Lander et Botstein, Genetics, 1989 La courbe du LOD C est la courbe obtenue en faisant varié l le long de la carte génétique et en transformant RV(l) par la fonction log 10 () Le LOD test C est le locus où cette courbe est maximum

Le test du rapport de vraisemblance Un exemple de courbe de LOD Resistance au fletrissement en F2 chez la tomate LOD 2 4 6 8 10 chromosome 6 0.0 0.2 0.4 0.6 distance en Morgan

Quel seuil pour la détection d un QTL? Seuil de rejet du LOD test Loi asymptotique sous H 0 ={pas de QTL en l} Au locus l, pour le back-cross, le LOD(l)/0.217 suit une loi de χ 2 (1) donc si LOD(l) > 3.84 0.217 on rejette l absence de QTL en l au risque 5% MAIS on fait un test à chaque locus l... la question difficile des tests multiples non indépendants Le seuil dépend du risque global choisi du nombre de groupes de liaison du nombre de marqueurs et de leur localisation du type de descendance

Quel seuil pour la détection d un QTL? = formule analytique (étude asymptotique) Rebaï et al, Genetics,1994 = simulation par Monte-Carlo sous H 0 par permutation des Y n Churchill et Doerge, Genetics, 1994

Quel seuil pour la détection d un QTL? Seuil pour le LOD test par simulations longueur du groupe de liaison : 1 M intervalle entre les marqueurs type risque 20 cm 10 cm 1 cm BC 5 % 1.5 1.6 1.8 BC 1 % 2.2 2.3 2.6 F 2 5 % 2.2 2.3 2.6 F 2 1 % 2.9 3.1 3.4 longueur du groupe de liaison : 2 M BC 5 % 1.8 1.9 2.1 BC 1 % 2.5 2.6 3.0 F 2 5 % 2.4 2.6 3.0 F 2 1% 3.2 3.4 3.8

Quel seuil pour la détection d un QTL? Principe des permutations en permutant les phénotypes, on casse la corrélation entre génotype et phénotype, on crée donc un échantillon sous l hypothèse nulle

D autres modélisations Plusieurs QTL Effet du QTL aléatoire (animaux) Effet polygénique aléatoire (animaux) ou effet fond génétique fixe (plantes) Effet d épistasie (interaction) entre QTLs Effet d épistasie (interaction) entre un QTL et le fond génétique QTL en pléiotropie...

Pedigrees complexes Diallèle de lignées homozygotes

Pedigrees complexes Familles de demi-frères

Pedigrees complexes Pedigree humain

Les logiciels Pour les QTL l ancêtre : MAPMAKER/QTL le clé en main : QTL carthographer le payant : mapqtl le futur : R/qtl les spécialisés pour les pedigrees et modèles animaux : QTLMap pour plusieurs descendances : MCQTL