Intégration de données multiéchelles pour caractériser la qualité des fruits Workshop IN-OVIVE - PAFIA 02/07/2013 Julie Bourbeillon et François Vallée
Contexte La pomme 1er fruit dans le panier de la ménagère France = 3ème producteur européen Pays de Loire = 2ème région de production en France Critères De sélection : la qualité du fruit Pour le consommateur : la texture Projet AI-Fruit Approches intégratives du déterminisme structural, génétique et écophysiologique de la qualité des fruits Intégration de données issues de méthodes expérimentales variées 2
Évaluation de la qualité du fruit Mesures physiques Tests de dégustation Croquant Fermeté Jutosité Fondant Grains Fibres Farinosité Acide / Sucre Acoustique Etc. Histologie Biochimie Spectres NIRs Sonométrie Pénétrométrie 3
Différentes échelles de mesure Développement arbre / fruit Floraison 100j après Floraison Récolte 2 mois de conservation 4 mois de conservation 4
Différentes échelles de mesure Développement arbre / fruit Floraison 100j après Floraison Germination Récolte Plantule 2 mois de conservation Greffe Jeune arbre 4 mois de conservation Arbre adulte 5
Différentes échelles de mesure Développement arbre / fruit Divers organes Floraison 100j après Floraison Récolte 2 mois de conservation 4 mois de conservation + répétions diverses années Germination Plantule Greffe Jeune arbre Arbre adulte 6
Différentes échelles de mesure «Physique» Analyse sensorielle 7
Différentes échelles de mesure «Physique» Fruit Mesures biochimiques 8
Différentes échelles de mesure «Physique» Branche Architecture Fruit 9
Différentes échelles de mesure «Physique» Branche Génotype Arbre Fruit 10
Différentes échelles de mesure «Physique» Branche Conduite culturale Arbre Fruit Parcelle 11
Différentes échelles de mesure «Physique» Branche Région / Pays Arbre Fruit Parcelle Climat 12
Différentes échelles de mesure «Physique» Branche Région / Pays Arbre Fruit Parcelle 13
Différentes échelles de mesure «Physique» Branche Région / Pays Arbre Fruit Parcelle 14
Différentes échelles de mesure «Physique» Branche Région / Pays Arbre Fruit Parcelle Lot de fruits 15
Différentes échelles de mesure «Physique» Branche Région / Pays Arbre Fruit Parcelle Lot de fruits 16
Différentes échelles de mesure «Physique» Branche Région / Pays Des mesures de même nature raccrochées à différents niveaux Arbre Fruit Des «chemins» : Variés Lot de fruits Incomplets Parcelle 17
Problématique Analyse sensorielle Intégration? Traitement statistique conjoint de l'ensemble des données Lot de fruits Mesures biochimiques Arbre Génotype Plusieurs types de mesures Des répétitions biologiques et / ou instrumentales Des données manquantes Plusieurs niveaux d'échelle Plusieurs niveaux possibles pour mise en correspondance des données Plusieurs critères possibles pour mise en correspondance des échantillons Années n, n+1, n+3 18
Intégration de données multi-échelles Principe envisagé Branche Région / Pays Arbre Fruit Parcelle Lot de fruits Mean Dispatch Représentation de connaissances Méthodes d'intégration de données / évaluation de similarité entre échantillons Niveaux d'échelle Association de méthodes d'intégration aux relations entre Workshop IN-OVIVE 02/07/2013 Julie Bourbeillon et François Vallée niveaux d'échelle 19
Intégration de données multi-échelles Principe envisagé Branche Région / Pays Arbre Fruit Parcelle Lot de fruits Documentation des jeux de données Rattachement de chaque jeu de données à un «niveau» selon les différents axes d'échelle (développement, «physique», etc.) Mean Dispatch Représentation de connaissances Méthodes d'intégration de données / évaluation de similarité entre échantillons Niveaux d'échelle Association de méthodes d'intégration aux relations entre Workshop IN-OVIVE 02/07/2013 Julie Bourbeillon et François Vallée niveaux d'échelle 20
Intégration de données multi-échelles Principe envisagé Branche Documentation des jeux de données Région / Pays Rattachement de chaque jeu de données à un «niveau» selon les différents axes d'échelle (développement, «physique», etc.) Arbre Fruit Parcelle Lot de fruits Interrogation Mean Dispatch Représentation de connaissances Données à récupérer Critères de sélection Niveau d'intégration Méthodes d'intégration Query Data : sensory data - biochemistry - genotype Méthodes d'intégration de Selection criteria : year = 2010 données / évaluation de similarité Integration level : tree entre échantillons Integration method : mean - dispactch Niveaux d'échelle Association de méthodes d'intégration aux relations entre Workshop IN-OVIVE 02/07/2013 Julie Bourbeillon et François Vallée niveaux d'échelle 21
Intégration de données multi-échelles Principe envisagé Branche Documentation des jeux de données Région / Pays Rattachement de chaque jeu de données à un «niveau» selon les différents axes d'échelle (développement, «physique», etc.) Arbre Fruit Parcelle Lot de fruits Interrogation Mean Dispatch Représentation de connaissances Données à récupérer Critères de sélection Niveau d'intégration Méthodes d'intégration Query Data : sensory data - biochemistry - genotype Méthodes d'intégration de Selection criteria : year = 2010 données / évaluation de similarité Integration level : tree entre échantillons Integration method : mean - dispactch Niveaux d'échelle Association de méthodes d'intégration aux relations entre Workshop IN-OVIVE 02/07/2013 Julie Bourbeillon et François Vallée niveaux d'échelle 22
Intégration de données multi-échelles Architecture du système Serveur Web BD Chado Méta-données Projets Expérimentations Jeux de données Stockage de fichiers Jeux de données Services Web Traitements Gestion de données Réponse à requêtes Interface Saisie Requête Représentation de connaissances Échelles Méthodes 23
Représentation des connaissances Méthodes d'intégration des données Besoin «Ontologie» «statistique» Description d'un graphe de méthodes Description de l'usage des méthodes (mode de calcul) Existant Hiérarchies de concepts statistiques en lien avec d'autres thèmes Ex : Ontology of Clinical Research Langages de représentation mathématique Ex : OpenMath, OMDoc En cours Étude comparative des formalismes 24
Représentation des connaissances Évaluation de similarité entre échantillons Besoin Pomme A Récolte 2012 Parcelle H Rang 1 Arbre 5 Génotype HIW12 Branche 1 Quartier de Pomme 1 Similarité? Distance? Récolte 2012 Parcelle H Génotype HIW12 Comment réaliser la mise en correspondance? En cours Définition des critères permettant la mise en correspondance Définition d'une évaluation de similarité / distance Questionnement : prise en compte de ces évaluations dans les analyses de données suivantes? 25
Représentation des connaissances Niveaux d'échelle Besoin Description des niveaux auxquels sont Branche Région / Pays faites les mesures Documentation des méthodes d'intégration entre niveaux Arbre Fruit Existant Parcelle Lot de fruits Ontologies «biologie» Ex : GO, Plant Ontology Mais items intéressants épars + manques En cours Construction d'une ontologie au plus proche des besoins Graphe de niveaux d'échelles Relations incluant les méthodes d'intégration 26
Documentation des jeux de données Besoin Méta-données «projet de recherche» Méta-données «expérimentation» Méta-données liées à l'intégration Existant Modèles de base de données + outils Ex : GMOD (Chado) En cours Étude la possibilité d'inclure ce qui est requis pour l'intégration 27
Interrogation Besoin Un formalisme pour décrire des requêtes de sélection et intégration de données Une interface graphique pour construire des requêtes selon le formalisme précédent Existant Travail de thèse (Synthèse d'information) En cours Recherche d'autres approches 28
Conclusion et perspectives Conclusion Problème complexe d'intégration de données sur la qualité des pommes Principe de résolution défini au niveau conceptuel Perspectives Développement des outils correspondants Actuellement uniquement données phénotypiques prise en compte des données génomiques (transcriptomique en particulier) 29
Remerciements Financeur Partenaires Merci de votre attention Des questions?