L ANALYSE DE DONNÉES AU SERVICE DES UTILISATEURS. Lorène Allano 16 Avril 2013



Documents pareils
Master de Bioinformatique et Biologie des Systèmes Toulouse Responsable : Pr. Gwennaele Fichant

ProxiLens : Exploration interactive de données multidimensionnelles à partir de leur projection

MASTER (LMD) MANAGEMENT DE PROJET ET INNOVATION EN BIOTECHNOLOGIE

Mise en place d une plateforme de gestion de matériels biologiques : quels avantages pour les chercheurs?

Environmental Research and Innovation ( ERIN )

Intérêt diagnostic du dosage de la CRP et de la leucocyte-estérase dans le liquide articulaire d une prothèse de genou infectée

Biomarqueurs en Cancérologie

Les Entrepôts de Données

MABioVis. Bio-informatique et la

Big Data: développement, rôle des ARS?? Laurent Tréluyer, ARS Ile de France Alain Livartowski Institut Curie Paris 01/12/2014

Ingénieur c est bon pour la Santé? 10 ans de X-Biotech FM, 17 mars 2014

Sujets présentés par le Professeur Olivier CUSSENOT

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours

Informatique. epims : un LIMS pour la gestion des données de spectrométrie de masse TECHNOLOGIE APPLIQUÉE

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

Introduction au datamining

Extraction d informations stratégiques par Analyse en Composantes Principales

Introduction au Data-Mining

DECLARATION DES PERFORMANCES N 1

Les plateformes de génétique

Système de gestion des données RAPIDComm 3.0 : la solution avancée de connectivité et de communication en biologie délocalisée

«Innovation Intelligence» La valorisation des données massives au service des partenariats R&D. Expernova Université d été GFII

UviLight XTW Spectrophotomètre UV-Vis

Pentaho Business Analytics Intégrer > Explorer > Prévoir

Chapitre 4 - Spectroscopie rotationnelle

Agenda de la présentation

ASA-Advanced Solutions Accelerator. Solution pour la gestion des données des laboratoires et des plateformes de service

Entrepôt de données 1. Introduction

AXES DE RECHERCHE - DOMAINE D'INTERET MAJEUR LOGICIELS ET SYSTEMES COMPLEXES

Apprentissage Automatique

La classification automatique de données quantitatives

2D-Differential Differential Gel Electrophoresis & Applications en neurosciences

Dr E. CHEVRET UE Aperçu général sur l architecture et les fonctions cellulaires

Votre Infrastructure est-elle? Business Intelligence. Améliorer la capacité d analyse et de décision de vos équipes

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données

Accélérer l agilité de votre site de e-commerce. Cas client

En route vers le succès avec une solution de BI intuitive destinée aux entreprises de taille moyenne

Informatique Médicale & Ingénierie des Connaissances Pour la e-santé

Master Informatique Aix-Marseille Université

Les attentes du marché

Sujet 1 : Diagnostique du Syndrome de l apnée du sommeil par des techniques d analyse discriminante.

Cycle de vie, processus de gestion

Filière Fouille de Données et Décisionnel FDD (Data Mining) Pierre Morizet-Mahoudeaux

Protéomique Séance 1 Introduction aux données de protéomique et aux outils de recherche

Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining.

Gènes Diffusion - EPIC 2010

Quel apport de l imagerie dans les traitements anti-angiogéniques?

Le partenaire de votre innovation technologique

Génétique et génomique Pierre Martin

Simulation d'un examen anthropomorphique en imagerie TEMP à l iode 131 par simulation Monte Carlo GATE

Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise.

TRAVAUX DE RECHERCHE DANS LE

BI = Business Intelligence Master Data-Science

Comprendre le Big data grâce à la visualisation

évaluation des risques professionnels

Laboratoire d Informatique, de Traitement de l Information et des Systèmes EA établissements T. Paquet D. Olivier T. Lecroq A.

OPEN DATA : CHALLENGES ET PERSPECTIVES D ENTREPOSAGE

Intelligence Inventive & Mapping des réseaux de Recherche. Expernova & Active Innovation Management GFII 5 Mars 2015

Panorama des problématiques de traitement de l information. Larbi Aït Hennani, Fatma Bouali, Vincent Vandewalle

BASE. Vous avez alors accès à un ensemble de fonctionnalités explicitées ci-dessous :

Formation continue. Ensae-Ensai Formation Continue (Cepe)

SUPERVISION : Smart Condition Monitoring. Brand of ACOEM

Marquage CE et dispositifs médicaux

DOSSIER SOLUTION CA ERwin Modeling. Comment gérer la complexité des données et améliorer l agilité métier?

La fonction Conformité dans l assurance

Pilot4IT Tableaux de Bord Agréger et consolider l ensemble de vos indicateurs dans un même portail.

Spécificités, Applications et Outils

Le Data WareHouse à l INAMI Exploitation des données

CRM Service. Exemples de secteurs concernés. Fonctionnalités clés. Gestion de l activité quotidienne. Gestion complète de la force de vente

Jedox rafraîchit les rapports du fabricant de boissons MBG

Mass Spec/tacular. performance, productivité et fiabilité. Systèmes CPL/SM Agilent série Our measure is your success.

BI2B est un cabinet de conseil expert en Corporate Performance Management QUI SOMMES-NOUS?

Dan Istrate. Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier

Big Data et Graphes : Quelques pistes de recherche

July 1, Stéphan Clémençon (Télécom ParisTech) Mastère Big Data July 1, / 15

Item 169 : Évaluation thérapeutique et niveau de preuve

Masses de données. 1. Introduction 2. Problématiques 3. Socle de formation (non présenté) 4. Liens avec Formation INSA

Analyse de grandes bases de données en santé

Les sciences de l ingénieur appliquées à la prise en charge du

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

Nous avons augmenté de manière significative notre productivité avec le même effectif

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Résumés des projets de GMM5-2014/2015

A N A L Y S E U R E N L I G N E D A G V D E S B I C A R B O N A T E S D E L A L C A L I N I T E

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

Chapitre 9 : Informatique décisionnelle

Bases de données Outils de gestion

Didier MOUNIEN Samantha MOINEAUX

Epidémiologie appliquée aux sciences vétérinaires DES DAOA DES - DEA

Foscolo (1), J Felblinger (2), S Bracard (1) CHU Hôpital central, service de neuroradiologie, Nancy (1) CHU BRABOIS, Centre d investigation clinique

La biologie médicale en France : présent et avenir. Académie Nationale de Pharmacie Mercredi 4 Février 2015

Annexe 6 et 7 Du Contrat de Performance Medicen Paris Region. Liste des engagements du Pôle avec d autres clusters français ou étrangers

Intérêt du découpage en sous-bandes pour l analyse spectrale

Modélisation Multidimensionnelle des Tableaux de Bord Prospectifs

Sciences Humaines et Sociales. Informatique et applications. VIGNERON Vincent STIC Traitement du signal et des images

Hopital: Optimisation, Simulation et évitement des Tensions. ANR-TECSAN partenaires ( 1 CH, 1 PME ) 900 k - 36 mois

Fiche 19 La couleur des haricots verts et cuisson

Introduction aux bases de données: application en biologie

Stratégie et Vision de SAP pour le secteur Banque- Assurance: Data-Management, BI, Mobilité

Introduction à la B.I. Avec SQL Server 2008

Transcription:

L ANALYSE DE DONNÉES AU SERVICE DES UTILISATEURS Lorène Allano 16 Avril 2013

Question? Expert Aide à la décision Expériences Digitalisation Analyse automatique Visualisation Outils adapté Données numériques Informations interprétables 2

DE LA DONNÉE VERS L INFORMATION Données brutes Volumineuses Massives Hétérogènes Structurées ou non Informations Interprétables Intelligibles Aide à la décision 3

LABORATOIRE ANALYSE DE DONNÉES ET INTELLIGENCE DES SYSTÈMES Compétences Traitement de données brutes Fouilles de données Aide à la décision Intelligence distribuée 60 personnes Applications Industrialisation 4

PLAN 1. Outils d analyse de données pour extraire l information 2. De l analyse de données vers la biologie des systèmes 3. Des outils adaptés aux utilisateurs 5

1. ANALYSE DE DONNÉES POUR EXTRAIRE L INFORMATION

OUTILS D ANALYSE DE DONNÉES POUR EXTRAIRE L INFORMATION Extraction par l utilisateur fouille interactive Extraction automatique modélisation 7

FOUILLE DE DONNÉES INTERACTIVE

FOUILLE INTERACTIVE Projection De données multidimensionnelles à l écran Exemples ACP (linéaire) ACC (non linéaire) Distorsions Déchirures Recollements Objectif: Visualisation des distances multidimensionnelles 9

PROXIVIZ 10

PROXIVIZ 11

PROXILENS 12

PROXILENS 13

CLASSIFICATION SEMI-AUTOMATIQUE 14

CLASSIFICATION SEMI-AUTOMATIQUE 15

CONCLUSIONS Visualisation des données Outils interactifs et intuitifs de fouille des données pour l utilisateur Classification semi-automatique (regroupement) 16

MODÉLISATION

MODÉLISATION Modélisation non supervisée Sans connaissance a priori sur la sortie associée aux données Ex clustering Profil de patient, stratification de population Modélisation supervisée Avec une base de données dont la sortie est connue Ex: classification Recherche de marqueurs de réponse/ non réponse 18

CONCLUSIONS Outils de modélisation Extraction d information intelligible par l utilisateur À partir de données hétérogènes et massives Selon les besoins et les données disponibles 19

2. DE L ANALYSE DE DONNÉES VERS LA BIOLOGIE DES SYSTÈMES

DE L ANALYSE DE DONNÉES VERS LA BIOLOGIE DES SYSTÈMES Analyses de données numériques issues d échantillons biologiques De l intégration des données vers la compréhension de mécanismes 21

DONNÉES PROTÉOMIQUES POUR LE DIAGNOSTIC IN VITRO

Staphylococcus aureus Nécessité d un diagnostic : Sûr Rapide Informatif Peu couteux 23

Hémoculture Extraction des protéines Protéomique par spectrométrie de masse Analyse des données et visualisation 24

OUTILS D ANALYSE DE DONNÉES Spectres 2D Extraction de pics Comparaison à une base de référence (1,97): STAAU-I_Y1195_NLVSEVTDAVEK_1077 (652.341 / 1076.55) Analyse des peptides après fragmentation Intensity 0 20000 40000 60000 (1,98): STAAU-I_Y1195_NLVSEVTDAVEK_890 (652.341 / 890.447) Detected - A = 3.21e+05 - Fwhm = 1.05 Intensity 0 20000 40000 60000 80000 100000 120000 Intensity (1,99): STAAU-I_Y1195_NLVSEVTDAVEK_977 (652.341 / 977.479) Detected - A = 1.78e+05 - Fwhm = 1.33 0 50000 100000 150000 Detected - A = 8.67e+05 - Fwhm = 1.09 18.0 18.5 19.0 19.5 20.0 20.5 Time (min) 18.0 18.5 19.0 19.5 20.0 20.5 Time (min) Prédiction de résistance, typage, virulence 25

CONCLUSIONS Chaine de traitement de la donnée brute à l utilisateur Autres sources Metabolomique par spectrométrie de masse Spectroscopie Raman sur cellule ou tissu Imagerie hyperspectrale Des données et des analyses en lien avec les équipes expérimentales 26

DES DONNÉES AUX MÉCANISMES

DE L INTÉGRATION DES DONNÉES VERS LA COMPRÉHENSION DE MÉCANISMES Intégration de donnés multi-omics Métabolomique Protéomique Transcriptomique Génomique Modélisation pharmacocinétique Xp Modèles à effets-mixtes, modèles parents-métabolites Personnalisation du traitement grâce à la carte individuelle métabolique Dose Xa k a k 21 k 12 k m X Xm k e k em Interface avec la biologie des systèmes Lien vers des bases de connaissances 28

3. DES OUTILS ADAPTÉS AUX UTILISATEURS

SUIVI DE PATIENT, CANCER UROLOGIQUE Recommandation de traitement selon: Données issues de différents services Suivi dans le temps Profile du patient 30

SUIVI DE PATIENT, CANCER UROLOGIQUE Des données hétérogènes et multi-sources Interface d aide à la décision Intégration de l expertise 31

UNE COLLABORATION ÉTROITE POUR RÉPONDRE AUX BESOINS APHP Pr. Olivier Cussenot (hôpital Tenon, Paris) Un outils dédié pour: Centraliser les informations d un patient Centraliser les différentes sources Suivi dans le temps Outils de comparaison visuelle avec une base de patients de référence Génération automatique de rapport Utilisé au quotidien par Pr. Cussenot 32

CONCLUSIONS

CONCLUSIONS Des études en lien avec les experts Les utilisateurs pour la définition des besoins Les équipes instrumentales pour l interface aux données Les utilisateurs finaux pour des outils adaptés Des méthodes innovantes d analyse de données De la donnée brute à l aide à la décision Pour les données massives et hétérogènes Intégration de la donnée Des outils au service des utilisateurs Interactifs Interprétables Utilisables 34

Questions? Lorene.allano@cea.fr