Big Data et la santé



Documents pareils
Groupe de Discussion Big Data Aperçu des technologies et applications. Stéphane MOUTON

Jean-François Boulicaut & Mohand-Saïd Hacid

Big Data: développement, rôle des ARS?? Laurent Tréluyer, ARS Ile de France Alain Livartowski Institut Curie Paris 01/12/2014

La mise en place du PACS 1 Midi-Pyrénées s inscrit

Webinar EBG Nouvelles perspectives d'exploitation des données clients avec le big data

MODULE 2 : VEILLE & ANALYSE DE DONNÉES

Big data et données géospatiales : Enjeux et défis pour la géomatique. Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique

Informatique Médicale & Ingénierie des Connaissances Pour la e-santé

Le BIG DATA????? Big Buzz? Big Bang? Big Opportunity? Big hype? Big Business? Big Challenge? Big Hacking? Gérard Peliks planche 2

BIG DATA en Sciences et Industries de l Environnement

IBM Software Big Data. Plateforme IBM Big Data

SÉRIE NOUVELLES ARCHITECTURES

Télésurveillance à domicile de patients chroniques et pratiques collaboratives : arrêt sur image vu d un Industriel

Big Data? Big responsabilités! Paul-Olivier Gibert Digital Ethics

NewPoint IT Consulting BIG DATA WHITE PAPER. NewPoint Information Technology Consulting

Big data et sciences du Vivant L'exemple du séquençage haut débit

Le Big Data est-il polluant? BILLET. Big Data, la déferlante des octets VIVANT MATIÈRE SOCIÉTÉS UNIVERS TERRE NUMÉRIQUE TERRE (/TERRE)

Les données massives de Copernicus : vers un nouveau paradigme. Hervé Jeanjean Cnes

Les datas = le fuel du 21ième sicècle

CONFERENCE TECHNOM AIDE IBM

Le BigData, aussi par et pour les PMEs

Protection des données personnelles : Vers un Web personnel sécurisé

Hébergement MMI SEMESTRE 4

Montréal, 24 mars David Levine Président et chef de la direction DL Strategic Consulting. DL Consulting Strategies in Healthcare

La maitrise de vos systèmes d information

accompagner la transformation digitale grâce au Big & Fast Data Orange Business Services Confidentiel 02/10/2014

e-biogenouest CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé

L ORDINATEUR. Les composants. La carte mère. Le processeur. Fréquence

Alphonse Carlier, Intelligence Économique et Knowledge Management, AFNOR Éditions, 2012.

Big Data et Graphes : Quelques pistes de recherche

Il y a tellement de hype autour du big data que Gartner étudie un nouveau modèle ;-) Talend

Gestion de documents. Découvrez HYDMedia. Système de gestion électronique de documents médicaux

WD et le logo WD sont des marques déposées de Western Digital Technologies, Inc, aux États-Unis et dans d'autres pays ; absolutely WD Re, WD Se, WD

Big data* et marketing

Bases de données pour la recherche : quels enjeux et quel rôle pour les patients?

Masses de données. 1. Introduction 2. Problématiques 3. Socle de formation (non présenté) 4. Liens avec Formation INSA

Des Big Data aux Big Brothers Jean- Gabriel Ganascia Equipe ACASA LIP6 Université Pierre and Marie Curie Labex OBVIL PRES Sorbonne Université

NoSQL. Introduction 1/23. I NoSQL : Not Only SQL, ce n est pas du relationnel, et le contexte. I table d associations - Map - de couples (clef,valeur)

DIGITAL MINDS. Chapitre 7, Les médias sociaux. 12 Clés pour Développer votre Business sur le Web WSI. All rights reserved.

20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars ans du SIAD -"Big Data par l'exemple" -Julien DULOUT

Introduction Big Data

Big data : vers une nouvelle science des risques?

Big Data & objets connectés

PROFILAGE : UN DEFI POUR LA PROTECTION DES DONNEES PERSONNELLES Me Alain GROSJEAN Bonn & Schmitt

Fondation PremUp. Mieux naître pour mieux vivre

MapReduce. Malo Jaffré, Pablo Rauzy. 16 avril 2010 ENS. Malo Jaffré, Pablo Rauzy (ENS) MapReduce 16 avril / 15

UNE TECHNOLOGIE LIBÉRATRICE. FLUIDITÉ ET SIMPLICITÉ. Vue for. Cloud Services

Mettre en place de plateformes inter-opérables mutualisées d informations et de services.

Masses de données et calcul : à l IRIT. 8 octobre 2013

Leadership, innovation, réussite L A N O U V E L L E R É F É R E N C E E N M AT I È R E D E T E C H N O L O G I E D E L A S A N T É.

Mise en œuvre de la virtualisation à l IGBMC. Guillaume Seith Remy Fritz

Les enjeux du Big Data Innovation et opportunités de l'internet industriel. Datasio 2013

Big Data. Concept et perspectives : la réalité derrière le "buzz"

Entreprise et Big Data

Le potentiel et les défis du Big Data. Mardi 2 et Mercredi 3 Juillet 2013

Cloud Computing. Veille Technologique

Les participants repartiront de cette formation en ayant une vision claire de la stratégie et de l éventuelle mise en œuvre d un Big Data.

DOSSIER DE PRESSE. Salon de la Santé et de l Autonomie Pavillon 1 Stand L22

TIC. Panorama. L'industrie de l'information et de la communication la première industrie japonaise

SADIR assistance, Prestataire de Santé à Domicile (PSAD)

Culture numérique Cloud computing

25 % EXPERTS PAR AN. + de de 35. près de 50 DE CROISSANCE DE L OPEN SOURCE ANNÉES D EXPERIENCE AU SERVICE DE L OPEN SOURCE

Fouillez facilement dans votre système Big Data. Olivier TAVARD

TRAVAUX DE RECHERCHE DANS LE

Transformez vos données en opportunités. avec Microsoft Big Data

Architectures informatiques dans les nuages

Programmation parallèle et distribuée

Big Data : où en est votre entreprise. Vraiment.

Programmation parallèle et distribuée

Comment ça se passe? Déroulé détaillé. INTRODUCTION / 10 minutes

L utilisation de Drupal dans l entreprise

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

Veille Technologique. Cloud Computing

Enjeux mathématiques et Statistiques du Big Data

Les plateformes de génétique

Des systèmes d information partagés pour des parcours de santé performants en Ile-de-France.

Big Data et Graphes : Quelques pistes de recherche

Chapitre 1. Infrastructures distribuées : cluster, grilles et cloud. Grid and Cloud Computing

PANORAMA DES MENACES ET RISQUES POUR LE SI

Big Data On Line Analytics

Territoires géographiques/numériques

Document réalisé par Khadidjatou BAMBA

Télémédecine, télésanté, esanté. Pr. François KOHLER

FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis

Emergence du Big Data Exemple : Linked Open Data

Entrez dans l ère du Numérique Très Haut Débit

Surmonter les 5 défis opérationnels du Big Data

IGEL : Le «cloud sourcing», un nouveau marché pour les clients légers

Open Data. Enjeux et perspectives dans les télécommunications

Big Data : Risques et contre-mesures

Introduction à MapReduce/Hadoop et Spark

Traitement numérique de l'image. Raphaël Isdant

Démonstration Google Apps. Christophe Thuillier Avril 2010 Arrowsoft

11/01/2014. Le Big Data Mining enjeux et approches techniques. Plan. Introduction. Introduction. Quelques exemples d applications

L Internet des objets

Fiche Pratique. Big Data : transformer les données en valeur business pour l entreprise BIG DATA

NoSQL. Introduction 1/30. I NoSQL : Not Only SQL, ce n est pas du relationnel, et le contexte. I table d associations - Map - de couples (clef,valeur)

Transformation IT de l entreprise ANALYTIQUE: L ÈRE WATSON

Transcription:

Big Data, c'est quoi? Big Data et la santé Collecte, stockage et exploitation de masses de données Capter de façon automatique et anonyme une très grande quantité d'informations, les traiter avec des algorithmes si possible en temps réel (ex comparateurs de prix) Objectif : modifier nos comportements! Origine : le développement des réseaux et des objets connectés, la puissance et la rapidité des calculs, le Cloud computing (données stockées et accessibles en ligne) Une tentative de définition : critères des «5V» Volume Variété (données hétérogènes, diverses sources et différents formats) Vélocité : accès et traitement temps réel + Véracité : précision et exactitude ++ Valeur : capacité à créer de la valeur Utilisation de grappes de serveurs (clusters d'ordinateurs indépendants) Données => traitement (interactions, corrélations) => interprétation => prédiction 8% du PIB européen en 2020? 80% d entre elles sont détenues par les GAFA (Google, Amazon, Facebook, Apple, etc.).

Un nombre de données gigantesque! (Infographie CNRS) Unité 1page de texte 30 KB 1morceau de Musique 6 MB 1 Film de 2h 1 GB 6 millions de livres 1 TB 1 colonne de DVD haute de 5 étages 1 PB Toutes les infos Générées depuis 2003 5 EB Toutes les Données Produites En 2015 8 ZB Capacité Data Center NASA 2013 92000 m2 1 YB 1 Byte = 1 Octet Kilobyte Megabyte Gigabyte Terabyte Petabyte Exabyte Zettabyte Yottabyte 10 3 10 6 10 9 10 12 10 15 10 18 10 21 10 24 La plupart viennent d'internet mais aussi de capteurs et des objetcs connectés Problèmes : le stockage => développement de mémoires non volatiles à l'échelle nano l'énergie pour refroidir tout cela => nouveaux matériaux, nouvelles architectures

Un gigantesque marché 46 à 110 Mds en 2018! Données Financières Recherche en physique (particules, astronomie) Santé ( génome, médecine) Marketing et de vente Gestion (villes, aéroports, infrastructures à risques) Météo Politiques, sécurité (le plus gros centre de stockage est celui de la NSA)

Dans le domaine de la santé Quelles données? 1. Images et données médicales des patients => PACS : développement essentiel pour l'imagerie => e-santé : seulement 9% des hôpitaux européens permettent aux patients d'accéder à un dossier médical en ligne! 2. Recherche et études épidémiologiques => enquêtes, données de cohortes pour études internationales, évaluation des médicaments (pharmacovigilance= recherche de signaux faibles détectés dans les cohortes), santé publique et sécurité sanitaire (information des citoyens) 3. Génomique et biologie moléculaire => le coût du séquencement du génome a fortement baissé => détection de maladies génétiques, prédispositions 4. Données issues des Objets connectés => les vraies Big data à forte valeur ajoutée => plutôt forme et bien-être (70% des applications) : auto-mesure de données physiques et biologiques et de l'activité physique => télésurveillance de maladies chroniques, avec l objectif de 50 000 patients suivis en 2017 (75% des dépenses de santé dans les pays riches) => les risques!

Imagerie : PACS ou Picture Archiving and Communication System Avant : le film Maintenant : le numérique

Architecture fonctionnelle d'un PACS Système de gestion des images médicales avec des fonctions d'archivage, de stockage, permettant le partage entre professionnels d'images et de données cliniques ou biologiques. Intégré au système informatique hospitalier. Permet de centraliser les images provenant de tous les systèmes d'imagerie => diagnostic plus rapide et thérapies plus sûres (partage d'informations à distance) => économique (suppression des examens redondants, des déplacements, archivage)

Les structures Programme «Hôpital numérique» pour le développement et la modernisation des SIH Programme «Territoire des soins numériques» cible partage et échange d'informations pour prise en charge coordonnée tout au long du parcours de soins dans et hors hôpital. Grosses infrastructures! Interopérabilité nécessaire Stocker et échanger dans le respect de la confidentialité!

Hébergeur de données de santé - CHEOPS Technology avec 11 agences en France - Groupe SIGMA avec 3 data centers à Nantes, agréés par le ministère de la santé Flux réseau dimensionnant en imagerie médicale Evolution vers le Cloud computing Moins couteux En principe neutre... mais les données sont bien stockées dans des centres matériels, presque tous aux USA! WATSON

Séquençage du génome : la première application Big Data Épeler la chaîne d'adn et déterminer l'enchaînement des nucléotides le long de la séquence Explosion des données - les puces à ADN - la collecte via les réseaux - séquençage massif et parallèle - statistique et modèles Les risques d'exploitation : eugénisme, assurances et mutuelles...

Outil puissant! Effrayant? Mais un réel intérêt! Aux USA, des start-up ont lancé des applications permettant d'obtenir une carte ADN sur mesure pour obtenir les informations relatives aux maladies qui vous guettent! => juste un peu de salive => informations sur l'origine Genomic Data Sharing Policy : résultat de plusieurs directives sur le partage des données établies depuis 2003, pour promouvoir le partage des données génomiques. Accès déjà fourni à plus de 2400 chercheurs de 41 pays. Le projet BrainSCANr, exploitant plusieurs millions d articles scientifiques, a permis d identifier un lien entre des maladies et certaines parties du cerveau. Un programme d'intelligence artificielle d'ibm, baptisé Watson a absorbé des millions de pages d'articles spécialisés et de rapports cliniques. On en attend une meilleure connaissance de la maladie et des pistes pour mieux la prédire et donc la prévenir.

La quête de l'immortalité! Les données issues des objets connectés Google : nanoparticules pour détecter et soigner le cancer... Samsung : Capteur de rythme cardiaque dans le Galaxy S5... Simband en cours de développement associé à une plateforme big data (Samsung Architecture Multimodal Interactions) pour concentrer les données et les vendre! «Les données seront disponibles pour les partenaires qui veulent créer des applications et services approuvés» Apple: montre qui collecte en permanence des données ou iphone => Health kit Interdit l'exploitation publicitaire aux développeurs (ex produits amincissement pour personnes en surpoids) mais garde tous les droits y compris de vendre ces données à des assurances privées

Données personnelles : une marchandise comme une autre! Développement de l'open data : une demande de l'industrie La plus grande banque mondiale de données de santé est en France : SNIIR-AM (système d'informations inter régimes de l'assiurance maladie) Celtipharm : utilisation des feuilles de soin pour études sur prise de médicaments et situations à risques (1,3 Mds de données par an!) Think Thank Orange Healthcare (Healthcare Data Institute) : la chaîne de valeur est différente selon les pays. La CNIL a autorisé AXA en 2010 à utiliser les données de soins pharmaceutiques de ses adhérents pour optimiser leurs contrats. Maladies chroniques et Télémédecine => questions techniques (déploiement) => questions éthiques (confidentialité) => questions humaines (changement de culture du personnel de santé, responsabilité des patients) De nombreuses formations : parcours «Numérique et Santé» à l'isep (école d'ingénieurs) De nombreuses réflexions!

Big data peut traiter des données exprimées dans toutes les langues. Il peut aussi exploiter d autres données contenues dans les dessins vectoriels, les images matricielles (en pixels), la vidéo, le son, les logs, les données spatiales (géolocalisation), les sites web, les blogs, les mails, les échanges sur les réseaux sociaux (Facebook, Twitter, LinkedIn...), les éléments de biométrie, etc. Hadoop : ensemble logiciel structurel de licence libre, géré par la fondation Apache, il utilise des algorithmes de type MapReduce 2.0 qui, après avoir découpé les milliards d enregistrements en blocs de même taille, répartit l exécution du traitement «parallèle distribué» sur des serveurs distants, puis enchaîne les résultats reçus (concaténation) avant d adresser le résultat sous une forme visuelle (data visualisation). Note du Centre de Recherche de l'ecole des Officiers de la Gendarmerie Nationale