L EXPLOITATION DES DONNEES SCIENTIFIQUES 3 Juillet 2012

Dimension: px
Commencer à balayer dès la page:

Download "L EXPLOITATION DES DONNEES SCIENTIFIQUES 3 Juillet 2012"

Transcription

1 P. 1 L EXPLOITATION DES DONNEES SCIENTIFIQUES 3 Juillet 2012 Mark Asch, INSMI-CNRS et Université de Picardie Jules Verne Journée BIG DATA - GFII

2 P. 2 MISSION POUR L INTERDISCIPLINARITE Juillet 2012

3 Organisation du CNRS Conseil d'administration Président Direction de l'audit interne Comité d'éthique P. 3 Direction de la communication Institut des sciences de la communication Mission pour l'interdisciplinarité Secrétariat général du Comité national Direction générale déléguée à la science Très grands équipements Cabinet Direction générale déléguée aux ressources Mission pilotage et relations avec les délégations régionales et les instituts Médiateur Conseil de politique européenne et internationale Mission pour la place des femmes Fonctionnaire de sécurité de défense Agent comptable principal Comité national Conseil scientifique Direction d'appui à la structuration territoriale de la recherche Direction Europe de la recherche et coopération internationale Institut des sciences biologiques (INSB) Institut de chimie (INC) 3 pt Institut écologie et environnement (INEE) Direction des comptes et de l'information financière Direction de la stratégie financière, de l'immobilier et de la modernisation Direction de l'innovation et des relations avec les entreprises Institut des sciences humaines et sociales (INSHS) Direction des ressources humaines Conseils scientifiques d'instituts Direction information scientifique et technique Institut des sciences de l'information et de leurs interactions (INS2I) Institut des sciences de l'ingénierie et des systèmes (INSIS) Institut national des sciences mathématiques et de leurs interactions (INSMI) Direction des affaires juridiques Direction des systèmes d'information Institut de physique (INP) Coordination nationale de prévention et de sécurité Sections - Commissions interdisciplinaires Institut national de physique nucléaire et de physique des particules (IN2P3) Institut national des sciences de l'univers (INSU) Unités de recherche Délégations régionales Agents comptables secondaires

4 Organisation de la MI l Un comité de pilotage de l interdisciplinarité P. 4 Direction de la MI + 10 DAS II + ISCC + MRCT+DIRCOM+DIRE Mise en place et suivi opérationnel des outils et des actions interdisciplinaires puis Validation en Collège de Direction

5 Les actions P. 5 l Les défis scientifiques l L interdisciplinarité en réseau l L interdisciplinarité sur site l Les autres actions Ouverture d une boite à idées interdisciplinaires (ouverte à la communauté)

6 Les actions Les défis scientifiques P. 6 Actions de recherche long terme (> 5 ans) et à risque Choix des équipes/unités engagées Evaluation de l avancement tous les ans Le comité de pilotage examine les thématiques exploratoires et fait des propositions pour : Promouvoir et soutenir des actions aux interfaces Répondre à un besoin, un objet Favoriser l émergence de nouveaux champs disciplinaires Partenaires potentiels : les grands organismes, les industriels, les universités

7 Actions Les défis scientifiques P. 7 NEEDS SENS MASTODONS Biologie Synthétique Nano - G3N l NEEDS: Nucléaire Energie Environnement Déchets et Société l Défi SENS, Insuffisances perceptives et suppléances personnalisées l MASTODONS: Très Grandes Masses de Données Scientifiques l Biologie synthétique l Nano-G3N: Graphène, Nouveaux paradigmes, Nanomédecine, Nanométrologie

8 P. 8 NEEDS SENS MASTODONS Biologie Synthétique Nano - G3N Actions Les défis scientifiques MASTODONS: Très grandes masses de données scientifiques Porteurs du défi : Mark Asch Mokrane Bouzeghoub * Budget : 700 k Gestion et de l exploitation de grandes masses de données (mesures, texte, image, son,...) 7 axes 1. Stockage et gestion de données (par exemple, dans le Cloud), sécurité, confidentialité. 2. Calcul intensif sur des grands volumes de données, parallélisme dirigé par les données. 3. Visualisation de grandes masses de données. 4. Extraction de connaissances, datamining et apprentissage. 5. Problèmes de propriété, de droit d usage, droit à l oubli. 6. Préservation/archivage des données pour les générations futures. 7. Exploitation des grandes masses de données liées aux bases de données scientifiques, réseaux sociaux, très gros corpus littéraires, et autres.

9 P. 9 NEEDS Actions Les défis scientifiques Nombre de laboratoires ou organismes ayant postulé: 74 Nombre de laboratoires ou organismes présents dans les projets 43 sélectionnés : Nombre de projets soumis: 37 Nombre de projets sélectionnés: 18 Résultats: SENS 10 au titre de la qualité scientifique et du caractère ambitieux du projet MASTODONS Nombre de projets financés (après fusion de certains projets): 16 5 au titre de la qualité scientifique mais dont le projet était plus modeste 1 au titre de l'animation sur la préservation des données Biologie Synthétique Nano - G3N

10 Masses de Données Scientifiques: Quelques Enjeux et Perspectives INS2I MASTODONS

11 INS2I Les données : une matière première et des produits à forte valeur ajoutée Institut des sciences informatiques et de leurs interactions BD et fichiers d entreprises Données WEB et Réseaux Sociaux Données de Capteurs Données d expériences scientifiques Commerce et les affaires! SI d entreprise, transactions commerciales, systèmes de réservation,! Loisirs! Musique, vidéo, jeux, réseaux sociaux! Sciences! Astronomie, physique et énergie, génome,! Médecine! Dossier médical, sécurité sociale, imagérie! Environnement! Climat, dév durable, pollution, alimentation,! Humanités et Sciences Sociales! Numérisation du savoir (littérature, histoire, ), interactions dans les réseaux sociaux, données archéologiques! Mokrane Bouzeghoub l DAS 11

12 INS2I Une petite idée des volumes de données Institut des sciences informatiques et de leurs interactions Volume Exemple "* )'($%&'(!"#$ 1 gigabyte Information known in the human 10 9 genome 1 terabyte Annual world literature production petabyte All US academic research libraries exabyte Two thirds of annual world production of information Source: Mokrane Bouzeghoub l DAS 12

13 Recherches en gestion de données INS2I Institut des sciences informatiques et de leurs interactions Données de base Données dérivées Structures de tables Structures d objets Données semi-structurées (XML) Données multi-média Données scientifiques Séries temporelles Flux de données / événements Un domaine très vaste, en interaction permanente avec toutes les autres disciplines des STIC! Architectures machin( HPC), Réseaux, systèmes, GL, IA, différentes théories de l informatique! Un domaine qui se repositionne périodiquement! En revisitant ses solutions à la lumière de nouvelles technos et de nouvelles idées! En intégrant de nouveaux besoins et de nouveaux problèmes! Un domaine interdisciplinaire! Modélisation et simulation! Apprentissage statistique! Calcul haute performance! Inférence logique! Mokrane Bouzeghoub l DAS 13

14 Caractéristiques INS2I Institut des sciences informatiques et de leurs interactions Des recherches principalement tirées par! Des applications industrielles! L émergence de nouvelles technologies! L émergence de nouveaux usages! Une recherche dominée (ou presque) par des labos industriels!! Nombreuses «success stories»! Des laboratoires industriels de pointe! ü IBM, Oracle, Microsoft, Sun, AT&T, Bell Labs, Google, Yahoo!" Une grande perméabilité entre monde académique et monde industriel (en particulier aux US, moins en Europe)! Mokrane Bouzeghoub l DAS 14

15 INS2I Institut des sciences informatiques et de leurs interactions Les grands verrous dans la gestion des masses de données 1. La virtualisation du stockage et de l accès (Cloud).! 2. L intégration de données.! 3. La gestion d événements et de flots de données (event processing, data streams).! 4. L analyse complexe à grande échelle.! 5. La qualité et protection des données.! 6. La visualisation/navigation des masses de données.! 7. La préservation des données.! Mokrane Bouzeghoub l DAS 15

16 INS2I Défi 1 : Stockage à grande échelle (Cloud) R R Institut des sciences informatiques et de leurs interactions C Time D Bénéfices du Cloud! Pas d infrastructure à acquérir ni à gérer! ü «Pay as you go»" Stockage massif de données (à moindre coût)! ü Coûts de stockage et d utilisation réduits" Accès anytime anywhere via Internet! ü Ex: icloud (Apple)" Qualité de service! ü Disponibilité, sécurité" Elasticité! ü absorbe facilement les charges lourdes ou soudaines" C D Challenges du Cloud! Indexation intelligente (sémantique)! Sécurité et Confidentialité (privacy)! Calcul haute performance (//)! Cohérence et qualité des données! Mokrane Bouzeghoub l DAS 16

17 INS2I Divy Agrawal et al VLDB Tutorial 2010 Institut des sciences informatiques et de leurs interactions Défi 2 : Analyse complexe à grande échelle Analyse en temps réel de flots continus de données émanant de différentes sources! Ex: Découvrir et comprendre les patterns caractéristiques du comportement des clients/ utilisateurs! Réaction en temps réel à des événements d alerte! Ex: attaques sur le réseau! Requêtes multidimensionnelles sur des grands ensembles de données! Découvrir et comprendre des patterns en analysant le comportement d une population! Découvrir des corrélations entre phénomènes! Mokrane Bouzeghoub l DAS 17

18 INS2I Institut des sciences informatiques et de leurs interactions Cible : intelligence ambiante, réseaux sociaux, surveillance temps réel, robotique, bioinformatique. Mokrane Bouzeghoub l DAS Défi 3 : la gestion de flots d événements Capture d événements! Politique de détection et de composition (requêtes sur les évnts)! Introduction d incertitude sur l arrivée des événements et sur le contenu de leurs messages! Détection / simulation d événements rares! Réaction aux événements! Politique de déclenchement, consommation, exécution (optimisation)! Couplage transactionnel! Analyse : confluence, terminaison! Bufferisation! Taille des fenêtres temporelles! Stratégies de glissement! Historisation! Stockage massif! Indexation! Analyse complexe (analyse de séquences, motifs fréquents, )! 18

19 INS2I Défi 4 : La visualisation des masses de données Institut des sciences informatiques et de leurs interactions Mokrane Bouzeghoub l DAS Besoins! Navigation intuitive/contextuelle! ü desktop intelligent, réseaux sociaux, contenus MM" Visualisation de phénomènes non perceptibles! ü Génome, trou noir" Analyse visuelle! ü Découverte de connaissances" Challenges! Invention de nouvelles métaphores graphiques! Algorithmes de graphes performants (//)! ü Optimisation de la visulaisation de grands graphes" Clusterisation et stats de graphes! Adaptation aux terminaux /équipements!! 19

20 Défi 5 : La préservation des données INS2I Institut des sciences informatiques et de leurs interactions Accroissement de l hétérogénéité des MDD Plus grandes difficultés pour leur intégration et leur exploitation Mokrane Bouzeghoub l DAS Comment préserver les données à durée de vie illimité?! connaissances scientifiques! produits culturelles! connaissances archéologiques et environnementales! connaissances sociales (recensements)! Comment préserver les données à durée de vie longue mais limitée! patrimoine informationnel des entreprises! Données personnelles (stockées dans les disques privés ou publiés sur le Web)! Données publiques (fichiers sécu, police, )! Quel coût pour la préservation des données! Coût de conversion des données (formats)! Coût pour la migration des technologies! Coût de maintien des technologies de niche! Quelle stratégie pour les données gérées dans le Cloud?! 20

21 Conclusion INS2I Institut des sciences informatiques et de leurs interactions Fin de l ère «One Size Fits All»! Il faut offrir des architectures de données flexibles, avec des services de gestion de données adaptables à chaque type d application/type de données! Les SGBD ne sont plus visibles en tant que systèmes intégrés et cohérents! les services de gestion de données sont enfouis dans des systèmes à plus forte valeur ajoutée (services métiers)! Grands challenges des MDD! Passage à l échelle et calcul haute performance! Virtualisation et indexation sémantique! Requêtage, extraction des connaissances et visualisation! Sécurité et protection de la vie privée! Mokrane Bouzeghoub l DAS 21

22 P. 22 MISSION POUR L INTERDISCIPLINARITE Grand défi : MASTODONS

23 P. 23 NEEDS SENS MASTODONS Biologie Synthétique Nano - G3N Actions Les défis scientifiques MASTODONS: Très grandes masses de données scientifiques Porteurs du défi : Mark Asch Mokrane Bouzeghoub * Budget : 700 k en 2012 Gestion et de l exploitation de grandes masses de données (mesures, texte, image, son,...) 7 axes 1. Stockage et gestion de données (par exemple, dans le Cloud), sécurité, confidentialité. 2. Calcul intensif sur des grands volumes de données, parallélisme dirigé par les données. 3. Visualisation de grandes masses de données. 4. Extraction de connaissances, datamining et apprentissage. 5. Problèmes de propriété, de droit d usage, droit à l oubli. 6. Préservation/archivage des données pour les générations futures. 7. Exploitation des grandes masses de données liées aux bases de données scientifiques, réseaux sociaux, très gros corpus littéraires, et autres.

24 DEFI "MASTODONS" Résumé Nombre de laboratoires ou organismes ayant postulé: 74 Nombre de laboratoires ou organismes présents dans les projets sélectionnés : 43 Nombre de projets soumis: 37 Nombre de projets sélectionnés: Actions 18 Nombre de projets financés (après fusion de certains projets): P. 24 MASTODONS au titre de la qualité scientifique et du caractère ambitieux du projet 5 au titre de la qualité scientifique mais dont le projet était plus modeste 1 au titre de l'animation sur la préservation des données 1- Projets fédérateurs : Titre du projet Porteur UMR Impliquées Instituts/Organismes DEEPHY: Data in physics - Large-scale data storage, data management, and data analysis for next generation particle physics experiments NEEDS Kegl Balazs LAL, LIP, LRI IN2P3, INS2I Gaia: l origine et l évolution de notre Galaxie : validation des données Arenou Frédéric GEPI, IMCCE, PRISM, LMPP INSU, INS2I, INSMI Projet IPSL-INRIA: production, distribution et analyse des résultats de simulations climatiques. (EPINES) Dufresne Jean-Louis IPSL, KerData INSU, INRIA CrEDIBLE : fédération de données et de ConnaissancEs Distribuées en Imagerie BiomédicaLE Montagnat Johan I3S, LTSI, CREATIS, MIS INS2I, INSIS, INSB, INSERM ARESOS: Reconstruction, Analyse et Accès aux Données dans les Grands Réseaux Socio Sémantiques Gallinari Patrick LIP6, CAMS, LIG, LIRIT, LATTICE INS2I, INSMI, INSHS SABIOD : Scaled Acoustic BioDiversity Glotin Hervé LSIS, LIP6 INSB, INS2I Grandes masses de données sismologiques: Exploration complète des grandes masses de données sismologiques: études de l intérieur de la Terre à partir des champs d onde complexes Shapiro Nikolai IPGP, LJLL, Langevin INSU, INSMI, INSIS/INP AMADEUS: Analysis of MAssive Data in Earth and Universe Sciences Analyse de données massives en Sciences de la Terre et de l Univers Maabout Sofian LABRI, LIRMM, LIF, CEREGE, LAM INS2I, INSU PetaSky: Gestion et exploration des grandes masses de données scientifiques issues d observations astronomiques grand champ Toumani Farouk LIMOS, LIRIS, LPC, APC, LAL INS2I/INSIS, IN2P3 Défis computationnels des séquençages et phénotypage haut-débit en science de la vie Rivals Eric, Esther Pacitti LIRMM, CEFE, EFE, IPMC, IRISA, ISEM, LEPSE INS2I, INSB, INEE, INRA 2- Projets ciblés : Titre du projet Porteur UMR Impliquées Instituts/Organismes Projet SENSE : Socialized Network Science Jensen Pablo LP, LIP, IXXI, Max Weber INP, INS2I, INSHS COMOTEX: COMmande temps réel de systèmes d'optique adaptative à très grand nombre de degrés de liberté pour les Télescopes EXtrêmement grands Le Roux Brice LAM, CEREA INSU, ONERA, ENPC AMADOUER: Analyse de MAsse de DOnnées de l Urbain et l EnviRonnement Baskurt Attila LIRIS, EVS, CETHIL,LGCIE INS2I, INSHS, INEE, INSIS PROSPECTOM: Etude visuelle et interactive des protéomes par apprentissage statistique et intégration des bases de données et de connaissances spectrométriques et «omiques». Bisson Gilles LIG, irtsv INS2I, INSB, CEA Statistiques Crowdsourcing Biodiversité Julliard Romain MNHN, CMAP, CEFE INEE, INSMI, INRA 3- Projet d'animation : Titre du projet Porteur UMR Impliquées Instituts/Organismes PREDON: La préservation et l exploitation des données scientifiques à long terme Diacanou Cristinel CPPM, LPCCG, LAPP IN2P3

25 Actions MASTODONS P. 25 Titre NEEDS CrEDIBLE : fédération de données et de ConnaissancEs Distribuées en Imagerie BiomédicaLE Porteur Montagnat Johan - johan@i3s.unice.fr - Laboratoire I3S d'informatique, Signaux et Systèmes, Sophia-Antipolis UMR 7271 UMR Instituts Résumé I3S, LTSI, CREATIS, MIS INS2I, INSIS, INSB, INSERM Le travail proposé intègre les moyens d aligner des entrepôts distribués de données hétérogènes (médiation) de les unifier (fédération), notamment à travers des outils d interrogation (requêtes distribuées), et de les analyser (flots de données) sur des infrastructures de calcul distribuées (Grilles, Clouds). Ce travail comprendra également une analyse sémantique du domaine de l imagerie médicale. Les principaux verrous scientifiques abordés sont : la représentation sémantique des données d imagerie médicale fondée sur des ontologies des différents domaines concernés, la gestion de sources de données hétérogènes, la fédération d entrepôts distribués, la performance des requêtes distribuées, la gestion de flots de calculs distribués sur les cohortes de données, la cohérence des données distribuées afin de lier les instances relatives à une même entité physiques potentiellement distribuées dans plusieurs entrepôts.

26 Actions MASTODONS P. 26 Titre Défis computationnels des séquençages et phénotypage haut-débit en science de la vie Porteur NEEDS Rivals Eric, Esther Pacitti - rivals@lirmm.fr, Esther.Pacitti@lirmm.fr - LIRMM, Montpellier - UMR 5506 UMR LIRMM, CEFE, EFE, IPMC, IRISA, ISEM, LEPSE Instituts Résumé INS2I, INSB, INEE, INRA Les nouvelles technologies de Séquençage à Haut Débit (SHD) et Séquençage de Nouvelle Génération (NGS), révolutionnent la manière dont sont posées et résolues les questions de recherches en science du vivant, par exemple, pour évaluer la biodiversité d un espace on peut aujourd hui séquencer l ADN des espèces présentes. Une seule expérience de séquençage produit jusqu à plusieurs centaines de millions de courtes séquences. Ces reads sont ensuite groupés en catégories représentant les espèces, et ainsi leur nombre et abondance relative permettent d estimer la biodiversité. La question devient alors computationnelle. La mesure automatisée des phénotypes (caractères observables d un organisme) permet d identifier les conséquences de variations alléliques en termes de morphologie, de croissance ou de métabolisme dans un environnement donné. Les verrous identifiés et visés comprennent : l algorithmique du texte et des séquences (indexation, comparaison, compression) et son passage à l échelle l exploitation des architectures parallèles (multi-coeurs, grille, cloud) pour l analyse des données l invention de nouvelles approches et algorithmes pour identifier variations génomiques, épigénomiques, transcriptomiques ou classifier les données du méta-génome le partage et la fouille de données à grande échelle l intégration de données sur les versants technique et biologique (lien génotype-phénotype). Axes de recherche : traitement primaire des séquences (algorithmique et parallélisme), prediction d événements biologiques, Partage et analyse de données (P2P)

27 Actions MASTODONS P. 27 Titre SABIOD : Scaled Acoustic BioDiversity NEEDS Porteur Glotin Hervé - glotin@univ-tln.fr - LSIS, Toulon. - UMR 7296 UMR Instituts Résumé LSIS, LIP6 INSB, INS2I L'observation et l'étude la biodiversité sont des enjeux majeurs de notre siècle, tant pour comprendre notre environnement, et son évolution, que sa vulnérabilité face aux activités humaines. La bioacoustique, discipline émergente à l'interface de l'écologie et la physique, analyse la trace acoustique directe (cri, chant, biosonar, etc) ou indirecte (leur déplacement ou modification du milieu) laissée par une majorité d'espèces animales. Les axes de recherche traitent des grands thèmes suivants : passage à l'échelle, clustering en ligne, classification, fouille de données, modélisation probabiliste nonsupervisée, analyse Bayésienne, adaptation de modèles en ligne, statistique de masse, indexation multi-échelle, interprétation écologique, fusion de connaissances hétérogènes.

28 Actions MASTODONS P. 28 Titre ARESOS: Reconstruction, Analyse et Accès aux Données dans les Grands Réseaux Socio Sémantiques Porteur NEEDS Gallinari Patrick - patrick.gallinari@lip6.fr - LIP6, Paris. - UMR 7606 UMR Instituts Résumé LIP6, CAMS, LIG, LIRIT, LATTICE INS2I, INSMI, INSHS Analyse et modélisation des réseaux sociaux. Le projet développera des outils et méthodes pour reconstruire à partir de l'analyse de ces grands corpus textuels les réseaux dynamiques multipartites des contenus et des acteurs qui les produisent, analysera et modélisera la structure de ces réseaux ainsi que les processus de diffusion d'information qu'ils supportent, et enfin proposera des interfaces innovantes permettant de visualiser et d'interagir avec ces contenus Les défis majeurs : taille des données, hétérogénéité et complexité des données, dynamicité et échelles de temps, interprétabilité des résultats et interaction, défis des différents champs disciplinaires. Il s'agira notamment d'intégrer dans une même approche des analyses à différentes échelles de temps et à travers plusieurs sphères du social reflétées par des corpus distincts (tweets, blogs, pages web, articles de journaux, articles scientifiques, corpus juridiques) de manière à mieux comprendre les différents types de dynamiques de nos sociétés.

29 Actions MASTODONS P. 29 Titre Porteur NEEDS UMR Instituts Gaia: l origine et l évolution de notre Galaxie : validation des données Arenou Frédéric - Frederic.Arenou@obspm.fr - GEPI, Observatoire de Paris, MEUDON - UMR8111 GEPI, IMCCE, PRISM, LMPP INSU, INS2I, INSMI Consortium et collaborations entre les domaines de l'astrophysique, de l'informatique (BD, datamining) et les mathématiques et statistiques pour permettre de résoudre les problèmes considérables posés par l exploitation des données GAIA (projet de cartographie 3D de notre galaxie). Developper des outils d'analyse multidimensionnelle adaptés aux grandes masses de données (1 Pb) astrométriques, photométriques, spectrophotométriques, spectroscopiques. Résumé

30 Actions MASTODONS P. 30 Titre Porteur NEEDS UMR Instituts DEEPHY: Data in physics - Large-scale data storage, data management, and data analysis for next generation particle physics experiments Kegl Balazs - balazs.kegl@gmail.com - LAL, Orsay - UMR8607 LAL, LIP, LRI IN2P3, INS2I Consortium interdisciplinaire (physiciens, informaticiens) pour traitement de données issues du LHC (dizaine de pétabytes/an). Trois thèmes: (1) la gestion de cycle de vie des données, placement optimal (2) l'analyse de données à grande échelle, algorithmes MCMC sur grille (3) l'integration de données sur le comportement d'egi (l'infrastructure de grille européenne), Observatoire de Grille. Résumé

31 Titre du projet Porteur UMR Impliquées Instituts/Organismes DEEPHY: Data in physics - Large-scale data storage, data management, and data analysis for next generation particle physics experiments Kegl Balazs LAL, LIP, LRI IN2P3, INS2I Gaia: l origine et l évolution de notre Galaxie : validation des données Arenou Frédéric GEPI, IMCCE, PRISM, LMPP INSU, INS2I, INSMI Projet IPSL-INRIA: production, distribution et analyse des résultats de simulations climatiques. (EPINES) Dufresne Jean-Louis IPSL, KerData INSU, INRIA CrEDIBLE : fédération de données et de ConnaissancEs Distribuées en Imagerie BiomédicaLE Montagnat Johan I3S, LTSI, CREATIS, MIS INS2I, INSIS, INSB, INSERM NEEDS Actions MASTODONS ARESOS: Reconstruction, Analyse et Accès aux Données dans les Grands Réseaux Socio Sémantiques Gallinari Patrick LIP6, CAMS, LIG, LIRIT, LATTICE INS2I, INSMI, INSHS SABIOD : Scaled Acoustic BioDiversity Glotin Hervé LSIS, LIP6 INSB, INS2I Grandes masses de données sismologiques: Exploration complète des grandes masses de données sismologiques: études de l intérieur de la Terre à partir des champs d onde complexes Shapiro Nikolai IPGP, LJLL, Langevin INSU, INSMI, INSIS/INP AMADEUS: Analysis of MAssive Data in Earth and Universe Sciences Analyse de données massives en Sciences de la P. 31 Terre et de l Univers Maabout Sofian LABRI, LIRMM, LIF, CEREGE, LAM INS2I, INSU PetaSky: Gestion et exploration des grandes masses de données scientifiques issues d observations astronomiques grand champ Toumani Farouk LIMOS, LIRIS, LPC, APC, LAL INS2I/INSIS, IN2P3 Défis computationnels des séquençages et phénotypage haut-débit en science de la vie Rivals Eric, Esther Pacitti LIRMM, CEFE, EFE, IPMC, IRISA, ISEM, LEPSE INS2I, INSB, INEE, INRA 2- Projets ciblés : Titre du projet Porteur UMR Impliquées Instituts/Organismes Projet SENSE : Socialized Network Science Jensen Pablo LP, LIP, IXXI, Max Weber INP, INS2I, INSHS COMOTEX: COMmande temps réel de systèmes d'optique adaptative à très grand nombre de degrés de liberté pour les Télescopes EXtrêmement grands Le Roux Brice LAM, CEREA INSU, ONERA, ENPC AMADOUER: Analyse de MAsse de DOnnées de l Urbain et l EnviRonnement Baskurt Attila LIRIS, EVS, CETHIL,LGCIE INS2I, INSHS, INEE, INSIS PROSPECTOM: Etude visuelle et interactive des protéomes par apprentissage statistique et intégration des bases de données et de connaissances spectrométriques et «omiques». Bisson Gilles LIG, irtsv INS2I, INSB, CEA Statistiques Crowdsourcing Biodiversité Julliard Romain MNHN, CMAP, CEFE INEE, INSMI, INRA 3- Projet d'animation : Titre du projet Porteur UMR Impliquées Instituts/Organismes PREDON: La préservation et l exploitation des données scientifiques à long terme Diacanou Cristinel CPPM, LPCCG, LAPP IN2P3

32 Actions Conclusion et Perspectives P. 32 NEEDS Année 2012 : Mise en place et structuration de l interdisciplinarité au CNRS. Lancement de «grands défis» et de «projets exploratoires». Année 2013 : Ouverture aux autres organismes de recherche (INSERM, INRA, INRIA, INSEE, ) Ouverture aux entreprises et industries de l information

33 P. 33 NEEDS

Mastodons Une approche interdisciplinaire des Big Data

Mastodons Une approche interdisciplinaire des Big Data Mastodons Une approche interdisciplinaire des Big Data Méga- données, IRIT Nov 2014 Mokrane Bouzeghoub DAS INS2I / MI CNRS - Mission pour l'interdisciplinarité Mokrane Bouzeghoub 1 1 Introduction 2 CNRS

Plus en détail

Emergence du Big Data Exemple : Linked Open Data

Emergence du Big Data Exemple : Linked Open Data 1 CNRS - Misionpour l'interdisciplinarité Mokrane Bouzeghoub 1 Une approche interdisciplinaire des grandes masses de données (Défi Mastodons) Mokrane Bouzeghoub DAS INS2I / MI Ecole de L Innova.on Thérapeu.

Plus en détail

Emergence du Big Data Exemple : Linked Open Data

Emergence du Big Data Exemple : Linked Open Data 16/05/2014 Une approche interdisciplinaire des grandes masses de données (Défi Mastodons) Mokrane Bouzeghoub DAS INS2I / MI 1 Emergence du Big Data Exemple : Linked Open Data Accès à plusieurs BD scientifiques

Plus en détail

Masses de données. 1. Introduction 2. Problématiques 3. Socle de formation (non présenté) 4. Liens avec Formation INSA

Masses de données. 1. Introduction 2. Problématiques 3. Socle de formation (non présenté) 4. Liens avec Formation INSA Masses de données 1. Introduction 2. Problématiques 3. Socle de formation (non présenté) 4. Liens avec Formation INSA Rédacteurs : Mjo Huguet / N. Jozefowiez 1. Introduction : Besoins Informations et Aide

Plus en détail

Mastodons. Une Approche Interdisciplinaire des Big Data. Mokrane Bouzeghoub CNRS / INS2I & MI !"#$%&%'()*%+,$-.'."$%%

Mastodons. Une Approche Interdisciplinaire des Big Data. Mokrane Bouzeghoub CNRS / INS2I & MI !#$%&%'()*%+,$-.'.$%% Mastodons Une Approche Interdisciplinaire des Big Data Mokrane Bouzeghoub CNRS / INS2I & MI!"#$%&%'()*%+,$-.'."$%% PLAN Quelques concepts de base Les ouels du Big Data Le défi Mastodons (CNRS) Conclusion

Plus en détail

Sommaire. Par$e 1 : Enjeux et probléma$ques des masses de données. Par$e 2 : Le défi Mastodons. Par$e 3 : Focus sur quelques projets

Sommaire. Par$e 1 : Enjeux et probléma$ques des masses de données. Par$e 2 : Le défi Mastodons. Par$e 3 : Focus sur quelques projets Mastodons Une approche interdisciplinaire des grandes masses de données (Big Data) Mokrane Bouzeghoub DAS INS2I / MI 1 Sommaire Par$e 1 : Enjeux et probléma$ques des masses de données Par$e 2 : Le défi

Plus en détail

Jean-François Boulicaut & Mohand-Saïd Hacid

Jean-François Boulicaut & Mohand-Saïd Hacid e siècle! Jean-François Boulicaut & Mohand-Saïd Hacid http://liris.cnrs.fr/~jboulica http://liris.cnrs.fr/mohand-said.hacid Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205

Plus en détail

Indexmed : Le big data en écologie? Pas encore disent certains. Pas si sûr! Avec IndexMed. Relevons ce challenge!

Indexmed : Le big data en écologie? Pas encore disent certains. Pas si sûr! Avec IndexMed. Relevons ce challenge! Indexmed : Le big data en écologie? Pas encore disent certains Pas si sûr! Avec IndexMed Relevons ce challenge! Origine du consortium L état des lieux (source : séminaire Allenvie, séminaire Indexmed1)

Plus en détail

Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant

Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant Parcours: Master 1 : Bioinformatique et biologie des Systèmes dans le Master

Plus en détail

e-biogenouest CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé

e-biogenouest CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé e-biogenouest Coordinateur : Olivier Collin Animateur : Yvan Le Bras CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé

Plus en détail

Big Data: développement, rôle des ARS?? Laurent Tréluyer, ARS Ile de France Alain Livartowski Institut Curie Paris 01/12/2014

Big Data: développement, rôle des ARS?? Laurent Tréluyer, ARS Ile de France Alain Livartowski Institut Curie Paris 01/12/2014 Big Data: développement, rôle des ARS?? Laurent Tréluyer, ARS Ile de France Alain Livartowski Institut Curie Paris 01/12/2014 1 Classiquement, le Big Data se définit autour des 3 V : Volume, Variété et

Plus en détail

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21 IODAA de l 1nf0rmation à la Décision par l Analyse et l Apprentissage IODAA Informations générales 2 Un monde nouveau Des données numériques partout en croissance prodigieuse Comment en extraire des connaissances

Plus en détail

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université

Plus en détail

Masses de données et calcul : à l IRIT. 8 octobre 2013

Masses de données et calcul : à l IRIT. 8 octobre 2013 Masses de données et calcul : la recherche en lien avec les Big Data à l IRIT 8 octobre 2013 08/10/2013 1 L IRIT en qq chiffres 700 personnes sur tous les sites toulousains 5 tutelles 7 thèmes et 21 équipes

Plus en détail

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci http://liris.cnrs.fr/hamamache.kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de

Plus en détail

L'écosystème du calcul intensif et des données : la vision du CNRS. M. Daydé. Directeur du Comité d Orientation pour le Calcul Intensif au CNRS

L'écosystème du calcul intensif et des données : la vision du CNRS. M. Daydé. Directeur du Comité d Orientation pour le Calcul Intensif au CNRS L'écosystème du calcul intensif et des données : la vision du CNRS M. Daydé Directeur du Comité d Orientation pour le Calcul Intensif au CNRS Délégué Scientifique CNRS / INS2 Rôle et missions du COCIN

Plus en détail

FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis

FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis Joseph Salmon Télécom ParisTech Jeudi 6 Février Joseph Salmon (Télécom ParisTech) Big Data Jeudi 6 Février 1 / 18 Agenda Contexte et opportunités

Plus en détail

Indexmed : Le big data en écologie? Pas encore disent certains. Pas si sûr! Avec IndexMed. Relevons ce challenge!

Indexmed : Le big data en écologie? Pas encore disent certains. Pas si sûr! Avec IndexMed. Relevons ce challenge! Indexmed : Le big data en écologie? Pas encore disent certains Pas si sûr! Avec IndexMed Relevons ce challenge! Origine du consortium L état des lieux (source : séminaire Allenvie, séminaire Indexmed1)

Plus en détail

Master Informatique Aix-Marseille Université

Master Informatique Aix-Marseille Université Aix-Marseille Université http://masterinfo.univ-mrs.fr/ Département Informatique et Interactions UFR Sciences Laboratoire d Informatique Fondamentale Laboratoire des Sciences de l Information et des Systèmes

Plus en détail

TRAVAUX DE RECHERCHE DANS LE

TRAVAUX DE RECHERCHE DANS LE TRAVAUX DE RECHERCHE DANS LE DOMAINE DE L'EXPLOITATION DES DONNÉES ET DES DOCUMENTS 1 Journée technologique " Solutions de maintenance prévisionnelle adaptées à la production Josiane Mothe, FREMIT, IRIT

Plus en détail

Projet de programme pour l enseignement d exploration de la classe de 2 nde : Informatique et création numérique

Projet de programme pour l enseignement d exploration de la classe de 2 nde : Informatique et création numérique Projet de programme pour l enseignement d exploration de la classe de 2 nde : Informatique et création numérique 19 mai 2015 Préambule L informatique est tout à la fois une science et une technologie qui

Plus en détail

Groupe de Discussion Big Data Aperçu des technologies et applications. Stéphane MOUTON stephane.mouton@cetic.be

Groupe de Discussion Big Data Aperçu des technologies et applications. Stéphane MOUTON stephane.mouton@cetic.be Groupe de Discussion Big Data Aperçu des technologies et applications Stéphane MOUTON stephane.mouton@cetic.be Recherche appliquée et transfert technologique q Agréé «Centre Collectif de Recherche» par

Plus en détail

AXES DE RECHERCHE - DOMAINE D'INTERET MAJEUR LOGICIELS ET SYSTEMES COMPLEXES

AXES DE RECHERCHE - DOMAINE D'INTERET MAJEUR LOGICIELS ET SYSTEMES COMPLEXES 1 AXES DE RECHERCHE - DOMAINE D'INTERET MAJEUR LOGICIELS ET SYSTEMES COMPLEXES 2 Axes de recherche L activité du DIM LSC concerne la méthodologie de la conception et le développement de systèmes à forte

Plus en détail

Introduction au datamining

Introduction au datamining Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des

Plus en détail

«Les projets collaboratifs pour les nuls»

«Les projets collaboratifs pour les nuls» «Les projets collaboratifs pour les nuls» Les jeudis du numérique à Vannes 28/05/15 Sommaire 1) Le projet collaboratif 2) Les appels à projets 3) Le financement 4) Le rôle d Images & Réseaux Les questions

Plus en détail

Eco-système calcul et données

Eco-système calcul et données Eco-système calcul et données M. Daydé Dr du Comité d'orientation pour le Calcul Intensif (COCIN) Délégué Scientifique INS2I en charge HPC / Grille / Cloud Calcul / données : un enjeu stratégique Calcul

Plus en détail

Big data et sciences du Vivant L'exemple du séquençage haut débit

Big data et sciences du Vivant L'exemple du séquençage haut débit Big data et sciences du Vivant L'exemple du séquençage haut débit C. Gaspin, C. Hoede, C. Klopp, D. Laborie, J. Mariette, C. Noirot, MS. Trotard bioinfo@genopole.toulouse.inra.fr INRA - MIAT - Plate-forme

Plus en détail

Smart City Pour relever les défis d urbanisation et de mobilité du futur. Raphael Rollier 05/2015

Smart City Pour relever les défis d urbanisation et de mobilité du futur. Raphael Rollier 05/2015 Smart City Pour relever les défis d urbanisation et de mobilité du futur Raphael Rollier 05/2015 Orateurs Marilyne Andersen Loïc Lepage Olivier de Watteville Raphael Rollier Doyenne de la faculté ENAC,

Plus en détail

Filière Fouille de Données et Décisionnel FDD (Data Mining) Pierre Morizet-Mahoudeaux www.hds.utc.fr/~pmorizet pierre.morizet@utc.

Filière Fouille de Données et Décisionnel FDD (Data Mining) Pierre Morizet-Mahoudeaux www.hds.utc.fr/~pmorizet pierre.morizet@utc. Filière Fouille de Données et Décisionnel FDD (Data Mining) Pierre Morizet-Mahoudeaux www.hds.utc.fr/~pmorizet pierre.morizet@utc.fr Plan Motivations Débouchés Formation UVs spécifiques UVs connexes Enseignants

Plus en détail

parée e avec C. Germain, B. Kegl et M. Jouvin CS de l Université Paris Sud

parée e avec C. Germain, B. Kegl et M. Jouvin CS de l Université Paris Sud Présentation prépar parée e avec C. Germain, B. Kegl et M. Jouvin CS de l Université Paris Sud (pré)histoire de la Grille Paris Sudn1 Les besoins de la communauté HEP La collaboration physiciens/informaticiens

Plus en détail

Les enjeux du Big Data Innovation et opportunités de l'internet industriel. Datasio 2013

Les enjeux du Big Data Innovation et opportunités de l'internet industriel. Datasio 2013 Les enjeux du Big Data Innovation et opportunités de l'internet industriel François Royer froyer@datasio.com Accompagnement des entreprises dans leurs stratégies quantitatives Valorisation de patrimoine

Plus en détail

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY Yvan Le Bras yvan.le_bras@irisa.fr Cyril Monjeaud, Mathieu Bahin, Claudia Hériveau, Olivier Quenez, Olivier Sallou, Aurélien Roult, Olivier

Plus en détail

Les datas = le fuel du 21ième sicècle

Les datas = le fuel du 21ième sicècle Les datas = le fuel du 21ième sicècle D énormes gisements de création de valeurs http://www.your networkmarketin g.com/facebooktwitter-youtubestats-in-realtime-simulation/ Xavier Dalloz Le Plan Définition

Plus en détail

Le Futur de la Visualisation d Information. Jean-Daniel Fekete Projet in situ INRIA Futurs

Le Futur de la Visualisation d Information. Jean-Daniel Fekete Projet in situ INRIA Futurs Le Futur de la Visualisation d Information Jean-Daniel Fekete Projet in situ INRIA Futurs La visualisation d information 1.Présentation 2.Bilan 3.Perspectives Visualisation : 3 domaines Visualisation scientifique

Plus en détail

MABioVis. Bio-informatique et la

MABioVis. Bio-informatique et la MABioVis Modèles et Algorithmes pour la Bio-informatique et la Visualisation Visite ENS Cachan 5 janvier 2011 MABioVis G GUY MELANÇON (PR UFR Maths Info / EPI GRAVITE) (là, maintenant) - MABioVis DAVID

Plus en détail

Chapitre 9 : Informatique décisionnelle

Chapitre 9 : Informatique décisionnelle Chapitre 9 : Informatique décisionnelle Sommaire Introduction... 3 Définition... 3 Les domaines d application de l informatique décisionnelle... 4 Architecture d un système décisionnel... 5 L outil Oracle

Plus en détail

MASTER (LMD) GESTION DE DONNEES ET SPATIALISATION EN ENVIRONNEMENT (GSE)

MASTER (LMD) GESTION DE DONNEES ET SPATIALISATION EN ENVIRONNEMENT (GSE) MASTER (LMD) GESTION DE DONNEES ET SPATIALISATION EN ENVIRONNEMENT (GSE) RÉSUMÉ DE LA FORMATION Type de diplôme : Master (LMD) Domaine ministériel : Sciences, Technologies, Santé Mention : STIC POUR L'ECOLOGIE

Plus en détail

ArcGIS. for Server. Comprendre notre monde

ArcGIS. for Server. Comprendre notre monde ArcGIS for Server Comprendre notre monde ArcGIS for Server Créer, distribuer et gérer des services SIG Vous pouvez utiliser ArcGIS for Server pour créer des services à partir de vos données cartographiques

Plus en détail

ArcGIS. for Server. Sénégal. Comprendre notre monde

ArcGIS. for Server. Sénégal. Comprendre notre monde ArcGIS for Server Sénégal Comprendre notre monde ArcGIS for Server Créer, distribuer et gérer des services SIG Vous pouvez utiliser ArcGIS for Server pour créer des services à partir de vos données cartographiques

Plus en détail

La renaissance de l industrie

La renaissance de l industrie La renaissance de l industrie Première contribution de l Académie des technologies Construire des écosystèmes compétitifs, fondés sur la confiance et favorisant l innovation Académie des technologies,

Plus en détail

Big Data et la santé

Big Data et la santé Big Data, c'est quoi? Big Data et la santé Collecte, stockage et exploitation de masses de données Capter de façon automatique et anonyme une très grande quantité d'informations, les traiter avec des algorithmes

Plus en détail

Présentations personnelles. filière IL

Présentations personnelles. filière IL Présentations personnelles filière IL Résumé Liste de sujets de présentations personnelles. Chaque présentation aborde un sujet particulier, l'objectif étant que la lecture du rapport ainsi que l'écoute

Plus en détail

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours Information du cours Informatique décisionnelle et data mining www.lia.univ-avignon.fr/chercheurs/torres/cours/dm Juan-Manuel Torres juan-manuel.torres@univ-avignon.fr LIA/Université d Avignon Cours/TP

Plus en détail

Les participants repartiront de cette formation en ayant une vision claire de la stratégie et de l éventuelle mise en œuvre d un Big Data.

Les participants repartiront de cette formation en ayant une vision claire de la stratégie et de l éventuelle mise en œuvre d un Big Data. Big Data De la stratégie à la mise en oeuvre Description : La formation a pour objet de brosser sans concession le tableau du Big Data. Les participants repartiront de cette formation en ayant une vision

Plus en détail

Les Rencontres ANR du numérique 2013

Les Rencontres ANR du numérique 2013 Les Rencontres ANR du numérique 2013 Jean-Yves Berthou ANR, Directeur dept. Sciences et Technologies de l Information et de la Communication Le Numérique à l ANR Quelques éléments marquants et réflexions

Plus en détail

L informatique à l IN2P3 et le rôle du Chargé de Mission

L informatique à l IN2P3 et le rôle du Chargé de Mission L informatique à l IN2P3 et le rôle du Chargé de Mission Giovanni Lamanna Réunion du comité des DUs 29 avril 2013 Plan - Présentation du Charge de Mission pour l Informatique - Lettre de mission: défis

Plus en détail

Faculté des Sciences d ORSAY

Faculté des Sciences d ORSAY Université Paris-Sud 11 Faculté des Sciences d ORSAY Personnes ressources des disciplines représentées : Département de Biologie Vice-Président : Hervé DANIEL Secrétaire : Malika DERRAS Université Paris-Sud

Plus en détail

CENTAI : Big Data & Big Analytics Réunion DGPN / Thales Octobre 2013

CENTAI : Big Data & Big Analytics Réunion DGPN / Thales Octobre 2013 www.thalesgroup.com CENTAI : Big Data & Big Analytics Réunion DGPN / Thales Octobre 2013 2 / Sommaire CENTAI : Présentation du laboratoire Plate-forme OSINT LAB Détection de la fraude à la carte bancaire

Plus en détail

Les ressources numériques

Les ressources numériques Les ressources numériques Les ressources numériques sont diverses et regroupent entre autres, les applications, les bases de données et les infrastructures informatiques. C est un ensemble de ressources

Plus en détail

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales Ecole des Hautes Etudes Commerciales HEC Alger Évolution des SGBDs par Amina GACEM Module Informatique 1ière Année Master Sciences Commerciales Evolution des SGBDs Pour toute remarque, question, commentaire

Plus en détail

SQL Server 2012 et SQL Server 2014

SQL Server 2012 et SQL Server 2014 SQL Server 2012 et SQL Server 2014 Principales fonctions SQL Server 2012 est le système de gestion de base de données de Microsoft. Il intègre un moteur relationnel, un outil d extraction et de transformation

Plus en détail

Big Data On Line Analytics

Big Data On Line Analytics Fdil Fadila Bentayeb Lb Laboratoire ERIC Lyon 2 Big Data On Line Analytics ASD 2014 Hammamet Tunisie 1 Sommaire Sommaire Informatique décisionnelle (BI Business Intelligence) Big Data Big Data analytics

Plus en détail

Spécialité IAD. Master de Sciences et technologie de l UPMC. Mention informatique. Partenaires : ENST, ENSTA. Responsables : T. Artières, C.

Spécialité IAD. Master de Sciences et technologie de l UPMC. Mention informatique. Partenaires : ENST, ENSTA. Responsables : T. Artières, C. Master de Sciences et technologie de l UPMC Mention informatique Spécialité IAD Partenaires : ENST, ENSTA Responsables : T. Artières, C. Gonzales Secrétariat : N. Nardy LES THÉMATIQUES ABORDÉES Les thématiques

Plus en détail

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation Base de données S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Présentation du module Contenu général Notion de bases de données Fondements / Conception Utilisation :

Plus en détail

July 1, 2013. Stéphan Clémençon (Télécom ParisTech) Mastère Big Data July 1, 2013 1 / 15

July 1, 2013. Stéphan Clémençon (Télécom ParisTech) Mastère Big Data July 1, 2013 1 / 15 Mastère Spécialisé Big Data Stéphan Clémençon Télécom ParisTech July 1, 2013 Stéphan Clémençon (Télécom ParisTech) Mastère Big Data July 1, 2013 1 / 15 Agenda Contexte et Opportunité Les grandes lignes

Plus en détail

Environmental Research and Innovation ( ERIN )

Environmental Research and Innovation ( ERIN ) DÉpartEment RDI Environmental Research and Innovation ( ERIN ) Le département «Environmental Research and Innovation» (ERIN) du LIST élabore des stratégies, des technologies et des outils visant à mieux

Plus en détail

PLAteforme d Observation de l InterNet (PLATON)

PLAteforme d Observation de l InterNet (PLATON) PLAteforme d Observation de l InterNet (PLATON) Observatoire de l Internet et de ses Usages Projet plate-forme Initiative soutenue par Inria dans le cadre du consortium Metroscope (http://www.metroscope.eu)

Plus en détail

Big Data -Comment exploiter les données et les transformer en prise de décisions?

Big Data -Comment exploiter les données et les transformer en prise de décisions? IBM Global Industry Solution Center Nice-Paris Big Data -Comment exploiter les données et les transformer en prise de décisions? Apollonie Sbragia Architecte Senior & Responsable Centre D Excellence Assurance

Plus en détail

Etudier l informatique

Etudier l informatique Etudier l informatique à l Université de Genève 2015-2016 Les bonnes raisons d étudier l informatique à l UNIGE La participation à des dizaines de projets de recherche européens Dans la présente brochure,

Plus en détail

Guide de préparation d un projet

Guide de préparation d un projet École thémathique Guide de préparation d un projet ÉDITION 2015 dépasser les frontières Direction des ressources humaines Service formation et itinéraires professionnels DIRECTION DES RESSOURCES HUMAINES

Plus en détail

ETUDE ET IMPLÉMENTATION D UNE CACHE L2 POUR MOBICENTS JSLEE

ETUDE ET IMPLÉMENTATION D UNE CACHE L2 POUR MOBICENTS JSLEE Mémoires 2010-2011 www.euranova.eu MÉMOIRES ETUDE ET IMPLÉMENTATION D UNE CACHE L2 POUR MOBICENTS JSLEE Contexte : Aujourd hui la plupart des serveurs d application JEE utilise des niveaux de cache L1

Plus en détail

Présentation de la Grille EGEE

Présentation de la Grille EGEE Présentation de la Grille EGEE Introduction aux grilles La grille EGEE Exemples d applications en physique des particules et en sciences de la vie Le cercle vertueux Conclusion Guy Wormser Directeur de

Plus en détail

Dr YAO Kouassi Patrick www.yaopatrick.e-monsite.com

Dr YAO Kouassi Patrick www.yaopatrick.e-monsite.com Notion de Bases de données et Gestion de données biologiques Dr YAO Kouassi Patrick www.yaopatrick.e-monsite.com Notion de base de données Une base de données est une collection de données interdépendantes

Plus en détail

BIG DATA en Sciences et Industries de l Environnement

BIG DATA en Sciences et Industries de l Environnement BIG DATA en Sciences et Industries de l Environnement François Royer www.datasio.com 21 mars 2012 FR Big Data Congress, Paris 2012 1/23 Transport terrestre Traçabilité Océanographie Transport aérien Télémétrie

Plus en détail

ISTEX, vers des services innovants d accès à la connaissance

ISTEX, vers des services innovants d accès à la connaissance ISTEX, vers des services innovants d accès à la connaissance Synthèse rédigée par Raymond Bérard, directeur de l ABES, à partir du dossier de candidature d ISTEX aux Initiatives d excellence et des réunions

Plus en détail

Laboratoire d Informatique, de Traitement de l Information et des Systèmes EA 4108. 3 établissements T. Paquet D. Olivier T. Lecroq A.

Laboratoire d Informatique, de Traitement de l Information et des Systèmes EA 4108. 3 établissements T. Paquet D. Olivier T. Lecroq A. Laboratoire d Informatique, de Traitement de l Information et des Systèmes EA 4108 3 établissements T. Paquet D. Olivier T. Lecroq A. Benshrair 7 équipes Disciplines 27-61, 25-26-43-64 L. Heutte DocApp

Plus en détail

Filière MMIS. Modélisation Mathématique, Images et Simulation. Responsables : Stefanie Hahmann, Valérie Perrier, Zoltan Szigeti

Filière MMIS. Modélisation Mathématique, Images et Simulation. Responsables : Stefanie Hahmann, Valérie Perrier, Zoltan Szigeti Filière MMIS Modélisation Mathématique, Images et Simulation Responsables : Stefanie Hahmann, Valérie Perrier, Zoltan Szigeti Valerie.Perrier@imag.fr Modélisation mathématique, Images et simulation (MMIS)

Plus en détail

Le Big Data est-il polluant? BILLET. Big Data, la déferlante des octets VIVANT MATIÈRE SOCIÉTÉS UNIVERS TERRE NUMÉRIQUE TERRE (/TERRE)

Le Big Data est-il polluant? BILLET. Big Data, la déferlante des octets VIVANT MATIÈRE SOCIÉTÉS UNIVERS TERRE NUMÉRIQUE TERRE (/TERRE) Donner du sens à la science Rechercher Se connecter / S'inscrire Suivre VIVANT MATIÈRE SOCIÉTÉS UNIVERS TERRE NUMÉRIQUE MES THÈMES Types DOSSIER Paru le 15.11.2012 Mis à jour le 29.01.2014 Big Data, la

Plus en détail

E-BIOGENOUEST, VERS UN ENVIRONNEMENT VIRTUEL DE RECHERCHE (VRE) ORIENTÉ SCIENCES DE LA VIE? Intervenant(s) : Yvan Le Bras, Olivier Collin

E-BIOGENOUEST, VERS UN ENVIRONNEMENT VIRTUEL DE RECHERCHE (VRE) ORIENTÉ SCIENCES DE LA VIE? Intervenant(s) : Yvan Le Bras, Olivier Collin E-BIOGENOUEST, VERS UN ENVIRONNEMENT VIRTUEL DE RECHERCHE (VRE) ORIENTÉ SCIENCES DE LA VIE? Intervenant(s) : Yvan Le Bras, Olivier Collin E-BIOGENOUEST Programme fédérateur Biogenouest co-financé par les

Plus en détail

Communauté d Universités et Établissements. Stratégie Territoriale et Initiative d Excellence. Université Côte d Azur (UCA) - page 1

Communauté d Universités et Établissements. Stratégie Territoriale et Initiative d Excellence. Université Côte d Azur (UCA) - page 1 Communauté d Universités et Établissements Stratégie Territoriale et Initiative d Excellence Université Côte d Azur (UCA) - page 1 En 2015 le paysage français de l Enseignement supérieur et de la Recherche

Plus en détail

BIG DATA. Veille technologique. Malek Hamouda Nina Lachia Léo Valette. Commanditaire : Thomas Milon. Encadré: Philippe Vismara

BIG DATA. Veille technologique. Malek Hamouda Nina Lachia Léo Valette. Commanditaire : Thomas Milon. Encadré: Philippe Vismara BIG DATA Veille technologique Malek Hamouda Nina Lachia Léo Valette Commanditaire : Thomas Milon Encadré: Philippe Vismara 1 2 Introduction Historique des bases de données : méthodes de stockage et d analyse

Plus en détail

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles) SGBDR Systèmes de Gestion de Bases de Données (Relationnelles) Plan Approches Les tâches du SGBD Les transactions Approche 1 Systèmes traditionnels basés sur des fichiers Application 1 Gestion clients

Plus en détail

Sécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL

Sécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL Sécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL Présenté par Hana Gara Kort Sous la direction de Dr Jalel Akaichi Maître de conférences 1 1.Introduction

Plus en détail

Entrepôt de données 1. Introduction

Entrepôt de données 1. Introduction Entrepôt de données 1 (data warehouse) Introduction 1 Présentation Le concept d entrepôt de données a été formalisé pour la première fois en 1990 par Bill Inmon. Il s agissait de constituer une base de

Plus en détail

Bases de données relationnelles : Introduction

Bases de données relationnelles : Introduction Bases de données relationnelles : Introduction historique et principes V. Benzaken Département d informatique LRI UMR 8623 CNRS Université Paris Sud veronique.benzaken@u-psud.fr https://www.lri.fr/ benzaken/

Plus en détail

Bases de données Cours 1 : Généralités sur les bases de données

Bases de données Cours 1 : Généralités sur les bases de données Cours 1 : Généralités sur les bases de données POLYTECH Université d Aix-Marseille odile.papini@univ-amu.fr http://odile.papini.perso.esil.univmed.fr/sources/bd.html Plan du cours 1 1 Qu est ce qu une

Plus en détail

OBJECTIFS. Une démarche E-science

OBJECTIFS. Une démarche E-science E-BIOGENOUEST Programme fédérateur Biogenouest co-financé par les Régions Bretagne et Pays de la Loire 24 mois Lancé depuis Mai 2012 Porteur : Olivier Collin (IRISA) Animateur : Yvan Le Bras (IRISA) OBJECTIFS

Plus en détail

Architectures d'intégration de données

Architectures d'intégration de données Architectures d'intégration de données Dan VODISLAV Université de Cergy-ontoise Master Informatique M1 Cours IED lan Intégration de données Objectifs, principes, caractéristiques Architectures type d'intégration

Plus en détail

Direction des bibliothèques. Sondage Ithaka S+R. Questionnaire français Université de Montréal

Direction des bibliothèques. Sondage Ithaka S+R. Questionnaire français Université de Montréal Direction des bibliothèques Sondage Ithaka S+R Questionnaire français Université de Montréal Décembre 2014 Modules retenus Découverte Activités de recherche numérique Compétences informationnelles des

Plus en détail

transformer en avantage compétitif en temps réel vos données Your business technologists. Powering progress

transformer en avantage compétitif en temps réel vos données Your business technologists. Powering progress transformer en temps réel vos données en avantage compétitif Your business technologists. Powering progress Transformer les données en savoir Les données sont au cœur de toute activité, mais seules elles

Plus en détail

BD réparties. Bases de Données Réparties. SGBD réparti. Paramètres à considérer

BD réparties. Bases de Données Réparties. SGBD réparti. Paramètres à considérer Bases de Données Réparties Définition Architectures Outils d interface SGBD Réplication SGBD répartis hétérogènes BD réparties Principe : BD locales, accès locaux rapides accès aux autres SGBD du réseau

Plus en détail

GENIE STATISTIQUE GESTION DES RISQUES ET INGENIERIE FINANCIERE MARKETING QUANTITATIF ET REVENUE MANAGEMENT

GENIE STATISTIQUE GESTION DES RISQUES ET INGENIERIE FINANCIERE MARKETING QUANTITATIF ET REVENUE MANAGEMENT Remarque : Tous les cours sont en français, sauf contre-indication. Pour des traductions anglaises des titres, des descriptifs, et plus de renseignements, consultez l intégralité du Programme des enseignements

Plus en détail

Prestations de conseil en SRM (Storage Ressource Management)

Prestations de conseil en SRM (Storage Ressource Management) Prestations de conseil en SRM (Storage Ressource Management) Sommaire 1 BUTS DE LA PRESTATION 2 PRESENTATION DE LA PRESTATION 3 3 3 ETAPE 1 : ELEMENTS TECHNIQUES SUR LESQUELS S APPUIE LA PRESTATION DE

Plus en détail

Module BDR Master d Informatique (SAR)

Module BDR Master d Informatique (SAR) Module BDR Master d Informatique (SAR) Cours 6- Bases de données réparties Anne Doucet Anne.Doucet@lip6.fr 1 Bases de Données Réparties Définition Conception Décomposition Fragmentation horizontale et

Plus en détail

Les Entrepôts de Données

Les Entrepôts de Données Les Entrepôts de Données Grégory Bonnet Abdel-Illah Mouaddib GREYC Dépt Dépt informatique :: GREYC Dépt Dépt informatique :: Cours Cours SIR SIR Systèmes d information décisionnels Nouvelles générations

Plus en détail

Réunion Information Investissements d Avenir

Réunion Information Investissements d Avenir Réunion Information Investissements d Avenir Logiciel Embarqué et Objets Connectés Sophia, 16 Juillet 2013 Investissements Avenir : Réorientation Réorientation de 2,2 Mds$ du budget non engagé des IA Soutien

Plus en détail

Performances. Gestion des serveurs (2/2) Clustering. Grid Computing

Performances. Gestion des serveurs (2/2) Clustering. Grid Computing Présentation d Oracle 10g Chapitre VII Présentation d ORACLE 10g 7.1 Nouvelles fonctionnalités 7.2 Architecture d Oracle 10g 7.3 Outils annexes 7.4 Conclusions 7.1 Nouvelles fonctionnalités Gestion des

Plus en détail

Présentation du module Base de données spatio-temporelles

Présentation du module Base de données spatio-temporelles Présentation du module Base de données spatio-temporelles S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Partie 1 : Notion de bases de données (12,5h ) Enjeux et principes

Plus en détail

MASTER LPL : LANGUE ET INFORMATIQUE (P)

MASTER LPL : LANGUE ET INFORMATIQUE (P) MASTER LPL : LANGUE ET INFORMATIQUE (P) RÉSUMÉ DE LA FORMATION Type de diplôme := Master Domaine : Arts, Lettres, Langues Mention : LITTERATURE, PHILOLOGIE, LINGUISTIQUE Spécialité : LANGUE ET INFORMATIQUE

Plus en détail

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com Intelligence Artificielle et Systèmes Multi-Agents Badr Benmammar bbm@badr-benmammar.com Plan La première partie : L intelligence artificielle (IA) Définition de l intelligence artificielle (IA) Domaines

Plus en détail

MASTER SIS PRO : logique et sécurité DÉTECTION D INTRUSIONS. Odile PAPINI, LSIS. Université de Toulon et du Var. papini@univ-tln.

MASTER SIS PRO : logique et sécurité DÉTECTION D INTRUSIONS. Odile PAPINI, LSIS. Université de Toulon et du Var. papini@univ-tln. MASTER SIS PRO : logique et sécurité DÉTECTION D INTRUSIONS Odile PAPINI, LSIS. Université de Toulon et du Var. papini@univ-tln.fr Plan Introduction Généralités sur les systèmes de détection d intrusion

Plus en détail

Laboratoire d informatique Gaspard-Monge UMR 8049. Journée Labex Bézout- ANSES

Laboratoire d informatique Gaspard-Monge UMR 8049. Journée Labex Bézout- ANSES Laboratoire d informatique Gaspard-Monge UMR 8049 Journée Labex Bézout- ANSES Présentation du laboratoire 150 membres, 71 chercheurs et enseignants-chercheurs, 60 doctorants 4 tutelles : CNRS, École des

Plus en détail

Master "Generating Eco Innovation"

Master Generating Eco Innovation International chair in "Generating Eco-innovation" Master "Generating Eco Innovation" Programme pédagogique 2009-2010 UE 1 : Prospective et compétitivité internationale (88 heures) UE 11 : Nature de l

Plus en détail

Les technologies du Big Data

Les technologies du Big Data Les technologies du Big Data PRÉSENTÉ AU 40 E CONGRÈS DE L ASSOCIATION DES ÉCONOMISTES QUÉBÉCOIS PAR TOM LANDRY, CONSEILLER SENIOR LE 20 MAI 2015 WWW.CRIM.CA TECHNOLOGIES: DES DONNÉES JUSQU'À L UTILISATEUR

Plus en détail

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION Classe de terminale de la série Sciences et Technologie du Management et de la Gestion Préambule Présentation Les technologies de l information

Plus en détail

Informatique Médicale & Ingénierie des Connaissances Pour la e-santé

Informatique Médicale & Ingénierie des Connaissances Pour la e-santé Li ics Laboratoire d Informatique Médicaleet d Ingénierie des Connaissances en e-santé Projet de création d une UMR Inserm Université Pierre et Marie Curie, Université Paris Nord Informatique Médicale

Plus en détail

PROJET BIGDATART DOSSIER DE PRESENTATION

PROJET BIGDATART DOSSIER DE PRESENTATION PROJET BIGDATART DOSSIER DE PRESENTATION Le projet BigDatArt est une installation scientifico-artistique centrée autour des notions d images et de BigData. Ce que je propose dans mon projet et d'inverser

Plus en détail

et les Systèmes Multidimensionnels

et les Systèmes Multidimensionnels Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Datawarehouse (DW) Le Datawarehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées

Plus en détail

DocForum 18 Juin 2015. Réussites d un projet Big Data Les incontournables

DocForum 18 Juin 2015. Réussites d un projet Big Data Les incontournables DocForum 18 Juin 2015 Réussites d un projet Big Data Les incontournables Vos interlocuteurs Mick LEVY Directeur Innovation Business mick.levy@businessdecision.com 06.50.87.13.26 @mick_levy 2 Business &

Plus en détail

FORMATIONS OUVRANT DROIT AU VERSEMENT DE LA TAXE D'APPRENTISSAGE Année Universitaire 2014-2015

FORMATIONS OUVRANT DROIT AU VERSEMENT DE LA TAXE D'APPRENTISSAGE Année Universitaire 2014-2015 FORMATIONS OUVRANT DROIT AU VERSEMENT DE LA TAXE D'APPRENTISSAGE Année Universitaire 2014-2015 Organisme gestionnaire : UNIVERSITE LILLE 1 59655 Villeneuve d'ascq Cedex Siret : 19593559800019 Tél 03 20

Plus en détail