Mastodons Une approche interdisciplinaire des Big Data

Dimension: px
Commencer à balayer dès la page:

Download "Mastodons Une approche interdisciplinaire des Big Data"

Transcription

1 Mastodons Une approche interdisciplinaire des Big Data Méga- données, IRIT Nov 2014 Mokrane Bouzeghoub DAS INS2I / MI CNRS - Mission pour l'interdisciplinarité Mokrane Bouzeghoub 1 1 Introduction 2 CNRS - Mission pour l'interdisciplinarité Mokrane Bouzeghoub 2 1

2 Deux constats La collecte, la produc.on et la dissémina.on à grande échelle de données sont devenues des «réflexes» de la société numérique Systèmes d observa.on Espace/Terre, Expérimenta.ons scien.fiques, Simula.on, Réseaux sociaux, Déluge de données (Big Data) dont l amplitude est inimaginable il y a qq années encore. Le traitement efficace de ces données défie les modèles classiques de calcul, de stockage, de communica.on et d explora.on des données Comment analyser ces données, les interpréter et les valoriser en connaissances scien.fiques ou sociétales? Quelles avancées technologiques, architecturales et algorithmiques permerent de répondre à ces défis? CNRS - Mission pour l'interdisciplinarité Mokrane Bouzeghoub 3 Aucun domaine n échappe à l avalanche des données Commerce et les affaires SI d entreprise, Banques, transactions commerciales, systèmes de réservation, Gouvernements et organisations Lois, réglementations, standards, infrastructures,. Loisirs Musique, vidéo, jeux, réseaux sociaux Sciences fondamentales Astronomie, physique et énergie, génome, Santé Dossier médical, sécurité sociale, Environnement Climat, dév durable, pollution, alimentation, Humanités et Sciences Sociales Numérisation du savoir (littérature, histoire,art, srchitectures), données archéologiques CNRS - Mission pour l'interdisciplinarité Mokrane Bouzeghoub 4 2

3 Les applications opérant sur des grandes MdD Applications d analyse Pas de mises à jour, pas de transactions ü ü ü OLAP, BI Fouille de données Apprentissage Applications scientifiques explorant des domaines inaccessibles à la théorie et à l expérimentation Évolution de l univers (observation) Crash test de véhicules (simulation) Prédiction des changements du climat (modélisation) CNRS - Mission pour l'interdisciplinarité Mokrane Bouzeghoub 5 Pourquoi pas les SGBD? Fin de l ère «One Size Fits All» Il faut offrir des architectures de données flexibles, avec des services de gestion de données adaptables à chaque type d application/type de données Les SGBD ne sont plus visibles en tant que systèmes intégrés et cohérents les fonctions de gestion de données sont enfouies dans des systèmes à plus forte valeur ajoutée (services métiers, process de haut niveau) La gestion de données: une offre de services web On n achète plus un SGBD mais des services Web opérant sur des sources locales ou distribuées Les services de gestion de données sont sous-jacents au Cloud/Grid CNRS - Mission pour l'interdisciplinarité Mokrane Bouzeghoub 6 3

4 De la Gestion des Données à La Science Des Données 7 CNRS - Mission pour l'interdisciplinarité Mokrane Bouzeghoub 7 Les grandes questions de la Science des Données La science est- elle dans les masses de données? La valeur de ces données réside dans les indicateurs, les parerns et les règles/lois qui peuvent en être dérivés (connaissance) Ces données sont importantes non seulement en raison de leur quan.té mais aussi en raison des rela.ons existantes entre elles (séman.que) Les données peuvent être source de plus- value scien.fique mais aussi source de bruit et de pollu.on (qualité, hétérogéneité, manipula.on) Les masses de données nous parlent- elles de notre société? Nous disent- elles quelque chose que nous ne sachions déjà? Diront- elles quelque chose de nous aux généra.ons futures? Ont- elles une objec.vité en elles- mêmes ou sont- elles biaisées par des transforma.ons subjec.ves? Les masses de données génèrent- elles une valeur économique? Quels sont les secteurs privilégiés? Quel retour sur inves.ssement? Quel rôle pour ces données (ma.ère première, produits dérivés, capital, )? Quel statut pour ces données (propriété privée, domaine publique, objet CNRS - Mission commercial)? pour l'interdisciplinarité Mokrane Bouzeghoub 8 4

5 Science des données : un 4 e pilier de la Science La disponibilité de très grandes masses de données et la capacité de les traiter de manière efficace est en train de modifier la manière dont nous faisons de la science 1. Science empirique : observa.ons de phénomènes naturels, évalua.on de faits mesurables, extrac.on de lois générales par raisonnement induc.f 2. Science théorique : cadre de travail offrant des modèles (mathéma.ques) pour comprendre un certain univers 3. Science computa.onnelle : simula.on de phénomènes complexes pour comprendre ou valider des théories 4. Science des données: collecte massive de données et traitement pour en extraire des connaissances nouvelles CNRS - Mission pour l'interdisciplinarité Mokrane Bouzeghoub 9 Complexité multidimensionnelle du Big Data Nouvelles archi. de stockage Nouvelles archi. d interopérabilité Défi pour les réseaux de communica.on Nouveaux modèles de calcul sur des flux NeRoyage et transforma.on Fusion de données Nouveaux modèles de qualité (données & processus de traitement) hnp:// veracity 10 CNRS - Mission pour l'interdisciplinarité Mokrane Bouzeghoub 10 5

6 27/11/14 Emergence du Big Data Exemple : Linked Open Data Accès à plusieurs BD scientifiques et culturelles interconnectées sur le Web Ini.ée en 2007 avec une dizaine de sources de données interconnectées Aujourd hui, plusieurs centaines de sources connectées et ouvertes 11 CNRS - Mission pour l'interdisciplinarité Mokrane Bouzeghoub Qu est-ce qu une (très grande) masse de données? Big Data VLDB LDB X B Very ta ig Da Data Deluge es ta ass M a Grandes Conf du domaine: VLDB, XLDB, ICDE, EDBT, at CNRS - Mission D pour l'interdisciplinarité Mokrane Bouzeghoub Mas siv e Da 12 6

7 Challenges scientifiques 13 CNRS - Mission pour l'interdisciplinarité Mokrane Bouzeghoub 13 Les grands challenges scientifiques de MdD&SdD Stockage et préserva.on des données Performance des accès, disponibilité des données ProtecWon des données IndexaWon sémanwque (ontologies), indexawon parwcipawve (folksonomies) PréservaWon à long terme Analyse sta.s.que et séman.que, raisonnement Analyse en temps réel de flux conwnus de données émanant de différentes sources Requêtes mulwdimensionnelles sur des grands ensembles de données ExtracWon et interprétawon de connaissances Impact sociétal et économique ProtecWon de la vie privée, Droit à l oubli Droits de propriétés, droits d exploitawon Economie d énergie, coût du stockage, coût de transfert è 120 kwh/an/to stocké par CCIN2P3 è 1M /an facture électricité de l IDRIS CNRS - Mission pour l'interdisciplinarité Mokrane Bouzeghoub 14 7

8 Exemple 1 : Analyse complexe à grande échelle Analyse en temps réel de flots continus de données émanant de différentes sources Ex: Découvrir et comprendre les patterns caractéristiques du comportement de certains phénomènes ou certaines populations Réaction en temps réel à des événements d alerte Ex: attaques sur le réseau Requêtes multidimensionnelles sur des grands ensembles de données Découvrir des corrélations entre phénomènes CNRS - Mission pour l'interdisciplinarité Mokrane Bouzeghoub 15 Exemple 2 : La visualisation des données Besoins Navigation intuitive/contextuelle Visualisation de phénomènes non perceptibles (durant la simulation) Analyse /Interaction visuelle Problèmes L approche de visualisation peut-elle aider à la compréhension d un phénomène Ou peut-elle introduire un biais et en altérer l interprétation? visualcomplexity.com/vc Ex: Visualisation post traitement V.S Visualisation in-situ Évite des zones d ombre par perte de calculs intermédiaires à Coupler la simulation et la visualisation (vars température, pression, ) Ex: Swiss Nat Supercomputing Center CNRS - Mission pour l'interdisciplinarité Mokrane Bouzeghoub 16 8

9 Une grande créativité pour faciliter l analyse/l interprétation visualcomplexity.com CNRS - Mission pour l'interdisciplinarité Mokrane Bouzeghoub 17 Exemple 3 : La préservation des données Comment préserver les données à durée de vie illimité? connaissances scientifiques produits culturelles connaissances archéologiques et environnementales connaissances sociales (recensements) Comment préserver les données à durée de vie longue mais limitée patrimoine informationnel des entreprises Données personnelles (stockées dans les disques privés ou publiés sur le Web) Données publiques (fichiers sécu, police, ) Quel coût pour la préservation des données Coût de conversion des données (formats) Coût pour la migration des technologies Coût de maintien des technologies de niche Quelle stratégie pour les données gérées dans le Cloud? CNRS - Mission pour l'interdisciplinarité Mokrane Bouzeghoub 18 9

10 Initiatives en Big Data Ex. du Défi Mastodons 19 CNRS - Mission pour l'interdisciplinarité Mokrane Bouzeghoub 19 Quelques exemples d initiatives USA Govt US: Big Data Research and Development IniWaWve (Mars 2012) ü 250M$ / an dont 60 pour les projets de recherche ü mis en œuvre par NSF, NIH, DOD, DOE, USGS) Accel Partners: fond d inveswssement à 60 M$ / an de souwen à la créawon de startups dans le Big Data UK ESRC Big Data Network (2012) : 3 phases, PHASE 2 AVR 2013: 60M. BBSRC (2012): 75 M pour améliorer la disponibilité des Big Data France PIA: Appel Cloud Comp & Big Data Ministère de l Industrie (juillet 2012): 25 M CNRS: IniWaWve interdisciplinaire (Mastodons): 800K /an sur 4/5 ans? CNRS - Mission pour l'interdisciplinarité Mokrane Bouzeghoub 20 10

11 Le Défi Mastodons : Objectifs Produire des concepts et des solu.ons qui n'auraient pu être obtenus sans coopéra.on entre les différentes disciplines Favoriser l émergence d une communauté scien.fique interdisciplinaire autour de la science des données, et produire des solu.ons originales sur le périmètre des données scien.fiques. CNRS - Mission pour l'interdisciplinarité Mokrane Bouzeghoub 21 Mastodons : Chiffres clés Défi lancé en 2012, avec un second appel en 2013 Projets de 3 à 5 ans avec un budget de 700 à 885 K /an Nb de soumissions: 58 Nb d UMR impliquées: + 100, Couvrant les 10 ins.tuts Nb de projets retenus: Reste 16+1 projets en janvier 2014, cible janvier 2015: 10 projets Degré de pénétra.on dans les labos Nb d UMR impliquées: 69, couvrant les 10 ins.tuts Nb de CH/EC impliqués: près de 300 Montant alloué/projet/an 30 à 120 K (projets ayant fusionné) Partenaires hors CNRS INRIA, INRA, IRSTEA, INSERM, CEA, ONERA, Universités et écoles CNRS - Mission pour l'interdisciplinarité Mokrane Bouzeghoub 22 11

12 Thématiques couvertes et thématiques orphelines Collecte, stockage et indexation de données (en particulier dans le Cloud) Hétérogénéité, interopérabilité, intégration, partage des données Calcul intensif sur des grands volumes de données, parallélisme dirigé par les données, optimisation Extraction de connaissances, datamining et apprentissage, agrégation/résumé, sémantique et raisonnement Visualisation de grandes masses de données Qualité des données, protection et sécurité des données Problèmes de propriété, de droit d usage, droit à l oubli Consommation d énergie, environnement, recyclage Préservation/archivage des données pour les générations futures (animation) CNRS - Mission pour l'interdisciplinarité Mokrane Bouzeghoub 23 Projets Mastodons Titre du projet Porteur UMR Impliquées Instituts/Organismes Nombre de permanents PetaSky: Gestion et exploration des grandes masses de données scientifiques issues d observations astronomiques grand champ Farouk Toumani LIMOS, LIRIS, LPC, APC, LAL INS2I/INSIS, IN2P3 29 AMADEUS: Analysis of MAssive Data in Earth and Universe Sciences Analyse de données massives en Sciences de la Terre et de l Univers Sofian Maabout LABRI, LIRMM, LIF, CEREGE, LAM INS2I, INSU 15 Gaia: l origine et l évolution de notre Galaxie : validation des données Frédéric Arenou GEPI, IMCCE, PRISM, LMPP INSU, INS2I, INSMI 7 SeqPhenoHD: Défis computationnels des séquençages et phénotypage haut-débit en science de la vie Eric Rivals / Esther Pacitti LIRMM, CEFE, EFE, IPMC, IRISA, ISEM, LEPSE INS2I, INSB, INEE, INRA 16 CrEDIBLE : fédération de données et de ConnaissancEs Distribuées en Imagerie BiomédicaLE Johan Montagnat I3S, LTSI, CREATIS, MIS INS2I, INSIS, INSB, INSERM 9 PROSPECTOM: Etude visuelle et interactive des protéomes par apprentissage statistique et intégration des bases de données et de connaissances spectrométriques et «omiques». Gilles Bisson LIG, irtsv INS2I, INSB, CEA 6 ARESOS: Reconstruction, Analyse et Accès aux Données dans les Grands Réseaux Socio Sémantiques Patrick Gallinari LIP6, CAMS, LIG, LIRIT, LATTICE, IRISA INS2I, INSMI, INSHS 23 SENSE : Socialized Network Science Pablo Jensen LP, LIP, IXXI, Max Weber INP, INS2I, INSHS 6 CROWD-BIODIV: Statistiques Crowdsourcing Biodiversité Romain Julliard MNHN, CMAP, CEFE INEE, INSMI, INRA 7 CROWD-HEALTH: A crowd-based platform for health-related hypothesis testing Sihem Amer-Yahia LIG, EVS,UREN, LIPADE INS2I, INSHS, INRA U.P5, U.P13 7 SABIOD : Scaled Acoustic BioDiversity Hervé Glotin LSIS, LIP6, CNPS, MNHN, LIG, GeoAzur INSB, INS2I 29 CNRS - Mission pour l'interdisciplinarité Mokrane Bouzeghoub 24 12

13 Projets Mastodons Tera_SAR: Massification du calcul des déformations de surface par imagerie radar multi---temporelle, multi--- spectrale et haute résolution Marie-Pierre Doin ISTerre, IPGP, GIPSA, LISTIC(EA) INSU(2), INS2I 15 SISMO : Grandes masses de données sismologiques: Exploration complète des grandes masses de données sismologiques: études de l intérieur de la Terre à partir Nikolai Shapiro IPGP, LJLL, Langevin INSU, INSMI, INSIS/INP 7 des champs d onde complexes EPINES: production, distribution et analyse des résultats de simulations climatiques. Jean-Louis Dufresne IPSL, KerData INSU, INRIA 5 Gargantua: Optimisation mathématique et apprentissage statistique à grande échelle pour le traitement et l'interprétation de données gigantesques Zaid Harchaoui LJK, LIG, DI-ENS, LPP INSMI, INS2I, INRIA 13 DISPLAY: Distributed processing for very large arrays in radioastronomy Andre Ferrari LJLL, SATIE, Artemis, LTCI, INSMI, INS2I 17 COMOTEX: COMmande temps réel de systèmes d'optique adaptative à très grand nombre de degrés de liberté pour les Télescopes EXtrêmement grands Brice Le Roux / Morgan Gray LAM, CEREA INSU, ONERA, ENPC 8 MesureHD: Développement de nouveaux protocoles de mesure, d'analyse et de traitement des données adaptés aux mesures à hautes résolutions et à haut débit par Marc-andre Delsuc des méthodes biophysiques. IGBMC, icube, LIGM, LJLL + INSB(2), INS2I, INSIS, (Soleil, Institut Pasteur, MSAP) INSMI(2), INC(2) 10 AMADOUER: Analyse de MAsse de DOnnées de l Urbain et l EnviRonnement Sylvie Servigne LIRIS, EVS, CETHIL,LGCIE INS2I, INSHS, INEE, INSIS 18 ANIMITEX: Analyse d'images fondée sur des informations textuelles Mathieu Roche LIRMM, TETIS, icube, GREYC, LIUPPA(EA) INS2I(2), IRSTEA, INSIS 13 DEEPHY: Data in physics - Large-scale data storage, data management, and data analysis for next generation particle physics experiments Balazs Kegl LAL, LIP, LRI IN2P3, INS2I 11 PREDON: La préservation et l exploitation des données scientifiques à long terme Cristinel Diacanou CPPM, LPCCG, LAPP IN2P3, INS2I, INSU, CINES, IRD 23 CNRS - Mission pour l'interdisciplinarité Mokrane Bouzeghoub 25 Types de données visés dans les projets retenus Cosmologie, astrophysique Dynamique de la Cartographie céleste Sciences de la terre et de l univers (traitement d images) Modélisa.on, déforma.on de la croute terrestre Environnement, climat, biodiversité Simula.on, intégra.on, fusion de données Biologie santé Génome, séquençage, phénotypage Données médicales Réseaux sociaux RI, analyse d opinions, santé Crowdsourcing CNRS - Mission pour l'interdisciplinarité Mokrane Bouzeghoub 26 13

14 Projet Aresos : Analyse de grands réseaux socio-sémantiques CAMS - INSMI, EHESS, Paris CSI - INSHS, Ecole des Mines, Paris IRIT - INS2I, U. Toulouse 3 LATTICE - INSHS, ENS/ U. Paris 3 LIG - INS2I, UJF, Grenoble LIP6 - INS2I, UPMC, Paris IRISA, INS2I, U. Rennes 1 GIS ISC- PIF, INSHS Objec.fs : qui parle, de quoi, comment Reconnaissance d acteurs Analyse sociologique Recherche d informa.on dans les microblogs Iden.fica.on de théma.ques Recommanda.on collabora.ve CrowdIndexing, tagging social Défi MASTODONS - Projet ARESOS CNRS - Mission pour l'interdisciplinarité Mokrane Bouzeghoub Projet SeqPhénoHD : Séquençage & Phénotypage Haut Débit Info et bio- info LIRMM, LIFL, IRISA Phénotypage INRA Génome France Génomique Biologie- environnement ISEM Etude du comportement des plantes, de différents génomes, Densité végéta.on (nb de feuilles) Croissance (rapidité, hauteur, encombrement, ) selon les évolu.ons de leur environnement Température, Humidité, Lumière/Ensoleillement Exemple 400 génomes 3 à 10 plants par génome 10 5 informa.ons / jour CNRS - Mission pour l'interdisciplinarité Mokrane Bouzeghoub 28 14

15 Projet PetaSky : observation astronomique grand champ (LSST) LIMOS (Clermont- Fd)=> F. Toumani LIRIS (Lyon) LPC (Clermont- Fd) APC (Paris) LAL (Paris) Centre de Calcul de l IN2P3/CNRS 15 CEC, 8 ITA, 2 Doct. Ges.on des données scien.fiques dans le domaine de la cosmologie et l astrophysique Des dizaines de milliers de milliards d observa.ons photométriques sur des dizaines de milliards d'objets 3 Milliards de sources 1-10 Millions d évènements par nuit 16 TB chaque 8 heures avec un taux de 540 MB/seconde EsWmaWon en fin de projet : Milliards de tuples (différentes versions des données sans prise en compte de la réplicawon), 60 PB CNRS - Mission pour l'interdisciplinarité Mokrane Bouzeghoub 29 Défi de la gestion des données dans LSST Requêtes sur une centaine d anributs Analyse en temps réel de 2 TB/heure Surveillance en temps réel des variawons de 10 Milliards d objets Requêtes type Point- query (chercher une aiguille dans une bone de foin) CorrélaWons : adresser par paires 109 galaxies Séries temporelles : 10 ans de données, 1000 visites par pointé Passage à l échelle des ouwls d aide à la décision OpWmiser l organisawon des données pour l analyse Une nouvelle approche pour l extracwon des connaissances en temps réel CNRS - Mission pour l'interdisciplinarité Mokrane Bouzeghoub 30 15

16 Indicateurs de suivi Pérennité de la coopéra.on Publica.ons communes Co- encadrement de thèses Plateformes de test et d expérimenta.on Montage et soumission de nouveaux projets Dynamique pour faire émerger une communauté interdisciplinaire sur la science des données. CNRS - Mission pour l'interdisciplinarité Mokrane Bouzeghoub 31 Indicateurs de suivi : quelques chiffres (Janv 2014) Publica.ons communes 25 publica.ons de haut niveau 5 workshops interna.onaux organisées Plusieurs workshops na.onaux et journées d études propres aux projets ou inter- projets Levier pour lancer d autres projets France: 1 ANR (projet Display è Magellan) Europe: 1: 1 COST Big Data Era in Sky and Earth Observa.on ü 16 pays partenaires dont les membres de PetaSky + Gaia Autres impacts (projet Sabiod) Bird Challenge: Iden.fy bird species from con.nuous audio recordings Expédi.on GoéleRe TARA: collecte et traitement de données sur la pollu.on en méditerrannée CNRS - Mission pour l'interdisciplinarité Mokrane Bouzeghoub 32 16

17 Perspectives 2015 Poursuivre la structura.on de la communauté Via le financement des gros projets (regroupement, renforcement) Via le nouveau GDR MaDICS (anima.on) Susciter de nouveaux projets (si budget) Les problèmes de droit d usage, de propriété, d oubli (aspect SHS) Le crowdsourcing (aspects SHS) Lancer un nouveau défi sur le traitement d images Année théma.que pour INS2I Coloriage de postes de CR1/CR2 Sou.en aux plateformes (ingénieurs) Sou.en aux recherches théoriques (AAP) Réfléchir à une stratégie plus ambi.euse pour le CNRS CNRS - Mission pour l'interdisciplinarité Mokrane Bouzeghoub 33 Initiatives en Big Data Ex. du Défi Mastodons 34 CNRS - Mission pour l'interdisciplinarité Mokrane Bouzeghoub 34 17

18 Conclusion Un domaine très vaste en interacwon permanente avec les autres disciplines scienwfiques Un domaine qui se reposi.onne périodiquement En revisitant ses soluwons à la lumière de nouvelles technos et de nouvelles idées En intégrant de nouveaux besoins et de nouveaux problèmes Une recherche dominée (ou presque) par des labos industriels : Google, Facebook, Yahoo!, Amazone, IBM, Oracle, Microsox CNRS - Mission pour l'interdisciplinarité Mokrane Bouzeghoub 35 Discussion Structura.on de la communauté Créa.on d un GDR (MaDICS) Émergence de sites de références La recherche en Big Data ne peut être fructueuse sans un rapprochement des chercheurs des grands centres de produc.on et d exploita.on des données (existants ou à créer) Avec un sou.en fort en ingénierie Une véritable interdisciplinarité Un code clair sur l accès aux données et leur u.lisa.on CNRS - Mission pour l'interdisciplinarité Mokrane Bouzeghoub 36 18

19 Big Data, la déferlante des octets CNRS le journal Donner du sens à la science Rechercher Rechercher Se connecter / S'inscrire Suivre file:///users/mokrane-cnrs/desktop/big%20data,%20la%20déferlante%20des%20octets%20%7c%20cnrs%20le%20journal.webarchive 04/03/14 12:30 Partager l'article Types Page 1 sur 10 27/11/14 Big Data : un enjeu pour le CNRS VIVANT MATIÈRE SOCIÉTÉS UNIVERS TERRE NUMÉRIQUE MES THÈMES CNRS - Mission pour l'interdisciplinarité Mokrane Bouzeghoub 37 Big Data = Big Topic CNRS - Mission pour l'interdisciplinarité Mokrane Bouzeghoub 38 19

Emergence du Big Data Exemple : Linked Open Data

Emergence du Big Data Exemple : Linked Open Data 16/05/2014 Une approche interdisciplinaire des grandes masses de données (Défi Mastodons) Mokrane Bouzeghoub DAS INS2I / MI 1 Emergence du Big Data Exemple : Linked Open Data Accès à plusieurs BD scientifiques

Plus en détail

Emergence du Big Data Exemple : Linked Open Data

Emergence du Big Data Exemple : Linked Open Data 1 CNRS - Misionpour l'interdisciplinarité Mokrane Bouzeghoub 1 Une approche interdisciplinaire des grandes masses de données (Défi Mastodons) Mokrane Bouzeghoub DAS INS2I / MI Ecole de L Innova.on Thérapeu.

Plus en détail

Mastodons. Une Approche Interdisciplinaire des Big Data. Mokrane Bouzeghoub CNRS / INS2I & MI !"#$%&%'()*%+,$-.'."$%%

Mastodons. Une Approche Interdisciplinaire des Big Data. Mokrane Bouzeghoub CNRS / INS2I & MI !#$%&%'()*%+,$-.'.$%% Mastodons Une Approche Interdisciplinaire des Big Data Mokrane Bouzeghoub CNRS / INS2I & MI!"#$%&%'()*%+,$-.'."$%% PLAN Quelques concepts de base Les ouels du Big Data Le défi Mastodons (CNRS) Conclusion

Plus en détail

Sommaire. Par$e 1 : Enjeux et probléma$ques des masses de données. Par$e 2 : Le défi Mastodons. Par$e 3 : Focus sur quelques projets

Sommaire. Par$e 1 : Enjeux et probléma$ques des masses de données. Par$e 2 : Le défi Mastodons. Par$e 3 : Focus sur quelques projets Mastodons Une approche interdisciplinaire des grandes masses de données (Big Data) Mokrane Bouzeghoub DAS INS2I / MI 1 Sommaire Par$e 1 : Enjeux et probléma$ques des masses de données Par$e 2 : Le défi

Plus en détail

Masses de données. 1. Introduction 2. Problématiques 3. Socle de formation (non présenté) 4. Liens avec Formation INSA

Masses de données. 1. Introduction 2. Problématiques 3. Socle de formation (non présenté) 4. Liens avec Formation INSA Masses de données 1. Introduction 2. Problématiques 3. Socle de formation (non présenté) 4. Liens avec Formation INSA Rédacteurs : Mjo Huguet / N. Jozefowiez 1. Introduction : Besoins Informations et Aide

Plus en détail

Indexmed : Le big data en écologie? Pas encore disent certains. Pas si sûr! Avec IndexMed. Relevons ce challenge!

Indexmed : Le big data en écologie? Pas encore disent certains. Pas si sûr! Avec IndexMed. Relevons ce challenge! Indexmed : Le big data en écologie? Pas encore disent certains Pas si sûr! Avec IndexMed Relevons ce challenge! Origine du consortium L état des lieux (source : séminaire Allenvie, séminaire Indexmed1)

Plus en détail

L'écosystème du calcul intensif et des données : la vision du CNRS. M. Daydé. Directeur du Comité d Orientation pour le Calcul Intensif au CNRS

L'écosystème du calcul intensif et des données : la vision du CNRS. M. Daydé. Directeur du Comité d Orientation pour le Calcul Intensif au CNRS L'écosystème du calcul intensif et des données : la vision du CNRS M. Daydé Directeur du Comité d Orientation pour le Calcul Intensif au CNRS Délégué Scientifique CNRS / INS2 Rôle et missions du COCIN

Plus en détail

Jean-François Boulicaut & Mohand-Saïd Hacid

Jean-François Boulicaut & Mohand-Saïd Hacid e siècle! Jean-François Boulicaut & Mohand-Saïd Hacid http://liris.cnrs.fr/~jboulica http://liris.cnrs.fr/mohand-said.hacid Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205

Plus en détail

FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis

FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis Joseph Salmon Télécom ParisTech Jeudi 6 Février Joseph Salmon (Télécom ParisTech) Big Data Jeudi 6 Février 1 / 18 Agenda Contexte et opportunités

Plus en détail

e-biogenouest CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé

e-biogenouest CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé e-biogenouest Coordinateur : Olivier Collin Animateur : Yvan Le Bras CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé

Plus en détail

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université

Plus en détail

Les Rencontres ANR du numérique 2013

Les Rencontres ANR du numérique 2013 Les Rencontres ANR du numérique 2013 Jean-Yves Berthou ANR, Directeur dept. Sciences et Technologies de l Information et de la Communication Le Numérique à l ANR Quelques éléments marquants et réflexions

Plus en détail

July 1, 2013. Stéphan Clémençon (Télécom ParisTech) Mastère Big Data July 1, 2013 1 / 15

July 1, 2013. Stéphan Clémençon (Télécom ParisTech) Mastère Big Data July 1, 2013 1 / 15 Mastère Spécialisé Big Data Stéphan Clémençon Télécom ParisTech July 1, 2013 Stéphan Clémençon (Télécom ParisTech) Mastère Big Data July 1, 2013 1 / 15 Agenda Contexte et Opportunité Les grandes lignes

Plus en détail

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci http://liris.cnrs.fr/hamamache.kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de

Plus en détail

Indexmed : Le big data en écologie? Pas encore disent certains. Pas si sûr! Avec IndexMed. Relevons ce challenge!

Indexmed : Le big data en écologie? Pas encore disent certains. Pas si sûr! Avec IndexMed. Relevons ce challenge! Indexmed : Le big data en écologie? Pas encore disent certains Pas si sûr! Avec IndexMed Relevons ce challenge! Origine du consortium L état des lieux (source : séminaire Allenvie, séminaire Indexmed1)

Plus en détail

parée e avec C. Germain, B. Kegl et M. Jouvin CS de l Université Paris Sud

parée e avec C. Germain, B. Kegl et M. Jouvin CS de l Université Paris Sud Présentation prépar parée e avec C. Germain, B. Kegl et M. Jouvin CS de l Université Paris Sud (pré)histoire de la Grille Paris Sudn1 Les besoins de la communauté HEP La collaboration physiciens/informaticiens

Plus en détail

Masses de données et calcul : à l IRIT. 8 octobre 2013

Masses de données et calcul : à l IRIT. 8 octobre 2013 Masses de données et calcul : la recherche en lien avec les Big Data à l IRIT 8 octobre 2013 08/10/2013 1 L IRIT en qq chiffres 700 personnes sur tous les sites toulousains 5 tutelles 7 thèmes et 21 équipes

Plus en détail

L informatique à l IN2P3 et le rôle du Chargé de Mission

L informatique à l IN2P3 et le rôle du Chargé de Mission L informatique à l IN2P3 et le rôle du Chargé de Mission Giovanni Lamanna Réunion du comité des DUs 29 avril 2013 Plan - Présentation du Charge de Mission pour l Informatique - Lettre de mission: défis

Plus en détail

Le Big Data est-il polluant? BILLET. Big Data, la déferlante des octets VIVANT MATIÈRE SOCIÉTÉS UNIVERS TERRE NUMÉRIQUE TERRE (/TERRE)

Le Big Data est-il polluant? BILLET. Big Data, la déferlante des octets VIVANT MATIÈRE SOCIÉTÉS UNIVERS TERRE NUMÉRIQUE TERRE (/TERRE) Donner du sens à la science Rechercher Se connecter / S'inscrire Suivre VIVANT MATIÈRE SOCIÉTÉS UNIVERS TERRE NUMÉRIQUE MES THÈMES Types DOSSIER Paru le 15.11.2012 Mis à jour le 29.01.2014 Big Data, la

Plus en détail

TRAVAUX DE RECHERCHE DANS LE

TRAVAUX DE RECHERCHE DANS LE TRAVAUX DE RECHERCHE DANS LE DOMAINE DE L'EXPLOITATION DES DONNÉES ET DES DOCUMENTS 1 Journée technologique " Solutions de maintenance prévisionnelle adaptées à la production Josiane Mothe, FREMIT, IRIT

Plus en détail

Communauté d Universités et Établissements. Stratégie Territoriale et Initiative d Excellence. Université Côte d Azur (UCA) - page 1

Communauté d Universités et Établissements. Stratégie Territoriale et Initiative d Excellence. Université Côte d Azur (UCA) - page 1 Communauté d Universités et Établissements Stratégie Territoriale et Initiative d Excellence Université Côte d Azur (UCA) - page 1 En 2015 le paysage français de l Enseignement supérieur et de la Recherche

Plus en détail

E-BIOGENOUEST, VERS UN ENVIRONNEMENT VIRTUEL DE RECHERCHE (VRE) ORIENTÉ SCIENCES DE LA VIE? Intervenant(s) : Yvan Le Bras, Olivier Collin

E-BIOGENOUEST, VERS UN ENVIRONNEMENT VIRTUEL DE RECHERCHE (VRE) ORIENTÉ SCIENCES DE LA VIE? Intervenant(s) : Yvan Le Bras, Olivier Collin E-BIOGENOUEST, VERS UN ENVIRONNEMENT VIRTUEL DE RECHERCHE (VRE) ORIENTÉ SCIENCES DE LA VIE? Intervenant(s) : Yvan Le Bras, Olivier Collin E-BIOGENOUEST Programme fédérateur Biogenouest co-financé par les

Plus en détail

Cycle de vie, processus de gestion

Cycle de vie, processus de gestion Les données scientifiques au CNES Cycle de vie, processus de gestion Danièle BOUCON Réunion PIN du 4 janvier 2013 Réunion PIN du 22 mars 2012 Outils CNES Contexte des données scientifiques au CNES SOMMAIRE

Plus en détail

Laboratoire d informatique Gaspard-Monge UMR 8049. Journée Labex Bézout- ANSES

Laboratoire d informatique Gaspard-Monge UMR 8049. Journée Labex Bézout- ANSES Laboratoire d informatique Gaspard-Monge UMR 8049 Journée Labex Bézout- ANSES Présentation du laboratoire 150 membres, 71 chercheurs et enseignants-chercheurs, 60 doctorants 4 tutelles : CNRS, École des

Plus en détail

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21 IODAA de l 1nf0rmation à la Décision par l Analyse et l Apprentissage IODAA Informations générales 2 Un monde nouveau Des données numériques partout en croissance prodigieuse Comment en extraire des connaissances

Plus en détail

Big Data -Comment exploiter les données et les transformer en prise de décisions?

Big Data -Comment exploiter les données et les transformer en prise de décisions? IBM Global Industry Solution Center Nice-Paris Big Data -Comment exploiter les données et les transformer en prise de décisions? Apollonie Sbragia Architecte Senior & Responsable Centre D Excellence Assurance

Plus en détail

OBJECTIFS. Une démarche E-science

OBJECTIFS. Une démarche E-science E-BIOGENOUEST Programme fédérateur Biogenouest co-financé par les Régions Bretagne et Pays de la Loire 24 mois Lancé depuis Mai 2012 Porteur : Olivier Collin (IRISA) Animateur : Yvan Le Bras (IRISA) OBJECTIFS

Plus en détail

ISTEX, vers des services innovants d accès à la connaissance

ISTEX, vers des services innovants d accès à la connaissance ISTEX, vers des services innovants d accès à la connaissance Synthèse rédigée par Raymond Bérard, directeur de l ABES, à partir du dossier de candidature d ISTEX aux Initiatives d excellence et des réunions

Plus en détail

Des Big Data aux Big Brothers Jean- Gabriel Ganascia Equipe ACASA LIP6 Université Pierre and Marie Curie Labex OBVIL PRES Sorbonne Université

Des Big Data aux Big Brothers Jean- Gabriel Ganascia Equipe ACASA LIP6 Université Pierre and Marie Curie Labex OBVIL PRES Sorbonne Université Des Big Data aux Big Brothers Jean- Gabriel Ganascia Equipe ACASA LIP6 Université Pierre and Marie Curie Labex OBVIL PRES Sorbonne Université 4, place Jussieu, 75252 Paris Cedex 05, FRANCE Jean- Gabriel.Ganascia@lip6.fr

Plus en détail

Eco-système calcul et données

Eco-système calcul et données Eco-système calcul et données M. Daydé Dr du Comité d'orientation pour le Calcul Intensif (COCIN) Délégué Scientifique INS2I en charge HPC / Grille / Cloud Calcul / données : un enjeu stratégique Calcul

Plus en détail

Les datas = le fuel du 21ième sicècle

Les datas = le fuel du 21ième sicècle Les datas = le fuel du 21ième sicècle D énormes gisements de création de valeurs http://www.your networkmarketin g.com/facebooktwitter-youtubestats-in-realtime-simulation/ Xavier Dalloz Le Plan Définition

Plus en détail

EXECUTIVE DOCTORATE IN BUSINESS ADMINISTRATION : LA NÉCESSITÉ DE L'INTÉGRATION DES TIC POUR MANAGER LA DISTANCE

EXECUTIVE DOCTORATE IN BUSINESS ADMINISTRATION : LA NÉCESSITÉ DE L'INTÉGRATION DES TIC POUR MANAGER LA DISTANCE COLLOQUE INTERNATIONAL «LE NUMÉRIQUE POUR ENSEIGNER AUTREMENT» 27 ET 28 JUIN 2014 UNIVERSITÉ PARIS-DAUPHINE EXECUTIVE DOCTORATE IN BUSINESS ADMINISTRATION : LA NÉCESSITÉ DE L'INTÉGRATION DES TIC POUR MANAGER

Plus en détail

Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant

Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant Parcours: Master 1 : Bioinformatique et biologie des Systèmes dans le Master

Plus en détail

Assemblée Générale. Structure Fédéra,ve de Recherche Condorcet. www.sfr- condorcet.fr. Agro- Sciences, Environnement et Développement Durable

Assemblée Générale. Structure Fédéra,ve de Recherche Condorcet. www.sfr- condorcet.fr. Agro- Sciences, Environnement et Développement Durable Structure Fédéra,ve de Recherche Condorcet Agro- Sciences, Environnement et Développement Durable Assemblée Générale Compiègne - 8 Juillet 2015 www.sfr- condorcet.fr Ordre du jour points d informa?on bilan

Plus en détail

Colloque Calcul IN2P3

Colloque Calcul IN2P3 Colloque Calcul IN2P3 Morceaux choisis 1 La mission Évolution des technologies Grille Cloud Calcul parallèle, HPC, GPU Big Data Open Access et pérennisation des données S'inscrire dans le contexte français

Plus en détail

Big data, digital studies, un nouveau nominalisme. Bruno Bachimont Université de Technologie de Compiègne

Big data, digital studies, un nouveau nominalisme. Bruno Bachimont Université de Technologie de Compiègne Big data, digital studies, un nouveau nominalisme. Bruno Bachimont Université de Technologie de Compiègne 1 Nominalisme : Argument Peut se comprendre comme la cri8que de l analogie établie entre la structure

Plus en détail

«Les projets collaboratifs pour les nuls»

«Les projets collaboratifs pour les nuls» «Les projets collaboratifs pour les nuls» Les jeudis du numérique à Vannes 28/05/15 Sommaire 1) Le projet collaboratif 2) Les appels à projets 3) Le financement 4) Le rôle d Images & Réseaux Les questions

Plus en détail

IN2P3 et PLUME Valorisation de la production de logiciels

IN2P3 et PLUME Valorisation de la production de logiciels IN2P3 et PLUME Valorisation de la production de logiciels Teresa Gomez-Diaz Laboratoire d informatique Gaspard-Monge PLUME e-séminaire Réseau des informaticiens de l IN2P3 et de l IRFU (RI3) LAL, Orsay,

Plus en détail

Les données massives de Copernicus : vers un nouveau paradigme. Hervé Jeanjean Cnes

Les données massives de Copernicus : vers un nouveau paradigme. Hervé Jeanjean Cnes Les données massives de Copernicus : vers un nouveau paradigme Hervé Jeanjean Cnes 1 Règlement Copernicus du 03/04/2014 : cadre politique, organisationnel et financier Règlement délégué du 12/07/2013 sur

Plus en détail

Informatique Médicale & Ingénierie des Connaissances Pour la e-santé

Informatique Médicale & Ingénierie des Connaissances Pour la e-santé Li ics Laboratoire d Informatique Médicaleet d Ingénierie des Connaissances en e-santé Projet de création d une UMR Inserm Université Pierre et Marie Curie, Université Paris Nord Informatique Médicale

Plus en détail

Big Data: développement, rôle des ARS?? Laurent Tréluyer, ARS Ile de France Alain Livartowski Institut Curie Paris 01/12/2014

Big Data: développement, rôle des ARS?? Laurent Tréluyer, ARS Ile de France Alain Livartowski Institut Curie Paris 01/12/2014 Big Data: développement, rôle des ARS?? Laurent Tréluyer, ARS Ile de France Alain Livartowski Institut Curie Paris 01/12/2014 1 Classiquement, le Big Data se définit autour des 3 V : Volume, Variété et

Plus en détail

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation Base de données S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Présentation du module Contenu général Notion de bases de données Fondements / Conception Utilisation :

Plus en détail

BIG DATA en Sciences et Industries de l Environnement

BIG DATA en Sciences et Industries de l Environnement BIG DATA en Sciences et Industries de l Environnement François Royer www.datasio.com 21 mars 2012 FR Big Data Congress, Paris 2012 1/23 Transport terrestre Traçabilité Océanographie Transport aérien Télémétrie

Plus en détail

Semestre HPC. Violaine Louvet. Institut Camille Jordan - CNRS louvet@math.univ-lyon1.fr. Labex MILyon, Printemps 2016

Semestre HPC. Violaine Louvet. Institut Camille Jordan - CNRS louvet@math.univ-lyon1.fr. Labex MILyon, Printemps 2016 Semestre HPC Violaine Louvet Institut Camille Jordan - CNRS louvet@math.univ-lyon1.fr Labex MILyon, Printemps 2016 V. Louvet (ICJ) Semestre HPC Printemps 2016 1 / 9 Présentation du semestre Modélisation

Plus en détail

Présentation du module Base de données spatio-temporelles

Présentation du module Base de données spatio-temporelles Présentation du module Base de données spatio-temporelles S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Partie 1 : Notion de bases de données (12,5h ) Enjeux et principes

Plus en détail

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales Ecole des Hautes Etudes Commerciales HEC Alger Évolution des SGBDs par Amina GACEM Module Informatique 1ière Année Master Sciences Commerciales Evolution des SGBDs Pour toute remarque, question, commentaire

Plus en détail

La mise en place d une cellule de veille

La mise en place d une cellule de veille La mise en place d une cellule de veille Floriane Giovannini IST - Antony 24 ème Rencontres OMER Lyon, les 29-30 mars 2007 Plan de la présentation Introduction à la veille Une cellule de veille : - Pourquoi?

Plus en détail

Les enjeux du Big Data Innovation et opportunités de l'internet industriel. Datasio 2013

Les enjeux du Big Data Innovation et opportunités de l'internet industriel. Datasio 2013 Les enjeux du Big Data Innovation et opportunités de l'internet industriel François Royer froyer@datasio.com Accompagnement des entreprises dans leurs stratégies quantitatives Valorisation de patrimoine

Plus en détail

Calcul Haute Performance & Données

Calcul Haute Performance & Données Calcul Haute Performance & Données Plan de l exposé CALMIP : news Evolution Matérielle Evolution des systèmes de calcul (CALMIP) Evolution Applicative Modélisation et Calcul haute performance Calcul haute

Plus en détail

Modèles et algorithmes pour le conseil et la gestion des préférences en configuration de produit

Modèles et algorithmes pour le conseil et la gestion des préférences en configuration de produit Modèles et algorithmes pour le conseil et la gestion des préférences en configuration de produit Revue à mi parcours du projet ANR Blanc «BR4CP» Hélène Fargier - IRIT Résolution interactive Le «catalogue»

Plus en détail

Introduction au datamining

Introduction au datamining Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des

Plus en détail

Me#re le Big Data sur la carte : défis et avenues rela6fs à l exploita6on de la localisa6on

Me#re le Big Data sur la carte : défis et avenues rela6fs à l exploita6on de la localisa6on Me#re le Big Data sur la carte : défis et avenues rela6fs à l exploita6on de la localisa6on Thierry Badard, PhD, ing. jr Centre de Recherche en Géoma6que Conférence ITIS - Big Data et Open Data au coeur

Plus en détail

AVIS A MANIFESTATION D INTERET N 017/MPT/2013/UCP/CAB

AVIS A MANIFESTATION D INTERET N 017/MPT/2013/UCP/CAB AVIS A MANIFESTATION D INTERET N 017/MPT/2013/UCP/CAB RECRUTEMENT D UN CONSULTANT INDIVIDUEL POUR LA REALISATION DE L ETUDE SUR LA PORTABILITE SUR LE MARCHE DES TELECOMMUNICATIONS EN REPUBLIQUE DU CONGO

Plus en détail

Préserva(on des données scien(fiques. C. Diaconu Centre de Physique des Par(cules de Marseille CPPM/IN2P3/CNRS

Préserva(on des données scien(fiques. C. Diaconu Centre de Physique des Par(cules de Marseille CPPM/IN2P3/CNRS Préserva(on des données scien(fiques C. Diaconu Centre de Physique des Par(cules de Marseille CPPM/IN2P3/CNRS «Big Scien(fic Data» La recherche est «digitale» Augmenta(on drama(que de la quan(té/complexité

Plus en détail

Environmental Research and Innovation ( ERIN )

Environmental Research and Innovation ( ERIN ) DÉpartEment RDI Environmental Research and Innovation ( ERIN ) Le département «Environmental Research and Innovation» (ERIN) du LIST élabore des stratégies, des technologies et des outils visant à mieux

Plus en détail

Guide de préparation d un projet

Guide de préparation d un projet École thémathique Guide de préparation d un projet ÉDITION 2015 dépasser les frontières Direction des ressources humaines Service formation et itinéraires professionnels DIRECTION DES RESSOURCES HUMAINES

Plus en détail

Métriques, classements et politique scientifique des Etablissements

Métriques, classements et politique scientifique des Etablissements Métriques, classements et politique scientifique des Etablissements Michel Blanc Bayesté Leclaire Ecole polytechnique, Palaiseau Quelques références clés Rapport au Sénat sur le défi des classements dans

Plus en détail

Exemple de projet et réseau: modélisation et simulation des systèmes socio-environnementaux

Exemple de projet et réseau: modélisation et simulation des systèmes socio-environnementaux Exemple de projet et réseau: modélisation et simulation des systèmes socio-environnementaux Jean-Pierre Müller Cadre scientifique CIRAD-ES-GREEN 1 Plan de présentation D où on part (parle) L objet de recherche

Plus en détail

Smart City Pour relever les défis d urbanisation et de mobilité du futur. Raphael Rollier 05/2015

Smart City Pour relever les défis d urbanisation et de mobilité du futur. Raphael Rollier 05/2015 Smart City Pour relever les défis d urbanisation et de mobilité du futur Raphael Rollier 05/2015 Orateurs Marilyne Andersen Loïc Lepage Olivier de Watteville Raphael Rollier Doyenne de la faculté ENAC,

Plus en détail

Constituer des profils d'experts scientifiques, de centres de recherche et d entreprises innovantes

Constituer des profils d'experts scientifiques, de centres de recherche et d entreprises innovantes Constituer des profils d'experts scientifiques, de centres de recherche et d entreprises innovantes Conférence GFII 12 Février 2014 www.expernova.com [ Le contexte ] Stratégie R&D Projets collaboratifs

Plus en détail

Note de cadrage du PEPI MACS Mathématiques Appliquées & Calcul Scientifique

Note de cadrage du PEPI MACS Mathématiques Appliquées & Calcul Scientifique Note de cadrage du PEPI MACS Mathématiques Appliquées & Calcul Scientifique Périmètre Le périmètre du PEPI concerne les méthodes et outils utilisés pour le traitement informatisé des données scientifiques.

Plus en détail

Big Data : utilisation d un cluster Hadoop HDFS Map/Reduce HBase

Big Data : utilisation d un cluster Hadoop HDFS Map/Reduce HBase Big Data : utilisation d un cluster cluster Cécile Cavet cecile.cavet at apc.univ-paris7.fr Centre François Arago (FACe), Laboratoire APC, Université Paris Diderot LabEx UnivEarthS 14 Janvier 2014 C. Cavet

Plus en détail

Open Data. Enjeux et perspectives dans les télécommunications

Open Data. Enjeux et perspectives dans les télécommunications Open Data Enjeux et perspectives dans les télécommunications Orange Labs 28/09/2012 Patrick launay, Recherche & Développement, Orange Labs - Recherche & Développement Printemps de la Recherche EDF Open

Plus en détail

SÉRIE NOUVELLES ARCHITECTURES

SÉRIE NOUVELLES ARCHITECTURES SÉRIE NOUVELLES ARCHITECTURES Alerte au tsunami des données : les entreprises doivent prendre la vague maintenant! Quels sont les faits qui sous-tendent cette réalité? Quelles entreprises sont aujourd

Plus en détail

Master Informatique Aix-Marseille Université

Master Informatique Aix-Marseille Université Aix-Marseille Université http://masterinfo.univ-mrs.fr/ Département Informatique et Interactions UFR Sciences Laboratoire d Informatique Fondamentale Laboratoire des Sciences de l Information et des Systèmes

Plus en détail

Direction des bibliothèques. Sondage Ithaka S+R. Questionnaire français Université de Montréal

Direction des bibliothèques. Sondage Ithaka S+R. Questionnaire français Université de Montréal Direction des bibliothèques Sondage Ithaka S+R Questionnaire français Université de Montréal Décembre 2014 Modules retenus Découverte Activités de recherche numérique Compétences informationnelles des

Plus en détail

3A-IIC - Parallélisme & Grid GRID : Définitions. GRID : Définitions. Stéphane Vialle. Stephane.Vialle@supelec.fr http://www.metz.supelec.

3A-IIC - Parallélisme & Grid GRID : Définitions. GRID : Définitions. Stéphane Vialle. Stephane.Vialle@supelec.fr http://www.metz.supelec. 3A-IIC - Parallélisme & Grid Stéphane Vialle Stephane.Vialle@supelec.fr http://www.metz.supelec.fr/~vialle Principes et Objectifs Evolution Leçons du passé Composition d une Grille Exemple d utilisation

Plus en détail

Etudier l informatique

Etudier l informatique Etudier l informatique à l Université de Genève 2015-2016 Les bonnes raisons d étudier l informatique à l UNIGE La participation à des dizaines de projets de recherche européens Dans la présente brochure,

Plus en détail

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY Yvan Le Bras yvan.le_bras@irisa.fr Cyril Monjeaud, Mathieu Bahin, Claudia Hériveau, Olivier Quenez, Olivier Sallou, Aurélien Roult, Olivier

Plus en détail

Offre Azimut CONTENT MARKETING. A l a&en)on de : Date de remise : Version : 3.0

Offre Azimut CONTENT MARKETING. A l a&en)on de : Date de remise : Version : 3.0 Offre Azimut CONTENT MARKETING A l a&en)on de : Date de remise : Version : 3.0 01 Marke3ng de Contenu Ecosytème Editorial Offre & Ou3ls Azimut Content Marke3ng Méthodologie Content management Qui sommes-

Plus en détail

Les défis statistiques du Big Data

Les défis statistiques du Big Data Les défis statistiques du Big Data Anne-Sophie Charest Professeure adjointe au département de mathématiques et statistique, Université Laval 29 avril 2014 Colloque ITIS - Big Data et Open Data au cœur

Plus en détail

Introduction Big Data

Introduction Big Data Introduction Big Data SOMMAIRE Rédacteurs : Réf.: SH. Lazare / F. Barthélemy AXIO_BD_V1 QU'EST-CE QUE LE BIG DATA? ENJEUX TECHNOLOGIQUES ENJEUX STRATÉGIQUES BIG DATA ET RH ANNEXE Ce document constitue

Plus en détail

ArcGIS. for Server. Comprendre notre monde

ArcGIS. for Server. Comprendre notre monde ArcGIS for Server Comprendre notre monde ArcGIS for Server Créer, distribuer et gérer des services SIG Vous pouvez utiliser ArcGIS for Server pour créer des services à partir de vos données cartographiques

Plus en détail

Conception des systèmes répartis

Conception des systèmes répartis Conception des systèmes répartis Principes et concepts Gérard Padiou Département Informatique et Mathématiques appliquées ENSEEIHT Octobre 2012 Gérard Padiou Conception des systèmes répartis 1 / 37 plan

Plus en détail

Dailymotion: La performance dans le cloud

Dailymotion: La performance dans le cloud Dailymotion: La performance dans le cloud CRiP Thématique Services IT dans le Cloud 06/11/14 Dailymotion en quelques chiffres? 130 millions visiteurs uniques par mois 3 milliards de vidéos vues par mois

Plus en détail

Archivage intermédiaire de données Scientifiques ISAAC Information Scientifique Archivée Au Cines

Archivage intermédiaire de données Scientifiques ISAAC Information Scientifique Archivée Au Cines Archivage intermédiaire de données Scientifiques ISAAC Information Scientifique Archivée Au Cines Constat Enquête auprès des laboratoires de recherche Besoin d information sur les enjeux de l'archivage

Plus en détail

Big Data. Concept et perspectives : la réalité derrière le "buzz"

Big Data. Concept et perspectives : la réalité derrière le buzz Big Data Concept et perspectives : la réalité derrière le "buzz" 2012 Agenda Concept & Perspectives Technologies & Acteurs 2 Pierre Audoin Consultants (PAC) Pierre Audoin Consultants (PAC) est une société

Plus en détail

GESTION DE CONTENUS (ECM) Ges1on de l informa1on. Nicolas Bürki, Senior Analyst

GESTION DE CONTENUS (ECM) Ges1on de l informa1on. Nicolas Bürki, Senior Analyst GESTION DE CONTENUS (ECM) Ges1on de l informa1on Nicolas Bürki, Senior Analyst AGENDA Entreprises: les tendances & les projets Les offres ECM / GED : les tendances du marche La réalité / retour d expérience

Plus en détail

Assemblée générale Aristote

Assemblée générale Aristote Assemblée générale Aristote Panorama 2011-2012 Philippe d Anfray Philippe.d-Anfray@cea.fr CEA DSM-Saclay CNES 5 juillet 2012 Assemblée générale Aristote CNES 5 juillet 2012 1 / 21 Comité de programme (1)

Plus en détail

Big data et données géospatiales : Enjeux et défis pour la géomatique. Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique

Big data et données géospatiales : Enjeux et défis pour la géomatique. Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique Big data et données géospatiales : Enjeux et défis pour la géomatique Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique Événement 25e anniversaire du CRG Université Laval, Qc, Canada 08 mai

Plus en détail

EXL GROUP FILIÈRE ERP - QUI SOMMES NOUS?

EXL GROUP FILIÈRE ERP - QUI SOMMES NOUS? EXL GROUP FILIÈRE ERP - QUI SOMMES NOUS? 94 Rue de Provence - 75009 Paris - Tél : +33 (0)1 53 32 21 40 - Fax : +33 (0)1 53 16 35 85 - www.exl Group.com EXL GROUP - Tous droits réservés SOMMAIRE 1. Présentation

Plus en détail

Bases de Données OLAP

Bases de Données OLAP Bases de Données OLAP Hiver 2013/2014 Melanie Herschel melanie.herschel@lri.fr Université Paris Sud, LRI Chapitre 1 Introduction Détails administratifs Entrepôts de Données Perspective sur le semestre

Plus en détail

Collabora'on IRISA/INRA sur le transfert de nitrates et l améliora'on de la qualité des eaux des bassins versants:

Collabora'on IRISA/INRA sur le transfert de nitrates et l améliora'on de la qualité des eaux des bassins versants: Collabora'on IRISA/INRA sur le transfert de nitrates et l améliora'on de la qualité des eaux des bassins versants: Tassadit BOUADI 22 Juin 2010, Saint Jacut 1 Plan Introduc

Plus en détail

Big Data On Line Analytics

Big Data On Line Analytics Fdil Fadila Bentayeb Lb Laboratoire ERIC Lyon 2 Big Data On Line Analytics ASD 2014 Hammamet Tunisie 1 Sommaire Sommaire Informatique décisionnelle (BI Business Intelligence) Big Data Big Data analytics

Plus en détail

LE SUPPLIER RELATIONSHIP MANAGEMENT EN PRATIQUE

LE SUPPLIER RELATIONSHIP MANAGEMENT EN PRATIQUE PARTENAIRES ACHATS LE SUPPLIER RELATIONSHIP MANAGEMENT EN PRATIQUE PROGRAMME La geson de la relaon fournisseur Supplier Relaonship Management est au centre de l aenon de toutes les foncons Achats. Les

Plus en détail

IT for Innovative Services (ITIS)

IT for Innovative Services (ITIS) DÉpartement RDI IT for Innovative Services (ITIS) Le département «IT for Innovative Services» (ITIS) du LIST conçoit des services IT innovants dans une démarche d innovation ouverte intégrant l ensemble

Plus en détail

#GoSocial. solutions de marketing communautaire & social crm

#GoSocial. solutions de marketing communautaire & social crm #GoSocial La révolution du Social Média Depuis quelques années, les médias sociaux ont métamorphosé le paysage du web et les modes de communication entre les individus et les marques. Hier encore spectateurs,

Plus en détail

Stratégie Open Source et Présentation du Centre de recherche et d innovation sur le logiciel libre

Stratégie Open Source et Présentation du Centre de recherche et d innovation sur le logiciel libre Stratégie Open Source et Présentation du Centre de recherche et d innovation sur le logiciel libre 1 INTECH, GRENOBLE, 12/01/2010 Patrick MOREAU patrick.moreau@inria.fr Direction du Transfert et de l Innovation

Plus en détail

Saadi KHOCHBIN. Directeur de recherche CNRS. médaille d Argent. Institut des sciences biologiques. Institut Albert Bonniot (IAB)

Saadi KHOCHBIN. Directeur de recherche CNRS. médaille d Argent. Institut des sciences biologiques. Institut Albert Bonniot (IAB) Saadi KHOCHBIN Directeur de recherche CNRS Institut Albert Bonniot (IAB) Inserm / UJF Institut des sciences biologiques médaille d Argent Les projets développés par Saadi Khochbin s inscrivent essentiellement

Plus en détail

Matrice snapshot 2013. Jacquelin Charbonnel ANF RNBM - Marseille, 23 mai 2013

Matrice snapshot 2013. Jacquelin Charbonnel ANF RNBM - Marseille, 23 mai 2013 Mathrice snapshot 2013 Jacquelin Charbonnel ANF RNBM - Marseille, 23 mai 2013 Jacquelin Charbonnel ANF RNBM - Marseille, 23 mai 2013 Plan Organisation, fonctionnement, activités de Mathrice Quelques services

Plus en détail

BI SWISS FORUM (ecom / SITB)

BI SWISS FORUM (ecom / SITB) 2015 04 21 - GENEVA BI SWISS FORUM (ecom / SITB) LE BIG DATA A L ASSAUT DES ZONES DE CONFORT TECH ET BUSINESS WWW.CROSS-SYSTEMS.CH GROUPE MICROPOLE 1100 COLLABORATEURS DONT 130 EN SUISSE +800 CLIENTS 27

Plus en détail

L Institut National des Sciences Mathématique et de leurs. Premiers éléments d un bilan à deux ans.

L Institut National des Sciences Mathématique et de leurs. Premiers éléments d un bilan à deux ans. L Institut National des Sciences Mathématique et de leurs Interactions (INSMI) : Premiers éléments d un bilan à deux ans. 1. Mise en place de l INSMI Au CNRS, l année 2009 a été une année de transition

Plus en détail

Les Entrepôts de Données

Les Entrepôts de Données Les Entrepôts de Données Grégory Bonnet Abdel-Illah Mouaddib GREYC Dépt Dépt informatique :: GREYC Dépt Dépt informatique :: Cours Cours SIR SIR Systèmes d information décisionnels Nouvelles générations

Plus en détail

Faculté des Sciences d ORSAY

Faculté des Sciences d ORSAY Université Paris-Sud 11 Faculté des Sciences d ORSAY Personnes ressources des disciplines représentées : Département de Biologie Vice-Président : Hervé DANIEL Secrétaire : Malika DERRAS Université Paris-Sud

Plus en détail

Recherche et Formation dans un environnement de pointe. Contact: Eric.Beaugnon@ujf-grenoble.fr

Recherche et Formation dans un environnement de pointe. Contact: Eric.Beaugnon@ujf-grenoble.fr Recherche et Formation dans un environnement de pointe Contact: Eric.Beaugnon@ujf-grenoble.fr 1 Grenoble: forte synergie recherche formation relations industrielles Années 8 International training courses

Plus en détail

SAUVER LA DISTRIBUTION!

SAUVER LA DISTRIBUTION! SAUVER LA DISTRIBUTION! Face au Cloud et à l explosion des usages innovants qu il permet dans tous les secteurs, les acteurs «canal historique» de la distribu=on et des services informa=ques se reposi=onnent

Plus en détail

Présentation de la Grille EGEE

Présentation de la Grille EGEE Présentation de la Grille EGEE Introduction aux grilles La grille EGEE Exemples d applications en physique des particules et en sciences de la vie Le cercle vertueux Conclusion Guy Wormser Directeur de

Plus en détail

Module BDR Master d Informatique (SAR)

Module BDR Master d Informatique (SAR) Module BDR Master d Informatique (SAR) Cours 6- Bases de données réparties Anne Doucet Anne.Doucet@lip6.fr 1 Bases de Données Réparties Définition Conception Décomposition Fragmentation horizontale et

Plus en détail

CENTAI : Big Data & Big Analytics Réunion DGPN / Thales Octobre 2013

CENTAI : Big Data & Big Analytics Réunion DGPN / Thales Octobre 2013 www.thalesgroup.com CENTAI : Big Data & Big Analytics Réunion DGPN / Thales Octobre 2013 2 / Sommaire CENTAI : Présentation du laboratoire Plate-forme OSINT LAB Détection de la fraude à la carte bancaire

Plus en détail

Hervé Couturier EVP, SAP Technology Development

Hervé Couturier EVP, SAP Technology Development Hervé Couturier EVP, SAP Technology Development Hervé Biausser Directeur de l Ecole Centrale Paris Bernard Liautaud Fondateur de Business Objects Questions à: Hervé Couturier Hervé Biausser Bernard Liautaud

Plus en détail