FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis

Documents pareils
Journées Big Data à l ENSAI Big Data: les challenges, les défis

July 1, Stéphan Clémençon (Télécom ParisTech) Mastère Big Data July 1, / 15

Le Mastère Spécialisé Big Data de Télécom ParisTech

BIG DATA : GESTION ET ANALYSE DES DONNÉES MASSIVES (BGD) Mastère Spécialisé. Appréhendez les challenges économiques et juridiques du Big Data

Introduction Big Data

Formation continue. Ensae-Ensai Formation Continue (Cepe)

Groupe de Discussion Big Data Aperçu des technologies et applications. Stéphane MOUTON

Big data et données géospatiales : Enjeux et défis pour la géomatique. Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique

Le BIG DATA????? Big Buzz? Big Bang? Big Opportunity? Big hype? Big Business? Big Challenge? Big Hacking? Gérard Peliks planche 2

Les participants repartiront de cette formation en ayant une vision claire de la stratégie et de l éventuelle mise en œuvre d un Big Data.

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21

Formation Actuaire Data Scientist. Programme au 24 octobre 2014

Pentaho Business Analytics Intégrer > Explorer > Prévoir

TRAVAUX DE RECHERCHE DANS LE

20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars ans du SIAD -"Big Data par l'exemple" -Julien DULOUT

Monétisation des données : comment identifier de nouvelles sources de revenus au sein des Big data?

Le potentiel et les défis du Big Data. Mardi 2 et Mercredi 3 Juillet 2013

Comment valoriser votre patrimoine de données?

CENTAI : Big Data & Big Analytics Réunion DGPN / Thales Octobre 2013

À PROPOS DE TALEND...

Fouillez facilement dans votre système Big Data. Olivier TAVARD

DocForum 18 Juin Réussites d un projet Big Data Les incontournables

Assemblée générale Aristote

Panorama des solutions analytiques existantes

11/01/2014. Le Big Data Mining enjeux et approches techniques. Plan. Introduction. Introduction. Quelques exemples d applications

Filière Fouille de Données et Décisionnel FDD (Data Mining) Pierre Morizet-Mahoudeaux

SMU MEDITERRANEAN. SOUTH MEDITERRANEAN UNIVERSITY Première Université Anglophone en Tunisie (Depuis 2002)

Cartographie des solutions BigData

Il y a tellement de hype autour du big data que Gartner étudie un nouveau modèle ;-) Talend

Spécialité IAD. Master de Sciences et technologie de l UPMC. Mention informatique. Partenaires : ENST, ENSTA. Responsables : T. Artières, C.

Entreprise et Big Data

AVRIL Au delà de Hadoop. Panorama des solutions NoSQL

GT Big Data. Saison Bruno Prévost (Safran), Marc Demerlé (GDF SUEZ) CRiP Thématique Mise en œuvre du Big Data 16/12/14

BIG DATA en Sciences et Industries de l Environnement

Big Data On Line Analytics

Offres de stages 2011/2012

Le Web, l'entreprise et le consommateur. Françoise Soulié Fogelman

Présentation de la majeure ISN. ESILV - 18 avril 2013

ELCA Forum 2014 BIG DATA

Stages ISOFT : UNE SOCIETE INNOVANTE. Contact : Mme Lapedra, stage@isoft.fr

Filière Data Mining (Fouille de données) Pierre Morizet-Mahoudeaux

Stratégie Télécom ParisTech

Titre : La BI vue par l intégrateur Orange

Master Informatique Aix-Marseille Université

«Innovation Intelligence» La valorisation des données massives au service des partenariats R&D. Expernova Université d été GFII

Labs Hadoop Février 2013

Document réalisé par Khadidjatou BAMBA

Bases de données documentaires et distribuées Cours NFE04

ANNEXES. Evaluation de la formation à Polytech Lille Département GIS. Enseignements les plus utiles. Enseignements à renforcer

Les datas = le fuel du 21ième sicècle


accompagner la transformation digitale grâce au Big & Fast Data Orange Business Services Confidentiel 02/10/2014

Enjeux mathématiques et Statistiques du Big Data

Big Graph Data Forum Teratec 2013

Stratégie et Vision de SAP pour le secteur Banque- Assurance: Data-Management, BI, Mobilité

Workshop Big Data Valère DUSSAUX (GCS-D-SISIF) Bruno PREVOST (SAFRAN) Point d avancement

Programmation parallèle et distribuée (Master 1 Info )

Vos experts Big Data. Le Big Data dans la pratique

BIG DATA : comment étendre et gérer la connaissance client? François Nguyen SFR Directeur SI décisionnel & Mkt relationnel GP

L écosystème Hadoop Nicolas Thiébaud Tuesday, July 2, 13

FORMATIONS STAGES INSERTION PROFESSIONNELLE. UFR Sciences Orsay. Isabelle DEMACHY

De l Etudiant à SBA à l Enseignant Chercheur à l ENSMA

Institut. Master MIAGE. Master SIC. d Administration des Entreprises de Paris. Sorbonne Graduate Business school

FINI LA RÉCRÉ PASSONS AUX MÉGADONNÉES

Le BigData, aussi par et pour les PMEs

Catalogue des stages Ercom 2013

DATA ANALYTICS Des données aux connaissances et à la création de valeur

Laboratoire d informatique Gaspard-Monge UMR Journée Labex Bézout- ANSES

Open Data. Enjeux et perspectives dans les télécommunications

Me#re le Big Data sur la carte : défis et avenues rela6fs à l exploita6on de la localisa6on

Le traitement du Big Data inclue la collecte, la curation, le stockage, l enrichissement, le croisement, la partage, l analyse et la visualisation.

Big Data: comment passer de la stratégie à la mise en œuvre? Big Data Paris Mars 2015

Technologies de la Recherche et standards du Web: Quel impact sur l Innovation?

Objectifs pédagogiques de l enseignement «Métiers»

SÉRIE NOUVELLES ARCHITECTURES

«Les projets collaboratifs pour les nuls»

Architecte de Services Informatiques

BIG DATA : une vraie révolution industrielle (1) Les fortes évolutions liées à la digitalisation

NewPoint IT Consulting BIG DATA WHITE PAPER. NewPoint Information Technology Consulting

AXIAD Conseil pour décider en toute intelligence

Big Data -Comment exploiter les données et les transformer en prise de décisions?

Comment le "big data" impacte le domaine de l'intelligence Economique?

Recherche et Diffusion de l Information dans les Réseaux. Philippe Robert. Le 8 avril 2014

Partie I Stratégies relationnelles et principes d organisation... 23

Big Data et Graphes : Quelques pistes de recherche

Big Data et Prévisions. Philippe Picard, le 24 juin Page 1

Open Data. François Bancilhon twitter.com/fbancilhon Printemps de la recherche EDF R&D 28/9/12

BIG DATA et DONNéES SEO

Fouille de données massives avec Hadoop

Les enjeux du Big Data Innovation et opportunités de l'internet industriel. Datasio 2013

BIG DATA. Veille technologique. Malek Hamouda Nina Lachia Léo Valette. Commanditaire : Thomas Milon. Encadré: Philippe Vismara

VIPE CNAM 6 mars Frank Meyer Orange Labs / IMT / UCE / CRM-DA / PROF

NoSQL. Introduction 1/30. I NoSQL : Not Only SQL, ce n est pas du relationnel, et le contexte. I table d associations - Map - de couples (clef,valeur)

Big Data : Quel usage au sein des projetsinternet?

HADOOP ET SON ÉCOSYSTÈME

LE MEILLEUR DES SOLUTIONS COLLABORATIVE OPEN SOURCE. et pas que la GED

Les quatre piliers d une solution de gestion des Big Data

Bologne à l EPFL. Réforme de Bologne Implications pour l EPFL. Prof. Dominique Bonvin, Doyen Bachelor-Master

Transcription:

FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis Joseph Salmon Télécom ParisTech Jeudi 6 Février Joseph Salmon (Télécom ParisTech) Big Data Jeudi 6 Février 1 / 18

Agenda Contexte et opportunités Challenges scientifiques et collaborations industrielles Le défi de la formation Qelques actions en cours et à venir Joseph Salmon (Télécom ParisTech) Big Data Jeudi 6 Février 2 / 18

Big Data - Le contexte Une accumulation de données massives dans de nombreux domaines: Biologie/Médecine (génomique, essais cliniques, imagerie, etc.) Réseaux sociaux (Facebook, Tweeter) Moteurs de recherche internet (contenu multimédia) Administrations (santé publique, douanes) Sécurité (biométrie, vidéosurveillance, informatique) Banque/Finance (risque de marché/liquidité, accès au crédit) Grande distribution, marketing (CRM), e-commerce... Joseph Salmon (Télécom ParisTech) Big Data Jeudi 6 Février 3 / 18

Big Data - Le contexte Un déluge de données qui rend inopérant: les outils basiques de stockage de données gestion de base de données (MySQL) le prétraitement reposant sur l expertise humaine indexation, analyse sémantique modélisation intelligence décisionnelle Joseph Salmon (Télécom ParisTech) Big Data Jeudi 6 Février 4 / 18

Big Data - Le contexte Une multitude de briques technologiques et de services disponibles pour: La parallélisation massive (Velocity) Le calcul distribué (Volume) La gestion de données sans schéma prédéfini (Variety) parmi lesquels: Calculs parallélisés/distribués: MapReduce Framework Hadoop NoSQL: SGBD Cassandra, MongoDB, bases de données orientées graphe, moteur de recherche Elasticsearch, etc. Clouds: infrastructures, plate-formes promus par Google, Amazon, Facebook, etc. Joseph Salmon (Télécom ParisTech) Big Data Jeudi 6 Février 5 / 18

Big Data - Les opportunités Des avancées spectaculaires la collecte et le stockage (distribué) des données la recherche automatique d objets, de contenu le partage de données peu structurées Le Big Data: un moteur pour la technologie, la science, l économie Moteurs de recherche, moteurs de recommandation Maintenance prédictive Marketing viral à travers les réseaux sociaux Détection des fraudes Médecine individualisée Publicité en ligne Joseph Salmon (Télécom ParisTech) Big Data Jeudi 6 Février 6 / 18

Big Data - Les opportunités Ubiquité De nombreux secteurs d activité sont concernés: (e-) Commerce Gestion de la relation client Santé Défense, renseignement Banque/Finance Transports intelligents etc. Joseph Salmon (Télécom ParisTech) Big Data Jeudi 6 Février 7 / 18

Big Data - Les besoins Talents Selon l Institut McKinsey Global, d ici à 2018 aux USA: 300 000 architectes Big Data 140 000-190 000 recrutements de data scientists 1,5 million de cadres/techniciens avec des connaissances générales dans ce domaine Joseph Salmon (Télécom ParisTech) Big Data Jeudi 6 Février 8 / 18

Big Data - Recherche Pour exploiter les données (prédiction, interpétation), il faut développer des technologies mathématiques permettant de résoudre les problèmes computationnels liés: aux contraintes du temps réel apprentissage automatique séquentiel on-line ( batch) au caractère distribué des données/ressources apprentissage automatique distribué à la volumétrie des données Impacte des techniques de sondages/échantillonnage sur la performance des algorithmes Joseph Salmon (Télécom ParisTech) Big Data Jeudi 6 Février 9 / 18

Big Data - Recherche Des techniques de visualisation, représentation de données complexes Graphes (évolutifs) - clustering, graph-mining Image, audio, vidéo - filtrage, compression Données textuelles (e.g. page web, tweet) Domaines Probabilité, Statistique Machine-Learning Optimisation Traitement du signal et de l image Analyse harmonique computationnelle Analyse sémantique Informatique, etc. Joseph Salmon (Télécom ParisTech) Big Data Jeudi 6 Février 10 / 18

Formations Data Science : un bref tour d horizon En France Masters disciplinaires: informatique ou mathématiques appliquées A l international Stanford University (Stanford Center for Professional Development): Data Mining and Applications Graduate Certificate en 3 ans (12 000 $ env.), avec Sony, Cisco Columbia Institute for Data Sciences and Engineering, Chicago Northwestern University (MS program in Predictive Analytics), North Carolina State University (MS in Analytics avec SAS), UC San Diego (certificate program in data mining), etc. Secteur privé: SAS, EMC (GreenPlum), IBM (Netezza), Cloudera, etc. Joseph Salmon (Télécom ParisTech) Big Data Jeudi 6 Février 11 / 18

Big Data : le défi de la formation Compétences en maths/info Analyse sémantique Sécurité des données Systèmes répartis, parallélisation massive, clouds Analyse des réseaux sociaux, graph-mining Visualisation, interface homme-machine Ranking, moteurs de recommandation/recherche Machine-learning distribué, en ligne, passage à l échelle Compétences en droit/économie Propriété des données personnelles Création de valeur, économie de l internet Joseph Salmon (Télécom ParisTech) Big Data Jeudi 6 Février 12 / 18

Big Data Le phénomène Big Data appelle de nouvelles offres de formation pose de nouveaux problèmes scientifiques/technologiques/juridiques Répondre à ces besoins requiert une collaboration étroite avec le monde de l industrie et des services une mutualisation des moyens/forces Joseph Salmon (Télécom ParisTech) Big Data Jeudi 6 Février 13 / 18

Actions dans le domaine de la formation Mastère Spécialisé Big Data - ouvert en sept. 2013 30 stagiaires Multidisciplinarité: programmation, données, sécurité, visualisation, maths appliquées, droit, économie/business Recrutement: niveau M2 Projets Fil Rouge tutorés par des professionnels (e.g. Capgemini, GdF Suez, EDF, Xebia, start-ups de l incubateur de TPT), séminaires (Thalès, McKinsey, NextPerformance, etc.) Comité de perfectionnement: EADS, Thalès, IBM, Google, Critéo, Liligo, Safran, SAS, Capgemini Objectif: un savoir-faire opérationnel Stage et thèse professionnelle 6 mois Joseph Salmon (Télécom ParisTech) Big Data Jeudi 6 Février 14 / 18

La formation - Projets Fil Rouge 7 mois travail en groupe (par ex. 4 à 5 stagiaires) vise à explorer un thème du Big Data à plusieurs facettes e.g. infrastructure, analyse, exploitation, mise en production, droit, business model recherches bibliographiques, étapes de modélisation, développement et expérimentation projets proposés et tutorés par des professionnels suivi régulier assuré par des enseignants-chercheurs Infrastructure Hadoop sur un cluster propriétaire, utilisation d AWS Joseph Salmon (Télécom ParisTech) Big Data Jeudi 6 Février 15 / 18

Actions dans le domaine de la formation Certificat Data Science - prévu au printemps 2014 Cible: professionnels en situation d emploi 24 jours de présentiel En développement: plateforme d e-learning Formation Continue Stages ciblés Ex: machine-learning, valorisation des données personnelles, l écosystème Big Data Joseph Salmon (Télécom ParisTech) Big Data Jeudi 6 Février 16 / 18

Actions dans le domaine de la recherche Partenariats avec l industrie Chaires industrielles: Réseaux sociaux - Télecom Ecole de Management Valeurs et politiques des informations personnelles - Télecom ParisTech, Télecom Sud Paris & Télecom Ecole de Management Machine-Learning & Big Data - Télecom ParisTech Big Data for e-commerce - Télecom ParisTech Contrats bilatéraux (e.g. EADS, Orange, StreamWide) Partenaires académiques IMT: Mines (Bio-info), TSP, Télecom Ecole de Management Au sein de ParisTech: X (CMAP), ENPC (Cermics), ENSAE (Crest) Saclay: Université Paris Orsay (LRI), ENS Cachan (CMLA), CEA, INRIA Joseph Salmon (Télécom ParisTech) Big Data Jeudi 6 Février 17 / 18

Infrastructure - Partenariat IMT/GENES: TERALAB Une plateforme IMT/GENES pour la recherche et l enseignement Projets de recherche et de transfert technologique À l exclusion de toute activité commerciale Equipe support Hébergement souverain 24/7 2 Compartiments Batch/ Temps réel - sécurisé - ultra-sécurisé (technologie CASD) 1 Institut Mines-Télécom Joseph Salmon (Télécom ParisTech) Big Data Jeudi 6 Février 18 / 18