July 1, 2013. Stéphan Clémençon (Télécom ParisTech) Mastère Big Data July 1, 2013 1 / 15



Documents pareils
FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis

Journées Big Data à l ENSAI Big Data: les challenges, les défis

BIG DATA : GESTION ET ANALYSE DES DONNÉES MASSIVES (BGD) Mastère Spécialisé. Appréhendez les challenges économiques et juridiques du Big Data

Le Mastère Spécialisé Big Data de Télécom ParisTech

SMU MEDITERRANEAN. SOUTH MEDITERRANEAN UNIVERSITY Première Université Anglophone en Tunisie (Depuis 2002)

Laboratoire d informatique Gaspard-Monge UMR Journée Labex Bézout- ANSES

Spécialité IAD. Master de Sciences et technologie de l UPMC. Mention informatique. Partenaires : ENST, ENSTA. Responsables : T. Artières, C.

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21

Métriques, classements et politique scientifique des Etablissements

Filière Fouille de Données et Décisionnel FDD (Data Mining) Pierre Morizet-Mahoudeaux

L INRIA, institut français des STIC. (en Île-de-France) 24 septembre 2009

Formation continue. Ensae-Ensai Formation Continue (Cepe)

INSTITUT D OPTIQUE GRADUATE SCHOOL

Etude Benchmarking 2010 sur les formations existantes apparentées au métier de Business Developer en Innovation

Rapport d évaluation du master

Section des Formations et des diplômes

Rapport d évaluation du master

Rapport d évaluation du master

Formation Actuaire Data Scientist. Programme au 24 octobre 2014

Rencontres Cap Digital/ Master MTI

CENTAI : Big Data & Big Analytics Réunion DGPN / Thales Octobre 2013

La problématique de la formation et du recrutement des analystes. mars 2012

Recherche et Diffusion de l Information dans les Réseaux. Philippe Robert. Le 8 avril 2014

Parcours Conception, Modélisation et Architecture des Systèmes Informatiques Complexes mention Informatique Paris-Saclay

Stratégie Télécom ParisTech

GENIE STATISTIQUE GESTION DES RISQUES ET INGENIERIE FINANCIERE MARKETING QUANTITATIF ET REVENUE MANAGEMENT

Rapport d évaluation du master

Filière Data Mining (Fouille de données) Pierre Morizet-Mahoudeaux

Stratégie et Vision de SAP pour le secteur Banque- Assurance: Data-Management, BI, Mobilité

Rapport d évaluation du master

Universum French Student Survey 2008

FORMATIONS STAGES INSERTION PROFESSIONNELLE. UFR Sciences Orsay. Isabelle DEMACHY

Site(s) (lieux où la formation est dispensée, y compris pour les diplômes délocalisés) :

Master Informatique Aix-Marseille Université

Bologne à l EPFL. Réforme de Bologne Implications pour l EPFL. Prof. Dominique Bonvin, Doyen Bachelor-Master

La Chaire Accenture Strategic Business Analytics de l ESSEC

Master. en sciences et technologies mention informatique. LIP6 - Frédéric Delvalle

Licences. Masters. Doctorats... L offre de formation

FORMATIONS EN INFORMATIQUE DES ORGANISATIONS. Informatique Economie Statistiques Gestion.

Rapport d évaluation du master

SMU MEDITERRANEAN. SOUTH MEDITERRANEAN UNIVERSITY Première Université Anglophone en Tunisie (Depuis 2002)

T o u s d r o i t s r é s e r v é s O S I s o f t, L L C. SÉMINAIRES RÉGIONAUX

Rapport d évaluation du master

Marketing des services & Relation Clients

Statistiques et traitement des données

Bienvenue au CLUSIR!

Filière MMIS. Modélisation Mathématique, Images et Simulation. Responsables : Stefanie Hahmann, Valérie Perrier, Zoltan Szigeti

Master de Bioinformatique et Biologie des Systèmes Toulouse Responsable : Pr. Gwennaele Fichant

Introduction Big Data

BIG DATA en Sciences et Industries de l Environnement

Réunion des DU de Biogenouest 19 mars 2014

Communauté d Universités et Établissements. Stratégie Territoriale et Initiative d Excellence. Université Côte d Azur (UCA) - page 1

Présentation de la majeure ISN. ESILV - 18 avril 2013

Comment valoriser votre patrimoine de données?

IT on demand & cloud professional services

Rapport d évaluation du master

SYSTEME D INFORMATION MARKETING ET COMMERCE

Masses de données. 1. Introduction 2. Problématiques 3. Socle de formation (non présenté) 4. Liens avec Formation INSA

IT SecuDay Geneva 2015 : Les apports du Big Data à la sécurité informatique

Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining.

Rapport d évaluation du master

Tout au long de votre cursus Quel métier futur? Dans quel secteur d activité? En fonction de vos goûts et aptitudes et du «niveau d emploi» dans ce

Big Data et Marketing : les competences attendues

OFFRE DE FORMATION ISEM 2015/2016

Les métiers évoluent, la formation s adapte. Témoignages de Centrale Marseille. Franck JOURNEAU

Rapport d évaluation du master

Les Ressources Humaines à l heure du Big Data : progrès, perspectives et limites CORNERSTONE WHITEPAPER

L avenir. est au numérique

Technologies de la Recherche et standards du Web: Quel impact sur l Innovation?

Mise en place des projets collaboratifs. public-privé dans les TIC à l entreprise. Cynapsys

EXECUTIVE EDUCATION STRATÉGIES DIGITALES

Présentation du Master Ingénierie Informatique et du Master Science Informatique , Année 2 Université Paris-Est Marne-la-Vallée

«39 ans d expérience» ( )

Master Management international

MS à temps plein Executive MS

Masters en BUsiness Management - MBM

UFR d Informatique. FORMATION MASTER Domaine SCIENCES, TECHNOLOGIE, SANTE Mention INFORMATIQUE

Décembre 2013 CHAIRES DES ÉCOLES DE PARISTECH

Le Web, l'entreprise et le consommateur. Françoise Soulié Fogelman

Emergence du Big Data Exemple : Linked Open Data

Vision prospective et obstacles à surmonter pour les assureurs

Introduction au Data-Mining

MASTER ECONOMIE APPLIQUEE

Rapport d évaluation du master

Management des Systèmes d Information

Compte rendu de l intervention de Jean-Louis LACOMBE. Rencontre européenne de la technologie du 23 mars La Fondation d entreprise EADS

Industrie 4.0 L usine connectée

Le potentiel et les défis du Big Data. Mardi 2 et Mercredi 3 Juillet 2013

INTRODUCTION. Daniel KROB Ecole Polytechnique & CNRS Chaire «Ingénierie des systèmes complexes» Palaiseau Cedex dk@lix.polytechnique.

ChairE Systèmes Embarqués Critiques (CESEC)

À PROPOS DE TALEND...

55, rue du Faubourg Montmartre Paris +33 (0)

PRÉSENTATION GÉNÉRALE

UNIVERSITE DE BREST Référence GALAXIE : 4201

Master Management, innovation, technologie

Public. Débouchés. Les atouts du Master PIC. Statistiques des débouchés 22 % 16 % 10 % 14 % 38 % Entreprise Start-up Thèse.

L École. en chiffres 2011/2012

Augmenter l impact économique de la recherche :

L Institut National des Sciences Mathématique et de leurs. Premiers éléments d un bilan à deux ans.

Télécom École de Management PROGRAMME GRANDE ÉCOLE #B E T HE N EXT O NE

Transcription:

Mastère Spécialisé Big Data Stéphan Clémençon Télécom ParisTech July 1, 2013 Stéphan Clémençon (Télécom ParisTech) Mastère Big Data July 1, 2013 1 / 15

Agenda Contexte et Opportunité Les grandes lignes du programme de formation Recrutement - Partenariats Stéphan Clémençon (Télécom ParisTech) Mastère Big Data July 1, 2013 2 / 15

Big Data : Le contexte Accumulation de données massives dans de nombreux domaines: Biologie/Médecine (génomique, métabolomique, essais cliniques, imagerie, etc. Grande distribution, marketing (CRM), e-commerce Moteurs de recherche internet (ex: contenu multimedia) Réseaux sociaux (Facebook, Tweeter,...) Banque/Finance (risque de marché/liquidité, accès au crédit) Sécurité (ex: biométrie, vidéosurveillance) Administrations (Santé Publique, Douanes) Risques opérationnels Un déluge de données qui rend inopérant: les outils basiques de gestion de base de données le prétraitement reposant sur l expertise humaine (indexation, modélisation, intelligence décisionnelle) Stéphan Clémençon (Télécom ParisTech) Mastère Big Data July 1, 2013 3 / 15

Big Data Les besoins Le phénomène Big Data requiert des techniques récentes/nouvelles pour: La collecte et le stockage des données La recherche automatique d objets Le partage des données ( cloud, fichiers distribués) L analyse (prédictive) et la visualisation de données massives Des avancées spectaculaires en informatique et en mathématiques appliquées ( machine-learning ) en réponse à cette évolution Big Data, un moteur pour la technologie, l économie: Moteurs de recherche, moteurs de recommandation Marketing viral Détection des fraudes Médecine individualisée Publicité en ligne etc. Stéphan Clémençon (Télécom ParisTech) Mastère Big Data July 1, 2013 4 / 15

Big Data Les cibles De nombreux secteurs d activité sont concernés et susceptibles de recruter des ingénieurs/techniciens avec ce type de compétences, parmi lesquels: (e-) Commerce (ex: Carrefour, Amazon) Web (ex: Google) Santé (ex: Merck, Glaxo, Novartis, SmithKline) Sécurité (ex: Safran, Thalès) Banque/Finance (ex: BNPP) Perspectives: Selon l Institut McKinsey Global, d ici à 2018 aux USA: 140 000-190 000 recrutements de data scientists 15 millions de cadres avec des connaissances générales dans ce domaine Stéphan Clémençon (Télécom ParisTech) Mastère Big Data July 1, 2013 5 / 15

Big Data Les atouts de Télécom ParisTech Une masse critique d enseignants-chercheurs compétents sur le plan académique Administration de bases de données Indexation, compression Prédiction Visualisation Une capacité reconnue à intégrer les contraintes industrielles Projets collaboratifs avec l industrie Valorisation, brevets Stéphan Clémençon (Télécom ParisTech) Mastère Big Data July 1, 2013 6 / 15

Le Machine-Learning à Telecom ParisTech Un thème omniprésent en recherche et dans les applications Applications en Traitement du Signal/Image, Réseaux, Communications Numériques, Sociologie Nombreux spécialistes du domaine: en particulier au sein des départements TSI (STA, TII, AAO et MM) et Infres (IC2) Une compétence originale: les méthodes d apprentissage combinées à un savoir expert dans les domaines du traitement du signal, des réseaux, permet de traiter des données structurées (données dépendantes, séries temporelles, graphes par ex.) Des équipes reconnues: évaluées A+ par l AERES, médaille d argent du CNRS (E. Moulines), participation aux comités scientifiques des conférences majeures Stéphan Clémençon (Télécom ParisTech) Mastère Big Data July 1, 2013 7 / 15

Le Machine-Learning à Telecom ParisTech Une couverture thématique très large Graph-mining: ANR Systèmes Complexes Viroscopy, Futur & Rupture Graphes et Réseaux Filtrage Collaboratif: Projet Digiteo Bemol Apprentissage par renforcement: CRE avec Orange Lab (CRM, Channel-sensing ), Détection d anomalies: ANR-RNRT Oscar Sélection de variables: Cifre Renault Technocentre Apprentissage non supervisé: ANR Tangerine Données structurées: Cifre Exane, Cifre Natixis, Cifre Findworks Tech. Ranking: Cifre Renault Technocentre, Futur & Rupture MetaRank Brevets Logiciels TopRank, TreeRank,... Stéphan Clémençon (Télécom ParisTech) Mastère Big Data July 1, 2013 8 / 15

Le Machine-Learning à Telecom ParisTech Nos partenaires académiques Au sein de ParisTech: Polytechnique (CMLA) Mines (Centre de Bio-informatique) ENPC (Cermics) ENSAE (Crest) INRIA/ENS Ulm (SIERRA) CEA LIST (LIMA) UPMC (Lip6) - Groupe d Intérêt Scientifique PARISTIC Université Paris Sud (LRI) Co-animation du séminaire SMILE Stéphan Clémençon (Télécom ParisTech) Mastère Big Data July 1, 2013 9 / 15

Le Machine-Learning à Telecom ParisTech Enseignement: une compétence reconnue Cours de Machine-Learning en Masters, co-habilités par Telecom ParisTech: Modélisation Aléatoire (Université Paris 7), Mathématiques Vision Apprentissage ENS Cachan Ensae ParisTech (Cours de 3ème année) ENPC ParisTech (Cours de 2ème année) Un parcours dédié à Telecom ParisTech: Apprentissage Fouille de Données et Applications Un cours de Web-Mining pour la formation des Ingénieurs du Corps Mines-Télécom Une Formation Continue destinée aux chefs de projet, ingénieurs techniciens Stéphan Clémençon (Télécom ParisTech) Mastère Big Data July 1, 2013 10 / 15

Une chaire Apprentissage Statistique à Telecom ParisTech Compétences en Machine-learning: une demande croissante depuis 10 ans Nombreux débouchés professionnels (secteurs high-tech, biotech, marketing, finance, sécurité, etc.) dans l Industrie (PME innovantes, grands groupes) Un domaine clef de l innovation technologique (Carnegie Mellon, Waterloo, CalTech, MIT) Une offre aujourd hui insuffisante en (Ile de) France Les forces de Telecom ParisTech Une équipe de recherche performante Une masse critique de chercheurs (en comparaison des autres acteurs en France), permettant un rayonnement international Une expérience avérée dans le domaine des applications industrielles Une implication significative dans la formation (cours de spécialité) Des partenaires: X, Mines ParisTech, Ensae ParisTech, ENPC ParisTech, ENSC, Lip6 (UPMC) Stéphan Clémençon (Télécom ParisTech) Mastère Big Data July 1, 2013 11 / 15

Une chaire Apprentissage Statistique à Telecom ParisTech Les objectifs de la chaire Mutualiser les expériences (industrielles et académiques), faire émerger des innovations Permettre un financement plus pérenne des activités de recherche en machine-learning, sur des sujets en amont Création d un Mastère Spécialisé de référence Big Data Accroître la visibilité de la discipline auprès des étudiants (de ParisTech) Stéphan Clémençon (Télécom ParisTech) Mastère Big Data July 1, 2013 12 / 15

Les formations concurrentes : un bref tour d horizon En (Ile de) France Master informatique (Paris 6, Paris 7,...) ESC Grenoble - MS Business Intelligence A l international Stanford University (Stanford Center for Professional Development): Data Mining and Applications Graduate Certificate en 3 ans (12 000 $ env.), avec Sony, Cisco Chicago Northwestern University (MS program in Predictive Analytics), North Carolina State University (MS in Analytics avec SAS), UC San Diego (certificate program in data mining), etc. Secteur privé: SAS, EMC (GreenPlum), IBM (Netezza), Cloudera, etc. Stéphan Clémençon (Télécom ParisTech) Mastère Big Data July 1, 2013 13 / 15

Mastère Spécialisé Big Data Les grandes lignes du programme de formation Quatre volets Gestion/administration de bases de données massives (ex: web, cloud) Outils d indexation, de recherche, de compression (ex: textmining, données multimedia), Visualisation Business intelligence, apprentissage automatique Aspects juridiques et business Animation Projets, fil rouge, groupes de travail (en collaboration avec nos partenaires industriels) Séminaires avec des spécialistes du domaine Stéphan Clémençon (Télécom ParisTech) Mastère Big Data July 1, 2013 14 / 15

Recrutement - Effectif - Partenariats Filières de recrutement Etudiants à la sortie d un Master (informatique, modélisation statistique) Ingénieurs Salariés: cadres, chefs de projet, techniciens Effectif: 20-25 stagiaires Comité de Perfectionnement Google, BNP, Safran, Thalès, EADS, EDF, Criteo, Amazon, Liligo, IBM, Capgemini, SAS, PSA... Stéphan Clémençon (Télécom ParisTech) Mastère Big Data July 1, 2013 15 / 15