LPCplus Particules, plasmas, Univers, applications Diplôme Universitaire Data Scientist 23/01/17
Introduction Offre de formation Diplôme Universitaire de Data Scientist Projets connexes Innovative Training Network Autre projets 2
Contexte Refonte de l offre de formation Fusion des 2 universités Clermontoises UCA Mise en place rentrée 2017 Master Physique Fondamentale et Applications (PFA) Parcours Univers et Particules Nouveau module Data science (90h en M2) Répond au besoin de professionaliser le Master Informatique avancée, Statistiques, Data mining, Machine Learning Légitimité: Expériences fouille données (LHC, LSST) Projets connexes (ITN ) Conseil de perfectionnement (Yandex ) Formation dédiée «Data Scientist» Diplôme Universitaire (flexibilité) Ouverture vers un public plus large 3
Master PFA / DU DU Data Science Master PFA 4
Diplôme Universitaire Data Scientist Durée de la formation : 1 an, volume horaire : 100h. Mode d accès : formation initiale (Master) ou formation continue (CNRS, Université, entreprises) Financement : formation continue/professionnelle, soutient initial IN2P3? Partenaires envisagés LIMOS (UMR): Informatique, Modélisation et Optimisation Systèmes CC-IN2P3 (réunion prévue avec P-E Macchi) Evolution potentielle vers DIU en partenariat avec Université Grenoble (contact C. Biscarat, LPSC) Débouchés Métiers de Data Scientist (data analyst, data miner) Chargé d études statistiques Chargé d études prospectives et d optimisation Analyste en intelligence socio-économique Responsable gestion et analyse de données Développeur analyste-programmeur Métiers de la Recherche 5
(Quelques) Formation de Data Scientist en France 6
Projet ITN : AMVA4NewPhysics Advanced Multivariate analysis for New Physics searches Innovative Training Network (ITN): EU Marie Curie Actions H2020 Aimed at training (PhD) students and performing research Develop and improve advanced stat learning tools for data analysis Training of students in stat learning, computational tools, data science Perform studies in Higgs sector and searches for new physics at LHC Network of 8 institutes and 7 partners Officially started 1 September 2015, duration: 48 Months Recruitment a total of 10 ESR ( Early Stage Researchers) Recruitment of 1 ESR at LPC: Fabricio Jimenez (15/07/16) ATLAS-LPC contributors: JD (PI), D. Calvet, E. Busato 7
Projet ITN : AMVA4NewPhysics 8 Beneficiary nodes: INFN, Oxford U., UBP, U. C. Louvain, LIP, IASA, U. Padova, CERN 7 partners (3 academic, 4 industrial): EPFL, U.C Irvine, TUM, B12 Consulting, SDG, Mathworks, Yandex Work packages -WP1: Higgs (D. Bortoletto, UOXF) -WP2: New Physics (JD, UBP) -WP3: ME developments (F. Maltoni, UCL) -WP4: Statistical tools (G. Menardi, PD) -WP5: Career development -WP6: Outreach -WP7: Management 8
Autres initiatives EDISON http://edison-project.eu/ Projet 2 ans 09/2017 (nouveau projet déposé) Travail sur la création de profession de Data Scientist EDISON Data Science Framework Suite de documents définissant la profession de Data Scientist Vise enseignants, employés et entreprises 9
Annexes 10
Contenu de la formation 11
Contenu de la formation 12
ITN Project: scientific goals of WP2 Study LHC Run 2 data for new physics searches Specialize/Optimize Statistical Learning methods Comparison study of advanced MVA algorithms Signature-specific new physics searches (CMS) Global searches considering wide number of signatures (ATLAS) Develop tools for reinterpretation of MVA results for NP searches Main beneficiary of this WP UBP, IASA, CERN, TUM Other contributors UNIPD, INFN, UCL, UCI, EPFL Partners (secondments) Yandex, MW, SDG 4 ESR will work on WP2 UBP (ATLAS) : 36m IASA (CMS) : 36m CERN (TH): 36m CERN (CMS): 24m List of all contributors : http://www.pd.infn.it/amva4newphysics/allparticipants.html 13