Formation Actuaire Data-Scientist PROGRAMME



Documents pareils
Formation Actuaire Data Scientist. Programme au 24 octobre 2014

Introduction au Data-Mining

Introduction au Data-Mining

Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining.

Formation continue. Ensae-Ensai Formation Continue (Cepe)

L'intelligence d'affaires: la statistique dans nos vies de consommateurs

Introduction au datamining

Agenda de la présentation

Panorama des solutions analytiques existantes

Débouchés professionnels

BIG DATA : GESTION ET ANALYSE DES DONNÉES MASSIVES (BGD) Mastère Spécialisé. Appréhendez les challenges économiques et juridiques du Big Data

4.2 Unités d enseignement du M1

GENIE STATISTIQUE GESTION DES RISQUES ET INGENIERIE FINANCIERE MARKETING QUANTITATIF ET REVENUE MANAGEMENT

UNIVERSITÉ DE MONTRÉAL DÉPARTEMENT DE SOCIOLOGIE ************* Cours de niveau gradué en méthodes quantitatives *************

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours

Méthodes d apprentissage statistique «Machine Learning»

Les participants repartiront de cette formation en ayant une vision claire de la stratégie et de l éventuelle mise en œuvre d un Big Data.

Enjeux mathématiques et Statistiques du Big Data

Introduction Big Data

Apprentissage Automatique

Master CCI. Compétences Complémentaires en Informatique. Livret de l étudiant

Apprentissage Statistique :

Coup de Projecteur sur les Réseaux de Neurones

FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis

Techniques du Data Mining pour la prédiction de faillite des entreprises et la gestion du risque de crédit

Stages ISOFT : UNE SOCIETE INNOVANTE. Contact : Mme Lapedra, stage@isoft.fr

Renforcement des trois compétences : compréhension orale, expression orale et expression écrite à partir de documents et vidéos.


Nombre de crédits Nombre d'évaluation UE Majeure de spécialité 6 2. UE mineure de spécialité 3 ou 2 1. UE libre 1 1

Catalogue des stages Ercom 2013

Analyse de grandes bases de données en santé

Accélérer l agilité de votre site de e-commerce. Cas client

Analytics & Big Data. Focus techniques & nouvelles perspectives pour les actuaires. Université d Eté de l Institut des Actuaires Mardi 8 juillet 2014

UE 8 Systèmes d information de gestion Le programme

Pentaho Business Analytics Intégrer > Explorer > Prévoir

Session Usager, Infrastructures, Réseaux sociaux et Transports intelligents

Les technologies du Big Data

Masses de données. 1. Introduction 2. Problématiques 3. Socle de formation (non présenté) 4. Liens avec Formation INSA

Algèbre 40 Analyse Stat. 1 - IES : Probabilités discrètes et calcul intégral 29,5 6 Stat. 2 - IES : Probabilités générales 54 8 UE1-02 M-E-IS

Programme de la formation. Écrit : 72hdepréparation aux épreuves d admissibilité au CRPE

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

Les enjeux du Big Data Innovation et opportunités de l'internet industriel. Datasio 2013

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 27/01/2009 Stéphane Tufféry - Data Mining -

MAÎTRISE ÈS SCIENCES EN GESTION. MICROPROGRAMMES Exploitation de données en intelligence d affaires Analytique d affaires - Énergie 2014 ANNUAIRE

Statistiques et traitement des données

Comment repenser l articulation entre présence et distance dans les dispositifs hybrides?

Programme détaillé BTS INFORMATIQUE DE GESTION DIPLÔME D ETAT. Objectifs de la formation. Les métiers. Durée de la formation

Ne cherchez plus, soyez informés! Robert van Kommer

TRAVAUX DE RECHERCHE DANS LE

Présentation du cursus Animateur de Cluster et de réseaux territoriaux Etat du 14 avril 2013

BIG DATA en Sciences et Industries de l Environnement

Mastère spécialisé. «Ingénierie de l innovation et du produit nouveau De l idée à la mise en marché»

MASTER MANAGEMENT PARCOURS MANAGEMENT ET TECHNOLOGIES DE L'INFORMATION ET DE LA COMMUNICATION

Spécifications, Développement et Promotion. Ricco RAKOTOMALALA Université Lumière Lyon 2 Laboratoire ERIC

MASTER 2 IMAFA. Informatique et Mathématiques Appliquées à la Finance et à l'assurance

Université Libre de Tunis

Big Data et Prévisions. Philippe Picard, le 24 juin Page 1

Cycle de formation certifiante Sphinx

Annexe au dossier du cursus CMI SID Licence - Master en Ingénierie. Syllabus L3 et Master SID Statistique et Informatique Décisionnelle

Des formations métiers pour maîtriser la science actuarielle

Diplôme de Comptabilité et de Gestion. D é c r e t N d u 2 2 d é c e m b r e A r r ê t é d u 8 m a r s

1 INFORMATION - INFORMATIQUE. 11 Systèmes d'information gestion des connaissances, knowledge management

Offre formation Big Data Analytics

Data Mining. Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales

Les Entrepôts de Données

UNIVERSITÉ MOHAMMED VI POLYTECHNIQUE MASTERE SPÉCIALISÉ MILEO

Projet de programme pour l enseignement d exploration de la classe de 2 nde : Informatique et création numérique

ANNEXES. Evaluation de la formation à Polytech Lille Département GIS. Enseignements les plus utiles. Enseignements à renforcer

LICENCE PROFESSIONNELLE EN MANAGEMENT ET ECONOMIE DU NUMERIQUE (LIPMeN)

CENTAI : Big Data & Big Analytics Réunion DGPN / Thales Octobre 2013

La rencontre du Big Data et du Cloud

Grâce aux compétences acquises, il participe ou pilote des activités qui peuvent consister à :

sous réserve de validation des modifications DROIT ECONOMIE GESTION SCIENCES DU MANAGEMENT FINANCE

Mastère spécialisé MS : «Ingénierie de l innovation et du produit nouveau

SAS ENTERPRISE MINER POUR L'ACTUAIRE

Demande de transformation de la formation qualifiante TEMIR : Technicien En Maintenance Informatique et Réseaux en diplôme d université (DU)

PLAN DE COURS TYPE COMMUNICATION MARKETING UNE PERSPECTIVE INTÉGRÉE

Modélisation aléatoire en fiabilité des logiciels

SUPPLEMENT AU DIPLOME

BIG DATA et DONNéES SEO

Programmes des classes préparatoires aux Grandes Ecoles

SCIENCES DE L ÉDUCATION

Que fait SAS Enterprise Miner?

MASTER 2 SCIENCES HUMAINES ET SOCIALES Mention Psychologie. Spécialité : Recherches en psychologie

Systèmes et réseaux d information et de communication

Le Mastère Spécialisé Big Data de Télécom ParisTech

Groupe de Discussion Big Data Aperçu des technologies et applications. Stéphane MOUTON

MASTER MAE MANAGEMENT

DESCRIPTIF DE MODULE S4 ADG : Mathématique pour la Gestion

Cours 1 : Introduction. Langages objets. but du module. contrôle des connaissances. Pourquoi Java? présentation du module. Présentation de Java

Panorama des problématiques de traitement de l information. Larbi Aït Hennani, Fatma Bouali, Vincent Vandewalle

Machine Learning 9:HSMBKA=\WU\YX: Big Data et machine learning. Manuel du data scientist. InfoPro

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION

Big Data et Graphes : Quelques pistes de recherche

Le data mining et l assurance Mai Charles Dugas Président Marianne Lalonde Directrice, développement des affaires

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

La classification automatique de données quantitatives

Transcription:

Formation Actuaire Data-Scientist PROGRAMME 15 Septembre 2014 Arthur Charpentier, Romuald Élie & Jérémie Jakubowicz 15914

Programme Séance inaugurale : révolu-on numérique besoins des entreprises cadre réglementaire éthique et normes 3 blocs pédagogiques : cours et TD (114 h) approfondissements et applica-ons aux mé-ers de l assurance (40 h) réalisa-on d un projet individuel sur un sujet actuariel Rythme : 2 jours par mois comportant à la fois cours et cas pra-ques début du projet à miparcours

Programme A) Éléments logiciels et programmation Python ~ 18h B) Datamining et programmation R ~ 18h C) Algorithmique en Machine Learning et mise en situation ~ 24h D) Fondements théoriques de l apprentissage statistique ~ 24h E) Machine Learning distribué et applications ~ 12h F) Extraction, utilisation et visualisation des données ~ 18h Applications aux métiers de l assurance ~ 40h * nombre d'heures à titre indicatif

Programme A) Éléments logiciels et programmation Python ~ 18h Objectif : Introduction au langage Python et sensibilisation aux grandeurs informatiques pertinentes. Éléments de programme : Initiation à la programmation Python Programmation objet, classes, héritage Bibliothèque des méthodes statistiques usuelles Éléments logiciels pour grandes bases de donnée Hardware, performance machine et gestion de mémoire Efficacité d'un algorithme Complexité, accès mémoire, ordres de grandeur

B) Datamining et programmation R ~ 18h Objectif : Présenter les outils classiques d'exploration de données, sous un angle essentiellement descriptif. Ces cours permettra une remise à niveau en R, en rappelant, durant les premières heures, les bases de la programmation en R. Éléments de programme : Programme Manipuler des données sous R : données continues, facteurs (recodification), dates, heures Bases de la programmation avancée en R Méthodes non-supervisées Analyse factorielle et détection de clusters

C) Algorithmique en machine learning et mise en situation ~ 24h Objectif : Approche par mise en situation via la participation à un concours type Kaggle. Présentation des différentes phases : exploration, sélection/transformation des données, algorithmes d apprentissage, visualisation Éléments de programme : Programme Étude de cas Exploration/ Sélection / Transformation / Nettoyage des données Principaux algorithmes de Machine Learning (contexte de Classification) K-NN, Régression Logistique, SVM Forêts aléatoires, Réseaux de Neurones Boosting, Bagging Procédures de validation / sélection de modèle Visualisation Retour d expérience et analyse des résultats

D) Fondements théoriques de l apprentissage statistique ~ 24h Objectif : Présenter les fondements mathématiques des principales méthodes de Machine learning Éléments de programme : Programme Théorie de la décision, Perte, risque, risque empirique Modèle statistique pour la classification binaire, Approches génératives vs. discriminantes Machine Learning, Méthodes paramétriques, perceptron, partitionnement Algorithmes de classification de données massives, Convexification du risque, boosting et SVM Méthodes ascendantes et descendantes, Critères AIC et BIC Régression linéaire: limites et améliorations : Parcimonie. Régression pas à pas Approche par pénalisation: ridge, lasso... Modèles linéaires généralisés, Méthodes de régression alternatives, Approche non linéaire: polynômes locaux, ondelettes Régression PLS et CART

E) Machine Learning distribué et applications ~ 12h Objectif : Pour passer à l échelle, les algorithmes de Machine Learning vus dans les cours précédents doivent être repensés. Un cadre efficace est celui des algorithmes distribués où on utilise plusieurs entités de calculs pour mener à bien l objectif initial. L objectif de ce cours sera de présenter différents exemples d algorithmes de Machine Learning distribués Éléments de programme : Algorithmes distribués : généralités Le cas de Map-Reduce Applications en Machine Learning Programme

F) Extraction, utilisation et visualisation des données ~ 18h Objectif : Programme Description des enjeux économiques et sociétaux de la révolution numérique du Big Data. Présentation des architectures de bases ou entrepôts de données, ainsi que des techniques d'exploration associées pour la récolte des données. Sensibilisation aux questions éthiques sous-jacentes, aux contraintes juridiques européennes et au rôle de la CNIL. Présentation des principales méthodes de visualisation des données complexes. Éléments de programme : Écosystème des données massives SQL vs NoSQL Anonymisation de données, Protection des données personnelles, enjeux économiques Visualisation des données

Applica;ons aux mé;ers de l assurance Approfondissements et études de cas ~ 40h Objectif : Présentations de sujets «métier» et mises en situation via des interventions courtes, et techniques, (2 à 4 h) sur des thématiques précises. Exemples : l Cartographie et GPS l Géolocalisation et anonymisation l Traitement de données textuelles l Health monitoring l Détection de fraude l Applications en Génomique l Investissement séquentiel en gestion de portefeuille l Enchère web l Réseaux de neurone & e-commerce l Calcul du capital économique en grande dimension l Vente d assurance en ligne l Visualisation de données et réseaux sociaux l Biosécurité l Parallélisassions massive pour la simulation Monte Carlo

Planning (susceptible d ajustements) 15914 * calendrier donné à titre purement indicatif

Réalisation d un projet Les participants à la formation réaliseront un projet visant à exhiber l'apport de ces nouvelles méthodologies statistiques et informatiques pour la modélisation d'un phénomène actuariel Projet réalisé sous le tutorat d un membre du corps enseignant de la formation Projet réalisé sur la deuxième moitié de la formation Rédaction d un rapport et soutenance devant un jury de membres du corps enseignant ainsi que l ensemble de la promotion (sauf conflit trop important pour cause de confidentialité). 15914

Validation de la formation Plusieurs examens ou Qcm au cours de la formation, pour valider l acquisition de blocs précis de compétences en data science Réalisation et soutenance d un projet mettant en application les compétences acquises à des problématiques actuarielles Obtention du diplôme Actuaire Data Scientist de l Institut du Risk Management 15914