Formation Actuaire Data-Scientist 4 JUILLET 2014
Objectifs de la formation Initier les participants aux méthodologies statistiques et informatiques en lien avec la manipulation de données massives. Sensibiliser les participants à l impact potentiel de ces méthodes en terme de création de valeur dans les métiers de l'assurance (tarification personnalisée, marketing et distribution ciblée, évaluation de risque de rachat/arbitrage/morbidité.) Compléter les formations en Actuariat
Public cible Par ordre de priorité: Ø Membre de l Institut des Actuaires sans ancienneté requise Ø Non membre de l Institut des Actuaires exerçant des fonctions de gestion des risques ou actuarielles Prérequis: Ø Maîtrise du Core Syllabus de l Institut des Actuaires Ø Bonne pratique de la programmation informatique
Compétences acquises à l issu de la formation Maîtrise des principales méthodes d apprentissage et de statistique en grande dimension Mise en place de ces méthodes online ou offline sous R ou Python Utilisation des méthodes de calcul parallèle massif (Hadoop ) Evaluation de l efficacité d un algorithme (complexité, gestion de la mémoire) Connaissance des différents moyens de stockage de données dans une compagnie d assurance Connaissance des outils de visualisation permettant de synthétiser une grande quantité d information
Pilotage de la formation Direction des études: Arthur Charpentier et Romuald Elie Responsable gestion : Catherine Idée-Rosier Comité de pilotage: Marc Hoffman Michel Bois Florence Picard Renaud Dumora Philippe Marie-Jeanne Francoise Soulie Fogelman
La formation en quelques chiffres Objectif de 20 (maximum 25) participants 168 heures de formation : Un lundi-mardi par mois pendant 12 mois Première promotion: de Mars 2015 à Avril 2016 Coût: 14 000 Euros
Processus d admission Réception des candidatures: 29 Septembre au 31 Octobre 2014 (au plus tard) Entretien avec la direction des études: courant Novembre 2014 Jury d admission: courant Décembre 2014
Programme prévisionnel A. L'environnement Big Data (env. 30 heures) Ø Description des enjeux économiques, sociétaux et déontologiques de la révolution numérique du Big Data. Ø Sensibilisation aux différentes typologies de données. Ø Présentation des architecture de bases ou entrepôts de données, ainsi que des techniques d'exploration associées. Ø Présentation de diverses méthodes de visualisation de données complexes B. Méthodologie statistique (env. 50 heures) Ø Présentation des principales méthodes statistiques d'exploration de large volume de données Ø Approche data-driven, apprentissage statistique, sélection de modèles, classification, régressions pénalisées, parcimonie, clustering. Ø Obtention d'un socle théorique solide pour comprendre leurs spécificités et limites ainsi que connaitre leurs principales propriétés mathématiques.
Programme prévisionnel C. Mise en œuvre informatique (env. 50 heures) Ø Utilisation des logiciels R, Python et des librairies statistiques correspondantes. Ø Analyse de la performance d'un algorithme Ø Introduction au cloud computing et programmation parallèle de procédures statistiques classiques. D. Approfondissements et études de cas (environ 40 heures) Ø Etude d'applications concrètes de l'utilisation des techniques statistiques ou informatiques précédentes Ø Applications en actuariat mais aussi en génomique, e-commerce, détection de fraudes, gestion d'actifs, enchères publicitaires, marketing. Ø Présentation de techniques propres à certaines problématiques numériques ou certaines typologies de données: linguistique textuelle, reconnaissance d'image...
Réalisation d un projet Les participants à la formation devront réaliser un projet visant à exhiber l'apport de ces nouvelles méthodologies statistiques et informatiques pour la modélisation d'un phénomène actuariel Projet réalisé sous le tutorat d un membre du corps enseignant de la formation Projet réalisé sur la deuxième moitié de la formation entre Octobre 2015 et Avril 2016 pour la première promotion Rédaction d un rapport et soutenance devant le jury de validation, ouverte à l ensemble de la promotion (sauf dans certains cas exceptionnels pour cause de confidentialité).
Validation de la formation Plusieurs examens ou QCMs au cours de la formation, pour valider l acquisition de blocs précis de compétences en data science Réalisation et soutenance d un projet mettant en application les compétences acquises à des problématiques actuarielles Jury de validation en Mai 2016 pour la première promotion Obtention d un diplôme d actuaire data-scientist délivré par l Institut du Risk Management