Master Mathématiques et Applications Spécialité : Ingénierie mathématique et modélisation Parcours : Mathématique et Informatique : Statistique, Signal, Santé (MI3S) 2015-2016 RÉSUMÉ DES COURS : (dernière mise à jour : 22/06/2015) Cours de la période 1 : Anglais (M. Barthelemy) Renforcement des trois compétences : compréhension orale, expression orale et expression écrite à partir de documents et vidéos. Pré-professionnalisation (E. Jugan) Projet de modélisation et d'utilisation de logiciel Matlab (V. Emiya et C. Melot) Objectifs du module: objectif principal: acquérir des compétences de programmation, en Matlab, en étant capable de mettre en œuvre un projet de programmation incluant des algorithmes dans le cadre d'applications sur des données réelles. Cet objectif répond à un besoin d'élever le niveau des étudiants en programmation, avec pour conséquence directe le bon déroulement des projets en périodes 2 et 3. objectif secondaire: approfondir une ou plusieurs techniques en rapport avec les thématiques de la filière MI3S objectif tertiaire: acquérir une compétence dans la manipulation de données d'un ou plusieurs types (signal, médical, etc.) Contenu: Nous aborderons la thématique des modèles parcimonieux (i.e. y=dx, le vecteur y étant l'observation, la matrice D le "dictionnaire" connu et le vecteur x étant inconnu avec un hypothèse de parcimonie x _0<k). Elle a l'avantage d'être assez générale et de pouvoir ainsi se décliner dans plusieurs projets. Une présentation de ces modèles fera le lien entre les différents contextes d'utilisation: en signal (codage/compression, problèmes inverses), en statistiques (sélection de variables pour la régression), en apprentissage, en optimisation convexe. Deux familles d'algorithmes seront abordées: les approches gloutonnes (matching pursuit, forward selection,...) et les techniques de minimisation convexe (lasso, etc.). Un grand nombre d'applications seront présentées en signal, stats, santé, etc., puis la reconstruction de données manquantes (i.e. l'inpainting) fera plus spécifiquement l'objet des projets. En croisant au moins deux types d'algorithmes (glouton/convexe) et deux applications (inpainting d'images/de sons), les (quatre ou plus) combinaisons possibles formeront autant de projets de programmation en Matlab. Ceci avec le double but de favoriser la programmation de type modulaire (modules indépendants avec tests unitaires intégrés dans une architecture globale) et de permettre des discussions entre les groupes. Programmation C et/ou Java et mini projet (F.X. Dupé)
Le programme portera sur des éléments d'algorithmique avancée et leur mise en œuvre en Java. On étudiera notamment le problème du tri, les structures de données linéaires, arborescentes et relationnelles ainsi que les grands algorithmes y afférents. On abordera à cette occasion les techniques dites "divide and conquer", la programmation dynamique, les algorithmes gloutons. Tous les algorithmes seront prouvés et évalués en fonction de leur complexité en temps et en espace. Tous donneront lieu à une programmation en Java. Les éléments du langage Java nécessaires à cette programmation seront introduits tout au long du semestre. Modèles pour la Finance (D. Henriet) cours à Centrale. Introduction aux produits financiers. Problèmes de valorisation. Approches de l'équilibre. Modèles probabilistes et déterministes dans le domaine de la santé (C. Gomez, F. Hubert) L'objectif de ce cours est de présenter quelques modèles mathématiques déterministes et stochastiques utilisés dans le domaine de la santé. L'approche déterministe sera développée par F. Hubert. Les premiers modèles déterministes utilisés en médecine sont des équations différentielles. On commencera par faire un historique des modèles de populations, à la base de la plupart des modèles. On présentera des exemples en épidémiologie, en cancérologie, en pharmacologie. Ces modèles peuvent être enrichis pour prendre en compte des phénomènes de propagation spatiale ou de structuration en âge des cellules. Les modèles sont alors des équations aux dérivées partielles de type parabolique ou de type transport. Des exemples seront proposés notamment en cancérologie. On finira par étudier un problème inverse utilisé par une machine d'imagerie par bioluminescence. C. Gomez quant à lui, après quelques rappels sur les processus de Markov de sauts, proposera des modèles stochastiques de carcinogenèse. Ce phénomène cellulaire à plusieurs étapes, observé cliniquement et chez l'animal en laboratoire, décrit la transformation d'une cellule saine en une cellule cancéreuse. Nous présenterons des modèles, basés sur les processus de naissance et de mort, permettant par exemple d évaluer les chance d'apparition d'une tumeur lorsque les cellules sont exposées à un carcinogène (un produit chimique toxique). Si le temps le permet, nous introduirons les processus de branchement qui, avec les processus de naissance et de mort, sont des processus stochastiques très reperdus en cancérologie, épidémiologie, immunologie, chimiothérapie, etc... Statistique inférentielle (A. Nasr) cours du master infomatique recherche (St Charles). Théorie des probabilités et statistique inférentielle. Ce cours permet d'acquérir des bases solides pour l'apprentissage automatique ou le traitement automatique de la langue naturelle. Cours de la période 2 :
Economie du risque et de la Finance (R. Bourlès, D. Henriet) - cours à Centrale. Partie Risque (D. Henriet) - Chapitre 0 : Quelques intuitions - Chapitre 1 : L'aversion au risque : le modèle d'utilité espérée - Chapitre 2 : Changement de risque : étalement à moyenne constante, dominance stochastique - Chapitre 3: La demande : demande d'actif risqué et demande d'assurance Partie Assurance (R. Bourlès) - Chapitre 1 : Le modèle à risque unique - Chapitre 2 : La différenciation des produits - Chapitre 3 : Les critères inobservables 14 - Chapitre 4 : Le risque moral Statistique Industrielle (F. Autin). - Analyse de la variance - Tests, contrôle de qualité - Plans d'expérience Apprentissage numérique (F.X. Dupé) cours du master infomatique recherche (St Charles). Étude de quelques unes des méthodes les plus performantes en apprentissage numérique : les réseaux de neurones, les modèles de Markov cachés et les machines à vecteurs de support. Analyse numérique des EDP (F. Hubert) cours du parcours EDP/CS. Ce cours a pour but l'étude de méthodes numériques avancées pour la résolution d'équations aux dérivées partielles dans des domaines bornés de dimension supérieure ou égale a 2. Le cours se concentrera sur l'approximation des équations elliptiques. Si le temps le permet, nous aborderons les difficultés supplémentaires rencontrées dans la discrétisation des problèmes paraboliques. Les méthodes numériques étudiées traditionnellement en licence ou en premiere année du master sont basées sur l'approche différences finies et à ce titre sont essentiellement destinées à résoudre des problèmes dans des géometries simples : en 1D ou en géométrie multi-d cartésienne. Cette approche, bien qu'intéressante à titre d'initiation aux concepts essentiels de l'analyse numérique, n'est plus suffisante pour attaquer des problèmes réels tels qu'on les trouve dans l'industrie. Pour traiter ces problèmes plus complexes, plusieurs classes de méthodes ont été développées dans les dernières décennies. Ce cours proposera une introduction à la méthode des Eléments Finis puis a la méthode des Volumes Finis. Dans chaque cas, on décrira le principe de la méthode, on évoquera certains aspects de son implementation, on démontrera des résultats de convergence et/ou d'estimations d'erreurs. La mise en pratique sur ordinateur des méthodes étudiees s'effectuera sous scilab et freefem. Calcul scientifique (T. Gallouët) cours du parcours EDP/CS L'objectif de ce cours est la mise au point de schemas numériques et la réalisation de codes de calculs pour quelques exemples d'equations aux Derivees Partielles modélisant des problèmes simples de mécanique. Les codes de calculs seront réalisés en scilab ou en fortran. Les problèmes modélisés seront probablement choisis parmi
les exemples suivants : - équilibre thermique dans une conduite, - écoulement diphasique en milieu poreux, - écoulement en rivière. Statistique biomédicale (E. Pardoux) Le but de ce cours est de présenter les méthodes statistiques spécifiques de la médecine. Il sera illustré par des exemples de traitement de données médicales. Il sera divisé en 3 chapitres : 1. Régression logistique. Estimation et tests; Interprétation des coefficients. 2. Introduction à l'nalyse de survie Estimateur de Kaplan Meier; Modèle semi-aparmétrique de Cox. 3. Statistique bayésienne et application aux données médicales comportant de petits échantillons. Traitement des images (F. Richard) Les champs gaussiens sont des modèles aléatoires spatiaux qui sont très utilisés à la fois en traitement d'images et en statistique spatiale. En traitement d'images, ils permettent notamment de faire de la synthèse et de l'analyse de textures. En statistique spatiale, ils servent principalement pour le krigeage, opération qui consiste à estimer des valeurs d'un phénomène spatial en des points non observés à partir de quelques points observés. Tout en étant axé sur ces applications, le cours a pour objectif de présenter les outils qui permettent d'utiliser les champs gaussiens dans les domaines du traitement d'images et de la statistique spatiale. Il comprendra une introduction aux champs gaussiens, à leur principales propriétés (stationnarité, régularité, isotropie) et à leurs représentations spectrales, une présentation de méthodes de simulations de réalisations de ces champs (méthodes de Fourier, des bandes tournantes, ). Une présentation des méthodes d'estimations (estimations paramétriques de variogramme) et de leur application au krigeage. Le cours comportera des TP où seront réalisés des projets sur des problèmes concrets. Cours de la période 3 : Maths Financières (E. Pardoux). Mouvement brownien, calcul stochastique, mouvement brownien géométrique. Le modèle de Black-Scholes. Options européennes : la formule de Black-Scholes. Lien entre processus stochastiques et EDP : la formule de Feynman-Kac Calcul du prix d'une option panier : EDP et méthode de Monte Carlo Introduction aux options américaines.
Statistiques avancées (P. Pudlo) De la régression linéaire aux méthodes d'apprentissage : - validation croisée et bootstrap - sélection de modèles (AIC, BIC,...) et régularisation ridge et lasso - méthodes non-linéaires (splines, régressions locales) - CART, bagging, forêts aléatoires et boosting Ces méthodes seront mis en oeuvre en TP avec R. Séries chronologiques (M. Carenzi) Estimation et élimination de tendance et composante périodique, Etude complète des modèles ARMA, Estimation des paramètres et prédiction de valeurs futures, Mise en pratique avec le logiciel R. Algorithmes stochastiques (F. Castell) Simulation de variables aléatoires (discrètes et continues), Méthodes MCMC, Recuit simulé et algorithmes génétiques, Applications en biologie. Problèmes inverses en traitement des signaux et des images (S. Anthoine, C. Chaux). La stéréovision autrement dit le problème d'estimation de la profondeur d'une scène à partir de deux images 2D de celle-ci; la reconstruction d'images médicales telles que les images de scanner tomographiques ou d'irm; ou encore la restauration d'images (débruitage et défloutage) sont différents exemples de problèmes inverses en traitement d'images. Il s'agit plus généralement d'estimer des quantités non directement observables. Ceci nécessite l'inversion de l'opérable dit "direct" (qui permet de relier les données aux observations). Ce problème étant mal posé, différents types de régularisation peuvent être mis en oeuvre. Ce cours vise à donner les bases mathématiques et à introduire quelques méthodes classiques de résolution de problèmes inverses. Nous étudierons des approches probabilistes (par exemple l'algorithme EM) ainsi que déterministes (comme les approches parcimonieuses) et les illustrerons sur des applications diverses (stéréovision, superrésolution, reconstruction tomographique,...) dont certaines seront implémentées en travaux pratiques.