Axe MSA Bilan scientifique et perspectives ENSM.SE L. Carraro - 17 décembre 07
17 décembre 07 2 Plan Compétences acquises domaines scientifiques compétences transverses Domaines ou activités accessibles : immédiatement au prix d adaptations faciles via des efforts conséquents Conclusion
17 décembre 07 3 Cartographie (domaines scientifiques) spatial Complexité croissante temporel monodim multidim linéaire multidim non linéaire statique
17 décembre 07 4 Cartographie (domaines scientifiques) spatial séries chros processus temporel monodim Cours 1A projet statique multidim régression linéaire plans exp. anal. données multidim non linéaire
17 décembre 07 5 Cartographie Compétences transverses Questionnement sur un problème Compréhension Prise en compte du contexte, des contraintes Rapport coût/qualité Communication écrite orale Travail en groupe
17 décembre 07 Domaines ou activités 6 accessibles immédiatement Etudes de données expérimentales laboratoires (industrie, santé ) mise en évidence de facteurs importants service qualité Prévisions prévisions de vente ou de consommation finance, assurances prévisions de coûts
17 décembre 07 Domaines ou activités 7 accessibles immédiatement Aide à la décision construction d indicateurs probabilisation de décisions sociétés de conseil (finance, risques ) Appui méthodologique à un autre domaine mécanique, matériaux procédés, environnement santé
17 décembre 07 Domaines ou activités 8 accessibles facilement Statistical Process Control. Traitement statistique du signal. Séries temporelles multidimensionnelles, économétrie. Régression non linéaire. Méthodes non paramétriques en petite dimension.
17 décembre 07 9 géostatistique linéaire spatial analyse d images séries chros monodim calcul processus stochastique processus, champs de Markov Cours 1A statique Aller plus loin? temporel traitement du signal - filtrage géostatistique non linéaire compression, ondelettes multidim régression linéaire plans exp. anal. données Apprentissage statistique : réseaux multidim de neurones support non vector linéaire machines bagging, boosting
17 décembre 07 10 géostatistique linéaire spatial analyse d images séries chros monodim calcul processus stochastique processus, champs de Markov Cours 1A statique Aller plus loin? temporel traitement du signal - filtrage géostatistique non linéaire compression, ondelettes multidim régression linéaire plans exp. anal. données Apprentissage statistique : réseaux multidim de neurones support non vector linéaire machines bagging, boosting
17 décembre 07 Filtrage de Kalman 11 et modèles d état! Modèle d état : X n = F X n"1 + G# n équation d état Y n = H X n + F n équation d observation Y n : vecteur p*1 observé au temps n X n : vecteur q*1 décrivant le système au temps n E n, F n : vecteurs de résidus aléatoires Modèle discret d équation différentielle bruitée, avec mesure.
17 décembre 07 12 Cas d un ARMA(2,1)!! x n " # 1 x n"1 " # 2 x n"2 = $ n " % 1 $ n"1 # X n = % $ x n x n"1 & # (, E n = ) n % ' $ ) n"1 & (, Y n = x n ' # X n = " 1 " 2 & # % ( X $ 1 0 n)1 + 1 )* & 1 % ( E ' $ 0 0 n ' [ ] X n Y n = 1 0!
17 décembre 07 13 Problèmes traités Filtrage : E(X n /Y 1,,Y n ) =? Prévision : E(X n+h /Y 1,,Y n ) =? Var(X n+h /Y 1,,Y n ) =? Loi de X n+h /Y 1,,Y n ) =? Algorithme de Kalman, valable en temps continu (ED stochastiques), non stationnaire. Applications innombrables aux pbs temps réel (cf. aéronautique) Vers le contrôle
17 décembre 07 14 Géostatistique Historique : exploitation minière (or) D. Krige, G. Matheron Modélisation de phénomènes spatiaux : Géométrie en 2D ou 3D (ou ND!) Observations non régulières Observation d une fonction y(x) en certains points x de l espace. Objectif = prévoir y(x) pour des x non observés ou inobservables.
17 décembre 07 15 Modèle probabiliste y(x) est supposé être la réalisation d un processus gaussien Y(x) tel que : [ ] = m E Y(x) [( ) 2 ] = 2#(h) E Y(x + h) " Y(x) γ est le (demi-) variogramme du processus! Si Var(Y(x)) = σ 2 : cov(y(x),y(x + h)) = " 2 # $(h)!
17 décembre 07 16 Lien variogramme-processus
17 décembre 07 17 Simulations en 2D
17 décembre 07 18 Simulations en 2D
17 décembre 07 19 Applications Tous les domaines qui mettent en œuvre des variables spatiales non totalement accessibles : Mines, pétrole, gaz Environnement Halieutique Computer experiments
17 décembre 07 Estimation de la longueur 20 moyenne du hareng écossais
17 décembre 07 21 Carte au toit d un champ pétrolier
17 décembre 07 22 Vers l apprentissage statistique Arbres de régression : Principe : Première séparation : Parmi tous les prédicteurs et tous les niveaux, trouver ceux qui séparent la réponse en deux groupes les plus hétérogènes (déviance) Séparations suivantes : Recommencer dans chaque sous-groupe Elagage de l arbre Remonter dans l arbre et couper les branches homogènes.
17 décembre 07 23 Exemple : données de spam 1 réponse qualitative : spam ou pas spam 57 prédicteurs : fréquence d apparition de caractères ou de mots. 4601 observations NB : X. = ; X..3=! X..1=( X..2=[ X..4=$ X..5=#
17 décembre 07 24 Arbre avant élagage
17 décembre 07 Arbre après élagage 25
17 décembre 07 Problèmes de stabilité 26
17 décembre 07 27 Modèles de ruine Origine : assurances sinistres, conception de barrages, fils d attentes Réserve de risque Z(t)au temps t : Z(t) = x + βt - X(t) x = capital initial β = taux (constant) de primes d assurances entrantes X(t) = montant des sinistres cumulé au temps t X(t) = N " t X k k=1
17 décembre 07 28 Hypothèses et premiers éléments (N t ) t est un processus de Poisson homogène d intensité λ Les variables X k sont i.i.d. d espérance µ!! E(X(t) /N t ) = µn t Et par suite : E(Z(t)) = x + "t # $µt Donc on doit avoir " > #µ!
17 décembre 07 29 Vers la théorie de la ruine Explicitation du lien entre x et P(T<+ ) T = instant de ruine = Inf{t, Z(t)<0} Difficulté du problème : Théorique (voir martingales) Numérique (processus à sauts) Introduction de la réassurance
17 décembre 07 30 Conclusion Axe MSA = des bases solides Compléments méthodologiques : option maths applis finance, assurance autres Compléments applicatifs : tous domaines