Package CAPUSHE pour le logiciel R



Documents pareils
Principe de symétrisation pour la construction d un test adaptatif

Etude des propriétés empiriques du lasso par simulations

Détection de têtes dans un nuage de points 3D à l aide d un modèle de mélange sphérique

21 mars Simulations et Méthodes de Monte Carlo. DADI Charles-Abner. Objectifs et intérêt de ce T.E.R. Générer l'aléatoire.

AICp. Vincent Vandewalle. To cite this version: HAL Id: inria

OPTIMISATION DE LA MAINTENANCE DES EQUIPEMENTS DE MANUTENTION DU TERMINAL A CONTENEURS DE BEJAIA (BMT)

Francisco José Silva Álvarez

High Performance by Exploiting Information Locality through Reverse Computing. Mouad Bahi

Élue Correspondant le 25 avril 1994, puis Membre le 30 novembre 2004 dans la section Sciences mécaniques et informatiques

Apprentissage Automatique

Professeur de Mathématiques à l Université de Toulouse 1 depuis septembre 2000.

Modèle de troncature gauche : Comparaison par simulation sur données indépendantes et dépendantes

MCMC et approximations en champ moyen pour les modèles de Markov

Curriculum Vitæ. Tél: Page web: Né le 2 mars 1983 Nationalité Française

UFR de Sciences Economiques Année TESTS PARAMÉTRIQUES

Echantillonnage Non uniforme

FIMA, 7 juillet 2005

Optimisation multi-critère pour l allocation de ressources sur Clouds distribués avec prise en compte de l énergie

Apprentissage par renforcement (1a/3)

POURQUOI LA LOI DE BENFORD N EST PAS MYSTÉRIEUSE

Économetrie non paramétrique I. Estimation d une densité

Charles BOUVEYRON. Docteur en Mathématiques appliquées Maître de Conférences (section CNU 26) Université Paris 1 Panthéon-Sorbonne

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Jean-Baptiste AUBIN Maître de Conférence en Statistique

Optimisation et programmation mathématique. Professeur Michel de Mathelin. Cours intégré : 20 h

K. Ammar, F. Bachoc, JM. Martinez. Séminaire ARISTOTE - 23 octobre Palaiseau

PREPROCESSING PAR LISSAGE LOESS POUR ACP LISSEE

Optimisation Combinatoire (Méthodes approchées) II. Recherche Locale simple (Les bases)

Sauvegarde collaborative en pair-à-pair

Etude d un cas industriel : Optimisation de la modélisation de paramètre de production

Algorithmes d'apprentissage

CURRICULUM VITAE Johanna Etner. Situation actuelle. Situations antérieures. Activité administrative

Mesure et gestion des risques d assurance

0 h(s)ds et h [t = 1 [t, [ h, t IR +. Φ L 2 (IR + ) Φ sur U par

Prédiction et Big data

Cours d introduction à la théorie de la détection

Emploi du temps prévisionnel

1 Installer des packages

Expérience 3 Formats de signalisation binaire

CURRICULUM VITAE Anne de Bouard

L INRIA, institut français des STIC. (en Île-de-France) 24 septembre 2009

Alexis PARMENTIER Assistant de recherches (post-doctorat) au département d économie de l Université Catholique de Louvain (Belgique).


Document de présentation technique. Blocage du comportement

PLAN DE COURS. GPA750 Ordonnancement des systèmes de production aéronautique

Introduction à la Statistique Inférentielle

OPTIMISATION À UNE VARIABLE

PROBABILITES ET STATISTIQUE I&II

L IMPACT ATTENDU DE DMARC SUR LE PHISHING. Auteur Sébastien GOUTAL Responsable Filter Lab

4.2 Unités d enseignement du M1

En 2014, comment mener à bien une enquête aléatoire en population générale par téléphone?

Classification non supervisée

Majeures et mineures

Freddy Huet. Adresse professionnelle : Adresse personnelle :

Analyse de la Commande Prédictive Floue : Algorithmes et Méthodologies de Solution

Feuille 6 : Tests. Peut-on dire que l usine a respecté ses engagements? Faire un test d hypothèses pour y répondre.

Programmation linéaire

Health Monitoring pour la Maintenance Prévisionnelle, Modélisation de la Dégradation

Qui sont les conférenciers aux congrès internationaux des mathématiciens?

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Température corporelle d un castor (une petite introduction aux séries temporelles)

ENSPS 3A ISAV Master ISTI AR. J. Gangloff

Une comparaison de méthodes de discrimination des masses de véhicules automobiles

Curriculum Vitae. 1. Formation

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Processus de comptage, Poisson mélange, fonction de perte exponentielle, système bonus-malus.

CLIQUEZ ET MODIFIEZ LE TITRE

Modélisation du comportement habituel de la personne en smarthome

CURRICULUM VITAE. Célibataire

Méthodes de Simulation

Analyse de la vidéo. Chapitre La modélisation pour le suivi d objet. 10 mars Chapitre La modélisation d objet 1 / 57

Université de Caen. Relativité générale. C. LONGUEMARE Applications version mars 2014

Francis Mignault. ! Coauteur : Expert Oracle Application Express. ! Membre du Oracle APEX Advisory Board apex.oracle.com/vote

On ne peut pas entendre la forme d un tambour

MAP 553 Apprentissage statistique

Optimisation des canalisations électriques et des armoires de distribution

Pratique et administration des systèmes

Utilisation de JAVA coté Application serveur couplé avec Oracle Forms Hafed Benteftifa Novembre 2008

ANNALES DES TÉLÉCOMMUNICATIONS / ANNALS OF TELECOMMUNICATIONS

Amélioration de la fiabilité d inspection en CND grâce à la fusion d information : applications en rayons X et ultrasons

Répondants et non-répondants dans les enquêtes. Analyse des séquences de contact

Plus de suivi dans un monde en mouvement

D Expert en Finance et Investissements

Compression et Transmission des Signaux. Samson LASAULCE Laboratoire des Signaux et Systèmes, Gif/Yvette

Contrôle par commande prédictive d un procédé de cuisson sous infrarouge de peintures en poudre.

L analyse d images regroupe plusieurs disciplines que l on classe en deux catégories :

Couplage efficace entre Optimisation et Simulation stochastique Application à la maintenance optimale d une constellation de satellites

Coup de Projecteur sur les Réseaux de Neurones

Recherche locale pour un problème d optimisation de tournées de véhicules avec gestion des stocks

Conditions de l'examen

Né le 13/06/1984 Russe Célibataire Langues : Russe, Anglais,

Reconnaissance de visages 2.5D par fusion des indices de texture et de profondeur ICI 12/12/12

DIPLOME D'ETUDES APPROFONDIES EN ECONOMIE ET FINANCE THEORIE DES MARCHES FINANCIERS. Semestre d hiver

Francis BISSON ( ) Kenny CÔTÉ ( ) Pierre-Luc ROGER ( ) IFT702 Planification en intelligence artificielle

Pascal Forget 2310, Avenue Notre-Dame Québec, (Québec) Canada, G2E 3G5 Tél. (418) Fax (418)

Apprentissage artificiel pour l ordonnancement des tâches dans les grilles de calcul

MABioVis. Bio-informatique et la

E-Biothon : Une plate-forme pour accélérer les recherches en biologie, santé et environnement.

10ème Congrès Français d'acoustique Lyon, Avril 2010

Communications collectives et ordonnancement en régime permanent pour plates-formes hétérogènes

Transcription:

1 / 44 Package CAPUSHE pour le logiciel R Vincent Brault (1,2) & Jean-Patrick Baudry (3) & Cathy Maugis-Rabusseau (4) & Bertrand Michel (3) 1 Université Paris-Sud 11 2 INRIA Saclay Île de France Projet SELECT 3 LSTA Paris 6 4 Institut de Mathématiques de Toulouse http://www.math.univ-toulouse.fr/ maugis/capushe.html 22 mai 2012

2 / 44 Plan 1 Théorie 2 Heuristique de pente 3 Package CAPUSHE DDSE Djump Capushe

3 / 44 Introduction

4 / 44 Plan 1 Théorie 2 Heuristique de pente 3 Package CAPUSHE DDSE Djump Capushe

5 / 44 n-échantillon X 1,..., X n de R d Paramètre d intérêt s S Fonction de contraste γ : S R d R telle que s argmin t S E X [γ(t, X)]

6 / 44 Contraste empirique t S, γ n (t) = 1 n L estimateur ŝ de s : ŝ argmin t S γ n (t). n γ(t, X i ) i=1

7 / 44 Famille de modèles (S m ) m M de dimension respective D m Modèle oracle : m argmin m M E X [ l ( s, ŝm )] où l (s, t) = E X [γ(t, X)] E X [γ(s, X)]

8 / 44 Famille de modèles (S m ) m M de dimension respective D m Modèle oracle : m argmin m M E X [ l ( s, ŝm )] où l (s, t) = E X [γ(t, X)] E X [γ(s, X)] crit(m) = γ n (ŝ m )

9 / 44 Famille de modèles (S m ) m M de dimension respective D m Modèle oracle : m argmin m M E X [ l ( s, ŝm )] où l (s, t) = E X [γ(t, X)] E X [γ(s, X)] Fonction de pénalité pen : M R + telle que le modèle m minimisant le critère pénalisé associé crit(m) = γ n (ŝ m ) + pen(m) ait un risque E X [ l(s, ŝ m ) ] proche de celui de l oracle.

10 / 44 Exemple : mélange gaussien s est la densité inconnue de l échantillon. S m ensemble des mélanges sphérique avec m composantes. X m p i N (µ i, σ i I 3 ) i=1 4m + (m 1) paramètres D m est le nombre de paramètres libres. La fonction de contraste est γ(θ) = log f (X; θ) ŝ m = θ maximisant θ log f (X 1,..., X n ; θ S m )

11 / 44 Plan 1 Théorie 2 Heuristique de pente 3 Package CAPUSHE DDSE Djump Capushe

12 / 44 Forme de la pénalité pen shape La pénalité à choisir est de la forme pen(m) = κ pen shape (m) Baudry, J.-P., Maugis, C. & Michel, B. (2011) Pour les mélanges gaussiens : pen shape (m) = κd m

13 / 44 Heuristique de pente Birgé et Massart (2006) pen min (m) = κ min pen shape (m) telle que crit κ (m) = γ n (ŝ m ) + κ pen shape (m) sélectionne un modèle avec une complexité déraisonnable si κ < κ min raisonnable si κ > κ min

14 / 44 Pénalité optimale pen opt (m) = scoef pen min (m) = scoef κ min pen shape (m)

15 / 44 Djump C m(κ) la complexité du modèle minimisant le critère crit κ ( ) κ C m(κ) doit faire un saut au voisinage du κ min

16 / 44 DDSE γ n (ŝ m ) γ n (s) E X [l(s, s m )] κ min pen shape (m)

17 / 44 Plan 1 Théorie 2 Heuristique de pente 3 Package CAPUSHE DDSE Djump Capushe

18 / 44 Données

19 / 44 Plot

20 / 44 Plot

21 / 44 Commande

22 / 44 Commande

23 / 44 Commande

24 / 44 Validation

25 / 44 Validation

26 / 44 Validation

27 / 44 Validation

28 / 44 Validation

29 / 44 Plot

30 / 44 Plot

31 / 44 C tresh

32 / 44 C tresh

33 / 44 C AreaJump

34 / 44 C AreaJump

35 / 44 Commande

36 / 44 Commande

37 / 44 Commande

38 / 44 Commande

39 / 44 Commande

40 / 44 Commande

41 / 44 Plot

42 / 44 Plot

43 / 44

44 / 44 Birgé, L. et Massart, P. (2001). Gaussian model selection. Journal of the European Mathematical Society, 3(3) :203-268. Birgé, L. et Massart, P. (2006). Minimal penalties for gaussian model selection. Probability Theory and Related Fields, 138(1-2) :33-73. Lebarbier, E. (2005). Detexting multiple change-points in the mean of gaussian process by model selection. Signal Processing, 85(4) :717-736. Massart, P. (2007). Concentration Inequalities and Model Selection. École d été de Probabilités de SAint-Flour 2003. Lecture Notes in Mathematics. Springer. Maugis, C. et Michel, B. (2009). A non-asymptotic penalized criterion for gaussian mixture model selection. ESAIM : P & S URL http ://hal.inria.fr/docs/00/28/50/31/pdf/rr-6549.pdf Baudry, J.-P., Maugis, C. and Michel, B. (2011) Slope Heuristics : Overview and Implementation. Statistics and Computing, Vol 22(2), 455-470.