Méthodes de la Recherche Opérationnelle pour l analyse de données

Save this PDF as:
 WORD  PNG  TXT  JPG

Dimension: px
Commencer à balayer dès la page:

Download "Méthodes de la Recherche Opérationnelle pour l analyse de données"

Transcription

1 Méthodes de la Recherche Opérationnelle pour l analyse de données Julien Darlay G-SCOP 27 janvier 2011 Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20

2 Plan Analyse de données Définitions Liens avec l optimisation Principale différence Analyse Combinatoire de Données Définitions et concepts Schéma d apprentissage Modèles d optimisation Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20

3 Analyse de données Extraire à partir d un large volume de données, des connaissances originales par des méthodes semi-automatiques. Applications : Identifier des pathologies (sarcoidose, connectivite...) Prédire le temps avant la prochaine panne Partitionner des observations en groupes homogènes Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20

4 Analyse de données Un problème d optimisation Données : Un ensemble d observations Ω Des attributs décrivant l observation X X Une valeur à prédire c(x ) C Id class dyspnea surgery pain antec. age 1 neg neg neg neg pos pos pos pos pos Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20

5 Analyse de données Un problème d optimisation Objectif : Trouver une fonction h : X C Parmi un ensemble d hypothèses H Minimisant une fonction d erreur l(h, X ) min l(h, X )dx h H X X Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20

6 Analyse de données Exemple X = (x 1, x 2 ) C = {+, x} H = {x 1 + ax 2 + b = 0} Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20

7 Analyse de données Exemple X = (x 1, x 2 ) C = {+, x} H = {x 1 + ax 2 + b = 0} h(x ) γ si c(x ) = x h(y ) γ si c(y ) = + Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20

8 Analyse de données Exemple X = (x 1, x 2 ) C = {+, x} H = {x 1 + ax 2 + b = 0} h(x ) + e X γ si c(x ) = x h(y ) e Y γ si c(y ) = + e 0 Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20

9 Analyse de données Exemple X = (x 1, x 2 ) C = {+, x} H = {x 1 + ax 2 + b = 0} min a,b,e i Ω e i s.c. h(x ) + e X γ 0 si c(x ) = x h(y ) e Y + γ 0 si c(y ) = + e 0 Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20

10 Analyse de données Surapprentissage Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20

11 Analyse de données Surapprentissage 2 solutions : Utiliser des bornes théoriques [Vapnik, 95] Utiliser des données externes Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20

12 Analyse de données Surapprentissage Utiliser des données externes Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20

13 Analyse de données Surapprentissage Utiliser des données externes Collecter de nouvelles données Couteux Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20

14 Analyse de données Surapprentissage Utiliser des données externes Collecter de nouvelles données Couteux N utiliser qu une partie de la base Dépend de la partition Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20

15 Analyse de données Surapprentissage Utiliser des données externes Collecter de nouvelles données Couteux N utiliser qu une partie de la base Dépend de la partition Utiliser la validation croisée Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20

16 Analyse de données Quelques méthodes classiques Support Vector Machine Réseaux de neurones Probabilité bayesienne Arbre de décision Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20

17 Analyse de données Quelques méthodes classiques Support Vector Machine Réseaux de neurones Probabilité bayesienne Arbre de décision Analyse combinatoire de données Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20

18 Analyse Combinatoire de Données Logical Analysis of Data [Crama, Hammer, Ibaraki, 88] Repose sur des techniques d optimisation combinatoire Extension de fonctions booléennes partiellement définies Cadre d apprentissage particulier C = {0, 1} X {0, 1} m H : fonctions booléennes Hypothèses facilement interprétables Qualité prouvée sur de nombreuses applications Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20

19 Analyse Combinatoire de Données Les différentes étapes 1 Binarisation des attributs 2 Sélection d un support 3 Génération de motifs 4 Construction d un modèle Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20

20 Analyse Combinatoire de Données Binarisation Transformer les attributs en attributs binaires Binaires (Homme, Femme) = Homme Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20

21 Analyse Combinatoire de Données Binarisation Transformer les attributs en attributs binaires Binaires (Homme, Femme) = Homme Catégories (Rouge, Vert, Bleu) = Rouge, = Vert, = Bleu Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20

22 Analyse Combinatoire de Données Binarisation Transformer les attributs en attributs binaires Binaires (Homme, Femme) = Homme Catégories (Rouge, Vert, Bleu) = Rouge, = Vert, = Bleu Ordonnés (Faible, Moyen, Fort) Moyen, Fort Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20

23 Analyse Combinatoire de Données Binarisation Transformer les attributs en attributs binaires Binaires (Homme, Femme) = Homme Catégories (Rouge, Vert, Bleu) = Rouge, = Vert, = Bleu Ordonnés (Faible, Moyen, Fort) Moyen, Fort Numériques (1, 2.5, 15, 20) < 1.75, < 8.75, < 17.5 Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20

24 Analyse Combinatoire de Données Binarisation Transformer les attributs en attributs binaires Binaires (Homme, Femme) = Homme Catégories (Rouge, Vert, Bleu) = Rouge, = Vert, = Bleu Ordonnés (Faible, Moyen, Fort) Moyen, Fort Numériques (1, 2.5, 15, 20) < 1.75, < 8.75, < 17.5 Génération d un grand nombre d attributs binaires Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20

25 Analyse Combinatoire de Données Sélection d un support Objectif Trouver un sous ensemble minimal d attributs Séparant les observations de classes différentes Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20

26 Analyse Combinatoire de Données Sélection d un support Objectif Trouver un sous ensemble minimal d attributs Séparant les observations de classes différentes Modélisation en problème de set-cover [Hammer et al., 88] min z i z i s.c. i 1 (X i Y i )z i 1 X Ω +, Y Ω z {0, 1} m Résolution en PLNE, ou par approche gloutonne Id class dyspnea surgery pain antec. age > 65 1 neg neg pos pos Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20

27 Analyse Combinatoire de Données Sélection d un support Objectif Trouver un sous ensemble minimal d attributs Séparant les observations de classes différentes Modélisation en problème de set-cover [Hammer et al., 88] min z i z i s.c. i 1 (X i Y i )z i 1 X Ω +, Y Ω z {0, 1} m Résolution en PLNE, ou par approche gloutonne Id class dyspnea surgery pain antec. age > 65 1 neg neg pos pos Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20

28 Analyse Combinatoire de Données Motifs Un motif est une conjonction de conditions sur les attributs dyspnea = 1 & pain = 1 Associé à une classe pos class dysp. pain neg 0 0 neg 0 0 neg 1 0 neg 1 1 pos 1 1 pos 1 1 pos 1 1 pos 0 1 pos 1 0 Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20

29 Analyse Combinatoire de Données Motifs Un motif est une conjonction de conditions sur les attributs dyspnea = 1 & pain = 1 Associé à une classe pos Couverture observations vérifiant le motif class dysp. pain neg 0 0 neg 0 0 neg 1 0 neg 1 1 pos 1 1 pos 1 1 pos 1 1 pos 0 1 pos 1 0 Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20

30 Analyse Combinatoire de Données Motifs Un motif est une conjonction de conditions sur les attributs dyspnea = 1 & pain = 1 Associé à une classe pos Couverture observations vérifiant le motif Homogénéité proportion d obs. de la bonne classe dans la couverture h = 3 4 class dysp. pain neg 0 0 neg 0 0 neg 1 0 neg 1 1 pos 1 1 pos 1 1 pos 1 1 pos 0 1 pos 1 0 Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20

31 Analyse Combinatoire de Données Motifs Un motif est une conjonction de conditions sur les attributs dyspnea = 1 & pain = 1 Associé à une classe pos Couverture observations vérifiant le motif Homogénéité proportion d obs. de la bonne classe dans la couverture h = 3 4 Prévalence proportion d obs. de la bonne classe couvertes p = 3 5 class dysp. pain neg 0 0 neg 0 0 neg 1 0 neg 1 1 pos 1 1 pos 1 1 pos 1 1 pos 0 1 pos 1 0 Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20

32 Analyse Combinatoire de Données Motifs Un motif est une conjonction de conditions sur les attributs dyspnea = 1 & pain = 1 Associé à une classe pos Couverture observations vérifiant le motif Homogénéité proportion d obs. de la bonne classe dans la couverture h = 3 4 Prévalence proportion d obs. de la bonne classe couvertes p = 3 5 Degré nombre de conditions dans le motif d = 2 class dysp. pain neg 0 0 neg 0 0 neg 1 0 neg 1 1 pos 1 1 pos 1 1 pos 1 1 pos 0 1 pos 1 0 Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20

33 Analyse Combinatoire de Données Motifs Un motif est une conjonction de conditions sur les attributs dyspnea = 1 & pain = 1 Associé à une classe pos Couverture observations vérifiant le motif Homogénéité proportion d obs. de la bonne classe dans la couverture h = 3 4 Prévalence proportion d obs. de la bonne classe couvertes p = 3 5 Degré nombre de conditions dans le motif d = 2 Générer des motifs en respectant des conditions sur h, p, d class dysp. pain neg 0 0 neg 0 0 neg 1 0 neg 1 1 pos 1 1 pos 1 1 pos 1 1 pos 0 1 pos 1 0 Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20

34 Analyse Combinatoire de Données Génération de motifs Différentes approches classiques Exhaustive, en pratique d 3 Glouton [Boros et al., 00] top-down ou bottom-up PLNE successifs [Ryoo et al., 08] [Boros, D. 10] Algorithme aléatoire avec garantie de qualité Fonctions booléennes duales Réduction de la complexité : une sélection aléatoire des observations Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20

35 Analyse Combinatoire de Données Sélection d un modèle Modèle Sous ensemble minimal de motifs Permettant d expliquer toutes les observations Modélisation en problème de set-cover [Hammer et al., 88] min z i z i s.c. i cov(m i, X )z i 1 z {0, 1} M X Ω Résolution en PLNE ou par approche gloutonne Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20

36 Analyse Combinatoire de Données Discriminant Traiter une nouvelle observation O = cov(p, O) P M + N M cov(n, O) Attribution de la classe en fonction de > 0 classe Pos < 0 classe Neg Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20

37 Analyse Combinatoire de Données Discriminant Traiter une nouvelle observation O = cov(p, O) P M + N M cov(n, O) Attribution de la classe en fonction de > 0 classe Pos < 0 classe Neg Approche par génération de colonnes [Hansen, 09] Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20

38 Applications médicales Improved screening for growth hormone deficiency using logical analysis of data [Lemaire et al. 09] Final height and gonad function after total body irradiation during childhood [Couto-Silva et al. 06] High-resolution computed tomography to differentiate chronic diffuse interstitial lung diseases with predominant ground-glass pattern using logical analysis of data [Grivaud Martin S. et al. 10] Logical Analysis of Computed Tomography Data to Differentiate Entities of Idiopathic Interstitial Pneumonias [Brauner et al. 07] Logical analysis of survival data : prognostic survival models by detecting high-degree interactions in right-censored data [Kronek et al. 08] Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20

39 Conclusion Analyse de données Un problème d optimisation particulier Utilisant des techniques de RO Source de problèmes en RO et en optimisation combinatoire Analyse combinatoire de données Fonctions booléennes Modèles d optimisation classiques Sorties facilement interprétables Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20

40 Perspectives Application médicale Algorithmes de génération de motifs Utiliser les bornes théoriques sur l erreur [Anthony, 11] Utilisation de l analyse de données en RO Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20

Séance 12: Algorithmes de Support Vector Machines

Séance 12: Algorithmes de Support Vector Machines Séance 12: Algorithmes de Support Vector Machines Laboratoire de Statistique et Probabilités UMR 5583 CNRS-UPS www.lsp.ups-tlse.fr/gadat Douzième partie XII Algorithmes de Support Vector Machines Principe

Plus en détail

Arbres binaires. Hélène Milhem. Institut de Mathématiques de Toulouse, INSA Toulouse, France IUP SID, 2011-2012

Arbres binaires. Hélène Milhem. Institut de Mathématiques de Toulouse, INSA Toulouse, France IUP SID, 2011-2012 Arbres binaires Hélène Milhem Institut de Mathématiques de Toulouse, INSA Toulouse, France IUP SID, 2011-2012 H. Milhem (IMT, INSA Toulouse) Arbres binaires IUP SID 2011-2012 1 / 35 PLAN Introduction Construction

Plus en détail

Arbres de décisions et forêts aléatoires.

Arbres de décisions et forêts aléatoires. Arbres de décisions et forêts aléatoires. Pierre Gaillard 7 janvier 2014 1 Plan 1 Arbre de décision 2 Les méthodes d ensembles et les forêts aléatoires 2 Introduction 3 Introduction Jeu de données (ex

Plus en détail

Recherche Opérationnelle et Optimisation : Quelles perspectives pour le Datamining

Recherche Opérationnelle et Optimisation : Quelles perspectives pour le Datamining Recherche Opérationnelle et Optimisation : Quelles perspectives pour le Datamining Clarisse DHAENENS LIFL Equipe OPAC INRIA Projet DOLPHIN Université de Lille 1 KESAKO Datamining Datamining : définitiond

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme

Plus en détail

Introduction aux Support Vector Machines (SVM)

Introduction aux Support Vector Machines (SVM) Introduction aux Support Vector Machines (SVM) Olivier Bousquet Centre de Mathématiques Appliquées Ecole Polytechnique, Palaiseau Orsay, 15 Novembre 2001 But de l exposé 2 Présenter les SVM Encourager

Plus en détail

DATA MINING 2 Réseaux de Neurones, Mélanges de classifieurs, SVM avancé

DATA MINING 2 Réseaux de Neurones, Mélanges de classifieurs, SVM avancé I. Réseau Artificiel de Neurones 1. Neurone 2. Type de réseaux Feedforward Couches successives Récurrents Boucles de rétroaction Exemples de choix pour la fonction : suivant une loi de probabilité Carte

Plus en détail

Outils Statistiques du Data Mining

Outils Statistiques du Data Mining Outils Statistiques du Data Mining Pr Roch Giorgi roch.giorgi@univ-amu.fr SESSTIM, Faculté de Médecine, Aix-Marseille Université, Marseille, France http://sesstim-orspaca.org http://optim-sesstim.univ-amu.fr

Plus en détail

Cours de Master Recherche

Cours de Master Recherche Cours de Master Recherche Spécialité CODE : Résolution de problèmes combinatoires Christine Solnon LIRIS, UMR 5205 CNRS / Université Lyon 1 2007 Rappel du plan du cours 16 heures de cours 1 - Introduction

Plus en détail

WEKA : c est quoi? Brigitte Bigi. 15 février 2011. LPL - Équipe C3I. Brigitte Bigi (LPL - Équipe C3I) WEKA : c est quoi? 15 février 2011 1 / 32

WEKA : c est quoi? Brigitte Bigi. 15 février 2011. LPL - Équipe C3I. Brigitte Bigi (LPL - Équipe C3I) WEKA : c est quoi? 15 février 2011 1 / 32 WEKA : c est quoi? Brigitte Bigi LPL - Équipe C3I 15 février 2011 Brigitte Bigi (LPL - Équipe C3I) WEKA : c est quoi? 15 février 2011 1 / 32 Introduction 1 Introduction 2 Classification supervisée 3 WEKA

Plus en détail

Méthodes avancées en décision

Méthodes avancées en décision Méthodes avancées en décision Support vector machines - Chapitre 2 - Principes MRE et MRS Principe MRE. Il s agit de minimiser la fonctionnelle de risque 1 P e (d) = y d(x;w, b) p(x, y) dxdy. 2 La densité

Plus en détail

Support Vector Machines

Support Vector Machines Support Vector Machines Séparateurs à vaste marge Arnaud Revel revel.arnaud@gmail.com Plan 1 Introduction 2 Formalisation 3 Utilisation des noyaux 4 Cas multi-classes 5 Applications des SVM 6 Bibliographie

Plus en détail

OPTIMISATION MULTICRITERE STOCHASTIQUE

OPTIMISATION MULTICRITERE STOCHASTIQUE OPTIMISATION MULTICRITERE STOCHASTIQUE Michel DUMAS, Gilles ARNAUD, Fabrice GAUDIER CEA/DEN/DMS/SFME/LETR michel.dumas@cea.r gilles.arnaud@cea.r abrice.gaudier @cea.r Introduction L optimisation multicritère

Plus en détail

Initiation à la fouille de données et à l apprentissage automatiq

Initiation à la fouille de données et à l apprentissage automatiq Initiation à la fouille de données et à l apprentissage automatique 1 Laboratoire d Informatique Fondamentale de Marseille Université de Provence christophe.magnan@lif.univ-mrs.fr www.lif.univ-mrs.fr/

Plus en détail

Classification par des méthodes de data mining. Yawo Eli Amesefe Guillaume Cernier Christophe Labrousse

Classification par des méthodes de data mining. Yawo Eli Amesefe Guillaume Cernier Christophe Labrousse Classification par des méthodes de data mining Yawo Eli Amesefe Guillaume Cernier Christophe Labrousse Plan: Le processus métier Présentation des 3 méthodes étudiées: Arbres de décision Machines à vecteurs

Plus en détail

Nouvelles propositions pour la résolution exacte du problème de sac à dos bi-objectif unidimensionnel en variables binaires

Nouvelles propositions pour la résolution exacte du problème de sac à dos bi-objectif unidimensionnel en variables binaires Nouvelles propositions pour la résolution exacte du problème de sac à dos bi-objectif unidimensionnel en variables binaires Julien Jorge, Xavier Gandibleux Laboratoire d Informatique de Nantes Atlantique

Plus en détail

Les arbres de décision

Les arbres de décision Les arbres de décision 25 Septembre 2007 Datamining 1 2007-2008 Plan 1 Le partitionnement récursif 2 C4.5 3 CART 4 Evaluation de performances 5 Bilan Datamining 2 2007-2008 Les données du Titanic Le partitionnement

Plus en détail

Polytech Paris-Sud Département informatique Formation par Apprentissage, 3ème année

Polytech Paris-Sud Département informatique Formation par Apprentissage, 3ème année 1 / 20 Polytech Paris-Sud Département informatique Formation par Apprentissage, 3ème année Cours : Jérôme Azé Université Paris-Sud LRI 2009-2010 2 / 20 Outline 1 Présentation de A q Algorithme Défauts

Plus en détail

Arbres de décision. Intelligence Artificielle et Systèmes Formels Master 1 I2L

Arbres de décision. Intelligence Artificielle et Systèmes Formels Master 1 I2L Arbres de décision Intelligence Artificielle et Systèmes Formels Master 1 I2L Sébastien Verel verel@lisic.univ-littoral.fr http://www-lisic.univ-littoral.fr/ verel Université du Littoral Côte d Opale Laboratoire

Plus en détail

Plan du cours. Intelligence Artificielle et Manipulation Symbolique de l Information. Induction de règles (rappels) L induction logique

Plan du cours. Intelligence Artificielle et Manipulation Symbolique de l Information. Induction de règles (rappels) L induction logique Intelligence Artificielle et Manipulation Symbolique de l Information Cours 0 mercredi 8 avril 205 Plan du cours Raisonner par induction l induction Induction par arbres de décision Christophe Marsala

Plus en détail

Une heuristique hybride pour le problème de set packing biobjectif p.1/19

Une heuristique hybride pour le problème de set packing biobjectif p.1/19 Une heuristique hybride pour le problème de set packing biobjectif Xavier Delorme 1,2, Xavier Gandibleux 2,3 et Fabien DEGOUTIN 2,4 1. Ecole Nationale Supérieure des Mines de Saint-Etienne Centre : Génie

Plus en détail

Programmation Linéaire - Cours 1

Programmation Linéaire - Cours 1 Programmation Linéaire - Cours 1 P. Pesneau pierre.pesneau@math.u-bordeaux1.fr Université Bordeaux 1 Bât A33 - Bur 265 Ouvrages de référence V. Chvátal - Linear Programming, W.H.Freeman, New York, 1983.

Plus en détail

Utilisation des diagrammes de Voronoï et des algorithmes génétiques pour l'étude des complexes protéine-protéine.

Utilisation des diagrammes de Voronoï et des algorithmes génétiques pour l'étude des complexes protéine-protéine. Utilisation des diagrammes de Voronoï et des algorithmes génétiques pour l'étude des complexes protéine-protéine. Anne Poupon Biologie et Bioinformatique des Systèmes de Signalisation INRA - Nouzilly France

Plus en détail

De la donnée à la décision. Sofian MAABOUT LaBRI. Université Bordeaux 1

De la donnée à la décision. Sofian MAABOUT LaBRI. Université Bordeaux 1 De la donnée à la décision Sofian MAABOUT LaBRI. Université Bordeaux 1 1 Décider c est choisir, parmi plusieurs actes possibles, celui qui apparaît comme le plus pertinent pour atteindre un résultat envisagé,

Plus en détail

Apprentissage statistique Stratégie du Data-Mining

Apprentissage statistique Stratégie du Data-Mining Apprentissage statistique Stratégie du Data-Mining Hélène Milhem Institut de Mathématiques de Toulouse, INSA Toulouse, France IUP SID, 2011-2012 H. Milhem (IMT, INSA Toulouse) Apprentissage statistique

Plus en détail

Analyse d images, vision par ordinateur. Partie 6: Segmentation d images. Segmentation? Segmentation?

Analyse d images, vision par ordinateur. Partie 6: Segmentation d images. Segmentation? Segmentation? Analyse d images, vision par ordinateur Traitement d images Segmentation : partitionner l image en ses différentes parties. Reconnaissance : étiqueter les différentes parties Partie 6: Segmentation d images

Plus en détail

Heuristique et métaheuristique. 8. Optimisation combinatoire et métaheuristiques. Optimisation combinatoire. Problème du voyageur de commerce

Heuristique et métaheuristique. 8. Optimisation combinatoire et métaheuristiques. Optimisation combinatoire. Problème du voyageur de commerce Heuristique et métaheuristique IFT1575 Modèles de recherche opérationnelle (RO) 8. Optimisation combinatoire et métaheuristiques Un algorithme heuristique permet d identifier au moins une solution réalisable

Plus en détail

Programmation linéaire

Programmation linéaire 1 Programmation linéaire 1. Le problème, un exemple. 2. Le cas b = 0 3. Théorème de dualité 4. L algorithme du simplexe 5. Problèmes équivalents 6. Complexité de l Algorithme 2 Position du problème Soit

Plus en détail

Ingénierie d aide à la décision

Ingénierie d aide à la décision Ingénierie d aide à la décision Maria Malek 1 er septembre 2009 1 Objectifs et débouchés Nous proposons dans cette option deux grands axes pour l aide à la décision : 1. La recherche opérationnelle ; 2.

Plus en détail

Apprentissage supervisé

Apprentissage supervisé Apprentissage supervisé 1 Apprendre aux ordinateurs à apprendre Objectif : appliquer la démarche de l apprentissage par l exemple à l ordinateur. Montrer des exemples à l ordinateur en lui disant de quoi

Plus en détail

Optimisation en nombres entiers

Optimisation en nombres entiers Optimisation en nombres entiers p. 1/83 Optimisation en nombres entiers Michel Bierlaire michel.bierlaire@epfl.ch EPFL - Laboratoire Transport et Mobilité - ENAC Optimisation en nombres entiers p. 2/83

Plus en détail

Génération aléatoire de structures ordonnées

Génération aléatoire de structures ordonnées Génération aléatoire de structures ordonnées Olivier Roussel Équipe APR Laboratoire d Informatique de Paris 6 Université Pierre et Marie Curie ALÉA 2011 7 mars 2011 Olivier Roussel (LIP6) Génération de

Plus en détail

Apprentissage incrémental par sélection de données dans un flux pour une application de sécurité routière

Apprentissage incrémental par sélection de données dans un flux pour une application de sécurité routière Apprentissage incrémental par sélection de données dans un flux pour une application de sécurité routière Nicolas Saunier INRETS Télécom Paris Sophie Midenet INRETS Alain Grumbach Télécom Paris Conférence

Plus en détail

Techniques et outils de test pour les logiciels réactifs synchrones

Techniques et outils de test pour les logiciels réactifs synchrones Journées Systèmes et Logiciels Critiques Institut IMAG ; 14-16 nombre 2000 Techniques et outils de test pour les logiciels réactifs synchrones Farid Ouabdesselam 1 Méthodes de test : classification générale

Plus en détail

SPLEX Statistiques pour la classification et fouille de données en

SPLEX Statistiques pour la classification et fouille de données en SPLEX Statistiques pour la classification et fouille de données en génomique Classification Linéaire Binaire CLB Pierre-Henri WUILLEMIN DEcision, Système Intelligent et Recherche opérationnelle LIP6 pierre-henri.wuillemin@lip6.fr

Plus en détail

Master ISI 2010-2011. Data Mining Recherche des sous-ensembles fréquents

Master ISI 2010-2011. Data Mining Recherche des sous-ensembles fréquents Master ISI 2010-2011 Data Mining Recherche des sous-ensembles fréquents Yves Lechevallier INRIA-Rocquencourt E_mail : Yves.Lechevallier@inria.fr 1 Processus Data Mining Phase A : Entrepôt de données Entrepôt

Plus en détail

Méthodes d apprentissage :

Méthodes d apprentissage : Méthodes d apprentissage : application au tri de complexes protéines-protéines Jérôme Azé Apprentissage: tâches Apprentissage non supervisé (Eisen, ) Apprentissage supervisé (arbres de décision, k-ppv,

Plus en détail

Nouvelles propositions pour la résolution exacte du sac à dos multi-objectif unidimensionnel en variables binaires

Nouvelles propositions pour la résolution exacte du sac à dos multi-objectif unidimensionnel en variables binaires Nouvelles propositions pour la résolution exacte du sac à dos multi-objectif unidimensionnel en variables binaires Julien Jorge julien.jorge@univ-nantes.fr Laboratoire d Informatique de Nantes Atlantique,

Plus en détail

Quels sont les patients atteints d un cancer du sein dont la décision de prise en charge thérapeutique

Quels sont les patients atteints d un cancer du sein dont la décision de prise en charge thérapeutique Quels sont les patients atteints d un cancer du sein dont la décision de prise en charge thérapeutique bénéficie de l utilisation d un système d aide à la décision? Un exemple utilisant la fouille de données

Plus en détail

Laboratoire 4 Développement d un système intelligent

Laboratoire 4 Développement d un système intelligent DÉPARTEMENT DE GÉNIE LOGICIEL ET DES TI LOG770 - SYSTÈMES INTELLIGENTS ÉTÉ 2012 Laboratoire 4 Développement d un système intelligent 1 Introduction Ce quatrième et dernier laboratoire porte sur le développement

Plus en détail

optimisation robuste de réseaux de télécommunications

optimisation robuste de réseaux de télécommunications optimisation robuste de réseaux de télécommunications Orange Labs Laboratoire Heudiasyc, UMR CNRS 6599, Université de Technologie de Compiègne Olivier Klopfenstein thèse effectuée sous la direction de

Plus en détail

APPLICATION DE LA RECHERCHE OPÉRATIONNELLE DANS DES APPLICATIONS OPÉRATIONNELLES FRANCIS SOURD SNCF INNOVATION & RECHERCHE

APPLICATION DE LA RECHERCHE OPÉRATIONNELLE DANS DES APPLICATIONS OPÉRATIONNELLES FRANCIS SOURD SNCF INNOVATION & RECHERCHE APPLICATION DE LA RECHERCHE OPÉRATIONNELLE DANS DES APPLICATIONS OPÉRATIONNELLES FRANCIS SOURD SNCF INNOVATION & RECHERCHE INAUGURATION DE L INSTITUT HENRI FAYOL 17/05/2013 DE L OPTIMISATION MATHEMATIQUE

Plus en détail

Projet : Plan Assurance Qualité

Projet : Plan Assurance Qualité Projet : Document : Plan Assurance Qualité 2UP_SPEC_DEV1 VERSION 1.00 Objet Ce document a pour objectif de définir la démarche d analyse et de conception objet ainsi les activités liées. Auteur Eric PAPET

Plus en détail

Enjeux mathématiques et Statistiques du Big Data

Enjeux mathématiques et Statistiques du Big Data Enjeux mathématiques et Statistiques du Big Data Mathilde Mougeot LPMA/Université Paris Diderot, mathilde.mougeot@univ-paris-diderot.fr Mathématique en Mouvements, Paris, IHP, 6 Juin 2015 M. Mougeot (Paris

Plus en détail

Fouille de données orientée motifs, méthodes et usages.

Fouille de données orientée motifs, méthodes et usages. Fouille de données orientée motifs, méthodes et usages. François RIOULT GREYC - Équipe Données-Documents-Langues CNRS UMR 6072 Université de Caen Basse-Normandie France Résumé La fouille de données orientée

Plus en détail

Livraison de colis pour des clients du e-commerce : modèles de Wardrop, et Logit simple ou imbriqué

Livraison de colis pour des clients du e-commerce : modèles de Wardrop, et Logit simple ou imbriqué Séminaire du LGI Centrale Paris Livraison de colis pour des clients du e-commerce : modèles de Wardrop, et Logit simple ou imbriqué Y. Hayel 1, D. Quadri 2, T. Jimenez 1, L. Brotcorne 3, B. Tousni 3 LGI,

Plus en détail

Introduction au datamining

Introduction au datamining Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des

Plus en détail

Méthodes de DM pour la GRC dans les banques

Méthodes de DM pour la GRC dans les banques Techniques de DM pour la GRC dans les banques Page 21 III.1 Introduction Avant de chercher des techniques à appliquer dans la gestion des relations avec les clients. Il faut étudier les données des clients

Plus en détail

Collecte des nœuds de raccordement abonnés chez Bouygues Telecom

Collecte des nœuds de raccordement abonnés chez Bouygues Telecom Collecte des nœuds de raccordement abonnés chez Bouygues Telecom Julien Darlay jdarlay@innovation24.fr Innovation 24 Groupe Bouygues 1 20 Innovation 24 Filiale Optimisation & Aide à la Décision du Groupe

Plus en détail

Comparaison d images binaires reposant sur une mesure locale des dissimilarités Application à la classification

Comparaison d images binaires reposant sur une mesure locale des dissimilarités Application à la classification 1/54 Comparaison d images binaires reposant sur une mesure locale des dissimilarités Application à la classification Étienne Baudrier CReSTIC vendredi 9 décembre 2005 2/54 Contexte programme national de

Plus en détail

Hélène Desmier ab, Pascale Kuntz a & Ivan Kojadinovic a. Pauc, 44306 Nantes. {prenom.nom}@polytech.univ-nantes.fr

Hélène Desmier ab, Pascale Kuntz a & Ivan Kojadinovic a. Pauc, 44306 Nantes. {prenom.nom}@polytech.univ-nantes.fr Une classification hiérarchique de variables discrètes basée sur l information mutuelle en pré-traitement d un algorithme de sélection de variables pertinentes. Hélène Desmier ab, Pascale Kuntz a & Ivan

Plus en détail

INTRODUCTION AU DATA MINING

INTRODUCTION AU DATA MINING INTRODUCTION AU DATA MINING 6 séances de 3 heures mai-juin 2006 EPF - 4 ème année - Option Ingénierie d Affaires et de Projets Bertrand LIAUDET Phase 4 : Modélisation non-supervisée - 5 : Règles d association

Plus en détail

INTERPRÉTATION DES RÉSULTATS DE SVM

INTERPRÉTATION DES RÉSULTATS DE SVM INTERPRÉTATION DES RÉSULTATS DE SVM Thanh-Nghi Do & François Poulet {dothanh poulet}@esiea-ouest.fr ESIEA Recherche 38, rue des Docteurs Calmette et Guérin Parc Universitaire de Laval-Changé 53000-Laval

Plus en détail

Table des matières I La programmation linéaire en variables continues 1 Présentation 3 1 Les bases de la programmation linéaire 5 1.1 Formulation d'un problème de programmation linéaire........... 5 1.2

Plus en détail

Discrétisation et génération de hiérarchies de concepts

Discrétisation et génération de hiérarchies de concepts Prétraitement des données 1 Pourquoi prétraiter les données? Nettoyage des données Intégration et transformation Réduction des données Discrétisation et génération de hiérarchies de g concepts Pourquoi

Plus en détail

Contexte et motivations Les techniques envisagées Evolution des processus Conclusion

Contexte et motivations Les techniques envisagées Evolution des processus Conclusion Vérification de logiciels par analyse statique Contexte et motivations Les techniques envisagées Evolution des processus Conclusion Contexte et motivations Specification Design architecture Revues and

Plus en détail

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com Intelligence Artificielle et Systèmes Multi-Agents Badr Benmammar bbm@badr-benmammar.com Plan La première partie : L intelligence artificielle (IA) Définition de l intelligence artificielle (IA) Domaines

Plus en détail

Analyse et modélisation de visages

Analyse et modélisation de visages Analyse et modélisation de visages Pascal Bourdon Laboratoire XLIM-SIC (UMR CNRS 7252) / Université de Poitiers pascal.bourdon@univ-poitiers.fr Analyse et modélisation de visages Plan Introduction Outils

Plus en détail

Clermont Ferrand - Janvier 2003

Clermont Ferrand - Janvier 2003 DISDAMIN: Algorithmes de Data Mining Distribués Valerie FIOLET (1,2) - Bernard TOURSEL (1) 1 Equipe PALOMA - LIFL - USTL - LILLE (FRANCE) 2 Service Informatique - UMH - MONS (BELGIUM) Clermont Ferrand

Plus en détail

Modélisation mathématique et finance des produits dérivés

Modélisation mathématique et finance des produits dérivés Modélisation mathématique et finance des produits dérivés Ecole Polytechnique Paris Académie Européenne Interdisciplinaire des Sciences Paris, 28 novembre 2011 Outline Introduction 1 Introduction 2 3 Qu

Plus en détail

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique

SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique SOCLE COMMUN - La Compétence 3 Les principaux éléments de mathématiques et la culture scientifique et technologique DOMAINE P3.C3.D1. Pratiquer une démarche scientifique et technologique, résoudre des

Plus en détail

L ANALYSE DES DONNÉES CLIENTS AU SERVICE DE LA PRÉVISION D ACHAT DE VOYAGES

L ANALYSE DES DONNÉES CLIENTS AU SERVICE DE LA PRÉVISION D ACHAT DE VOYAGES L ANALYSE DES DONNÉES CLIENTS AU SERVICE DE LA PRÉVISION D ACHAT DE VOYAGES SAS 3 DEC 2015 1 sur 9 TRANSAT Un voyagiste international solidement installé au Canada, en France et au Royaume-Uni, qui offre

Plus en détail

SY09 Rapport TP4 : Analyse discriminante, régression logistique

SY09 Rapport TP4 : Analyse discriminante, régression logistique UNIVERSITÉ DE TECHNOLOGIE DE COMPIÈGNE SY09 Rapport TP4 : Analyse discriminante, régression logistique CUNI Frédéric 15 juin 2015 Objectifs du TP : Le but de ce TP est l application de l analyse discriminante

Plus en détail

Système de contrôle du trafic d une ligne de métro Dossier de tests

Système de contrôle du trafic d une ligne de métro Dossier de tests Système de contrôle du trafic d une ligne de métro Dossier de tests Tests NI557/STL/M2/INFO/UPMC Action Date Auteur Statut Création 05/03/2012 P.Manoury En cours 1 Description et exigences fonctionnelles

Plus en détail

Axe MSA Bilan scientifique et perspectives. ENSM.SE L. Carraro - 17 décembre 07

Axe MSA Bilan scientifique et perspectives. ENSM.SE L. Carraro - 17 décembre 07 Axe MSA Bilan scientifique et perspectives ENSM.SE L. Carraro - 17 décembre 07 17 décembre 07 2 Plan Compétences acquises domaines scientifiques compétences transverses Domaines ou activités accessibles

Plus en détail

Introduction à la méthode d'analyse des réseaux sociaux

Introduction à la méthode d'analyse des réseaux sociaux Colloques d'épidémiologie clinique et biostatistique HUG 8 mars 2011 Gil Viry Introduction à la méthode d'analyse des réseaux sociaux FACULTÉ DES SCIENCES ÉCONOMIQUES ET SOCIALES Plan du cours 1. Les principes

Plus en détail

Module 3 : Introduction à la Modélisation SOUS MODELER

Module 3 : Introduction à la Modélisation SOUS MODELER Module 3 : Introduction à la Modélisation SOUS MODELER 1 Techniques prédictives Passé pour prédire l avenir 2 Concepts de la modélisation Données test / apprentissage Généralement créées par l utilisateur

Plus en détail

ENSIIE - Intelligence Artificielle (RIIA) - 1er cours

ENSIIE - Intelligence Artificielle (RIIA) - 1er cours ENSIIE - Intelligence Artificielle (RIIA) - 1er cours Benjamin PIWOWARSKI 28 septembre 2015 Benjamin PIWOWARSKI IA - 1er cours 28 septembre 2015 1 / 53 Introduction Plan 1 Introduction 2 Définitions 3

Plus en détail

Anne-lise HUYET- Jean-Luc PARIS LIMOS équipe Recherche en Systèmes de Production IFMA Mail: huyet@ifma.fr, paris@ifma.fr

Anne-lise HUYET- Jean-Luc PARIS LIMOS équipe Recherche en Systèmes de Production IFMA Mail: huyet@ifma.fr, paris@ifma.fr Extraction de Connaissances pertinentes sur le comportement des systèmes de production: une approche conjointe par Optimisation Évolutionniste via Simulation et Apprentissage Anne-lise HUYET- Jean-Luc

Plus en détail

Dual decomposition methods and parallel computing

Dual decomposition methods and parallel computing Dual decomposition methods and parallel computing Jonas Koko LIMOS UMR 6158 Université Blaise Pascal - CNRS Dijon 29/06/2015 Jonas Koko (LIMOS) Dual decomposition methods Dijon 29/06/2015 1 / 18 Plan 1

Plus en détail

Statistique et analyse de données pour l assureur : des outils pour la gestion des risques et le marketing

Statistique et analyse de données pour l assureur : des outils pour la gestion des risques et le marketing Statistique et analyse de données pour l assureur : des outils pour la gestion des risques et le marketing Gilbert Saporta Chaire de Statistique Appliquée, CNAM ActuariaCnam, 31 mai 2012 1 L approche statistique

Plus en détail

Incertitude et variabilité : la nécessité de les intégrer dans les modèles

Incertitude et variabilité : la nécessité de les intégrer dans les modèles Incertitude et variabilité : la nécessité de les intégrer dans les modèles M. L. Delignette-Muller Laboratoire de Biométrie et Biologie Evolutive VetAgro Sup - Université de Lyon - CNRS UMR 5558 24 novembre

Plus en détail

Reconnaissance des formes : Classement d ensembles d objets

Reconnaissance des formes : Classement d ensembles d objets Reconnaissance des formes : Classement d ensembles d objets Données Méthodes Extraction de connaissances Applications Expertise Apprentissage Bernard FERTIL Directeur de Recherche CNRS Équipe LXAO, UMR

Plus en détail

Master 1 de Psychologie du Travail et des Organisations : Recueil et analyse des données - Corrigés des T.D. ( 2014/2015) -

Master 1 de Psychologie du Travail et des Organisations : Recueil et analyse des données - Corrigés des T.D. ( 2014/2015) - Dominique Ferrieux - Université Paul Valéry - Montpellier III Master de Psychologie du Travail et des Organisations : Recueil et analyse des données - Corrigés des T.D. ( /) - Deuxième partie : Plans :

Plus en détail

BI = Business Intelligence Master Data-ScienceCours 7 - Data

BI = Business Intelligence Master Data-ScienceCours 7 - Data BI = Business Intelligence Master Data-Science Cours 7 - Data Mining Ludovic DENOYER - UPMC 30 mars 2015 Ludovic DENOYER - Typologie des méthodes de Data Mining Différents types de méthodes : Méthodes

Plus en détail

Master 1 Rentrée 2015/2016

Master 1 Rentrée 2015/2016 Informations générales Semestre 1 Semestre 2 Master 1 Rentrée 2015/2016 Université du Littoral Cote d Opale 4 septembre 2015 (Université du Littoral Cote d Opale) Master 1 4 septembre 2015 1 / 24 Informations

Plus en détail

PJE : Analyse de comportements avec Twitter Classification supervisée

PJE : Analyse de comportements avec Twitter Classification supervisée PJE : Analyse de comportements avec Twitter Classification supervisée Arnaud Liefooghe arnaud.liefooghe@univ-lille1.fr Master 1 Informatique PJE2 2015-16 B. Derbel L. Jourdan A. Liefooghe 1 2 Agenda Partie

Plus en détail

Module Mixmod pour OpenTURNS

Module Mixmod pour OpenTURNS Module Mixmod pour OpenTURNS Régis LEBRUN EADS Innovation Works 23 septembre 2013 EADS IW 2013 (EADS Innovation Work) 23 septembre 2013 1 / 21 Outline Plan 1 OpenTURNS et propagation d incertitudes 2 Mixmod

Plus en détail

Parallel Tree-based Exact Algorithms using Heterogeneous Many and Multi-core Computing for Solving Challenging Problems in Combinatorial Optimization

Parallel Tree-based Exact Algorithms using Heterogeneous Many and Multi-core Computing for Solving Challenging Problems in Combinatorial Optimization Parallel Tree-based Exact Algorithms using Heterogeneous Many and Multi-core Computing for Solving Challenging Problems in Combinatorial Optimization Rudi Leroy Encadrement : N. Melab (Univ. Lille 1),

Plus en détail

Modélisation et résolution du problème de transport de gaz: application au réseau principal français

Modélisation et résolution du problème de transport de gaz: application au réseau principal français Modélisation et résolution du problème de transport de gaz: application au réseau principal français Présentation des travaux de thèse GDF SUEZ - INPT - ENSIACET - LGC EMN 24 mars 2011 Le gaz en Europe

Plus en détail

La notion de dualité

La notion de dualité La notion de dualité Dual d un PL sous forme standard Un programme linéaire est caractérisé par le tableau simplexe [ ] A b. c Par définition, le problème dual est obtenu en transposant ce tableau. [ A

Plus en détail

Variable Neighborhood Search

Variable Neighborhood Search Variable Neighborhood Search () Universite de Montreal 6 avril 2010 Plan Motivations 1 Motivations 2 3 skewed variable neighborhood search variable neighborhood decomposition search 4 Le probleme d optimisation.

Plus en détail

INTRODUCTION AU DATA MINING

INTRODUCTION AU DATA MINING INTRODUCTION AU DATA MINING 6 séances de 3 heures mai-juin 2006 EPF - 4 ème année - Option Ingénierie d Affaires et de Projets Bertrand LIAUDET TP DE DATA MINING Le TP et le projet consisteront à mettre

Plus en détail

SCI03 - Analyse de données expérimentales

SCI03 - Analyse de données expérimentales SCI03 - Analyse de données expérimentales Introduction à la statistique Thierry Denœux 1 1 Université de Technologie de Compiègne tél : 44 96 tdenoeux@hds.utc.fr Automne 2014 Qu est ce que la statistique?

Plus en détail

V ERSION EXPERIMENTALE

V ERSION EXPERIMENTALE V ERSION EXPERIMENTALE Cette version de Sipina v 3.0 n est pas, et ne sera jamais, définitive, elle sert d outil de recherche, elle a plus une vocation d outil d expérimentation que de logiciel dédié au

Plus en détail

Sébastien Mignot. Encadrant : Michèle Sebag Laboratoire de Recherche en Informatique Université Paris Sud

Sébastien Mignot. Encadrant : Michèle Sebag Laboratoire de Recherche en Informatique Université Paris Sud Stratégies de décision dans les arbres de recherche pour jeux basées sur des informations incomplètes Application au bridge : Apprentissage statistique des enchères et jeu de la carte optimal Sébastien

Plus en détail

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique Objectifs Clustering On ne sait pas ce qu on veut trouver : on laisse l algorithme nous proposer un modèle. On pense qu il existe des similarités entre les exemples. Qui se ressemble s assemble p. /55

Plus en détail

Première STMG1 2014-2015 progression. - 1. Séquence : Proportion d une sous population dans une population.

Première STMG1 2014-2015 progression. - 1. Séquence : Proportion d une sous population dans une population. Première STMG1 2014-2015 progression. - 1 Table des matières Fil rouge. 3 Axes du programme. 3 Séquence : Proportion d une sous population dans une population. 3 Information chiffrée : connaître et exploiter

Plus en détail

La programmation linéaire : une introduction. Qu est-ce qu un programme linéaire? Terminologie. Écriture mathématique

La programmation linéaire : une introduction. Qu est-ce qu un programme linéaire? Terminologie. Écriture mathématique La programmation linéaire : une introduction Qu est-ce qu un programme linéaire? Qu est-ce qu un programme linéaire? Exemples : allocation de ressources problème de recouvrement Hypothèses de la programmation

Plus en détail

Pour le renouvellement de la sémiologie de la carte de flux

Pour le renouvellement de la sémiologie de la carte de flux Thème 3 : la sémiologie usages et renouveau Pour le renouvellement de la sémiologie de la carte de flux Françoise Bahoken Représenter sur une carte toute l information disponible dans une matrice de flux,

Plus en détail

Intelligence Artificielle

Intelligence Artificielle Intelligence Artificielle p. 1/1 Intelligence Artificielle Les arbres de décisions Maria Malek Département Systèmes Informatiques Formels & Intelligents Intelligence Artificielle p. 2/1 Extraire les connaissances

Plus en détail

Prototypes et k plus proches voisins (kppv (knn))

Prototypes et k plus proches voisins (kppv (knn)) Prototypes et k plus proches voisins (kppv (knn)) Université Grenoble 1 - Lab. Informatique Grenbole / MRIM Learning Vector Quantization (1) Algorithme en ligne (on-line) dans lequel des prototypes sont

Plus en détail

Ce qu est le Data Mining

Ce qu est le Data Mining Data Mining 1 Ce qu est le Data Mining Extraction d informations intéressantes non triviales, implicites, préalablement inconnues et potentiellement utiles à partir de données. Autres appellations: ECD

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

Apprentissage statistique:

Apprentissage statistique: Apprentissage statistique: Arbre de décision binaire et Random Forest 1 Plan 1. Introduction 2. 3. Application à l apprentissage supervisé 4. Forêt Aléatoire (Random Forest) 2 1 Plan 1. Introduction 2.

Plus en détail

L informatique des entrepôts de données

L informatique des entrepôts de données L informatique des entrepôts de données Daniel Lemire SEMAINE 13 L exploration des données 13.1. Présentation de la semaine L exploration de données (ou data mining) est souvent associée à l intelligence

Plus en détail

TECH. INFOTECH # 34 Solvabilité 2 : Le calcul du capital économique dans le cadre d un modèle interne. Introduction

TECH. INFOTECH # 34 Solvabilité 2 : Le calcul du capital économique dans le cadre d un modèle interne. Introduction INFO # 34 dans le cadre d un modèle interne Comment les méthodes d apprentissage statistique peuvent-elles optimiser les calculs? David MARIUZZA Actuaire Qualifié IA Responsable Modélisation et Solvabilité

Plus en détail

Le problème du flot maximal avec contraintes sur le nombre de chemins

Le problème du flot maximal avec contraintes sur le nombre de chemins Le problème du flot maximal avec contraintes sur le nombre de chemins Jérôme Truffot, Christophe Duhamel, Philippe Mahey jerome.truffot@isima.fr, christophe.duhamel@isima.fr, philippe.mahey@isima.fr LIMOS,

Plus en détail

Modèle probabiliste: Algorithmes et Complexité

Modèle probabiliste: Algorithmes et Complexité Modèles de calcul, Complexité, Approximation et Heuristiques Modèle probabiliste: Algorithmes et Complexité Jean-Louis Roch Master-2 Mathématique Informatique Grenoble-INP UJF Grenoble University, France

Plus en détail

Arbres binaires de décision

Arbres binaires de décision 1 Arbres binaires de décision Résumé Arbres binaires de décision Méthodes de construction d arbres binaires de décision, modélisant une discrimination (classification trees) ou une régression (regression

Plus en détail