Méthodes de la Recherche Opérationnelle pour l analyse de données
|
|
- Lucie Roberge
- il y a 8 ans
- Total affichages :
Transcription
1 Méthodes de la Recherche Opérationnelle pour l analyse de données Julien Darlay G-SCOP 27 janvier 2011 Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20
2 Plan Analyse de données Définitions Liens avec l optimisation Principale différence Analyse Combinatoire de Données Définitions et concepts Schéma d apprentissage Modèles d optimisation Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20
3 Analyse de données Extraire à partir d un large volume de données, des connaissances originales par des méthodes semi-automatiques. Applications : Identifier des pathologies (sarcoidose, connectivite...) Prédire le temps avant la prochaine panne Partitionner des observations en groupes homogènes Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20
4 Analyse de données Un problème d optimisation Données : Un ensemble d observations Ω Des attributs décrivant l observation X X Une valeur à prédire c(x ) C Id class dyspnea surgery pain antec. age 1 neg neg neg neg pos pos pos pos pos Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20
5 Analyse de données Un problème d optimisation Objectif : Trouver une fonction h : X C Parmi un ensemble d hypothèses H Minimisant une fonction d erreur l(h, X ) min l(h, X )dx h H X X Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20
6 Analyse de données Exemple X = (x 1, x 2 ) C = {+, x} H = {x 1 + ax 2 + b = 0} Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20
7 Analyse de données Exemple X = (x 1, x 2 ) C = {+, x} H = {x 1 + ax 2 + b = 0} h(x ) γ si c(x ) = x h(y ) γ si c(y ) = + Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20
8 Analyse de données Exemple X = (x 1, x 2 ) C = {+, x} H = {x 1 + ax 2 + b = 0} h(x ) + e X γ si c(x ) = x h(y ) e Y γ si c(y ) = + e 0 Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20
9 Analyse de données Exemple X = (x 1, x 2 ) C = {+, x} H = {x 1 + ax 2 + b = 0} min a,b,e i Ω e i s.c. h(x ) + e X γ 0 si c(x ) = x h(y ) e Y + γ 0 si c(y ) = + e 0 Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20
10 Analyse de données Surapprentissage Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20
11 Analyse de données Surapprentissage 2 solutions : Utiliser des bornes théoriques [Vapnik, 95] Utiliser des données externes Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20
12 Analyse de données Surapprentissage Utiliser des données externes Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20
13 Analyse de données Surapprentissage Utiliser des données externes Collecter de nouvelles données Couteux Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20
14 Analyse de données Surapprentissage Utiliser des données externes Collecter de nouvelles données Couteux N utiliser qu une partie de la base Dépend de la partition Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20
15 Analyse de données Surapprentissage Utiliser des données externes Collecter de nouvelles données Couteux N utiliser qu une partie de la base Dépend de la partition Utiliser la validation croisée Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20
16 Analyse de données Quelques méthodes classiques Support Vector Machine Réseaux de neurones Probabilité bayesienne Arbre de décision Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20
17 Analyse de données Quelques méthodes classiques Support Vector Machine Réseaux de neurones Probabilité bayesienne Arbre de décision Analyse combinatoire de données Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20
18 Analyse Combinatoire de Données Logical Analysis of Data [Crama, Hammer, Ibaraki, 88] Repose sur des techniques d optimisation combinatoire Extension de fonctions booléennes partiellement définies Cadre d apprentissage particulier C = {0, 1} X {0, 1} m H : fonctions booléennes Hypothèses facilement interprétables Qualité prouvée sur de nombreuses applications Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20
19 Analyse Combinatoire de Données Les différentes étapes 1 Binarisation des attributs 2 Sélection d un support 3 Génération de motifs 4 Construction d un modèle Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20
20 Analyse Combinatoire de Données Binarisation Transformer les attributs en attributs binaires Binaires (Homme, Femme) = Homme Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20
21 Analyse Combinatoire de Données Binarisation Transformer les attributs en attributs binaires Binaires (Homme, Femme) = Homme Catégories (Rouge, Vert, Bleu) = Rouge, = Vert, = Bleu Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20
22 Analyse Combinatoire de Données Binarisation Transformer les attributs en attributs binaires Binaires (Homme, Femme) = Homme Catégories (Rouge, Vert, Bleu) = Rouge, = Vert, = Bleu Ordonnés (Faible, Moyen, Fort) Moyen, Fort Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20
23 Analyse Combinatoire de Données Binarisation Transformer les attributs en attributs binaires Binaires (Homme, Femme) = Homme Catégories (Rouge, Vert, Bleu) = Rouge, = Vert, = Bleu Ordonnés (Faible, Moyen, Fort) Moyen, Fort Numériques (1, 2.5, 15, 20) < 1.75, < 8.75, < 17.5 Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20
24 Analyse Combinatoire de Données Binarisation Transformer les attributs en attributs binaires Binaires (Homme, Femme) = Homme Catégories (Rouge, Vert, Bleu) = Rouge, = Vert, = Bleu Ordonnés (Faible, Moyen, Fort) Moyen, Fort Numériques (1, 2.5, 15, 20) < 1.75, < 8.75, < 17.5 Génération d un grand nombre d attributs binaires Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20
25 Analyse Combinatoire de Données Sélection d un support Objectif Trouver un sous ensemble minimal d attributs Séparant les observations de classes différentes Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20
26 Analyse Combinatoire de Données Sélection d un support Objectif Trouver un sous ensemble minimal d attributs Séparant les observations de classes différentes Modélisation en problème de set-cover [Hammer et al., 88] min z i z i s.c. i 1 (X i Y i )z i 1 X Ω +, Y Ω z {0, 1} m Résolution en PLNE, ou par approche gloutonne Id class dyspnea surgery pain antec. age > 65 1 neg neg pos pos Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20
27 Analyse Combinatoire de Données Sélection d un support Objectif Trouver un sous ensemble minimal d attributs Séparant les observations de classes différentes Modélisation en problème de set-cover [Hammer et al., 88] min z i z i s.c. i 1 (X i Y i )z i 1 X Ω +, Y Ω z {0, 1} m Résolution en PLNE, ou par approche gloutonne Id class dyspnea surgery pain antec. age > 65 1 neg neg pos pos Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20
28 Analyse Combinatoire de Données Motifs Un motif est une conjonction de conditions sur les attributs dyspnea = 1 & pain = 1 Associé à une classe pos class dysp. pain neg 0 0 neg 0 0 neg 1 0 neg 1 1 pos 1 1 pos 1 1 pos 1 1 pos 0 1 pos 1 0 Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20
29 Analyse Combinatoire de Données Motifs Un motif est une conjonction de conditions sur les attributs dyspnea = 1 & pain = 1 Associé à une classe pos Couverture observations vérifiant le motif class dysp. pain neg 0 0 neg 0 0 neg 1 0 neg 1 1 pos 1 1 pos 1 1 pos 1 1 pos 0 1 pos 1 0 Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20
30 Analyse Combinatoire de Données Motifs Un motif est une conjonction de conditions sur les attributs dyspnea = 1 & pain = 1 Associé à une classe pos Couverture observations vérifiant le motif Homogénéité proportion d obs. de la bonne classe dans la couverture h = 3 4 class dysp. pain neg 0 0 neg 0 0 neg 1 0 neg 1 1 pos 1 1 pos 1 1 pos 1 1 pos 0 1 pos 1 0 Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20
31 Analyse Combinatoire de Données Motifs Un motif est une conjonction de conditions sur les attributs dyspnea = 1 & pain = 1 Associé à une classe pos Couverture observations vérifiant le motif Homogénéité proportion d obs. de la bonne classe dans la couverture h = 3 4 Prévalence proportion d obs. de la bonne classe couvertes p = 3 5 class dysp. pain neg 0 0 neg 0 0 neg 1 0 neg 1 1 pos 1 1 pos 1 1 pos 1 1 pos 0 1 pos 1 0 Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20
32 Analyse Combinatoire de Données Motifs Un motif est une conjonction de conditions sur les attributs dyspnea = 1 & pain = 1 Associé à une classe pos Couverture observations vérifiant le motif Homogénéité proportion d obs. de la bonne classe dans la couverture h = 3 4 Prévalence proportion d obs. de la bonne classe couvertes p = 3 5 Degré nombre de conditions dans le motif d = 2 class dysp. pain neg 0 0 neg 0 0 neg 1 0 neg 1 1 pos 1 1 pos 1 1 pos 1 1 pos 0 1 pos 1 0 Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20
33 Analyse Combinatoire de Données Motifs Un motif est une conjonction de conditions sur les attributs dyspnea = 1 & pain = 1 Associé à une classe pos Couverture observations vérifiant le motif Homogénéité proportion d obs. de la bonne classe dans la couverture h = 3 4 Prévalence proportion d obs. de la bonne classe couvertes p = 3 5 Degré nombre de conditions dans le motif d = 2 Générer des motifs en respectant des conditions sur h, p, d class dysp. pain neg 0 0 neg 0 0 neg 1 0 neg 1 1 pos 1 1 pos 1 1 pos 1 1 pos 0 1 pos 1 0 Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20
34 Analyse Combinatoire de Données Génération de motifs Différentes approches classiques Exhaustive, en pratique d 3 Glouton [Boros et al., 00] top-down ou bottom-up PLNE successifs [Ryoo et al., 08] [Boros, D. 10] Algorithme aléatoire avec garantie de qualité Fonctions booléennes duales Réduction de la complexité : une sélection aléatoire des observations Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20
35 Analyse Combinatoire de Données Sélection d un modèle Modèle Sous ensemble minimal de motifs Permettant d expliquer toutes les observations Modélisation en problème de set-cover [Hammer et al., 88] min z i z i s.c. i cov(m i, X )z i 1 z {0, 1} M X Ω Résolution en PLNE ou par approche gloutonne Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20
36 Analyse Combinatoire de Données Discriminant Traiter une nouvelle observation O = cov(p, O) P M + N M cov(n, O) Attribution de la classe en fonction de > 0 classe Pos < 0 classe Neg Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20
37 Analyse Combinatoire de Données Discriminant Traiter une nouvelle observation O = cov(p, O) P M + N M cov(n, O) Attribution de la classe en fonction de > 0 classe Pos < 0 classe Neg Approche par génération de colonnes [Hansen, 09] Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20
38 Applications médicales Improved screening for growth hormone deficiency using logical analysis of data [Lemaire et al. 09] Final height and gonad function after total body irradiation during childhood [Couto-Silva et al. 06] High-resolution computed tomography to differentiate chronic diffuse interstitial lung diseases with predominant ground-glass pattern using logical analysis of data [Grivaud Martin S. et al. 10] Logical Analysis of Computed Tomography Data to Differentiate Entities of Idiopathic Interstitial Pneumonias [Brauner et al. 07] Logical analysis of survival data : prognostic survival models by detecting high-degree interactions in right-censored data [Kronek et al. 08] Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20
39 Conclusion Analyse de données Un problème d optimisation particulier Utilisant des techniques de RO Source de problèmes en RO et en optimisation combinatoire Analyse combinatoire de données Fonctions booléennes Modèles d optimisation classiques Sorties facilement interprétables Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20
40 Perspectives Application médicale Algorithmes de génération de motifs Utiliser les bornes théoriques sur l erreur [Anthony, 11] Utilisation de l analyse de données en RO Julien Darlay (G-SCOP) Méthodes de RO pour l analyse de données 27 janvier / 20
Introduction au Data-Mining
Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme
Plus en détailCours de Master Recherche
Cours de Master Recherche Spécialité CODE : Résolution de problèmes combinatoires Christine Solnon LIRIS, UMR 5205 CNRS / Université Lyon 1 2007 Rappel du plan du cours 16 heures de cours 1 - Introduction
Plus en détailProgrammation linéaire
1 Programmation linéaire 1. Le problème, un exemple. 2. Le cas b = 0 3. Théorème de dualité 4. L algorithme du simplexe 5. Problèmes équivalents 6. Complexité de l Algorithme 2 Position du problème Soit
Plus en détailIntroduction au Data-Mining
Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane
Plus en détailSystème de contrôle du trafic d une ligne de métro Dossier de tests
Système de contrôle du trafic d une ligne de métro Dossier de tests Tests NI557/STL/M2/INFO/UPMC Action Date Auteur Statut Création 05/03/2012 P.Manoury En cours 1 Description et exigences fonctionnelles
Plus en détailIntroduction au datamining
Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des
Plus en détailNouvelles propositions pour la résolution exacte du problème de sac à dos bi-objectif unidimensionnel en variables binaires
Nouvelles propositions pour la résolution exacte du problème de sac à dos bi-objectif unidimensionnel en variables binaires Julien Jorge, Xavier Gandibleux Laboratoire d Informatique de Nantes Atlantique
Plus en détailProgrammation Linéaire - Cours 1
Programmation Linéaire - Cours 1 P. Pesneau pierre.pesneau@math.u-bordeaux1.fr Université Bordeaux 1 Bât A33 - Bur 265 Ouvrages de référence V. Chvátal - Linear Programming, W.H.Freeman, New York, 1983.
Plus en détailLaboratoire 4 Développement d un système intelligent
DÉPARTEMENT DE GÉNIE LOGICIEL ET DES TI LOG770 - SYSTÈMES INTELLIGENTS ÉTÉ 2012 Laboratoire 4 Développement d un système intelligent 1 Introduction Ce quatrième et dernier laboratoire porte sur le développement
Plus en détaildonnées en connaissance et en actions?
1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)
Plus en détailMéthodes d apprentissage statistique «Machine Learning»
Méthodes d apprentissage statistique «Machine Learning» Fabrice TAILLIEU, Sébastien DELUCINGE, Rémi BELLINA Le marché de l assurance a rarement été marqué par un environnement aussi difficile qu au cours
Plus en détailINTRODUCTION AU DATA MINING
INTRODUCTION AU DATA MINING 6 séances de 3 heures mai-juin 2006 EPF - 4 ème année - Option Ingénierie d Affaires et de Projets Bertrand LIAUDET TP DE DATA MINING Le TP et le projet consisteront à mettre
Plus en détailArbres binaires de décision
1 Arbres binaires de décision Résumé Arbres binaires de décision Méthodes de construction d arbres binaires de décision, modélisant une discrimination (classification trees) ou une régression (regression
Plus en détailObjectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique
Objectifs Clustering On ne sait pas ce qu on veut trouver : on laisse l algorithme nous proposer un modèle. On pense qu il existe des similarités entre les exemples. Qui se ressemble s assemble p. /55
Plus en détailData Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.
des des Data Mining Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne 2012-2013 1/65 des des 1 2 des des 3 4 Post-traitement 5 représentation : 6 2/65 des des Définition générale Le
Plus en détailLa classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
Plus en détailIncertitude et variabilité : la nécessité de les intégrer dans les modèles
Incertitude et variabilité : la nécessité de les intégrer dans les modèles M. L. Delignette-Muller Laboratoire de Biométrie et Biologie Evolutive VetAgro Sup - Université de Lyon - CNRS UMR 5558 24 novembre
Plus en détailMASTER SIS PRO : logique et sécurité DÉTECTION D INTRUSIONS. Odile PAPINI, LSIS. Université de Toulon et du Var. papini@univ-tln.
MASTER SIS PRO : logique et sécurité DÉTECTION D INTRUSIONS Odile PAPINI, LSIS. Université de Toulon et du Var. papini@univ-tln.fr Plan Introduction Généralités sur les systèmes de détection d intrusion
Plus en détailBaccalauréat ES Pondichéry 7 avril 2014 Corrigé
Baccalauréat ES Pondichéry 7 avril 204 Corrigé EXERCICE 4 points Commun à tous les candidats. Proposition fausse. La tangente T, passant par les points A et B d abscisses distinctes, a pour coefficient
Plus en détailPourquoi l apprentissage?
Pourquoi l apprentissage? Les SE sont basés sur la possibilité d extraire la connaissance d un expert sous forme de règles. Dépend fortement de la capacité à extraire et formaliser ces connaissances. Apprentissage
Plus en détail4.2 Unités d enseignement du M1
88 CHAPITRE 4. DESCRIPTION DES UNITÉS D ENSEIGNEMENT 4.2 Unités d enseignement du M1 Tous les cours sont de 6 ECTS. Modélisation, optimisation et complexité des algorithmes (code RCP106) Objectif : Présenter
Plus en détailTechniques du Data Mining pour la prédiction de faillite des entreprises et la gestion du risque de crédit
Techniques du Data Mining pour la prédiction de faillite des entreprises et la gestion du risque de crédit Adil Belhouari HEC - Montréal - Journées de l Optimisation 2005-09 Mai 2005 PLAN DE LA PRÉSENTATION
Plus en détailSouad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/
Recherche opérationnelle Les démonstrations et les exemples seront traités en cours Souad EL Bernoussi Groupe d Analyse Numérique et Optimisation Rabat http ://www.fsr.ac.ma/ano/ Table des matières 1 Programmation
Plus en détailLa programmation linéaire : une introduction. Qu est-ce qu un programme linéaire? Terminologie. Écriture mathématique
La programmation linéaire : une introduction Qu est-ce qu un programme linéaire? Qu est-ce qu un programme linéaire? Exemples : allocation de ressources problème de recouvrement Hypothèses de la programmation
Plus en détailBig Data et Graphes : Quelques pistes de recherche
Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université
Plus en détailCours de recherche opérationnelle I
1 Cours de recherche opérationnelle I Nadia Brauner Nadia.Brauner@imag.fr Grenoble, 2014-2015 Auteurs Ont participé à la rédaction de ce cours (par ordre d arrivée) Nadia Brauner Christophe Rapine Julien
Plus en détailVI. Tests non paramétriques sur un échantillon
VI. Tests non paramétriques sur un échantillon Le modèle n est pas un modèle paramétrique «TESTS du CHI-DEUX» : VI.1. Test d ajustement à une loi donnée VI.. Test d indépendance de deux facteurs 96 Différentes
Plus en détailRésolution de systèmes linéaires par des méthodes directes
Résolution de systèmes linéaires par des méthodes directes J. Erhel Janvier 2014 1 Inverse d une matrice carrée et systèmes linéaires Ce paragraphe a pour objet les matrices carrées et les systèmes linéaires.
Plus en détailContexte et motivations Les techniques envisagées Evolution des processus Conclusion
Vérification de logiciels par analyse statique Contexte et motivations Les techniques envisagées Evolution des processus Conclusion Contexte et motivations Specification Design architecture Revues and
Plus en détailUne comparaison de méthodes de discrimination des masses de véhicules automobiles
p.1/34 Une comparaison de méthodes de discrimination des masses de véhicules automobiles A. Rakotomamonjy, R. Le Riche et D. Gualandris INSA de Rouen / CNRS 1884 et SMS / PSA Enquêtes en clientèle dans
Plus en détailBig Data et Graphes : Quelques pistes de recherche
Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci http://liris.cnrs.fr/hamamache.kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de
Plus en détailÉtude des résultats des investisseurs particuliers sur le trading de CFD et de Forex en France
Étude des résultats des investisseurs particuliers sur le trading de CFD et de Forex en France Le 13 octobre 2014 Autorité des marchés financiers 17, place de la Bourse 75082 Paris cedex 02 Tél. : 01 53
Plus en détailMathématiques Première L, ES, S, Concours Post-Bac Equations et inéquations du second degré FORMAV
Mathématiques Première L, ES, S, Concours Post-Bac Equations et inéquations du second degré Méthode et exercices corrigés générés aléatoirement Pour un meilleur rendu ouvrir ce document avec TeXworks FORMAV
Plus en détailAlgorithmes d'apprentissage
Algorithmes d'apprentissage 1 Agents qui apprennent à partir d'exemples La problématique : prise de décision automatisée à partir d'un ensemble d'exemples Diagnostic médical Réponse à une demande de prêt
Plus en détailPrincipe de symétrisation pour la construction d un test adaptatif
Principe de symétrisation pour la construction d un test adaptatif Cécile Durot 1 & Yves Rozenholc 2 1 UFR SEGMI, Université Paris Ouest Nanterre La Défense, France, cecile.durot@gmail.com 2 Université
Plus en détailLES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN
LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN Les contenues de ce document sont la propriété exclusive de la société REVER. Ils ne sont transmis qu à titre d information et ne peuvent en aucun cas
Plus en détailLe Data Mining au service du Scoring ou notation statistique des emprunteurs!
France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative
Plus en détail1 Modélisation d être mauvais payeur
1 Modélisation d être mauvais payeur 1.1 Description Cet exercice est très largement inspiré d un document que M. Grégoire de Lassence de la société SAS m a transmis. Il est intitulé Guide de démarrage
Plus en détailChapitre 3. Les distributions à deux variables
Chapitre 3. Les distributions à deux variables Jean-François Coeurjolly http://www-ljk.imag.fr/membres/jean-francois.coeurjolly/ Laboratoire Jean Kuntzmann (LJK), Grenoble University 1 Distributions conditionnelles
Plus en détailCours Optimisation Partie Optimisation Combinatoire. Année scolaire 2008-2009. Gérard Verfaillie ONERA/DCSD/CD, Toulouse Gerard.Verfaillie@onera.
Cours Optimisation Partie Optimisation Combinatoire 3ième année ISAE Année scolaire 2008-2009 Gérard Verfaillie ONERA/DCSD/CD, Toulouse Gerard.Verfaillie@onera.fr Septembre 2008 Résumé Ce document couvre
Plus en détailGrandes lignes ASTRÉE. Logiciels critiques. Outils de certification classiques. Inspection manuelle. Definition. Test
Grandes lignes Analyseur Statique de logiciels Temps RÉel Embarqués École Polytechnique École Normale Supérieure Mercredi 18 juillet 2005 1 Présentation d 2 Cadre théorique de l interprétation abstraite
Plus en détailDébuter avec EXPRESS. Alain Plantec. 1 Schema 2
Débuter avec EXPRESS Alain Plantec Table des matières 1 Schema 2 2 Entité 2 2.1 Attributs simples................................................ 2 2.2 Attributs collection...............................................
Plus en détailK. Ammar, F. Bachoc, JM. Martinez. Séminaire ARISTOTE - 23 octobre 2014 - Palaiseau
Apport des modèles de krigeage à la simulation numérique K Ammar, F Bachoc, JM Martinez CEA-Saclay, DEN, DM2S, F-91191 Gif-sur-Yvette, France Séminaire ARISTOTE - 23 octobre 2014 - Palaiseau Apport des
Plus en détailThéorie et Codage de l Information (IF01) exercices 2013-2014. Paul Honeine Université de technologie de Troyes France
Théorie et Codage de l Information (IF01) exercices 2013-2014 Paul Honeine Université de technologie de Troyes France TD-1 Rappels de calculs de probabilités Exercice 1. On dispose d un jeu de 52 cartes
Plus en détailL apprentissage automatique
L apprentissage automatique L apprentissage automatique L'apprentissage automatique fait référence au développement, à l analyse et à l implémentation de méthodes qui permettent à une machine d évoluer
Plus en détailTARIFICATION EN ASSURANCE COMPLEMENTAIRE SANTE: il était une fois, un statisticien, un actuaire, un économiste de la santé
TARIFICATION EN ASSURANCE COMPLEMENTAIRE SANTE: il était une fois, un statisticien, un actuaire, un économiste de la santé Plan de l intervention 1 2 3 Généralités sur le fonctionnement de l assurance
Plus en détailUNE EXPERIENCE, EN COURS PREPARATOIRE, POUR FAIRE ORGANISER DE L INFORMATION EN TABLEAU
Odile VERBAERE UNE EXPERIENCE, EN COURS PREPARATOIRE, POUR FAIRE ORGANISER DE L INFORMATION EN TABLEAU Résumé : Cet article présente une réflexion sur une activité de construction de tableau, y compris
Plus en détailEncryptions, compression et partitionnement des données
Encryptions, compression et partitionnement des données Version 1.0 Grégory CASANOVA 2 Compression, encryption et partitionnement des données Sommaire 1 Introduction... 3 2 Encryption transparente des
Plus en détail$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU
$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU Fabien FIGUERES fabien.figueres@mpsa.com 0RWVFOpV : Krigeage, plans d expériences space-filling, points de validations, calibration moteur. 5pVXPp Dans le
Plus en détailValeur ajoutée relative basée sur les comparaisons indirectes Giens 2008, TR 5
Valeur ajoutée relative basée sur les comparaisons indirectes Giens 2008, TR 5 Claire Le Jeunne Bertrand Xerri Cécile Rey-Coquais Jean-Michel Joubert Jean Delonca Martine Pigeon Michel Lièvre Patricia
Plus en détailRétablissement d un réseau cellulaire après un désastre
Rétablissement d un réseau cellulaire après un désastre Anaïs Vergne avec Laurent Decreusefond, Ian Flint, et Philippe Martins Journées MAS 2014 29 août 2014 Rétablissement d un réseau cellulaire après
Plus en détailMABioVis. Bio-informatique et la
MABioVis Modèles et Algorithmes pour la Bio-informatique et la Visualisation Visite ENS Cachan 5 janvier 2011 MABioVis G GUY MELANÇON (PR UFR Maths Info / EPI GRAVITE) (là, maintenant) - MABioVis DAVID
Plus en détailApprentissage Automatique
Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs
Plus en détailEnjeux mathématiques et Statistiques du Big Data
Enjeux mathématiques et Statistiques du Big Data Mathilde Mougeot LPMA/Université Paris Diderot, mathilde.mougeot@univ-paris-diderot.fr Mathématique en Mouvements, Paris, IHP, 6 Juin 2015 M. Mougeot (Paris
Plus en détailL utilisation d un réseau de neurones pour optimiser la gestion d un firewall
L utilisation d un réseau de neurones pour optimiser la gestion d un firewall Réza Assadi et Karim Khattar École Polytechnique de Montréal Le 1 mai 2002 Résumé Les réseaux de neurones sont utilisés dans
Plus en détailIntégration de la dimension sémantique dans les réseaux sociaux
Intégration de la dimension sémantique dans les réseaux sociaux Application : systèmes de recommandation Maria Malek LARIS-EISTI maria.malek@eisti.fr 1 Contexte : Recommandation dans les réseaux sociaux
Plus en détailCommande Prédictive des. Convertisseurs Statiques
Commande Prédictive des Convertisseurs Statiques 1 Classification des méthodes de commande pour les convertisseurs statiques Commande des convertisseurs Hystérésis MLI Cde Linéaire Fuzzy Logic Sliding
Plus en détailProjet SINF2275 «Data mining and decision making» Projet classification et credit scoring
Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems
Plus en détailAnalyse Combinatoire
Analyse Combinatoire 1) Équipes On dispose d un groupe de cinq personnes. a) Combien d équipes de trois personnes peut-on former? b) Combien d équipes avec un chef, un sous-chef et un adjoint? c) Combien
Plus en détailApprentissage incrémental par sélection de données dans un flux pour une application de sécurité routière
Apprentissage incrémental par sélection de données dans un flux pour une application de sécurité routière Nicolas Saunier INRETS Télécom Paris Sophie Midenet INRETS Alain Grumbach Télécom Paris Conférence
Plus en détailChristophe CANDILLIER Cours de DataMining mars 2004 Page 1
Christophe CANDILLIER Cours de DataMining mars 2004 age 1 1. Introduction 2. rocessus du DataMining 3. Analyse des données en DataMining 4. Analyse en Ligne OLA 5. Logiciels 6. Bibliographie Christophe
Plus en détailMesurer les performances (CPU) sous Linux
Titre : Mesurer les performances (CPU) sous Linux Date : 22/07/2015 Page : 1/7 Mesurer les performances (CPU) sous Linux Résumé : Il existe des outils permettant de tracer les temps CPU utilisés (profiling).
Plus en détailCapacité d un canal Second Théorème de Shannon. Théorie de l information 1/34
Capacité d un canal Second Théorème de Shannon Théorie de l information 1/34 Plan du cours 1. Canaux discrets sans mémoire, exemples ; 2. Capacité ; 3. Canaux symétriques ; 4. Codage de canal ; 5. Second
Plus en détailInfo0804. Cours 6. Optimisation combinatoire : Applications et compléments
Recherche Opérationnelle Optimisation combinatoire : Applications et compléments Pierre Delisle Université de Reims Champagne-Ardenne Département de Mathématiques et Informatique 17 février 2014 Plan de
Plus en détailI.D.S. Systèmes de détection d intrusion - Link Analysis. par: FOUQUIN MATHIEU. responsable: AKLI ADJAOUTE DEVÈZE BENJAMIN.
EPITA SCIA PROMO 2005 14-16 rue Voltaire 94270 Kremlin-Bicêtre I.D.S. Systèmes de détection d intrusion - Link Analysis Juillet 2004 par: DEVÈZE BENJAMIN FOUQUIN MATHIEU responsable: AKLI ADJAOUTE TABLE
Plus en détailCalcul de développements de Puiseux et application au calcul du groupe de monodromie d'une courbe algébrique plane
Calcul de développements de Puiseux et application au calcul du groupe de monodromie d'une courbe algébrique plane Poteaux Adrien XLIM-DMI, UMR-CNRS 6172 Université de Limoges Soutenance de thèse 15 octobre
Plus en détailVers une Optimisation de l Algorithme AntTreeStoch
Revue des Sciences et de la Technologie - RST- Volume 3 N 1 / janvier 2012 Vers une Optimisation de l Algorithme AntTreeStoch O. KADRI, H. MOUSS, A. ABDELHADI, R. MAHDAOUI Laboratoire d Automatique et
Plus en détailINF6304 Interfaces Intelligentes
INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie
Plus en détailOptimisation des ressources des produits automobile première
EURIA EURo Optimisation produits automobile première Pauline PERROT promotion 2011 EURIA EURo 1 ère partie : contexte MMA (FFSA) MAAF (GEMA) SGAM : COVEA (AFA) GMF (GEMA) MMA : Plus 3 millions clients
Plus en détailConception d une Plateforme Open Source d Extraction et de Gestion des Connaissances
Département d Informatique MEMOIRE Présenté par : KADEM Habib Pour obtenir LE DIPLOME DE MAGISTER Spécialité : Informatique Option : Informatique & Automatique Intitulé : Conception d une Plateforme Open
Plus en détailOrganisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining.
2 jours : Mardi 15 et mercredi 16 novembre 2005 de 9 heures 30 à 17 heures 30 Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining. Madame, Monsieur, On parle
Plus en détailClassification non supervisée
AgroParisTech Classification non supervisée E. Lebarbier, T. Mary-Huard Table des matières 1 Introduction 4 2 Méthodes de partitionnement 5 2.1 Mesures de similarité et de dissimilarité, distances.................
Plus en détailExercices du Cours de la programmation linéaire donné par le Dr. Ali DERBALA
75. Un plombier connaît la disposition de trois tuyaux sous des dalles ( voir figure ci dessous ) et il lui suffit de découvrir une partie de chacun d eux pour pouvoir y poser les robinets. Il cherche
Plus en détailL exclusion mutuelle distribuée
L exclusion mutuelle distribuée L algorithme de L Amport L algorithme est basé sur 2 concepts : L estampillage des messages La distribution d une file d attente sur l ensemble des sites du système distribué
Plus en détailCoup de Projecteur sur les Réseaux de Neurones
Coup de Projecteur sur les Réseaux de Neurones Les réseaux de neurones peuvent être utilisés pour des problèmes de prévision ou de classification. La représentation la plus populaire est le réseau multicouche
Plus en détailLa nouvelle planification de l échantillonnage
La nouvelle planification de l échantillonnage Pierre-Arnaud Pendoli Division Sondages Plan de la présentation Rappel sur le Recensement de la population (RP) en continu Description de la base de sondage
Plus en détailPrésentation du sujet de thèse Schémas temporels hybrides fondés sur les SVMs pour l analyse du comportement du conducteur
Présentation du sujet de thèse Schémas temporels hybrides fondés sur les SVMs pour l analyse du comportement du conducteur Réalisé par : Bassem Besbes Laboratoire d Informatique, Traitement de l Information
Plus en détailLaboratoire d Automatique et Productique Université de Batna, Algérie
Anale. Seria Informatică. Vol. IX fasc. 2 Annals. Computer Science Series. 9 th Tome st Fasc. 2 La sélection de paramètres d un système industriel par les colonies de fourmis Ouahab Kadri, L. Hayet Mouss,
Plus en détailConception de Médicament
Conception de Médicament Approche classique HTS Chimie combinatoire Rational Drug Design Ligand based (QSAR) Structure based (ligand et ou macromolec.) 3DQSAR Docking Virtual screening Needle in a Haystack
Plus en détailCours Base de données relationnelles. M. Boughanem, IUP STRI
Cours Base de données relationnelles 1 Plan 1. Notions de base 2. Modèle relationnel 3. SQL 2 Notions de base (1) Définition intuitive : une base de données est un ensemble d informations, (fichiers),
Plus en détailANALYSE STATISTIQUE PRÉDICTIVE
Yoshua Bengio Chaire de Recherche du Canada sur les Algorithmes d Apprentissage Statistique, Université de Montréal Charles Dugas ApSTAT Technologies Inc. Et Aviva Canada SALON INTELLIGENCE D AFFAIRE 8
Plus en détailLES MODELES DE SCORE
LES MODELES DE SCORE Stéphane TUFFERY CONFERENCE GENDER DIRECTIVE 31 mai 2012 31/05/2012 ActuariaCnam Conférence Gender Directive Stéphane Tufféry 1 Plan Le scoring et ses applications L élaboration d
Plus en détailExercices sur le chapitre «Probabilités»
Arnaud de Saint Julien - MPSI Lycée La Merci 2014-2015 1 Pour démarrer Exercices sur le chapitre «Probabilités» Exercice 1 (Modélisation d un dé non cubique) On considère un parallélépipède rectangle de
Plus en détailChapitre 6 Apprentissage des réseaux de neurones et régularisation
Chapitre 6 : Apprentissage des réseaux de neurones et régularisation 77 Chapitre 6 Apprentissage des réseaux de neurones et régularisation Après une introduction rapide aux réseaux de neurones et à la
Plus en détailProblèmes d ordonnancement dans les systèmes de production. Journée Automatique et Optimisation Université de Paris 12 20 Mars 2003
Problèmes d ordonnancement dans les systèmes de production Michel Gourgand Université Blaise Pascal Clermont Ferrand LIMOS CNRS UMR 6158 1 Le LIMOS Laboratoire d Informatique, de Modélisation et d Optimisation
Plus en détailIntroduction aux outils BI de SQL Server 2014. Fouille de données avec SQL Server Analysis Services (SSAS)
MIT820: Entrepôts de données et intelligence artificielle Introduction aux outils BI de SQL Server 2014 Fouille de données avec SQL Server Analysis Services (SSAS) Description générale Ce tutoriel a pour
Plus en détailConception d un lecteur de musique intelligent basé sur l apprentissage automatique.
Université de Mons Faculté des Sciences Institut d Informatique Service d Algorithmique Conception d un lecteur de musique intelligent basé sur l apprentissage automatique. Mémoire réalisé par Xavier DUBUC
Plus en détailProgrammation Par Contraintes
Programmation Par Contraintes Cours 2 - Arc-Consistance et autres amusettes David Savourey CNRS, École Polytechnique Séance 2 inspiré des cours de Philippe Baptiste, Ruslan Sadykov et de la thèse d Hadrien
Plus en détailchapitre 4 Nombres de Catalan
chapitre 4 Nombres de Catalan I Dénitions Dénition 1 La suite de Catalan (C n ) n est la suite dénie par C 0 = 1 et, pour tout n N, C n+1 = C k C n k. Exemple 2 On trouve rapidement C 0 = 1, C 1 = 1, C
Plus en détailET 24 : Modèle de comportement d un système Boucles de programmation avec Labview.
ET 24 : Modèle de comportement d un système Boucles de programmation avec Labview. Sciences et Technologies de l Industrie et du Développement Durable Formation des enseignants parcours : ET24 Modèle de
Plus en détailStatistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier
Statistiques Appliquées à l Expérimentation en Sciences Humaines Christophe Lalanne, Sébastien Georges, Christophe Pallier Table des matières 1 Méthodologie expérimentale et recueil des données 6 1.1 Introduction.......................................
Plus en détailModélisation du comportement habituel de la personne en smarthome
Modélisation du comportement habituel de la personne en smarthome Arnaud Paris, Selma Arbaoui, Nathalie Cislo, Adnen El-Amraoui, Nacim Ramdani Université d Orléans, INSA-CVL, Laboratoire PRISME 26 mai
Plus en détailJade. Projet Intelligence Artificielle «Devine à quoi je pense»
Jade Projet Intelligence Artificielle «Devine à quoi je pense» Réalisé par Djénéba Djikiné, Alexandre Bernard et Julien Lafont EPSI CSII2-2011 TABLE DES MATIÈRES 1. Analyse du besoin a. Cahier des charges
Plus en détail4 Exemples de problèmes MapReduce incrémentaux
4 Exemples de problèmes MapReduce incrémentaux 1 / 32 Calcul des plus courtes distances à un noeud d un graphe Calcul des plus courts chemins entre toutes les paires de noeuds d un graphe Algorithme PageRank
Plus en détailApprentissage. Intelligence Artificielle NFP106 Année 2012-2013. Plan. Apprentissage. Apprentissage
Intelligence Artificielle NFP106 Année 2012-2013 Apprentissage! F.-Y. Villemin! Plan! Apprentissage! Induction! Règles d'inférence inductive! Apprentissage de concepts!! Arbres de décision! ID3! Analogie
Plus en détailQu est-ce qu une probabilité?
Chapitre 1 Qu est-ce qu une probabilité? 1 Modéliser une expérience dont on ne peut prédire le résultat 1.1 Ensemble fondamental d une expérience aléatoire Une expérience aléatoire est une expérience dont
Plus en détailDéroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI
1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage
Plus en détailStéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 24/12/2006 Stéphane Tufféry - Data Mining - http://data.mining.free.fr
1 Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE 2 Plan du cours Qu est-ce que le data mining? A quoi sert le data mining? Les 2 grandes familles de techniques Le déroulement d un projet de data
Plus en détailGestion des Clés Publiques (PKI)
Chapitre 3 Gestion des Clés Publiques (PKI) L infrastructure de gestion de clés publiques (PKI : Public Key Infrastructure) représente l ensemble des moyens matériels et logiciels assurant la gestion des
Plus en détailNouvelles propositions pour la résolution exacte du sac à dos multi-objectif unidimensionnel en variables binaires
Nouvelles propositions pour la résolution exacte du sac à dos multi-objectif unidimensionnel en variables binaires Julien Jorge julien.jorge@univ-nantes.fr Laboratoire d Informatique de Nantes Atlantique,
Plus en détail