Polytech Paris-Sud Département informatique Formation par Apprentissage, 3ème année



Documents pareils
Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

Introduction au Data-Mining

Soutenance de stage Laboratoire des Signaux et Systèmes

Coup de Projecteur sur les Réseaux de Neurones

Semarchy Convergence for MDM La Plate-Forme MDM Évolutionnaire

Théorie des Graphes Cours 3: Forêts et Arbres II / Modélisation

Pourquoi l apprentissage?

Une comparaison de méthodes de discrimination des masses de véhicules automobiles

Les algorithmes de base du graphisme

4.2 Unités d enseignement du M1

TP N 57. Déploiement et renouvellement d une constellation de satellites

Introduction au Data-Mining

Apprentissage Automatique

Mathématique et Automatique : de la boucle ouverte à la boucle fermée. Maïtine bergounioux Laboratoire MAPMO - UMR 6628 Université d'orléans

Pôle Référentiels Métier (Master Data Management)

25/12/2012

Data 2 Business : La démarche de valorisation de la Data pour améliorer la performance de ses clients

VIPE CNAM 6 mars Frank Meyer Orange Labs / IMT / UCE / CRM-DA / PROF

Resolution limit in community detection

Création intuitive des éléments d un paysage

(51) Int Cl.: H04L 29/06 ( ) G06F 21/55 ( )

Chapitre 2 : Systèmes radio mobiles et concepts cellulaires

L analyse d images regroupe plusieurs disciplines que l on classe en deux catégories :

Syllabus du cours de musique. Maternelle. enseigné par Joël Chiasson

ITIL Gestion de la capacité

Présentation BAI -CITC

Une application de méthodes inverses en astrophysique : l'analyse de l'histoire de la formation d'étoiles dans les galaxies

Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining.

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU

Manage Yourself. Rapport de planification. Projet de 4ème année informatique. Equipe :

Laboratoire 4 Développement d un système intelligent

Techniques d optimisation des requêtes dans les data warehouses

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Retour d expériences avec UML

OPÉRATIONS SUR LES FRACTIONS

5255 Av. Decelles, suite 2030 Montréal (Québec) H3T 2B1 T: F:

Brique BDL Gestion de Projet Logiciel

Méthode Agile de 3 ème génération J-P Vickoff

Guide d accréditation. Syllabus Niveau Fondation Testeur Agile

Enterprise Data Quality : fiabilisez vos processus E-Business Suite en améliorant la qualité des données

!-.!#- $'( 1&) &) (,' &*- %,!

Evry - M2 MIAGE Entrepôt de données

Grandes lignes ASTRÉE. Logiciels critiques. Outils de certification classiques. Inspection manuelle. Definition. Test

Introduction au datamining

Ordonnancement robuste et décision dans l'incertain

Critères de Choix d une Echelle de Qualité De Vie. Etudes cliniques dans l autisme. Introduction

Travailler avec les télécommunications

MCMC et approximations en champ moyen pour les modèles de Markov

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

Technologie Web. Conception de sites Web. Alexandre Pauchet. INSA Rouen - Département ASI. INSA - ASI TechnoWeb : Rappels UML 1/21

Outils logiciels pour la combinaison de vérification fonctionnelle et d évaluation de performances au sein de CADP

Programmation Linéaire - Cours 1

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION

Apprentissage artificiel pour l ordonnancement des tâches dans les grilles de calcul

1 Modélisation d une base de données pour une société de bourse

Agrégation des portefeuilles de contrats d assurance vie

Les algorithmes de fouille de données

Annuités. Administration Économique et Sociale. Mathématiques XA100M

Master MIDO 2ème année. Spécification et Conception en UML Maude Manouvrier

Cours de Recherche Opérationnelle IUT d Orsay. Nicolas M. THIÉRY. address: Nicolas.Thiery@u-psud.fr URL:

Le cycle de développement des produits à la Société GRICS : une nouvelle approche

TABLE DES MATIÈRES CHAPITRE I. Les quanta s invitent

De la mesure à l analyse des risques

Méthodes Agiles et gestion de projets

GOL502 Industries de services

L apprentissage automatique

Mesure agnostique de la qualité des images.

Annexe B : Exemples. Avis de vente aux enchères liées Système de plafonnement et d échange de droits d émission de gaz à effet de serre (GES)

Contributions à l expérimentation sur les systèmes distribués de grande taille

INF 232: Langages et Automates. Travaux Dirigés. Université Joseph Fourier, Université Grenoble 1 Licence Sciences et Technologies

Reconstruction de bâtiments en 3D à partir de nuages de points LIDAR

Quantification Scalaire et Prédictive

Maîtriser les mutations

Cours de Master Recherche

Un modèle conceptuel pour une présentation multimodale et contextuelle de l information

Le turbo met les gaz. Les turbines en équation

Soutien technique en informatique

Présentation. Au programme. Fonctionnement. A l issue de ce module vous devriez...

Une méthode de classification supervisée sans paramètre pour l apprentissage sur les grandes bases de données

Calculer avec Sage. Revision : 417 du 1 er juillet 2010

Programmation sous QT

Recherche locale pour un problème d optimisation de tournées de véhicules avec gestion des stocks

PROGRAMME DETAILLE. Parcours en première année en apprentissage. Travail personnel CC + ET réseaux

Les technologies du Big Data

IFT2255 : Génie logiciel

Apprentissage. Intelligence Artificielle NFP106 Année Plan. Apprentissage. Apprentissage

Les apports de l informatique. Aux autres disciplines

devenir chef d entreprise créateur de mode mode d emploi

Processus d Informatisation

Annexe 6. Notions d ordonnancement.

Format de l avis d efficience

Cahier des charges : gestion de projets agiles. Programmation d Algorithmes Distribués (PAD)

Apprentissage incrémental par sélection de données dans un flux pour une application de sécurité routière

17/07/2013. Décisionnel dans le Nuage. Laboratoire ERIC. Section 1. Équipe d Accueil Décisionnel dans le Nuage.

Contexte. Pour cela, elles doivent être très compliquées, c est-à-dire elles doivent être très différentes des fonctions simples,

OpenText Content Server v10 Cours (ex 223)

Les nombres entiers. Durée suggérée: 3 semaines

Cours Base de données relationnelles. M. Boughanem, IUP STRI

La Certification de la Sécurité des Automatismes de METEOR

Introduction. I Étude rapide du réseau - Apprentissage. II Application à la reconnaissance des notes.

Transcription:

1 / 20 Polytech Paris-Sud Département informatique Formation par Apprentissage, 3ème année Cours : Jérôme Azé Université Paris-Sud LRI 2009-2010

2 / 20 Outline 1 Présentation de A q Algorithme Défauts de la méthode

3 / 20 Présentation de A q Proposé par R. Michalski (1969) Problème : un ensemble d attributs discrèts 2 classes (POS, NEG) Objectif : Apprendre une description correcte et complète de la classe POS Correction et complétude Correction : Couvrir uniquement les exemples POS Complétude : Couvrir tous les exemples POS

4 / 20 Présentation de A q Applications Quelques applications Apprentissage de règles permettant de caractériser une classe par rapport à une autre Modéliser le comportement d utilisateurs Caractériser une maladie... Apprentissage incrémental

5 / 20 Ensemble d apprentissage Présentation de A q POS NEG Exemples A 1 A 2 A 3 Classe E 1 Y N R + E 2 X M R + E 3 Y N S + E 4 X N T + F 1 X M S F 2 Y M T F 3 Y N T F 4 Z N T F 5 Z N R F 6 X N S

6 / 20 Algorithme L algorithme Principe Diviser les exemples en deux sous ensembles (POS, NEG) Choisir un exemple dans POS (le noyau) Trouver un ensemble de règles générales caractérisant le noyau (l étoile) Choisir la meilleure règle dans l étoile Itérer s il reste des exemples non couverts dans POS

7 / 20 Ensemble d apprentissage Changement de représentation POS NEG Ex A 1 A 2 A 3 C E 1 Y N R + E 2 X M R + E 3 Y N S + E 4 X N T + F 1 X M S F 2 Y M T F 3 Y N T F 4 Z N T F 5 Z N R F 6 X N S N : M : X Y Z T E 4 F 3 F 4 S F 6 E 3 R E 1 F 5 X Y Z T F 2 S F 1 R E 2

8 / 20 Ensemble d apprentissage Changement de représentation N : M : X Y Z T E 4 F 3 F 4 S F 6 E 3 R E 1 F 5 X Y Z T F 2 S F 1 R E 2 A 1 X E 2 F 1 F 6 E 4 Y E 1 E 3 F 2 F 3 Z F 5 F 4 A 2 M N M N M N A 3 R S T

9 / 20 Ensemble d apprentissage Changement de représentation N : M : X Y Z T E 4 F 3 F 4 S F 6 E 3 R E 1 F 5 X Y Z T F 2 S F 1 R E 2 A 1 X E 2 F 1 F 6 E 4 Y E 1 E 3 F 2 F 3 Z F 5 F 4 A 2 M N M N M N A 3 R S T A 1 X + + Y + + Z A 2 M N M N M N A 3 R S T

10 / 20 Apprentissage Choix du noyau : E 1 Génération de l étoile de E 1 tel que F 1 ne soit pas couvert Puis étoile de E 1 mais pas F 2... Fonction qui reconnaît E 1 et qui rejette F 1 G(E 1 /F 1 ) = (A 1 X) (A 2 M) (A 3 S) A 1 X E 2 F 1 F 6 E 4 Y E 1 E 3 F 2 F 3 Z F 5 F 4 A 2 M N M N M N A 3 R S T

11 / 20 Apprentissage... Fonction qui reconnaît E 1 et qui rejette F i, 1 i 6 G(E 1 /F 1 ) = (A 1 X) (A 2 M) (A 3 S) G(E 1 /F 2 ) = (A 2 M) (A 3 T) G(E 1 /F 3 ) = (A 3 T) G(E 1 /F 4 ) = (A 1 Z) (A 3 T) G(E 1 /F 5 ) = (A 1 Z) G(E 1 /F 6 ) = (A 1 X) (A 3 S) Étoile de E 1 Étoile de E 1 = 1 i 6 G(E 1 /F i )

12 / 20 Apprentissage... Simplification de l étoile Conservez les règles les plus spécifiques G(E 1 /F 3 ) = (A 3 T) plus spécifique que G(E 1 /F 2 ) = (A 2 M) (A 3 T) Étoile de E 1 (A 3 T) (A 1 Z) ((A 1 X) (A 3 S)) Après réécriture : ((A 1 = Y) (A 3 T)) ((A 1 Z) (A 3 = R))

13 / 20 Apprentissage... Étoile de E 1 R 1 : (A 1 = Y) (A 3 T) R 2 : (A 1 Z) (A 3 = R) A 1 X E 2 F 1 F 6 E 4 Y E 1 E 3 F 2 F 3 Z F 5 F 4 A 2 M N M N M N A 3 R S T

14 / 20 Apprentissage... Critères de sélection des règles dans l étoile Maximiser le nombre d éléments couverts par la règle retenue Minimiser le nombre d attributs de la règle retenue Maximiser la capacité à généraliser de la règle retenue Utilisation d un ensemble de validation...

15 / 20 Apprentissage... Choix d une règle dans l étoile de E 1 Choix de R 2 : (A 1 Z) (A 3 = R) Exemples POS couverts : E 1 et E 2 Exemples POS non couverts : E 3 et E 4 A 1 X E 2 F 1 F 6 E 4 Y E 1 E 3 F 2 F 3 Z F 5 F 4 A 2 M N M N M N A 3 R S T

16 / 20 Apprentissage... Itération de l algorithme : Étoile de E 3 G(E 3 /F 1 ) = (A 1 X) (A 2 M) G(E 3 /F 2 ) = (A 2 M) (A 3 T) G(E 3 /F 3 ) = (A 3 T) G(E 3 /F 4 ) = (A 1 X) (A 3 T) G(E 3 /F 5 ) = (A 1 Z) (A 3 R) G(E 3 /F 6 ) = (A 1 X) Après simplification ((A 1 = Y) (A 3 T)) ((A 1 X) (A 3 = S))

17 / 20 Apprentissage... Étoile de E 3 : (A 1 X) (A 3 = S) Critère retenu : capacité à généraliser Exemples POS couverts : E 1, E 2 et E 3 A 1 X E 2 F 1 F 6 E 4 Y E 1 E 3 F 2 F 3 Z F 5 F 4 A 2 M N M N M N A 3 R S T

18 / 20 Apprentissage... Itération de l algorithme L exemple E 4 n est pas couvert Étoile de E 4 : (A 1 = X) (A 3 S) A 1 X E 2 F 1 F 6 E 4 Y E 1 E 3 F 2 F 3 Z F 5 F 4 A 2 M N M N M N A 3 R S T

19 / 20 Apprentissage... Résultat final (A 1 Z) (A 3 = R) (A 1 X) (A 3 = S) (A 1 = X) (A 3 S) A 1 X E 2 F 1 F 6 E 4 Y E 1 E 3 F 2 F 3 Z F 5 F 4 A 2 M N M N M N A 3 R S T

20 / 20 Défauts de la méthode Défauts de A q Défauts Sensibilité au bruit dans les classes Sensibilité liée à l imprécision du contexte Solution proposée par R. Michalski (1990) Approche à deux niveaux (two-tiered approach)