(2ÈME ÉDITION) Antoine Cornuéjols et Laurent Miclet. Editions Eyrolles, 2009 Version du 9 décembre 2009

Documents pareils
4.2 Unités d enseignement du M1

Apprentissage Automatique

Modélisation aléatoire en fiabilité des logiciels

chargement d amplitude variable à partir de mesures Application à l approche fiabiliste de la tolérance aux dommages Modélisation stochastique d un d

Liste des notes techniques... xxi Liste des encadrés... xxiii Préface à l édition internationale... xxv Préface à l édition francophone...

Conception des systèmes répartis

Chapitre 6 Apprentissage des réseaux de neurones et régularisation

ITIL. optimal. pour un service informatique. 2 e édition C H R I S T I A N D U M O N T. Préface de Patrick Abad

Master IAD Module PS. Reconnaissance de la parole (suite) Alignement temporel et Programmation dynamique. Gaël RICHARD Février 2008

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

Echantillonnage Non uniforme

APPORT DES RESEAUX BAYESIENS DANS LA PREVENTION DE LA DELINQUANCE

TABLE DES MATIÈRES. Avant-propos... Remerciements... CHAPITRE 1 LA COMPTABILITÉ DE MANAGEMENT... 1

L'intelligence d'affaires: la statistique dans nos vies de consommateurs

overmind La solution précède le problème 2008 Overmind - All rights reserved

Algèbre 40 Analyse Stat. 1 - IES : Probabilités discrètes et calcul intégral 29,5 6 Stat. 2 - IES : Probabilités générales 54 8 UE1-02 M-E-IS

Sommaire Chapitre 1 Chapitre 2 Chapitre 3 Chapitre 4 Chapitre 5 Chapitre 6 Chapitre 7. ARC EPS Eco-microbiologie Prévisionnelle Statistique

Groupe Eyrolles, 2004, ISBN :

Les apports de l informatique. Aux autres disciplines

Eléments de spécification des systèmes temps réel Pierre-Yves Duval (cppm)

Déploiement et migration Windows 8 Méthodologie Compatibilité des applications ADK MDT 2012 ConfigMgr 2012 SCCM 2012 Windows Intune MDOP

INGENIERIE DES SYSTEMES INFORMATIQUES - PARCOURS : MOBILITE ET CLOUD COMPUTING

Limitations of the Playstation 3 for High Performance Cluster Computing

Groupe Eyrolles, 2006, ISBN :

Raisonnement probabiliste

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

MASTER SIS PRO : logique et sécurité DÉTECTION D INTRUSIONS. Odile PAPINI, LSIS. Université de Toulon et du Var. papini@univ-tln.

MABioVis. Bio-informatique et la

Une comparaison de méthodes de discrimination des masses de véhicules automobiles

5. Apprentissage pour le filtrage collaboratif

L isomorphisme entre les tours de Lubin-Tate et de Drinfeld et applications cohomologiques par Laurent Fargues

TABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie

Modélisation du comportement habituel de la personne en smarthome

Introduction au Data-Mining

NON-LINEARITE ET RESEAUX NEURONAUX

OPTIMISATION À UNE VARIABLE

Quantification des Risques

CarrotAge, un logiciel pour la fouille de données agricoles

Identification de nouveaux membres dans des familles d'interleukines

Chaînes de Markov au lycée

Programme détaillé BTS INFORMATIQUE DE GESTION DIPLÔME D ETAT. Objectifs de la formation. Les métiers. Durée de la formation

Dan Istrate. Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier

INTRODUCTION A L ELECTRONIQUE NUMERIQUE ECHANTILLONNAGE ET QUANTIFICATION I. ARCHITECTURE DE L ELECRONIQUE NUMERIQUE

Intelligence Artificielle et Robotique

Relever les défis des véhicules autonomes

Commande Prédictive des. Convertisseurs Statiques

UNIVERSITE DES ANTILLES et DE LA GUYANE Campus de Fouillole BP Pointe-à-Pitre Cedex CONTRAT LE MASTER NOM DU DOMAINE STS

L E Ç O N. Marches aléatoires. Niveau : Terminale S Prérequis : aucun

Semestre 1. Objectifs Approfondissement de l environnement Java et de son interface de programmation d applications : réseaux, et processus.

ECTS INFORMATIQUE ET RESEAUX POUR L INDUSTRIE ET LES SERVICES TECHNIQUES

PROBABILITES ET STATISTIQUE I&II

L utilisation d un réseau de neurones pour optimiser la gestion d un firewall

Grandes lignes ASTRÉE. Logiciels critiques. Outils de certification classiques. Inspection manuelle. Definition. Test

Soutenance de stage Laboratoire des Signaux et Systèmes

Workflow/DataWarehouse/DataMining LORIA - Université d automne Informatique décisionnelle - L. Mirtain 1

Introduction au datamining

Masses de données. 1. Introduction 2. Problématiques 3. Socle de formation (non présenté) 4. Liens avec Formation INSA

TABLE DES MATIÈRES 1. DÉMARRER ISIS 2 2. SAISIE D UN SCHÉMA 3 & ' " ( ) '*+ ", ##) # " -. /0 " 1 2 " 3. SIMULATION 7 " - 4.

Table des matières. Partie I CobiT et la gouvernance TI

Intégration des paramètres de maintenance dans la conception du Health Monitoring. Saintis Laurent Laboratoire LASQUO (futur LARIS)

un module de simulation des évolutions urbaines Présentation

Programmes des classes préparatoires aux Grandes Ecoles

PEUT- ON SE PASSER DE LA NOTION DE FINALITÉ?

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

Évaluation et implémentation des langages

TABLE DES MATIÈRES. Les auteurs. Préface par Walter Deffaa. Préface par André Kilesse

T. Gasc 1,2,3, F. De Vuyst 1, R. Motte 3, M. Peybernes 4, R. Poncet 5

Sommaire Préface...XV Introduction générale... XVII Introduction à la 2e édition... XXI Définir le tableau de bord...1

BSM 9.0 ESSENTIALS. Nouveaux utilisateurs de Business Service Management (BSM) 9.0, parmi lesquels :

Web Science. Master 1 IFI. Andrea G. B. Tettamanzi. Université de Nice Sophia Antipolis Département Informatique andrea.tettamanzi@unice.

Groupe Eyrolles, 2005,

Réduction progressive de la consommation de HFC dans l UE Évaluation des implications pour le secteur RAC RAPPORT FINAL

Introduction. I Étude rapide du réseau - Apprentissage. II Application à la reconnaissance des notes.

I Stabilité, Commandabilité et Observabilité Introduction Un exemple emprunté à la robotique Le plan Problème...

«Cours Statistique et logiciel R»

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

Introduction au Data-Mining

La programmation linéaire : une introduction. Qu est-ce qu un programme linéaire? Terminologie. Écriture mathématique

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

Logique binaire. Aujourd'hui, l'algèbre de Boole trouve de nombreuses applications en informatique et dans la conception des circuits électroniques.

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

TABLE DES MATIERES. C Exercices complémentaires 42

Résumé des communications des Intervenants

Table des matières PARTIE I : LES FONDAMENTAUX DU MARKETING DIGITAL

<Insert Picture Here>ApExposé. Cédric MYLLE 05 Février Exposé Système et Réseaux : ApEx, Application Express d Oracle

Renforcement des trois compétences : compréhension orale, expression orale et expression écrite à partir de documents et vidéos.

Contributions à l expérimentation sur les systèmes distribués de grande taille

Health Monitoring pour la Maintenance Prévisionnelle, Modélisation de la Dégradation

Le programme d examens du Bureau canadien des conditions d admission en génie d Ingénieurs Canada englobe 19 domaines du génie.

Utilisation des tableaux sémantiques dans les logiques de description

TRACER LE GRAPHE D'UNE FONCTION

Sommaire. Introduction. I. Notions de routage a) Technologies actuelles b) Avantages et désavantages

Estimation des charges. «Le travail se dilate jusqu à remplir le temps disponible»

PROJET D'INFORMATIQUE I IFT 592 PROJET EN SYSTÈMES INTELLIGENTS IFT-593 POKUS. Système d aide au poker. Travail présenté à M.


d. Tendances du marché...22 e. Une vision européenne...22 III. La distribution en France... 23

Le théorème de Perron-Frobenius, les chaines de Markov et un célèbre moteur de recherche

Projet de Traitement du Signal Segmentation d images SAR

K. Ammar, F. Bachoc, JM. Martinez. Séminaire ARISTOTE - 23 octobre Palaiseau

PHP. Performances. Audit et optimisation LAMP. Julien Pauli. Cyril Pierre de Geyer. Guillaume Plessis. Préface d Armel Fauveau

Transcription:

i L APPRENTISSAGE ARTIFICIEL CONCEPTS ET ALGORITHMES. (2ÈME ÉDITION) Antoine Cornuéjols et Laurent Miclet Editions Eyrolles, 2009 Version du 9 décembre 2009

ii

Table des matières Table des matières iii Avant-propos ix Quelques applications de l apprentissage artificiel...................... x Quelques définitions de base................................. x Deux champs industriels de l apprentissage artificiels : la reconnaissance des formes et la fouille de données.................................. xi Les caractéristiques de l apprentissage artificiel...................... xiii Trois exemples d apprentissage............................... xiv Organisation et plan de l ouvrage.............................. xvii Guide de lecture....................................... xix Notations xxv I Les Fondements de l Apprentissage 1 1 De l apprentissage naturel à l apprentissage artificiel 3 1 L apprentissage artificiel................................ 4 2 Deux exemples : apprendre à jouer, apprendre à lire................ 6 3 Deux approches : la cybernétique et les sciences cognitives............. 10 4 Les concepts de base de l apprentissage........................ 14 5 L induction comme un jeu entre espaces....................... 22 6 Retour sur l organisation de l ouvrage........................ 29 2 Première approche théorique de l induction 37 1 Poser un problème d apprentissage.......................... 40 2 Approches bayésiennes et approche directe pour décider.............. 46 3 Le critère inductif.................................... 49 4 Analyse du principe de Minimisation du Risque Empirique............. 60 5 Le lien entre le passé et le futur et le no-free-lunch theorem............ 73 6 Notes historiques et bibliographiques......................... 78

iv Table des matières 3 L environnement méthodologique de l apprentissage 81 1 L espace des données d apprentissage......................... 85 2 L espace des hypothèses d apprentissage....................... 101 3 Les protocoles d apprentissage............................. 112 4 L évaluation de l apprentissage............................ 113 5 La comparaison des méthodes d apprentissage.................... 124 6 Autres problèmes pratiques.............................. 129 II Apprentissage par Exploration 135 4 Induction et relation d ordre : l espace des versions 137 1 Les concepts de base.................................. 140 2 La structuration de l espace des hypothèses..................... 144 3 La construction de l espace des versions....................... 152 4 La représentation des connaissances par un treillis de Galois............ 156 5 La programmation logique inductive 163 1 La programmation logique inductive : le cadre général............... 167 2 La logique des prédicats et les programmes logiques : terminologie....................................... 173 3 La structuration de l espace des hypothèses en logique des prédicats....... 177 4 L exploration de l espace des hypothèses....................... 184 5 Deux exemples de systèmes de PLI.......................... 188 6 La probabilisation de la PLI.............................. 192 7 Les domaines d application de la PLI......................... 193 8 Les chantiers de la PLI................................. 195 6 Reformulation, transfert de connaissances et apprentissage par analogie 201 1 L apprentissage en présence de théorie........................ 203 2 L apprentissage par examen de preuve (EBL).................... 204 3 Abstraction et reformulation des connaissances................... 211 4 Changement de repère, raisonnement par analogie et RaPC............ 213 5 L apprentissage par proportion analogique...................... 216 6 Bilan........................................... 220 7 L inférence grammaticale 223 1 Définitions et notations................................ 229 2 Les protocoles de l inférence : quelques résultats théoriques............ 237 3 L espace de recherche de l inférence régulière.................... 243 4 L inférence régulière sans échantillon négatif.................... 245 5 L inférence régulière sous contrôle d un échantillon négatif............. 250 6 L inférence de grammaires algébriques......................... 254 7 L inférence d automates probabilistes......................... 260 8 Quelques approches complémentaires......................... 263

Table des matières v 8 Apprentissage par évolution simulée 267 1 Trois espaces au lieu de deux............................. 269 2 Un modèle formel simplifié de l évolution....................... 272 3 Les algorithmes génétiques............................... 273 4 Les stratégies d évolution............................... 285 5 La programmation génétique............................. 285 6 La coévolution..................................... 295 III Apprentissage par Optimisation 301 9 L apprentissage de modèles linéaires 303 1 Introduction....................................... 304 2 Régression linéaire................................... 305 3 Séparatrices linéaires.................................. 310 4 Modèles linéaires par morceaux et combinaisons de modèles locaux........ 321 5 La recherche des facteurs pertinents......................... 324 10 L apprentissage de réseaux connexionnistes 329 1 Les différents éléments d un réseau connexionniste................. 332 2 L architecture multicouche............................... 334 3 L algorithme d apprentissage............................. 339 4 Quelques résultats théoriques sur les réseaux connexionnistes........... 348 5 Comment choisir l architecture d un réseau?..................... 349 6 Les réseaux à architecture profonde.......................... 349 7 Réseaux et régime dynamique : le «Reservoir Computing»............ 351 11 L apprentissage de réseaux bayésiens 357 1 Les modèles graphiques................................ 359 2 Les réseaux d inférence bayésiens........................... 361 3 Les inférences dans les réseaux bayésiens....................... 369 4 L apprentissage des réseaux bayésiens......................... 373 5 L inférence de relations causales............................ 382 6 Applications....................................... 383 7 Quelques logiciels.................................... 384 12 L apprentissage de modèles de Markov cachés 387 1 Les modèles de Markov observables.......................... 390 2 Les modèles de Markov cachés (Hmm)........................ 391 3 Les Hmm comme règles de classification de séquences................ 396 4 L évaluation de la probabilité d observation..................... 397 5 Le calcul du chemin optimal : l algorithme de Viterbi................ 399 6 L apprentissage..................................... 402 7 Approfondissements.................................. 407 8 Applications....................................... 408 13 Apprentissage par inférence d arbres 411 1 Les arbres de décision................................. 413 2 Les arbres de régression................................ 427

vi Table des matières IV Apprentissage par approximation et interpolation 431 14 Méthodes à noyaux 433 1 Trois voies vers les méthodes à noyau......................... 435 2 Philosophie des méthodes à noyaux.......................... 445 3 Les Séparatrices à Vaste Marge (SVM)........................ 447 4 Autres types d induction avec fonctions noyau.................... 457 5 Ingénierie des fonctions noyau............................. 460 6 Les méthodes à noyaux en pratique.......................... 479 7 Bilan et perspectives.................................. 485 15 L apprentissage bayésien et son approximation 489 1 L apprentissage bayésien................................ 492 2 Les méthodes paramétriques.............................. 501 3 Les méthodes non paramétriques........................... 510 4 Les méthodes semi paramétriques........................... 525 16 L apprentissage de réflexes par renforcement 531 1 Description du problème................................ 534 2 Si tout est connu : l utilité de la fonction d utilité.................. 541 3 L apprentissage des fonctions d utilité quand l environnement est connu..... 543 4 Sans modèle du monde : la méthode de Monte-Carlo................ 547 5 La méthode des différences temporelles........................ 548 6 La généralisation dans l apprentissage par renforcement.............. 552 7 Contrôle optimal par recherche arborescente et algorithme UCT.......... 558 8 Le cas des environnements partiellement observables................ 561 9 Exemples d application................................. 562 10 Bilan et perspectives.................................. 565 V Au delà de l apprentissage supervisé 569 17 Apprentissage de combinaisons d experts 571 1 Principes des méthodes par combinaison....................... 572 2 Le vote de plusieurs classificateurs.......................... 576 3 Les codes correcteurs de classes............................ 577 4 Le boosting d un algorithme d apprentissage..................... 582 5 Le bagging........................................ 590 6 L apprentissage en cascade (cascading)........................ 591 18 La classification non supervisée et la fouille de données 593 1 Introduction....................................... 596 2 Les méthodes de classification fondées sur les distances............... 597 3 Les méthodes de classification par des modèles probabilistes............ 608 4 Méthodes spectrales de catégorisation........................ 610 5 La classification de données symboliques....................... 611 6 La fouille de données.................................. 614 7 Les analyses en composantes.............................. 624

Table des matières vii 19 L apprentissage semi-supervisé 633 1 Présentation....................................... 634 2 Les modèles génératifs : apprentissage dans l espace joint X Y.......... 638 3 L auto-apprentissage.................................. 642 4 Le co-apprentissage................................... 642 5 L utilisation d hypothèses fondamentales sur les données.............. 644 6 Quelques directions pour l apprentissage semi-supervisé............... 654 7 Conclusion........................................ 655 20 Vers de nouvelles tâches et de nouvelles questions 657 1 Apprentissage actif................................... 659 2 Apprentissages en-ligne, incrémental et par transferts................ 667 3 Apprentissage à partir de flux de données...................... 675 4 Apprentissage de sorties structurées.......................... 680 5 Apprentissage pour le filtrage collaboratif...................... 684 21 Analyse de l induction : approfondissements et ouvertures 693 1 Généralisation de l analyse du principe MRE.................... 694 2 Principes inductifs contrôlant l espace des hypothèses................ 700 3 Prise en compte de l algorithme d apprentissage dans la théorie.......... 713 4 Autres types d analyses................................ 718 VI Annexes techniques 725 22 Annexes techniques 727 1 Exemples de fonctions de perte en induction..................... 727 2 Le calcul de l intervalle de confiance de l estimation de la probabilité d une règle de classification..................................... 730 3 Estimation d une densité de probabilité en un point................. 731 4 L estimation des paramètres d une distribution gaussienne.............. 732 5 Pourquoi et comment la règle du PPV converge-t elle?............... 733 6 Pourquoi la règle de décision bayésienne est-elle optimale?............. 734 7 Apprentissage par Estimation-Maximisation...................... 734 8 Optimisation par descente de gradient........................ 738 9 La rétropropagation du gradient de l erreur..................... 742 10 L analyse de l induction de Vapnik.......................... 745 11 L induction par compression d information...................... 756 Bibliographie 763 Index 795