LOG770 Systèmes Intelligents

Documents pareils
Introduction au Data-Mining

Introduction au Data-Mining

Apprentissage Automatique

Introduction au datamining

Améliorer les performances du site par l'utilisation de techniques de Web Mining

Pourquoi l apprentissage?

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

Les défis statistiques du Big Data

Laboratoire 4 Développement d un système intelligent

Les datas = le fuel du 21ième sicècle

Data Mining. Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.

Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining.

Cette Leçon va remplir ces attentes spécifiques du curriculum :

Analyse de grandes bases de données en santé

Ne cherchez plus, soyez informés! Robert van Kommer

" # $ % % & ' ( ) * +,! '()*+ *, + ' +' + ' ' /0 / * 0 4 * 0 6! "##$ % &!

Cybermarché et analyse comportementale

données en connaissance et en actions?

Agenda de la présentation

DocForum 18 Juin Réussites d un projet Big Data Les incontournables

Tammy: Something exceptional happened today. I met somebody legendary. Tex: Qui as-tu rencontré? Tex: Who did you meet?

Big Data -Comment exploiter les données et les transformer en prise de décisions?

Les enjeux du Big Data Innovation et opportunités de l'internet industriel. Datasio 2013

ANGULAR JS AVEC GDE GOOGLE

La classification automatique de données quantitatives

Catherine Chochoy. Alain Maneville. I/T Specialist, IBM Information Management on System z, Software Group

Analyse de la vidéo. Chapitre La modélisation pour le suivi d objet. 10 mars Chapitre La modélisation d objet 1 / 57

Lesson Plan Physical Descriptions. belle vieille grande petite grosse laide mignonne jolie. beau vieux grand petit gros laid mignon

Plan 1/9/2013. Génération et exploitation de données. CEP et applications. Flux de données et notifications. Traitement des flux Implémentation

Le passé composé. C'est le passé! Tout ça c'est du passé! That's the past! All that's in the past!

LOGO. Module «Big Data» Extraction de Connaissances à partir de Données. Claudia MARINICA MCF, ETIS UCP/ENSEA/CNRS

Méthodes d apprentissage statistique «Machine Learning»

Spécificités, Applications et Outils

Un code-barre sur la tête?

Accélérer l agilité de votre site de e-commerce. Cas client

Le data mining et l assurance Mai Charles Dugas Président Marianne Lalonde Directrice, développement des affaires

Exemple PLS avec SAS

Pratiques induites par les réunions à distance : discours, identités et organisation des actions

Présentation du sujet de thèse Schémas temporels hybrides fondés sur les SVMs pour l analyse du comportement du conducteur

Voici les textes des fichiers associés au bulletin CA. Notez que vous retrouverez dans ces textes les nouvelles de toutes les régions.

Modélisation du comportement habituel de la personne en smarthome

Les BRMS Business Rules Management System. Groupe GENITECH

Mesure agnostique de la qualité des images.

Dan Istrate. Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier

Hervé Couturier EVP, SAP Technology Development

1. Logiciel ERP pour les PME d ici Technologies Microsoft Modules disponibles Finance Analyses & BI

BI = Business Intelligence Master Data-ScienceCours 3 - Data

EN UNE PAGE PLAN STRATÉGIQUE

TRAVAUX DE RECHERCHE DANS LE

Introduction à la B.I. Avec SQL Server 2008

Formulaire d inscription (form also available in English) Mission commerciale en Floride. Coordonnées

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

L'intelligence d'affaires: la statistique dans nos vies de consommateurs

MASTER SIS PRO : logique et sécurité DÉTECTION D INTRUSIONS. Odile PAPINI, LSIS. Université de Toulon et du Var. papini@univ-tln.

Application Form/ Formulaire de demande

INTRODUCTION AU DATA MINING

Laboratoire d Automatique et Productique Université de Batna, Algérie

Instructions Mozilla Thunderbird Page 1

Le Futur de la Visualisation d Information. Jean-Daniel Fekete Projet in situ INRIA Futurs

TP11 - Administration/Tuning

Dans une agence de location immobilière...

Workflow/DataWarehouse/DataMining LORIA - Université d automne Informatique décisionnelle - L. Mirtain 1

AICp. Vincent Vandewalle. To cite this version: HAL Id: inria

Cours 1 : Qu est-ce que la programmation?

Gestion de la relation Client (CRM)

Ingénierie et gestion des connaissances

Introduction à l Informatique Décisionnelle - Business Intelligence (7)

Apprentissage Statistique

Surveillance et maintenance prédictive : évaluation de la latence de fautes. Zineb SIMEU-ABAZI Univ. Joseph Fourier, LAG)

Simplicity is the ultimate sophistication. Leonardo Da Vinci

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Informatique et sciences du numérique

MODERN LANGUAGES DEPARTMENT

Frequently Asked Questions

Décision Markovienne appliquée à un jeu de stop ou encore : Pickomino (Heckmeck Am Bratwurmeck)

Économétrie, causalité et analyse des politiques

Grégoire de Lassence. Copyright 2006, SAS Institute Inc. All rights reserved.

6605 MFP 3615 MFP. Sommaire : Paramètres généraux. Réglages de l Horloge et des Bacs. Paramètre Copie (par défaut) Paramètres Réseaux (IP)

La création de vêtements, éléments de génétiques, et de maquillage.

recommandation Domaine : Informatique, Intelligence Artificielle, Modélisation de préférences

Une dérivation du paradigme de réécriture de multiensembles pour l'architecture de processeur graphique GPU

FAQ Foire aux questions. Sur cette page, vous trouverez les réponses à toutes vos questions relatives aux études de la musique en Europe.

L apprentissage automatique

Filière Fouille de Données et Décisionnel FDD (Data Mining) Pierre Morizet-Mahoudeaux

Les Entrepôts de Données

IDENTITÉ DE L ÉTUDIANT / APPLICANT INFORMATION

CLIM/GTP/27/8 ANNEX III/ANNEXE III. Category 1 New indications/ 1 re catégorie Nouvelles indications

AUTUMN/WINTER PARIS COLLECTION

Qualité et ERP CLOUD & SECURITY (HACKING) Alireza MOKHTARI. 9/12/2014 Cloud & Security

Le nouveau visage de la Dataviz dans MicroStrategy 10

La Data Visualisation dans les organisations. Par Claude-Henri Meledo

Le modèle standard, SPE (1/8)

ENOVIA 3DLive. IBM PLM Solutions 1 er Octobre Philippe Georgelin Sébastien Veret

Projet de Master en Informatique: Web WriteIt!

Urbanisation des SI-NFE107

Reconnaissance de visages 2.5D par fusion des indices de texture et de profondeur ICI 12/12/12

Objectif et contexte business : piliers du traitement efficace des données -l exemple de RANK- Khalid MEHL Jean-François WASSONG 10 mars 2015

Big Data et Graphes : Quelques pistes de recherche

TROUVER UN EMPLOI EN AUSTRALIE

Transcription:

1 Calendrier de la session Été 2013 LOG770 Systèmes Intelligents INTRODUCTION TO Machine Learning Chargé de cours : Patrick Cardinal Local: A- 3466 Téléphone: (514) 396-8800 #7810 Courriel: cc- pcardinal@etsmtl.ca Responsable de cours : Pierre Dumouchel, ing., Ph.D., Local: A- 3498 Téléphone: (514) 396-8996 Courriel: pierre.dumouchel@etsmtl.ca Légende: Cours #1 à 13 Labo #1 à 12 Examens finaux Date à retenir: Examen Intra: 12 juin 2013 Abandon: 8 juillet 2013 Cours: Mercredi 13h30 17h0; 13 périodes au total Labo : Vendredi 8h45-10h45; 12 périodes au total ETHEM ALPAYDIN The MIT Press, 2004 alpaydin@boun.edu.tr http://www.cmpe.boun.edu.tr/~ethem/i2ml 2

2 Apprentissage naturel vs apprentissage artificiel Pourquoi apprendre? CHAPITRE 1: Introduction Dark star movie. [Doolittle convinces the bomb not to explode] Doolittle: Hello, Bomb? Are you with me? Bomb #20: Of course. Doolittle: Are you willing to entertain a few concepts? Bomb #20: I am always receptive to suggestions. Doolittle: Fine. Think about this then. How do you know you exist? Bomb #20: Well, of course I exist. Doolittle: But how do you know you exist? Bomb #20: It is intuitively obvious. Doolittle: Intuition is no proof. What concrete evidence do you have that you exist? Bomb #20: Hmmmm... well... I think, therefore I am. Doolittle: That's good. That's very good. But how do you know that anything else exists? Bomb #20: My sensory apparatus reveals it to me. This is fun. Les machines d apprentissage sont des programmes d ordinateurs qui performent une tâche suite à un apprentissage à partir de données et d expériences du passé. Ce n est pas utile d apprendre à faire des chèques de paie. L apprentissage est utile quand: L expertise humaine n existe pas (naviguer sur Mars), L humain n arrive pas à expliquer comment il arrive à accomplir une tâche (reconnaissance automatique de la parole) Large quantité de données à traiter. La solution change en court de route (routage sur un réseau Internet) La solution doit s adapter à son utilisateur (biométrie, filtrage: e- mail). 5 6

3 Qu assumons-nous lorsque nous parlons d apprentissage Apprentissage de modèles génériques à partir de données d exemples particuliers (apprentissage par des exemples). Les données sont de faibles coûts et abondantes (data warehouses, data marts); les connaissances coûtent chers et sont rares. Exemple dans le milieu du commerce: les transactions commerciales versus les comportements des consommateurs: People who bought Da Vinci Code also bought The Five People You Meet in Heaven (www.amazon.com) Développer un modèle qui a une bonne et utile approximation des données. 7 Forage de données (Data Mining) Vente: Analyse du panier du marché, Customer relationship management (CRM) Finance: analyse du crédit, détection de fraudes Fabrication manufacturière: Optimisation, détection de problèmes Médecine: diagnostic médical Télécommunications: Qualité de service, optimisation Bioinformatique: Motifs, alignement Forage de l Internet (Web mining): Engins de recherche... 8 Qu est-ce que l apprentissange machine? Optimiser un critère de performance à partir de données ou d expériences passées. Minimiser Probabilité des sorties erronées produites par le système. Moyenne des coûts produits par des décisions erronées Rôle des statistiques: inférence à partir de données Rôle de la science informatique : algorithmes efficients pour : Solutionner le problème d optimisation Représenter et évaluer le modèle d inférence 9

4 un système d apprentissage et de reconnaissance des formes Exemple d un système d apprentissage Applications Codage Représentation d une forme La modélisation Choisir un modèle approprié pour modéliser les échantillons La mesure de performance Trouver une bonne métrique pour mesurer les erreurs produites par ce système. Parole / Ecriture Données : (entrée : signal + sortie : transcription) But : reconnaître signal mesure : nombre de mots correctement reconnus Association Apprentissage supervisé Classification Régression Apprentissage non-supervisé: Données non étiqutées Apprentissage semi-supervisé Apprentissage par renforcement 10 11 12

5 Apprentissage par association Apprentissage par association Classification Type Cheveux Tenue Analyse du panier du marché: P (Y X ) est la probabilité qu une personne qui achète X achète aussi Y où X et Y sont des produits ou services. Exemples: P ( chips bière ) = 0.7 P ( lait bière ) = 0.01 Problème: Un vendeur d automobile a étudié ses 20 dernières ventes d auto. Que valent les probabilités suivantes: Pr( Mazda 3 blonde) Pr( Mazda 3 blonde, sport) Pr( MX-5 blonde) Madza 3 châtaine jeans Madza 3 brune habit Madza 3 blonde sport Madza 3 noire jeans Madza 5 rousse habit Madza 5 grise sport Madza 5 châtaine jeans Madza 5 brune habit Madza 5 blonde sport Madza 6 rousse jeans Madza 6 blonde habit Madza 6 noire sport Madza 6 noire jeans MX-5 blonde habit MX-5 blonde sport Tribute gris jeans Tribute noire habit Tribute blanc sport Exemple: obtention de crédit Différenciation entre les clients à bas-risque (lowrisk) et à haut-risque (high-risk) en fonction de leurs revenus (income) and leurs épargnes (savings) Discriminant: SI income > 1 ET savings > 2 ALORS low-risk SINON high-risk RX-8 rousse jeans 13 RX-8 noire habit 14 15

6 Classification: Applications Régression Applications de la régression Sous-problèmes de la Reconnaissance de formes Reconnaissance des visages: Pose, luminance, occlusion (verres, barbe), maquillage, coiffure Reconnaissance de l écrit: différentes calligraphies. Reconnaissance de la parole: dépendance temporelle. Utilisation d un dictionnaire de prononciation, de modèles de langage. Fusion de données: Combiner plusieurs modalités i.e. visuelle (lecture labiale) et données acoustiques Diagnostic médicaux: du symptôme jusqu à la maladie... Exemple: prix d une automobile usagée x : attributs d une auto y : prix y = g (x ) g ( ) modèle, paramètres y = wx+w 0 Navigation d une automobile de façon automatique: angle du volant de conduite (CMU NavLab) Cinématique d un bras de robot (x,y) 1 2 1 = g 1 (x,y) 2 = g 2 (x,y) Réponse de la surface de conception 16 17 18

7 Apprentissage supervisé: cas Apprentissage non supervisé Apprentissage non supervisé Prédiction de situations futures: Utilisation d une règle de prédiction de la sortie pour des données d entrée futures Extraction de connaissances: La règle est facile à comprendre Compression: La règle est plus facile à comprendre que les données brutes Détection de valeurs aberrantes: Détection d exceptions qui ne sont expliquées par les règles normales c.à.d fraude Apprendre ce qui se passe normalement Sans sortie Groupage: formation de groupe d éléments similaires Exemples d applications Segmentation des clients dans un CRM Compression de l image : quantification de la couleur Bioinformatique: apprentissage de motifs Exemples d applications Segmentation des clients dans un CRM Essaie de regrouper des clients ayant un profil similaire afin de développer une stratégie de vente Essaie de trouver les clients hors de l ordinaire (valeur aberrante) afin de développer une stratégie spécifique à ce type 19 20 21

8 Apprentissage non supervisé Apprentissage par renforcement Reconnaissance de faces Exemples d applications Bioinformatique: apprentissage de motifs DNA: séquences de bases, A, G, C, T Un des problèmes en biologie moléculaire est d aligner une séquences de bases avec une autre séquences. C est un problème complexe car les séquences peuvent être longues et qu il peut y avoir des substitutions, des insertions et des élisions. Pour quelques applications, la sortie du système est une séquence d actions. Apprendre une politique: une séquence de sorties. Une sortie particulière n est pas intéressante, c est la séquence qui importe. Exemples d application; Problème d assignation de crédit Jeux Robot navigant dans un labyrinthe Agents multiples, observation partielle, etc. Ensemble de données d entraînement Ensemble de données de test AT&T Laboratories, Cambridge UK http://www.uk.research.att.com/facedatabase.html 22 23 24

9 Reconnaissance de visages Suivi de la bouche Suivi de la bouche 25 26 27

10 Suivi de piéton et d automobile Requête audio de mots Requête audio-visuelle 28 29 30

11 Inspection industrielle Reconnaissance de la voix Post-synchronisation 31 32 33

12 Lecture labiale Ressources: Banque de données Ressources: Journaux scientifiques UCI Repository: http://www.ics.uci.edu/~mlearn/mlrepository.html UCI KDD Archive: http://kdd.ics.uci.edu/summary.data.application.html Statlib: http://lib.stat.cmu.edu/ Delve: http://www.cs.utoronto.ca/~delve/ Linguistic Data Consortium: http://www.ldc.upenn.edu/ ELDA: http://www.elda.org/ Journal of Machine Learning Research www.jmlr.org Machine Learning Neural Computation Neural Networks IEEE Transactions on Neural Networks IEEE Transactions on Pattern Analysis and Machine Intelligence Annals of Statistics Journal of the American Statistical Association... 34 35 36

13 Ressources: Conférences International Conference on Machine Learning (ICML) ICML05: http://icml.ais.fraunhofer.de/ European Conference on Machine Learning (ECML) ECML05: http://ecmlpkdd05.liacc.up.pt/ Neural Information Processing Systems (NIPS) NIPS05: http://nips.cc/ Uncertainty in Artificial Intelligence (UAI) UAI05: http://www.cs.toronto.edu/uai2005/ Computational Learning Theory (COLT) COLT05: http://learningtheory.org/colt2005/ International Joint Conference on Artificial Intelligence (IJCAI) IJCAI05: http://ijcai05.csd.abdn.ac.uk/ International Conference on Neural Networks (Europe) ICANN05: http://www.ibspan.waw.pl/icann-2005/... 37