Apprentissage symbolique et statistique à l ère du mariage pour tous



Documents pareils
Tour d horizon de l apprentissage statistique. from Machine Learning to Big Data Analytics

Apprentissage automatique et méga données

Optimisation et apprentissage statistique. Une introduction à l apprentissage statistique

L'intelligence d'affaires: la statistique dans nos vies de consommateurs

Introduction au Data-Mining

Une méthode de classification supervisée sans paramètre pour l apprentissage sur les grandes bases de données

Big Data et Statistique Publique

Laboratoire 4 Développement d un système intelligent

Les datas = le fuel du 21ième sicècle

Application Form/ Formulaire de demande

Big Data -Comment exploiter les données et les transformer en prise de décisions?

BNP Paribas Personal Finance

PeTEX Plateforme pour e-learning et expérimentation télémétrique

Intelligence Artificielle et Robotique

La carte, le territoire et l'explorateur où est la visualisation? Jean-Daniel Fekete Equipe-projet AVIZ INRIA

BIG DATA : une vraie révolution industrielle (1) Les fortes évolutions liées à la digitalisation

Instructions Mozilla Thunderbird Page 1

Accès aux données Sentinelles

La coopération dans un contexte de recherches doctorales Cooperation amongst PhD researchers. Josée Charbonneau Anne- Marie Merrien 28 mai 2014

BIG DATA en Sciences et Industries de l Environnement

Eléments de statistique

Simon Lacoste-Julien Chercheur CR Équipe-Projet SIERRA, INRIA - École Normale Supérieure

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013

Tier 1 / Tier 2 relations: Are the roles changing?

Informatique / Computer Science

Introduction au datamining

Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining.

EN UNE PAGE PLAN STRATÉGIQUE

FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis

Big Data et Prévisions. Philippe Picard, le 24 juin Page 1

Editing and managing Systems engineering processes at Snecma

Integrated Music Education: Challenges for Teaching and Teacher Training Presentation of a Book Project

REMOTE DATA ACQUISITION OF EMBEDDED SYSTEMS USING INTERNET TECHNOLOGIES: A ROLE-BASED GENERIC SYSTEM SPECIFICATION

Directions Marketing : réussir vos challenges stratégiques et opérationnels d aujourd hui

TRS: Sélection des sous-graphes représentants par l intermédiaire des attributs topologiques et K-medoïdes

Une comparaison de méthodes de discrimination des masses de véhicules automobiles

Spécificités, Applications et Outils

intelligence artificielle et cognitique"

Publications, ressources, liens, logiciels,

20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars ans du SIAD -"Big Data par l'exemple" -Julien DULOUT

Objectif et contexte business : piliers du traitement efficace des données -l exemple de RANK- Khalid MEHL Jean-François WASSONG 10 mars 2015

Ingénierie et gestion des connaissances

PREPROCESSING PAR LISSAGE LOESS POUR ACP LISSEE

HIVER 2004 MÉTHODOLOGIE DE LA RECHERCHE EN MARKETING MRK

Data issues in species monitoring: where are the traps?

Forthcoming Database

Anticiper et prédire les sinistres avec une approche Big Data

Techniques du Data Mining pour la prédiction de faillite des entreprises et la gestion du risque de crédit

SAN07 IBM Social Media Analytics:

Philippe Lemerle Big Data Secteur public. Copyright 2015, Oracle and/or its affiliates. All rights reserved.

THE EVOLUTION OF CONTENT CONSUMPTION ON MOBILE AND TABLETS

Jean-Daniel Fekete Directeur de Recherche, Resp. équipe-projet AVIZ INRIA

Formation Actuaire Data Scientist. Programme au 24 octobre 2014

ANGULAR JS AVEC GDE GOOGLE

Grégoire de Lassence. Copyright 2006, SAS Institute Inc. All rights reserved.

L Art d être Numérique. Thierry Pierre Directeur Business Development SAP France

Comment mesurer de façon efficace le succès en ligne d une marque de luxe?

TARIFS PIETONS SAISON PEDESTRIAN RATES SEASON 2014/2015 TARIFS ASSURANCE CARRE NEIGE CARRE NEIGE INSURANCE RATES 2014/2015

Introduction aux outils BI de SQL Server Fouille de données avec SQL Server Analysis Services (SSAS)

BIG Data et R: opportunités et perspectives

Small Businesses support Senator Ringuette s bill to limit credit card acceptance fees

Entreposage de données complexes pour la médecine d anticipation personnalisée

Contents Windows

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

ADHEFILM : tronçonnage. ADHEFILM : cutting off. ADHECAL : fabrication. ADHECAL : manufacturing.

Bourses d excellence pour les masters orientés vers la recherche

Classification Automatique de messages : une approche hybride

Alumni. 15 Double Degrees. ESSEC Business School Global key figures. Founded in1907 AACSB, EQUIS Fulltime. BBA, Masters, MBA, PhD

Les défis statistiques du Big Data

Modélisation du comportement habituel de la personne en smarthome

0 h(s)ds et h [t = 1 [t, [ h, t IR +. Φ L 2 (IR + ) Φ sur U par

Le nouveau visage de la Dataviz dans MicroStrategy 10

Media Pack. À propos de nous. Statistiques par mois. Pourquoi préférer IT Job Board? Références

The assessment of professional/vocational skills Le bilan de compétences professionnelles

Formation continue. Ensae-Ensai Formation Continue (Cepe)

1 er Avril 2015 Data Science & Big Data Etat de l art Donner plus d intelligence aux données

La rencontre du Big Data et du Cloud

Introduction au Data-Mining

MODERN LANGUAGES DEPARTMENT

Université de XY University of XY. Faculté XY Faculty of XY

Ne cherchez plus, soyez informés! Robert van Kommer

IDENTITÉ DE L ÉTUDIANT / APPLICANT INFORMATION

Toni Lazazzera Tmanco is expert partner from Anatole ( and distributes the solution AnatoleTEM

AIDE FINANCIÈRE POUR ATHLÈTES FINANCIAL ASSISTANCE FOR ATHLETES

Le MDM (Master Data Management) Pierre angulaire d'une bonne stratégie de management de l'information

The new consumables catalogue from Medisoft is now updated. Please discover this full overview of all our consumables available to you.

July 1, Stéphan Clémençon (Télécom ParisTech) Mastère Big Data July 1, / 15

Les enjeux du Big Data Innovation et opportunités de l'internet industriel. Datasio 2013

Public and European Business Law - Droit public et européen des affaires. Master I Law Level

BI SWISS FORUM (ecom / SITB)

iqtool - Outil e-learning innovateur pour enseigner la Gestion de Qualité au niveau BAC+2

Expériences des Universités européennes dans l enseignement de la Finance islamique. Zineb Bensaid, Senior Consultant ISFIN

Conférence Bales II - Mauritanie. Patrick Le Nôtre. Directeur de la Stratégie - Secteur Finance Solutions risques et Réglementations

Méthodes d apprentissage statistique «Machine Learning»

RÉSUMÉ DE THÈSE. L implantation des systèmes d'information (SI) organisationnels demeure une tâche difficile

Gestion des prestations Volontaire

Cairnalys est une société spécialisée dans le développement de la connaissance client et l analyse des campagnes d ing.

WEB page builder and server for SCADA applications usable from a WEB navigator

La solution idéale de personnalisation interactive sur internet

Industrial Phd Progam

Transcription:

Apprentissage symbolique et statistique à l ère du mariage pour tous Stéphane Canu asi.insa-rouen.fr/enseignants/~scanu RFIA 2014, INSA Rouen 2 juillet 2014

Apprentissage : humain vs. machine Les apprentissages d un enfant marcher : un an parler : deux ans raisonner : le reste

Apprentissage : humain vs. machine Les apprentissages d un enfant marcher : un an parler : deux ans raisonner : le reste

Apprendre à raisoner

Symbolique et statistique : une opposition historique Deux visions de l apprentissage des machines Expliquer : trouver un model Prédire : améliorer des performances Deux disciplines scientifiques concernées Informatique Statistique

Deux visions des statistiques Table 1: An Outsider's Glossary: NOT THE OPINION OF THE AUTHOR CONCEPT BERKELEY STANFORD Statistics Study of measurable functions The bootstrap Applied Statistics Study of measurable functions The bootstrap applied in metric spaces to MARS Regression Hilbert space projection Special case of wavelet transform A proof Lucien LeCam says so Charles Stein says so Systems support Spector, Licht, Kawin A guy last seen somewhere in EE last month Impediment to research Data Berkeley's research progress One of our superstars David Donoho David Donoho Most FAQ Where is Donoho? Where is Donoho?

Deux définitions de l apprentissage Arthur Samuel (1959) Machine Learning : Field of study that gives computers the ability to learn without being explicitly programmed. Tom Mitchell (The Discipline of Machine Learning, 2006) How can we build computer systems that automatically improve with experience, and what are the fundamental laws that govern all learning processes? A computer program CP is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E

Le problème d apprentissage (CP, E, T, P) CP : le programme, c est à dire l algorithme qui apprend A E : l expérience, les données les entrées x les sorties : y P : la mesure de performance - le critère à optimiser T : la tâche entrées : sorties : apprentissage x a test x t apprentissage y a test y t renforcement r tâche T type données E critère P Marketing apprentissage non supervisé x a information apprentissage supervisé x a, y a OCR discrimination (classification) y a {0, 1} cout 0/1 Recommandation ordonnancement (ranking) y i < y j mesure cumulative de qualité de tri (NDCG) Prévision météo régression y i IR carrées des écarts Génomique apprentissage semi supervisé (x a, y a, x t) Jeux (Go) apprentissage par renforcement x i,i=1,n, r IE(r)

Les objectifs de l apprentissage automatique Algorithmes d apprentissage bonne généralisation généricité passage à l échelle Questions théoriques (Vapnik s Book, 1982 - Valiant, 1984) apprenabilité, sous quelles conditions? complexité (en temps, en échantillon)

Top 10 algorithmes en fouille de données Arbres de décision (et les forêts) C4.5, CART, SVM, AdaBoost, knn, Bayesien k-means, Apriori, EM, Naive Bayes, PageRank, identified by the IEEE International Conference on Data Mining (ICDM) in December 2006

Top 10 algorithmes en fouille de données Arbres de décision (et les forêts) C4.5, CART, SVM, AdaBoost, knn, Bayesien k-means, Apriori, EM, Naive Bayes, PageRank, en 2014 un 11 ème : deep networks identified by the IEEE International Conference on Data Mining (ICDM) in December 2006

Une brève histoire des modes en apprentissage

Faire de la science un sport! Netflix : un million de dollar pour deux ans de travail...au service des entreprises : Datascience.net SNCF : Prédiction de la fréquentation des gares SNCF en Ile-de-France GDF Suez : Modéliser les consommations électriques de sites B2B Kaggle : Go from Big Data to Big Analytics Higgs Boson Machine Learning Challenge proposé par le Paris-Saclay Center for Data Science.

Retour aux applications : deep learning & big data Quelques challenges + la traduction automatique : deep learning strikes back web : google, facebook... Marketing : Walmart & big data volume variété vitesse Jürgen Schmidhuber, Deep Learning in Neural Networks : An Overview

New trends in ML fashion : big data ICML 2014 workshops Designing Machine Learning Platforms for Big Data Xiangxiang Meng, Wayne Thompson, Xiaodong Lin New Learning Frameworks and Models for Big Data Massih-Reza Amini, Eric Gaussier, James Kwok, Yiming Yang Deep Learning Models for Emerging Big Data Applications Shan Suthaharan, Jinzhu Jia Unsupervised Learning for Bioacoustic Big Data Hervé Glotin, P. Dugan, F. Chamroukhi, C. Clark, Yann LeCun Knowledge-Powered Deep Learning for Text Mining Bin Gao, Scott Yih, Richard Socher, Jiang Bian Optimizing Customer Lifetime Value in Online Marketing Georgios Theocharous, Mohammad Ghavamzadeh, Shie Mannor Comment traiter ces big data : data science

New trends in ML fashion : data science Hilary Mason, http://www.infoq.com/presentations/machine-learning

Data Scientist Voted Sexiest Job of 21st Century

New trends in ML fashion : big data hiring boom

Quelques prédictions... à propos du futur Data science - Applications multi compétences chaine de traitements Outils pour l apprentissage l apprentissage sans paramètres (off-the-shelf) passage à l échelle (3v - big data) Algorithmes d apprentissage optimisation (big data, non convexe) dynamique (interactions) apprendre à apprendre (transfert) Théorie de l apprentissage la nature de l information

Références Bishop, C. M. 1995. Neural Networks for Pattern Recognition. Oxford : Oxford University Press. Duda, R. O., P. E. Hart, and D. G. Stork. 2001. Pattern Classification, 2nd ed. New York : Wiley. Hand, D. J. 1998. Consumer Credit and Statistics. In Statistics in Finance, ed. D. J. Hand and S. D. Jacka, 69-81. London : Arnold. Hastie, T., R. Tibshirani, and J. Friedman. 2001. The Elements of Statistical Learning : Data Mining, Inference, and Prediction. New York : Springer. Leahey, T. H., and R. J. Harris. 1997. Learning and Cognition, 4th ed. New York : Prentice Hall. McLachlan, G. J. 1992. Discriminant Analysis and Statistical Pattern Recognition. New York : Wiley. Russell, S., and P. Norvig. 1995. Artificial Intelligence : A Modern Approach. New York : Prentice Hall. Webb, A. 1999. Statistical Pattern Recognition. London : Arnold. Weiss, S. M., and N. Indurkhya. 1998. Predictive Data Mining : A Practical Guide. San Francisco : Morgan Kaufmann.