Apprentissage Automatique, Big Data et Data Science

Documents pareils
Spécialité IAD. Master de Sciences et technologie de l UPMC. Mention informatique. Partenaires : ENST, ENSTA. Responsables : T. Artières, C.

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

Recommandation prédictive

Les apports de l informatique. Aux autres disciplines

FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis

Dossier justificatif des travaux de R&D déclarés au titre du CIR

Redevance pour la mise à disposition de settop-boxes avec mémoire et de vpvr

Resolution limit in community detection

Le BIG DATA????? Big Buzz? Big Bang? Big Opportunity? Big hype? Big Business? Big Challenge? Big Hacking? Gérard Peliks planche 2

Les participants repartiront de cette formation en ayant une vision claire de la stratégie et de l éventuelle mise en œuvre d un Big Data.

Masses de données. 1. Introduction 2. Problématiques 3. Socle de formation (non présenté) 4. Liens avec Formation INSA

Ecran : Processeur : OS : Caméra : Communication : Mémoire : Connectique : Audio : Batterie : Autonomie : Dimensions : Poids : DAS :

LOIS SUR LES INVESTISSEMENTS ÉTRANGERS

Traitement numérique de l'image. Raphaël Isdant

Évaluation et implémentation des langages

OPTION SCIENCES BELLE-ISLE-EN-TERRE

Pourquoi l apprentissage?

GT Big Data. Saison Bruno Prévost (Safran), Marc Demerlé (GDF SUEZ) CRiP Thématique Mise en œuvre du Big Data 16/12/14

Présentation du Laboratoire en médias socionumériques et ludification. Maude Bonenfant Département de communication sociale et publique

Panorama des études à travers les filières. FEEL du 23 octobre 2014

Formation Actuaire Data Scientist. Programme au 24 octobre 2014

A - «Le nombre dans l art» (L œuvre d art et sa composition)

Apprentissage Automatique

INFO 2 : Traitement des images

Big Data et Statistique Publique

Introduction au Data-Mining

APPORT DES RESEAUX BAYESIENS DANS LA PREVENTION DE LA DELINQUANCE

Les Ressources Humaines à l heure du Big Data : progrès, perspectives et limites CORNERSTONE WHITEPAPER

Bienvenue. Jeudi 26 avril 2012 Comment vendre face à une concurrence ouverte et les réseaux sociaux?

Feuille TD n 1 Exercices d algorithmique éléments de correction

Observatoire des loisirs des Français

Fujitsu World Tour 2015

Introduction. I Étude rapide du réseau - Apprentissage. II Application à la reconnaissance des notes.

Intelligence Artificielle et Robotique

NOM : Prénom : Date de naissance : Ecole : CM2 Palier 2

Data 2 Business : La démarche de valorisation de la Data pour améliorer la performance de ses clients

SOMMAIRE. Portraits des intervenants Portraits des animateurs Conférence, Débat et Échanges #$%&'(!)(*+,!-$*./)(*-(!"0!1,2*!34"0!5!!

Une dérivation du paradigme de réécriture de multiensembles pour l'architecture de processeur graphique GPU

Programme scientifique Majeure INTELLIGENCE NUMERIQUE. Mentions Image et Réalité Virtuelle Intelligence Artificielle et Robotique

A la découverte du Traitement. des signaux audio METISS. Inria Rennes - Bretagne Atlantique

Attestation de maîtrise des connaissances et compétences au cours moyen deuxième année


ENOVIA 3DLive. IBM PLM Solutions 1 er Octobre Philippe Georgelin Sébastien Veret

CONSEILS POUR LA REDACTION DU RAPPORT DE RECHERCHE. Information importante : Ces conseils ne sont pas exhaustifs!

DÉLÉGATION DES COMPÉTITIONS EN INFORMATIQUE DE L ÉTS PLAN DE PARTENARIAT

Intelligence Artificielle Planification

BIG DATA : GESTION ET ANALYSE DES DONNÉES MASSIVES (BGD) Mastère Spécialisé. Appréhendez les challenges économiques et juridiques du Big Data

AUX ÉTUDIANTS INTERNATIONAUX

M06/5/COMSC/SP1/FRE/TZ0/XX INFORMATIQUE NIVEAU MOYEN ÉPREUVE 1. Mardi 2 mai 2006 (après-midi) 1 heure 30 minutes INSTRUCTIONS DESTINÉES AUX CANDIDATS

July 1, Stéphan Clémençon (Télécom ParisTech) Mastère Big Data July 1, / 15

LA CONFIANCE CrytalSanté

industrielle Institut national de la propriété Protections des innovations de logiciels Stéphanie LEPARMENTIER

DUNSKY EXPERTISE EN ÉNERGIE

Informatique et sciences du numérique

Benchmark Accès Internet

Big data et données géospatiales : Enjeux et défis pour la géomatique. Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique

Bigdata et Web sémantique. les données + l intelligence= la solution

Enregistrement et transformation du son. S. Natkin Novembre 2001

SEO On-page. Avez-vous mis toutes les chances de votre côté pour le référencement de votre site?

Dailymotion: La performance dans le cloud

Ministère des Affaires étrangères et européennes

5255 Av. Decelles, suite 2030 Montréal (Québec) H3T 2B1 T: F:

Progressons vers l internet de demain

GREENTIC. Multimédia et TIC au service du développement durable

Tout au long de votre cursus Quel métier futur? Dans quel secteur d activité? En fonction de vos goûts et aptitudes et du «niveau d emploi» dans ce

Défi SSQ Groupe financier

Documentation utilisateur. [EIP] TransLSF

GUIDE Excel (version débutante) Version 2013

Copyright / 2014 Éditions Stratégies et développement Siège Social 20 Rue du Béguinage Crespin

Introduction au Data-Mining

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21

VI- Exemples de fiches pédagogiques en 3 ème année primaires

Guide de configuration d'une classe

Fouillez facilement dans votre système Big Data. Olivier TAVARD

TABLE DES MATIERES MENTIONS LEGALES INTRODUCTION CHAPITRE 1 : INSTALLATION DE L ALGORITHME CHAPITRE 2 : EXECUTION & OPTIMISATION DU BACKTEST

Introduction à MapReduce/Hadoop et Spark

LE MARKETING DIRECT, SUPPORT DU MARKETING CLIENT

SFR utilise la version JBoss EAP de Red Hat


Une Démarche pour la sélection d outils de cartographie des processus métiers

Cours de Licence 2 - ICL 2A 01 c : Notions de base en sciences de l'information et de la communication adaptées au contexte interculturel

TENDANCES CLÉS DU MARCHÉ JURIDIQUE

Indications pour une progression au CM1 et au CM2

Intelligence précoce

Cours d électricité. Circuits électriques en courant constant. Mathieu Bardoux. 1 re année

WIPO Training of trainers Program on Effective Intellectual Property Asset Management by Small and Medium-Sized Enterprises (SMEs)

David BEDOUET, WebSchool Orleans. Cosmina TRIFAN, WebSchool Orleans

Formation tableur niveau 1 (Excel 2013)

Vision prospective et obstacles à surmonter pour les assureurs

Techniques d interaction dans la visualisation de l information Séminaire DIVA

Questionnaire pour connaître ton profil de perception sensorielle Visuelle / Auditive / Kinesthésique

Recherche d information textuelle

DocForum 18 Juin Réussites d un projet Big Data Les incontournables

INTRODUCTION A L ELECTRONIQUE NUMERIQUE ECHANTILLONNAGE ET QUANTIFICATION I. ARCHITECTURE DE L ELECRONIQUE NUMERIQUE

BIG DATA ET MARKETING

Le logiciel EduAnatomist.

Big Data: développement, rôle des ARS?? Laurent Tréluyer, ARS Ile de France Alain Livartowski Institut Curie Paris 01/12/2014

FRENCH Language (Advanced Level III)

Transcription:

Apprentissage Automatique, Big Data et Data Science Thierry Artières

Le machine learning : un paradigme de programmation Quel algorithme?

L Apprentissage Automatique: un paradigme de programmation Quel algorithme? [Farabet et al., IEEE PAMI, 2012]

L Apprentissage Automatique: un paradigme de programmation Quel algorithme? Epilepsie / Pas d épilepsie

Le cas Jeopardy : Jeu télévisé On nous donne une réponse, on doit trouver la question Exemple de réponse : Stendhal Question à trouver : Qui a écrit le Rouge et le Noir? IBM DeepQA program (QA = Question Answering) A gagné à Jeopardy (2011) Peut être étendu à d autres domaines Domaine médical, juridique etc

L Apprentissage Automatique Adapté pour tout type de tâches de décision, de prédiction Pour lesquelles on ne connait pas d algorithme Pour lesquelles on ne veut pas passer par une étape de formalisation Champs d applications Réflexion : Intelligence Artificielle et jeux Interprétation textuelle : Recherche d information, résumé automatique, traduction automatique, analyse de sentiment, analyse de réputation Robotique et systèmes autonomes Taches perceptives : images, vidéos, parole, musique, gestes Recommandation et personnalisation Inférence sur des données relationnelles (sociales) et graphes, web advertising

Contexte de la société de l information Les Vs La data-isation Et puis?

Contexte de la société de l information Les Vs La data-isation L or noir n est qu un produit brut Et puis?

Contexte de la société de l information Les Vs La data-isation Et puis? L or noir n est qu un produit brut Bienvenue dans la data science!

L Apprentissage Automatique et la science des données Informatique Programmation Complexité Bases de données Apprentissage Automatique Fondamental Mathématiques Statistiques

L Apprentissage Automatique et la science des données Informatique Programmation Complexité Bases de données Fondamental Mathématiques Statistiques Data science Hacking Ingénierie des données Calcul GPU et // Web Applicatif Expertise de domaine

L Apprentissage Automatique et la science des données Informatique Programmation Complexité Bases de données Fondamental Mathématiques Statistiques Hacking Data science Raffiner l or noir Applicatif Ingénierie des données Calcul GPU et // Web Expertise de domaine

Kaggle Site de rencontre entre entreprises et datascientists Gros succès en termes de participation Hétérogénéité des participants Rendu possible par l apparition de nombreux toolkits de ML gratuits (Weka, Scikit-learn) et payants Matthieu S. (UPMC 2013) 127th /219,547

Ce que le big data change (en AA) Nombreux problèmes «tous les jours» Nouvelles tâches à inventer Changement profond dans la manière de résoudre une tâche N=All Qualité variable et amoindrie des données

Ce que le big data change Approche traditionnelle Approche «Big Data» Problème clairement identifié Besoins multiples Sélection limitée de données représentatives Examen rendu aisé par la taille limitée Collection la plus large de données Utilisation de méthodes statistiques Estimation d un modèle

L exemple des réseaux de neurones 1980-1990 : Vague des RNs Irrigue tous les domaines de la Reconnaissance Des Formes 2005-Aujourd hui : Renouveau / Apprentissage profond Algorithmes (modérément) nouveaux Usage massif de données d entrainement Avancées majeures sur divers problèmes réels durs (Vision, Parole, Texte)

L exemple de la Traduction Automatique 1990 IBM fait une avancée majeure La traduction vue comme un TRES gros problème statistique Espace Phrases en Anglais -> Phrases en Français Ressources importantes (transcriptions parlement canadien Fr/En) mais limitées : Millions de documents 2000 Google Énorme corpus Milliards de documents diverses qualités plus ou moins alignés Cela fonctionne beaucoup mieux