Ne cherchez plus, soyez informés! Robert van Kommer



Documents pareils
Les participants repartiront de cette formation en ayant une vision claire de la stratégie et de l éventuelle mise en œuvre d un Big Data.

Pentaho Business Analytics Intégrer > Explorer > Prévoir

Anticiper et prédire les sinistres avec une approche Big Data

Big data et données géospatiales : Enjeux et défis pour la géomatique. Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique

L écosystème Hadoop Nicolas Thiébaud Tuesday, July 2, 13

BIG Data et R: opportunités et perspectives

Catherine Chochoy. Alain Maneville. I/T Specialist, IBM Information Management on System z, Software Group

BIG DATA : une vraie révolution industrielle (1) Les fortes évolutions liées à la digitalisation

Big Data: comment passer de la stratégie à la mise en œuvre? Big Data Paris Mars 2015

Hadoop, les clés du succès

SEMINAIRE SAS VISUAL ANALYTICS LAUSANNE, MARCH 18 : JÉRÔME BERTHIER VALERIE AMEEL

DEMARRER UN PROJET BIGDATA EN QUELQUES MINUTES GRACE AU CLOUD

Acquisition des données - Big Data. Dario VEGA Senior Sales Consultant

Cartographie des solutions BigData

BIG DATA : comment étendre et gérer la connaissance client? François Nguyen SFR Directeur SI décisionnel & Mkt relationnel GP

Labs Hadoop Février 2013

20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars ans du SIAD -"Big Data par l'exemple" -Julien DULOUT

Entreprise et Big Data

bservatoire Les assureurs face à la révolution digitale Big data et assurance : le mariage de la carpe et du lapin?

Introduction au Data-Mining

Offre formation Big Data Analytics

Formation Cloudera Data Analyst Utiliser Pig, Hive et Impala avec Hadoop

Vos experts Big Data. Le Big Data dans la pratique

Introduction à MapReduce/Hadoop et Spark

AVRIL Au delà de Hadoop. Panorama des solutions NoSQL

Les datas = le fuel du 21ième sicècle

Me#re le Big Data sur la carte : défis et avenues rela6fs à l exploita6on de la localisa6on

Groupe de Discussion Big Data Aperçu des technologies et applications. Stéphane MOUTON

BI dans les nuages. Olivier Bendavid, UM2 Prof. A. April, ÉTS

Introduction au Massive Data

Conception pédagogique Multimédia

Livre. blanc. Solution Hadoop d entreprise d EMC. Stockage NAS scale-out Isilon et Greenplum HD. Février 2012

Journée Utiliateurs Nouvelles du Pôle ID (Informatique) Pierre Neyron, LIG/CNRS

HADOOP ET SON ÉCOSYSTÈME

accompagner la transformation digitale grâce au Big & Fast Data Orange Business Services Confidentiel 02/10/2014

Containers : Outils magiques pour les Devops? OpenNebula et son écosystème pour une infrastructure cloud agile

Big Data et Statistique Publique

Hadoop dans l entreprise: du concept à la réalité. Pourquoi et comment?

Ricco Rakotomalala R.R. Université Lyon 2

Stephan Hadinger, Sr. Mgr Solutions Architecture, AWS. Salon du Big Data 11 mars 2015

Livret de Stages 2014 / 2015

Le traitement du Big Data inclue la collecte, la curation, le stockage, l enrichissement, le croisement, la partage, l analyse et la visualisation.

RFID: Middleware et intégration avec le système d'information Olivier Liechti

Les journées SQL Server 2013

Big Data. Cyril Amsellem Consultant avant-vente. 16 juin Talend

Le projet Gaïa, le Big Data au service du traitement de données satellitaires CRIP - 16/10/2013 Pierre-Marie Brunet

Les marchés Security La méthode The markets The approach

SCC / QUANTUM Kickoff 2015 Data Protection Best Practices

FINI LA RÉCRÉ PASSONS AUX MÉGADONNÉES

TRAVAUX DE RECHERCHE DANS LE

De l Etudiant à SBA à l Enseignant Chercheur à l ENSMA

Surmonter les 5 défis opérationnels du Big Data

QlikView et Google Big Query : Une réponse simple, rapide et peu coûteuse aux analyses Big Data

Financement de vos innovations. Evénement Big Data 23/10/2014

SparkInData. Place de Marché des applications Spatiales

Monétisation des données : comment identifier de nouvelles sources de revenus au sein des Big data?

Le BigData, aussi par et pour les PMEs

Tables Rondes Le «Big Data»

04/05/2011 Amundi Liquidity A creative market introduction Date

Les données (voix, vidéo, etc.) sont échangées à l aide du protocole RTP (Real-time Transport Protocol).

Open Data. François Bancilhon twitter.com/fbancilhon Printemps de la recherche EDF R&D 28/9/12

Cloud Computing : Généralités & Concepts de base

ILM ou Archivage Une démarche Métier

La rencontre du Big Data et du Cloud

Cloud Computing. Introduction. ! Explosion du nombre et du volume de données


Il y a tellement de hype autour du big data que Gartner étudie un nouveau modèle ;-) Talend

Data Governance et. Optim / FileNet. La synergie entre le structuré et le non structuré IBM Corporation

Panorama des solutions analytiques existantes

IBM Security Systems Les nouveaux enjeux de la sécurité Serge Richard - CISSP - Senior Security Architect. serge.richard@fr.ibm.

Le Cloud Computing et le SI : Offre et différentiateurs Microsoft

Nouvelles opportunités pour les données fortement interconnectées : La base de graphe Neo4j

Préparer un état de l art

REMOTE DATA ACQUISITION OF EMBEDDED SYSTEMS USING INTERNET TECHNOLOGIES: A ROLE-BASED GENERIC SYSTEM SPECIFICATION

Opportunités et enjeux à l heure du Cloud, du Big Data, de la mobilité et du Social Business

Titre : La BI vue par l intégrateur Orange

DEMARREZ RAPIDEMENT VOTRE EVALUATION

Le nouveau visage de la Dataviz dans MicroStrategy 10

Stages ISOFT : UNE SOCIETE INNOVANTE. Contact : Mme Lapedra, stage@isoft.fr

Estimated SMB instances PC (Physical and Virtual) 125,000 Total instances: SMB 1-24 PC. 392,000 Total instances: SMB PC

Architecture de la grille

BIG DATA et DONNéES SEO

Programme TechDay Romandie

PCI DSS un retour d experience

Laboratoire 4 Développement d un système intelligent

Basware Invoice Automation, aujourd hui et demain

Déploiement d une architecture Hadoop pour analyse de flux. françois-xavier.andreu@renater.fr

Cisco Identity Services Engine

Big Data Concepts et mise en oeuvre de Hadoop

Technologies du Web. Ludovic DENOYER - ludovic.denoyer@lip6.fr. Février 2014 UPMC

Résultats annuels 2014 & perspectives. «Du mobile au Big Data»

GT Big Data. Saison Bruno Prévost (Safran), Marc Demerlé (GDF SUEZ) CRiP Thématique Mise en œuvre du Big Data 16/12/14

ETAT DE L ART ET PERSPECTIVES POUR LES SERVICES NUMÉRIQUES APPLIQUÉS À LA VITICULTURE.

AGORA : contexte et objectifs

Accès aux données Sentinelles

Organiser vos données - Big Data. Patrick Millart Senior Sales Consultant

Introduction aux services Cloud Computing de Tunisie Télécom. Forum Storage et Sécurité des données Novembre 2012 Montassar Bach Ouerdiane

Comment démarrer son Cloud Hybrid avec Amazon Web Services

Transcription:

Ne cherchez plus, soyez informés! Robert van Kommer

Le sommaire La présentation du contexte applicatif Le mariage: Big Data et apprentissage automatique Dialogues - interactions - apprentissages 2

Le contexte applicatif Hautes Ecoles Alliance PME His research activity focuses on the theory of wavelets and their applications, signal processing for telecommunications, communication systems and multimedia, and sensor networks. But: développer des produits et des services informatiques dans les domaines des multimédia, photographie et vidéo digitales (digital imagery), 3

Le mariage: données et apprentissage «Large-scale Machine Learning» pour extraire l information des données Big Data Information 4

40000 coéfficients Le principe d apprentissage semi-supervisé La société de l information et le journaliste de demain Dans la société d information, les nouveaux moyens de communication facilitent une diffusion instantanée de l information depuis n importe quel point du globe vers l ensemble de la toile. Aujourd hui, l information peut être capturée sous toutes ses formes et diffusée par l intermédiaire La société de l information et le journaliste de demain d un simple téléphone mobile. La conséquence inévitable est Dans la société d information, les nouveaux moyens de une explosion de la quantité des données publiées et la difficulté communication facilitent une diffusion instantanée de pour tout journaliste de prétendre maîtriser une vue d ensemble. l information depuis n importe quel point du globe vers Comment traiter et qualifier ces quantités phénoménales l ensemble de la toile. Aujourd hui, l information peut être d information tout en tenant compte, si possible, de l intérêt et de capturée sous toutes ses formes et diffusée par l intermédiaire chaque individu? La société Quel de sera l information le nouveau et visage le journaliste du journaliste de demain d un simple téléphone mobile. La conséquence inévitable est demain? Dans Sera-t-il la société un être d information, virtuel nourri par les nouveaux l intermédiaire moyens de son de une explosion de la quantité des données publiées et la difficulté réseau social communication et la propriété facilitent privée une d un diffusion consommateur instantanée de pour tout journaliste de prétendre maîtriser une vue d ensemble. particulier? l information Aujourd hui, depuis quelle n importe est l efficacité quel point réelle du des globe systèmes vers Comment traiter et qualifier ces quantités phénoménales de traitement l ensemble automatique de la toile. de l information Aujourd hui, et l information quelles sont peut leurs être d information tout en tenant compte, si possible, de l intérêt et de possibilités capturée de fournir sous une toutes information ses formes personnalisée? et diffusée par l intermédiaire chaque individu? Quel sera le nouveau visage du journaliste de d un simple téléphone mobile. La conséquence inévitable est demain? Sera-t-il un être virtuel nourri par l intermédiaire de son une explosion de la quantité des données publiées et la difficulté réseau social et la propriété privée d un consommateur Les réseaux pour sociaux tout journaliste : les règles de prétendre du jeu maîtriser une vue d ensemble. particulier? Aujourd hui, quelle est l efficacité réelle des systèmes La révolution Comment des réseaux traiter et sociaux qualifier entraine ces quantités une profusion phénoménales de de traitement automatique de l information et quelles sont leurs données d information personnelles tout décrivant en tenant les individus compte, et si possible, leur vie privée. de l intérêt et de possibilités de fournir une information personnalisée? Comment chaque les systèmes individu? de traitement Quel sera le de nouveau l information visage peuvent-ils du journaliste de exploiter demain ces données? Sera-t-il et quelles un être sont virtuel les recommandations nourri par l intermédiaire de son nécessaires réseau pour social prévenir et la l irréparable propriété privée violation d un de consommateur la sphère Les réseaux sociaux : les règles du jeu privée. Quelles-sont particulier? les Aujourd hui, règles du quelle jeu? est l efficacité réelle des systèmes La révolution des réseaux sociaux entraine une profusion de de traitement automatique de l information et quelles sont leurs données personnelles décrivant les individus et leur vie privée. possibilités de fournir une information personnalisée? Comment les systèmes de traitement de l information peuvent-ils exploiter ces données et quelles sont les recommandations nécessaires pour prévenir l irréparable violation de la sphère Les réseaux sociaux : les règles du jeu privée. Quelles-sont les règles du jeu? La révolution des réseaux sociaux entraine une profusion de données personnelles décrivant les individus et leur vie privée. Comment les systèmes de traitement de l information peuvent-ils exploiter ces données et quelles sont les recommandations nécessaires pour prévenir l irréparable violation de la sphère privée. Quelles-sont les règles du jeu? Extraction des vecteurs Apprentissage interactif J aime J aime pas Vecteurs 5

La plateforme «Big Data» d Alliance Les données: EPFL PME suisses Moteur de recherche Étendre l échelle HES-SO Vous Autres Newsletters Notifications 6

Datasets sources L architecture «Big Data» Company data Web sites crawler Multi-core search engine, Solr Web Site Company public data Market place datasets Data Ingest Gateway Compute Cluster Large-Scale Distributed Storage & Processing NoSQL data storage, HBase API Customer Interactions Value Inter/ intra EPFL data Social networks MapReduce Batch Gateway Hints System Software: Access Control, Operation, Monitoring Software Application : Hadoop ecosystem, Data Processing, Analytics, Machine Learning 7

Correct classification Quelle est l efficacité? Avec 10 interactions, la qualité de l information est améliorée d un facteur 10 Transductive text classification of Reuters articles: "corporate acquisitions" 100.00% 95.00% 90.00% 85.00% 80.00% 75.00% 70.00% 65.00% 60.00% 55.00% 50.00% 2 5 10 20 40 80 160 320 640 Number of positive and negative labelled training articles out of 2000 that are used in the transductive SVM 8

En résumé et pour conclure Moteur de recherche basé sur un apprentissage semi-supervisé Génération de newsletters personnalisées L objectif ultime: Etre informé, sans avoir la nécessité de rechercher l information 9

Merci pour votre attention! 10