VIPE CNAM 6 mars 2015. Frank Meyer Orange Labs / IMT / UCE / CRM-DA / PROF



Documents pareils
Qu est ce qu un réseau social. CNAM Séminaire de Statistiques Appliquées 13/11/2013. F.Soulié Fogelman 1. Utilisation des réseaux sociaux pour le

FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis

Alpha PRIMO 58 boulevard baron du Marais Roanne / / contact@alphaprimo.fr

BIG DATA : comment étendre et gérer la connaissance client? François Nguyen SFR Directeur SI décisionnel & Mkt relationnel GP

Étape 1 / CHOISIR UN HÉBERGEMENT

CONNEXION. Une interface de connexion sécurisée, simple et accessible même depuis un appareil mobile. CONNEXION /

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Panorama des solutions analytiques existantes

Détection des deux roues motorisés par télémétrie laser à balayage

Content Management System V.3.0. BlackOffice CMS V3.0 by ultranoir 1

Internet mobile : Etat de l art - Février Reproduction ou communication même partielle interdite sans autorisation écrite d ip-label.

Baromètre des métiers du numérique

SharePoint (Toute la Gamme)... 1 Office 2010 (Toute la Gamme)... 2 OLAP (Toute la Gamme)... 2 STATISTICA Connecteur PI (Produit Complémentaire)...

Présentation du module Base de données spatio-temporelles

Manipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner

Initiation aux bases de données (SGBD) Walter RUDAMETKIN

Créateur de sites Internet. Développeur de logiciels.

INTRODUCTION AU DATA MINING

Marie-Christine Spengler

Devenez un véritable développeur web en 3 mois!

LANGAGUE JAVA. Public Développeurs souhaitant étendre leur panel de langages de programmation

Systèmes de recommandation de produits Projet CADI Composants Avancés pour la DIstribution

DUT. Informatique, orientation Imagerie Numérique. Domaine : Sciences, Technologies, Santé. Mention : Informatique

Gestion du parc informatique matériel et logiciel de l Ensicaen. Rapport de projet. Spécialité Informatique 2 e année. SAKHI Taoufik SIFAOUI Mohammed

Atlas départemental de la couverture 2G et 3G en France métropolitaine : Bas-Rhin (67)

Journées Big Data à l ENSAI Big Data: les challenges, les défis

Marketing. en 12 étapes clés. Une introduction au Marketing Automation Comment délivrer le bon contenu au bon moment à son interlocuteur

Editeur de solutions innovantes pour l immobilier neuf

Paul FLYE SAINTE MARIE

Spécificités, Applications et Outils

Accélérer l agilité de votre site de e-commerce. Cas client

Bases de données documentaires et distribuées Cours NFE04

Spécifications, Développement et Promotion. Ricco RAKOTOMALALA Université Lumière Lyon 2 Laboratoire ERIC

Google fait alors son travail et vous propose une liste de plusieurs milliers de sites susceptibles de faire votre bonheur de consommateur.

RECUPEREZ DES FICHIERS SUPPRIMES AVEC RECUVA

données en connaissance et en actions?

Catalogue des formations.

1 Modélisation d être mauvais payeur

Catalogue des stages Ercom 2013

ÉdIteur officiel et fournisseur de ServIceS professionnels du LogIcIeL open Source ScILab

Guide d utilisation de la base de données bibliographiques. Centre de ressources - IFsanté

Analytics & Big Data. Focus techniques & nouvelles perspectives pour les actuaires. Université d Eté de l Institut des Actuaires Mardi 8 juillet 2014

Projet 2. Gestion des services enseignants CENTRE D ENSEIGNEMENT ET DE RECHERCHE EN INFORMATIQUE. G r o u p e :

Ateliers de formation Internet. epub : netlinking et Adwords

Nous vous proposons des formations à la carte et vous accompagnons dans leur mise en oeuvre au quotidien.

Informatique & Systèmes de Communication. Stages de 12 à 16 semaines aux Etats-Unis

1 er Avril 2015 Data Science & Big Data Etat de l art Donner plus d intelligence aux données

Compte Rendu d intégration d application

Création d un module complet de sondage en ligne

Manuel d utilisation 26 juin Tâche à effectuer : écrire un algorithme 2

Animer des séances pratiques et/ou des laboratoires

Architecture N-Tier. Ces données peuvent être saisies interactivement via l interface ou lues depuis un disque. Application

The brand is a story. But it's a story about you, not about the brand.

Comment booster vos applications SAP Hana avec SQLSCRIPT

Principes d AdWords. Quelques mots de présentation. Une audience large : les réseaux de ciblage. Réseau de recherche

Web Science. Master 1 IFI. Andrea G. B. Tettamanzi. Université de Nice Sophia Antipolis Département Informatique andrea.tettamanzi@unice.

Le ranking de Augure Influencers La méthodologie AIR en détails

Techniques d analyse et de conception d outils pour la gestion du processus de segmentation des abonnés des entreprises de télécommunication

May Lopez PETIT COUTEAU SUISSE CRÉATIF. May Lopez Petit couteau suisse créatif

Notre modèle d engagement

: seul le dossier dossier sera cherché, tous les sousdomaines

S7 Le top 10 des raisons d utiliser PHP pour moderniser votre existant IBM i

Resolution limit in community detection

Curriculum Vitae. GISBERT Aurélien Ingénieur Informatique INSA Senior Business & Data Analyst Business Intelligence 11 ans d expérience

PostgreSQL, le cœur d un système critique

Pierre Vélon

Master Informatique Aix-Marseille Université

Big Data et Prévisions. Philippe Picard, le 24 juin Page 1

Technologies du Web. Créer et héberger un site Web. Pierre Senellart. Page 1 / 26 Licence de droits d usage

Correction du baccalauréat STMG Polynésie 17 juin 2014

Aide : publication de décisions VS

Une famille d'applications permettant à toute organisation d'optimiser le suivi et la gestion de ses ressources internes vous présente

Catalogue des Formations Techniques

EP60.92 Projet d application pluridisciplinaire La chasse aux trésors

SMS. Vocalisés. CleverSMS. Maîtrisez votre communication!... Solution immédiate, simple et intuitive pour l envoi de tous messages, via le Web (SaaS).

Stages ISOFT : UNE SOCIETE INNOVANTE. Contact : Mme Lapedra, stage@isoft.fr

Synthèse «Le Plus Grand Produit»

Bonjour, Clara Bove-Ziemann Rue du Faubourg Saint-Honoré, Paris, France +33 (0)

We make your. Data Smart. Data Smart

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21

Recommandation prédictive

Caruso33 : une association à votre service

CATALOGUE DES FORMATIONS 2014

INGÉNIEUR - DÉVELOPPEUR EXPÉRIMENT É PHP. 27 ans - 6 ans d'expérience

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments»

Efficacité énergétique pour les particuliers : une solution pour le monitoring énergétique

Agenda de la présentation

D'UN SITE INTERNET LES S D'UN SITE INTERNET PRATIQUE ET PERFORMANT PRATIQUE ET PERFORMANT

DIRECTEUR / CHEF DE PROJETS / CONSULTANT. «Project Management Institute PMP»

Thème : Création, Hébergement et référencement d un site Web

L expérience citoyenne numérique. Solutions et expertises pour répondre aux enjeux des territoires

LICENCE PROFESSIONNELLE SYSTEMES INFORMATIQUES & LOGICIELS

Programmation Web. Introduction

MSP Center Plus. Vue du Produit

Un bonne analyse de statistiques = La voie du succès!

Apprentissage incrémental par sélection de données dans un flux pour une application de sécurité routière

Formation GISEH Module rédacteur 7, 9 juin 5, 12 juillet 2011

COMPÉTENCES TECHNIQUES

Transcription:

CNAM 6 mars 205 Frank Meyer Orange Labs / IMT / UCE / CRM-DA / PROF

2 UCE / CRM-DA / PROF

Application prototype pour l apprentissage multi-label interactif 2 sous-applications en ligne (utilisable par vous pour des tests) Vipe-VOD : démonstrateur de système de recommandation multi-profil ou multicritères Vipe-Tweet : démonstrateur de système de reconnaissance de concepts sur petits textes très bruités, les tweets Développée en mode application web PHP pour l applicatif WEB, + HTML5 et Javascript MySQL (pour le moment) pour le SGBD Algorithme d apprentissage en JAVA Par la suite, on approfondit uniquement Vipe-Tweet 3 UCE / CRM-DA / PROF

-Tweet : particularités Principales particularités de -Tweet Prototype text-mining temps-réel Apprentissage interactif apprentissage quasi temps réel Fonctionnement via une IHM intuitive (pas de cycle batch modélisation / application du modèle) Vipe classe tous les tweets dans les catégories apprises (soit comme exemple positif, soit comme exemple négatif) ; les mises à jour sont prises en compte en quasi temps-réel Démonstrateur : système de classification et de veille de la twittosphere surveille des villes toutes les heures, récupère des tweets autour de ces villes, classe les tweets selon des catégories personnalisées 4 UCE / CRM-DA / PROF

-Tweet recherche de tweets par mots-clés (pour ensuite les donner en exemples ou contre-exemples) Utilisateur / profil actuel sélection courante «Concept» courant actif (catégorie de tweets recherchée): ici, «concurrence» Tweets correspondant à la sélection courante (parlant de «concurrence») Pour créer d autres «Concepts» Nombre d exemples positifs déjà donnés pour «problèmes freenautes») Nombre d exemples négatifs donnés pour «problèmes freenautes») 5 UCE / CRM-DA / PROF Voyant vert : le concept est appris (les scores prédictifs sont à jour)

-Tweet Cliquer sur un tweet pour l ouvrir... 6

-Tweet... puis classer le tweet, positivement ou négativement, dans les catégories souhaitées 7

-Tweet FOCUS : spécifier les mots clés et les lieux complémentaires qui doivent être suivis 8

-Tweet : à l intérieur est une application WEB composée de 5 modules Module de récupération des Tweets Toutes les heures, va chercher, sur + de 00 villes de France (plus San Francisco, Londres et Madrid) des Tweets... au hasard,... ou correspondant à des «focus» utilisateurs Module de gestion de la base de données Intègre les Tweets, gère la matrice Tweet X Mots-clés, efface les anciens Tweets ; gère les utilisateurs et leurs concepts (exemples et contreexemples) Module Applicatif Web Gère l IHM Module de scoring Pré calcule les scores prédictifs pour les concepts, mise à jour toutes les 30s Algorithme prédictif de type anytime (Molecule) non détaillé ici. 9 UCE / CRM-DA / PROF

: principe de l apprentissage Représentation des Tweets et des concepts Grande matrice creuse 2 zones : descriptions des Tweets (données explicatives, logs des concepts (données cibles) apprentissage fait par cycles, proportionnellement /0 du temps sur les mots clés, 9/0 sur les concepts Mot clé n Mot-clé n 2 Orange SFR Jus Shosh Free Problème couleur Mairie passer à cher Mot-clé N Concept Concept 2 Orange TM Concurrence Churn (changement opérateur) Concept N Tweet n Tweet n 2 Tweet n i Tweet n M On utilise un algorithme de factorisation rapide de matrice pour apprendre en quasi-temps réel. 0 UCE / CRM-DA / PROF

Volumétrie (mai 204) une passe d apprentissage dure environ 5 secondes environ 222 000 mots clés (colonnes) quelques dizaines de concepts Mot clé n Mot-clé n 2 Orange SFR Jus Shosh Free Problème couleur Mairie passer à cher Mot-clé N Concept Concept 2 Orange TM Concurrence Churn (changement opérateur) Concept N Tweet n Tweet n 2 environ 67 000 tweets (lignes) Tweet n i Tweet n M environ 400 000 logs liés aux contenus des tweets (moyenne de 8 mots clés par tweets environ) UCE / CRM-DA / PROF environ 800 logs liés aux exemples / contre-exemples de concepts utilisateurs

est un bon cas d usage pour expérimenter des systèmes interactifs multi-labels (multi-cibles) sur données massives centaines de milliers de colonnes (mots clés possibles) centaines de concepts (système multiutilisateurs) Mot clé n Mot-clé n 2 Orange SFR Jus Shosh Free Problème couleur Mairie passer à cher Mot-clé N Concept Concept 2 Orange TM Concurrence Churn (changement opérateur) Concept N Tweet n Tweet n 2 centaines de milliers de lignes (tweets) Tweet n i Tweet n M variables explicatives variables cibles 2 UCE / CRM-DA / PROF

POUR TESTER : http://prof.orange-labs.fr/vipe/index.php 3 UCE / CRM-DA / PROF