Analyse exploratoire de données

Documents pareils
ProxiLens : Exploration interactive de données multidimensionnelles à partir de leur projection

La classification automatique de données quantitatives

Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining.

Introduction au Data-Mining

La segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM

Tableau de recueil des données concernant l auto évaluation. Nom de la structure :

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Accélérer l agilité de votre site de e-commerce. Cas client

Partie I Stratégies relationnelles et principes d organisation... 23

CRM Service. Exemples de secteurs concernés. Fonctionnalités clés. Gestion de l activité quotidienne. Gestion complète de la force de vente

Agenda de la présentation

GROUPE IDRAC Bachelor Responsable de Communication 3 ème Année Juin 2014

SERVICE : NEWSLETTER

Plateforme AnaXagora. Guide d utilisation

Méthodes et techniques de la Prospection commerciale

IFT 6261: L Analytique Web. Fares Aldik, Consultant principal, Analytique Web et optimisation Bell Marchés Affaires services d expérience client

VISUALISATION DES DISTANCES ENTRE LES CLASSES DE LA CARTE DE KOHONEN POUR LE DEVELOPPEMENT D'UN OUTIL D'ANALYSE ET DE REPRESENTATION DES DONNEES

Un nouveau regard sur votre marketing relationnel

Gestion de la Relation Client (GRC)

Première partie. Sous Projet 2. Classification et Dimensionnement

Des données à la connaissance client. A la découverte de la plateforme de connaissance client knowlbox

EN MAÎTRISANT INTERNET, APPORTEZ UN NOUVEL ÉLAN À VOTRE ACTIVITÉ

L AMPHI #2 LA REVOLITION MOBILE EST EN MARCHE. #Amphi2GIW

Logiciel XLSTAT version rue Damrémont PARIS

COLLOQUE Solaire thermique & Habitat collectif. François GIBERT directeur EKLOR. Instrumentation et régulation : la vision d un fabricant

FACILITER LES COMMUNICATIONS. Le gestionnaire de réseau VPN global de Saima Sistemas

La diffusion des technologies de l information et de la communication dans la société française

DEMANDE D INFORMATION RFI (Request for information)

Marc Meynardi International Sarl 13 Rue de la Poste ANNECY - France Tel : +33 (0)

NOTICE D UTILISATION

Comment Créer & Envoyer Votre Newsletter

25 October 2013 Dossier Confidentiel MTS CONSULTING ORCA. ORCA est une suite d outils d informatique décisionnel dédiée aux télécoms.

Ebauche Rapport finale

La 1 ère suite marketing web + mobile + social des TPE/PME. Présentation

Métrologie réseaux GABI LYDIA GORGO GAEL

AnaXagora LMS v3.0. Guide d utilisation

L analyse de la gestion de la clientèle

matthieumarce.com - Fiches pratiques - ing ing

Les dessous des moteurs de recommandation

COURS SYRRES RÉSEAUX SOCIAUX INTRODUCTION. Jean-Loup Guillaume

Les critères de segmentation Critères Variables retenues Description Exemple Pays, région, ville, Chauffage,

Un logiciel pour aller plus loin dans la gestion de vos espaces. Mémo technique

MS PROJECT Prise en main. Date: Mars Anère MSI. 12, rue Chabanais PARIS E mail : jcrussier@anere.com Site :

Des outils. pour les industriels et les distributeurs. Analysez. Valorisez. Optimisez. vos produits. vos produits. vos produits

CRM PERFORMANCE CONTACT

Mesurage de la qualité acoustique de revêtements. acoustique de revêtements

Extraction d informations stratégiques par Analyse en Composantes Principales

LE PUBLIPOSTAGE OU MAILING

Retrouver les informations demandées dans les différents rapports Utiliser les fonctionnalités des rapports Utiliser la segmentation avancée

achat shopping fidèlisation animation magnétic communication magnétic communication magnéti CENTRES COMMERCIAUX VILLAGES trafic DE MARQUES

TRAITEMENT DES DONNEES MANQUANTES AU MOYEN DE L ALGORITHME DE KOHONEN

L entreprise virtuelle

Webinar EBG Nouvelles perspectives d'exploitation des données clients avec le big data

W3MS Web, Marketeur, Manager de Médias sociaux

Description du programme du Master M2 MIAGE SIIN (1)

Cognit Ive Cas d utilisation

Introduction au Data-Mining

EXEMPLE DE RAPPORT D'AUDIT. Site Internet

Conception d un outil d aide au déploiement d un réseau EV-DO dans un concept IMS pour l opérateur CAMTEL

Atelier du 25 juin «Les bonnes pratiques dans l ing» Club

1 La visualisation des logs au CNES

Les bases de données

Consumer. Fiche Synthètique. Journey. Enquête sur les parcours d achat Secteur Fournisseurs d accès à internet (FAI)

formations Le Guide de FORMATIONS 1er semestre 2015 DÉVELOPPEZ VOTRE ACTIVITÉ PAR L ENRICHISSEMENT DE VOS COMPÉTENCES COMMERÇANTES + D INFO

Masters Spécialisés «Actuariat et Prévoyance» et «Actuariat et Finance»

Chapitre 1 : Introduction au contrôle de gestion. Marie Gies - Contrôle de gestion et gestion prévisionnelle - Chapitre 1

Introduction : présentation de la Business Intelligence

ballester~consulting Etude MD Expo 2007 L'utilisation du marketing direct multicanal État des lieux et tendances

Les réseaux de campus. F. Nolot

AIDE EN LIGNE ESPACE EPARGNANTS

Management des Systèmes d Information

D'UN SITE INTERNET LES S D'UN SITE INTERNET PRATIQUE ET PERFORMANT PRATIQUE ET PERFORMANT

ilottery 2.0 DÉVELOPPER LE JEU En collaboration avec

Comprendre le Big data grâce à la visualisation

Virtual PBX Quick User Guide

Contenu Acomba 9.57 ATELIER 1 VUE D ENSEMBLE DU PROGRAMME ATELIER 3 RAPPORTS ATELIER 2 MODULE COMPTABILITÉ TRANSACTIONS ATELIER 4 MODULE CLIENTS.

Présentation de nos prestations

Baccalauréat professionnel GESTION ADMINISTRATION

Mesurer son ROI Partie 2

Cette solution s adresse aussi bien aux PME/PMI qu aux grands groupes, qu ils disposent ou non d une structure de veille dédiée.

MGP 702c Marketing & Financement d événements. Remarques (1) Remarques (3) Remarques (2)

Historique. Architecture. Contribution. Conclusion. Définitions et buts La veille stratégique Le multidimensionnel Les classifications

Laboratoire de Haute Sécurité. Télescope réseau et sécurité des réseaux

Mail Tracking V3.0.4 Logiciel de traçabilité de messages électroniques et de suivi comportemental à usage multiple

Patrick NCHO Chef de projet Interactif et Marketing relationnel / patrickncho@gmail.com

EUDONET EN 2014 QUI SOMMES NOUS? 800 RÉFÉRENCES CLIENTS ÉDITEUR ET INTÉGRATEUR DE EUDONET + 14 ANS D EXPÉRIENCE

Quel que soit votre budget, vous pouvez diffuser vos annonces sur Google et son réseau publicitaire.

INF6304 Interfaces Intelligentes

CRM pour le marketing

INSTALLATION ET LANCEMENT DU CONNECTEUR E-SIDOC

ÉCOLE POLYTECHNIQUE FÉDÉRALE DE LAUSANNE. Manuel de formation. Achats

Mon Budget Guide d utilisateur Windows Phone 7

Search Engine Marketing. Impact des campagnes marketing

KDP DATA. Location d'adresses , GSM, postales, téléphoniques, Collecte, qualification, enrichissement de données,

demander pourquoi mon site n'apparaît pas sur google ou pourquoi mon site n'est pas référencé par les moteurs de recherche?

SAP BusinessObjects Web Intelligence (WebI) BI 4

Guide d équipement des BTS commerciaux

BEE Agency est une AGENCE DE CONSEIL et de COMMUNICATION spécialisée dans les SOLUTIONS DIGITALES, le Web-Marketing et le développement durable.

Transcription:

Analyse exploratoire de données Françoise Fessant TECH/SUSI 28/09/2006

Sommaire Analyse exploratoire de données Cartes de kohonen Analyse des usages ADSL p2

Analyse exploratoire de données Construction de segments Produire de la connaissance sur les données Visualiser «intelligemment» cette connaissance Beaucoup d'individus (N) x beaucoup de variables (p) Effectuer des regroupements qui respectent la structure des données Rendre visibles les similarités entre données variables 1 p 1 Outil pour la segmentation : les cartes de Kohonen Permettent de réaliser une segmentation et de la visualiser Méthodologie d analyse Construction de segments interprétables, Qui soient riches et fidèles N observation p3

Cartes de Kohonen Permettent de réaliser une segmentation et de visualiser le comportement de la segmentation sur une carte «Projection» non linéaire sur un plan Qui respecte en dimension 2 les relations de similarité existant dans l espace de départ (en dimension p) Des données voisines dans l espace de départ sont voisines sur la carte Des régions proches ont des caractéristiques communes La carte fournit une visualisation intuitive des données, lisible par un non expert Carte des populations p4

Analyse des usages ADSL à partir de mesures de trafic Projet ATRACTION : Analyse du TRAfic Client pour l évolution des réseaux (RO&SI) Typologie des clients ADSL sur la base de leurs usages Données issues du réseau des sondes Otarie (CORE/M2I) Trafics regroupés sur 13 catégories de ports Unknown, web, P2P, FTP, News, Mail, DB, others, control, games, streaming, chat, VoIP Campagne de mesure sur le long terme 9 sites géographiques (~15 000 clients) Début des mesures : janvier 2003 Format des données Chaque jour, pour chaque client, les volumes échangés dans les sens de trafic montant et descendant sur les 13 catégories par plage de 6 p5

Analyse des usages mensuels (1) Analyse d'un site géographique (~2000 clients ADSL) Un client est défini par ses volumes mensuels par catégorie, recodés en statistique d'ordre En fonction du volume échangé, chaque client est représenté par son rang pour chaque catégorie Toutes les catégories sont mises sur le même plan ce qui permet de se focaliser sur les usages et non sur les volumes p6

Analyse des usages mensuels (2) Déroulement d'une analyse N observations T variables T Carte des populations Carte des clusters Profils moyens des clusters N Après apprentissage un individu est associé à l'hexagone de la carte le plus proche La taille de l'hexagone est proportionnelle au nombre de ses individus Clustering hiérarchique sur la carte pour faciliter son interprétation Chaque groupe est représenté par son profil moyen p7 Au final Regroupement des clients qui ont une activité similaire Segments de clients typiques décrits sur la base des volume journaliers

Analyse des segments 7 segments de clients typiques très actif sur l'ensemble des applications, 25% très actif sur toutes les applications sauf le Mail, 9% activité plus forte que la moyenne sur les applications Web, Streaming et Mail et usage plus faible des autres applications, 7% activité plus forte que la moyenne sur les applications Web, FTP, News, Streaming, control et Mail une activité moyenne sur les autres applications, 7% usage moyen des applications, 20% peu actif sur l'ensemble des applications, 22% très peu actif sur l'ensemble des applications, 10% C 1 C 2 C 3 C 4 C 5 C 6 C 7 Description globale des segments 1 % < 1 % 7 6 % 3 % 1 % 8 % répartition du volume dans les segments 1 1 % pourcentage de clients dans les segments Mail, Web, FTP Les 7 segments sur la carte de Kohonen : ACTIVITE Projection des contrats Netissimo 0, 1, 2, 3 Projection d'informations extérieures sur la carte p8

Analyse des variables Projections des clusters de variables Carte des clients p9 Profil des clusters de clients

Projections des clusters de variables Carte des clients p10 Profil des clusters de clients