Techniques d analyse et de conception d outils pour la gestion du processus de segmentation des abonnés des entreprises de télécommunication
|
|
|
- Sophie David
- il y a 10 ans
- Total affichages :
Transcription
1 Techniques d analyse et de conception d outils pour la gestion du processus de segmentation des abonnés des entreprises de télécommunication R. Carlos Nana Mbinkeu 1,3, C. Tangha 1, A. Chomnoue 1, A. Kuete 2 1 Ecole Nationale Supérieure Polytechnique - Université de Yaoundé I, Cameroun 2 Orange Cameroun SA Groupe France Télécom 3 DBGroupLab Université de Modène, Italie {nana_mbinkeu, nanacarlos2004}@yahoo.fr, [email protected] RÉSUMÉ. La plupart des entreprises de télécommunication sont en possession d une remarquable quantité de données concernant leurs clients. Les connaissances que l on voudrait découvrir dans leurs bases de données sont par exemple l éventuel regroupement des abonnés au sein de sousensembles homogènes dont les membres ont des comportements de consommation similaires. On parle de segmentation de la clientèle. Cette segmentation va permettre d identifier et de sélectionner les clients les plus susceptibles de réagir favorablement aux offres. Notre article propose des techniques d analyse et de conception d outils qui permettent de gérer le processus d acquisition des données, de nettoyage des données et le choix de l algorithme de segmentation. ABSTRACT. Most telecommunications providers already possess a remarkable amount of data about their customers. The knowledge that we would discover in the database of telecommunications providers is vital to understanding the customers, and why high customer churn and declining brand loyalty continue to erode profit margins. We talk about customer segmentation. The segmentation will identify and select the customers most likely to respond favorably to offers. Our paper proposes a set of techniques to analyze and conceive tools that manages the process of data acquisition, data cleaning and selection of the segmentation algorithm. Our techniques help manage the process of segmentation of subscribers. MOTS-CLÉS : Fouille de donnée, datawarehouse, télécommunication, marketing, segmentation. KEYWORDS: Data Mining, datawarehouse, telecommunication, marketing, segmentation. Pages 1 à 8
2 2 1. Introduction L industrie des télécommunications génère et stocke d énormes quantités de données [1]. Ces données incluent les détails sur les abonnés, leurs utilisations du réseau, l état des composantes matérielles et logicielles de ce réseau [1]. Mais ce potentiel énorme n est pas toujours exploité de manière optimale. La fouille des données consiste tout d abord à extraire les connaissances utiles de la masse d informations disponibles. Les connaissances ainsi récoltées peuvent être employées à différentes fins: interpeller individuellement les clients, présenter des offres adaptées aux groupes cibles, prédire le comportement des clients. Ces connaissances permettent aussi d identifier les clients susceptibles d aller à la concurrence : on parle de churn [1]. La segmentation est très importante dans le domaine du marketing direct [2]. L objectif de notre article est de proposer des techniques d analyse et de conception d outils capables de gérer tout le processus de segmentation de la clientèle d une compagnie de téléphonie mobile. Ces techniques facilitent la gestion automatisée des phases d acquisition et de nettoyage des données, le choix de l algorithme de segmentation, la visualisation des segments recherchés et des statistiques [5]. Ce papier est organisé de la manière suivante : la section 2 nous présente les outils de fouille de données. Dans la section 3, nous présentons la gestion du processus d acquisition des données. La section 4 fait une description du prototype réalisé. Nous terminons par une conclusion. 2. Les outils de fouille de données La fouille de données n'existerait pas sans outils. Les logiciels de fouille de données sont des programmes spécialisés dans l'analyse et l'extraction des connaissances à partir des données informatisées. Actuellement, les outils les plus utilisés sont : SPSS, RapidMiner, SAS, Excel, R, KXEN, Weka, Matlab, Knime, Microsoft SQL Server, Oracle DM et STATISTICA [3]. La plupart de ces outils ne permettent pas une utilisation aisée et intuitive par des personnes non experte en fouille de données. Nos techniques permettent d automatiser la gestion du processus de segmentation des abonnés. L implémentation de ces techniques dans la conception d outils va permettre aux personnes non expertes de faire de la segmentation. Elles permettent la prise en charge de toute base de données relationnelle. Dans le cadre de notre étude et la réalisation d un prototype, nous avons utilisé un datawarehouse sous le SGBD Oracle et le serveur de datamining JDM [4,10]. Les opérations liées à la segmentation et définies par l expert. Nos techniques utilisent la méthode CRISP-DM [5,6].
3 Gestion du processus de segmentation des abonnés 3 3. Gestion du processus d acquisition des données 3.1. Compréhension des données La compréhension des données à partir d une base de données existante peut nécessiter la définition d une ontologie. Une ontologie est la spécification d'une conceptualisation d'un domaine de connaissance [7]. Le choix des méthodes à mettre en œuvre pour préparer les données, notamment pour discrétiser certaines, repose en grande partie sur cette étape, au cours de laquelle l'ontologie doit être construite. Cette ontologie est une ontologie d'application, c'est-à-dire que les concepts définis dépendent à la fois du domaine étudié mais aussi de la tâche à effectuer. L ontologie permet l établissement d un niveau supérieur d abstraction des données afin de simplifier le processus de découverte de connaissance en termes de réutilisabilité. Dans notre cas, nous devons représenter de façon formelle les concepts issus de la compréhension du domaine et les mettre en relation avec les tables du data-warehouse. Euler et Scholz présentent une méthode utilisant des ontologies pour la modélisation des connaissances et leur interconnexion avec les données en base [7]. Nous nous sommes inspirés de leur travail pour construire notre modèle de données dans le formalisme que nous présentons à la section suivante Construction d une ontologie applicative La construction de l ontologie permet de modéliser les données à deux niveaux. Au premier niveau, on retrouve les tables telles qu existant dans le data-warehouse. Au second niveau, le concept et ses attributs nous permettent de décrire les données de manière plus abstraite. Cette approche nous permet d obtenir une nouvelle vue de la base de données existante pouvant contenir une ou plusieurs tables virtuelles [7]. Nous appelons concept le sujet d apprentissage faisant l objet de la segmentation et nous avons dit que les instances d un concept sont caractérisées par des attributs. Un avantage de cette modélisation à deux niveaux est qu il permet sa réutilisation sur une nouvelle base de données juste en refaisant l interconnexion entre les deux niveaux [7]. Considérons par exemple le concept «abonné» caractérisé par un numéro de téléphone et d autres attributs significatifs pour le processus de segmentation. Les instances du concept sont obtenues en définissant pour chaque attribut une expression SQL sur une ou plusieurs colonnes des tables du data-warehouse. Le niveau conceptuel obtenu représente donc une ontologie du domaine et offre une vue simplifiée et plus compréhensible des données du data-warehouse. Nous proposons à la sous-section 3.2.2, une procédure générale pour le calcul des instances des attributs associés aux concepts définis au niveau conceptuel.
4 La dimension temps Nous étudions le comportement des abonnés sur une certaine période. Elle peut être définie en jours, en semaines, en mois etc Nous nous servirons donc des mois pour définir les périodes. Les tables du data warehouse possèdent en général chacune une colonne définissant la date des évènements qu elle enregistre. Les tables les plus granulaires donnent le jour et l heure de l évènement, d autres plus agrégées donnent plutôt la semaine ou le mois. Nous allons spécifier pour chaque table une expression donnant le mois d occurrence des évènements Calcul des attributs du concept Nous mettons en relation les attributs du concept et les tables à partir desquelles leurs valeurs sont calculées. Nous spécifions pour chaque attribut du concept : - la table (les tables) à partir de laquelle (desquelles) sa valeur est calculée - une expression qui donne la valeur de l attribut à partir d une ou de plusieurs colonnes de la table (des tables). Plusieurs attributs du concept peuvent être liés à la même table du data warehouse. Dans ce cas une discrimination est incluse dans l expression de calcul. Le modèle de données défini dans le formalisme présenté ci-dessus a des attributs qui sont en relation avec les tables du data-warehouse. Nous proposons maintenant une procédure permettant de recueillir dans la table virtuelle la valeur de ses attributs pour chaque abonné. Elle s exécute comme suit : 1. Regrouper les attributs en fonction des tables auxquelles ils sont liés; 2. Créer une requête sur chaque table en se servant des expressions de calcul de chaque attribut ; 3. Exécuter les requêtes ainsi obtenues. Notons que ces requêtes peuvent être exécutées en parallèle ; 4. Joindre les résultats pour obtenir l ensemble des valeurs des attributs dans la table virtuelle créée ad hoc. Le modèle de données défini dans le formalisme ci-dessus est évolutif. Des attributs peuvent être ajoutés ou retirés du concept, l interconnexion entre les tables et les attributs peut être modifiée et cette modification sera automatiquement prise en compte lors de la prochaine exécution du processus de collecte des données. On obtient donc un faible couplage entre le niveau conceptuel et les tables du data warehouse. Ce faible couplage répond au besoin des utilisateurs de pouvoir étendre le concept (prendre en compte de nouveaux attributs) lors des éventuelles segmentations.
5 Gestion du processus de segmentation des abonnés Traitement de la qualité des données La qualité des données des tables virtuelles doit être analysée. Par conséquent, les données sont nettoyées, puis réduites avant d être soumises au serveur de datamining JDM [4,10] qui se chargera de leur séparation en segments. La réduction du concept consiste à éliminer certains attributs du concept qui n ont aucun impact sur le calcul des segments recherchés (la procédure de calcul est illustrée au 3.3.2). Des statistiques seront ensuite calculées sur les attributs restant pour obtenir les différents segments Nettoyage des données Traitement des valeurs inexistantes Les attributs peuvent avoir des valeurs nulles (absence de valeur). Les valeurs absentes dans ces cas sont dues en général à la non utilisation de certains services par les abonnés. Par défaut, nous remplaçons les valeurs inexistantes par 0, sauf dans le cas où l utilisateur spécifiera l un des traitements suivants pour un attribut: - suppression : les instances n ayant pas de valeur pour cet attribut seront écartées de l ensemble pour la suite du processus ; - substitution : les valeurs inexistantes seront remplacées par une valeur réelle spécifiée par l utilisateur ; Traitement des valeurs extrêmes Nous avons choisi lors du processus de construction des segments d éliminer les instances extérieures à un intervalle de confiance autour de la moyenne. Dans l approche que nous proposons, l utilisateur peut soit : - Spécifier un intervalle de confiance pour chaque attribut ; - Spécifier des valeurs maximales et minimales pour chaque attribut. Les instances se retrouvant à l extérieur de l intervalle défini seront écartées Réduction du concept L opération de réduction du concept permet de choisir les attributs qui seront effectivement utilisés pour la construction des segments [9]. Pour cela le système exécutera automatiquement les tâches que nous avons décrites dans les phases antérieures. La procédure de réduction est la suivante : Eliminer les attributs qui ne varient pas suffisamment 1. Calculer la variance des différents attributs après normalisation ;
6 6 2. Eliminer les attributs dont la variance est en dessous d un seuil fixé par l utilisateur. Séparer les attributs fortement corrélés 1. Regrouper les attributs en paires ; 2. Calculer le coefficient de corrélation pour chaque paire ; 3. Ranger les paires par ordre de corrélation décroissante ; 4. Etablir un classement des attributs en fonction de la plus grande corrélation de chacun avec un autre attribut en dessous du seuil (0,9 par défaut) ; 5. Parcourir les couples ayant une corrélation au-dessus du seuil et éliminer dans chaque couple l un des deux attributs (s il n est pas déjà éliminé) ; Appliquer le principe de description de longueur minimale : Dans le cas où le nombre d attributs après les étapes d élimination citées ci-dessus reste au-dessus d un maximum fixé, le principe de description de longueur minimale peut être appliqué à l aide de l algorithme attribute importance spécifié dans le standard JDM [4,10]. Cela implique des interactions avec le serveur JDM. Les attributs seront classés en fonction de leur importance dans la prédiction d un attribut cible (par défaut le revenu généré joue ce rôle) et les moins importants seront écartés. Les données obtenues après les étapes décrites plus haut sont prêtes à être élaborées par les différents algorithmes de segmentation [11]. Les données sont accessibles à partir du serveur de datamining. 4. Prototype : Fonctionnement Notre prototype a pour objectif de faciliter la gestion du processus de segmentation par des utilisateurs non experts en s inspirant de l approche de Daniel C. Robbins [8] et en tenant compte de notre contexte de travail. Dans le cadre de notre collaboration avec l opérateur téléphonique Orange, nous avons implémenté une application web qui permet de réaliser la segmentation des abonnés en utilisant l'approche décrite ci-dessus. Nous montrons dans la figure 1, les différents algorithmes [11] (K-means, O-cluster, etc.) qui peuvent être utilisés dans notre application web de fouille de données. L'utilisateur pour collecter les données à analyser, définit une vue à la base de données et crée l'interconnexion avec les tables de la base de données (figure 2). Chaque vue est associée à un ensemble d attributs. L'utilisateur spécifie pour chaque attribut : l'expression de la requête qui va sélectionner les données dans les tables existantes.
7 Gestion du processus de segmentation des abonnés 7 Figure 1. Choix des algorithmes Le système guide l'utilisateur dans la phase de nettoyage des données (figure 3). L'utilisateur définit un ensemble d'opérations qui permettent de sélectionner les attributs pertinents (variance, corrélation). Toutes ces tâches de base définies par l'utilisateur sont stockées dans un fichier XML de l application web. Cela a l'avantage d'automatiser le processus des futures segmentations car il ne sera plus nécessaire de redéfinir les tâches citées ci-dessus. Figure 2. Définition des attributs de la Vue (concept) L application de fouille de données, que nous avons implémentée, a été utilisée par un operateur de téléphonie. Elle a été en mesure de gérer le processus de segmentation sur un ensemble de sept millions d'abonnés, à la grande satisfaction de l operateur.
8 8 Figure 3. Gestion de la qualité des données 5. Conclusion Nous avons proposé un ensemble de techniques qui aident à l analyse et la conception d outils pour la gestion du processus de segmentation des abonnés des entreprises de télécommunication. Ces techniques permettent aux personnes non expertes de faire de la segmentation grâce à une gestion automatisée du processus. Un prototype a été implémenté et est utilisé actuellement par Orange Cameroun. Comme perspective, nous envisageons d étendre ce travail en proposant l ajout de nouvelles fonctionnalités suivant d autres secteurs d activités. 6. Bibliographie 1. Gary M. Weiss. Data Mining in the Telecommunications Industry. Data Mining and Knowledge Discovery Handbook 2005, Part 12, Edmunds Communications Group. The Importance of Data Mining and Segmentation in Direct Marketing, K. Rexer, H. Allen, & P. Gearan, Data Miner Survey Summary, Oct Oracle Data Mining Application Developer's Guide 11g and Java API. 5. P. Chapman et al. CRISP-DM 1.0 Step-by-step data mining guide (2000). 6. A. Azevedo. KDD, SEMMA and CRISP-DM: A Parallel Overview, Tim Euler and Martin Scholz. Using Ontologies in a KDD Workbench, In Workshop on Knowledge Discovery and Ontologies at ECML-PKDD Daniel C. Robbins et al. ZoneZoom: map navigation for smartphones with recursive view segmentation, AVI 04, January Igor Kononenko. Evaluating the Quality of Attribute, Oracle Data Mining Concepts, 10g release 2. Part Number B Ayaz Ali, A. Bagherjeiran and Chen. Scalable Clustering Algorithms, 2004
données en connaissance et en actions?
1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)
THOT - Extraction de données et de schémas d un SGBD
THOT - Extraction de données et de schémas d un SGBD Pierre-Jean DOUSSET (France), Benoît ALBAREIL (France) [email protected], [email protected] Mots clefs : Fouille d information, base de données, système
Information utiles. [email protected]. webpage : Google+ : http://www.ibisc.univ-evry.fr/ digiusto/
Systèmes de gestion de bases de données Introduction Université d Evry Val d Essonne, IBISC utiles email : [email protected] webpage : http://www.ibisc.univ-evry.fr/ digiusto/ Google+ : https://plus.google.com/u/0/b/103572780965897723237/
Introduction à la B.I. Avec SQL Server 2008
Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide
Didier MOUNIEN Samantha MOINEAUX
Didier MOUNIEN Samantha MOINEAUX 08/01/2008 1 Généralisation des ERP ERP génère une importante masse de données Comment mesurer l impact réel d une décision? Comment choisir entre plusieurs décisions?
Business Intelligence avec SQL Server 2012
Editions ENI Business Intelligence avec SQL Server 2012 Maîtrisez les concepts et réalisez un système décisionnel Collection Solutions Informatiques Extrait Alimenter l'entrepôt de données avec SSIS Business
Introduction au datamining
Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des
Spécifications, Développement et Promotion. Ricco RAKOTOMALALA Université Lumière Lyon 2 Laboratoire ERIC
Spécifications, Développement et Promotion Ricco RAKOTOMALALA Université Lumière Lyon 2 Laboratoire ERIC Ricco? Enseignant chercheur (CNU.27) En poste à l Université Lyon 2 Faculté de Sciences Eco. Recherche
Introduction à ORACLE WAREHOUSE BUILDER Cédric du Mouza
Introduction à ORACLE WAREHOUSE BUILDER Cédric du Mouza Avant de commencer à travailler avec le produit, il est nécessaire de comprendre, à un haut niveau, les problèmes en réponse desquels l outil a été
Agenda de la présentation
Le Data Mining Techniques pour exploiter l information Dan Noël 1 Agenda de la présentation Concept de Data Mining ou qu est-ce que le Data Mining Déroulement d un projet de Data Mining Place du Data Mining
Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise.
Solutions PME VIPDev Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise. Cette offre est basée sur la mise à disposition de l ensemble de nos compétences techniques et créatives au service
et les Systèmes Multidimensionnels
Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Datawarehouse (DW) Le Datawarehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées
Chapitre 9 : Informatique décisionnelle
Chapitre 9 : Informatique décisionnelle Sommaire Introduction... 3 Définition... 3 Les domaines d application de l informatique décisionnelle... 4 Architecture d un système décisionnel... 5 L outil Oracle
Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours
Information du cours Informatique décisionnelle et data mining www.lia.univ-avignon.fr/chercheurs/torres/cours/dm Juan-Manuel Torres [email protected] LIA/Université d Avignon Cours/TP
BUSINESS INTELLIGENCE
GUIDE COMPARATIF BUSINESS INTELLIGENCE www.viseo.com Table des matières Business Intelligence :... 2 Contexte et objectifs... 2 Une architecture spécifique... 2 Les outils de Business intelligence... 3
Une méthode d apprentissage pour la composition de services web
Une méthode d apprentissage pour la composition de services web Soufiene Lajmi * Chirine Ghedira ** Khaled Ghedira * * Laboratoire SOIE (ENSI) University of Manouba, Manouba 2010, Tunisia [email protected],
INTRODUCTION AU DATA MINING
INTRODUCTION AU DATA MINING 6 séances de 3 heures mai-juin 2006 EPF - 4 ème année - Option Ingénierie d Affaires et de Projets Bertrand LIAUDET TP DE DATA MINING Le TP et le projet consisteront à mettre
INTELLIGENCE MARKETING ETUDES DE MARCHE - DATA MINING - CONSEIL EN MARKETING - SYSTEMES D INFORMATION MARKETING
ETUDES DE MARCHE - DATA MINING - CONSEIL EN - SYSTEMES D INFORMATION Notre mission Des études de marché au data mining Cinq sur Cinq est un institut d intelligence marketing. Notre métier : collecter,
Méthodologie de conceptualisation BI
Méthodologie de conceptualisation BI Business Intelligence (BI) La Business intelligence est un outil décisionnel incontournable à la gestion stratégique et quotidienne des entités. Il fournit de l information
1 Introduction. Business Intelligence avec SharePoint Server 2010
Business Intelligence avec SharePoint Server 2010 1 Introduction Dans le chapitre précédent, nous avons créé une collection de sites et activé les fonctions de restitution décisionnelles du serveur SharePoint
BIRT (Business Intelligence and Reporting Tools)
BIRT (Business Intelligence and Reporting Tools) Introduction Cette publication a pour objectif de présenter l outil de reporting BIRT, dans le cadre de l unité de valeur «Data Warehouse et Outils Décisionnels»
Business Intelligence
avec Excel, Power BI et Office 365 Téléchargement www.editions-eni.fr.fr Jean-Pierre GIRARDOT Table des matières 1 Avant-propos A. À qui s adresse ce livre?..................................................
Présentations personnelles. filière IL
Présentations personnelles filière IL Résumé Liste de sujets de présentations personnelles. Chaque présentation aborde un sujet particulier, l'objectif étant que la lecture du rapport ainsi que l'écoute
Suite Jedox La Business-Driven Intelligence avec Jedox
Suite La Business-Driven Intelligence avec Une solution intégrée pour la simulation, l analyse et le reporting vous offre la possibilité d analyser vos données et de gérer votre planification selon vos
Entreposage de données complexes pour la médecine d anticipation personnalisée
Manuscrit auteur, publié dans "9th International Conference on System Science in Health Care (ICSSHC 08), Lyon : France (2008)" Entreposage de données complexes pour la médecine d anticipation personnalisée
Entrepôt de données 1. Introduction
Entrepôt de données 1 (data warehouse) Introduction 1 Présentation Le concept d entrepôt de données a été formalisé pour la première fois en 1990 par Bill Inmon. Il s agissait de constituer une base de
Cours Base de données relationnelles. M. Boughanem, IUP STRI
Cours Base de données relationnelles 1 Plan 1. Notions de base 2. Modèle relationnel 3. SQL 2 Notions de base (1) Définition intuitive : une base de données est un ensemble d informations, (fichiers),
Spécificités, Applications et Outils
Spécificités, Applications et Outils Ricco Rakotomalala Université Lumière Lyon 2 Laboratoire ERIC Laboratoire ERIC 1 Ricco Rakotomalala [email protected] http://chirouble.univ-lyon2.fr/~ricco/data-mining
BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise
BUSINESS INTELLIGENCE Une vision cockpit : utilité et apport pour l'entreprise 1 Présentation PIERRE-YVES BONVIN, SOLVAXIS BERNARD BOIL, RESP. SI, GROUPE OROLUX 2 AGENDA Définitions Positionnement de la
Objectif. Participant. Prérequis. Oracle BI Suite EE 10g R3 - Développer des référentiels. 5 Jours [35 Heures]
Objectif Utiliser les techniques de gestion de la mise en cache pour contrôler et améliorer les performances des requêtes Définir des mesures simples et des mesures calculées pour une table de faits Créer
DESCRIPTION DES PRODUITS ET MÉTRIQUES
DESCRIPTION DES PRODUITS ET MÉTRIQUES DPM Adobe - Adobe Analytics (2015v1) Les Produits et Services décrits dans cette DPM sont soit des Services On-demand soit des Services Gérés (comme décrits ci-dessous)
Conception des bases de données : Modèle Entité-Association
Conception des bases de données : Modèle Entité-Association La modélisation d un problème, c est-à-dire le passage du monde réel à sa représentation informatique, se définit en plusieurs étapes pour parvenir
SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)
Avant-propos 1. À qui s'adresse ce livre? 15 2. Pré-requis 15 3. Objectifs du livre 16 4. Notations 17 Introduction à la Business Intelligence 1. Du transactionnel au décisionnel 19 2. Business Intelligence
4. Utilisation d un SGBD : le langage SQL. 5. Normalisation
Base de données S. Lèbre [email protected] Université de Strasbourg, département d informatique. Présentation du module Contenu général Notion de bases de données Fondements / Conception Utilisation :
Libérez votre intuition
Présentation de Qlik Sense Libérez votre intuition Qlik Sense est une application nouvelle génération de visualisation de données en libre-service qui permet à chacun de créer facilement des visualisations
Le Langage SQL version Oracle
Université de Manouba École Supérieure d Économie Numérique Département des Technologies des Systèmes d Information Le Langage SQL version Oracle Document version 1.1 Mohamed Anis BACH TOBJI [email protected]
Bases de données avancées Introduction
Bases de données avancées Introduction Dan VODISLAV Université de Cergy-Pontoise Master Informatique M1 Cours BDA Plan Objectifs et contenu du cours Rappels BD relationnelles Bibliographie Cours BDA (UCP/M1)
Intelligence Economique - Business Intelligence
Intelligence Economique - Business Intelligence Notion de Business Intelligence Dès qu'il y a une entreprise, il y a implicitement intelligence économique (tout comme il y a du marketing) : quelle produit
Initiation aux bases de données (SGBD) Walter RUDAMETKIN
Initiation aux bases de données (SGBD) Walter RUDAMETKIN Bureau F011 [email protected] Moi Je suis étranger J'ai un accent Je me trompe beaucoup en français (et en info, et en math, et...)
La Stratégie d Intégration Advantage
La Stratégie d Intégration Advantage Intégration pour l Entreprise Synthèse Ces dernières années, les entreprises comptent sur moins de systèmes pour gérer leurs activités au quotidien et ont souvent implémenté
Introduction à la Fouille de Données (Data Mining) (8)
Introduction à la Fouille de Données (Data Mining) (8) Bernard ESPINASSE Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille Septembre 2008 Introduction à la fouille
La problématique. La philosophie ' ) * )
La problématique!" La philosophie #$ % La philosophie &'( ' ) * ) 1 La philosophie +, -) *. Mise en oeuvre Data warehouse ou Datamart /01-2, / 3 13 4,$ / 5 23, 2 * $3 3 63 3 #, 7 Datawarehouse Data warehouse
Transformation IT de l entreprise ANALYTIQUE: L ÈRE WATSON
Transformation IT de l entreprise ANALYTIQUE: L ÈRE WATSON L analytique joue un rôle désormais primordial dans la réussite d une entreprise. Les pouvoirs qu elle délivre sont incontestables, cependant
IBM Tivoli Monitoring, version 6.1
Superviser et administrer à partir d une unique console l ensemble de vos ressources, plates-formes et applications. IBM Tivoli Monitoring, version 6.1 Points forts! Surveillez de façon proactive les éléments
2 Serveurs OLAP et introduction au Data Mining
2-1 2 Serveurs OLAP et introduction au Data Mining 2-2 Création et consultation des cubes en mode client-serveur Serveur OLAP Clients OLAP Clients OLAP 2-3 Intérêt Systèmes serveurs et clients Fonctionnalité
Présentation du module Base de données spatio-temporelles
Présentation du module Base de données spatio-temporelles S. Lèbre [email protected] Université de Strasbourg, département d informatique. Partie 1 : Notion de bases de données (12,5h ) Enjeux et principes
Bases de Données. Plan
Université Mohammed V- Agdal Ecole Mohammadia d'ingénieurs Rabat Bases de Données Mr N.EL FADDOULI 2014-2015 Plan Généralités: Définition de Bases de Données Le modèle relationnel Algèbre relationnelle
SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)
SGBDR Systèmes de Gestion de Bases de Données (Relationnelles) Plan Approches Les tâches du SGBD Les transactions Approche 1 Systèmes traditionnels basés sur des fichiers Application 1 Gestion clients
Bases de données relationnelles
Bases de données relationnelles Système de Gestion de Bases de Données Une base de données est un ensemble de données mémorisé par un ordinateur, organisé selon un modèle et accessible à de nombreuses
INTRODUCTION AUX TECHNOLOGIES D INGENIERIE DES DONNEES DIRIGEE PAR LES MODELES
INTRODUCTION AUX TECHNOLOGIES D INGENIERIE DES DONNEES DIRIGEE PAR LES MODELES Les contenus de ce document sont la propriété exclusive de la société REVER. Ils ne sont transmis qu à titre d information
Hervé Couturier EVP, SAP Technology Development
Hervé Couturier EVP, SAP Technology Development Hervé Biausser Directeur de l Ecole Centrale Paris Bernard Liautaud Fondateur de Business Objects Questions à: Hervé Couturier Hervé Biausser Bernard Liautaud
MYXTRACTION. 2009 La Business Intelligence en temps réel
MYXTRACTION 2009 La Business Intelligence en temps réel Administration Qui sommes nous? Administration et management des profils Connecteurs Base des données Gestion des variables et catégories de variables
Data Mining. Master 1 Informatique - Mathématiques UAG
Data Mining Master 1 Informatique - Mathématiques UAG 1.1 - Introduction Data Mining? On parle de Fouille de données Data Mining Extraction de connaissances à partir de données Knowledge Discovery in Data
Communiqué de Lancement
Direction du Marketing Produits Sage - Division Mid Market Communiqué de Lancement Rapprochement Bancaire 1000 Produit : Rapprochement Bancaire 1000 Bases de Données : Oracle - MS/SQL Server Microsoft
UE 8 Systèmes d information de gestion Le programme
UE 8 Systèmes d information de gestion Le programme Légende : Modifications de l arrêté du 8 mars 2010 Suppressions de l arrêté du 8 mars 2010 Partie inchangée par rapport au programme antérieur Indications
Qu est-ce que ArcGIS?
2 Qu est-ce que ArcGIS? LE SIG ÉVOLUE Depuis de nombreuses années, la technologie SIG améliore la communication, la collaboration et la prise de décision, la gestion des ressources et des infrastructures,
Qu'est-ce que le BPM?
Qu'est-ce que le BPM? Le BPM (Business Process Management) n'est pas seulement une technologie mais, dans les grandes lignes, une discipline de gestion d'entreprise qui s'occupe des procédures contribuant
Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION. Mentions Ingénierie des Systèmes d Information Business Intelligence
É C O L E D I N G É N I E U R D E S T E C H N O L O G I E S D E L I N F O R M A T I O N E T D E L A C O M M U N I C A T I O N Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION Mentions
Votre Infrastructure est-elle? Business Intelligence. Améliorer la capacité d analyse et de décision de vos équipes
Votre Infrastructure est-elle? Business Intelligence Améliorer la capacité d analyse et de décision de vos équipes Sommaire Introduction : Les domaines d application de la Business Intelligence p. 4 Vue
ORACLE DATA INTEGRATOR ENTERPRISE EDITION - ODI EE
ORACLE DATA INTEGRATOR ENTERPRISE EDITION - ODI EE ORACLE DATA INTEGRATOR ENTERPRISE EDITION offre de nombreux avantages : performances de pointe, productivité et souplesse accrues pour un coût total de
Introduction aux SGBDR
1 Introduction aux SGBDR Pour optimiser une base Oracle, il est important d avoir une idée de la manière dont elle fonctionne. La connaissance des éléments sous-jacents à son fonctionnement permet de mieux
Panorama des solutions analytiques existantes
Arnaud LAROCHE Julien DAMON Panorama des solutions analytiques existantes SFdS Méthodes et Logiciels - 16 janvier 2014 - Données Massives Ne sont ici considérés que les solutions autour de l environnement
Introduction à l Informatique Décisionnelle - Business Intelligence (7)
Introduction à l Informatique Décisionnelle - Business Intelligence (7) Bernard ESPINASSE Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille Septembre 2013 Emergence
HERMES SYSTEM et BEWISE souhaitent vous offrir les meilleures compétences.
Notre alliance, Votre atout. HERMES SYSTEM et BEWISE souhaitent vous offrir les meilleures compétences. C est de cette philosophie qu est née notre partenariat avec la société toulousaine (31) Bewise,
IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21
IODAA de l 1nf0rmation à la Décision par l Analyse et l Apprentissage IODAA Informations générales 2 Un monde nouveau Des données numériques partout en croissance prodigieuse Comment en extraire des connaissances
CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012
CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE Edition 2012 AGENDA Qui sommes nous? Présentation de Keyrus Keyrus : Expert en formations BI Nos propositions de formation 3 modes de formations Liste des
Business Intelligence avec Excel, Power BI et Office 365
Avant-propos A. À qui s adresse ce livre? 9 1. Pourquoi à chaque manager? 9 2. Pourquoi à tout informaticien impliqué dans des projets «BI» 9 B. Obtention des données sources 10 C. Objectif du livre 10
Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services
69 Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services M. Bakhouya, J. Gaber et A. Koukam Laboratoire Systèmes et Transports SeT Université de Technologie de Belfort-Montbéliard
DATA MINING - Analyses de données symboliques sur les restaurants
Master 2 Professionnel - Informatique Décisionnelle DATA MINING - Analyses de données symboliques sur les restaurants Etudiants : Enseignant : Vincent RICHARD Edwin DIDAY Seghir SADAOUI SOMMAIRE I Introduction...
Sybase PowerAMC 16. Guide des nouvelles fonctionnalités générales. www.sybase.fr/poweramc DOCUMENTATION
Sybase PowerAMC 16 Guide des nouvelles fonctionnalités générales DOCUMENTATION 2 2 www.sybase.fr/poweramc A propos de PowerAMC 16 PowerAMC est une solution de modélisation d'entreprise graphique qui prend
LES NOUVEAUTES DE COST AND PROFITABILITY MANAGEMENT 8.1
LES NOUVEAUTES DE COST AND PROFITABILITY MANAGEMENT 8.1 SAS Cost and Profitability Management, également appelé CPM (ou C&P), est le nouveau nom de la solution SAS Activity-Based Management. Cette version
Principe de symétrisation pour la construction d un test adaptatif
Principe de symétrisation pour la construction d un test adaptatif Cécile Durot 1 & Yves Rozenholc 2 1 UFR SEGMI, Université Paris Ouest Nanterre La Défense, France, [email protected] 2 Université
TP Bases de données réparties
page 1 TP Bases de données réparties requêtes réparties Version corrigée Auteur : Hubert Naacke, révision 5 mars 2003 Mots-clés: bases de données réparties, fragmentation, schéma de placement, lien, jointure
Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe
Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe Karima Dhouib, Sylvie Després Faiez Gargouri ISET - Sfax Tunisie, BP : 88A Elbustan ; Sfax [email protected],
UML et les Bases de Données
CNAM UML et les Bases de Données UML et les Bases de Données. Diagramme de classes / diagramme d objets (UML)...2.. Premier niveau de modélisation des données d une application...2.2. Les éléments de modélisation...2.2..
Un datawarehouse est un entrepôt de données (une base de données) qui se caractérise par des données :
Page 1 of 6 Entrepôt de données Un article de Wikipédia, l'encyclopédie libre. L'entrepôt de données, ou datawarehouse, est un concept spécifique de l'informatique décisionnelle, issu du constat suivant
Chapitre VIII. Les bases de données. Orientées Objet. Motivation
Chapitre VIII Motivation Le modèle relationnel connaît un très grand succès et s avère très adéquat pour les applications traditionnelles des bases de données (gestion) Les bases de données Orientées Objet
IBM SPSS Direct Marketing
IBM SPSS Statistics 19 IBM SPSS Direct Marketing Comprenez vos clients et renforcez vos campagnes marketing Points clés Avec IBM SPSS Direct Marketing, vous pouvez : Comprendre vos clients de manière plus
Pentaho Business Analytics Intégrer > Explorer > Prévoir
Pentaho Business Analytics Intégrer > Explorer > Prévoir Pentaho lie étroitement intégration de données et analytique. En effet, les services informatiques et les utilisateurs métiers peuvent accéder aux
SQL SERVER 2008, BUSINESS INTELLIGENCE
SGBD / Aide à la décision SQL SERVER 2008, BUSINESS INTELLIGENCE Réf: QLI Durée : 5 jours (7 heures) OBJECTIFS DE LA FORMATION Cette formation vous apprendra à concevoir et à déployer une solution de Business
L'intelligence d'affaires: la statistique dans nos vies de consommateurs
L'intelligence d'affaires: la statistique dans nos vies de consommateurs Jean-François Plante, HEC Montréal Marc Fredette, HEC Montréal Congrès de l ACFAS, Université Laval, 6 mai 2013 Intelligence d affaires
1 er Avril 2015 Data Science & Big Data Etat de l art Donner plus d intelligence aux données
1 er Avril 2015 Data Science & Big Data Etat de l art Donner plus d intelligence aux données Votre interlocuteur Didier Gaultier Directeur Data Science Business & Decision Professeur de Statistique à l
Introduction au Data-Mining
Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme
Rappel sur les bases de données
Rappel sur les bases de données 1) Généralités 1.1 Base de données et système de gestion de base de donnés: définitions Une base de données est un ensemble de données stockées de manière structurée permettant
NF26 Data warehouse et Outils Décisionnels Printemps 2010
NF26 Data warehouse et Outils Décisionnels Printemps 2010 Rapport Modélisation Datamart VU Xuan Truong LAURENS Francis Analyse des données Avant de proposer un modèle dimensionnel, une analyse exhaustive
Types d applications pour la persistance. Outils de développement. Base de données préexistante? 3 modèles. Variantes avec passerelles
Types d applications pour la persistance Université de Nice Sophia-Antipolis Version 0.9 28/8/07 Richard Grin Toutes les applications n ont pas une complexité qui nécessite une architecture n- tiers Ce
X2BIRT : Mettez de l interactivité dans vos archives
Présentation Produit Présentation Produit X2BIRT : Mettez de l interactivité dans vos archives L accès à l information est capital pour les affaires. X2BIRT, la dernière innovation d Actuate, prend le
Christophe CANDILLIER Cours de DataMining mars 2004 Page 1
Christophe CANDILLIER Cours de DataMining mars 2004 age 1 1. Introduction 2. rocessus du DataMining 3. Analyse des données en DataMining 4. Analyse en Ligne OLA 5. Logiciels 6. Bibliographie Christophe
Du 10 Fév. au 14 Mars 2014
Interconnexion des Sites - Design et Implémentation des Réseaux informatiques - Sécurité et Audit des systèmes - IT CATALOGUE DE FORMATION SIS 2014 1 FORMATION ORACLE 10G 11G 10 FEV 2014 DOUALA CAMEROUN
Les 10 grands principes de l utilisation du data mining pour une gestion de la relation client réussie
Les 10 grands principes de l utilisation du data mining pour une gestion de la relation client réussie Découvrir les stratégies ayant fait leurs preuves et les meilleures pratiques Points clés : Planifier
Pilot4IT Tableaux de Bord Agréger et consolider l ensemble de vos indicateurs dans un même portail.
Pilot4IT Tableaux de Bord Agréger et consolider l ensemble de vos indicateurs dans un même portail. Comment exploiter au mieux l ensemble de vos indicateurs? Avec la solution agile Pilot4IT Tableau de
L ergonomie de vos formulaires web permet-elle une expérience utilisateur optimale? QAS Intuitive Search
L ergonomie de vos formulaires web permet-elle une expérience utilisateur optimale? QAS Intuitive Search A l écoute du marché et de ses mutations, Experian Marketing Services a développé un outil de saisie
Introduction aux outils BI de SQL Server 2014. Fouille de données avec SQL Server Analysis Services (SSAS)
MIT820: Entrepôts de données et intelligence artificielle Introduction aux outils BI de SQL Server 2014 Fouille de données avec SQL Server Analysis Services (SSAS) Description générale Ce tutoriel a pour
MapReduce. Malo Jaffré, Pablo Rauzy. 16 avril 2010 ENS. Malo Jaffré, Pablo Rauzy (ENS) MapReduce 16 avril 2010 1 / 15
MapReduce Malo Jaffré, Pablo Rauzy ENS 16 avril 2010 Malo Jaffré, Pablo Rauzy (ENS) MapReduce 16 avril 2010 1 / 15 Qu est ce que c est? Conceptuellement Données MapReduce est un framework de calcul distribué
Université de Bangui. Modélisons en UML
Université de Bangui CRM Modélisons en UML Ce cours a été possible grâce à l initiative d Apollinaire MOLAYE qui m a contacté pour vous faire bénéficier de mes connaissances en nouvelles technologies et
Petit guide pour choisir une solution CRM
Petit guide pour choisir une solution CRM Trouvez la solution qui vous convient» Nos clients sont plus performants. www.update.com Avant-propos Le CRM est en passe de devenir le principal logiciel de l
Nom de l application
Ministère de l Enseignement Supérieur et de la Recherche Scientifique Direction Générale des Etudes Technologiques Institut Supérieur des Etudes Technologiques de Gafsa Département Technologies de l Informatique
27 janvier 2011. Issam El Hachimi Ludovic Schmieder
27 janvier 2011 Issam El Hachimi Ludovic Schmieder Le Business Intelligence Les ETL PDI Talend Démo : 2 exemples Constat et comparatif Conclusion 2 «Il faut connaitre le client pour connaitre ses besoins»
