Masters Spécialisés «Actuariat et Prévoyance» et «Actuariat et Finance»

Dimension: px
Commencer à balayer dès la page:

Download "Masters Spécialisés «Actuariat et Prévoyance» et «Actuariat et Finance»"

Transcription

1 Masters Spécialisés «Actuariat et Prévoyance» et «Actuariat et Finance» Introduction au Data Mining K. EL HIMDI 1 Sommaire du MODULE Partie 1 : Introduction au Data Mining Partie 2 : Présentation de la plate-forme de Data Mining PASW Modeler Partie 3 : Ateliers de manipulation de base de PASW Modeler 2

2 Partie 1 : Introduction au Data Mining 1- Qu est ce que le Data Mining? 2- Domaines d applications 3- Principales techniques 3.1 Techniques non supervisées 3.2 Techniques supervisées 4- Méthodologie de Projets 3 Contexte économique Les entreprises doivent améliorer La qualité des produits & services La connaissance des marchés et leur dynamique Leur position face à la concurrence Les coûts de production La connaissance des technologies pour en tirer profit La maîtrise de l information par un processus d intelligence La collecte de l information, Le traitement de l information, La diffusion de l information à des fins stratégiques D où l importance du «Data Mining» 4

3 Plate-forme analytique et opérationnelle pour l entreprise Intégration des canaux de communication et des processus métiers Finances Marketing Ventes Organisation Credit Scoring Notation Interne & Risque (ex. Bâle II, Patriot Act) Optimisation des grilles tarifaires Valorisation des sinistres Détection de Fraude (sinistres, cartes, prêt) Blanchiment d Argent Acquisition client, ventes croisées et rétention Optimisation des campagnes Marketing Segmentation Client Valeur Comportement Simulation tarifaire Optimisation des interactions Web Analyse du portefeuille client Ventes croisées et rétention sur le point de contact du client Affectation des prospects aux commerciaux Analyse de la performance Force de vente Secteurs géographiques Service Client pro-actif Call center monitoring et tuning Analyse automatique des s Satisfaction Client Recrutement des employés Satisfaction des employés Rétention des employés Direction Générale : Analyses et Reporting Analyses Data mining Statistiques Sortantes Entrantes Actions Vision Client Unique Datamart Marketing Données déclaratives Données contrats Navigation Web Call Center Données opérationnelles 5 De l analyse historique à l analyse Predictive Analyse Historique (BI) Analyse Prédictive (DM) Valeur Business Combien de clients avons nous perdu? Query & Reporting Quelle est leur localisation? OLAP Data mining Quels clients type sont à risques et pourquoi? Real time distribution Que devons nous offrir à ce client aujourd hui? Temps Point de départ de la chaîne de prise de décision : le Reporting Soucis pour les entreprises : données incompatibles, lourdeur du traitement, difficultés de consolidations,. 6

4 Le Data Mining : Un champs multidisciplinaire Statistiques Régression logistique Analyse discriminante Arbre de décision : CHAID Classification : K-Means Intelligence Artificielle, Machine Learning Réseaux de neurones Règles d inductions Kohonen Data Mining Familles d algorithmes Prédictive prédit une valeur numérique ou symbolique Classement (Segmentation ou Clustering) Identifier des groupes d items ayant un comportement similaire. Association trouver des événements ayant une forte probabilité de se réaliser ensemble Database Technology ETL, ROLAP, MOLAP Reporting I. BERRADA7 1 Qu est ce que le Data Mining? 8

5 Qu est ce que le Data Mining? Data Mining est un sujet qui dépasse le cercle restreint des scientifiques et suscite un vif intérêt dans le monde des affaires «l extraction d information originale, auparavant inconnues et potentiellement utiles, à partir de données» (Piateski-Shapiro). «la découverte de nouvelles corrélation (ou coefficient de coïncidence), tendances et modèles par tamisage d un large volume de données» (John Page). «un processus d aide à la décision où les utilisateurs cherchent des modèles d interprétation dans les données» (Kamran Parsaye). 9 Qu est ce que le Data Mining? «l exploration et l analyse, par des moyens automatiques ou semi-automatiques, d un large volume de données afin de découvrir des tendances ou des règles» (M. Berry). «un processus non élémentaire de mise à jour de relation, corrélation, dépendances, association, modèles, structure, tendance, classes, facteurs obtenus en naviguant à travers de grands ensembles de données» (M. Jambu). Avec poésie: «torturer l information disponible jusqu à ce qu elle avoue» (Dimitris Chorafas). Avec cynisme et réalisme «passer les données dans la machine à saucisses pour obtenir des Merguez douces ou épicées» (Moktar Outtas) 10

6 Le data mining : une définition Le data mining est un processus de gestion et de valorisation de l information client au service de la performance de l entreprise. Le data mining doit permettre de : 1. Décrire un phénomène «client» (choix, désaffection ). 2. Comprendre ce phénomène (relations, dépendances). 3. Modéliser (abstraire le phénomène dans un modèle). 4. Prédire (anticiper sur de nouvelles données à l aide du modèle). 11 Quelle Problématique du Data Mining? Comment gérer la grande quantité des données brutes provenant de plusieurs sources pour les rendre accessibles et lisibles par le décideur? 12

7 Définition du Data mining Extraction d information d intérêt (non triviale, implicite, inconnue à priori et potentiellement utile) à partir de données stockées dans de large entrepôts de données, en utilisant des procédures automatiques ou semi-automatiques pour une prise de décision. Appelé aussi KDD (Knowledge Discovery in Databases ) 13 De la donnée vers la connaissance Data mining: noyau du processus de découverte de la connaissance. Enrichissement des variables Data Mining Données sources Sélection des données Qualification des données Données validées Données cibles Information découverte Données Transformées Utilisation de la connaissance Information exploitée et diffusée 14

8 Processus de Data Mining : Etude de cas - ciblage Mk Périmètre d un projet DM pilote ACTION DATAMINING ENRICHISSEMENT DES VARIABLES TRANSFORMATION DES DONNEES Information Exploitée et diffusée BDI MARKETING Données Validées BD Développement Données Transformées Information Scoring Modélisation Reporting DW Données sources Données Marketing Plate-forme analytique d un projet DM 15 2 Domaines d applications 16

9 Applications clefs du Data Mining Marketing direct : identifier les profils des prospects ayant les meilleurs taux de réponses à une action marketing donnée (réponse / non réponse - réponse achat / réponse non achat / non réponse). Credit Scoring : identifier les profils des emprunteurs ou souscripteurs à risque en matière de crédit ou d'assurance (bon payeur/ mauvais payeur - client non risqué/client à risque moyen/client à risque élevé). Analyse de marché : identifier les segments les plus porteurs sur un marché - Déterminer les variables influant sur la vente d un produit ou d'un service - Identifier les profils des clients de tel ou tel produit ou tel ou tel service. Industrie Industrie Santé Utilisation des Ressources Qualité des Soins Satisfaction Clientèle le Contrôle Qualité Finance / Service Acquisition Clientèle le Détection des Fraudes Data mining Détection des Fraudes Analyse Base de Données Secteur Public Ventes Croisées, Ventes Additionnelles Fidélisation Fidélisation Analyse de Panier d Achat d Télécom Distributeur/VPC Distributeur/VPC Application Secteur Médical : déterminer les facteurs de risques liées à une maladie (développement / non développement) - identifier les profils des patients susceptibles de réagir favorablement à un traitement (guérison / non guérison). 17 Champs disciplinaire du CRM champs disciplinaires Problématique d acquisition Problématique de fidélisation Problématique de rétention Problématique de migration 3 Migration Mouvement des clients dans les segments actifs de la pyramide de valeur Rétention/Attrition Mouvements des consommateurs depuis les segments actifs vers les segments inactifs. Acquisition/Fidélisation Basée notamment sur la segmentation et le profilage Sup Grands Moyens Petits Inactifs Actifs Inactifs I. BERRADA 18

10 L historique du Data Mining Ces techniques ne sont pas récentes Ce qui est nouveau Capacité de stockage et de calcul // (matériel puissant) Package de techniques de natures différentes qui peuvent s enchaîner les unes aux autres L intégration du DM dans le processus de production Elle permettent de traiter de grands volumes de données et font sortir le DM des Laboratoires de Recherche pour entrer dans les entreprises. Modélisation le noyau du data mining C est ce qui permet de différencier le DM de ces ancêtres Les requêtes, le reporting, la visualisation et les statistiques simples permettent de tester les hypothèses Les hypothèses, les idées, sont spécifiées par l utilisateur La Modélisation permet la génération des hypothèses Utiliser les outils de data mining pour suggérer de nouvelles idées et directions 19 Des statistiques.. Au Data Mining Statistiques Quelques centaines d individus Quelques variables recueillies avec protocole spécial (échantillonnage, plan d expérience, etc.) Fortes hypothèses sur les lois statistiques suivies Data Mining Quelques millions d individus Quelques centaines de variables Nombreuses var non numériques Données recueillies avant l étude et souvent à d autres fins Population constamment évolutive Données imparfaites avec erreur de codification Nécessité de calculs rapides On ne cherche pas l optimum mathématique mais le modèle le + facile à appréhender par les utilisateurs non statisticiens 20

11 Différence entre le Data Mining et la Statistique traditionnelle Les techniques de Data Mining remplacent-elles les statistiques? Les statistiques sont omniprésentes. On les utilise : Pour faire une analyse préalable, Pour estimer ou alimenter les valeurs manquantes, Pendant le processus pour évaluer la qualité des estimations, Après le processus pour mesurer les actions entreprises et faire un bilan. Statistiques et Data Mining sont tout à fait complémentaires 21 3 Principales techniques 3.1 Techniques descriptives Classification Typologie Règles d association 3.2 Techniques prédictives Classement Arbre de décision Réseau de neurone 22

12 Principales approches de modélisation Prédictive prédit une valeur numérique ou symbolique Classement (Segmentation ou Clustering) Identifier des groupes d items ayant un comportement similaire. Association trouver des événements ayant une forte probabilité de se réaliser ensemble 23 Les 2 types de techniques de DM Les techniques descriptives visent à mettre en évidence des informations présentes mais cachées par le volume des données (ex: segmentation de clientèles et recherche d associations de produits sur les tickets de caisse) Réduisent, résument, synthétisent les données il n y a pas de var cible à expliquer Les techniques prédictives visent à extrapoler de nouvelles informations à partir des informations présentes (ex. Scoring) Expliquent des données Il y a une variable cible à prédire. & & 24

13 Méthodes descriptives de DM Type Famille Sous famille Algorithme Modèles géométriques Méthodes descriptives Modèles à base de règles logiques Analyse factorielle (projection sur un espace de dimension inférieure) Détection de liens Analyse en composantes principales ACP (var. continues) Analyse des correspondances multiples ACM (var. catégorielle) Centre mobiles, k_means, nuées dynamiques Classification hiérarchique Classification neuronale (carte de Kohonen) Classification relationnelle Détection d associations Recherche de séries similaires 25 Méthodes prédictives de DM Type Famille Sous famille Algorithme Modèles à base de règles logiques Arbre de décision Arbre de décision (var. à expliquer continue ou catégorielle) Modèles à base de fonctions mathématique Réseaux de neurones Réseaux à apprentissage supervisé perceptron, réseau à fonction radiale de base Méthodes prédictives Modèles paramétriques ou semi paramétriques Régression linéaire (var. à expliquer continue) Modèle linéaire général (var. à expliquer continue) Régression logistique (var. à expliquer catégorielle) Analyse discriminante de Fisher (var. àexpliquer catégorielle) Modèle log-linéaire (var. à expliquer discrète) Prédiction sans modèle Modèles linéaire généralisé (var. à expliquer continue, discrète ou catégorielle) Modèle additif généralisé (var. à expliquer continue, discrète ou catégorielle) K plus proche voisin (K-NN) 26

14 Principales techniques Zoom sur les techniques descriptives Classification Typologie Règles d associations Principales techniques Zoom sur les techniques descriptives Classification Typologie Règles d associations 28

15 Pourquoi et Quand utiliser la classification? Quand on souhaite trouver des patterns sans cible Pour trouver des anomalies / cas atypiques Ex. détection de fraude Plusieurs terminologies Clustering Attention, il est employé par les anglo-saxons (classification désigne la technique prédictive Classement en français) Segmentation : employé en Marketing Typologie Taxinomie (Biologie) Nosologie (Médecine) 29 Plusieurs algorithmes de classification Méthode hiérarchique Ascendantes (agglomérations) Basées sur une notion de distance Basée sur une notion de densité Descendante (divisives) Méthodes de partitionnement Centres mobiles : K-means Réseaux de Kohonen Méthodes Two Step 30

16 Comparatif entre les différentes méthodes de classification de partitions Méthode Hiérarchique Il n'est pas nécessaire de sélectionner à l'avance le nombre de classes. on rassemble les pairs de sous-classes avec la plus petite distance. Ceci est répété jusqu à obtenir une classe qui regroupe tout. Méthode K_Means Etant donné k entier, Partitionner les cas en k groupes. Calculer un centre ou point moyen de chaque groupe Affecter chaque cas (point) au groupe ayant le centre le plus proche Retour à l étape 2, stopper lorsqu il n y plus d affectation possible. Méthode Two Step Traite les données de grandes tailles. Utilisée pour les variables continues et catégorielles Constituée de deux étapes : Étape 1 : Regroupement préliminaire (sub-cluster). Etape 2 : Regroupement final (cluster) : l'utilisation de la méthode de classification hiérarchique pour fusionner progressivement les sousclasses de l étape 1 en classes de plus en plus importantes, sans qu'un nouvel examen des données soit nécessaire. Validité = inter intra 31 Principe du Réseau de Kohonen Il s agit d un algorithme original de classification qui a été défini par Teuvo Kohonen dans les années 80. L algorithme regroupe les observations en classes en respectant la topologie de l espace des observations. On se définit une notion de voisinage entre classes et les observations voisines dans l espace des variables. En général, on suppose que les classes sont disposées sur une grille rectangulaire qui définit naturellement les voisins de chaque classe. Couche cachée, lxm nœuds connectés avec un certain poids p ijk Principe de l algorithme L algorithme de classement est itératif L initialisation : associer à chaque classe un vecteur code dans l espace des observations choisi de manière aléatoire Ensuite, à chaque étape, on choisit une observation au hasard, on la compare à tous les vecteurs codes et on détermine la classe gagnante, i.e. celle dont le vecteur code est le plus proche au sens d une distance donnée à priori. On rapproche de l observation les codes de classe gagnante et des classes voisines On ne modifie à chaque étape que le code de la classe gagnante. C est un algorithme compétitif. Couche d entrée, 1 nœud par var (-> n nœuds) 32

17 Description de Kohonen L'analyse Kohonen est une méthode de classification non supervisée. Elle a les propriétés: de représenter les données en conservant la topologie. des données proches (dans l'espace d'entrée) vont avoir des représentations proches dans l'espace de sortie et vont donc être classés dans une même classe ou dans des classes voisines. Un réseau de Kohonen est constitué: d'une couche d'entrée: Tout individu à classer est représenté par un vecteur multidimensionnel (le vecteur d'entrée). A chaque individu est affecté un neurone qui représente le centre de la classe d'une couche de sortie (ou couche de compétition). Les neurones de cette couche entrent en compétition.seuls les meilleurs gagnent("wta ou Winner takes all") 33 Representation de kohonen A chaque neurone, on fait correspondre un espace de sortie qui, en général, est un espace 2D défini par une grille soit rectangulaire soit hexagonale. Chaque neurone posséde 8 plus proches voisins 34

18 Description de Kohonen Le neurone biologique Le neurone de Kohonen a une fonction d'activation qui ne prend que des valeurs positives. Compétition Chaque neurone reçoit les signaux de ses voisins. Son excitation (ou son inhibition) dépend de la distance et peut être représentée par la fonction ci-aprés. : + exitation :-inhibition Les neurones voisins ont une action d'excitation. Les neurones éloignés ont une action d'inhibition. La loi d'évolution de la couche fait que: le réseau s'organise de telle façon à créer un amas de neurones autour du neurone le plus stimulé par le signal d'entrée. Les autres neurones se stabilisent dans un état d'activation faible. 35 Algorithme 1) Prétraitement des données Chaque vecteur d'entrée V est normalisé de telle façon à ce que sa longueur soit égale à 1. Les poids initiaux W (générés aléatoirement) des neurones de compétition sont également normalisés à 1. 2) Présentation des données Les données d'entrée peuvent être présentées soit dans leur ordre initial soit de façon aléatoire. 3) Recherche du neurone gagnant Le programme recherche le neurone dit "gagnant" en minimisant(v-w). Les neurones voisins du gagnant sont modifiés, à chaque itération, comme suit: W=W+alpha(V-W) alpha est la vitesse d'apprentissage. Elle peut être linéaire (et décroissante en fonction du temps) ou gaussienne des distances (et décroissante en fonction du temps). 4) Visualisation de la couche de sortie La visualisation de la carte finale est en générale faite en projetant les neurones gagnants dans un espace 3D/2D("Non linear mapping"). 36

19 Algorithme d Apprentissage d un réseau Kohonen Initialisation aléatoire des poids p ijk Pour tout individu x=(x 1,x 2,, x n ) présenté au réseau sont calculées les distances le séparant de lxm nœuds : Nœud retenu pour représenter x est le nœud (i,j) pour n lequel d ij (x) est minimum. 2 dij( x) ( xk pijk ) k 1 Ce nœud et tous les nœuds voisins voient leurs poids ajustés p ijk + (x k -p ijk ) pour les rapprocher de x. [0,1] est le taux d apprentissage pendant l apprentissage. C est cet ajustement des poids dans tout le voisinage du nœud «gagnant» qui rapproche les nœuds voisins de (i,j) de l individu x. On diminue la taille du voisinage et on prend un autre individu (enregistrement) x. 37 Conseils d ordre général sur les solutions de classification Il existe un certain nombre de principes standard pouvant être appliqués à chaque solution de classification. Les plus critiques sont : Nombre d enregistrements par classe Les classes ne doivent pas être trop petites dans la pratique. Certains cas isolés peuvent constituer leur propre classe (5 ou 10 cas dans un jeu de données de enregistrements). Nombre de classes Le nombre de classes étant arbitraire, il est courant d essayer des solutions avec différents nombres de classes en examinant chacune tour à tour pour déterminer laquelle est la plus utile. 38

20 3.2 Principales techniques Zoom sur les techniques prédictives Classement Arbre de décision Réseau de neurone 39 Techniques prédictives Passé pour prédire l avenir 40

21 Concepts de la modélisation Données test / apprentissage Généralement créées par l utilisateur pour permettre une validation indépendante des modèles. Parfois l algorithme divise automatiquement les données en données d apprentissage/test Prédire la cible qu est-ce que nous essayons de prédire? Rôle de chaque champs dans le modèle Directions (terminologie de Clementine) IN, OUT, LES DEUX, AUCUNE Précision Combien de fois le modèle prédit correctement? Ou pour les nombres, moyenne d erreur, corrélation, Confiance à quel point cette prédiction peut être correcte? Parfois ce n est pas une probabilité, mais juste une indication Les questions de l équilibre Est-ce les oui / non sont de proportions égales 50/50? Quelle différence peut-il faire? 41 Modèles Prédictifs Certains modèles sont meilleurs que d autres : Précision Compréhension Modèles varient entre facile à comprendre à incompréhensible Arbre de Décision Règles d induction Modèles de Régression Réseaux de Neurones Simple Complexe 42

22 Classification vs Classement Classification des données consiste regrouper les données en classes (non définie à priori) basées sur le principe conceptuel : maximiser la similarité intra classe et minimiser la similarité interclasse. Classement (affecter à un classe pré-définie, Analyse Discriminante, Rég. Logistique) est une méthode d apprentissage supervisée, alors que la classification est une méthode non supervisée. 43 Principe des arbres de décision Les méthodes de segmentation par Induction de Règles sont des techniques statistiques (CHAID, CART et non statistiques C5) multivariées et supervisées. Elles permettent : d'étudier plusieurs variables simultanément, et, plus précisément, la relation entre une variable dite dépendante (cible) et des variables dites indépendantes. Le résultat de la segmentation, décrit sous la forme d'un arbre dit arbre de décision: indique quels sont, parmi les variables indépendantes considérées, les meilleurs prédicteurs de la variable cible, et affiche les caractéristiques des groupes définis par ces prédicteurs. De partitionner de manière séquentielle, les données en des groupes (segments), en fonction des modalités des variables indépendantes retenues pour leur pouvoir explicatif sur la variable dépendante. 44

23 Exemple: Arbre de décision age : du chef du foyer, sexe : le sexe du chef du foyer, enfant : existence d enfants, revenu : revenu du ménage, carte : présence de carte bancaire, nbpers : # de personne dans le foyer, occup : type de profession I. BERRADA 45 Prédire le risque client par l arbre l de décisiond 46

24 Les individus entre 25 à 35 ans sont tous bons payeurs lorsqu ils perçoivent un salaire mensuel, mais majoritairement des mauvais payeurs lorsqu ils perçoivent un salaire hebdomadaire. Les individus de moins de 25 ans sont en majorité de mauvais payeurs lorsqu ils sont payés à la semaine et se répartissent entre bons et mauvais lorsqu ils sont payés au mois. Les individus de plus de 35 ans sont toujours des bons payeurs, quel que soit le mode de rémunération. I. BERRADA 47 Pourquoi / quand utiliser les règles d Association? Exploration Générale Ne sait pas exactement ce que je cherche, je veux juste savoir ce qui va avec quoi Pannier de la ménagère Analyse des transactions commerciales à l aide d un moteur d associations grande distribution, Analyse des mouvements dans les grandes banques, Analyse des incidents en assurance Analyse des associations des pages Web 48

25 Exemple de règles d association Analyse du panier de la ménagère Découverte d associations et de corrélations entre les articles achetés par clients en analysant les achats effectués (panier) Quels items tendent à se retrouver ensemble? Une règle est une expression de la forme : Si condition alors Résultat La règle Soda & Boucherie => Conserve légumes si vous avez Soda et Boucherie, vous achèteriez probablement Conserve légumes probablement = confiance, Combien de cas = couverture (ou support ). L indice de confiance = p(conditions et résultat) / p(condition) L indice de support = p(condition et résultat) 49 Exemple de calcul des indices de confiance et du support 50

26 Application des règles r d association d pour le choix des plans tarifaires par les clients Le Support correspond au pourcentage d'enregistrements contenus dans les données d'apprentissage pour lesquels les antécédents sont vrais (true). 13% des cas vérifient la règle Forfait maîtrisé Forfait plafonné est vraie avec une confiance de 89,7% 51 Les réseaux de neurones Simulation des neurones dans le cerveau humain par apprentissage de règles et généralisations Une classe d outils et d algorithmes très puissants pour : La prédiction La classification La segmentation ou Clustering Ils sont utilisés dans plusieurs domaines : Prévision des séries temporelles dans les finances Diagnostic médical Identification de segments de clients potentiels Détection de fraude Etc. 52

27 Qu est ce qu un réseau de neurones? Un réseau de neurone typique présente plusieurs neurones rangés en couches afin de créer un réseau. Chaque neurone peut être considéré comme un calculateur élémentaire à qui l on attribue une tâche simple et unique. Les connexions entre neurones donnent au réseau sa capacité à apprendre des caractéristiques et des relations. Une représentation simple d un réseau de neurones : Perceptron 53 Exemples de fonctions d activation x Sigmoïde ou logistique : e f ( x) 1 x e x 2e Tangente hyperbolique : f ( x) 1 x 1 e Linéaire : f ( x) x L unité ou neurone combine ses entrées (valeurs entre 0 et 1) en une seule valeur, qu elle transforme après pour produire la sortie (entre 0 et 1). Cette combinaison et cette transformation sont appelées la fonction d activation. Quand la fonction d activation est linéaire, le réseau de neurones n est autre qu une régression linéaire multiple avec comme entrées les variables indépendantes x i et comme sortie la variable dépendante y. Les poids w i ne sont autres que les coefficients β i du modèle de régression. Lorsque la fonction d activation est logistique, le réseau de neurones s assimile à un modèle de régression logistique. La différence avec le modèle de régression linéaire est que la variable dépendante y est binaire (valeurs : 0 ou 1). Quand la fonction d activation est la tangente hyperbolique, le réseau de neurones est un perceptron multi-couches (MLP), variante la plus fréquemment utilisée. On note ici que le modèle se complique avec la présence d une couche cachée. 54

28 Mise en œuvre d un réseau de neurone Les étapes pour la mise en œuvre d un réseau pour la prédiction ou le classement sont : Identification des données en entrée et en sortie Normalisation des données (entre 0 et 1) Constitution d un réseau avec une topologie adaptée (nb de couches, ) Apprentissage ou entraînement du réseau Test du réseau Application du modèle généré par l apprentissage Dénormalisation des données en sortie rétropropagation L entraînement est le processus de choisir les poids optimaux sur les arêtes minimisant SEC pour chaque observation: SEC = (données réelles données en sorties)² Utiliser l ensemble d apprentissage afin de calculer les poids et s approcher le possible de la sortie. w nouveau = w encours + w encours w encours = - η ( SEC/ w encours) + α W antérieur η : taux d apprentissage 0<η<1 contrôle l importance de la modification des poids. C est la vitesse de déplacement : plus il est élevé, plus l apprentissage est rapide mais plus le réseau risque de converger vers une solution globalement non optimale. α Le terme de moment aide à diminuer les oscillations autour de l optimum en encourageant les ajustements à rester On peut ne pas atteindre l optimum si α est petit dans la même direction 55 Forces et faiblesses des réseaux de neurones Un RN «apprend itérativement» les patterns dans les données : A chaque itération, le modèle est testé puis raffiné. Alors que les Analyses Statistiques supposent un type de modèle pour les données puis testent son adéquation aux données. Forces Aptitude à modéliser des structures complexes et des données irrégulières Prise en compte des relations non linéaires (interactions) entre les variables. Assez bonne robustesse aux données bruitées Aptitude à modéliser des problèmes très variés. Faiblesses Résultats totalement non explicites Sensibilité à un trop grand nombre de variables non discriminantes (contrairement aux arbres de décision) Convergence vers la meilleure solution globale pas toujours assurée Paramètres nombreux et délicats à régler (nb et taille des couches cachées, taux d apprentissage, moment, etc.) Ne s applique naturellement qu aux variables continues dans l intervalle (0,1) Nécessité de normaliser les données. 56

29 Quel modèle retenir? Plusieurs itérations Data Miners exécutent plusieurs modèles en utilisant les paramètres par défault. Affinent les paramètres ou reviennent à la phase de préparation pour effectuer des transformations requises par le modèle choisi. Courbe ROC 57 En guise de synthèse : Quels problèmes : Fiche technique La Segmentation (clustering) Rechercher des groupes homogènes dans une population d individus Par exemple, segmenter les comportements d achat des clients. Techniques: K-means, CAH (Classification Ascendante Hiérarchique), Nuées Dynamiques, Cartes de Kohonen... 58

30 Quels problèmes : Fiche technique L Association Rapprocher les caractéristiques, les comportements ou les préférences d un individu Un exemple particulièrement populaire est celui de l analyse du panier de la ménagère Techniques: Règles d associations, analyse des corrélations, analyse des correspondances (ACM) 59 Quels problèmes : Fiche technique La Classification Prévoir l appartenance d un individu à un groupe donné. = Expliquer une caractéristique qualitative à partir d autres variables qualitatives ou quantitatives Exemple: Un client donné fera t il parti des «churners»? Techniques: Arbres de décisions (CART, ChAID, C4.5, ID3,..), Analyse Factorielle Discriminante, Régression Logistique, Réseaux de neurones... 60

31 Quels problèmes : Fiche technique L Estimation Évaluer une caractéristique quantitative d un individu (taille, revenu, montant d achat, ) = Expliquer une caractéristique quantitative à partir d autres variables qualitatives ou quantitatives Exemple: Évaluer le montant d achat d un client? Techniques : Modèles linéaires ou non linéaire, Réseaux de neurones, GLM, Poursuite de projection en Régression Projet Data Mining Coût et Gain Facteurs Clés de succès et quelques freins 62

Module 3 : Introduction à la Modélisation SOUS MODELER

Module 3 : Introduction à la Modélisation SOUS MODELER Module 3 : Introduction à la Modélisation SOUS MODELER 1 Techniques prédictives Passé pour prédire l avenir 2 Concepts de la modélisation Données test / apprentissage Généralement créées par l utilisateur

Plus en détail

Agenda de la présentation

Agenda de la présentation Le Data Mining Techniques pour exploiter l information Dan Noël 1 Agenda de la présentation Concept de Data Mining ou qu est-ce que le Data Mining Déroulement d un projet de Data Mining Place du Data Mining

Plus en détail

Le Data Mining Techniques pour exploiter l information. Auteur : Dan Noël Date : 24.04.2009

Le Data Mining Techniques pour exploiter l information. Auteur : Dan Noël Date : 24.04.2009 Le Data Mining Techniques pour exploiter l information Auteur : Dan Noël Date : 24.04.2009 Agenda de la présentation du 26.03.2009 Concept de Data Mining ou qu est-ce que le Data Mining Déroulement d un

Plus en détail

Motivation : pourquoi exploration de données? Nous nous noyons dans les données, mais manquons cruellement de connaissances

Motivation : pourquoi exploration de données? Nous nous noyons dans les données, mais manquons cruellement de connaissances 1 Introduction Définition et motivations Tâches de data mining (fouille de données, exploration de données) Techniques et algorithmes Exemples et applications 1 Motivation : pourquoi exploration de données?

Plus en détail

Outils Statistiques du Data Mining

Outils Statistiques du Data Mining Outils Statistiques du Data Mining Pr Roch Giorgi roch.giorgi@univ-amu.fr SESSTIM, Faculté de Médecine, Aix-Marseille Université, Marseille, France http://sesstim-orspaca.org http://optim-sesstim.univ-amu.fr

Plus en détail

De la donnée à la décision. Sofian MAABOUT LaBRI. Université Bordeaux 1

De la donnée à la décision. Sofian MAABOUT LaBRI. Université Bordeaux 1 De la donnée à la décision Sofian MAABOUT LaBRI. Université Bordeaux 1 1 Décider c est choisir, parmi plusieurs actes possibles, celui qui apparaît comme le plus pertinent pour atteindre un résultat envisagé,

Plus en détail

Classification Exemple : Enquête d opinion sur les OGM. Pauline Le Badezet Alexandra Lepage

Classification Exemple : Enquête d opinion sur les OGM. Pauline Le Badezet Alexandra Lepage Classification Exemple : Enquête d opinion sur les OGM Pauline Le Badezet Alexandra Lepage SOMMAIRE Introduction Méthodologie Méthode de partitionnement Classification Ascendante Hiérarchique Interprétation

Plus en détail

Introduction au datamining

Introduction au datamining Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des

Plus en détail

Statistique et analyse de données pour l assureur : des outils pour la gestion des risques et le marketing

Statistique et analyse de données pour l assureur : des outils pour la gestion des risques et le marketing Statistique et analyse de données pour l assureur : des outils pour la gestion des risques et le marketing Gilbert Saporta Chaire de Statistique Appliquée, CNAM ActuariaCnam, 31 mai 2012 1 L approche statistique

Plus en détail

Ce qu est le Data Mining

Ce qu est le Data Mining Data Mining 1 Ce qu est le Data Mining Extraction d informations intéressantes non triviales, implicites, préalablement inconnues et potentiellement utiles à partir de données. Autres appellations: ECD

Plus en détail

CRM Banque. Fonctionnalités clés. Vision complète de la performance de la banque. Optimisation fondamentale de la relation client

CRM Banque. Fonctionnalités clés. Vision complète de la performance de la banque. Optimisation fondamentale de la relation client CRM Banque Fonctionnalités clés Vision complète de la performance de la banque Suivi des indicateurs clés de performance de la banque avec des tableaux de bord en temps réel, des rapports prédéfinis, une

Plus en détail

Reconnaissance des formes : Classement d ensembles d objets

Reconnaissance des formes : Classement d ensembles d objets Reconnaissance des formes : Classement d ensembles d objets Données Méthodes Extraction de connaissances Applications Expertise Apprentissage Bernard FERTIL Directeur de Recherche CNRS Équipe LXAO, UMR

Plus en détail

Analyse de données électroniques et intelligence d affaires

Analyse de données électroniques et intelligence d affaires Analyse de données électroniques et intelligence d affaires Valoriser les données internes et externes 3 avril 2014 Ordre du jour UNE INTRODUCTION À L ANALYSE DE DONNÉES Analyse de données et l intelligence

Plus en détail

QU EST-CE QUE LE DECISIONNEL?

QU EST-CE QUE LE DECISIONNEL? La plupart des entreprises disposent d une masse considérable d informations sur leurs clients, leurs produits, leurs ventes Toutefois ces données sont cloisonnées par les applications utilisées ou parce

Plus en détail

" # $ % % & ' ( ) * +,! '()*+ *, + ' +' + ' ' -+ - +.+. /0 / 1 0 12 1 1 2 34+ 4 1 +. 50 5 * 0 4 * 0 6! "##$ % &!

 # $ % % & ' ( ) * +,! '()*+ *, + ' +' + ' ' -+ - +.+. /0 / 1 0 12 1 1 2 34+ 4 1 +. 50 5 * 0 4 * 0 6! ##$ % &! "# $ %%& ' ( )*+, '()*+,'+''-++.+/0112134+1.50*406 "##$ %& 8CC "#$%& ' ( )* +,-./ 0 123 456+7 3 7-55-89.*/ 0 +3 *+:3 ;< =3 3-3 8 0 23 >-8-3 >5? //*/*0;* @A: *53,,3 / * $/ >B+? - 5, 2 34*56 7 /+#** //8

Plus en détail

Crédit Bureaux. des PME. Alger, le 12 mars 2009 Margherita GALLARELLO

Crédit Bureaux. des PME. Alger, le 12 mars 2009 Margherita GALLARELLO Le rôle des Crédit Bureaux pour l accès au crédit des PME 2009 Agenda L activité des Crédit Bureaux Sujets critiques pour les PME Crédit Bureaux: quels avantages pour les PME? Exemple d évaluation Conclusion

Plus en détail

Initiation à la fouille de données et à l apprentissage automatiq

Initiation à la fouille de données et à l apprentissage automatiq Initiation à la fouille de données et à l apprentissage automatique 1 Laboratoire d Informatique Fondamentale de Marseille Université de Provence christophe.magnan@lif.univ-mrs.fr www.lif.univ-mrs.fr/

Plus en détail

Les solutions SAS pour les Petites et Moyennes Entreprises

Les solutions SAS pour les Petites et Moyennes Entreprises BROCHURE SOLUTION Les solutions SAS pour les Petites et Moyennes Entreprises Sur un marché aussi compétitif que celui des Petites et Moyennes Entreprises, le temps et l efficacité sont deux valeurs prioritaires

Plus en détail

Le Data Mining, Outil d aide à la prise de décision dans l action commerciale

Le Data Mining, Outil d aide à la prise de décision dans l action commerciale Université Ibn Zohr Faculté des Sciences Juridiques, Économiques et Sociales Exposé sous le thème : Le Data Mining, Outil d aide à la prise de décision dans l action commerciale Plan : Introduction : L

Plus en détail

Partie I Stratégies relationnelles et principes d organisation... 23

Partie I Stratégies relationnelles et principes d organisation... 23 Introduction......................................................................... 1 1. Définition........................................................................ 2 1.1 Le CRM comme processus

Plus en détail

Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining.

Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining. 2 jours : Mardi 15 et mercredi 16 novembre 2005 de 9 heures 30 à 17 heures 30 Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining. Madame, Monsieur, On parle

Plus en détail

Utilisations des mathématiques à des fins opérationnelles

Utilisations des mathématiques à des fins opérationnelles Utilisations des mathématiques à des fins opérationnelles Michael Vandenbossche mvn@softcomputing.com Soft Computing 165 avenue de Bretagne 59000 Lille 1. Présentation 2. Indicateurs statistiques de base

Plus en détail

Coup de Projecteur sur les Réseaux de Neurones

Coup de Projecteur sur les Réseaux de Neurones Coup de Projecteur sur les Réseaux de Neurones Les réseaux de neurones peuvent être utilisés pour des problèmes de prévision ou de classification. La représentation la plus populaire est le réseau multicouche

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme

Plus en détail

Webinar EBG Nouvelles perspectives d'exploitation des données clients avec le big data

Webinar EBG Nouvelles perspectives d'exploitation des données clients avec le big data Webinar EBG Nouvelles perspectives d'exploitation des données clients avec le big data Approches & opportunités face aux enjeux de volume, variété et vélocité France, 2012-2014 28 mars 2013 Ce document

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

Le data mining et l assurance Mai 2004. Charles Dugas Président Marianne Lalonde Directrice, développement des affaires

Le data mining et l assurance Mai 2004. Charles Dugas Président Marianne Lalonde Directrice, développement des affaires Le data mining et l assurance Mai 2004 Charles Dugas Président Marianne Lalonde Directrice, développement des affaires AGENDA Qu est-ce que le data mining? Le projet et les facteurs de réussite Les technologies

Plus en détail

Méthodes de prévision des ventes

Méthodes de prévision des ventes Méthodes de prévision des ventes Il est important pour toute organisation qui souhaite survivre dans un environnement concurrentiel d adopter des démarches de prévision des ventes pour anticiper et agir

Plus en détail

Sage CRM. La solution complète de Gestion des Relations Clients pour PME. Précision et efficacité à portée de mains!

Sage CRM. La solution complète de Gestion des Relations Clients pour PME. Précision et efficacité à portée de mains! Sage CRM Précision et efficacité à portée de mains! La solution complète de Gestion des Relations Clients pour PME Alliant l innovation pragmatique, la souplesse d utilisation et l efficacité Living Your

Plus en détail

Leçon 4 : Typologie des SI

Leçon 4 : Typologie des SI Leçon 4 : Typologie des SI Typologie des SI Système formel Système informel Typologie des SI Chaque jour au sein d une organisation Le système d info stocke, traie ou restitue des quantités importantes

Plus en détail

PLAN. Les systèmes d'information analytiques. Exemples de décisions

PLAN. Les systèmes d'information analytiques. Exemples de décisions Les systèmes d'information analytiques Dr A.R. Baba-ali Maitre de conferences USTHB PLAN Le cycle de decision Les composants analytiques ETL (Extract, Transform and Load) Entrepot de (Data warehouse) Traitement

Plus en détail

Techniques de DM pour la GRC dans les banques Page 11

Techniques de DM pour la GRC dans les banques Page 11 Techniques de DM pour la GRC dans les banques Page 11 II.1 Introduction Les techniques de data mining sont utilisé de façon augmentaté dans le domaine économique. Tels que la prédiction de certains indicateurs

Plus en détail

Analyse de grandes bases de données en santé

Analyse de grandes bases de données en santé .. Analyse de grandes bases de données en santé Alain Duhamel Michaël Genin Mohamed Lemdani EA 2694 / CERIM Master 2 Recherche Biologie et Santé Journée Thématique Fouille de Données Plan. 1 Problématique.

Plus en détail

Analyse de grandes bases de données en santé

Analyse de grandes bases de données en santé .. Analyse de grandes bases de données en santé Alain Duhamel Michaël Genin Mohamed Lemdani EA 2694 / CERIM Master 2 Recherche Biologie et Santé Journée Thématique Fouille de Données Plan. 1 Problématique.

Plus en détail

CRM et GRC, la gestion de la relation client R A LLER PL US L OI

CRM et GRC, la gestion de la relation client R A LLER PL US L OI 3 R A LLER PL US L OI CRM et GRC, la gestion de la relation client Comment exploiter et déployer une solution de relation client dans votre entreprise? Les usages d une CRM Les fonctionnalités d une CRM

Plus en détail

Accélérer l agilité de votre site de e-commerce. Cas client

Accélérer l agilité de votre site de e-commerce. Cas client Accélérer l agilité de votre site de e-commerce Cas client L agilité «outillée» devient nécessaire au delà d un certain facteur de complexité (clients x produits) Elevé Nombre de produits vendus Faible

Plus en détail

Méthodes de DM pour la GRC dans les banques

Méthodes de DM pour la GRC dans les banques Techniques de DM pour la GRC dans les banques Page 21 III.1 Introduction Avant de chercher des techniques à appliquer dans la gestion des relations avec les clients. Il faut étudier les données des clients

Plus en détail

IBM SPSS Direct Marketing

IBM SPSS Direct Marketing IBM SPSS Direct Marketing Analysez le comportement de vos clients et améliorez vos campagnes marketing Points clés Avec SPSS Direct Marketing, vous pouvez : Mieux comprendre vos clients Améliorer vos campagnes

Plus en détail

Le métier de Chargé(e) d Etudes Statistiques

Le métier de Chargé(e) d Etudes Statistiques Le métier de Chargé(e) d Etudes Statistiques Nicolas Cabaj Sommaire Présentation du chargé d études statistiques 3 exemples de missions réalisées: Le scoring, illustré par un outil de détection des fraudes

Plus en détail

Formation Actuaire Data-Scientist PROGRAMME

Formation Actuaire Data-Scientist PROGRAMME Formation Actuaire Data-Scientist PROGRAMME 15 Septembre 2014 Arthur Charpentier, Romuald Élie & Jérémie Jakubowicz 15914 Programme Séance inaugurale : révolu-on numérique besoins des entreprises cadre

Plus en détail

Cybermarché et analyse comportementale

Cybermarché et analyse comportementale Cybermarché et analyse comportementale Antoine-Eric Sammartino aesammartino@e-laser.fr Séminaire Data Mining - Educasoft Formations 18 juin 2001-1- MENU Le Groupe LaSer Le processus Data Mining L industrialisation

Plus en détail

Analyse de données textuelles Panorama des fonctions, des méthodes et des usages

Analyse de données textuelles Panorama des fonctions, des méthodes et des usages Analyse de données textuelles Panorama des fonctions, des méthodes et des usages Sylvie Dalbin Assistance & Techniques Documentaires DocForum, Le 17 Novembre 2005 Déroulé de l'intervention (1) 1. Définition

Plus en détail

Table des matières. PREMIÈRE PARTIE Étapes initiales des études marketing 7

Table des matières. PREMIÈRE PARTIE Étapes initiales des études marketing 7 Table des matières Préface Public 1 Structure de l ouvrage 1 Caractéristiques de l ouvrage 3 Contenu 3 Pédagogie 4 Remarques sur l adaptation française 4 Ressources numériques 5 Biographie 6 PREMIÈRE PARTIE

Plus en détail

Business Intelligence

Business Intelligence Business Intelligence Enjeux, Projets, Données, Indicateurs Gilles FONTANINI g.fontanini@decision-network.eu +33 (0)6 11 21 24 53 2? Gilles Fontanini Consultant et Administrateur d un GIE d experts en

Plus en détail

COURS DE STATISTIQUES (24h)

COURS DE STATISTIQUES (24h) COURS DE STATISTIQUES (24h) Introduction Statistiques descriptives (4 h) Rappels de Probabilités (4 h) Echantillonnage(4 h) Estimation ponctuelle (6 h) Introduction aux tests (6 h) Qu est-ce que la statistique?

Plus en détail

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

Le tout fichier Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique Introduction à l informatique : Information automatisée Le premier ordinateur Définition disque dure, mémoire, carte mémoire, carte mère etc Architecture d un ordinateur Les constructeurs leader du marché

Plus en détail

Shadow Manager Simulateur de gestion globale d entreprise. Introduction

Shadow Manager Simulateur de gestion globale d entreprise. Introduction Shadow Manager Simulateur de gestion globale d entreprise Introduction Le logiciel de simulation d entreprise Shadow Manager représente le nec plus ultra des outils pédagogiques de simulation de gestion

Plus en détail

Master ISI 2010-2011. Data Mining Recherche des sous-ensembles fréquents

Master ISI 2010-2011. Data Mining Recherche des sous-ensembles fréquents Master ISI 2010-2011 Data Mining Recherche des sous-ensembles fréquents Yves Lechevallier INRIA-Rocquencourt E_mail : Yves.Lechevallier@inria.fr 1 Processus Data Mining Phase A : Entrepôt de données Entrepôt

Plus en détail

La Crm : quels sont les compartiments du jeu? Emmanuel Crevecoeur. Directeur commercial. Isagri

La Crm : quels sont les compartiments du jeu? Emmanuel Crevecoeur. Directeur commercial. Isagri La Crm : quels sont les compartiments du jeu? Emmanuel Crevecoeur. Directeur commercial. Isagri Gestion de la Relation Client GRC : quels sont les compartiments du jeu? Emmanuel Crevecoeur Mars 2012 Ordre

Plus en détail

Le «data mining», une démarche pour améliorer le ciblage des contrôles

Le «data mining», une démarche pour améliorer le ciblage des contrôles MINISTERE DE L ECONOMIE ET DES FINANCES Le «data mining», une démarche pour améliorer le ciblage des contrôles La lutte contre la fraude aux finances publiques a été renforcée ces dernières années et a

Plus en détail

Fouille de Données et Media Sociaux Cours 2 Master DAC Data Science UPMC - LIP6

Fouille de Données et Media Sociaux Cours 2 Master DAC Data Science UPMC - LIP6 Fouille de Données et Media Sociaux Cours 2 Master DAC Data Science UPMC - LIP6 Ludovic Denoyer 21 septembre 2015 Ludovic Denoyer () FDMS 21 septembre 2015 1 / 1 Contexte Observation La plupart des bonnes

Plus en détail

INTRODUCTION AU DATA MINING. Cina MOTAMED

INTRODUCTION AU DATA MINING. Cina MOTAMED INTRODUCTION AU DATA MINING Cina MOTAMED 2 Data Mining : contexte Âge numérique : explosion des volumes de données Transactions commerciales Opérations bancaires Navigation Internet Indicateurs démographiques

Plus en détail

Caisse d Epargne Rhône Alpes Licence Econométrie Lyon 2

Caisse d Epargne Rhône Alpes Licence Econométrie Lyon 2 Caisse d Epargne Rhône Alpes Licence Econométrie Lyon 2 22 Novembre 2013 - Valérie Rousvoal Direction Etudes Commerciales Sommaire de la rencontre Présentation de la Caisse d épargne Rhône Alpes Présentation

Plus en détail

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring ESSEC Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring Les méthodes d évaluation du risque de crédit pour les PME et les ménages Caractéristiques Comme les montants des crédits et des

Plus en détail

ADAPTER LA METHODE AUX OBJECTIFS DE L ENQUETE

ADAPTER LA METHODE AUX OBJECTIFS DE L ENQUETE Déchets : outils et exemples pour agir Fiche méthode n 1 www.optigede.ademe.fr ADAPTER LA METHODE AUX OBJECTIFS DE L ENQUETE Origine et objectif de la fiche : Les retours d expérience des collectivités

Plus en détail

PEI Sage 100 CRM. Présentation Fonctionnelle. Version i7.7

PEI Sage 100 CRM. Présentation Fonctionnelle. Version i7.7 Version i7.7 Sommaire 1 INTRODUCTION... 4 1.1 Proposition de valeur...4 1.2 Détails de la solution...4 2 MODULE PROSPECTION ET VENTE... 6 2.1 Sociétés et Contacts : Informations contextuelles...6 2.2 Parc

Plus en détail

Evry - M2 MIAGE Entrepôt de données

Evry - M2 MIAGE Entrepôt de données Evry - M2 MIAGE Entrepôt de données Introduction D. Ploix - M2 Miage - EDD - Introduction 1 Plan Positionnement du BI dans l entreprise Déclinaison fonctionnelle du décisionnel dans l entreprise Intégration

Plus en détail

SYNERGIE Associés Confidentiel Reproduction interdite sans autorisation préalable Page 1 de 44

SYNERGIE Associés Confidentiel Reproduction interdite sans autorisation préalable Page 1 de 44 SYNERGIE Associés Confidentiel Reproduction interdite sans autorisation préalable Page 1 de 44 Le CRM (GRC) est la clef de votre succès Les Principes généraux de la Gestion de la Relation Clients Confidentiel

Plus en détail

Discrétisation et génération de hiérarchies de concepts

Discrétisation et génération de hiérarchies de concepts Prétraitement des données 1 Pourquoi prétraiter les données? Nettoyage des données Intégration et transformation Réduction des données Discrétisation et génération de hiérarchies de g concepts Pourquoi

Plus en détail

Concours interne de l agrégation du second degré. Section économie et gestion. Programme de la session 2013

Concours interne de l agrégation du second degré. Section économie et gestion. Programme de la session 2013 Concours interne de l agrégation du second degré Concours interne d accès à l échelle de rémunération des professeurs agrégés dans les établissements d enseignement privés sous contrat du second degré

Plus en détail

Transformation IT de l entreprise ANALYTIQUE: L ÈRE WATSON

Transformation IT de l entreprise ANALYTIQUE: L ÈRE WATSON Transformation IT de l entreprise ANALYTIQUE: L ÈRE WATSON L analytique joue un rôle désormais primordial dans la réussite d une entreprise. Les pouvoirs qu elle délivre sont incontestables, cependant

Plus en détail

ENSEIGNEMENT ET MONDE PROFESSIONNEL. Illustration d un lien fort au travers d un cours de scoring. Jean-Philippe KIENNER 7 novembre 2013

ENSEIGNEMENT ET MONDE PROFESSIONNEL. Illustration d un lien fort au travers d un cours de scoring. Jean-Philippe KIENNER 7 novembre 2013 ENSEIGNEMENT ET MONDE PROFESSIONNEL Illustration d un lien fort au travers d un cours de scoring Jean-Philippe KIENNER 7 novembre 2013 CONTEXTE Une bonne insertion professionnelle des étudiants passe par

Plus en détail

6ème édition du Baromètre des investissements informatiques en France

6ème édition du Baromètre des investissements informatiques en France 6ème édition du Baromètre des investissements informatiques en France Objectifs Baromètre des investissements informatiques en France avec pour objectifs : de suivre l évolution de l opinion des responsables

Plus en détail

Sage CRM. La solution complète de Gestion des Relations Clients pour PME. Précision et efficacité à portée de mains!

Sage CRM. La solution complète de Gestion des Relations Clients pour PME. Précision et efficacité à portée de mains! Sage CRM Précision et efficacité à portée de mains! La solution complète de Gestion des Relations Clients pour PME Alliant l innovation pragmatique, la souplesse d utilisation et l efficacité Le CRM Simplicité

Plus en détail

LES TYPOLOGIES DE PARCOURS METHODES ET USAGES. Yvette Grelet, Patrick Rousset CEREQ grelet@mrsh.unicaen.fr rousset@cereq.fr

LES TYPOLOGIES DE PARCOURS METHODES ET USAGES. Yvette Grelet, Patrick Rousset CEREQ grelet@mrsh.unicaen.fr rousset@cereq.fr LES TYPOLOGIES DE PARCOURS METHODES ET USAGES Yvette Grelet, Patrick Rousset CEREQ grelet@mrsh.unicaen.fr rousset@cereq.fr 1 PLAN Première partie : un exemple traité «en vraie grandeur» : les 26500 jeunes

Plus en détail

Les 10 grands principes de l utilisation du data mining pour une gestion de la relation client réussie

Les 10 grands principes de l utilisation du data mining pour une gestion de la relation client réussie Les 10 grands principes de l utilisation du data mining pour une gestion de la relation client réussie Découvrir les stratégies ayant fait leurs preuves et les meilleures pratiques Points clés : Planifier

Plus en détail

Dossier de candidature

Dossier de candidature Dossier de candidature Introduction: Avant d entreprendre la création d une entreprise, mais également à l occasion du développement d une nouvelle activité, il est absolument conseillé d élaborer un business

Plus en détail

TABLE DES MATIÈRES CHAPITRE

TABLE DES MATIÈRES CHAPITRE TABLE DES MATIÈRES CHAPITRE 1 Le pilotage de la performance... 17 I. Du contrôle au pilotage de la performance... 17 A. Le contrôle de gestion traditionnel... 17 B. Le pilotage de la performance... 19

Plus en détail

INTELLIGENCE MARKETING ETUDES DE MARCHE - DATA MINING - CONSEIL EN MARKETING - SYSTEMES D INFORMATION MARKETING

INTELLIGENCE MARKETING ETUDES DE MARCHE - DATA MINING - CONSEIL EN MARKETING - SYSTEMES D INFORMATION MARKETING ETUDES DE MARCHE - DATA MINING - CONSEIL EN - SYSTEMES D INFORMATION Notre mission Des études de marché au data mining Cinq sur Cinq est un institut d intelligence marketing. Notre métier : collecter,

Plus en détail

Le géomarketing - Page 1 sur 7

Le géomarketing - Page 1 sur 7 Le géomarketing - Page 1 sur 7 LES DOSSIERS MADWATCH.net méthodes Le Géomarketing Novembre 2003 Nb de pages : 7 Le géomarketing - Page 2 sur 7 Créé dans les années 80, la plupart des applications du géomarketing

Plus en détail

Cours Fouille de données avancée

Cours Fouille de données avancée Ministère de l Enseignement Supérieur et de la Recherche Scientifique Université Mohamed Khider - Biskra Faculté des Sciences Exactes et des Sciences de la Nature et de la Vie Département d Informatique

Plus en détail

Enjeux mathématiques et Statistiques du Big Data

Enjeux mathématiques et Statistiques du Big Data Enjeux mathématiques et Statistiques du Big Data Mathilde Mougeot LPMA/Université Paris Diderot, mathilde.mougeot@univ-paris-diderot.fr Mathématique en Mouvements, Paris, IHP, 6 Juin 2015 M. Mougeot (Paris

Plus en détail

Journées d études IARD

Journées d études IARD Journées d études IARD Gestion des risques liés à la refonte tarifaire d un portefeuille automobile Niort, le 20 mars 2014 Marie Foucher mfoucher@galea-associes.eu Pierre Thérond ptherond@galea-associes.eu

Plus en détail

Apprentissage statistique Stratégie du Data-Mining

Apprentissage statistique Stratégie du Data-Mining Apprentissage statistique Stratégie du Data-Mining Hélène Milhem Institut de Mathématiques de Toulouse, INSA Toulouse, France IUP SID, 2011-2012 H. Milhem (IMT, INSA Toulouse) Apprentissage statistique

Plus en détail

We make your. Data Smart. Data Smart

We make your. Data Smart. Data Smart We make your We make your Data Smart Data Smart Une société Une société du du groupe Le groupe NP6 SPECIALISTE LEADER SECTEURS EFFECTIFS SaaS Marketing : 50% Data intelligence : 50% 15 sociétés du CAC

Plus en détail

Des données à la connaissance client. A la découverte de la plateforme de connaissance client knowlbox

Des données à la connaissance client. A la découverte de la plateforme de connaissance client knowlbox Des données à la connaissance client A la découverte de la plateforme de connaissance client knowlbox Livre blanc mai 2013 A l heure du Big Data, les entreprises s interrogent davantage sur leurs données.

Plus en détail

2.1. Les stades d évolution de la fonction de Supply Chain Management 7 2.2. L intégration horizontale des fonctions de l entreprise 12

2.1. Les stades d évolution de la fonction de Supply Chain Management 7 2.2. L intégration horizontale des fonctions de l entreprise 12 Table des matières Avant-propos 3 Introduction 1. L entreprise et l environnement financier...5 2. Le concept traditionnel...6 2.1. Les stades d évolution de la fonction de Supply Chain Management 7 2.2.

Plus en détail

Travailler avec les télécommunications

Travailler avec les télécommunications Travailler avec les télécommunications Minimiser l attrition dans le secteur des télécommunications Table des matières : 1 Analyse de l attrition à l aide du data mining 2 Analyse de l attrition de la

Plus en détail

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com Intelligence Artificielle et Systèmes Multi-Agents Badr Benmammar bbm@badr-benmammar.com Plan La première partie : L intelligence artificielle (IA) Définition de l intelligence artificielle (IA) Domaines

Plus en détail

du Commercial Profil d activités

du Commercial Profil d activités Activités des salariés permanents des agences d intérim Profil d activités du Commercial Activités type Développer et suivre le chiffre d affaire et la rentabilité du portefeuille confié par des actions

Plus en détail

Glossaire GRH. Il vise à proposer un langage commun, et permet d éviter d éventuels risques de malentendus ou de confusions.

Glossaire GRH. Il vise à proposer un langage commun, et permet d éviter d éventuels risques de malentendus ou de confusions. Ce glossaire a été élaboré dans un souci de clarification des notions et concepts clés communément utilisés en Gestion des Ressources Humaines, et notamment dans le champ de la gestion prévisionnelle des

Plus en détail

Méthodologie de conceptualisation BI

Méthodologie de conceptualisation BI Méthodologie de conceptualisation BI Business Intelligence (BI) La Business intelligence est un outil décisionnel incontournable à la gestion stratégique et quotidienne des entités. Il fournit de l information

Plus en détail

5 raisons de placer Le CRM au cœur de votre performance

5 raisons de placer Le CRM au cœur de votre performance L'expertise du Data Management 5 raisons de placer Le CRM au cœur de votre performance Thierry ALINGRIN William BEREAULT L'information client au cœur des décisions et de l'action CRM & Performance d Entreprise

Plus en détail

IBM Content Analytics Libérer l Information

IBM Content Analytics Libérer l Information IBM Content Analytics Libérer l Information Patrick HOFLEITNER patrick_hofleitner@fr.ibm.com Août 2011 TABLE DES MATIERES RESUME...3 INTRODUCTION...4 LA PROBLEMATIQUE...5 1 L EXPLOSION DU CONTENU NON-STRUCTURE...5

Plus en détail

CONSEIL STRATÉGIQUE. Services professionnels. En bref

CONSEIL STRATÉGIQUE. Services professionnels. En bref Services professionnels CONSEIL STRATÉGIQUE En bref La bonne information, au bon moment, au bon endroit par l arrimage des technologies appropriées et des meilleures pratiques. Des solutions modernes adaptées

Plus en détail

Ici, le titre de la. Tableaux de bords de conférence

Ici, le titre de la. Tableaux de bords de conférence Ici, le titre de la Tableaux de bords de conférence pilotage d entreprise, indicateurs de performance reporting et BI quels outils seront incontournables à l horizon 2010? Les intervenants Editeur/Intégrateur

Plus en détail

PRÉSENTATION PRODUIT. Plus qu un logiciel, la méthode plus efficace de réconcilier.

PRÉSENTATION PRODUIT. Plus qu un logiciel, la méthode plus efficace de réconcilier. PRÉSENTATION PRODUIT Plus qu un logiciel, la méthode plus efficace de réconcilier. Automatiser les réconciliations permet d optimiser l utilisation des ressources et de générer plus de rentabilité dans

Plus en détail

Livre Blanc. Optimiser la gestion et le pilotage des opérations. Août 2010

Livre Blanc. Optimiser la gestion et le pilotage des opérations. Août 2010 Livre Blanc Optimiser la gestion et le pilotage des opérations Août 2010 Un livre blanc édité par : NQI - Network Quality Intelligence Tél. : +33 4 92 96 24 90 E-mail : info@nqicorp.com Web : http://www.nqicorp.com

Plus en détail

Tous droits réservés SELENIS

Tous droits réservés SELENIS 1. Objectifs 2. Etapes clefs 3. Notre proposition d accompagnement 4. Présentation de SELENIS 2 Un projet est une réalisation spécifique, dans un système de contraintes donné (organisation, ressources,

Plus en détail

Ingénierie d aide à la décision

Ingénierie d aide à la décision Ingénierie d aide à la décision Maria Malek 1 er septembre 2009 1 Objectifs et débouchés Nous proposons dans cette option deux grands axes pour l aide à la décision : 1. La recherche opérationnelle ; 2.

Plus en détail

ECOLE DU MANAGEMENT - Niveau 3 Cycle Supérieur Industriel

ECOLE DU MANAGEMENT - Niveau 3 Cycle Supérieur Industriel Responsables opérationnels débutants ou expérimentés en lien direct avec le comité de direction. Responsables d unités de production. Responsables de projet (technique, organisation, industrialisation).

Plus en détail

LES SOLUTIONS MES HUMAINES METTENT EN AVANT LES INDIVIDUS

LES SOLUTIONS MES HUMAINES METTENT EN AVANT LES INDIVIDUS LIVRE BLANC LES SOLUTIONS MES HUMAINES METTENT EN AVANT LES INDIVIDUS Une collaboration entre homme et machine LIVRE BLANC LES SOLUTIONS MES HUMAINES METTENT EN AVANT LES INDIVIDUS 2 A PROPOS Les hommes

Plus en détail

Stages 2015-2016 ISOFT : 25 ANS DE RECHERCHE EN INFORMATIQUE DECISIONNELLE ET. Contact : Mme Lapedra, stage@isoft.fr ANALYSE DE DONNEES

Stages 2015-2016 ISOFT : 25 ANS DE RECHERCHE EN INFORMATIQUE DECISIONNELLE ET. Contact : Mme Lapedra, stage@isoft.fr ANALYSE DE DONNEES Stages 2015-2016 Contact : Mme Lapedra, stage@isoft.fr ISOFT : 25 ANS DE RECHERCHE EN INFORMATIQUE DECISIONNELLE ET ANALYSE DE DONNEES ISoft est un concepteur-éditeur de logiciels spécialisé dans la recherche

Plus en détail

CRM Assurance. Fonctionnalités clés. Vue globale de l assuré. Gestion des échanges en Multicanal

CRM Assurance. Fonctionnalités clés. Vue globale de l assuré. Gestion des échanges en Multicanal CRM Assurance Fonctionnalités clés Vue globale de l assuré Le CRM pour les compagnies d'assurances est une solution spécialement conçue pour mettre en place et soutenir les fondements d une orientation

Plus en détail

Séance 12: Algorithmes de Support Vector Machines

Séance 12: Algorithmes de Support Vector Machines Séance 12: Algorithmes de Support Vector Machines Laboratoire de Statistique et Probabilités UMR 5583 CNRS-UPS www.lsp.ups-tlse.fr/gadat Douzième partie XII Algorithmes de Support Vector Machines Principe

Plus en détail

JASPERSOFT ET LE PAYSAGE ANALYTIQUE. Jaspersoft et le paysage analytique 1

JASPERSOFT ET LE PAYSAGE ANALYTIQUE. Jaspersoft et le paysage analytique 1 JASPERSOFT ET LE PAYSAGE ANALYTIQUE Jaspersoft et le paysage analytique 1 Ce texte est un résumé du Livre Blanc complet. N hésitez pas à vous inscrire sur Jaspersoft (http://www.jaspersoft.com/fr/analyticslandscape-jaspersoft)

Plus en détail

FILIÈRE METHODOLOGIE & PROJET

FILIÈRE METHODOLOGIE & PROJET FILIÈRE METHODOLOGIE & PROJET 109 Gestion de projet METHODOLOGIE ET PROJET Durée 3 jours Conduite de projet COND-PRO s Intégrer les conditions de réussite d une démarche de management par projet. Impliquer

Plus en détail

PROGRAMMES DE GESTION 3 ème année & 4 ème année de l Enseignement secondaire

PROGRAMMES DE GESTION 3 ème année & 4 ème année de l Enseignement secondaire RÉPUBLIQUE TUNISIENNE MINISTÈRE DE L ÉDUCATION & DE LA FORMATION DIRECTION GÉNÉRALE DES PROGRAMMES & DE LA FORMATION CONTINUE Direction des Programmes & des Manuels Scolaires PROGRAMMES DE GESTION 3 ème

Plus en détail

La Gestion de la Relation Client n est pas un luxe : c est une nécessité pour gagner en efficacité

La Gestion de la Relation Client n est pas un luxe : c est une nécessité pour gagner en efficacité SAGE CRM EXPRESS La Gestion de la Relation Client n est pas un luxe : c est une nécessité pour gagner en efficacité Titre de la rubrique Pourquoi un logiciel de Gestion de la Relation Client? Découvrir

Plus en détail

Étapes du développement et de l utilisation d un modèle de simulation

Étapes du développement et de l utilisation d un modèle de simulation Étapes du développement et de l utilisation d un modèle de simulation Étapes du développement et de l utilisation d un modèle de simulation Formulation du problème Cueillette et analyse de données Conception

Plus en détail