Christophe CANDILLIER Cours de DataMining mars 2004 Page 1
|
|
- Basile Alarie
- il y a 8 ans
- Total affichages :
Transcription
1 Christophe CANDILLIER Cours de DataMining mars 2004 age 1
2 1. Introduction 2. rocessus du DataMining 3. Analyse des données en DataMining 4. Analyse en Ligne OLA 5. Logiciels 6. Bibliographie Christophe CANDILLIER Cours de DataMining mars 2004 age 2
3 Définition : Ensemble des techniques permettant d'aller puiser des informations pertinentes dans les montagnes de données stockées ces dernières décennies dans les entreprises. Analyse de Données + Bases de Données = Christophe CANDILLIER Cours de DataMining mars 2004 age 3
4 1. Nettoyage des données 3. Transformation des données 4. Définition de l'objectif et de la stratégie 5. Mise en oeuvre des méthodes 6. Test de validation 7. Exploitation des résultats. Analyse de données 3,4,5,7 + 1,,6 = DataMining Christophe CANDILLIER Cours de DataMining mars 2004 age 4
5 révoir marketing: Analyse des stocks et des ventes. Eviter les stocks, vendre à flux tendu. Segmenter marketing: Recherche et ciblage de niches de marché. Définir des types de clients potentiels. Analyser marketing: Analyse des profils des clients. Définir la fidélité potentielle d'un type de client. Définir une offre adaptée à chaque type de client. Christophe CANDILLIER Cours de DataMining mars 2004 age 5
6 Analyser marketing: Analyse des relations. Définir des produits groupés. Analyser production: Suivi en ligne des paramètres de production. Déterminer les facteurs modifiant la qualité. Analyser banques, télécom: Suivi en ligne des comportements. Détection de fraudes. Christophe CANDILLIER Cours de DataMining mars 2004 age 6
7 Optimisation transport: Calcul des circuits de livraison. Diminuer les coûts de transport. Diagnostiquer médecine: Estimation des causes et des conséquences probables des symptômes. Aider au diagnostic des maladies. Christophe CANDILLIER Cours de DataMining mars 2004 age 7
8 Autres : rospection textuelle text mining Veille technologique et collecte automatique d'informations textuelles. Web mining et comportement des internautes. Amélioration d'un site web ersonnalisation d'un site web. Christophe CANDILLIER Cours de DataMining mars 2004 age 8
9 Des volumes considérables de données plusieurs téraoctets : entrepôts de données Data WareHouses Christophe CANDILLIER Cours de DataMining mars 2004 age 9
10 Nettoyage des Données Échantillonnage Analyse de données standard Validation du résultat sur un autre échantillon Lecture artielle ou Résumé Analyse de Données en Ligne : OLA On-Line Analytical rocessing Résultats d'analyse Christophe CANDILLIER Cours de DataMining mars 2004 age 10
11 our enlever les bruits données répétées, doublons. our détecter les anomalies erreurs de saisie, valeurs improbables ou aberrantes. valeurs continues : méthodes statistiques donnant les valeurs minimales et maximales acceptables. valeurs qualitatives : sélection, comparaison à l'aide de tableaux de fréquence. valeurs manquantes :? pas de solution générale Christophe CANDILLIER Cours de DataMining mars 2004 age 11
12 Le plus grand possible ET traitable dans un temps raisonnable Choix aléatoire des individus Un échantillon pour la phase d'apprentissage Un échantillon pour la phase de validation Christophe CANDILLIER Cours de DataMining mars 2004 age 12
13 Dépend de la méthode d'analyse utilisée arfois difficilement faisable ou pas faisable du tout ex : Classification d'individus as forcément utile si l'on fait confiance au résultat Christophe CANDILLIER Cours de DataMining mars 2004 age 13
14 Analyse exploratoire des données, Visualisation Analyses factorielles vues en cours Classifications vues en cours Règles d'associations Arbres de décision Algorithmes génétiques Réseaux bayésiens Réseaux de neurones Christophe CANDILLIER Cours de DataMining mars 2004 age 14
15 But : Identifier des relations entre des variables Techniques utilisées : Examen des distributions de variables Examen des matrices de corrélations Régression linéaire ou non avec 2 ou plus variables Christophe CANDILLIER Cours de DataMining mars 2004 age 15
16 Variable analysée : Revenu Christophe CANDILLIER Cours de DataMining mars 2004 age 16
17 Variables analysées : NB,EF et CA Christophe CANDILLIER Cours de DataMining mars 2004 age 17
18 Variables analysées avec une Cible : ROFcible, TRAN,MENA,REA,SOMM ROF théo = TRAN 0.33 MENA REA SOMM Christophe CANDILLIER Cours de DataMining mars 2004 age 18
19 Une règle d association est une règle du type Si REDICAT alors CONSÉQUENCE Les règles sont caractérisées par deux mesures : Support pop REDICAT et CONSÉQUENCE pop totale pop REDICAT Confiance pop CONSÉQUENCE Choix des Règles : Bonne confiance ex : >70% et Bon support ex : >5% Christophe CANDILLIER Cours de DataMining mars 2004 age 19
20 Exemple, le naufrage du Titanic : la classe premiere, deuxieme, troisieme, equipage le sexe de la personne masculin, feminin l'age adulte, enfant survecu oui, non Christophe CANDILLIER Cours de DataMining mars 2004 age 20
21 Définition : Il ressemble aux règles d'association mais il est ordonné de la variable la plus explicative jusqu'à la moins explicative en fonction de la variable cible. Exemple, le Titanic : prédicat : classe, sexe, age cible : survecu Christophe CANDILLIER Cours de DataMining mars 2004 age 21
22 sexe = male classe = 1st age = adult: no 175.0/57.0 age = child: yes 5.0 classe = 2nd age = adult: no 168.0/14.0 age = child: yes 11.0 classe = 3rd: no 510.0/88.0 classe = crew: no 862.0/192.0 sexe = female classe = 1st: yes 145.0/4.0 classe = 2nd: yes 106.0/13.0 classe = 3rd: no 196.0/90.0 classe = crew: yes 23.0/3.0 classement correct global =79% Christophe CANDILLIER Cours de DataMining mars 2004 age 22
23 But : trouver les quelques bonnes solutions sans évaluer toutes les solutions en imitant la sélection naturelle. Exemple d'application : la recherche de règles d'association n our n variables prédicats : règles possibles pour A,B,C X X A X, B X, C X, A et B X, A et C X, B et C X A et B et C X Christophe CANDILLIER Cours de DataMining mars 2004 age 23
24 Modélisation : Choix du codage des solutions en individus Choix de la fonction d'évaluation des individus Choix de la fonction de croisement des individus Choix de la fonction de mutation des individus Déroulement du processus : 1. Création au hasard des premiers individus 2. Sélection Évaluation 3. Reproduction Croisements / Mutations 4. Si pas terminé Alors retour à l'étape 2 Christophe CANDILLIER Cours de DataMining mars 2004 age 24
25 Exemple : le voyageur de commerce Codage : ordre des villes Évaluation : distance parcourue la plus courte Croisement : Mutation : Inversion Christophe CANDILLIER Cours de DataMining mars 2004 age 25
26 Exemple : le voyageur de commerce 100 villes Christophe CANDILLIER Cours de DataMining mars 2004 age 26
27 Définition : modèle graphique de représentation de la causalité sous forme probabiliste. Intérêts : Déduire les conséquences probables grâce à une partie des causes. Induire depuis les conséquences pour déterminer les causes probables. Inconvénient : Seul un expert peut construire le graphe de causes/conséquences et il faut donner les probabilités Domaines d'application : Diagnostic maladies, pannes Christophe CANDILLIER Cours de DataMining mars 2004 age 27
28 outil de diagnostic : Christophe CANDILLIER Cours de DataMining mars 2004 age 28
29 Exemple : Il a lu robabilité VRAI 0.2 FAUX 0.8 Arrosage robabilité VRAI 0.1 FAUX 0.9 Le jardin du Voisin luie luie est mouillé VRAI FAUX VRAI FAUX Mon ArrosageArrosage Arrosage Arrosage Jardin VRAI VRAI FAUX FAUX Est luie luie luie luie Mouillé VRAI FAUX VRAI FAUX VRAI FAUX Déduction : J / A J / Aet J / Aet J / A J / J / Aet A J / Aet A J / Christophe CANDILLIER Cours de DataMining mars 2004 age 29
30 Christophe CANDILLIER Cours de DataMining mars 2004 age 30 Déduction : Induction : / / / / J A Aet J A Aet J A Aet J A Aet J J / / J A A J J A / / J J J / / J A Aet J J Aet
31 Définition : graphe orienté de neurones se comportant comme une fonction non linéaire donnant les sorties en fonction des entrées. Neurone Réseau de Neurones Fonctionnement : hase d'apprentissage sur des exemples hase d'utilisation Christophe CANDILLIER Cours de DataMining mars 2004 age 31
32 Exemple : détermination du comportement d'un acheteur Inconvénients : Difficulté du choix du modèle de réseau Difficultés de la phase d'apprentissage Quels exemples? Combien? Dans quel ordre? Quand arrêter l'apprentissage? Fiabilité du réseau après l'apprentissage : bon fonctionnement incertain sur les nouveaux cas inconnus! Applications : Reconnaissance écriture, parole Christophe CANDILLIER Cours de DataMining mars 2004 age 32
33 Exemple simple : apprentissage du OU pour un réseau composé d'un seul neurone avec =-1,0,1 Et Sortie=0,1. E1 Sortie E2 Sortie E1, E2 E1 1 E2 2 Essai E1 E2 Résultat 1 2 Sortie Correction 1 Correction 2 A B _+1 0 C _+1 D A B C D Christophe CANDILLIER Cours de DataMining mars 2004 age 33
34 Exemple donnant la fonction XOR non linéaire E1 1 N Sortie N 20,0 N 21,0 N 21,1 E2 N N3 NS NS E1, E2 N1 N3 2 N 2 NS E1, E2 E1 E2 2 E1 E NS0,0 NS1,0 NS11, Christophe CANDILLIER Cours de DataMining mars 2004 age 34
35 rincipe : bénéficier en temps réel d'un tableau de bord donnant les informations souhaitées résumé, dernières variations sur un entrepôt de données. Un système OLA est un tout indissociable entre la structure de données et les analyses OLA : La structure des données détermine les analyses OLA possibles. Les analyses OLA demandées déterminent la structure de données à adopter. Christophe CANDILLIER Cours de DataMining mars 2004 age 35
36 Les analyses se font via un cube de données représentant au maximum trois variables réelles ou synthétiques appelées dimensions. Exemple : Le prix HT d'une vente de chaussures est fonction d'un magasin, d'un mois la date et d'un modèle, son cube est : Christophe CANDILLIER Cours de DataMining mars 2004 age 36
37 La structure de données permettant d'obtenir ce cube et bien d'autres est : Christophe CANDILLIER Cours de DataMining mars 2004 age 37
38 Les variables synthétiques sont définies par des formules. Exemple : avec TVA qui dépend du temps mois, on obtient le cube de TTC : Christophe CANDILLIER Cours de DataMining mars 2004 age 38
39 Les principales différences : Entrepôt Base de données +OLA de données + SQL Visualisation Cubes Tables sélections Exploration Souris Requêtes textes Résumés Oui Non Rapidité Instantané Lent pour résumer Christophe CANDILLIER Cours de DataMining mars 2004 age 39
40 Outils rofessionels : Enterprise Miner de SAS Clementine de SSS DB2 Intelligent Miner d'ibm SAD de Decisia Logiciels Libres : Tanagra R WEKA Christophe CANDILLIER Cours de DataMining mars 2004 age 40
41 Christophe CANDILLIER Cours de DataMining mars 2004 age 41
42 Christophe CANDILLIER Cours de DataMining mars 2004 age 42
43 Sites référençant les logiciels de DataMining : Christophe CANDILLIER Cours de DataMining mars 2004 age 43
44 Livres : Data mining Gestion de la relation client. ersonnalisation de sites Web de René Lefébure, Gilles Venturi Introduction au Data Mining de Michel Jambu Sites Web : Christophe CANDILLIER Cours de DataMining mars 2004 age 44
45 Christophe CANDILLIER Cours de DataMining mars 2004 age 45
Introduction au datamining
Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des
Plus en détaildonnées en connaissance et en actions?
1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)
Plus en détailAnalyse de grandes bases de données en santé
.. Analyse de grandes bases de données en santé Alain Duhamel Michaël Genin Mohamed Lemdani EA 2694 / CERIM Master 2 Recherche Biologie et Santé Journée Thématique Fouille de Données Plan. 1 Problématique.
Plus en détailDéroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI
1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage
Plus en détailAgenda de la présentation
Le Data Mining Techniques pour exploiter l information Dan Noël 1 Agenda de la présentation Concept de Data Mining ou qu est-ce que le Data Mining Déroulement d un projet de Data Mining Place du Data Mining
Plus en détailApprentissage Automatique
Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs
Plus en détailSpécificités, Applications et Outils
Spécificités, Applications et Outils Ricco Rakotomalala Université Lumière Lyon 2 Laboratoire ERIC Laboratoire ERIC 1 Ricco Rakotomalala ricco.rakotomalala@univ-lyon2.fr http://chirouble.univ-lyon2.fr/~ricco/data-mining
Plus en détailDidacticiel Études de cas. Description succincte de Pentaho Data Integration Community Edition (Kettle).
1 Objectif Description succincte de Pentaho Data Integration Community Edition (Kettle). L informatique décisionnelle («Business Intelligence BI» en anglais, ça fait tout de suite plus glamour) fait référence
Plus en détailIntroduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours
Information du cours Informatique décisionnelle et data mining www.lia.univ-avignon.fr/chercheurs/torres/cours/dm Juan-Manuel Torres juan-manuel.torres@univ-avignon.fr LIA/Université d Avignon Cours/TP
Plus en détailStructure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données
Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données et le Data Mining Nous suivons le plan suivant : Fonctionnement de Spad Catalogue des méthodes (statistiques
Plus en détailIntroduction au Data-Mining
Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane
Plus en détailQU EST-CE QUE LE DECISIONNEL?
La plupart des entreprises disposent d une masse considérable d informations sur leurs clients, leurs produits, leurs ventes Toutefois ces données sont cloisonnées par les applications utilisées ou parce
Plus en détailIntroduction au Data-Mining
Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme
Plus en détailData Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.
des des Data Mining Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne 2012-2013 1/65 des des 1 2 des des 3 4 Post-traitement 5 représentation : 6 2/65 des des Définition générale Le
Plus en détailIntroduction à la B.I. Avec SQL Server 2008
Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide
Plus en détail" # $ % % & ' ( ) * +,! '()*+ *, + ' +' + ' ' -+ - +.+. /0 / 1 0 12 1 1 2 34+ 4 1 +. 50 5 * 0 4 * 0 6! "##$ % &!
"# $ %%& ' ( )*+, '()*+,'+''-++.+/0112134+1.50*406 "##$ %& 8CC "#$%& ' ( )* +,-./ 0 123 456+7 3 7-55-89.*/ 0 +3 *+:3 ;< =3 3-3 8 0 23 >-8-3 >5? //*/*0;* @A: *53,,3 / * $/ >B+? - 5, 2 34*56 7 /+#** //8
Plus en détailFilière Data Mining (Fouille de données) Pierre Morizet-Mahoudeaux
Filière Data Mining (Fouille de données) Pierre Morizet-Mahoudeaux Plan Objectifs Débouchés Formation UVs spécifiques UVs connexes Enseignants et partenaires Structure générale des études à l UTC Règlement
Plus en détailDidier MOUNIEN Samantha MOINEAUX
Didier MOUNIEN Samantha MOINEAUX 08/01/2008 1 Généralisation des ERP ERP génère une importante masse de données Comment mesurer l impact réel d une décision? Comment choisir entre plusieurs décisions?
Plus en détailBig Data et Marketing : les competences attendues
Big Data et Marketing : les competences attendues Laurence Fiévet Responsable Marketing Corporate Oney Banque Accord LA DYNAMIQUE DU MARKETING Selon la définition de Kotler et Dubois, «Le marketing est
Plus en détailGENIE STATISTIQUE GESTION DES RISQUES ET INGENIERIE FINANCIERE MARKETING QUANTITATIF ET REVENUE MANAGEMENT
Remarque : Tous les cours sont en français, sauf contre-indication. Pour des traductions anglaises des titres, des descriptifs, et plus de renseignements, consultez l intégralité du Programme des enseignements
Plus en détailMagasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP)
Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP) Définition (G. Gardarin) Entrepôt : ensemble de données historisées variant
Plus en détailIntelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com
Intelligence Artificielle et Systèmes Multi-Agents Badr Benmammar bbm@badr-benmammar.com Plan La première partie : L intelligence artificielle (IA) Définition de l intelligence artificielle (IA) Domaines
Plus en détailLes Entrepôts de Données
Les Entrepôts de Données Grégory Bonnet Abdel-Illah Mouaddib GREYC Dépt Dépt informatique :: GREYC Dépt Dépt informatique :: Cours Cours SIR SIR Systèmes d information décisionnels Nouvelles générations
Plus en détailGrégoire de Lassence. Copyright 2006, SAS Institute Inc. All rights reserved.
Grégoire de Lassence 1 Grégoire de Lassence Responsable Pédagogie et Recherche Département Académique Tel : +33 1 60 62 12 19 gregoire.delassence@fra.sas.com http://www.sas.com/france/academic SAS dans
Plus en détailAlgèbre 40 Analyse 26 14 Stat. 1 - IES : Probabilités discrètes et calcul intégral 29,5 6 Stat. 2 - IES : Probabilités générales 54 8 UE1-02 M-E-IS
1er semestre UE1-01 E Algèbre 40 Analyse 26 14 Stat. 1 - IES : Probabilités discrètes et calcul intégral 29,5 6 Stat. 2 - IES : Probabilités générales 54 8 UE1-02 M-E-IS Introduction au système SAS 25,5
Plus en détailPrésentation du module Base de données spatio-temporelles
Présentation du module Base de données spatio-temporelles S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Partie 1 : Notion de bases de données (12,5h ) Enjeux et principes
Plus en détailLe Data Mining au service du Scoring ou notation statistique des emprunteurs!
France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative
Plus en détailFilière Fouille de Données et Décisionnel FDD (Data Mining) Pierre Morizet-Mahoudeaux www.hds.utc.fr/~pmorizet pierre.morizet@utc.
Filière Fouille de Données et Décisionnel FDD (Data Mining) Pierre Morizet-Mahoudeaux www.hds.utc.fr/~pmorizet pierre.morizet@utc.fr Plan Motivations Débouchés Formation UVs spécifiques UVs connexes Enseignants
Plus en détailTABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.
STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,
Plus en détailRaisonnement probabiliste
Plan Raisonnement probabiliste IFT-17587 Concepts avancés pour systèmes intelligents Luc Lamontagne Réseaux bayésiens Inférence dans les réseaux bayésiens Inférence exacte Inférence approximative 1 2 Contexte
Plus en détailOrganisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining.
2 jours : Mardi 15 et mercredi 16 novembre 2005 de 9 heures 30 à 17 heures 30 Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining. Madame, Monsieur, On parle
Plus en détailIntelligence Economique - Business Intelligence
Intelligence Economique - Business Intelligence Notion de Business Intelligence Dès qu'il y a une entreprise, il y a implicitement intelligence économique (tout comme il y a du marketing) : quelle produit
Plus en détailProjet SINF2275 «Data mining and decision making» Projet classification et credit scoring
Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems
Plus en détailCybermarché et analyse comportementale
Cybermarché et analyse comportementale Antoine-Eric Sammartino aesammartino@e-laser.fr Séminaire Data Mining - Educasoft Formations 18 juin 2001-1- MENU Le Groupe LaSer Le processus Data Mining L industrialisation
Plus en détailGuide d exploration de base de données de IBM SPSS Modeler 15
Guide d exploration de base de données de IBM SPSS Modeler 15 Remarque : Avant d utiliser ces informations et le produit qu elles concernent, lisez les informations générales sous Remarques sur p.. Cette
Plus en détailUrbanisation des SI-NFE107
OLAP Urbanisation des SI-NFE107 Fiche de lecture Karim SEKRI 20/01/2009 OLAP 1 Introduction PLAN OLAP Les différentes technologies OLAP Plate formes et Outils 20/01/2009 OLAP 2 Informatique décisionnelle
Plus en détailIntroduction. I Étude rapide du réseau - Apprentissage. II Application à la reconnaissance des notes.
Introduction L'objectif de mon TIPE est la reconnaissance de sons ou de notes de musique à l'aide d'un réseau de neurones. Ce réseau doit être capable d'apprendre à distinguer les exemples présentés puis
Plus en détailAméliorer les performances du site par l'utilisation de techniques de Web Mining
Améliorer les performances du site par l'utilisation de techniques de Web Mining CLUB SAS 2001 17/18 octobre 2001 Stéfan Galissie LINCOLN stefan.galissie@lincoln.fr contact@web-datamining.net 2001 Sommaire
Plus en détailAccélérer l agilité de votre site de e-commerce. Cas client
Accélérer l agilité de votre site de e-commerce Cas client L agilité «outillée» devient nécessaire au delà d un certain facteur de complexité (clients x produits) Elevé Nombre de produits vendus Faible
Plus en détailChapitre 9 : Informatique décisionnelle
Chapitre 9 : Informatique décisionnelle Sommaire Introduction... 3 Définition... 3 Les domaines d application de l informatique décisionnelle... 4 Architecture d un système décisionnel... 5 L outil Oracle
Plus en détailEntrepôt de données 1. Introduction
Entrepôt de données 1 (data warehouse) Introduction 1 Présentation Le concept d entrepôt de données a été formalisé pour la première fois en 1990 par Bill Inmon. Il s agissait de constituer une base de
Plus en détailINTRODUCTION AU DATA MINING
INTRODUCTION AU DATA MINING 6 séances de 3 heures mai-juin 2006 EPF - 4 ème année - Option Ingénierie d Affaires et de Projets Bertrand LIAUDET TP DE DATA MINING Le TP et le projet consisteront à mettre
Plus en détailIntroduction à l Informatique Décisionnelle - Business Intelligence (7)
Introduction à l Informatique Décisionnelle - Business Intelligence (7) Bernard ESPINASSE Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille Septembre 2013 Emergence
Plus en détailTRAVAUX DE RECHERCHE DANS LE
TRAVAUX DE RECHERCHE DANS LE DOMAINE DE L'EXPLOITATION DES DONNÉES ET DES DOCUMENTS 1 Journée technologique " Solutions de maintenance prévisionnelle adaptées à la production Josiane Mothe, FREMIT, IRIT
Plus en détailLa problématique. La philosophie ' ) * )
La problématique!" La philosophie #$ % La philosophie &'( ' ) * ) 1 La philosophie +, -) *. Mise en oeuvre Data warehouse ou Datamart /01-2, / 3 13 4,$ / 5 23, 2 * $3 3 63 3 #, 7 Datawarehouse Data warehouse
Plus en détailMaster Exploration Informatique des données Data Mining & Business Intelligence. Evelyne CHARIFOU Priscillia CASSANDRA
Master Exploration Informatique des données Data Mining & Business Intelligence Groupe 5 Piotr BENSALEM Ahmed BENSI Evelyne CHARIFOU Priscillia CASSANDRA Enseignant Françoise FOGELMAN Nicolas DULIAN SOMMAIRE
Plus en détailSGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)
SGBDR Systèmes de Gestion de Bases de Données (Relationnelles) Plan Approches Les tâches du SGBD Les transactions Approche 1 Systèmes traditionnels basés sur des fichiers Application 1 Gestion clients
Plus en détailIntroduction à la Fouille de Données (Data Mining) (8)
Introduction à la Fouille de Données (Data Mining) (8) Bernard ESPINASSE Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille Septembre 2008 Introduction à la fouille
Plus en détailMASTER SIS PRO : logique et sécurité DÉTECTION D INTRUSIONS. Odile PAPINI, LSIS. Université de Toulon et du Var. papini@univ-tln.
MASTER SIS PRO : logique et sécurité DÉTECTION D INTRUSIONS Odile PAPINI, LSIS. Université de Toulon et du Var. papini@univ-tln.fr Plan Introduction Généralités sur les systèmes de détection d intrusion
Plus en détailLogiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS
Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence
Plus en détailguide Le Le guide Ligne PME
EBP Informatique RCS Versailles B 33083894700043 Rue de Cutesson ZA du Bel Air 78513 Rambouillet CEDEX Fax : 01 34 85 62 07 www.ebp.com Toutes les marques et produits cités appartiennent à leurs propriétaires
Plus en détailDURÉE DE VIE ET DE. Michel JAMBU, Centre National d'etudes des Télécommunications France Direction scientifique
ESTIMATION ET PRÉDICTION DE LA FIDÉLITÉ, DE LA DURÉE DE VIE ET DE LA VALEUR ÉCONOMIQUE DES CLIENTS PAR DES TECHNIQUES DE DATAMINING Michel JAMBU, Centre National d'etudes des Télécommunications France
Plus en détailCONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS
CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS Nazih Selmoune (*), Zaia Alimazighi (*) Selmoune@lsi-usthb.dz, Alimazighi@wissal.dz (*) Laboratoire des systèmes
Plus en détailÉléments de contexte. L univers des jardineries et graineteries
Éléments de contexte L univers des jardineries et graineteries L univers étudié est constitué des établissements spécialisés dont l activité se caractérise par la distribution de végétaux, de fleurs, de
Plus en détailSQL SERVER 2008, BUSINESS INTELLIGENCE
SGBD / Aide à la décision SQL SERVER 2008, BUSINESS INTELLIGENCE Réf: QLI Durée : 5 jours (7 heures) OBJECTIFS DE LA FORMATION Cette formation vous apprendra à concevoir et à déployer une solution de Business
Plus en détail1 er Avril 2015 Data Science & Big Data Etat de l art Donner plus d intelligence aux données
1 er Avril 2015 Data Science & Big Data Etat de l art Donner plus d intelligence aux données Votre interlocuteur Didier Gaultier Directeur Data Science Business & Decision Professeur de Statistique à l
Plus en détailINF6304 Interfaces Intelligentes
INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie
Plus en détailLe géomarketing - Page 1 sur 7
Le géomarketing - Page 1 sur 7 LES DOSSIERS MADWATCH.net méthodes Le Géomarketing Novembre 2003 Nb de pages : 7 Le géomarketing - Page 2 sur 7 Créé dans les années 80, la plupart des applications du géomarketing
Plus en détailBusiness Intelligence : Informatique Décisionnelle
Business Intelligence : Informatique Décisionnelle On appelle «aide à la décision», «décisionnel», ou encore «business intelligence», un ensemble de solutions informatiques permettant l analyse des données
Plus en détailLicence Professionnelle en Statistique et Informatique Décisionnelle (S.I.D.)
Université de Lille 2 - Droit et Santé Ecole Supérieure des Affaires & Institut Universitaire de Technologie (IUT-C) Département Statistique et Traitement Informatique des Données Licence Professionnelle
Plus en détailAPPORT DES RESEAUX BAYESIENS DANS LA PREVENTION DE LA DELINQUANCE
SûretéGlobale.Org La Guitonnière 49770 La Meignanne Téléphone : +33 241 777 886 Télécopie : +33 241 200 987 Portable : +33 6 83 01 01 80 Adresse de messagerie : c.courtois@sureteglobale.org APPORT DES
Plus en détailCycle de formation certifiante Sphinx
Cycle de formation certifiante Sphinx 28, 29, 30 Mai 2015 Initiation, Approfondissement et Maîtrise Etudes qualitatives / quantitatives Initiation, approfondissement et maîtrise des études qualitatives
Plus en détailBusiness Intelligence avec SQL Server 2012
Editions ENI Business Intelligence avec SQL Server 2012 Maîtrisez les concepts et réalisez un système décisionnel Collection Solutions Informatiques Extrait Alimenter l'entrepôt de données avec SSIS Business
Plus en détailExtraction d informations stratégiques par Analyse en Composantes Principales
Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 dousset@irit.fr 1 Introduction
Plus en détailPrésentations personnelles. filière IL
Présentations personnelles filière IL Résumé Liste de sujets de présentations personnelles. Chaque présentation aborde un sujet particulier, l'objectif étant que la lecture du rapport ainsi que l'écoute
Plus en détailLES ENTREPOTS DE DONNEES
Module B4 : Projet des Systèmes d information Lille, le 25 mars 2002 LES ENTREPOTS DE DONNEES Problématique : Pour capitaliser ses informations, une entreprise doit-elle commencer par mettre en œuvre des
Plus en détailPourquoi l apprentissage?
Pourquoi l apprentissage? Les SE sont basés sur la possibilité d extraire la connaissance d un expert sous forme de règles. Dépend fortement de la capacité à extraire et formaliser ces connaissances. Apprentissage
Plus en détailMaster Marketing et Pratiques Commerciales Formation continue
Master Marketing et Pratiques Commerciales Formation continue 2014/2015 UE1 MARKETING OPÉRATIONNEL/CONCEPTS ET MÉTHODES Ouidade Sabri Familiariser les étudiants aux principaux concepts marketing; Comprendre
Plus en détailStages 2014-2015 ISOFT : UNE SOCIETE INNOVANTE. Contact : Mme Lapedra, stage@isoft.fr
Stages 2014-2015 ISOFT : UNE SOCIETE INNOVANTE Contact : Mme Lapedra, stage@isoft.fr ISoft, éditeur de logiciels, est spécialisé dans l informatique décisionnelle et l analyse de données. Son expertise
Plus en détailLe data mining et l assurance Mai 2004. Charles Dugas Président Marianne Lalonde Directrice, développement des affaires
Le data mining et l assurance Mai 2004 Charles Dugas Président Marianne Lalonde Directrice, développement des affaires AGENDA Qu est-ce que le data mining? Le projet et les facteurs de réussite Les technologies
Plus en détailStéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 24/12/2006 Stéphane Tufféry - Data Mining - http://data.mining.free.fr
1 Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE 2 Plan du cours Qu est-ce que le data mining? A quoi sert le data mining? Les 2 grandes familles de techniques Le déroulement d un projet de data
Plus en détailPetit Déjeuner Pépinière du Logiciel Libre. 25 juin 2008
Petit Déjeuner Pépinière du Logiciel Libre 25 juin 2008 1 / 37 Agenda Définition & Principes Les différents outils & composants Les Solutions intégrés Open-Source Vos Questions 2 / 37 Agenda Définition
Plus en détailESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring
ESSEC Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring Les méthodes d évaluation du risque de crédit pour les PME et les ménages Caractéristiques Comme les montants des crédits et des
Plus en détailTravailler avec les télécommunications
Travailler avec les télécommunications Minimiser l attrition dans le secteur des télécommunications Table des matières : 1 Analyse de l attrition à l aide du data mining 2 Analyse de l attrition de la
Plus en détailPanorama des problématiques de traitement de l information. Larbi Aït Hennani, Fatma Bouali, Vincent Vandewalle
Panorama des problématiques de traitement de l information Larbi Aït Hennani, Fatma Bouali, Vincent Vandewalle Conduite d une étude statistique Larbi Aït Hennani, maître de conférences en mathématiques
Plus en détailBI = Business Intelligence Master Data-Science
BI = Business Intelligence Master Data-Science UPMC 25 janvier 2015 Organisation Horaire Cours : Lundi de 13h30 à 15h30 TP : Vendredi de 13h30 à 17h45 Intervenants : Divers industriels (en cours de construction)
Plus en détailComplet Intuitif Efficace. Références
Logiciel de référence en Analyse de Données, Data Mining et Text Mining pour transformer vos données en connaissance Complet Intuitif Efficace Dans un environnement convivial et intuitif, disposez de toute
Plus en détailBaccalauréat ES Pondichéry 7 avril 2014 Corrigé
Baccalauréat ES Pondichéry 7 avril 204 Corrigé EXERCICE 4 points Commun à tous les candidats. Proposition fausse. La tangente T, passant par les points A et B d abscisses distinctes, a pour coefficient
Plus en détailTHOT - Extraction de données et de schémas d un SGBD
THOT - Extraction de données et de schémas d un SGBD Pierre-Jean DOUSSET (France), Benoît ALBAREIL (France) pj@miningdb.com, benoit@miningdb.com Mots clefs : Fouille d information, base de données, système
Plus en détailSpécifications, Développement et Promotion. Ricco RAKOTOMALALA Université Lumière Lyon 2 Laboratoire ERIC
Spécifications, Développement et Promotion Ricco RAKOTOMALALA Université Lumière Lyon 2 Laboratoire ERIC Ricco? Enseignant chercheur (CNU.27) En poste à l Université Lyon 2 Faculté de Sciences Eco. Recherche
Plus en détailSommaire. BilanStat manuel de présentation et d utilisation Page 2
BilanStat-Audit Sommaire Présentation... 3 Chapitre 0 : Gestion des bases de données... 5 Chapitre 0 : Gestion des missions... 12 Chapitre 1 : Eléments généraux... 17 Chapitre 2 : Capitaux propres... 28
Plus en détailMASTER EUROPEEN EN MANAGEMENT ET STRATEGIE D ENTREPRISE MSE. Diplôme Européen reconnu par la Fédération Européenne des Ecoles ; www.fede.
MASTER EUROPEEN EN MANAGEMENT ET STRATEGIE D ENTREPRISE MSE Diplôme Européen reconnu par la Fédération Européenne des Ecoles ; www.fede.org - BAC+5 Présentation Ce programme de formation interdisciplinaire
Plus en détailIntroduction à Business Objects. J. Akoka I. Wattiau
Introduction à Business Objects J. Akoka I. Wattiau Introduction Un outil d'aide à la décision accès aux informations stockées dans les bases de données et les progiciels interrogation génération d'états
Plus en détailBaccalauréat ES/L Amérique du Sud 21 novembre 2013
Baccalauréat ES/L Amérique du Sud 21 novembre 2013 A. P. M. E. P. EXERCICE 1 Commun à tous les candidats 5 points Une entreprise informatique produit et vend des clés USB. La vente de ces clés est réalisée
Plus en détailWEBSELL. Projet DATAMINING
WEBSELL Projet DATAMINING Analyse des données dans le cadre d une étude de banchmarking DESS ID Session 2005/2006 Mariam GASPARIAN [ Page 1 ] SOMMAIRE 1. INTRODUCTION... 3 2. METHODES ET OUTILS... 4 2.1.
Plus en détailFournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement
Introduction Phases du projet Les principales phases du projet sont les suivantes : La mise à disposition des sources Des fichiers Excel sont utilisés pour récolter nos informations L extraction des données
Plus en détailTABLE DES MATIÈRES. PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats. Pierre Dagnelie
PRINCIPES D EXPÉRIMENTATION Planification des expériences et analyse de leurs résultats Pierre Dagnelie TABLE DES MATIÈRES 2012 Presses agronomiques de Gembloux pressesagro.gembloux@ulg.ac.be www.pressesagro.be
Plus en détailSIG ET ANALYSE EXPLORATOIRE
SIG ET ANALYSE EXPLORATOIRE VERS DE NOUVELLES PRATIQUES EN GÉOGRAPHIE Jean-Marc ORHAN Equipe P.A.R.I.S., URA 1243 du CNRS Paris Résumé L'offre actuelle dans le domaine des logiciels de type Système d'information
Plus en détailProxiLens : Exploration interactive de données multidimensionnelles à partir de leur projection
ProxiLens : Exploration interactive de données multidimensionnelles à partir de leur projection Nicolas HEULOT (CEA LIST) Michaël AUPETIT (CEA LIST) Jean-Daniel FEKETE (INRIA Saclay) Journées Big Data
Plus en détailTravaux pratiques avec RapidMiner
Travaux pratiques avec RapidMiner Master Informatique de Paris 6 Spécialité IAD Parcours EDOW Module Algorithmes pour la Fouille de Données Janvier 2012 Prise en main Généralités RapidMiner est un logiciel
Plus en détail1.5 0.5 -0.5 -1.5 0 20 40 60 80 100 120. (VM(t i ),Q(t i+j ),VM(t i+j ))
La logique oue dans les PME/PMI Application au dosage de l'eau dans les bétons P.Y. Glorennec INSA de Rennes/IRISA glorenne@irisa.fr C. Hérault Hydrostop christophe@hydrostop.fr V. Hulin Hydrostop vincent@hydrostop.fr
Plus en détailRenforcement des trois compétences : compréhension orale, expression orale et expression écrite à partir de documents et vidéos.
Master Mathématiques et Applications Spécialité : Ingénierie mathématique et modélisation Parcours : Mathématique et Informatique : Statistique, Signal, Santé (MI3S) 2015-2016 RÉSUMÉ DES COURS : (dernière
Plus en détailL analyse de la gestion de la clientèle
chapitre 1 - La connaissance du client * Techniques utilisées : observation, recherche documentaire, études de cas, études qualitatives (entretiens de groupes ou individuels, tests projectifs, analyses
Plus en détailLa classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
Plus en détailSharePoint (Toute la Gamme)... 1 Office 2010 (Toute la Gamme)... 2 OLAP (Toute la Gamme)... 2 STATISTICA Connecteur PI (Produit Complémentaire)...
SharePoint (Toute la Gamme)... 1 Office 2010 (Toute la Gamme)... 2 OLAP (Toute la Gamme)... 2 STATISTICA Connecteur PI (Produit Complémentaire)... 3 Introduction... 3 Échelle Interactive... 4 Navigation
Plus en détailL apprentissage automatique
L apprentissage automatique L apprentissage automatique L'apprentissage automatique fait référence au développement, à l analyse et à l implémentation de méthodes qui permettent à une machine d évoluer
Plus en détailWe make your. Data Smart. Data Smart
We make your We make your Data Smart Data Smart Une société Une société du du groupe Le groupe NP6 SPECIALISTE LEADER SECTEURS EFFECTIFS SaaS Marketing : 50% Data intelligence : 50% 15 sociétés du CAC
Plus en détailDATA MINING - Analyses de données symboliques sur les restaurants
Master 2 Professionnel - Informatique Décisionnelle DATA MINING - Analyses de données symboliques sur les restaurants Etudiants : Enseignant : Vincent RICHARD Edwin DIDAY Seghir SADAOUI SOMMAIRE I Introduction...
Plus en détailLes participants repartiront de cette formation en ayant une vision claire de la stratégie et de l éventuelle mise en œuvre d un Big Data.
Big Data De la stratégie à la mise en oeuvre Description : La formation a pour objet de brosser sans concession le tableau du Big Data. Les participants repartiront de cette formation en ayant une vision
Plus en détailL'intelligence d'affaires: la statistique dans nos vies de consommateurs
L'intelligence d'affaires: la statistique dans nos vies de consommateurs Jean-François Plante, HEC Montréal Marc Fredette, HEC Montréal Congrès de l ACFAS, Université Laval, 6 mai 2013 Intelligence d affaires
Plus en détail