Extraction de Connaissances Avancées
|
|
- Lucile Meunier
- il y a 8 ans
- Total affichages :
Transcription
1 1 Extraction de Connaissances Avancées Maguelonne Teisseire TETIS Irstea
2 Organisation o Planning o Les intervenants Equipes Advanse - SISO o Le projet 2
3 Plan o Pourquoi fouiller les données? o Le processus d extraction o Quelques domaines d application o Vocabulaire o Vers de nouveaux challenges 3
4 Pourquoi fouiller les données? o o De nombreuses données sont collectées et entreposées n Données du Web, E-commerce, Achats dans les supermarchés, Transactions de cartes bancaires n Capteurs intelligents, Textes, Sons, Images Les ordinateurs deviennent de moins en moins chers et de plus en plus puissants n Information facile à produire n millions de blogs n blogs crées par jour 4
5 Pourquoi fouiller les données? o Les données sont collectées et stockées rapidement (GB/heures) n Capteurs : RFID, supervision de procédé n Puces à ADN générant des expressions de gènes n Simulations générant de téraoctets de données n Yahoo : 48 Gbs par heure de clickstream n NASA EOS (Earth Observation System) observation par satellites 350 GBs par jour 5
6 Pourquoi fouiller les données? o Les techniques traditionnelles ne sont pas adaptées o Volume de données trop grands (trop de tuples, trop d attributs) Comment explorer des millions d enregistrements avec des milliers d attributs? o Requêtes traditionnelles (SQL) impossibles «Rechercher tous les enregistrements indiquant une fraude» o Croyance dans la présence de données importantes 6
7 Un enjeu stratégique Déterminer les moyens pour fidéliser les clients Identifier les nouveaux marchés Anticiper les changements de comportement Minimiser les risques Identifier les nouveaux produits ou services 7
8 Qu est ce que la fouille de données? n Exploration et analyse, par des moyens automatiques ou semi-automatiques, de grandes quantités de données en vue d extraire des motifs intéressants n De nombreuses définitions : Fayyad (1996) Knowledge Discovery in Databases : "the nontrivial process of identifying valid, potentially useful and ultimately understandable patterns in data" 8
9 Qu est-ce que la fouille de données? Convergence de domaines statistiques KDD vs. Data Mining I.H.M. I.A. apprentissage Bases de données 9
10 10 Le processus de KDD Données pré-traitées Pré-traitement et nettoyage Données transformées Databases Datawarehouse DataMart Web Données cibles visualisation Motifs / Modèles
11 Données, Informations, Connaissances Décision Promouvoir le produit P dans la région R durant la période N Réaliser un mailing sur le produit P aux familles de profil F Connaissance (data mining) Une quantité Q du produit P est vendue en région R Les familles de profil F utilisent M% de P durant la période N Information (requêtes) X habite la région R Y a A ans Z dépense son argent dans la ville V de la région R Données Consommateurs Magasins Ventes Démographie Géographie 11
12 Fouille de données. ou pas? NON Rechercher le salaire d un employé OUI Les supporters achètent de la bière le samedi et de l aspirine le dimanche Interroger un moteur de recherche Web pour avoir des informations sur le Data Mining Regrouper ensemble des documents retournés par un moteur de recherche en fonction de leur contenu 12
13 Cycle de vie du KDD «Questions stratégiques» Identification du problème DataWarehouse SGBD Evaluer Rapports, graphique, Executive Information Systems (EIS) Agir sur l information Transformation des données en information/ connaissances Processus de KDD 13
14 Applications o o o o o Médecine : bio-médecine, drogue, Sida, séquence génétique, gestion hôpitaux,... Finance, assurance : crédit, prédiction du marché, détection de fraudes, Social : données démographiques, votes, résultats des élections, Marketing et ventes : comportement des utilisateurs, prédiction des ventes, espionnage industriel, Militaire : fusion de données.. (secret défense) o Astrophysique : astronomie, «contact» ( ;-)) o Informatique : agents, règles actives, IHM, réseau, Data- Warehouse, Data Mart, Internet (moteurs intelligent, profiling, text mining, ) 14
15 Quid des données? o Grandes Bases de Données ou non? o Faut -il échantillonner? enregistrements, 100 Mo par jour o 2 Go par jour, 100 Go par heure. Déjà les petabyte (2 50 )... Différents domaines n Bases de Données n Intelligence Artificielle (Machine Learning) n Statistiques n Algorithmique, 15
16 Data Mining vs Statistiques Hypothèses Nouvelles informations Techniques Statistiques Techniques de Data Mining Confirmatoires Exploratoires 16
17 Machine Learning vs Data Mining Passage à l échelle 17
18 Les tâches du DM o Fouille de données : de nombreuses tâches possibles (27) n n n n n n Classification créer une fonction qui classifie une donnée élémentaire parmi plusieurs classes prédéfinies existantes Régression créer une fonction qui donne une donnée élémentaire à une variable de prévision avec des données réelles Groupement (clustering) rechercher à identifier un ensemble fini de catégories ou groupe en vues de décrire les données Résumé affiner une description compacte d un sous-ensemble de données Modélisation des dépendances trouver un modèle qui décrit des dépendances significatives entre les variables Détection de changement et déviation découvrir les changements les plus significatifs dans les données 18
19 Les tâches du DM o Non pas 1 mais n approches donc m techniques o 3 approches principales (R. Agrawal) vision BD Classification Règles d association Motifs séquentiels 19
20 Supervisés et non supervisés n Apprentissage supervisé : o On dispose d'un fichier décrivant des données alliant une description et une classe o On cherche une fonction de classification permettant d'induire la classe en fonction d'une description n Apprentissage non supervisé : o On dispose d'un fichier de description des données sans classes connues a priori o On cherche à diviser ces données en catégories 20
21 Algorithmes prédictifs et descriptifs n Veut-on o Trouver une fonction permettant de prédire la classe d'une données jamais vue Ou o Trouver des descriptions résumées et pertinentes expliquant les données n La limite entre les 2 est floue! (méthodes descriptives pour la prédiction) 21
22 Algorithmes vu en M1 o Classification supervisée o Méthode de Bayes naïf o k plus proches voisins o Arbres de décision o Classification non supervisée : o o o k-means o De partition o Hiérarchique Règles d association Évaluation des méthodes 22
23 Classification n division de l ensemble de données en classes disjointes en utilisant un apprentissage supervisé ou non (clustering) o But : recherche d un ensemble de prédicats caractérisant une classe d objet et qui peut être appliqué à des objets inconnus pour prévoir leur classe d appartenance. o Exemple : une banque peut vouloir classer ses clients pour savoir si elle accorde un crédit ou non. o Techniques : Arbre de décision, réseaux neuronaux,... 23
24 Le mailing o Classification/clustering un exemple d utilisation n un cadeau est envoyé par mailing. Un envoi sans réponse coûte 50 et une réponse assure 100. n Pas d envoi de mailing à un client qui aurait répondu : perte de
25 Le mailing Envoi du mailing Quel client a répondu? Déterminer les caractéristiques des clients avec le Data Mining Sélection des clients sur la base Résultat : groupement avec une forte probabilité de réponse 25
26 Résultat du mailing Population de Mailing 100 personnes Oui : 31%, Non : 69 % Prob : 97% Cadres 70 personnes Oui : 40 %, Non 60 % Prob : 95% Ouvrier 30 personnes Oui : 10 %, Non : 90 % Prob : 95 % Hommes 50 personnes Oui : 36 %, Non : 64 % Prob : 93 % Femmes 20 personnes Oui : 50 %, Non : 50 % Prob : 93 % 26
27 Quantification Population de mailing *100-69*50 Cadres 700 (70* 40%)*100 - (70*60%)*50 Ouvriers * * 50 Hommes * * 50 Femmes * * 50 Mailing à l ensemble des cadres ou uniquement aux femmes cadres 27
28 Evaluation Matrice de coûts Prédit OBSERVE Payé Retardé Impayé TOTAL Payé Retardé Impayé TOTAL Validité du modèle : nombre de cas exacts (=somme de la diagonale) divisé par le nombre total : 120/150 =
29 Recherche de motifs fréquents o Qu est ce qu un motif fréquent? n Un motif (ensemble d items, séquences, arbres, ) qui interviennent fréquemment ensemble dans une base de données [AIS93] o Les motifs fréquents : une forme importante de régularité n Quels produits sont souvent achetés ensemble? n Quelles sont les conséquences d un ouragan? n Quel est le prochain achat après un PC? 29
30 Recherche de motifs fréquents o Analyse des associations 35% des clients qui achètent de la bière achètent des couches n Panier de la ménagère, cross marketing, conception de catalogue, analyse de textes n Corrélation ou analyse de causalité o Analyse de séquences 25% des clients achètent de la bière et le lendemain de l aspirine n Web Mining, détection de tendances, analyses ADN n Périodicité partielle, associations temporelles/cycliques 30
31 Panier de la ménagère Localisation Produits achetés Identification Date, heure Les règles d association 31
32 Aidons Mme Guénolé 32
33 Aidons Mme Guénolé o Quels enseignements? n Rechercher sans a priori n est pas une tâche aisée n Quelle validation des découvertes de connaissance? surprenante et nouvelle
34 La légende Les règles d association 34
35 Motivations vers une évolution Requêtes sur une base de données Select F.Four_Nom, F.Ville From F,FP,P Where F.Four_No=FP.Four_No And FP.Piece_No=P.Piece_No And Piece_Nom=«Ecrou» Salsa, Lille Jean, Paris 35
36 Motivations vers une évolution hl=fr&rlz=1t4gfrc_frfr207fr208&q=.cgi&ie=utf-8&oe=utf-8&um=1&sa= N&tab=wi hl=fr&rlz=1t4gfrc_frfr207fr208&q=.cgi&ie=utf-8&oe=utf-8&um=1&sa= N&tab=ig hl=fr&rlz=1t4gfrc_frfr207fr208&q=.cgi&ie=utf-8&oe=utf-8&um=1&sa= N&tab=gn hl=fr&q=sdi&ie=utf-8&oe=utf-8&um=1&sa=n&tab=iw maps search?hl=fr&q=scholar&meta= scholar.google.com/scholar?q=intrusion+detection+data+mining&hl=fr&lr=&lr= groups.google.fr/groups/dir? hl=fr&sel= , , , , groups.google.fr/group/soswindows?lnk=gschg&hl=fr ned=fr&topic=n videosearch?q=genre:../../../etc/passwd books.google.fr/books? id=7na0ud5wbi4c&pg=pa1&ots=fo9stqkezv&dq=ids&sig=p3bmwwqjemo zrgondxsfj6tjn4m Fouille De Données Motifs de fraudes : -> 36
37 Les challenges «classiques» 37
38 Les challenges «classiques» o Quelques exemples de gros volumes de données Sources wintercorp.com 2003 Co. Size (GB) DBMS System France Telecom Oracle HP AT&T Dayton Sun SBC Teradata NCR Anonymous DB2 for Unix IBM Amazon.com Oracle HP 38
39 Mais aussi o Capteurs : A, B, C o Mesures : le capteur A mesure la valeur 82.5 au temps 06:41:39 39
40 Pour la maintenance 40
41 Mais aussi hl=fr&rlz=1t4gfrc_frfr207fr208&q=.cgi&ie=utf-8&oe=utf-8&um=1&sa=n&tab=wi groups.google.fr/groups? hl=fr&rlz=1t4gfrc_frfr207fr208&q=.cgi&ie=utf-8&oe=utf-8&um=1&sa=n&tab=ig news.google.fr/news? hl=fr&rlz=1t4gfrc_frfr207fr208&q=.cgi&ie=utf-8&oe=utf-8&um=1&sa=n&tab=gn maps.google.fr/maps hl=fr&q=scholar&meta= +detection+data+mining&hl=fr&lr=&lr= hl=fr&lr=&cluster= lnk=od&hl=fr&sel= hl=fr&sel= , , , , soswindows?lnk=gschg&hl=fr ned=fr&topic=n earth4.html id=7na0ud5wbi4c&pg=pa1&ots=fo9stqkezv&dq=ids&sig=p3bmwwqjemozrgondxsfj6tjn4m Connaissance : -> hl=fr&rlz=1t4gfrc_frfr207fr208&q=.cgi&ie=utf-8&oe=utf-8&um=1&sa=n&tab=wi groups.google.fr/groups? hl=fr&rlz=1t4gfrc_frfr207fr208&q=.cgi&ie=utf-8&oe=utf-8&um=1&sa=n&tab=ig news.google.fr/news? hl=fr&rlz=1t4gfrc_frfr207fr208&q=.cgi&ie=utf-8&oe=utf-8&um=1&sa=n&tab=gn maps.google.fr/maps Quid des aspects incrémentaux? 41
42 Explosion de données ces dernières années n 30 Milliards d par jour - 1 Milliard de SMS, MMS n «China s cellular operators estimate Chinese customers will send around 14 billion Lunar New Year text messages on their mobile phones during the weeklong holiday» n n n Trafic réseau IP : plus d 1 Milliard de packets par heure et par routeur. Chaque fournisseur de service internet possède (des centaines) de routeurs! tuples par seconde! AT&T collecte 100 GBs de données de réseaux chaque jour Données scientifiques: NASA EOS (Earth Observation System) observation par satellites génére 350 GBs par jour Sources: tutorial of Muthu Muthukrishnan (Rutgers Univ.), Turorial of G. Hebrail (ENST) News February 19th 07 42
43 Explosion de données ces dernières années n En moyenne 1 1Milliard de page par jour vus sur ebay Sources: ebay Report (2006) n Yahoo: 166 millions de visiteurs par jour; 48 Gbs par heure de clickstream Sources: Yahoo (2002) o Besoin de requête/analyse sophistiquée en temps réel 43
44 Applications o Enregistrement des appels téléphoniques o Business: transactions cartes banquaires o Supervision de réseau o Marché financier : stock exchange o Processus industriels, RFID o Capteurs, surveillance : flux vidéo o Localisation de Visiteur : IntelliBadge (expérience du NCSA) o Hôpitaux o Clickstreams 44
45 Qu est ce qu un flux de données? o Une définition n Un flux de données est une séquence (potentiellement) non limitée de tuples n Continue n Ordonné : suppose un numéro (éventuellement implicite) de séquence pour chaque élément n Changeant : la distribution des données change en temps réel n Rapide : les données arrivent rapidement n Volume très grand : De gros volumes de données (quelques terabytes) - éventuellement infinis n Vous n avez droit qu à un seul passage!!!! 45
46 Conclusion o Pour une application, de nombreuses approches possibles o De nombreuses questions : n Quelle technique choisir? Quelles données retenir? n Résultats attendus?.. o Ne pas oublier l étape de préparation des données : 80% du temps o Besoin de s adapter à de nouvelles contraintes : préservation de la vie privée, contraintes temporelles, données dynamiques (incrémental ou flot), données complexes (semi structurées, textuelles, multidimensionnelles), 46
Introduction au datamining
Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des
Plus en détailIntroduction au Data-Mining
Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme
Plus en détailLa problématique. La philosophie ' ) * )
La problématique!" La philosophie #$ % La philosophie &'( ' ) * ) 1 La philosophie +, -) *. Mise en oeuvre Data warehouse ou Datamart /01-2, / 3 13 4,$ / 5 23, 2 * $3 3 63 3 #, 7 Datawarehouse Data warehouse
Plus en détailAgenda de la présentation
Le Data Mining Techniques pour exploiter l information Dan Noël 1 Agenda de la présentation Concept de Data Mining ou qu est-ce que le Data Mining Déroulement d un projet de Data Mining Place du Data Mining
Plus en détailIntroduction au Data-Mining
Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane
Plus en détailLOGO. Module «Big Data» Extraction de Connaissances à partir de Données. Claudia MARINICA MCF, ETIS UCP/ENSEA/CNRS Claudia.Marinica@u-cergy.
Module «Big Data» Extraction de Connaissances à partir de Données Claudia MARINICA MCF, ETIS UCP/ENSEA/CNRS Claudia.Marinica@u-cergy.fr 14 Janvier 2015 Pourquoi l extraction de connaissances à partir de
Plus en détailIntroduction à l Informatique Décisionnelle - Business Intelligence (7)
Introduction à l Informatique Décisionnelle - Business Intelligence (7) Bernard ESPINASSE Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille Septembre 2013 Emergence
Plus en détailAnalyse de grandes bases de données en santé
.. Analyse de grandes bases de données en santé Alain Duhamel Michaël Genin Mohamed Lemdani EA 2694 / CERIM Master 2 Recherche Biologie et Santé Journée Thématique Fouille de Données Plan. 1 Problématique.
Plus en détailLes datas = le fuel du 21ième sicècle
Les datas = le fuel du 21ième sicècle D énormes gisements de création de valeurs http://www.your networkmarketin g.com/facebooktwitter-youtubestats-in-realtime-simulation/ Xavier Dalloz Le Plan Définition
Plus en détailBig Data et Graphes : Quelques pistes de recherche
Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université
Plus en détailCybermarché et analyse comportementale
Cybermarché et analyse comportementale Antoine-Eric Sammartino aesammartino@e-laser.fr Séminaire Data Mining - Educasoft Formations 18 juin 2001-1- MENU Le Groupe LaSer Le processus Data Mining L industrialisation
Plus en détailL'intelligence d'affaires: la statistique dans nos vies de consommateurs
L'intelligence d'affaires: la statistique dans nos vies de consommateurs Jean-François Plante, HEC Montréal Marc Fredette, HEC Montréal Congrès de l ACFAS, Université Laval, 6 mai 2013 Intelligence d affaires
Plus en détailData Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.
des des Data Mining Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne 2012-2013 1/65 des des 1 2 des des 3 4 Post-traitement 5 représentation : 6 2/65 des des Définition générale Le
Plus en détailDidier MOUNIEN Samantha MOINEAUX
Didier MOUNIEN Samantha MOINEAUX 08/01/2008 1 Généralisation des ERP ERP génère une importante masse de données Comment mesurer l impact réel d une décision? Comment choisir entre plusieurs décisions?
Plus en détailIntroduction à la B.I. Avec SQL Server 2008
Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide
Plus en détailChristophe CANDILLIER Cours de DataMining mars 2004 Page 1
Christophe CANDILLIER Cours de DataMining mars 2004 age 1 1. Introduction 2. rocessus du DataMining 3. Analyse des données en DataMining 4. Analyse en Ligne OLA 5. Logiciels 6. Bibliographie Christophe
Plus en détailFilière Fouille de Données et Décisionnel FDD (Data Mining) Pierre Morizet-Mahoudeaux www.hds.utc.fr/~pmorizet pierre.morizet@utc.
Filière Fouille de Données et Décisionnel FDD (Data Mining) Pierre Morizet-Mahoudeaux www.hds.utc.fr/~pmorizet pierre.morizet@utc.fr Plan Motivations Débouchés Formation UVs spécifiques UVs connexes Enseignants
Plus en détailSGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)
SGBDR Systèmes de Gestion de Bases de Données (Relationnelles) Plan Approches Les tâches du SGBD Les transactions Approche 1 Systèmes traditionnels basés sur des fichiers Application 1 Gestion clients
Plus en détailApprentissage Automatique
Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs
Plus en détailIntroduction à lʼinformatique. Décisionnelle (ID) / Business. Intelligence» (1)
Introduction à lʼinformatique Décisionnelle et la «Business Intelligence» (1) Bernard ESPINASSE Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille Septembre 2013
Plus en détailEcole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales
Ecole des Hautes Etudes Commerciales HEC Alger Évolution des SGBDs par Amina GACEM Module Informatique 1ière Année Master Sciences Commerciales Evolution des SGBDs Pour toute remarque, question, commentaire
Plus en détailData Mining. Master 1 Informatique - Mathématiques UAG
Data Mining Master 1 Informatique - Mathématiques UAG 1.1 - Introduction Data Mining? On parle de Fouille de données Data Mining Extraction de connaissances à partir de données Knowledge Discovery in Data
Plus en détailAccélérer l agilité de votre site de e-commerce. Cas client
Accélérer l agilité de votre site de e-commerce Cas client L agilité «outillée» devient nécessaire au delà d un certain facteur de complexité (clients x produits) Elevé Nombre de produits vendus Faible
Plus en détailLes clients puissance cube
LETTRE CONVERGENCE Les clients puissance cube L intelligence artificielle au service du marketing des services N 28 To get there. Together. A PROPOS DE BEARINGPOINT BearingPoint est un cabinet de conseil
Plus en détailTravailler avec les télécommunications
Travailler avec les télécommunications Minimiser l attrition dans le secteur des télécommunications Table des matières : 1 Analyse de l attrition à l aide du data mining 2 Analyse de l attrition de la
Plus en détailSpécificités, Applications et Outils
Spécificités, Applications et Outils Ricco Rakotomalala Université Lumière Lyon 2 Laboratoire ERIC Laboratoire ERIC 1 Ricco Rakotomalala ricco.rakotomalala@univ-lyon2.fr http://chirouble.univ-lyon2.fr/~ricco/data-mining
Plus en détail" # $ % % & ' ( ) * +,! '()*+ *, + ' +' + ' ' -+ - +.+. /0 / 1 0 12 1 1 2 34+ 4 1 +. 50 5 * 0 4 * 0 6! "##$ % &!
"# $ %%& ' ( )*+, '()*+,'+''-++.+/0112134+1.50*406 "##$ %& 8CC "#$%& ' ( )* +,-./ 0 123 456+7 3 7-55-89.*/ 0 +3 *+:3 ;< =3 3-3 8 0 23 >-8-3 >5? //*/*0;* @A: *53,,3 / * $/ >B+? - 5, 2 34*56 7 /+#** //8
Plus en détail4. Utilisation d un SGBD : le langage SQL. 5. Normalisation
Base de données S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Présentation du module Contenu général Notion de bases de données Fondements / Conception Utilisation :
Plus en détailBig Data et Graphes : Quelques pistes de recherche
Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci http://liris.cnrs.fr/hamamache.kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de
Plus en détailLes 10 grands principes de l utilisation du data mining pour une gestion de la relation client réussie
Les 10 grands principes de l utilisation du data mining pour une gestion de la relation client réussie Découvrir les stratégies ayant fait leurs preuves et les meilleures pratiques Points clés : Planifier
Plus en détailBIG DATA en Sciences et Industries de l Environnement
BIG DATA en Sciences et Industries de l Environnement François Royer www.datasio.com 21 mars 2012 FR Big Data Congress, Paris 2012 1/23 Transport terrestre Traçabilité Océanographie Transport aérien Télémétrie
Plus en détailIntelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com
Intelligence Artificielle et Systèmes Multi-Agents Badr Benmammar bbm@badr-benmammar.com Plan La première partie : L intelligence artificielle (IA) Définition de l intelligence artificielle (IA) Domaines
Plus en détailAméliorer les performances du site par l'utilisation de techniques de Web Mining
Améliorer les performances du site par l'utilisation de techniques de Web Mining CLUB SAS 2001 17/18 octobre 2001 Stéfan Galissie LINCOLN stefan.galissie@lincoln.fr contact@web-datamining.net 2001 Sommaire
Plus en détailDatawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani
Datawarehouse: Cubes OLAP Marlyse Dieungang Khaoula Ghilani Table des matières 1 Data Warehouse 3 1.1 Introduction............................ 3 1.1.1 Définition......................... 3 1.1.2 Architecture........................
Plus en détailLicence Professionnelle en Statistique et Informatique Décisionnelle (S.I.D.)
Université de Lille 2 - Droit et Santé Ecole Supérieure des Affaires & Institut Universitaire de Technologie (IUT-C) Département Statistique et Traitement Informatique des Données Licence Professionnelle
Plus en détailIntégration de données hétérogènes et réparties. Anne Doucet Anne.Doucet@lip6.fr
Intégration de données hétérogènes et réparties Anne Doucet Anne.Doucet@lip6.fr 1 Plan Intégration de données Architectures d intégration Approche matérialisée Approche virtuelle Médiateurs Conception
Plus en détailConférence Big Data Paris
Conférence Big Data Paris Zouheir Guédri Directeur Consulting - PwC 20 Mars 2012 Consulting Academy February 2011 Agenda 1. Qu est-ce que la Big Data? 2. Que constatent les entreprises? 3. La Big Data,
Plus en détailBI = Business Intelligence Master Data-Science
BI = Business Intelligence Master Data-Science UPMC 25 janvier 2015 Organisation Horaire Cours : Lundi de 13h30 à 15h30 TP : Vendredi de 13h30 à 17h45 Intervenants : Divers industriels (en cours de construction)
Plus en détailLa classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
Plus en détailet les Systèmes Multidimensionnels
Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Datawarehouse (DW) Le Datawarehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées
Plus en détailPrésentations personnelles. filière IL
Présentations personnelles filière IL Résumé Liste de sujets de présentations personnelles. Chaque présentation aborde un sujet particulier, l'objectif étant que la lecture du rapport ainsi que l'écoute
Plus en détailPrésentation du module Base de données spatio-temporelles
Présentation du module Base de données spatio-temporelles S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Partie 1 : Notion de bases de données (12,5h ) Enjeux et principes
Plus en détailLes Entrepôts de Données
Les Entrepôts de Données Grégory Bonnet Abdel-Illah Mouaddib GREYC Dépt Dépt informatique :: GREYC Dépt Dépt informatique :: Cours Cours SIR SIR Systèmes d information décisionnels Nouvelles générations
Plus en détailIntroduction Big Data
Introduction Big Data SOMMAIRE Rédacteurs : Réf.: SH. Lazare / F. Barthélemy AXIO_BD_V1 QU'EST-CE QUE LE BIG DATA? ENJEUX TECHNOLOGIQUES ENJEUX STRATÉGIQUES BIG DATA ET RH ANNEXE Ce document constitue
Plus en détailIntroduction à la Fouille de Données (Data Mining) (8)
Introduction à la Fouille de Données (Data Mining) (8) Bernard ESPINASSE Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille Septembre 2008 Introduction à la fouille
Plus en détailBUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise
BUSINESS INTELLIGENCE Une vision cockpit : utilité et apport pour l'entreprise 1 Présentation PIERRE-YVES BONVIN, SOLVAXIS BERNARD BOIL, RESP. SI, GROUPE OROLUX 2 AGENDA Définitions Positionnement de la
Plus en détailCatherine Chochoy. Alain Maneville. I/T Specialist, IBM Information Management on System z, Software Group
1 Catherine Chochoy I/T Specialist, IBM Information Management on System z, Software Group Alain Maneville Executive I/T specialist, zchampion, IBM Systems and Technology Group 2 Le défi du Big Data (et
Plus en détailApplication de K-means à la définition du nombre de VM optimal dans un cloud
Application de K-means à la définition du nombre de VM optimal dans un cloud EGC 2012 : Atelier Fouille de données complexes : complexité liée aux données multiples et massives (31 janvier - 3 février
Plus en détailTechniques d analyse et de conception d outils pour la gestion du processus de segmentation des abonnés des entreprises de télécommunication
Techniques d analyse et de conception d outils pour la gestion du processus de segmentation des abonnés des entreprises de télécommunication R. Carlos Nana Mbinkeu 1,3, C. Tangha 1, A. Chomnoue 1, A. Kuete
Plus en détailChapitre 9 : Informatique décisionnelle
Chapitre 9 : Informatique décisionnelle Sommaire Introduction... 3 Définition... 3 Les domaines d application de l informatique décisionnelle... 4 Architecture d un système décisionnel... 5 L outil Oracle
Plus en détailBases de Données Avancées
1/26 Bases de Données Avancées DataWareHouse Thierry Hamon Bureau H202 - Institut Galilée Tél. : 33 1.48.38.35.53 Bureau 150 LIM&BIO EA 3969 Université Paris 13 - UFR Léonard de Vinci 74, rue Marcel Cachin,
Plus en détailJean-François Boulicaut & Mohand-Saïd Hacid
e siècle! Jean-François Boulicaut & Mohand-Saïd Hacid http://liris.cnrs.fr/~jboulica http://liris.cnrs.fr/mohand-said.hacid Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205
Plus en détailL apprentissage automatique
L apprentissage automatique L apprentissage automatique L'apprentissage automatique fait référence au développement, à l analyse et à l implémentation de méthodes qui permettent à une machine d évoluer
Plus en détailFilière Data Mining (Fouille de données) Pierre Morizet-Mahoudeaux
Filière Data Mining (Fouille de données) Pierre Morizet-Mahoudeaux Plan Objectifs Débouchés Formation UVs spécifiques UVs connexes Enseignants et partenaires Structure générale des études à l UTC Règlement
Plus en détailCours Base de données relationnelles. M. Boughanem, IUP STRI
Cours Base de données relationnelles 1 Plan 1. Notions de base 2. Modèle relationnel 3. SQL 2 Notions de base (1) Définition intuitive : une base de données est un ensemble d informations, (fichiers),
Plus en détailSystèmes de recommandation de produits Projet CADI Composants Avancés pour la DIstribution
Journée DAPA du 26 mars 2009 Systèmes de recommandation de produits Projet CADI Composants Avancés pour la DIstribution Michel de Bollivier michel.debollivier@kxen.com Agenda Projet CADI La recommandation
Plus en détailEntreprise et Big Data
Entreprise et Big Data Christophe Favart Chef Architecte, SAP Advanced Development, Business Information Technology Public Juin 2013 Agenda SAP Données d Entreprise Big Data en entreprise Solutions SAP
Plus en détailSpécifications, Développement et Promotion. Ricco RAKOTOMALALA Université Lumière Lyon 2 Laboratoire ERIC
Spécifications, Développement et Promotion Ricco RAKOTOMALALA Université Lumière Lyon 2 Laboratoire ERIC Ricco? Enseignant chercheur (CNU.27) En poste à l Université Lyon 2 Faculté de Sciences Eco. Recherche
Plus en détailIBM Tivoli Monitoring, version 6.1
Superviser et administrer à partir d une unique console l ensemble de vos ressources, plates-formes et applications. IBM Tivoli Monitoring, version 6.1 Points forts! Surveillez de façon proactive les éléments
Plus en détailIntelligence Economique - Business Intelligence
Intelligence Economique - Business Intelligence Notion de Business Intelligence Dès qu'il y a une entreprise, il y a implicitement intelligence économique (tout comme il y a du marketing) : quelle produit
Plus en détailLe cinquième chapitre
Le cinquième chapitre Objectif : présenter les supports matériels ou immatériels permettant d'étayer cette nouvelle approche de la fonction maintenance. I. Evolution du domaine technique - Différents domaines
Plus en détailMagasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP)
Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP) Définition (G. Gardarin) Entrepôt : ensemble de données historisées variant
Plus en détailPourquoi l apprentissage?
Pourquoi l apprentissage? Les SE sont basés sur la possibilité d extraire la connaissance d un expert sous forme de règles. Dépend fortement de la capacité à extraire et formaliser ces connaissances. Apprentissage
Plus en détailINTRODUCTION AU DATA MINING
INTRODUCTION AU DATA MINING 6 séances de 3 heures mai-juin 2006 EPF - 4 ème année - Option Ingénierie d Affaires et de Projets Bertrand LIAUDET TP DE DATA MINING Le TP et le projet consisteront à mettre
Plus en détailUE 8 Systèmes d information de gestion Le programme
UE 8 Systèmes d information de gestion Le programme Légende : Modifications de l arrêté du 8 mars 2010 Suppressions de l arrêté du 8 mars 2010 Partie inchangée par rapport au programme antérieur Indications
Plus en détailTraitement et exploration du fichier Log du Serveur Web, pour l extraction des connaissances: Web Usage Mining
Traitement et exploration du fichier Log du Serveur Web, pour l extraction des connaissances: Web Usage Mining Mostafa HANOUNE*, Fouzia BENABBOU* *Université Hassan II- Mohammedia, Faculté des sciences
Plus en détailProjet SINF2275 «Data mining and decision making» Projet classification et credit scoring
Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems
Plus en détailOrganisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining.
2 jours : Mardi 15 et mercredi 16 novembre 2005 de 9 heures 30 à 17 heures 30 Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining. Madame, Monsieur, On parle
Plus en détailProgramme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION. Mentions Ingénierie des Systèmes d Information Business Intelligence
É C O L E D I N G É N I E U R D E S T E C H N O L O G I E S D E L I N F O R M A T I O N E T D E L A C O M M U N I C A T I O N Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION Mentions
Plus en détailUne méthode de classification supervisée sans paramètre pour l apprentissage sur les grandes bases de données
Une méthode de classification supervisée sans paramètre pour l apprentissage sur les grandes bases de données Marc Boullé Orange Labs 2 avenue Pierre Marzin 22300 Lannion marc.boulle@orange-ftgroup.com,
Plus en détailStructure fonctionnelle d un SGBD
Fichiers et Disques Structure fonctionnelle d un SGBD Requetes Optimiseur de requetes Operateurs relationnels Methodes d acces Gestion de tampon Gestion de disque BD 1 Fichiers et Disques Lecture : Transfert
Plus en détailLes enjeux du Big Data Innovation et opportunités de l'internet industriel. Datasio 2013
Les enjeux du Big Data Innovation et opportunités de l'internet industriel François Royer froyer@datasio.com Accompagnement des entreprises dans leurs stratégies quantitatives Valorisation de patrimoine
Plus en détailStructure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données
Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données et le Data Mining Nous suivons le plan suivant : Fonctionnement de Spad Catalogue des méthodes (statistiques
Plus en détaildonnées en connaissance et en actions?
1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)
Plus en détailNos Solutions PME VIPDev sont les Atouts Business de votre entreprise.
Solutions PME VIPDev Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise. Cette offre est basée sur la mise à disposition de l ensemble de nos compétences techniques et créatives au service
Plus en détailBases de données Cours 1 : Généralités sur les bases de données
Cours 1 : Généralités sur les bases de données POLYTECH Université d Aix-Marseille odile.papini@univ-amu.fr http://odile.papini.perso.esil.univmed.fr/sources/bd.html Plan du cours 1 1 Qu est ce qu une
Plus en détailBusiness Intelligence avec Excel, Power BI et Office 365
Avant-propos A. À qui s adresse ce livre? 9 1. Pourquoi à chaque manager? 9 2. Pourquoi à tout informaticien impliqué dans des projets «BI» 9 B. Obtention des données sources 10 C. Objectif du livre 10
Plus en détailLES ENTREPOTS DE DONNEES
Module B4 : Projet des Systèmes d information Lille, le 25 mars 2002 LES ENTREPOTS DE DONNEES Problématique : Pour capitaliser ses informations, une entreprise doit-elle commencer par mettre en œuvre des
Plus en détailLes dessous des moteurs de recommandation
Les dessous des moteurs de recommandation La personnalisation est un enjeu majeur du e-commerce aujourd hui. Elle réveille l esprit commerçant dans les boutiques en ligne en remettant le visiteur au cœur
Plus en détailDatawarehouse and OLAP
Datawarehouse and OLAP Datawarehousing Syllabus, materials, notes, etc. See http://www.info.univ-tours.fr/ marcel/dw.html today architecture ETL refreshing warehousing projects architecture architecture
Plus en détailcompario.com Fidélisation client Nouvelles tactiques pour un site E-Commerce rentable
Fidélisation client Nouvelles tactiques pour un site E-Commerce rentable Fidélisation client : Nouvelles tactiques pour un site E-Commerce rentable L acquisition de trafic génère des dépenses importantes
Plus en détailORACLE DATA INTEGRATOR ENTERPRISE EDITION - ODI EE
ORACLE DATA INTEGRATOR ENTERPRISE EDITION - ODI EE ORACLE DATA INTEGRATOR ENTERPRISE EDITION offre de nombreux avantages : performances de pointe, productivité et souplesse accrues pour un coût total de
Plus en détail1 er Avril 2015 Data Science & Big Data Etat de l art Donner plus d intelligence aux données
1 er Avril 2015 Data Science & Big Data Etat de l art Donner plus d intelligence aux données Votre interlocuteur Didier Gaultier Directeur Data Science Business & Decision Professeur de Statistique à l
Plus en détailMasters Spécialisés «Actuariat et Prévoyance» et «Actuariat et Finance»
Masters Spécialisés «Actuariat et Prévoyance» et «Actuariat et Finance» Introduction au Data Mining K. EL HIMDI elhimdi@menara.ma 1 Sommaire du MODULE Partie 1 : Introduction au Data Mining Partie 2 :
Plus en détailINF6304 Interfaces Intelligentes
INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie
Plus en détailIODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21
IODAA de l 1nf0rmation à la Décision par l Analyse et l Apprentissage IODAA Informations générales 2 Un monde nouveau Des données numériques partout en croissance prodigieuse Comment en extraire des connaissances
Plus en détailL information et la technologie de l informationl
L information et la technologie de l informationl CRM & informatique décisionnelled CRM CRM & informatique décisionnelle. d 1 2 3 Les Les fondements managériaux managériaux du du CRM. CRM. Les Les fondements
Plus en détailBI = Business Intelligence Master Data-ScienceCours 3 - Data
BI = Business Intelligence Master Data-Science Cours 3 - Datawarehouse UPMC 8 février 2015 Rappel L Informatique Décisionnelle (ID), en anglais Business Intelligence (BI), est l informatique à l usage
Plus en détailBig Data. Concept et perspectives : la réalité derrière le "buzz"
Big Data Concept et perspectives : la réalité derrière le "buzz" 2012 Agenda Concept & Perspectives Technologies & Acteurs 2 Pierre Audoin Consultants (PAC) Pierre Audoin Consultants (PAC) est une société
Plus en détailQU EST-CE QUE LE DECISIONNEL?
La plupart des entreprises disposent d une masse considérable d informations sur leurs clients, leurs produits, leurs ventes Toutefois ces données sont cloisonnées par les applications utilisées ou parce
Plus en détail4.2 Unités d enseignement du M1
88 CHAPITRE 4. DESCRIPTION DES UNITÉS D ENSEIGNEMENT 4.2 Unités d enseignement du M1 Tous les cours sont de 6 ECTS. Modélisation, optimisation et complexité des algorithmes (code RCP106) Objectif : Présenter
Plus en détailData 2 Business : La démarche de valorisation de la Data pour améliorer la performance de ses clients
Data 2 Business : La démarche de valorisation de la Data pour améliorer la performance de ses clients Frédérick Vautrain, Dir. Data Science - Viseo Laurent Lefranc, Resp. Data Science Analytics - Altares
Plus en détailAXIAD Conseil pour décider en toute intelligence
AXIAD Conseil pour décider en toute intelligence Gestion de la Performance, Business Intelligence, Big Data Domaine d expertise «Business Intelligence» Un accompagnement adapté à votre métier dans toutes
Plus en détailIntroduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours
Information du cours Informatique décisionnelle et data mining www.lia.univ-avignon.fr/chercheurs/torres/cours/dm Juan-Manuel Torres juan-manuel.torres@univ-avignon.fr LIA/Université d Avignon Cours/TP
Plus en détailUrbanisation des SI-NFE107
OLAP Urbanisation des SI-NFE107 Fiche de lecture Karim SEKRI 20/01/2009 OLAP 1 Introduction PLAN OLAP Les différentes technologies OLAP Plate formes et Outils 20/01/2009 OLAP 2 Informatique décisionnelle
Plus en détailApprentissage Statistique
Apprentissage Statistique Master DAC - Université Paris 6, patrick.gallinari@lip6.fr, http://www-connex.lip6.fr/~gallinar/ Année 2014-2015 Partie 1 Introduction Apprentissage Automatique Problématique
Plus en détailFidélisation client : Nouvelles tactiques pour un site E- Commerce rentable
Fidélisation client : Nouvelles tactiques pour un site E- Commerce rentable L acquisition de trafic génère des dépenses importantes pour un site E-Commerce et les taux de conversion restent faibles. Se
Plus en détailPanorama des problématiques de traitement de l information. Larbi Aït Hennani, Fatma Bouali, Vincent Vandewalle
Panorama des problématiques de traitement de l information Larbi Aït Hennani, Fatma Bouali, Vincent Vandewalle Conduite d une étude statistique Larbi Aït Hennani, maître de conférences en mathématiques
Plus en détailLe "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique
Introduction à l informatique : Information automatisée Le premier ordinateur Définition disque dure, mémoire, carte mémoire, carte mère etc Architecture d un ordinateur Les constructeurs leader du marché
Plus en détailEvry - M2 MIAGE Entrepôt de données
Evry - M2 MIAGE Entrepôt de données Introduction D. Ploix - M2 Miage - EDD - Introduction 1 Plan Positionnement du BI dans l entreprise Déclinaison fonctionnelle du décisionnel dans l entreprise Intégration
Plus en détail