Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données

Dimension: px
Commencer à balayer dès la page:

Download "Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données"

Transcription

1

2 Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données et le Data Mining Nous suivons le plan suivant : Fonctionnement de Spad Catalogue des méthodes (statistiques descriptives, analyses factorielles, arbre de décision, régression multiple, régression logistique, scoring ) Pour chaque méthode, nous avons une approche non formelle et très pratique (ce que fait la méthode, comment l employer ) Théorie puis application sous Spad Théorie Applications

3 création d une enquête (élaboration du questionnaire, saisie, codage logique ) gestion d une base de données (data management) traitement d une enquête analyse statistique des résultats d une enquête maîtrise du logiciel SPAD version 73

4 Guide du Data Miner de Spad 70 (kit-étudiant et Eprel) Guide de l utilisateur de Spad 70 (kit-étudiant et Eprel) Wikipédia : Exploration de données Analyse de données Arbre de décision Analyse discriminante linéaire

5 Qu est-ce que le Data Management?

6 Le Data Management est la gestion des données au sens large Dans Spad, elle recouvre, entre autres, les éléments suivants: Filtre logique Échantillonnage Dédoublonnage Tri Empilement de tables Agrégation Transposition Verticalisation Format Édition de libellés Sélection, ordre Juxtaposition Jointure Binarisation Remplacement des données manquantes Mise en classes Générateur de nouvelles variables Création d une variable de pondération

7 Qu est-ce que l Analyse des Données?

8 Traiter une enquête Trouver des profils type Détecter les oppositions de profils

9 L analyse des données est une branche des statistiques (et donc des mathématiques) qui traite de la description de données conjointes On cherche par ces méthodes à donner les liens pouvant exister entre les différentes données et à en tirer une information statistique qui permet de décrire de façon plus succincte les principales informations contenues dans ces données On peut également chercher à classer les données en différents sous groupes plus homogènes : un exemple d'utilisation d'un tel classement serait celui de la reconnaissance automatique des pourriels Un type d'analyse des données, ou, plus précisément ici, de data profiling, serait l'analyse simultanée de l âge, du sexe et de la catégorie socioprofessionnelle des joueurs de golf ; la bibliométrie fait également largement appel à l'analyse de la publication des revues scientifiques afin de calculer, par exemple, leur «facteur d'impact» Source : Wikipédia, rubrique «analyse des données»

10 Dans l'acception française, la terminologie analyse des données désigne un sousensemble de ce qui est appelé plus généralement la statistique multivariée Elle comprend principalement : L analyse en composantes principales (ACP), utilisée pour des données quantitatives L analyse factorielle discriminante (AFD) ou analyse discriminante qui permet d identifier des groupes homogènes au sein de la population du point de vue des variables étudiées, L'analyse factorielle des correspondances (AFC), utilisée pour des données qualitatives (tableau d association) La classification automatique L analyse en composantes indépendantes (ACI) L'iconographie des corrélations, pour des données qualitatives et quantitatives Ces méthodes permettent notamment de manipuler et de synthétiser l information provenant de tableaux de données de grande taille Pour cela, il est très important de bien estimer les corrélations entre les variables que l on étudie On a alors souvent recours à la matrice des corrélations (ou la matrice de variance-covariance) entre les variables

11 Les techniques d analyse de données multidimensionnelles sont au cœur de la pratique marketing car elles permettent l interprétation des données Elles sont essentielles pour développer des typologies, analyser un positionnement et plus généralement pour comprendre la demande du marché et construire des propositions susceptibles de satisfaire le client Autant la disponibilité des outils d analyse que l accumulation toujours plus importante de données rendent facile mais aussi complexe l approche des données Ce cours rappelle les principes des méthodes d analyse des données afin de permettre leur mise en œuvre pratique avec un logiciel statistique (SPAD 70)

12 Qu est-ce que le Data Mining? Source : Wikipédia, rubrique «exploration de données»

13 L exploration de données (fouille de données, data mining, forage de données ou encore extraction de connaissances à partir de données) a pour objet l extraction d'un savoir ou d'une connaissance à partir de grandes quantités de données, par des méthodes automatiques ou semiautomatiques L'utilisation industrielle ou opérationnelle de ce savoir dans le monde professionnel permet de résoudre des problématiques très diverses, allant de la gestion de la relation client à la maintenance préventive, en passant par la détection de fraudes ou encore l'optimisation de sites web Source : Wikipédia, rubrique «exploration de données»

14 Le data mining est un processus d'extraction de connaissances valides et exploitables à partir de grands volumes de données Il a vocation à être utilisé dans un environnement professionnel et se distingue de l'analyse de données et de la statistique par les points suivants: Contrairement à la méthode statistique, le data mining ne nécessite jamais que l'on établisse une hypothèse de départ qu'il s'agira de vérifier Ce sont des données elles-mêmes que sont déduites les corrélations intéressantes, le logiciel n'étant là que pour les découvrir (le data mining se situe à la croisée des statistiques, de l'intelligence artificielle et des bases de données) Les connaissances extraites par le data mining ont vocation à être intégrées dans le schéma organisationnel de l'entreprise ou de l'entité considérée Le data mining impose donc d'être capable d'utiliser de manière opérationnelle les résultats des analyses effectuées, souvent dans des délais très courts Le processus d'analyse doit permettre à l'organisation une réactivité(très) importante Les données traitées sont issues des systèmes de stockage en place dans l'organisation et sont ainsi hétérogènes, multiples, plus ou moins structurées Leur raison d'être n'est donc a priori pas l'analyse (sauf dans le cas d'un entrepôt de données) Cela impose de disposer de systèmes performants de préparation ou de manipulation de données

15 Le data mining se propose de transformer en information, ou en connaissance, de grands volumes de données qui peuvent être stockés de manière diverse, dans des bases de données relationnelles, dans un (ou plusieurs) entrepôt de données (data warehouse), mais qui peuvent aussi être récupérées de sources riches plus ou moins structurées comme internet, ou encore en temps réel (sollicitation d'un centre d'appel, retrait d'argent dans undistributeuràbillets) Lorsque la source n est pas directement un entrepôt de données, il s'agit très souvent de construire une base de données ou un datamart dédié à l'analyse et aux analystes Cela suppose d'avoir à sa disposition une palette d'outils de gestion de données (data management) On peut également structurer les données de l entrepôt sous forme d un hypercube OLAP, même si cela est assez rare en matière de data mining

16 Le data mining est un processus d'analyse dont l'approche est différente de celle utilisée en statistique Cette dernière présuppose en général que l'on se fixe une hypothèse que les données permettent ou non de confirmer Au contraire, le data mining adopte une démarche sans a priori (approche pragmatique) et essaie ainsi de faire émerger, à partir des données brutes, des inférences que l'expérimentateur peut ne pas soupçonner (sérendipité), et dont il aura éventuellement à valider la pertinence Le data mining tente alors de réaliser un arbitrage entre validité scientifique, interprétabilité des résultats et facilité d'utilisation, dans un environnement professionnel où le temps d'étude joue un rôle majeur et où les analystes ne sont pas toujours des statisticiens

17 Le logiciel SPAD 73 SPAD version 70 Guide de l utilisateur(en pdf) Guidedudataminer(enpdf) Choixdecelogiciel:«quipeutlepluspeutlemoins!»(Aristote) wwwcoherisfr Nousdonnonslesréférencesdesguidesaveclelogo Les autres logiciels : SPSS, Le Sphinx, Modalisa, Minitab, SAS Défaut: pas de ressources sur Internet

18 Le Projet sous SPAD

19 1 3 personnes maximum (bonus si 1 ou 2) 2 Sujet : lié au diplôme ou à l entreprise, prescriptions marketing (idéal : mémoire) 3 Support papier : 30 pages Présentation synthétique sur PowerPoint (noté à part) Supports informatiques (base Excel, projet, ppt) La base doit être prête rapidement! Date limite de remise du projet 30 juin

20 Dans le cours, nous apprenons à créer une enquête, à l'administrer, à la coder, à la traiter sur Excel et Spad et à la traiter statistiquement (fouillage et analyses) Le cours est théorique (même s'il y a de nombreux cas et des applications avec le logiciel) et il faut que vous travailliez vous-même sur le terrain pour acquérir l'autonomie recherchée C'est l'objet de ce travail Je vous recommande d'intégrer ce travail dans votre mémoire (synergies) Le projet demandé consiste à faire votre propre enquête, seul(e) ou en groupes (de 3 maximum) et à analyser les résultats Toutes les méthodes vues en cours doivent y figurer (tris à plat, tris croisés régression multiple, classification et analyse factorielle) Chaque procédure doit être rappelée (définition), traitée et interprétée Par exemple, avant de faire un tri à plat, il faudra expliquer pourquoi on fait un tri à plat, comment on lit le tableau produit par Spad et comment on peut l'exploiter sur un plan prescriptif

21 Démarche : - fixer d'abord une problématique globale (exemple : "Comment améliorer l'efficacité des négociateurs dans mon entreprise?") ; - élaborer un questionnaire dont l'analyse permettra de répondre à cette problématique (exemples de question : "Quel est votre style de négociation préféré?", "Aimez-vous négocier?") ; - faire le codage logique des réponses aux questions ouvertes (par exemple : oui=1 et non=2) ; - saisir le questionnaire (questions et réponses) sur Excel puis importer sous Spad (ou saisir directement sur Spad) ; - faire les analyses sous Spad (tris à plat, arbre de décision, analyse factorielle) ; - produire un document synthétique (introduction, partie 1) présentant votre travail ; - produire une présentation PowerPoint qui met en lumière vos résultats (sans faire de copier-coller du document) Nombre de questions minimum : 15 Nombre d'individus minimum : 30 Il faut un mélange de variables quantitatives et qualitatives

22 Le thème de l'enquête doit être en rapport avec le diplôme (problématique réseau, marketing) et les prescriptions doivent être professionnelles Un document écrit et des fichiers informatiques doivent être remis (base de données, fichier de présentation PowerPoint, fichiers Spad) sur une clé USB ou sur un CD-ROM Un document professionnel est attendu (mise en forme, réalité des prescriptions) Bonus de note finale : Projet fait à 3 : 0 Projet fait à 2 : +1 Projet fait seul(e) : +3 Ce travail ne doit pas être fait au dernier moment car (i) ce sera trop lourd pour vous et (ii) si vous rencontrez des difficultés (ce qui est presque certain), je ne serai plus forcément disponible pour vous aider Enfin, le travail doit être remis à la scolarité pour consignation (et non à moi directement)

23 Plan type Introduction Partie 1 L enquête : du questionnaire à la base de données Section 11 Le questionnaire Section 12 La base de données Partie 2 Statistiques descriptives Section 21 Tris à plat, histogramme et discrétisation Section 22 Tableaux croisés Section 23 Caractérisation de variables 231 Caractérisation d une variable continue 232 Caractérisation d une variable nominale Section 24 Analyse bivariée Partie 3 Analyses factorielles Section 31 ACP, AFC ou ACM Section 32 Description des axes factoriels Partie 4 Classification Partie 5 Modèle linéaire et ses extensions Section 51 Régression multiple Section 52 Régression logistique Partie 6 Arbres de décision interactifs Conclusion

24 Le Kit-étudiant Offert par l IAE (valeur de 23 ) Licence personnelle pour un an Possibilité de travailler chez soi Pas de version Mac

25 Ce que nous verrons Statistiques descriptives Analyses factorielles Typologies Modèle linéaire Analyses discriminantes Scoring Arbres de décision

26 L UNI-DIMENSIONNEL Poids Olivier 90 Sylvie 60 Louis 100 Distance euclidienne : A B d( A, B) = ( x x ) n i= 1 Olivier Louis = ( Poids Poids ) = (90 100) = 10 2 i i 2 2 Sylvie Olivier Louis POIDS D(L,O)

27 L UNI-DIMENSIONNEL La distance qui sépare Olivier de Louis est plus petite que celle qui sépare Olivier de Sylvie Olivier ressemble donc plus à Louis qu à Sylvie, en termes de poids, et sur le critère de la distance euclidienne

28 LE BI-DIMENSIONNEL Poids Taille O livier Taille Seuil 1 Sylvie Minces Louis Louis 200 D(L,O) Olivier 190 Seuil Sylvie Grands (0,0) Les «petits gros» Poids

29 Calcul de la distance euclidienne A B d( A, B) = ( x x ) n i= 1 i i 2 = ( Poids Poids ) + ( Taille Taille ) Olivier Louis 2 Olivier Louis 2 = (90 100) + ( ) = La valeur n a aucun sens La différence, elle, peut s interpréter

30 LE TRI-DIMENSIONNEL Taille Poids Taille Age Olivier Sylvie Louis Louis 170 Sylvie 20 Olivier Age Poids

31 LE N-DIMENSIONNEL Poids Taille Age Revenus Olivier Sylvie Louis Eric Plus de représentation graphique possible! Distance euclidienne et projection sur un plan

32 Relation entre la tranche d âge du conducteur et le type de collision : «notre premier tri croisé»

33 z LE POINT A(90,70,30) z O A(90,70,30) : point en 3D 90 (90,70,0) : point en 2D x y

IUT STID, 1 ère année Découverte de logiciels statistiques Prise en main du logiciel SPAD

IUT STID, 1 ère année Découverte de logiciels statistiques Prise en main du logiciel SPAD Université de Perpignan - IUT de Carcassonne Vivien ROSSI Année 2006/2007 IUT STID, 1 ère année Découverte de logiciels statistiques Prise en main du logiciel SPAD Ce document est tiré du site : http ://www.stat.ucl.ac.be/ispersonnel/lecoutre/stats/spad/

Plus en détail

EFFICACITE PROFESSIONNELLE. Itinéraires : Ecoute et analyse prospective de son terrioire Ecoute citoyenne et démocratie participative

EFFICACITE PROFESSIONNELLE. Itinéraires : Ecoute et analyse prospective de son terrioire Ecoute citoyenne et démocratie participative EFFICACITE PROFESSIONNELLE Itinéraires : Ecoute et analyse prospective de son terrioire Ecoute citoyenne et démocratie participative DOMAINE : REPÈRES ET OUTILS FONDAMENTAUX / Sous-domaine : Connaissance

Plus en détail

Heidi WECHTLER. Octobre 2005

Heidi WECHTLER. Octobre 2005 Heidi WECHTLER Le support aux analyses de données Séminaire GREGOR Octobre 2005 Support aux analyse de données du GREGOR Le poste Chargée d étude statistiques au GREGOR, bureau B126 (wechtler.iae@univ-paris1.fr)

Plus en détail

INTRODUCTION AU DATA MINING

INTRODUCTION AU DATA MINING INTRODUCTION AU DATA MINING 6 séances de 3 heures mai-juin 2006 EPF - 4 ème année - Option Ingénierie d Affaires et de Projets Bertrand LIAUDET TP DE DATA MINING Le TP et le projet consisteront à mettre

Plus en détail

Table des matières. PREMIÈRE PARTIE Étapes initiales des études marketing 7

Table des matières. PREMIÈRE PARTIE Étapes initiales des études marketing 7 Table des matières Préface Public 1 Structure de l ouvrage 1 Caractéristiques de l ouvrage 3 Contenu 3 Pédagogie 4 Remarques sur l adaptation française 4 Ressources numériques 5 Biographie 6 PREMIÈRE PARTIE

Plus en détail

Entrepôt de données 1. Introduction

Entrepôt de données 1. Introduction Entrepôt de données 1 (data warehouse) Introduction 1 Présentation Le concept d entrepôt de données a été formalisé pour la première fois en 1990 par Bill Inmon. Il s agissait de constituer une base de

Plus en détail

Business & High Technology

Business & High Technology UNIVERSITE DE TUNIS INSTITUT SUPERIEUR DE GESTION DE TUNIS Département : Informatique Business & High Technology Chapitre 8 : ID : Informatique Décisionnelle BI : Business Intelligence Sommaire Introduction...

Plus en détail

Le Sphinx Millenium Modes opératoires d'analyse de données Traitements et analyses avec Le Sphinx Plus²

Le Sphinx Millenium Modes opératoires d'analyse de données Traitements et analyses avec Le Sphinx Plus² Le Sphinx Millenium Modes opératoires d'analyse de données Traitements et analyses avec Le Sphinx Plus² Le Sphinx Développement Parc Altaïs 74650 CHAVANOD Tél : 33 / 4.50.69.82.98. Fax : 33 / 4.50.69.82.78.

Plus en détail

Cycle de formation certifiante Sphinx

Cycle de formation certifiante Sphinx Cycle de formation certifiante Sphinx 28, 29, 30 Mai 2015 Initiation, Approfondissement et Maîtrise Etudes qualitatives / quantitatives Initiation, approfondissement et maîtrise des études qualitatives

Plus en détail

Introduction au datamining

Introduction au datamining Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des

Plus en détail

COURS DE STATISTIQUES (24h)

COURS DE STATISTIQUES (24h) COURS DE STATISTIQUES (24h) Introduction Statistiques descriptives (4 h) Rappels de Probabilités (4 h) Echantillonnage(4 h) Estimation ponctuelle (6 h) Introduction aux tests (6 h) Qu est-ce que la statistique?

Plus en détail

Analyse Statistique pour Le Traitement d Enquêtes

Analyse Statistique pour Le Traitement d Enquêtes DAT 104, année 2004-2005 p. 1/90 Analyse Statistique pour Le Traitement d Enquêtes Mastère Développement Agricole Tropical Stéphanie Laffont & Vivien ROSSI UMR ENSAM-INRA Analyse des systèmes et Biométrie

Plus en détail

L'AFC pour les nuls. Mise à jour du 21 janvier 2010. Dernière version des diapos disponible ici : analyse factorielle des composantes

L'AFC pour les nuls. Mise à jour du 21 janvier 2010. Dernière version des diapos disponible ici : analyse factorielle des composantes L'AFC pour les nuls Mise à jour du 21 janvier 2010 Dernière version des diapos disponible ici : analyse factorielle des composantes Source des images indiquées au-dessous ou en cliquant sur l image Cours

Plus en détail

Solutions Décisionnelles SPAD. La maîtrise des données, l'art de la décision

Solutions Décisionnelles SPAD. La maîtrise des données, l'art de la décision Solutions Décisionnelles SPAD La maîtrise des données, l'art de la décision SPAD, la référence en Analyse de Données et Data Mining La solution logicielle SPAD permet de tirer le meilleur parti de tous

Plus en détail

Introduction à l analyse des données. Olivier Godechot

Introduction à l analyse des données. Olivier Godechot Introduction à l analyse des données Olivier Godechot Introduction. Les données statistiques : de très nombreuses variables. Aucune n est parfaite La perception d un phénomène appréhendée comme la combinaison

Plus en détail

Outils Statistiques du Data Mining

Outils Statistiques du Data Mining Outils Statistiques du Data Mining Pr Roch Giorgi roch.giorgi@univ-amu.fr SESSTIM, Faculté de Médecine, Aix-Marseille Université, Marseille, France http://sesstim-orspaca.org http://optim-sesstim.univ-amu.fr

Plus en détail

- Services sur Internet. utile à la

- Services sur Internet. utile à la SM M GLOBAL SOLUTIONS CATALOGUE DES FORMATIONS 2 015 Suivi-évaluation Statistiques - techniques quantitatives avancées basées sur PASW/ /SPSS - Stata Sphinx CSPro Epi Info Système d information géographique

Plus en détail

Le Data Mining Techniques pour exploiter l information. Auteur : Dan Noël Date : 24.04.2009

Le Data Mining Techniques pour exploiter l information. Auteur : Dan Noël Date : 24.04.2009 Le Data Mining Techniques pour exploiter l information Auteur : Dan Noël Date : 24.04.2009 Agenda de la présentation du 26.03.2009 Concept de Data Mining ou qu est-ce que le Data Mining Déroulement d un

Plus en détail

L3 Géographie UE Méthodologie. Statistiques COURS 1. Salle 125. Intervenants : Nadège. UMR Centre de Recherches de Climatologie (CRC)

L3 Géographie UE Méthodologie. Statistiques COURS 1. Salle 125. Intervenants : Nadège. UMR Centre de Recherches de Climatologie (CRC) L3 Géographie UE Méthodologie Statistiques COURS 1 Salle 125 Intervenants : Nadège Martiny & Julien Crétat UFR Sciences Humaines (Département de Géographie) UMR Centre de Recherches de Climatologie (CRC)

Plus en détail

Agenda de la présentation

Agenda de la présentation Le Data Mining Techniques pour exploiter l information Dan Noël 1 Agenda de la présentation Concept de Data Mining ou qu est-ce que le Data Mining Déroulement d un projet de Data Mining Place du Data Mining

Plus en détail

Introduction à la B.I. Avec SQL Server 2008

Introduction à la B.I. Avec SQL Server 2008 Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide

Plus en détail

Analyse des Données. Questions de cours. Exercice n o 1. Examen terminal - Durée 3h

Analyse des Données. Questions de cours. Exercice n o 1. Examen terminal - Durée 3h I.U.T de Caen STID 2ème année Département STID Année Universitaire 2002-2003 Responsable de cours : Alain LUCAS Seule la calculatrice type collège est autorisée. Seul le cours est autorisé. On rappelera

Plus en détail

Entreposage, analyse en ligne et fouille de données

Entreposage, analyse en ligne et fouille de données Entreposage, analyse en ligne et fouille de données Houssem Jerbi IRIT - SIG/ED jerbi@irit.fr Journée COMPIL " Bases de Données" 14/12/2010 PLAN Introduction Bases de données Entrepôt de données Technologie

Plus en détail

Modalisa : mode d emploi

Modalisa : mode d emploi Méthodes quantitatives en sociologie 2009-2010 Responsables : Frédérique Giraud & Pierre Mercklé Modalisa : mode d emploi Pierre Mercklé, novembre 2009 Ce document, qui sert de support aux formations en

Plus en détail

Cybermarché et analyse comportementale

Cybermarché et analyse comportementale Cybermarché et analyse comportementale Antoine-Eric Sammartino aesammartino@e-laser.fr Séminaire Data Mining - Educasoft Formations 18 juin 2001-1- MENU Le Groupe LaSer Le processus Data Mining L industrialisation

Plus en détail

Documentation utilisateur 2. Comment réaliser des analyses complémentaires à partir des données saisies sur le serveur Iteo

Documentation utilisateur 2. Comment réaliser des analyses complémentaires à partir des données saisies sur le serveur Iteo Documentation utilisateur 2 Comment réaliser des analyses complémentaires à partir des données saisies sur le serveur Iteo Version 2 Février 2006 Objet de cette présentation Dans le cadre du label Écoute

Plus en détail

2015-2ème semestre EFFICACITE PROFESSIONNELLE

2015-2ème semestre EFFICACITE PROFESSIONNELLE EFFICACITE PROFESSIONNELLE 2015-2ème semestre Itinéraires : Ecoute et analyse prospective de son territoire Ecoute citoyenne et démocratie participative OFFRE DE FORMATION DU CNFPT DOMAINE : REPÈRES ET

Plus en détail

Statistique et analyse de données pour l assureur : des outils pour la gestion des risques et le marketing

Statistique et analyse de données pour l assureur : des outils pour la gestion des risques et le marketing Statistique et analyse de données pour l assureur : des outils pour la gestion des risques et le marketing Gilbert Saporta Chaire de Statistique Appliquée, CNAM ActuariaCnam, 31 mai 2012 1 L approche statistique

Plus en détail

Enquête sur les besoins de formation en statistiques

Enquête sur les besoins de formation en statistiques Aix Marseille Université Observatoire de la Vie Etudiante ove@univ-provence.fr Aix Marseille Université - Observatoire de la Vie Etudiante A l'attention du responsable de l'enquête Enquête sur les besoins

Plus en détail

Analyse de données textuelles Panorama des fonctions, des méthodes et des usages

Analyse de données textuelles Panorama des fonctions, des méthodes et des usages Analyse de données textuelles Panorama des fonctions, des méthodes et des usages Sylvie Dalbin Assistance & Techniques Documentaires DocForum, Le 17 Novembre 2005 Déroulé de l'intervention (1) 1. Définition

Plus en détail

Le Data Mining, Outil d aide à la prise de décision dans l action commerciale

Le Data Mining, Outil d aide à la prise de décision dans l action commerciale Université Ibn Zohr Faculté des Sciences Juridiques, Économiques et Sociales Exposé sous le thème : Le Data Mining, Outil d aide à la prise de décision dans l action commerciale Plan : Introduction : L

Plus en détail

STAGE. «Offre modulaire - Recueillir et analyser les besoins et attentes des usagers - Module 4 - L'analyse experte des données statistiques»

STAGE. «Offre modulaire - Recueillir et analyser les besoins et attentes des usagers - Module 4 - L'analyse experte des données statistiques» STAGE «Offre modulaire - Recueillir et analyser les besoins et attentes des usagers - Module 4 - L'analyse experte des données statistiques» PROGRAMME DETAILLE Intervenant : PARIS nicolas Cabinet : OPTIMA

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

Intelligence Economique - Business Intelligence

Intelligence Economique - Business Intelligence Intelligence Economique - Business Intelligence Notion de Business Intelligence Dès qu'il y a une entreprise, il y a implicitement intelligence économique (tout comme il y a du marketing) : quelle produit

Plus en détail

Cycles de formation certifiante du CIEMS

Cycles de formation certifiante du CIEMS Cycles de formation certifiante du CIEMS Casablanca, Agadir, Tanger Calendrier 2016 Cycle de formation certifiante Etudes Quantitatives & Qualitatives En partenariat avec Le Sphinx Initiation, Approfondissement

Plus en détail

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours Information du cours Informatique décisionnelle et data mining www.lia.univ-avignon.fr/chercheurs/torres/cours/dm Juan-Manuel Torres juan-manuel.torres@univ-avignon.fr LIA/Université d Avignon Cours/TP

Plus en détail

GOUTTE. Analyse Statistique des Données Cours 4. Master 2 EID. LUISS, Libera Università Internazionale degli Studi Sociali

GOUTTE. Analyse Statistique des Données Cours 4. Master 2 EID. LUISS, Libera Università Internazionale degli Studi Sociali LUISS, Libera Università Internazionale degli Studi Sociali Université Paris 13 Laboratoire Analyse, Géométrie et Applications UMR 7539 GOUTTE Analyse Statistique des Données Cours 4 Master 2 EID goutte@math.univ-paris13.fr

Plus en détail

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1 Christophe CANDILLIER Cours de DataMining mars 2004 age 1 1. Introduction 2. rocessus du DataMining 3. Analyse des données en DataMining 4. Analyse en Ligne OLA 5. Logiciels 6. Bibliographie Christophe

Plus en détail

Analyse de données. [Tapez le sous-titre du document] ANALYSE DE DONNEES 2011 2012. ANALYSE DE DONNEES Page 1 LICENCE 3 SCIENCES ECONOMIQUES

Analyse de données. [Tapez le sous-titre du document] ANALYSE DE DONNEES 2011 2012. ANALYSE DE DONNEES Page 1 LICENCE 3 SCIENCES ECONOMIQUES 2011 2012 ANALYSE DE DONNEES 2011 2012 LICENCE 3 SCIENCES ECONOMIQUES COURS DE M. THIERRY BLAYAC Analyse de données [Tapez le sous-titre du document] ANALYSE DE DONNEES Page 1 H34VEN Cours pour Licence

Plus en détail

SAISIR LES REPONSES PRODUIRE LES RESULTATS ANALYSE UNIVARIEE, LES TABLEAUX A PLAT ANALYSES BIVARIEES, LES TABLEAUX CROISES

SAISIR LES REPONSES PRODUIRE LES RESULTATS ANALYSE UNIVARIEE, LES TABLEAUX A PLAT ANALYSES BIVARIEES, LES TABLEAUX CROISES SAISIR LES REPONSES PRODUIRE LES RESULTATS ANALYSE UNIVARIEE, LES TABLEAUX A PLAT ANALYSES BIVARIEES, LES TABLEAUX CROISES 1 SAISIE DES REPONSES CONCERNANT L ENQUETE SUR LE CINEMA (Voir page 4) 1- LES

Plus en détail

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

Le tout fichier Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique Introduction à l informatique : Information automatisée Le premier ordinateur Définition disque dure, mémoire, carte mémoire, carte mère etc Architecture d un ordinateur Les constructeurs leader du marché

Plus en détail

Chapitre 9 ANALYSE MULTIDIMENSIONNELLE

Chapitre 9 ANALYSE MULTIDIMENSIONNELLE Statistique appliquée à la gestion et au marketing http://foucart.thierry.free.fr/statpc Chapitre 9 ANALYSE MULTIDIMENSIONNELLE L analyse des données multidimensionnelles regroupe un ensemble de méthodes

Plus en détail

www.platiniumfinance.com P L A T I N I U M F I N A N C E. Tél. +212.642.23.22.43 Fixe. +212.537.60.70.05 contact@platiniumfinance.

www.platiniumfinance.com P L A T I N I U M F I N A N C E. Tél. +212.642.23.22.43 Fixe. +212.537.60.70.05 contact@platiniumfinance. Droit Economie Comptabilité Gestion Management Statistique et Probabilité Commerce-Vente Econométrie et analyse de données Finance Mathématiques économique Langues Marketing - Mercatique Recherche opérationnel

Plus en détail

TP DE DATA MINING 2 : MODELISATION AVEC SPSS CLEMENTINE

TP DE DATA MINING 2 : MODELISATION AVEC SPSS CLEMENTINE TP DE DATA MINING 2 : MODELISATION AVEC SPSS CLEMENTINE EPF 4/ 5 ème année - Option Ingénierie d Affaires et de Projets - Finance Bertrand LIAUDET TP n 2 de DATA MINING : Modélisation 1 Jeu de données

Plus en détail

Traitement des données avec Microsoft EXCEL 2010

Traitement des données avec Microsoft EXCEL 2010 Traitement des données avec Microsoft EXCEL 2010 Vincent Jalby Septembre 2012 1 Saisie des données Les données collectées sont saisies dans une feuille Excel. Chaque ligne correspond à une observation

Plus en détail

AVANT-PROPOS L analyse des données

AVANT-PROPOS L analyse des données AVANT-PROPOS L analyse des données Godelieve MASUY-STROOBANT Nos «sociétés de l information» voient se multiplier les bases de données administratives et les enquêtes ad hoc le plus souvent destinées à

Plus en détail

Introduction à l'analyse statistique des données

Introduction à l'analyse statistique des données INTRODUCTION À L'ANALYSE STATISTIQUE DES DONNÉES CONCEPTS DE BASE Un certain nombre de concepts, préalables indispensables à la compréhension des analyses présentées, sont définis ici. De même pour quelques

Plus en détail

5. Architecture et sécurité des systèmes informatiques Dimension Fonctionnelle du SI

5. Architecture et sécurité des systèmes informatiques Dimension Fonctionnelle du SI 5. Architecture et sécurité des systèmes informatiques Dimension Fonctionnelle du SI Un SI : et pour faire quoi? Permet de stocker de manière définitive des informations volatiles provenant d autre BD.

Plus en détail

Annexe 1. Tableau 1 : Contenu indicatif des modules de la formation

Annexe 1. Tableau 1 : Contenu indicatif des modules de la formation Annexe 1 Tableau 1 : Contenu indicatif des modules de la formation 1 Modules Objectifs Contenu indicatif du module Module 1 : veille stratégique et intelligence des Territoires Acquérir des techniques

Plus en détail

Complet Intuitif Efficace. Références

Complet Intuitif Efficace. Références Logiciel de référence en Analyse de Données, Data Mining et Text Mining pour transformer vos données en connaissance Complet Intuitif Efficace Dans un environnement convivial et intuitif, disposez de toute

Plus en détail

BUSINESS INTELLIGENCE

BUSINESS INTELLIGENCE GUIDE COMPARATIF BUSINESS INTELLIGENCE www.viseo.com Table des matières Business Intelligence :... 2 Contexte et objectifs... 2 Une architecture spécifique... 2 Les outils de Business intelligence... 3

Plus en détail

Manuel d'utilisation. Module " Gestionnaire "

Manuel d'utilisation. Module  Gestionnaire SphinxOnline Manuel d'utilisation Module " Gestionnaire " Le Sphinx Developpement - Parc Altais - 74650 CHAVANOD France - Tel : +33 (0)4 50 69 82 98 - Fax : +33 (0)4 50 69 82 78 - www.lesphinx-developpement.fr

Plus en détail

MATHÉMATIQUES ET SCIENCES HUMAINES

MATHÉMATIQUES ET SCIENCES HUMAINES MATHÉMATIQUES ET SCIENCES HUMAINES J. P. FENELON L école d été du C.N.R.S. sur l analyse des données Mathématiques et sciences humaines, tome 70 (1980), p. 69-75.

Plus en détail

Analyse de grandes bases de données en santé

Analyse de grandes bases de données en santé .. Analyse de grandes bases de données en santé Alain Duhamel Michaël Genin Mohamed Lemdani EA 2694 / CERIM Master 2 Recherche Biologie et Santé Journée Thématique Fouille de Données Plan. 1 Problématique.

Plus en détail

Chapitre 9 : Informatique décisionnelle

Chapitre 9 : Informatique décisionnelle Chapitre 9 : Informatique décisionnelle Sommaire Introduction... 3 Définition... 3 Les domaines d application de l informatique décisionnelle... 4 Architecture d un système décisionnel... 5 L outil Oracle

Plus en détail

Analyse de grandes bases de données en santé

Analyse de grandes bases de données en santé .. Analyse de grandes bases de données en santé Alain Duhamel Michaël Genin Mohamed Lemdani EA 2694 / CERIM Master 2 Recherche Biologie et Santé Journée Thématique Fouille de Données Plan. 1 Problématique.

Plus en détail

et les Systèmes Multidimensionnels

et les Systèmes Multidimensionnels Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Datawarehouse (DW) Le Datawarehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées

Plus en détail

SPHINX Logiciel de dépouillement d enquêtes

SPHINX Logiciel de dépouillement d enquêtes SPHINX Logiciel de dépouillement d enquêtes sphinx50frversion4.doc 1 Les trois stades du SPHINX sont ceux que comporte habituellement toute enquête d opinion: Elaboration du questionnaire (fiche outil

Plus en détail

Méthodologie de conceptualisation BI

Méthodologie de conceptualisation BI Méthodologie de conceptualisation BI Business Intelligence (BI) La Business intelligence est un outil décisionnel incontournable à la gestion stratégique et quotidienne des entités. Il fournit de l information

Plus en détail

Licence Professionnelle en Statistique et Informatique Décisionnelle (S.I.D.)

Licence Professionnelle en Statistique et Informatique Décisionnelle (S.I.D.) Université de Lille 2 - Droit et Santé Ecole Supérieure des Affaires & Institut Universitaire de Technologie (IUT-C) Département Statistique et Traitement Informatique des Données Licence Professionnelle

Plus en détail

Spécificités, Applications et Outils

Spécificités, Applications et Outils Spécificités, Applications et Outils Ricco Rakotomalala Université Lumière Lyon 2 Laboratoire ERIC Laboratoire ERIC 1 Ricco Rakotomalala ricco.rakotomalala@univ-lyon2.fr http://chirouble.univ-lyon2.fr/~ricco/data-mining

Plus en détail

Classification Exemple : Enquête d opinion sur les OGM. Pauline Le Badezet Alexandra Lepage

Classification Exemple : Enquête d opinion sur les OGM. Pauline Le Badezet Alexandra Lepage Classification Exemple : Enquête d opinion sur les OGM Pauline Le Badezet Alexandra Lepage SOMMAIRE Introduction Méthodologie Méthode de partitionnement Classification Ascendante Hiérarchique Interprétation

Plus en détail

Introduction aux S.G.B.D.

Introduction aux S.G.B.D. NFE113 Administration et configuration des bases de données - 2010 Introduction aux S.G.B.D. Eric Boniface Sommaire L origine La gestion de fichiers Les S.G.B.D. : définition, principes et architecture

Plus en détail

L'APPROCHE EXPERIMENTALE EN RECHERCHE: introduction aux statistiques.

L'APPROCHE EXPERIMENTALE EN RECHERCHE: introduction aux statistiques. L'APPROCHE EXPERIMENTALE EN RECHERCHE: introduction aux statistiques 1 BUTS DU COURS : se familiariser avec le vocabulaire statistique o variable dépendante, variable indépendante o statistique descriptive,

Plus en détail

QU EST-CE QUE LE DECISIONNEL?

QU EST-CE QUE LE DECISIONNEL? La plupart des entreprises disposent d une masse considérable d informations sur leurs clients, leurs produits, leurs ventes Toutefois ces données sont cloisonnées par les applications utilisées ou parce

Plus en détail

L'infocentre sert à prendre des décisions opérationnelles basées sur des valeurs courantes

L'infocentre sert à prendre des décisions opérationnelles basées sur des valeurs courantes II - II 1ère génération 13 2ème génération : Entrepôt de données / Magasin de données 15 3ème génération OLAP 16 Références Bibliographiques 18 A. 1ère génération Infocentre Tableur Base de données Infocentre

Plus en détail

Fiche de lecture OLAP

Fiche de lecture OLAP Fiche de lecture OLAP NFE107 Urbanisation des Systèmes d Information Karim Sekri Informatique décisionnelle BI, Business Intelligence Système interprétant des données complexes permettant aux dirigeants

Plus en détail

Évaluer les liens entre codage et les données structurées (variables) Introduction au gestionnaire de rapport et au journal de commandes

Évaluer les liens entre codage et les données structurées (variables) Introduction au gestionnaire de rapport et au journal de commandes Trois approches en analyse de texte L'Analyse Qualitative L'analyse de Contenu Quantitative (par dictionnaires) Le forage de texte ("Text Mining") Introduction aux logiciels de Provalis Research QDA Miner

Plus en détail

Programme détaillé des enseignements

Programme détaillé des enseignements Programme détaillé des enseignements SEMESTRE S1 STATISTIQUES Méthodes d'estimation ponctuelle (méthodes des moments, du maximum de vraisemblances, bayésienne) et par intervalles de confiance. Statistiques

Plus en détail

Le parcours pédagogique Sage Business Intelligence. Utilisateur Niv I BO XI 3.0 WebI pour Sage 1000 2 jours

Le parcours pédagogique Sage Business Intelligence. Utilisateur Niv I BO XI 3.0 WebI pour Sage 1000 2 jours Vous êtes Consultant, Chef de Projets, Directeur des Systèmes d Information, Directeur Administratif et Financier, Optez pour les «formations Produits» Nous vous proposons des formations vous permettant

Plus en détail

Utilisations des mathématiques à des fins opérationnelles

Utilisations des mathématiques à des fins opérationnelles Utilisations des mathématiques à des fins opérationnelles Michael Vandenbossche mvn@softcomputing.com Soft Computing 165 avenue de Bretagne 59000 Lille 1. Présentation 2. Indicateurs statistiques de base

Plus en détail

Glossaire Analyse en Composantes Principales (ACP) Analyse Factorielle des Correspondances (AFC) Apprentissage supervisé Apprentissage non supervisé

Glossaire Analyse en Composantes Principales (ACP) Analyse Factorielle des Correspondances (AFC) Apprentissage supervisé Apprentissage non supervisé Glossaire Analyse en Composantes Principales (ACP) : *méthode factorielle (Pearson 1901, Hotelling 1933) permettant de fournir un résumé descriptif (sous forme graphique le plus souvent) d une population

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme

Plus en détail

Data Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.

Data Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto. des des Data Mining Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne 2012-2013 1/65 des des 1 2 des des 3 4 Post-traitement 5 représentation : 6 2/65 des des Définition générale Le

Plus en détail

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems

Plus en détail

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie

Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie Partie I : Séries statistiques descriptives univariées (SSDU) A Introduction Comment se servir de cet ouvrage? Chaque chapitre présente une étape de la méthodologie et tous sont organisés selon le même

Plus en détail

UNIVERSITÉ DE MONTRÉAL DÉPARTEMENT DE SOCIOLOGIE ************* Cours de niveau gradué en méthodes quantitatives *************

UNIVERSITÉ DE MONTRÉAL DÉPARTEMENT DE SOCIOLOGIE ************* Cours de niveau gradué en méthodes quantitatives ************* ************* Cours de niveau gradué en méthodes quantitatives ************* SOL 6210 - Analyse quantitative avancée Le séminaire d analyse quantitative avancée se donne en classe une fois par année. Chaque

Plus en détail

Traitement des données avec EXCEL 2007

Traitement des données avec EXCEL 2007 Traitement des données avec EXCEL 2007 Vincent Jalby Octobre 2010 1 Saisie des données Les données collectées sont saisies dans une feuille Excel. Chaque ligne correspond à une observation (questionnaire),

Plus en détail

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement Introduction Phases du projet Les principales phases du projet sont les suivantes : La mise à disposition des sources Des fichiers Excel sont utilisés pour récolter nos informations L extraction des données

Plus en détail

DU MÉTHODES STATISTIQUES EN SANTÉ (DIPLÔME D UNIVERSITÉ) - UB ISPED

DU MÉTHODES STATISTIQUES EN SANTÉ (DIPLÔME D UNIVERSITÉ) - UB ISPED DU MÉTHODES STATISTIQUES EN SANTÉ (DIPLÔME D UNIVERSITÉ) - UB ISPED Résumé de la formation Type de diplôme : DU Domaine ministériel : Santé Présentation Ce Diplôme d Université (DU) consacré à l enseignement

Plus en détail

Généralités sur les bases de données

Généralités sur les bases de données Généralités sur les bases de données Qu est-ce donc qu une base de données? Que peut-on attendre d un système de gestion de bases de données? Que peut-on faire avec une base de données? 1 Des données?

Plus en détail

La place de SAS dans l'informatique décisionnelle

La place de SAS dans l'informatique décisionnelle La place de SAS dans l'informatique décisionnelle Olivier Decourt ABS Technologies - Educasoft Formations La place de SAS dans l'informatique décisionnelle! L'historique de SAS! La mécanique! La carrosserie

Plus en détail

Filière Licence d études fondamentales «Sciences Economiques et Gestion»

Filière Licence d études fondamentales «Sciences Economiques et Gestion» Filière Licence d études fondamentales «Sciences Economiques et Gestion» Politiquement, de par sa vocation, institution à accès ouvert et délibérément généraliste, la formation en «Sciences Economiques

Plus en détail

Des données à la connaissance client. A la découverte de la plateforme de connaissance client knowlbox

Des données à la connaissance client. A la découverte de la plateforme de connaissance client knowlbox Des données à la connaissance client A la découverte de la plateforme de connaissance client knowlbox Livre blanc mai 2013 A l heure du Big Data, les entreprises s interrogent davantage sur leurs données.

Plus en détail

L analyse des correspondances et ses applications en recherche marketing. MONSUG mai 2015

L analyse des correspondances et ses applications en recherche marketing. MONSUG mai 2015 L analyse des correspondances et ses applications en recherche marketing MONSUG mai 2015 Contenu Mise en contexte et exemple d application L analyse des correspondances multiples (ACM) L ACM et la segmentation

Plus en détail

Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise.

Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise. Solutions PME VIPDev Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise. Cette offre est basée sur la mise à disposition de l ensemble de nos compétences techniques et créatives au service

Plus en détail

PLAN. Les systèmes d'information analytiques. Exemples de décisions

PLAN. Les systèmes d'information analytiques. Exemples de décisions Les systèmes d'information analytiques Dr A.R. Baba-ali Maitre de conferences USTHB PLAN Le cycle de decision Les composants analytiques ETL (Extract, Transform and Load) Entrepot de (Data warehouse) Traitement

Plus en détail

MRK -6081 A : Méthodes d Analyse de Données en Marketing Automne 2010

MRK -6081 A : Méthodes d Analyse de Données en Marketing Automne 2010 E MRK -6081 A : Méthodes d Analyse de Données en Marketing Automne 2010 Professeure :Elissar Toufaily Plage horaire du cours : Cours en salle Jeudi 15h 30-18h30 Local 4221 PAP Du 2 septembre. 2010 au 9

Plus en détail

Le métier de Chargé(e) d Etudes Statistiques

Le métier de Chargé(e) d Etudes Statistiques Le métier de Chargé(e) d Etudes Statistiques Nicolas Cabaj Sommaire Présentation du chargé d études statistiques 3 exemples de missions réalisées: Le scoring, illustré par un outil de détection des fraudes

Plus en détail

Illustration sur un exemple de diverses procédures graphiques et quantitatives.

Illustration sur un exemple de diverses procédures graphiques et quantitatives. Au-delà de l'analyse des correspondances multiples : Illustration sur un exemple de diverses procédures graphiques et quantitatives Yannick Savina Jean-Marc Bernard Laboratoire de Psychologie Environnementale

Plus en détail

Réalisation d'une enquête avec Ethnos Mode Opératoire

Réalisation d'une enquête avec Ethnos Mode Opératoire Réalisation d'une enquête avec Ethnos Mode Opératoire Lancer l'application. Sélectionner le mode «Classic» en cliquant sur l'onglet correspondant dans le menu d'accueil. 1. Saisie du questionnaire l'écran

Plus en détail

Gestion d événements et modulation dynamique de choix sous Sphinx par calcul de contraintes en temps réel.

Gestion d événements et modulation dynamique de choix sous Sphinx par calcul de contraintes en temps réel. Gestion d événements et modulation dynamique de choix sous Sphinx par calcul de contraintes en temps réel. Entreprise ou organisme : ICN Business School Activité de l'entreprise ou de l'organisme : Par

Plus en détail

Restitution. Antoine Lapostolle Ingénieur Avant-Vente Microsoft France

Restitution. Antoine Lapostolle Ingénieur Avant-Vente Microsoft France Restitution Antoine Lapostolle Ingénieur Avant-Vente Microsoft France Fgi was here Restitution: les problématiques Stocker ne suffit, il faut permettre de comprendre et d analyser ces données. Avec des

Plus en détail

Leçon 4 : Typologie des SI

Leçon 4 : Typologie des SI Leçon 4 : Typologie des SI Typologie des SI Système formel Système informel Typologie des SI Chaque jour au sein d une organisation Le système d info stocke, traie ou restitue des quantités importantes

Plus en détail

RICA, Outil d'interrogation et traitements SAS via le Web. Jean-Marc Rousselle Laboratoire d'economie Forestière, UMR INRA-AgroParisTech, NANCY

RICA, Outil d'interrogation et traitements SAS via le Web. Jean-Marc Rousselle Laboratoire d'economie Forestière, UMR INRA-AgroParisTech, NANCY RICA, Outil d'interrogation et traitements SAS via le Web. Jean-Marc Rousselle Laboratoire d'economie Forestière, UMR INRA-AgroParisTech, NANCY 2èmes journées de recherches en sciences sociales INRA SFER

Plus en détail

Motivation : pourquoi exploration de données? Nous nous noyons dans les données, mais manquons cruellement de connaissances

Motivation : pourquoi exploration de données? Nous nous noyons dans les données, mais manquons cruellement de connaissances 1 Introduction Définition et motivations Tâches de data mining (fouille de données, exploration de données) Techniques et algorithmes Exemples et applications 1 Motivation : pourquoi exploration de données?

Plus en détail

CARTE HEURISTIQUE...1 LA CHAÎNE DÉCISIONNELLE...2. Collecte des données...2 Stockage des Données...3 Exploitation des Données...4 OLTP ET OLAP...

CARTE HEURISTIQUE...1 LA CHAÎNE DÉCISIONNELLE...2. Collecte des données...2 Stockage des Données...3 Exploitation des Données...4 OLTP ET OLAP... Table des matières CARTE HEURISTIQUE...1 LA CHAÎNE DÉCISIONNELLE...2 Collecte des données...2 Stockage des Données...3 Exploitation des Données...4 OLTP ET OLAP...6 OPÉRATIONS SUR LES CUBES...7 Exemple

Plus en détail

3. ACM Analyse des Correspondances Multiples

3. ACM Analyse des Correspondances Multiples 3. ACM Analyse des Correspondances Multiples Analyse des Correspondances Multiples - ACM 1 Plan 1. Exemples, problématique 2. Le tableau de données étudié 3. Principe d une ACM 4. L ajustement des deux

Plus en détail

Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation

Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation Data WareHouse Plan Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation 2 Présentation Besoin: prise de décisions

Plus en détail