Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

Dimension: px
Commencer à balayer dès la page:

Download "Christophe CANDILLIER Cours de DataMining mars 2004 Page 1"

Transcription

1 Christophe CANDILLIER Cours de DataMining mars 2004 age 1

2 1. Introduction 2. rocessus du DataMining 3. Analyse des données en DataMining 4. Analyse en Ligne OLA 5. Logiciels 6. Bibliographie Christophe CANDILLIER Cours de DataMining mars 2004 age 2

3 Définition : Ensemble des techniques permettant d'aller puiser des informations pertinentes dans les montagnes de données stockées ces dernières décennies dans les entreprises. Analyse de Données + Bases de Données = Christophe CANDILLIER Cours de DataMining mars 2004 age 3

4 1. Nettoyage des données 3. Transformation des données 4. Définition de l'objectif et de la stratégie 5. Mise en oeuvre des méthodes 6. Test de validation 7. Exploitation des résultats. Analyse de données 3,4,5,7 + 1,,6 = DataMining Christophe CANDILLIER Cours de DataMining mars 2004 age 4

5 révoir marketing: Analyse des stocks et des ventes. Eviter les stocks, vendre à flux tendu. Segmenter marketing: Recherche et ciblage de niches de marché. Définir des types de clients potentiels. Analyser marketing: Analyse des profils des clients. Définir la fidélité potentielle d'un type de client. Définir une offre adaptée à chaque type de client. Christophe CANDILLIER Cours de DataMining mars 2004 age 5

6 Analyser marketing: Analyse des relations. Définir des produits groupés. Analyser production: Suivi en ligne des paramètres de production. Déterminer les facteurs modifiant la qualité. Analyser banques, télécom: Suivi en ligne des comportements. Détection de fraudes. Christophe CANDILLIER Cours de DataMining mars 2004 age 6

7 Optimisation transport: Calcul des circuits de livraison. Diminuer les coûts de transport. Diagnostiquer médecine: Estimation des causes et des conséquences probables des symptômes. Aider au diagnostic des maladies. Christophe CANDILLIER Cours de DataMining mars 2004 age 7

8 Autres : rospection textuelle text mining Veille technologique et collecte automatique d'informations textuelles. Web mining et comportement des internautes. Amélioration d'un site web ersonnalisation d'un site web. Christophe CANDILLIER Cours de DataMining mars 2004 age 8

9 Des volumes considérables de données plusieurs téraoctets : entrepôts de données Data WareHouses Christophe CANDILLIER Cours de DataMining mars 2004 age 9

10 Nettoyage des Données Échantillonnage Analyse de données standard Validation du résultat sur un autre échantillon Lecture artielle ou Résumé Analyse de Données en Ligne : OLA On-Line Analytical rocessing Résultats d'analyse Christophe CANDILLIER Cours de DataMining mars 2004 age 10

11 our enlever les bruits données répétées, doublons. our détecter les anomalies erreurs de saisie, valeurs improbables ou aberrantes. valeurs continues : méthodes statistiques donnant les valeurs minimales et maximales acceptables. valeurs qualitatives : sélection, comparaison à l'aide de tableaux de fréquence. valeurs manquantes :? pas de solution générale Christophe CANDILLIER Cours de DataMining mars 2004 age 11

12 Le plus grand possible ET traitable dans un temps raisonnable Choix aléatoire des individus Un échantillon pour la phase d'apprentissage Un échantillon pour la phase de validation Christophe CANDILLIER Cours de DataMining mars 2004 age 12

13 Dépend de la méthode d'analyse utilisée arfois difficilement faisable ou pas faisable du tout ex : Classification d'individus as forcément utile si l'on fait confiance au résultat Christophe CANDILLIER Cours de DataMining mars 2004 age 13

14 Analyse exploratoire des données, Visualisation Analyses factorielles vues en cours Classifications vues en cours Règles d'associations Arbres de décision Algorithmes génétiques Réseaux bayésiens Réseaux de neurones Christophe CANDILLIER Cours de DataMining mars 2004 age 14

15 But : Identifier des relations entre des variables Techniques utilisées : Examen des distributions de variables Examen des matrices de corrélations Régression linéaire ou non avec 2 ou plus variables Christophe CANDILLIER Cours de DataMining mars 2004 age 15

16 Variable analysée : Revenu Christophe CANDILLIER Cours de DataMining mars 2004 age 16

17 Variables analysées : NB,EF et CA Christophe CANDILLIER Cours de DataMining mars 2004 age 17

18 Variables analysées avec une Cible : ROFcible, TRAN,MENA,REA,SOMM ROF théo = TRAN 0.33 MENA REA SOMM Christophe CANDILLIER Cours de DataMining mars 2004 age 18

19 Une règle d association est une règle du type Si REDICAT alors CONSÉQUENCE Les règles sont caractérisées par deux mesures : Support pop REDICAT et CONSÉQUENCE pop totale pop REDICAT Confiance pop CONSÉQUENCE Choix des Règles : Bonne confiance ex : >70% et Bon support ex : >5% Christophe CANDILLIER Cours de DataMining mars 2004 age 19

20 Exemple, le naufrage du Titanic : la classe premiere, deuxieme, troisieme, equipage le sexe de la personne masculin, feminin l'age adulte, enfant survecu oui, non Christophe CANDILLIER Cours de DataMining mars 2004 age 20

21 Définition : Il ressemble aux règles d'association mais il est ordonné de la variable la plus explicative jusqu'à la moins explicative en fonction de la variable cible. Exemple, le Titanic : prédicat : classe, sexe, age cible : survecu Christophe CANDILLIER Cours de DataMining mars 2004 age 21

22 sexe = male classe = 1st age = adult: no 175.0/57.0 age = child: yes 5.0 classe = 2nd age = adult: no 168.0/14.0 age = child: yes 11.0 classe = 3rd: no 510.0/88.0 classe = crew: no 862.0/192.0 sexe = female classe = 1st: yes 145.0/4.0 classe = 2nd: yes 106.0/13.0 classe = 3rd: no 196.0/90.0 classe = crew: yes 23.0/3.0 classement correct global =79% Christophe CANDILLIER Cours de DataMining mars 2004 age 22

23 But : trouver les quelques bonnes solutions sans évaluer toutes les solutions en imitant la sélection naturelle. Exemple d'application : la recherche de règles d'association n our n variables prédicats : règles possibles pour A,B,C X X A X, B X, C X, A et B X, A et C X, B et C X A et B et C X Christophe CANDILLIER Cours de DataMining mars 2004 age 23

24 Modélisation : Choix du codage des solutions en individus Choix de la fonction d'évaluation des individus Choix de la fonction de croisement des individus Choix de la fonction de mutation des individus Déroulement du processus : 1. Création au hasard des premiers individus 2. Sélection Évaluation 3. Reproduction Croisements / Mutations 4. Si pas terminé Alors retour à l'étape 2 Christophe CANDILLIER Cours de DataMining mars 2004 age 24

25 Exemple : le voyageur de commerce Codage : ordre des villes Évaluation : distance parcourue la plus courte Croisement : Mutation : Inversion Christophe CANDILLIER Cours de DataMining mars 2004 age 25

26 Exemple : le voyageur de commerce 100 villes Christophe CANDILLIER Cours de DataMining mars 2004 age 26

27 Définition : modèle graphique de représentation de la causalité sous forme probabiliste. Intérêts : Déduire les conséquences probables grâce à une partie des causes. Induire depuis les conséquences pour déterminer les causes probables. Inconvénient : Seul un expert peut construire le graphe de causes/conséquences et il faut donner les probabilités Domaines d'application : Diagnostic maladies, pannes Christophe CANDILLIER Cours de DataMining mars 2004 age 27

28 outil de diagnostic : Christophe CANDILLIER Cours de DataMining mars 2004 age 28

29 Exemple : Il a lu robabilité VRAI 0.2 FAUX 0.8 Arrosage robabilité VRAI 0.1 FAUX 0.9 Le jardin du Voisin luie luie est mouillé VRAI FAUX VRAI FAUX Mon ArrosageArrosage Arrosage Arrosage Jardin VRAI VRAI FAUX FAUX Est luie luie luie luie Mouillé VRAI FAUX VRAI FAUX VRAI FAUX Déduction : J / A J / Aet J / Aet J / A J / J / Aet A J / Aet A J / Christophe CANDILLIER Cours de DataMining mars 2004 age 29

30 Christophe CANDILLIER Cours de DataMining mars 2004 age 30 Déduction : Induction : / / / / J A Aet J A Aet J A Aet J A Aet J J / / J A A J J A / / J J J / / J A Aet J J Aet

31 Définition : graphe orienté de neurones se comportant comme une fonction non linéaire donnant les sorties en fonction des entrées. Neurone Réseau de Neurones Fonctionnement : hase d'apprentissage sur des exemples hase d'utilisation Christophe CANDILLIER Cours de DataMining mars 2004 age 31

32 Exemple : détermination du comportement d'un acheteur Inconvénients : Difficulté du choix du modèle de réseau Difficultés de la phase d'apprentissage Quels exemples? Combien? Dans quel ordre? Quand arrêter l'apprentissage? Fiabilité du réseau après l'apprentissage : bon fonctionnement incertain sur les nouveaux cas inconnus! Applications : Reconnaissance écriture, parole Christophe CANDILLIER Cours de DataMining mars 2004 age 32

33 Exemple simple : apprentissage du OU pour un réseau composé d'un seul neurone avec =-1,0,1 Et Sortie=0,1. E1 Sortie E2 Sortie E1, E2 E1 1 E2 2 Essai E1 E2 Résultat 1 2 Sortie Correction 1 Correction 2 A B _+1 0 C _+1 D A B C D Christophe CANDILLIER Cours de DataMining mars 2004 age 33

34 Exemple donnant la fonction XOR non linéaire E1 1 N Sortie N 20,0 N 21,0 N 21,1 E2 N N3 NS NS E1, E2 N1 N3 2 N 2 NS E1, E2 E1 E2 2 E1 E NS0,0 NS1,0 NS11, Christophe CANDILLIER Cours de DataMining mars 2004 age 34

35 rincipe : bénéficier en temps réel d'un tableau de bord donnant les informations souhaitées résumé, dernières variations sur un entrepôt de données. Un système OLA est un tout indissociable entre la structure de données et les analyses OLA : La structure des données détermine les analyses OLA possibles. Les analyses OLA demandées déterminent la structure de données à adopter. Christophe CANDILLIER Cours de DataMining mars 2004 age 35

36 Les analyses se font via un cube de données représentant au maximum trois variables réelles ou synthétiques appelées dimensions. Exemple : Le prix HT d'une vente de chaussures est fonction d'un magasin, d'un mois la date et d'un modèle, son cube est : Christophe CANDILLIER Cours de DataMining mars 2004 age 36

37 La structure de données permettant d'obtenir ce cube et bien d'autres est : Christophe CANDILLIER Cours de DataMining mars 2004 age 37

38 Les variables synthétiques sont définies par des formules. Exemple : avec TVA qui dépend du temps mois, on obtient le cube de TTC : Christophe CANDILLIER Cours de DataMining mars 2004 age 38

39 Les principales différences : Entrepôt Base de données +OLA de données + SQL Visualisation Cubes Tables sélections Exploration Souris Requêtes textes Résumés Oui Non Rapidité Instantané Lent pour résumer Christophe CANDILLIER Cours de DataMining mars 2004 age 39

40 Outils rofessionels : Enterprise Miner de SAS Clementine de SSS DB2 Intelligent Miner d'ibm SAD de Decisia Logiciels Libres : Tanagra R WEKA Christophe CANDILLIER Cours de DataMining mars 2004 age 40

41 Christophe CANDILLIER Cours de DataMining mars 2004 age 41

42 Christophe CANDILLIER Cours de DataMining mars 2004 age 42

43 Sites référençant les logiciels de DataMining : Christophe CANDILLIER Cours de DataMining mars 2004 age 43

44 Livres : Data mining Gestion de la relation client. ersonnalisation de sites Web de René Lefébure, Gilles Venturi Introduction au Data Mining de Michel Jambu Sites Web : Christophe CANDILLIER Cours de DataMining mars 2004 age 44

45 Christophe CANDILLIER Cours de DataMining mars 2004 age 45

Outils Statistiques du Data Mining

Outils Statistiques du Data Mining Outils Statistiques du Data Mining Pr Roch Giorgi roch.giorgi@univ-amu.fr SESSTIM, Faculté de Médecine, Aix-Marseille Université, Marseille, France http://sesstim-orspaca.org http://optim-sesstim.univ-amu.fr

Plus en détail

Analyse de grandes bases de données en santé

Analyse de grandes bases de données en santé .. Analyse de grandes bases de données en santé Alain Duhamel Michaël Genin Mohamed Lemdani EA 2694 / CERIM Master 2 Recherche Biologie et Santé Journée Thématique Fouille de Données Plan. 1 Problématique.

Plus en détail

Analyse de grandes bases de données en santé

Analyse de grandes bases de données en santé .. Analyse de grandes bases de données en santé Alain Duhamel Michaël Genin Mohamed Lemdani EA 2694 / CERIM Master 2 Recherche Biologie et Santé Journée Thématique Fouille de Données Plan. 1 Problématique.

Plus en détail

Introduction au datamining

Introduction au datamining Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des

Plus en détail

Motivation : pourquoi exploration de données? Nous nous noyons dans les données, mais manquons cruellement de connaissances

Motivation : pourquoi exploration de données? Nous nous noyons dans les données, mais manquons cruellement de connaissances 1 Introduction Définition et motivations Tâches de data mining (fouille de données, exploration de données) Techniques et algorithmes Exemples et applications 1 Motivation : pourquoi exploration de données?

Plus en détail

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com Intelligence Artificielle et Systèmes Multi-Agents Badr Benmammar bbm@badr-benmammar.com Plan La première partie : L intelligence artificielle (IA) Définition de l intelligence artificielle (IA) Domaines

Plus en détail

Programme détaillé des enseignements

Programme détaillé des enseignements Programme détaillé des enseignements SEMESTRE S1 STATISTIQUES Méthodes d'estimation ponctuelle (méthodes des moments, du maximum de vraisemblances, bayésienne) et par intervalles de confiance. Statistiques

Plus en détail

INTRODUCTION AU DATA MINING

INTRODUCTION AU DATA MINING INTRODUCTION AU DATA MINING 6 séances de 3 heures mai-juin 2006 EPF - 4 ème année - Option Ingénierie d Affaires et de Projets Bertrand LIAUDET TP DE DATA MINING Le TP et le projet consisteront à mettre

Plus en détail

Module 3 : Introduction à la Modélisation SOUS MODELER

Module 3 : Introduction à la Modélisation SOUS MODELER Module 3 : Introduction à la Modélisation SOUS MODELER 1 Techniques prédictives Passé pour prédire l avenir 2 Concepts de la modélisation Données test / apprentissage Généralement créées par l utilisateur

Plus en détail

Reconnaissance des formes : Classement d ensembles d objets

Reconnaissance des formes : Classement d ensembles d objets Reconnaissance des formes : Classement d ensembles d objets Données Méthodes Extraction de connaissances Applications Expertise Apprentissage Bernard FERTIL Directeur de Recherche CNRS Équipe LXAO, UMR

Plus en détail

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p. STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,

Plus en détail

Table des matières. PREMIÈRE PARTIE Étapes initiales des études marketing 7

Table des matières. PREMIÈRE PARTIE Étapes initiales des études marketing 7 Table des matières Préface Public 1 Structure de l ouvrage 1 Caractéristiques de l ouvrage 3 Contenu 3 Pédagogie 4 Remarques sur l adaptation française 4 Ressources numériques 5 Biographie 6 PREMIÈRE PARTIE

Plus en détail

Le Data Mining, Outil d aide à la prise de décision dans l action commerciale

Le Data Mining, Outil d aide à la prise de décision dans l action commerciale Université Ibn Zohr Faculté des Sciences Juridiques, Économiques et Sociales Exposé sous le thème : Le Data Mining, Outil d aide à la prise de décision dans l action commerciale Plan : Introduction : L

Plus en détail

Dans ce chapitre nous allons étudier une méthode pratique d anti-phishing, ce qui consiste à un système de classification automatique.

Dans ce chapitre nous allons étudier une méthode pratique d anti-phishing, ce qui consiste à un système de classification automatique. I INTRODUCTION Les pages de phishing sont l un des problèmes majeurs de sécurité sur internet. La majorité des attaques utilisent des méthodes sophistiquées comme les fausses pages pour tromper les utilisateurs

Plus en détail

De la donnée à la décision. Sofian MAABOUT LaBRI. Université Bordeaux 1

De la donnée à la décision. Sofian MAABOUT LaBRI. Université Bordeaux 1 De la donnée à la décision Sofian MAABOUT LaBRI. Université Bordeaux 1 1 Décider c est choisir, parmi plusieurs actes possibles, celui qui apparaît comme le plus pertinent pour atteindre un résultat envisagé,

Plus en détail

Analyse de données textuelles Panorama des fonctions, des méthodes et des usages

Analyse de données textuelles Panorama des fonctions, des méthodes et des usages Analyse de données textuelles Panorama des fonctions, des méthodes et des usages Sylvie Dalbin Assistance & Techniques Documentaires DocForum, Le 17 Novembre 2005 Déroulé de l'intervention (1) 1. Définition

Plus en détail

Projet Biométrie. Acquisition et reconnaissance de signatures. RICM 5ème année 2011 / 2012

Projet Biométrie. Acquisition et reconnaissance de signatures. RICM 5ème année 2011 / 2012 RICM 5ème année 2011 / 2012 Projet Biométrie Acquisition et reconnaissance de signatures Renaud Collin - Corentin Foucault - Flavien Garcia - Christophe Havard Thibaud Michel - Aurélie Moiroux Plan 1)

Plus en détail

Formation Actuaire Data-Scientist PROGRAMME

Formation Actuaire Data-Scientist PROGRAMME Formation Actuaire Data-Scientist PROGRAMME 15 Septembre 2014 Arthur Charpentier, Romuald Élie & Jérémie Jakubowicz 15914 Programme Séance inaugurale : révolu-on numérique besoins des entreprises cadre

Plus en détail

Accélérer l agilité de votre site de e-commerce. Cas client

Accélérer l agilité de votre site de e-commerce. Cas client Accélérer l agilité de votre site de e-commerce Cas client L agilité «outillée» devient nécessaire au delà d un certain facteur de complexité (clients x produits) Elevé Nombre de produits vendus Faible

Plus en détail

Méthodes de DM pour la GRC dans les banques

Méthodes de DM pour la GRC dans les banques Techniques de DM pour la GRC dans les banques Page 21 III.1 Introduction Avant de chercher des techniques à appliquer dans la gestion des relations avec les clients. Il faut étudier les données des clients

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme

Plus en détail

SQL SERVER 2008, BUSINESS INTELLIGENCE

SQL SERVER 2008, BUSINESS INTELLIGENCE SGBD / Aide à la décision SQL SERVER 2008, BUSINESS INTELLIGENCE Réf: QLI Durée : 5 jours (7 heures) OBJECTIFS DE LA FORMATION Cette formation vous apprendra à concevoir et à déployer une solution de Business

Plus en détail

L'Intelligence Artificielle pour les développeurs Concepts et implémentations en C#

L'Intelligence Artificielle pour les développeurs Concepts et implémentations en C# Introduction 1. Structure du chapitre 19 2. Définir l intelligence 19 3. L intelligence du vivant 22 4. L intelligence artificielle 23 5. Domaines d application 25 6. Synthèse 27 Systèmes experts 1. Présentation

Plus en détail

WEKA : c est quoi? Brigitte Bigi. 15 février 2011. LPL - Équipe C3I. Brigitte Bigi (LPL - Équipe C3I) WEKA : c est quoi? 15 février 2011 1 / 32

WEKA : c est quoi? Brigitte Bigi. 15 février 2011. LPL - Équipe C3I. Brigitte Bigi (LPL - Équipe C3I) WEKA : c est quoi? 15 février 2011 1 / 32 WEKA : c est quoi? Brigitte Bigi LPL - Équipe C3I 15 février 2011 Brigitte Bigi (LPL - Équipe C3I) WEKA : c est quoi? 15 février 2011 1 / 32 Introduction 1 Introduction 2 Classification supervisée 3 WEKA

Plus en détail

Agenda de la présentation

Agenda de la présentation Le Data Mining Techniques pour exploiter l information Dan Noël 1 Agenda de la présentation Concept de Data Mining ou qu est-ce que le Data Mining Déroulement d un projet de Data Mining Place du Data Mining

Plus en détail

Filière Data Mining (Fouille de données) Pierre Morizet-Mahoudeaux

Filière Data Mining (Fouille de données) Pierre Morizet-Mahoudeaux Filière Data Mining (Fouille de données) Pierre Morizet-Mahoudeaux Plan Objectifs Débouchés Formation UVs spécifiques UVs connexes Enseignants et partenaires Structure générale des études à l UTC Règlement

Plus en détail

Initiation à la fouille de données et à l apprentissage automatiq

Initiation à la fouille de données et à l apprentissage automatiq Initiation à la fouille de données et à l apprentissage automatique 1 Laboratoire d Informatique Fondamentale de Marseille Université de Provence christophe.magnan@lif.univ-mrs.fr www.lif.univ-mrs.fr/

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

2.1. Les stades d évolution de la fonction de Supply Chain Management 7 2.2. L intégration horizontale des fonctions de l entreprise 12

2.1. Les stades d évolution de la fonction de Supply Chain Management 7 2.2. L intégration horizontale des fonctions de l entreprise 12 Table des matières Avant-propos 3 Introduction 1. L entreprise et l environnement financier...5 2. Le concept traditionnel...6 2.1. Les stades d évolution de la fonction de Supply Chain Management 7 2.2.

Plus en détail

Séance 12: Algorithmes de Support Vector Machines

Séance 12: Algorithmes de Support Vector Machines Séance 12: Algorithmes de Support Vector Machines Laboratoire de Statistique et Probabilités UMR 5583 CNRS-UPS www.lsp.ups-tlse.fr/gadat Douzième partie XII Algorithmes de Support Vector Machines Principe

Plus en détail

ERP & Processus. lacreuse@unistra.fr

ERP & Processus. lacreuse@unistra.fr ERP & Processus Métiers lacreuse@unistra.fr Processus : «Système d activités qui utilise des ressources pour transformer des éléments d entrée en résultat» Iso9000 Approche par processus Axes de modélisation

Plus en détail

L'Intelligence Artificielle pour les développeurs Concepts et implémentations en Java

L'Intelligence Artificielle pour les développeurs Concepts et implémentations en Java Avant-propos 1. Objectifs du livre 15 2. Public et prérequis 15 3. Structure du livre 16 4. Code en téléchargement 18 Introduction 1. Présentation du chapitre 19 2. Définir l intelligence 19 3. L intelligence

Plus en détail

L ANALYSE DES DONNÉES CLIENTS AU SERVICE DE LA PRÉVISION D ACHAT DE VOYAGES

L ANALYSE DES DONNÉES CLIENTS AU SERVICE DE LA PRÉVISION D ACHAT DE VOYAGES L ANALYSE DES DONNÉES CLIENTS AU SERVICE DE LA PRÉVISION D ACHAT DE VOYAGES SAS 3 DEC 2015 1 sur 9 TRANSAT Un voyagiste international solidement installé au Canada, en France et au Royaume-Uni, qui offre

Plus en détail

Construction à partir d une régression logistique

Construction à partir d une régression logistique Construction à partir d une régression logistique Ricco RAKOTOMALALA Université Lumière Lyon 2 Tutoriels Tanagra - http://tutoriels-data-mining.blogspot.fr/ 1 PLAN 1. Position du problème Grille de score?

Plus en détail

Leçon 4 : Typologie des SI

Leçon 4 : Typologie des SI Leçon 4 : Typologie des SI Typologie des SI Système formel Système informel Typologie des SI Chaque jour au sein d une organisation Le système d info stocke, traie ou restitue des quantités importantes

Plus en détail

COURS DE STATISTIQUES (24h)

COURS DE STATISTIQUES (24h) COURS DE STATISTIQUES (24h) Introduction Statistiques descriptives (4 h) Rappels de Probabilités (4 h) Echantillonnage(4 h) Estimation ponctuelle (6 h) Introduction aux tests (6 h) Qu est-ce que la statistique?

Plus en détail

Statistique et analyse de données pour l assureur : des outils pour la gestion des risques et le marketing

Statistique et analyse de données pour l assureur : des outils pour la gestion des risques et le marketing Statistique et analyse de données pour l assureur : des outils pour la gestion des risques et le marketing Gilbert Saporta Chaire de Statistique Appliquée, CNAM ActuariaCnam, 31 mai 2012 1 L approche statistique

Plus en détail

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring ESSEC Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring Les méthodes d évaluation du risque de crédit pour les PME et les ménages Caractéristiques Comme les montants des crédits et des

Plus en détail

" # $ % % & ' ( ) * +,! '()*+ *, + ' +' + ' ' -+ - +.+. /0 / 1 0 12 1 1 2 34+ 4 1 +. 50 5 * 0 4 * 0 6! "##$ % &!

 # $ % % & ' ( ) * +,! '()*+ *, + ' +' + ' ' -+ - +.+. /0 / 1 0 12 1 1 2 34+ 4 1 +. 50 5 * 0 4 * 0 6! ##$ % &! "# $ %%& ' ( )*+, '()*+,'+''-++.+/0112134+1.50*406 "##$ %& 8CC "#$%& ' ( )* +,-./ 0 123 456+7 3 7-55-89.*/ 0 +3 *+:3 ;< =3 3-3 8 0 23 >-8-3 >5? //*/*0;* @A: *53,,3 / * $/ >B+? - 5, 2 34*56 7 /+#** //8

Plus en détail

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours Information du cours Informatique décisionnelle et data mining www.lia.univ-avignon.fr/chercheurs/torres/cours/dm Juan-Manuel Torres juan-manuel.torres@univ-avignon.fr LIA/Université d Avignon Cours/TP

Plus en détail

INTRODUCTION AU DATA MINING. Cina MOTAMED

INTRODUCTION AU DATA MINING. Cina MOTAMED INTRODUCTION AU DATA MINING Cina MOTAMED 2 Data Mining : contexte Âge numérique : explosion des volumes de données Transactions commerciales Opérations bancaires Navigation Internet Indicateurs démographiques

Plus en détail

La problématique. La philosophie ' ) * )

La problématique. La philosophie ' ) * ) La problématique!" La philosophie #$ % La philosophie &'( ' ) * ) 1 La philosophie +, -) *. Mise en oeuvre Data warehouse ou Datamart /01-2, / 3 13 4,$ / 5 23, 2 * $3 3 63 3 #, 7 Datawarehouse Data warehouse

Plus en détail

Heidi WECHTLER. Octobre 2005

Heidi WECHTLER. Octobre 2005 Heidi WECHTLER Le support aux analyses de données Séminaire GREGOR Octobre 2005 Support aux analyse de données du GREGOR Le poste Chargée d étude statistiques au GREGOR, bureau B126 (wechtler.iae@univ-paris1.fr)

Plus en détail

INTERNATIONAL CHAIR IN MATHEMATICAL PHYSICS AND APPLICATIONS (ICMPA) UNESCO CHAIR IN MATHEMATICAL PHYSICS AND APPLICATIONS

INTERNATIONAL CHAIR IN MATHEMATICAL PHYSICS AND APPLICATIONS (ICMPA) UNESCO CHAIR IN MATHEMATICAL PHYSICS AND APPLICATIONS INTERNATIONAL CHAIR IN MATHEMATICAL PHYSICS AND APPLICATIONS (ICMPA) UNESCO CHAIR IN MATHEMATICAL PHYSICS AND APPLICATIONS established in 2006 at the University of Abomey-Calavi (Republic of Benin) UNITWIN/UNESCO

Plus en détail

Cybermarché et analyse comportementale

Cybermarché et analyse comportementale Cybermarché et analyse comportementale Antoine-Eric Sammartino aesammartino@e-laser.fr Séminaire Data Mining - Educasoft Formations 18 juin 2001-1- MENU Le Groupe LaSer Le processus Data Mining L industrialisation

Plus en détail

Le Data Mining Techniques pour exploiter l information. Auteur : Dan Noël Date : 24.04.2009

Le Data Mining Techniques pour exploiter l information. Auteur : Dan Noël Date : 24.04.2009 Le Data Mining Techniques pour exploiter l information Auteur : Dan Noël Date : 24.04.2009 Agenda de la présentation du 26.03.2009 Concept de Data Mining ou qu est-ce que le Data Mining Déroulement d un

Plus en détail

Semestre 1. Volume horaire hebdomadaire. Cours TD TP T.Perso. Total. Calcul de Probabilité 3 1,5 1,5 6 84 2. Introduction à l Economie 1,5 1,5 3 42 2

Semestre 1. Volume horaire hebdomadaire. Cours TD TP T.Perso. Total. Calcul de Probabilité 3 1,5 1,5 6 84 2. Introduction à l Economie 1,5 1,5 3 42 2 3ème Année Semestre 1 N MODULES MATIERES Volume horaire hebdomadaire Cours TD TP T.Perso. Total Volume horaire semestriel (14 semaines) Coefficients Régime d'examen 1 Modèle Probabiliste 1,5 1,5 1,5 4,5

Plus en détail

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP)

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP) Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP) Définition (G. Gardarin) Entrepôt : ensemble de données historisées variant

Plus en détail

L'infocentre sert à prendre des décisions opérationnelles basées sur des valeurs courantes

L'infocentre sert à prendre des décisions opérationnelles basées sur des valeurs courantes II - II 1ère génération 13 2ème génération : Entrepôt de données / Magasin de données 15 3ème génération OLAP 16 Références Bibliographiques 18 A. 1ère génération Infocentre Tableur Base de données Infocentre

Plus en détail

TP DE DATA MINING 2 : MODELISATION AVEC SPSS CLEMENTINE

TP DE DATA MINING 2 : MODELISATION AVEC SPSS CLEMENTINE TP DE DATA MINING 2 : MODELISATION AVEC SPSS CLEMENTINE EPF 4/ 5 ème année - Option Ingénierie d Affaires et de Projets - Finance Bertrand LIAUDET TP n 2 de DATA MINING : Modélisation 1 Jeu de données

Plus en détail

Discrétisation et génération de hiérarchies de concepts

Discrétisation et génération de hiérarchies de concepts Prétraitement des données 1 Pourquoi prétraiter les données? Nettoyage des données Intégration et transformation Réduction des données Discrétisation et génération de hiérarchies de g concepts Pourquoi

Plus en détail

Les Réseaux de Neurones avec

Les Réseaux de Neurones avec Les Réseaux de Neurones avec Au cours des deux dernières décennies, l intérêt pour les réseaux de neurones s est accentué. Cela a commencé par les succès rencontrés par cette puissante technique dans beaucoup

Plus en détail

L informatique des entrepôts de données

L informatique des entrepôts de données L informatique des entrepôts de données Daniel Lemire SEMAINE 13 L exploration des données 13.1. Présentation de la semaine L exploration de données (ou data mining) est souvent associée à l intelligence

Plus en détail

Filière Data Mining (Fouille de données) Pierre Morizet-Mahoudeaux

Filière Data Mining (Fouille de données) Pierre Morizet-Mahoudeaux Filière Data Mining (Fouille de données) Pierre Morizet-Mahoudeaux Plan Motivations Débouchés Formation UVs spécifiques UVs connexes Enseignants et partenaires Motivations de la filière fouille de données

Plus en détail

Heuristique et métaheuristique. 8. Optimisation combinatoire et métaheuristiques. Optimisation combinatoire. Problème du voyageur de commerce

Heuristique et métaheuristique. 8. Optimisation combinatoire et métaheuristiques. Optimisation combinatoire. Problème du voyageur de commerce Heuristique et métaheuristique IFT1575 Modèles de recherche opérationnelle (RO) 8. Optimisation combinatoire et métaheuristiques Un algorithme heuristique permet d identifier au moins une solution réalisable

Plus en détail

Data Mining. Exposés logiciels, systèmes et réseaux. Damien Jubeau IR3 Lundi 19 novembre 2012

Data Mining. Exposés logiciels, systèmes et réseaux. Damien Jubeau IR3 Lundi 19 novembre 2012 Data Mining Exposés logiciels, systèmes et réseaux. Damien Jubeau IR3 Lundi 19 novembre 2012 2 Plan Data mining : définition, utilisations et concepts Wolfram Alpha : extraction de données d'un compte

Plus en détail

Action de formation: SQL Server Business Intelligence & Data Warehouse

Action de formation: SQL Server Business Intelligence & Data Warehouse Action de formation: SQL Server Business Intelligence & Data Warehouse Contenu : Integration Services Présentation de Management Studio - Présenter les différentes tâches de SSMS - Structure des serveurs

Plus en détail

PLAN. Les systèmes d'information analytiques. Exemples de décisions

PLAN. Les systèmes d'information analytiques. Exemples de décisions Les systèmes d'information analytiques Dr A.R. Baba-ali Maitre de conferences USTHB PLAN Le cycle de decision Les composants analytiques ETL (Extract, Transform and Load) Entrepot de (Data warehouse) Traitement

Plus en détail

Améliorer les performances du site par l'utilisation de techniques de Web Mining

Améliorer les performances du site par l'utilisation de techniques de Web Mining Améliorer les performances du site par l'utilisation de techniques de Web Mining CLUB SAS 2001 17/18 octobre 2001 Stéfan Galissie LINCOLN stefan.galissie@lincoln.fr contact@web-datamining.net 2001 Sommaire

Plus en détail

Le data mining et l assurance Mai 2004. Charles Dugas Président Marianne Lalonde Directrice, développement des affaires

Le data mining et l assurance Mai 2004. Charles Dugas Président Marianne Lalonde Directrice, développement des affaires Le data mining et l assurance Mai 2004 Charles Dugas Président Marianne Lalonde Directrice, développement des affaires AGENDA Qu est-ce que le data mining? Le projet et les facteurs de réussite Les technologies

Plus en détail

Business Intelligence

Business Intelligence Business Intelligence Enjeux, Projets, Données, Indicateurs Gilles FONTANINI g.fontanini@decision-network.eu +33 (0)6 11 21 24 53 2? Gilles Fontanini Consultant et Administrateur d un GIE d experts en

Plus en détail

Les techniques d exploitation de données (Data Mining)

Les techniques d exploitation de données (Data Mining) Les techniques d exploitation de données (Data Mining) 1 Présenté par : Emer Mestiri, M.sc Finance, Data Scientist Conseiller Gestion de risque de crédit, Mouvement Desjardins Sommaire 2 I. Logiciel SAS

Plus en détail

Cours Fouille de données avancée

Cours Fouille de données avancée Ministère de l Enseignement Supérieur et de la Recherche Scientifique Université Mohamed Khider - Biskra Faculté des Sciences Exactes et des Sciences de la Nature et de la Vie Département d Informatique

Plus en détail

Logiciel QDA Miner. Deuxième partie Gestion du livre des codes et codage manuel

Logiciel QDA Miner. Deuxième partie Gestion du livre des codes et codage manuel PLAN DE COURS «ANALYSE DE DONNEES TEXTUELLES» Trois approches pour l analyse de textes Analyse qualitative Analyse quantitative Fouille de textes Introduction au logiciel QDA Miner Introduction et gestion

Plus en détail

Apprentissage Automatique

Apprentissage Automatique Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs

Plus en détail

Comment ne pas construire un score-titanic

Comment ne pas construire un score-titanic Comment ne pas construire un score-titanic Mon mailing Olivier Decourt ABS Technologies / Educasoft Formations 1- Les principes 2- Un premier exemple : les vins de France 3- Mise en œuvre sous SAS 4- Un

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

Business Intelligence - Introduction

Business Intelligence - Introduction Le cours Business Intelligence - Introduction Olivier Schwander UPMC 1 / 45 Le cours Organisation du cours http://www-connex.lip6.fr/~schwander/enseignement/ 2015-2016/m2stat_bi/

Plus en détail

Informatique Décisionnelle pour l environnement

Informatique Décisionnelle pour l environnement Territoires, Environnement, Télédétection et Information Spatiale Unité mixte de recherche AgroParisTech - Cirad - Irstea Informatique Décisionnelle pour l environnement Principe, architecture informatique

Plus en détail

SOMMAIRE. Présentation 3. Marketing de l offre 15 Marketing de la demande 16 Marketing de l échange 16

SOMMAIRE. Présentation 3. Marketing de l offre 15 Marketing de la demande 16 Marketing de l échange 16 Présentation 3 Chapitre 1 Le concept de marketing 15 1 Définitions 15 Marketing de l offre 15 Marketing de la demande 16 Marketing de l échange 16 2 Principaux outils du marketing 16 3 Les critiques envers

Plus en détail

OPTIMISATION DE LA TARIFICATION DES RÉSEAUX MOBILES

OPTIMISATION DE LA TARIFICATION DES RÉSEAUX MOBILES OPTIMISATION DE LA TARIFICATION DES RÉSEAUX MOBILES ST50 - Projet de fin d études Matthieu Leromain - Génie Informatique Systèmes temps Réel, Embarqués et informatique Mobile - REM 1 Suiveur en entreprise

Plus en détail

QU EST-CE QUE LE DECISIONNEL?

QU EST-CE QUE LE DECISIONNEL? La plupart des entreprises disposent d une masse considérable d informations sur leurs clients, leurs produits, leurs ventes Toutefois ces données sont cloisonnées par les applications utilisées ou parce

Plus en détail

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems

Plus en détail

Les méthodes d optimisation appliquées à la conception de convertisseurs électromécaniques. Elec 2311 : S7

Les méthodes d optimisation appliquées à la conception de convertisseurs électromécaniques. Elec 2311 : S7 Les méthodes d optimisation appliquées à la conception de convertisseurs électromécaniques Elec 2311 : S7 1 Plan du cours Qu est-ce l optimisation? Comment l optimisation s intègre dans la conception?

Plus en détail

Offre de formation de troisième cycle (LMD)

Offre de formation de troisième cycle (LMD) Offre de formation de troisième cycle (LMD) (Arrêté n 250 du 28 juillet 2009, fixant l organisation de la formation de troisième en vue de l obtention du diplôme de doctorat) Etablissement Faculté / Institut

Plus en détail

Apprentissage statistique Stratégie du Data-Mining

Apprentissage statistique Stratégie du Data-Mining Apprentissage statistique Stratégie du Data-Mining Hélène Milhem Institut de Mathématiques de Toulouse, INSA Toulouse, France IUP SID, 2011-2012 H. Milhem (IMT, INSA Toulouse) Apprentissage statistique

Plus en détail

Système d information Exploitation des bases de données Rapport d audit permanent

Système d information Exploitation des bases de données Rapport d audit permanent www.coopami.org Système d information Exploitation des bases de données Rapport d audit permanent BRUXELLES 24 octobre 2013 Michel Vigneul Conseiller Actuaire PARTIE 1 Système d information Qu est-ce qu

Plus en détail

FAITES DE LA DONNÉE LE MOTEUR DE VOTRE BUSINESS. Alexandre Vasseur Responsable Avant-Vente Europe du Sud Pivotal, EMC

FAITES DE LA DONNÉE LE MOTEUR DE VOTRE BUSINESS. Alexandre Vasseur Responsable Avant-Vente Europe du Sud Pivotal, EMC FAITES DE LA DONNÉE LE MOTEUR DE VOTRE BUSINESS Alexandre Vasseur Responsable Avant-Vente Europe du Sud Pivotal, EMC 1 Big Data = Volume, Variété, Vélocité et Valorisation Internet des objets Informations

Plus en détail

Sommaire. Liste des Abréviations...13 Avant-Propos...15

Sommaire. Liste des Abréviations...13 Avant-Propos...15 Sommaire Liste des Abréviations...13 Avant-Propos...15 Partie 1 Gestion de la Qualité des Données (GQD) de votre clientèle...17 1.1. Introduction...19 1.2. Utilité de cette gestion...21 1.3. Mise sur pied

Plus en détail

IUT STID, 1 ère année Découverte de logiciels statistiques Prise en main du logiciel SPAD

IUT STID, 1 ère année Découverte de logiciels statistiques Prise en main du logiciel SPAD Université de Perpignan - IUT de Carcassonne Vivien ROSSI Année 2006/2007 IUT STID, 1 ère année Découverte de logiciels statistiques Prise en main du logiciel SPAD Ce document est tiré du site : http ://www.stat.ucl.ac.be/ispersonnel/lecoutre/stats/spad/

Plus en détail

Projet informatique «Voyageur de commerce» Résolution approchée par algorithme génétique du problème du voyageur de commerce

Projet informatique «Voyageur de commerce» Résolution approchée par algorithme génétique du problème du voyageur de commerce Année 2007-2008 Projet informatique «Voyageur de commerce» Résolution approchée par algorithme génétique du problème du voyageur de commerce B. Monsuez Projet informatique «Voyageur de commerce» Résolution

Plus en détail

Journée de rencontres ANSES - IGN - INA - Labex Bézout

Journée de rencontres ANSES - IGN - INA - Labex Bézout Journée de rencontres ANSES - IGN - INA - Labex Bézout Présentation du LAMA Stéphane Sabourau 3 mars 2014 Présentation générale Le Laboratoire d Analyse et Mathématiques Appliquées (LAMA) est composé de

Plus en détail

Introduction à Business Objects. J. Akoka I. Wattiau

Introduction à Business Objects. J. Akoka I. Wattiau Introduction à Business Objects J. Akoka I. Wattiau Introduction Un outil d'aide à la décision accès aux informations stockées dans les bases de données et les progiciels interrogation génération d'états

Plus en détail

SCI03 - Analyse de données expérimentales

SCI03 - Analyse de données expérimentales SCI03 - Analyse de données expérimentales Introduction à la statistique Thierry Denœux 1 1 Université de Technologie de Compiègne tél : 44 96 tdenoeux@hds.utc.fr Automne 2014 Qu est ce que la statistique?

Plus en détail

Le géomarketing - Page 1 sur 7

Le géomarketing - Page 1 sur 7 Le géomarketing - Page 1 sur 7 LES DOSSIERS MADWATCH.net méthodes Le Géomarketing Novembre 2003 Nb de pages : 7 Le géomarketing - Page 2 sur 7 Créé dans les années 80, la plupart des applications du géomarketing

Plus en détail

GIND5439 Systèmes Intelligents. Septembre 2004

GIND5439 Systèmes Intelligents. Septembre 2004 GIND5439 Systèmes Intelligents Septembre 2004 Contenu du cours Introduction aux systèmes experts Intelligence artificielle Représentation des connaissances Acquisition de connaissances Systèmes à base

Plus en détail

Analyse multivariée approfondie

Analyse multivariée approfondie Analyse multivariée approfondie Enseignants: NIANG N. et RUSSOLILLIO G. Maître de conférences Statistique Appliquée Laboratoire CEDRIC CNAM http://www.cnam.fr et d autres intervenants extérieurs au Cnam

Plus en détail

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données et le Data Mining Nous suivons le plan suivant : Fonctionnement de Spad Catalogue des méthodes (statistiques

Plus en détail

Big Data et Marketing : les competences attendues

Big Data et Marketing : les competences attendues Big Data et Marketing : les competences attendues Laurence Fiévet Responsable Marketing Corporate Oney Banque Accord LA DYNAMIQUE DU MARKETING Selon la définition de Kotler et Dubois, «Le marketing est

Plus en détail

UTFPR. Nada Benlahbib. [DATA MINING] Fertility Data Set

UTFPR. Nada Benlahbib. [DATA MINING] Fertility Data Set UTFPR [DATA MINING] Fertility Data Set Sommaire Introduction... 2 1. Description de la base de données... 3 1.1. Origine de la base... 3 1.2. Description des attributs... 3 1.3. Exploration des données...

Plus en détail

CRÉER UN COURS EN LIGNE

CRÉER UN COURS EN LIGNE Anne DELABY CRÉER UN COURS EN LIGNE Deuxième édition, 2006, 2008 ISBN : 978-2-212-54153-3 2 Que recouvre le concept d interactivité? Dans une perspective de cours en ligne, une activité interactive est

Plus en détail

Spécificités, Applications et Outils

Spécificités, Applications et Outils Spécificités, Applications et Outils Ricco Rakotomalala Université Lumière Lyon 2 Laboratoire ERIC Laboratoire ERIC 1 Ricco Rakotomalala ricco.rakotomalala@univ-lyon2.fr http://chirouble.univ-lyon2.fr/~ricco/data-mining

Plus en détail

L Intelligence Artificielle

L Intelligence Artificielle L Intelligence Artificielle pour les développeurs Concepts et implémentations en C# Virginie MATHIVET Table des matières 1 Les exemples à télécharger sont disponibles à l'adresse suivante : http://www.editions-eni.fr

Plus en détail

Entreposage, analyse en ligne et fouille de données

Entreposage, analyse en ligne et fouille de données Entreposage, analyse en ligne et fouille de données Houssem Jerbi IRIT - SIG/ED jerbi@irit.fr Journée COMPIL " Bases de Données" 14/12/2010 PLAN Introduction Bases de données Entrepôt de données Technologie

Plus en détail

Apprentissage par exploration

Apprentissage par exploration Apprentissage par exploration 1/32 Introduction Méthode particulière d acquisition de connaissance : apprentissage artificiel, à partir d induction. obtention des connaissances à partir d exemples. On

Plus en détail

Préparation des données. Auteur : Dan Noël Date : 24.04.2009

Préparation des données. Auteur : Dan Noël Date : 24.04.2009 Préparation des données Auteur : Dan Noël Date : 24.04.2009 Objectifs du module Comprendre les données et passer en revue les étapes principales de la préparation des données afin de maximiser la performance

Plus en détail

GOUTTE. Analyse Statistique des Données Cours 8. Master 2 EID. LUISS, Libera Università Internazionale degli Studi Sociali

GOUTTE. Analyse Statistique des Données Cours 8. Master 2 EID. LUISS, Libera Università Internazionale degli Studi Sociali LUISS, Libera Università Internazionale degli Studi Sociali Université Paris 13 Laboratoire Analyse, Géométrie et Applications UMR 7539 GOUTTE Analyse Statistique des Données Cours 8 Master 2 EID goutte@math.univ-paris13.fr

Plus en détail

Cours IFT6266, Exemple d application: Data-Mining

Cours IFT6266, Exemple d application: Data-Mining Cours IFT6266, Exemple d application: Data-Mining Voici un exemple du processus d application des algorithmes d apprentissage statistique dans un contexte d affaire, qu on appelle aussi data-mining. 1.

Plus en détail

Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining.

Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining. 2 jours : Mardi 15 et mercredi 16 novembre 2005 de 9 heures 30 à 17 heures 30 Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining. Madame, Monsieur, On parle

Plus en détail

Estimation et tests statistiques, TD 5. Solutions

Estimation et tests statistiques, TD 5. Solutions ISTIL, Tronc commun de première année Introduction aux méthodes probabilistes et statistiques, 2008 2009 Estimation et tests statistiques, TD 5. Solutions Exercice 1 Dans un centre avicole, des études

Plus en détail