Analyse de grandes bases de données en santé

Dimension: px
Commencer à balayer dès la page:

Download "Analyse de grandes bases de données en santé"

Transcription

1 .. Analyse de grandes bases de données en santé Alain Duhamel Michaël Genin Mohamed Lemdani EA 2694 / CERIM Master 2 Recherche Biologie et Santé Journée Thématique Fouille de Données

2 Plan. 1 Problématique. 2 Knowledge Data Discovery Phase 1 Phase 2. 3 Programme de la Journée Thématique A. Duhamel, M. Genin, M. Lemdani Analyse de Grandes BDD en Santé Version - 19 février / 18

3 Problématique Problématique Développement des outils informatiques et des NTIC Augmentation très importante du nombre et de la taille des BDD en Santé : SIH (séjours), BDD médicales (MICI, nutrition), épidémiologiques (prisons) = gisements de données Nécessité de disposer de méthodes efficaces pour L exploitation (requêtes simples,... ) mais aussi La découverte (extraction) de connaissances La valorisation des connaissances extraites pour l aide à la décision Techniques de la statistique inférentielle classique insuffisantes (multiplication des tests, des croisements,... ) Méthodologie d extraction de connaissances à partir de bases de données (KDD) (milieu 90 - Fayyad) A. Duhamel, M. Genin, M. Lemdani Analyse de Grandes BDD en Santé Version - 19 février / 18

4 Knowledge Data Discovery Knowledge Data Discovery KDD = Knowledge Data Discovery = Extraction de connaissances à partir de bases de données Processus permettant la découverte, à partir de Base De Données (BDD), de connaissances auparavant inconnues et potentiellement utiles pour la prise de décision (Fayyad) Méthodologie différente de l étude de recherche classique Etude classique : prospectif, un objectif principal, données recueillies pour y répondre KDD souvent rétrospectif = on travaille sur une BDD existante Domaine de recherche inter disciplinaire KDD largement utilisé en marketing, grandes distributions, banques,... A. Duhamel, M. Genin, M. Lemdani Analyse de Grandes BDD en Santé Version - 19 février / 18

5 Knowledge Data Discovery Knowledge Data Discovery KDD encore plus difficile à utiliser pour l analyse des BDD cliniques Nature des données : valeurs aberrantes, valeurs manquantes, différents types de variables Nécessité d une validation à chaque étape du processus Nécessité de modèles explicatifs Expertise rare et coûteuse A. Duhamel, M. Genin, M. Lemdani Analyse de Grandes BDD en Santé Version - 19 février / 18

6 Knowledge Data Discovery Phase 1 Phase 2 Phase 3 BDD Existante Données ne.oyées Fouille de données Valorisa6on des résultats ACTIONS 3 phases principales : Phase 1 : pré traitement des données (80% du temps du projet) Phase 2 : extraction de connaissances (fouille de données ou data mining) : procédures dérivées des statistiques, de l informatique et de l ntelligence artificielle Phase 3 : valorisation des connaissances extraites : prise de décision A. Duhamel, M. Genin, M. Lemdani Analyse de Grandes BDD en Santé Version - 19 février / 18

7 Knowledge Data Discovery Phase 1 KDD - Phase 1 Objectifs du projet Plan d analyse Sélection des données Type de données Pré traitement ( garbage in garbage out ) Valeurs aberrantes Méthodes univariés : boxplot,... Méthodes multivariées : Analyses en Composantes Principales (ACP), Classifications,... Cohérence des données : homme et grossesse! Méthodes statistiques (supra) Règles logiques : expertise SI traitement par voie orale et âge début diabète > 30 ans et BMI > 25 ALORS type diabète =2 (2% des dossiers corrigés) Gestion de données manquantes A. Duhamel, M. Genin, M. Lemdani Analyse de Grandes BDD en Santé Version - 19 février / 18

8 Knowledge Data Discovery Phase 1 KDD - Phase 1 Pré traitement : +++ Gestion des données manquantes Fréquemment : valeurs manquantes sur de nombreuses variables Domaine de recherche en Statistique Comment faire des analyses multivariées? (exemple : régressions) Travaux fondamentaux : Rubin, Little, Schafer Très important d utiliser ces méthodes modernes (Rubin) Dans cette JT : présentation des principales méthodes de gestion des données manquantes A. Duhamel, M. Genin, M. Lemdani Analyse de Grandes BDD en Santé Version - 19 février / 18

9 Knowledge Data Discovery Phase 2 KDD - Phase 2 : Datamining Data mining : méthodes multi-disciplinaires Méthodes statistiques Méthodes descriptives : Classifications, analyse en composantes principales, analyses factorielles Modélisation : régression, discrimination Méthodes informatiques Règles d associations Algorithmes génétiques : boîte noire Méthodes statistiques et informatiques Arbres de décisions Méthodes dérivées de l intelligence artificielle Réseaux de neurones : boîte noire Réseaux bayésiens : boîte noire Méthode de base de données (entrepôts de données data warehouse) A. Duhamel, M. Genin, M. Lemdani Analyse de Grandes BDD en Santé Version - 19 février / 18

10 Knowledge Data Discovery Phase 2 KDD - Phase 2 : Datamining Certaines méthodes existent depuis de nombreuses années : Classifications (Fischer : 1936,..., Diday 1979,... ) Arbres de décision : Hunt 1966 Réseaux de neurones : perceptron de Rosenblat, 1961 Nouveautés Développement de nouveaux outils (règles d association) Regrouper les méthodes, les outils pour les 3 phases : pré traitement, extraction de connaissances, valorisation A. Duhamel, M. Genin, M. Lemdani Analyse de Grandes BDD en Santé Version - 19 février / 18

11 Knowledge Data Discovery Phase 2 KDD - Phase 2 : Datamining Méthodes utilisées depuis plusieurs années en marketing, banques, grande distribution... Logiciels disponibles : Mineset (Silicon Graphics) SAS (entreprise miner) Prix exhorbitants SPSS Modeler R, SIPINA, TANAGRA, CBA,... Gratuits ou prix universitaires Principales méthodes dans le domaine médical : Règles d association, (présentation succincte) Arbres de décision, Classifications (clusters) A. Duhamel, M. Genin, M. Lemdani Analyse de Grandes BDD en Santé Version - 19 février / 18

12 Knowledge Data Discovery Phase 2 KDD - Phase 2 : Datamining - Règles d association Une règle d association est une règle du type : Si A et B alors C Identification automatique = algorithme d Agrawal (1993) pour l analyse du panier de la ménagère Exemple : SI achat couche culotte ET achat samedi ALORS achat bière Règles d association caractérisées différentes mesures : Le support : P(A et B et C) (= fréquence) La confiance : P(C/A et B) (= probabilité conditionnelle) L amélioration : P(C/A et B)/P(C)... Pas nécessairement de variable à expliquer et d ordre de priorité entre les variables. Méthode adaptée aux gros volumes de données et à un nombre important de variables A. Duhamel, M. Genin, M. Lemdani Analyse de Grandes BDD en Santé Version - 19 février / 18

13 Knowledge Data Discovery Phase 2 KDD - Phase 2 : Datamining - Règles d association Attention au paramétrage du support et confiance minimum ET au nombre de variables Nombre élevé de règles générées! Exemple 1 : DIABCARE = programme européen d évaluation du suivi des diabétiques (type 2) patients, 51 variables règles (support=10%, confiance=60%) Exemple 2 : 12 variables dont complication de St Vincent (s=10%, c=60%) Nombre de Règles : 943 Exemples de Règle : SI cholestérol>5,2mmol/l ET diabète de type 2 ALORS présence d angor (support = 31,6%, confiance=71.89%) Logiciels libres : Tanagra, R,... A. Duhamel, M. Genin, M. Lemdani Analyse de Grandes BDD en Santé Version - 19 février / 18

14 Programme de la Journée Thématique Programme Arbres de décision : 9h30-11h Méthodes de classification : 11h - 12h30 Méthodes de gestion des données manquantes : 14h - 16h30 Exemples gestion des données manquantes : 16h30-18h Présentation d articles - Discussion A. Duhamel, M. Genin, M. Lemdani Analyse de Grandes BDD en Santé Version - 19 février / 18

Analyse de grandes bases de données en santé

Analyse de grandes bases de données en santé .. Analyse de grandes bases de données en santé Alain Duhamel Michaël Genin Mohamed Lemdani EA 2694 / CERIM Master 2 Recherche Biologie et Santé Journée Thématique Fouille de Données Plan. 1 Problématique.

Plus en détail

Outils Statistiques du Data Mining

Outils Statistiques du Data Mining Outils Statistiques du Data Mining Pr Roch Giorgi roch.giorgi@univ-amu.fr SESSTIM, Faculté de Médecine, Aix-Marseille Université, Marseille, France http://sesstim-orspaca.org http://optim-sesstim.univ-amu.fr

Plus en détail

Cours Fouille de données avancée

Cours Fouille de données avancée Ministère de l Enseignement Supérieur et de la Recherche Scientifique Université Mohamed Khider - Biskra Faculté des Sciences Exactes et des Sciences de la Nature et de la Vie Département d Informatique

Plus en détail

Statistique et analyse de données pour l assureur : des outils pour la gestion des risques et le marketing

Statistique et analyse de données pour l assureur : des outils pour la gestion des risques et le marketing Statistique et analyse de données pour l assureur : des outils pour la gestion des risques et le marketing Gilbert Saporta Chaire de Statistique Appliquée, CNAM ActuariaCnam, 31 mai 2012 1 L approche statistique

Plus en détail

Offre de formation de troisième cycle (LMD)

Offre de formation de troisième cycle (LMD) Offre de formation de troisième cycle (LMD) (Arrêté n 250 du 28 juillet 2009, fixant l organisation de la formation de troisième en vue de l obtention du diplôme de doctorat) Etablissement Faculté / Institut

Plus en détail

Le Data Mining, Outil d aide à la prise de décision dans l action commerciale

Le Data Mining, Outil d aide à la prise de décision dans l action commerciale Université Ibn Zohr Faculté des Sciences Juridiques, Économiques et Sociales Exposé sous le thème : Le Data Mining, Outil d aide à la prise de décision dans l action commerciale Plan : Introduction : L

Plus en détail

Introduction au datamining

Introduction au datamining Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des

Plus en détail

Programme détaillé des enseignements

Programme détaillé des enseignements Programme détaillé des enseignements SEMESTRE S1 STATISTIQUES Méthodes d'estimation ponctuelle (méthodes des moments, du maximum de vraisemblances, bayésienne) et par intervalles de confiance. Statistiques

Plus en détail

I. Systèmes de. Data mining et identification des effets indésirables médicamenteux

I. Systèmes de. Data mining et identification des effets indésirables médicamenteux Data mining et identification des effets indésirables médicamenteux I. ystèmes de règles de décisiond I. ystèmes de règles de décision II. III. IV. Détection des effets indésirables médicamenteux (IM)

Plus en détail

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1 Christophe CANDILLIER Cours de DataMining mars 2004 age 1 1. Introduction 2. rocessus du DataMining 3. Analyse des données en DataMining 4. Analyse en Ligne OLA 5. Logiciels 6. Bibliographie Christophe

Plus en détail

Cycle de formation certifiante Sphinx

Cycle de formation certifiante Sphinx Cycle de formation certifiante Sphinx 28, 29, 30 Mai 2015 Initiation, Approfondissement et Maîtrise Etudes qualitatives / quantitatives Initiation, approfondissement et maîtrise des études qualitatives

Plus en détail

Motivation : pourquoi exploration de données? Nous nous noyons dans les données, mais manquons cruellement de connaissances

Motivation : pourquoi exploration de données? Nous nous noyons dans les données, mais manquons cruellement de connaissances 1 Introduction Définition et motivations Tâches de data mining (fouille de données, exploration de données) Techniques et algorithmes Exemples et applications 1 Motivation : pourquoi exploration de données?

Plus en détail

INTRODUCTION AU DATA MINING. Cina MOTAMED

INTRODUCTION AU DATA MINING. Cina MOTAMED INTRODUCTION AU DATA MINING Cina MOTAMED 2 Data Mining : contexte Âge numérique : explosion des volumes de données Transactions commerciales Opérations bancaires Navigation Internet Indicateurs démographiques

Plus en détail

Master ISI 2010-2011. Data Mining Recherche des sous-ensembles fréquents

Master ISI 2010-2011. Data Mining Recherche des sous-ensembles fréquents Master ISI 2010-2011 Data Mining Recherche des sous-ensembles fréquents Yves Lechevallier INRIA-Rocquencourt E_mail : Yves.Lechevallier@inria.fr 1 Processus Data Mining Phase A : Entrepôt de données Entrepôt

Plus en détail

Formation Actuaire Data-Scientist PROGRAMME

Formation Actuaire Data-Scientist PROGRAMME Formation Actuaire Data-Scientist PROGRAMME 15 Septembre 2014 Arthur Charpentier, Romuald Élie & Jérémie Jakubowicz 15914 Programme Séance inaugurale : révolu-on numérique besoins des entreprises cadre

Plus en détail

Initiation à la fouille de données et à l apprentissage automatiq

Initiation à la fouille de données et à l apprentissage automatiq Initiation à la fouille de données et à l apprentissage automatique 1 Laboratoire d Informatique Fondamentale de Marseille Université de Provence christophe.magnan@lif.univ-mrs.fr www.lif.univ-mrs.fr/

Plus en détail

Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining.

Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining. 2 jours : Mardi 15 et mercredi 16 novembre 2005 de 9 heures 30 à 17 heures 30 Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining. Madame, Monsieur, On parle

Plus en détail

Filière Data Mining (Fouille de données) Pierre Morizet-Mahoudeaux

Filière Data Mining (Fouille de données) Pierre Morizet-Mahoudeaux Filière Data Mining (Fouille de données) Pierre Morizet-Mahoudeaux Plan Motivations Débouchés Formation UVs spécifiques UVs connexes Enseignants et partenaires Motivations de la filière fouille de données

Plus en détail

Ce qu est le Data Mining

Ce qu est le Data Mining Data Mining 1 Ce qu est le Data Mining Extraction d informations intéressantes non triviales, implicites, préalablement inconnues et potentiellement utiles à partir de données. Autres appellations: ECD

Plus en détail

FOUILLE DE DONNEES. Anne LAURENT ECD. laurent@lirmm.fr

FOUILLE DE DONNEES. Anne LAURENT ECD. laurent@lirmm.fr FOUILLE DE DONNEES Anne LAURENT laurent@lirmm.fr ECD Pourquoi la fouille de données? Données disponibles Limites de l approche humaine Nombreux besoins : Industriels, Médicaux, Marketing, Qu est-ce que

Plus en détail

Analyse de données textuelles Panorama des fonctions, des méthodes et des usages

Analyse de données textuelles Panorama des fonctions, des méthodes et des usages Analyse de données textuelles Panorama des fonctions, des méthodes et des usages Sylvie Dalbin Assistance & Techniques Documentaires DocForum, Le 17 Novembre 2005 Déroulé de l'intervention (1) 1. Définition

Plus en détail

Spécificités, Applications et Outils

Spécificités, Applications et Outils Spécificités, Applications et Outils Ricco Rakotomalala Université Lumière Lyon 2 Laboratoire ERIC Laboratoire ERIC 1 Ricco Rakotomalala ricco.rakotomalala@univ-lyon2.fr http://chirouble.univ-lyon2.fr/~ricco/data-mining

Plus en détail

Apprentissage statistique Stratégie du Data-Mining

Apprentissage statistique Stratégie du Data-Mining Apprentissage statistique Stratégie du Data-Mining Hélène Milhem Institut de Mathématiques de Toulouse, INSA Toulouse, France IUP SID, 2011-2012 H. Milhem (IMT, INSA Toulouse) Apprentissage statistique

Plus en détail

Retour sur les sessions

Retour sur les sessions Retour sur les sessions Session 1 : Modèles de données dans le cadre de systèmes d informations multi-sources en écologie Session 2 : Enrichissement et représentation de données multi-sources en écologie

Plus en détail

Filière Data Mining (Fouille de données) Pierre Morizet-Mahoudeaux

Filière Data Mining (Fouille de données) Pierre Morizet-Mahoudeaux Filière Data Mining (Fouille de données) Pierre Morizet-Mahoudeaux Plan Objectifs Débouchés Formation UVs spécifiques UVs connexes Enseignants et partenaires Structure générale des études à l UTC Règlement

Plus en détail

Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.

Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction. Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction. Etudes et traitements statistiques des données : le cas illustratif de la démarche par sondage INTRODUCTION

Plus en détail

INTRODUCTION AU DATA MINING

INTRODUCTION AU DATA MINING INTRODUCTION AU DATA MINING 6 séances de 3 heures mai-juin 2006 EPF - 4 ème année - Option Ingénierie d Affaires et de Projets Bertrand LIAUDET TP DE DATA MINING Le TP et le projet consisteront à mettre

Plus en détail

De la donnée à la décision. Sofian MAABOUT LaBRI. Université Bordeaux 1

De la donnée à la décision. Sofian MAABOUT LaBRI. Université Bordeaux 1 De la donnée à la décision Sofian MAABOUT LaBRI. Université Bordeaux 1 1 Décider c est choisir, parmi plusieurs actes possibles, celui qui apparaît comme le plus pertinent pour atteindre un résultat envisagé,

Plus en détail

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données et le Data Mining Nous suivons le plan suivant : Fonctionnement de Spad Catalogue des méthodes (statistiques

Plus en détail

OLAP. Data Mining Decision

OLAP. Data Mining Decision Machine Learning Information Systems Data Warehouses Web & Cloud Intelligence OLAP Knowledge Management Data Mining Decision ENTREPÔTS, REPRÉSENTATION & INGÉNIERIE des CONNAISSANCES Une recherche pluridisciplinaire...

Plus en détail

[Aucun étudiant ne. sera autorisé à passer les examens sans la présentation de sa carte d'étudiant.].

[Aucun étudiant ne. sera autorisé à passer les examens sans la présentation de sa carte d'étudiant.]. [Aucun étudiant ne sera autorisé à passer les examens sans la présentation de sa carte d'étudiant.]. 1 ère Année 1 ère Année Licence Appliquée en Informatique de Gestion Mercredi 11/06/2014 Jeudi 12/06/2014

Plus en détail

INTERNATIONAL CHAIR IN MATHEMATICAL PHYSICS AND APPLICATIONS (ICMPA) UNESCO CHAIR IN MATHEMATICAL PHYSICS AND APPLICATIONS

INTERNATIONAL CHAIR IN MATHEMATICAL PHYSICS AND APPLICATIONS (ICMPA) UNESCO CHAIR IN MATHEMATICAL PHYSICS AND APPLICATIONS INTERNATIONAL CHAIR IN MATHEMATICAL PHYSICS AND APPLICATIONS (ICMPA) UNESCO CHAIR IN MATHEMATICAL PHYSICS AND APPLICATIONS established in 2006 at the University of Abomey-Calavi (Republic of Benin) UNITWIN/UNESCO

Plus en détail

connaissances «intéressantes» ou des motifs (patterns) à partir d une grande quantité de données.

connaissances «intéressantes» ou des motifs (patterns) à partir d une grande quantité de données. Data Mining = Knowledge Discovery in Databases (KDD) = Fouille de données 1 Définition : Processus ou méthode qui extrait des connaissances «intéressantes» ou des motifs (patterns) à partir d une grande

Plus en détail

Atelier de Prospective n 7. Jusqu où le dossier informatisé peut il favoriser la coordination des acteurs de santé?

Atelier de Prospective n 7. Jusqu où le dossier informatisé peut il favoriser la coordination des acteurs de santé? Atelier de Prospective n 7 Jusqu où le dossier informatisé peut il favoriser la coordination des acteurs de santé? Aujourd hui et demain Aujourd hui : Déploiement : Les DPI sont en cours de généralisation

Plus en détail

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP)

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP) Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP) Définition (G. Gardarin) Entrepôt : ensemble de données historisées variant

Plus en détail

L informatique des entrepôts de données

L informatique des entrepôts de données L informatique des entrepôts de données Daniel Lemire SEMAINE 13 L exploration des données 13.1. Présentation de la semaine L exploration de données (ou data mining) est souvent associée à l intelligence

Plus en détail

Recherche Opérationnelle et Optimisation : Quelles perspectives pour le Datamining

Recherche Opérationnelle et Optimisation : Quelles perspectives pour le Datamining Recherche Opérationnelle et Optimisation : Quelles perspectives pour le Datamining Clarisse DHAENENS LIFL Equipe OPAC INRIA Projet DOLPHIN Université de Lille 1 KESAKO Datamining Datamining : définitiond

Plus en détail

Méthodes de DM pour la GRC dans les banques

Méthodes de DM pour la GRC dans les banques Techniques de DM pour la GRC dans les banques Page 21 III.1 Introduction Avant de chercher des techniques à appliquer dans la gestion des relations avec les clients. Il faut étudier les données des clients

Plus en détail

Analyse de données électroniques et intelligence d affaires

Analyse de données électroniques et intelligence d affaires Analyse de données électroniques et intelligence d affaires Valoriser les données internes et externes 3 avril 2014 Ordre du jour UNE INTRODUCTION À L ANALYSE DE DONNÉES Analyse de données et l intelligence

Plus en détail

Bases de données Outils de gestion

Bases de données Outils de gestion 11/03/2010 Bases de données Outils de gestion Mise en place d outils pour gérer, stocker et utiliser les informations d une recherche biomédicale ent réalisé par L. QUINQUIS d épidémiologie et de biostatistique

Plus en détail

Didier MOUNIEN Samantha MOINEAUX

Didier MOUNIEN Samantha MOINEAUX Didier MOUNIEN Samantha MOINEAUX 08/01/2008 1 Généralisation des ERP ERP génère une importante masse de données Comment mesurer l impact réel d une décision? Comment choisir entre plusieurs décisions?

Plus en détail

PLACE DES STATISTIQUES DANS LA RECHERCHE MEDICALE

PLACE DES STATISTIQUES DANS LA RECHERCHE MEDICALE PLACE DES STATISTIQUES DANS LA RECHERCHE MEDICALE PLAN Définition des statistiques Échantillonnage Mise en place d une étude Interprétation des résultats Petits échantillons Analyse des bases de données

Plus en détail

Cybermarché et analyse comportementale

Cybermarché et analyse comportementale Cybermarché et analyse comportementale Antoine-Eric Sammartino aesammartino@e-laser.fr Séminaire Data Mining - Educasoft Formations 18 juin 2001-1- MENU Le Groupe LaSer Le processus Data Mining L industrialisation

Plus en détail

Domaine de Formation : Sciences et Technologies Mention : Informatique Spécialité : Informatique de Gestion

Domaine de Formation : Sciences et Technologies Mention : Informatique Spécialité : Informatique de Gestion LICENCE FONDAMENTALE INFORMATIQUE DE GESTION Domaine de Formation : Sciences et Technologies Mention : Informatique Spécialité : Informatique de Gestion I. Présentation de la licence Le but de la Licence

Plus en détail

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement Introduction Phases du projet Les principales phases du projet sont les suivantes : La mise à disposition des sources Des fichiers Excel sont utilisés pour récolter nos informations L extraction des données

Plus en détail

MASTER INFORMATIQUE Parcours INFORMATIQUE DECISIONNELLE

MASTER INFORMATIQUE Parcours INFORMATIQUE DECISIONNELLE MASTER INFORMATIQUE Parcours INFORMATIQUE DECISIONNELLE Responsable du parcours: Prof Hoai An LE THI Département d Informatique, UFR MIM Tel. 03 87 31 54 41, email lethi@univ-metz.fr Informatique décisionnelle

Plus en détail

Calendrier des examens - Session de contrôle Juin 2015 1 ère Année Licence Appliquée en Informatique de Gestion

Calendrier des examens - Session de contrôle Juin 2015 1 ère Année Licence Appliquée en Informatique de Gestion 1 ère Année 1 ère Année Licence Appliquée en Informatique de Gestion LUNDI 08/06/2015 MARDI 09/06/2015 MERCREDI 10/06/2015 JEUDI 11/06/2015 VENDREDI 12/06/2015 SAMEDI 13/06/2015 LUNDI 15/06/2015 MARDI

Plus en détail

WEKA : c est quoi? Brigitte Bigi. 15 février 2011. LPL - Équipe C3I. Brigitte Bigi (LPL - Équipe C3I) WEKA : c est quoi? 15 février 2011 1 / 32

WEKA : c est quoi? Brigitte Bigi. 15 février 2011. LPL - Équipe C3I. Brigitte Bigi (LPL - Équipe C3I) WEKA : c est quoi? 15 février 2011 1 / 32 WEKA : c est quoi? Brigitte Bigi LPL - Équipe C3I 15 février 2011 Brigitte Bigi (LPL - Équipe C3I) WEKA : c est quoi? 15 février 2011 1 / 32 Introduction 1 Introduction 2 Classification supervisée 3 WEKA

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme

Plus en détail

Table des matières. PREMIÈRE PARTIE Étapes initiales des études marketing 7

Table des matières. PREMIÈRE PARTIE Étapes initiales des études marketing 7 Table des matières Préface Public 1 Structure de l ouvrage 1 Caractéristiques de l ouvrage 3 Contenu 3 Pédagogie 4 Remarques sur l adaptation française 4 Ressources numériques 5 Biographie 6 PREMIÈRE PARTIE

Plus en détail

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours Information du cours Informatique décisionnelle et data mining www.lia.univ-avignon.fr/chercheurs/torres/cours/dm Juan-Manuel Torres juan-manuel.torres@univ-avignon.fr LIA/Université d Avignon Cours/TP

Plus en détail

Dr Donatien MOUKASSA Département des sciences biomédicales Anatomie et Cytologie Pathologiques FSS, Brazzaville, Congo

Dr Donatien MOUKASSA Département des sciences biomédicales Anatomie et Cytologie Pathologiques FSS, Brazzaville, Congo COMMENT REDIGER UN PROJET DE RECHERCHE POUR UNE THESE DE MEDECINE OU UN MEMOIRE EN SCIENCES DE LA SANTE? Dr Donatien MOUKASSA Département des sciences biomédicales Anatomie et Cytologie Pathologiques FSS,

Plus en détail

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

La survie nette actuelle à long terme Qualités de sept méthodes d estimation La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg

Plus en détail

Support di cours disponible à l adresse suivante http://sspsd.u-strasbg.fr/mdem22e-statistiques-cours-td.html

Support di cours disponible à l adresse suivante http://sspsd.u-strasbg.fr/mdem22e-statistiques-cours-td.html MDEM22E - Cours et TD de statistiques descriptives à partir de données d enquête Support di cours disponible à l adresse suivante http://sspsd.u-strasbg.fr/mdem22e-statistiques-cours-td.html Objectif du

Plus en détail

Semestre 1. Volume horaire hebdomadaire. Cours TD TP T.Perso. Total. Calcul de Probabilité 3 1,5 1,5 6 84 2. Introduction à l Economie 1,5 1,5 3 42 2

Semestre 1. Volume horaire hebdomadaire. Cours TD TP T.Perso. Total. Calcul de Probabilité 3 1,5 1,5 6 84 2. Introduction à l Economie 1,5 1,5 3 42 2 3ème Année Semestre 1 N MODULES MATIERES Volume horaire hebdomadaire Cours TD TP T.Perso. Total Volume horaire semestriel (14 semaines) Coefficients Régime d'examen 1 Modèle Probabiliste 1,5 1,5 1,5 4,5

Plus en détail

Agenda de la présentation

Agenda de la présentation Le Data Mining Techniques pour exploiter l information Dan Noël 1 Agenda de la présentation Concept de Data Mining ou qu est-ce que le Data Mining Déroulement d un projet de Data Mining Place du Data Mining

Plus en détail

Data Mining. Exposés logiciels, systèmes et réseaux. Damien Jubeau IR3 Lundi 19 novembre 2012

Data Mining. Exposés logiciels, systèmes et réseaux. Damien Jubeau IR3 Lundi 19 novembre 2012 Data Mining Exposés logiciels, systèmes et réseaux. Damien Jubeau IR3 Lundi 19 novembre 2012 2 Plan Data mining : définition, utilisations et concepts Wolfram Alpha : extraction de données d'un compte

Plus en détail

Session Principale CA 51 Pr. A. Mast. Mastère professionnel en comptabilité (Comptabilité-Contrôle et Audit) Journée_: Modules HoraireEpreuve

Session Principale CA 51 Pr. A. Mast. Mastère professionnel en comptabilité (Comptabilité-Contrôle et Audit) Journée_: Modules HoraireEpreuve CA 51 Pr. A. Mast. Mastère professionnel en comptabilité (Comptabilité-Contrôle et Audit) Information et communication Méthodologie de Recherche Comptabilité IFRS II Conduite du changement et GRH DROIT

Plus en détail

Objectif du groupe GT1.1 Fusion de Données

Objectif du groupe GT1.1 Fusion de Données Objectif du groupe GT1.1 Fusion de Données Le groupe travaille dans trois directions Le vocabulaire (piloté par ADVITAM et l aide de SITE) L état de l art (piloté par SYROKKO) Deux applications illustratives

Plus en détail

Méthodologie de conceptualisation BI

Méthodologie de conceptualisation BI Méthodologie de conceptualisation BI Business Intelligence (BI) La Business intelligence est un outil décisionnel incontournable à la gestion stratégique et quotidienne des entités. Il fournit de l information

Plus en détail

Fouille de données orientée motifs, méthodes et usages.

Fouille de données orientée motifs, méthodes et usages. Fouille de données orientée motifs, méthodes et usages. François RIOULT GREYC - Équipe Données-Documents-Langues CNRS UMR 6072 Université de Caen Basse-Normandie France Résumé La fouille de données orientée

Plus en détail

FOUILLE DE DONNEES. Anne LAURENT POLYTECH'MONTPELLIER IG 5

FOUILLE DE DONNEES. Anne LAURENT POLYTECH'MONTPELLIER IG 5 FOUILLE DE DONNEES Anne LAURENT POLYTECH'MONTPELLIER IG 5 Pourquoi la fouille de données? Données disponibles Limites de l approche humaine Nombreux besoins : Industriels, Médicaux, Marketing, Qu est-ce

Plus en détail

Sommaire. Liste des Abréviations...13 Avant-Propos...15

Sommaire. Liste des Abréviations...13 Avant-Propos...15 Sommaire Liste des Abréviations...13 Avant-Propos...15 Partie 1 Gestion de la Qualité des Données (GQD) de votre clientèle...17 1.1. Introduction...19 1.2. Utilité de cette gestion...21 1.3. Mise sur pied

Plus en détail

Programme Précision sur l axe Description de la mesure. l importance du français. l importance de la qualité de la langue.

Programme Précision sur l axe Description de la mesure. l importance du français. l importance de la qualité de la langue. AXE 1 - SENSIBILISATION À L IMPORTANCE DE LA QUALITÉ DE LA LANGUE Programme Précision sur l axe Description de la mesure Danse Valorisation des écrits intermédiaires. Analyse grammaticale des erreurs de

Plus en détail

TP DE DATA MINING 2 : MODELISATION AVEC SPSS CLEMENTINE

TP DE DATA MINING 2 : MODELISATION AVEC SPSS CLEMENTINE TP DE DATA MINING 2 : MODELISATION AVEC SPSS CLEMENTINE EPF 4/ 5 ème année - Option Ingénierie d Affaires et de Projets - Finance Bertrand LIAUDET TP n 2 de DATA MINING : Modélisation 1 Jeu de données

Plus en détail

Calendrier des examens - session Janvier 2016 Mastère Digital Marketing M 2

Calendrier des examens - session Janvier 2016 Mastère Digital Marketing M 2 Mastère Digital Marketing M 2 Lundi 04/01/2016 Initiation aux business games 09H00 02 :00 Mardi 05/01/2016 Veille et système d information marketing 09H00 02 :00 Mercredi 06/01/2016 Datawarehouse datamining

Plus en détail

Statistiques et traitement des données

Statistiques et traitement des données Statistiques et traitement des données Mention : Mathématiques Nature de la formation : Diplôme national de l'enseignement Supérieur Durée des études : 2 ans Crédits ECTS : 120 Formation accessible en

Plus en détail

R, VISUALISATION ET APPRENTISSAGE

R, VISUALISATION ET APPRENTISSAGE R, VISUALISATION ET APPRENTISSAGE ANALYSE DE COMPORTEMENTS TOURISTIQUES À PARTIR DE DONNÉES PHOTOGRAPHIQUES GÉOTAGGÉES B.Branchet G.Chareyron J.Da-Rugna 2 PRÉSENTATION Bérengère Branchet Gaël Chareyron

Plus en détail

Le Data Mining Techniques pour exploiter l information. Auteur : Dan Noël Date : 24.04.2009

Le Data Mining Techniques pour exploiter l information. Auteur : Dan Noël Date : 24.04.2009 Le Data Mining Techniques pour exploiter l information Auteur : Dan Noël Date : 24.04.2009 Agenda de la présentation du 26.03.2009 Concept de Data Mining ou qu est-ce que le Data Mining Déroulement d un

Plus en détail

Etat de l art sur l utilisation des techniques Web Sémantique en ECD

Etat de l art sur l utilisation des techniques Web Sémantique en ECD Etat de l art sur l utilisation des techniques Web Sémantique en ECD Hicham Behja ENSAM Meknès(1,2,3) Brigitte Trousse Projet AxIS INRIA Sophia Antipolis (2) Abdelaziz Marzak Faculté des sciences Casablanca

Plus en détail

1.1 Exemple introductif d un cube de données... 2

1.1 Exemple introductif d un cube de données... 2 1.1 Exemple introductif d un cube de données............... 2 2.1 Pré-traitement des données avec les outils OLAP [MHW00]...... 14 2.2 Architecture d un système intégrant SGBD, OLAP et MOLAP [Fu05] 16

Plus en détail

Module 3 : Introduction à la Modélisation SOUS MODELER

Module 3 : Introduction à la Modélisation SOUS MODELER Module 3 : Introduction à la Modélisation SOUS MODELER 1 Techniques prédictives Passé pour prédire l avenir 2 Concepts de la modélisation Données test / apprentissage Généralement créées par l utilisateur

Plus en détail

But du cours. Sources & références. Sources & références. Sources & références. Plan. La fouille de données (ou data mining) Principe (postulat...

But du cours. Sources & références. Sources & références. Sources & références. Plan. La fouille de données (ou data mining) Principe (postulat... But du cours Vocabulaire, principes et techniques du Data Mining Méthodes et Algorithmes Interprétation des résultats. Data Mining : Concepts and Techniques J. Han, M. Kamber Morgan Kaufmann Le Data Mining

Plus en détail

Introduction à La Fouille de Données. Khai thác dữ liệu. Cours M1 IA «Systèmes Intelligents & Multimédia» Jean-Daniel Zucker

Introduction à La Fouille de Données. Khai thác dữ liệu. Cours M1 IA «Systèmes Intelligents & Multimédia» Jean-Daniel Zucker 1 /81 Cours IFI M1 Data Mining Introduction à La Fouille de Données Khai thác dữ liệu Cours M1 IA «Systèmes Intelligents & Multimédia» Jean-Daniel Zucker Chercheur de l IRD à UMMISCO (Modélisation Mathématiques

Plus en détail

Statistique II Inférence pour une et deux variables Introduction

Statistique II Inférence pour une et deux variables Introduction Faculté de psychologie Statistique II Inférence pour une et deux variables Introduction Support à l exposé oral Titulaire Bernadette Govaerts ISBA, LSBA et SMCS UCLouvain 28/08/15 P 1 28/08/15 P 2 Statistique

Plus en détail

Master MIAGE «Méthodes informatiques Appliquées à la Gestion des Entreprises» Parcours- «Système d Information et Aide à La Décision» (SIAD)

Master MIAGE «Méthodes informatiques Appliquées à la Gestion des Entreprises» Parcours- «Système d Information et Aide à La Décision» (SIAD) Master MIAGE «Méthodes informatiques Appliquées à la Gestion des Entreprises» Parcours- «Système d Information et Aide à La Décision» (SIAD) De l Université Internationale Senghor IGA-Maroc est un campus

Plus en détail

Statistique et Informatique Décisionnelle (SID) - Parcours Informatique liste liste A saisir A saisir

Statistique et Informatique Décisionnelle (SID) - Parcours Informatique liste liste A saisir A saisir Université de TOULOUSE 3 1/3 Parcours Informatique L1 S1 Accompagnement et projet de l'étudiant (1 ECTS, 12 heures) 1 L1 S1 Mathématiques 1 (6 ECTS, 60 heures) 6 L1 S1 Option Informatique 1 (UE à choix

Plus en détail

QU EST-CE QUE LE DECISIONNEL?

QU EST-CE QUE LE DECISIONNEL? La plupart des entreprises disposent d une masse considérable d informations sur leurs clients, leurs produits, leurs ventes Toutefois ces données sont cloisonnées par les applications utilisées ou parce

Plus en détail

UNIVERSITE DE LORRAINE CALCIUM

UNIVERSITE DE LORRAINE CALCIUM UNIVERSITE DE LORRAINE CALCIUM Outil pour la gestion des dossiers médicaux des étudiants dans les services universitaires de médecine préventive Table des matières CALCIUM... 0 I. L INFORMATION GÉRÉE PAR

Plus en détail

COURS DE STATISTIQUES (24h)

COURS DE STATISTIQUES (24h) COURS DE STATISTIQUES (24h) Introduction Statistiques descriptives (4 h) Rappels de Probabilités (4 h) Echantillonnage(4 h) Estimation ponctuelle (6 h) Introduction aux tests (6 h) Qu est-ce que la statistique?

Plus en détail

Plateforme SAS. Data & Information System

Plateforme SAS. Data & Information System Data & Information System SOMMAIRE Rédacteur : Ref: F.Barthelemy AXIO_1111_V1 PLATEFORME SAS PREREQUIS SAS GUIDE SAS WRS SAS PORTAL SAS MINER Une plateforme unique et modulable capable d exploiter l architecture

Plus en détail

Calendrier des examens - session Février 2016 Mastère Digital Marketing M 2

Calendrier des examens - session Février 2016 Mastère Digital Marketing M 2 Mastère Digital Marketing M 2 Mercredi 03/02/2016 Vendredi 05/02/2016 Lundi 08/02/2016 Mardi 09/02/2016 Coach et développement personnel 09H00 02 :00 Initiation aux business games 12H00 02 :00 Veille et

Plus en détail

Département d'informatique. Apprentissage Automatique IFT-65764A. S y l l a b u s. Guy Mineau mineau@ift.ulaval.ca, 656-5189, PLT-3908C

Département d'informatique. Apprentissage Automatique IFT-65764A. S y l l a b u s. Guy Mineau mineau@ift.ulaval.ca, 656-5189, PLT-3908C Département d'informatique Apprentissage Automatique IFT-65764A S y l l a b u s Guy Mineau mineau@ift.ulaval.ca, 656-5189, PLT-3908C Automne 2001 Page 2 A. Cours Titre : Apprentissage automatique Sigle

Plus en détail

Les entrepôts de données pour les nuls... ou pas!

Les entrepôts de données pour les nuls... ou pas! Atelier aideà la Décision à tous les Etages AIDE@EGC2013 Toulouse Mardi 29 janvier 2013 Cécile Favre Fadila Bentayeb Omar Boussaid Jérôme Darmont Gérald Gavin Nouria Harbi Nadia Kabachi Sabine Loudcher

Plus en détail

Statistique et Informatique décisionnelle 30/01/12

Statistique et Informatique décisionnelle 30/01/12 Statistique et Informatique décisionnelle 1 Statistique et Informatique Décisionnelle STID IUT2-Université Pierre Mendès France LE TRAITEMENT «STATISTIQUE-INFORMATIQUE» DES DONNEES DECISIONNELLES 2 Objectifs

Plus en détail

UNIVERSITÉ DE MONTRÉAL DÉPARTEMENT DE SOCIOLOGIE ************* Cours de niveau gradué en méthodes quantitatives *************

UNIVERSITÉ DE MONTRÉAL DÉPARTEMENT DE SOCIOLOGIE ************* Cours de niveau gradué en méthodes quantitatives ************* ************* Cours de niveau gradué en méthodes quantitatives ************* SOL 6210 - Analyse quantitative avancée Le séminaire d analyse quantitative avancée se donne en classe une fois par année. Chaque

Plus en détail

Licence Professionnelle en Statistique et Informatique Décisionnelle (S.I.D.)

Licence Professionnelle en Statistique et Informatique Décisionnelle (S.I.D.) Université de Lille 2 - Droit et Santé Ecole Supérieure des Affaires & Institut Universitaire de Technologie (IUT-C) Département Statistique et Traitement Informatique des Données Licence Professionnelle

Plus en détail

DATAMINING ANALYSE DE DONNEES SYMBOLIQUES : DONNEES DE REMBOURSEMENT DE LA MUTUELLE SOCIALE AGRICOLE DESS SITN / ID

DATAMINING ANALYSE DE DONNEES SYMBOLIQUES : DONNEES DE REMBOURSEMENT DE LA MUTUELLE SOCIALE AGRICOLE DESS SITN / ID DESS SITN / ID DATAMINING ANALYSE DE DONNEES SYMBOLIQUES : DONNEES DE REMBOURSEMENT DE LA MUTUELLE SOCIALE AGRICOLE Réalisé par : Karamatou LIADY & Antoine HOUENONTIN Enseignant : Edwin DIDAY Avril 2005

Plus en détail

Légende. Prérequis. unité A unité B. signifie que l'unité B est un prérequis de l'unité A. Corequis. unité A unité B

Légende. Prérequis. unité A unité B. signifie que l'unité B est un prérequis de l'unité A. Corequis. unité A unité B Légende unité A unité B signifie que l'unité B est un prérequis de l'unité A unité A unité B signifie que l'unité B est un corequis de l'unité A Note : lorsque deux cours sont corequis l'un de l'autre,

Plus en détail

STAGE. «Offre modulaire - Recueillir et analyser les besoins et attentes des usagers - Module 4 - L'analyse experte des données statistiques»

STAGE. «Offre modulaire - Recueillir et analyser les besoins et attentes des usagers - Module 4 - L'analyse experte des données statistiques» STAGE «Offre modulaire - Recueillir et analyser les besoins et attentes des usagers - Module 4 - L'analyse experte des données statistiques» PROGRAMME DETAILLE Intervenant : PARIS nicolas Cabinet : OPTIMA

Plus en détail

AVANT-PROPOS L analyse des données

AVANT-PROPOS L analyse des données AVANT-PROPOS L analyse des données Godelieve MASUY-STROOBANT Nos «sociétés de l information» voient se multiplier les bases de données administratives et les enquêtes ad hoc le plus souvent destinées à

Plus en détail

Améliorer les performances du site par l'utilisation de techniques de Web Mining

Améliorer les performances du site par l'utilisation de techniques de Web Mining Améliorer les performances du site par l'utilisation de techniques de Web Mining CLUB SAS 2001 17/18 octobre 2001 Stéfan Galissie LINCOLN stefan.galissie@lincoln.fr contact@web-datamining.net 2001 Sommaire

Plus en détail

Spécificités méthodologiques en pédiatrie : gestion des petits effectifs et des effets rares au long cours

Spécificités méthodologiques en pédiatrie : gestion des petits effectifs et des effets rares au long cours Spécificités méthodologiques en pédiatrie : gestion des petits effectifs et des effets rares au long cours Corinne Alberti CIE 5 : modèles et méthodes de l évaluation clinique et thérapeutique en pédiatrie

Plus en détail

Le bootstrap expliqué par l exemple

Le bootstrap expliqué par l exemple Le bootstrap expliqué par l exemple 1 Le bootstrap expliqué par l exemple 1. Les concepts du bootstrap 2. Des variantes adaptées au contexte 3. Comparaison des différentes méthodes 4. Les cas sensibles

Plus en détail

Business Intelligence

Business Intelligence Business Intelligence Enjeux, Projets, Données, Indicateurs Gilles FONTANINI g.fontanini@decision-network.eu +33 (0)6 11 21 24 53 2? Gilles Fontanini Consultant et Administrateur d un GIE d experts en

Plus en détail

Ingénierie d aide à la décision

Ingénierie d aide à la décision Ingénierie d aide à la décision Maria Malek 1 er septembre 2009 1 Objectifs et débouchés Nous proposons dans cette option deux grands axes pour l aide à la décision : 1. La recherche opérationnelle ; 2.

Plus en détail

Fouille de Données Médicales

Fouille de Données Médicales Journée Romande d Hygiène Hospitalière Fouille de Données Médicales Michèle Sebag Laboratoire de Recherche en Informatique, Université Paris-Sud http://www.lri.fr/ sebag/ Genève, 21 novembre 2002 MIT Technology

Plus en détail

INGENIERIE DES SYSTEMES INFORMATIQUES - PARCOURS : SYSTEMES INFORMATIQUES D AIDE A LA DECISION

INGENIERIE DES SYSTEMES INFORMATIQUES - PARCOURS : SYSTEMES INFORMATIQUES D AIDE A LA DECISION INGENIERIE DES SYSTEMES INFORMATIQUES - PARCOURS : SYSTEMES INFORMATIQUES D AIDE A LA DECISION Préparez ce diplôme à l école de d ingénierie de l IGA OBJECTIFS DE LA FORMATION Le système décisionnel est

Plus en détail

SYLLABUS SEMESTRE 9 Année 2011-2012

SYLLABUS SEMESTRE 9 Année 2011-2012 SYLLABUS SEMESTRE 9 2011-2012 Parcours S2I «Systèmes d Information et Informatique» François Brucker Tel.: 04 91 05 43 95 E-mail : francois.brucker@centrale-marseille.fr PROGRAMME Nb heures élèves (hors

Plus en détail

CClin Est. Le 17 avril 2014 Strasbourg

CClin Est. Le 17 avril 2014 Strasbourg Recherche des causes d un grave défaut de transmission d information en présence d une situation à fort risque de contamination CClin Est Le 17 avril 2014 Strasbourg 1 Contexte Développement de la culture

Plus en détail