Fouille des données Introduction

Dimension: px
Commencer à balayer dès la page:

Download "Fouille des données Introduction"

Transcription

1 Fouille des données p. 1/? Fouille des données Introduction Maria Malek Filière TSI EISTI

2 Fouille des données p. 2/? Vous avez dit? Data Mining?

3 Fouille des données p. 2/? Vous avez dit? Data Mining? Découverte de connaissances à partir de données? un processus itératif par lequel on extrait des connaissances valides, nouvelles, potentiellement utiles et compréhensibles [Fayyad et al., 1995]

4 Fouille des données p. 2/? Vous avez dit? Data Mining? Découverte de connaissances à partir de données? un processus itératif par lequel on extrait des connaissances valides, nouvelles, potentiellement utiles et compréhensibles [Fayyad et al., 1995] "Comment faire parler les données? "

5 Fouille des données p. 3/? Autour du data mining : les domaines Apprentissage Automatique (ML) DM : suppose la pré-existence de très grands volumes de données Data mining.

6 Fouille des données p. 3/? Autour du data mining : les domaines Apprentissage Automatique (ML) DM : suppose la pré-existence de très grands volumes de données Data mining. Statistiques, Analyse des données Stat : but = vérification d hypothèses. DM : but = découverte de nouvelles connaissances.

7 Fouille des données p. 4/? Processus du Data Mining - 1 Analyse du problème d application.

8 Fouille des données p. 4/? Processus du Data Mining - 1 Analyse du problème d application. Sélection et exploration des données évaluer la qualité des données, visualiser, analyser les distributions et les regroupements, détecter les insuffisances, pathologies des données.

9 Fouille des données p. 4/? Processus du Data Mining - 1 Analyse du problème d application. Sélection et exploration des données évaluer la qualité des données, visualiser, analyser les distributions et les regroupements, détecter les insuffisances, pathologies des données. Pré-traitement des données

10 Fouille des données p. 4/? Processus du Data Mining - 1 Analyse du problème d application. Sélection et exploration des données évaluer la qualité des données, visualiser, analyser les distributions et les regroupements, détecter les insuffisances, pathologies des données. Pré-traitement des données nettoyage bruit, valeurs manquantes, valeurs aberrantes,

11 Fouille des données p. 4/? Processus du Data Mining - 1 Analyse du problème d application. Sélection et exploration des données évaluer la qualité des données, visualiser, analyser les distributions et les regroupements, détecter les insuffisances, pathologies des données. Pré-traitement des données nettoyage bruit, valeurs manquantes, valeurs aberrantes, réduction sélection des instances sélection, extraction, combinaison des variables,

12 Processus du Data Mining - 1 Analyse du problème d application. Sélection et exploration des données évaluer la qualité des données, visualiser, analyser les distributions et les regroupements, détecter les insuffisances, pathologies des données. Pré-traitement des données nettoyage bruit, valeurs manquantes, valeurs aberrantes, réduction sélection des instances sélection, extraction, combinaison des variables, transformation discrétisation des variables continues, binarisation des variables nominales, ajout de nouvelles variables (induction constructive). Fouille des données p. 4/?

13 Processus du Data Mining - 1 Analyse du problème d application. Sélection et exploration des données évaluer la qualité des données, visualiser, analyser les distributions et les regroupements, détecter les insuffisances, pathologies des données. Pré-traitement des données nettoyage bruit, valeurs manquantes, valeurs aberrantes, réduction sélection des instances sélection, extraction, combinaison des variables, transformation discrétisation des variables continues, binarisation des variables nominales, ajout de nouvelles variables (induction constructive). Fouille des données p. 4/?

14 Fouille des données p. 5/? Processus du Data Mining - 4 L apprentissage «data mining» une méthode d extraction de connaissances.

15 Fouille des données p. 5/? Processus du Data Mining - 4 L apprentissage «data mining» une méthode d extraction de connaissances. Evaluation et interprétation des résultats critères différents suivant la tâche.

16 Fouille des données p. 6/? Les données?? Une donnée est un enregistrement,un individu (statistique), une instance (orienté objet), un point, un vecteur.

17 Fouille des données p. 6/? Les données?? Une donnée est un enregistrement,un individu (statistique), une instance (orienté objet), un point, un vecteur. Un attribut peut être de nature qualitative ou quantitative, ou même un enregistrement (comme la date).

18 Fouille des données p. 6/? Les données?? Une donnée est un enregistrement,un individu (statistique), une instance (orienté objet), un point, un vecteur. Un attribut peut être de nature qualitative ou quantitative, ou même un enregistrement (comme la date). Structure de base : un exemple/cas/observation = vecteur de p attributs ou variables chaque attribut prend sa valeur dans un domaine donné.

19 Fouille des données p. 6/? Les données?? Une donnée est un enregistrement,un individu (statistique), une instance (orienté objet), un point, un vecteur. Un attribut peut être de nature qualitative ou quantitative, ou même un enregistrement (comme la date). Structure de base : un exemple/cas/observation = vecteur de p attributs ou variables chaque attribut prend sa valeur dans un domaine donné. Ensemble d attribut - valeur : Techniques de logique d ordre 0 ou propositionnelle.

20 Fouille des données p. 6/? Les données?? Une donnée est un enregistrement,un individu (statistique), une instance (orienté objet), un point, un vecteur. Un attribut peut être de nature qualitative ou quantitative, ou même un enregistrement (comme la date). Structure de base : un exemple/cas/observation = vecteur de p attributs ou variables chaque attribut prend sa valeur dans un domaine donné. Ensemble d attribut - valeur : Techniques de logique d ordre 0 ou propositionnelle. Attributs & relations : Apprentissage relationnel & programmation inductive logique (logique de prédicats).

21 Fouille des données p. 7/? Les données : exemple - 1 NUM CIEL TEMP. HUMI. VENT CLASSE 1 ensoleillé élevé forte non N 2 ensoleillé élevé forte oui N 3 couvert élevé forte non P 4 pluvieux moyenne forte non P 5 pluvieux basse normale non P 6 pluvieux basse normale oui N 7 couvert basse normale oui P Table 1: Description des conditions météorologiques

22 Fouille des données p. 8/? Les données : exemple - 2 NUM CIEL TEMP. HUMI. VENT CLASSE 8 ensoleillé moyenne forte non N 9 ensoleillé basse normale non P 10 pluvieux moyenne normale non P 11 ensoleillé moyenne normale oui P 12 couvert moyenne forte oui P 13 couvert élevé normale non P 14 pluvieux moyenne forte oui N Table 2: Description des conditions météorologiques

23 Fouille des données p. 9/? Nature des variables.. Indépendante & Dépendante

24 Fouille des données p. 9/? Nature des variables.. Indépendante & Dépendante Variable indépendante/explicative/prédictive : variable dont la valeur est obtenue par observation

25 Fouille des données p. 9/? Nature des variables.. Indépendante & Dépendante Variable indépendante/explicative/prédictive : variable dont la valeur est obtenue par observation Variable dépendante/réponse/cible : variable dont la valeur dépend d autres variables

26 Fouille des données p. 9/? Nature des variables.. Indépendante & Dépendante Variable indépendante/explicative/prédictive : variable dont la valeur est obtenue par observation Variable dépendante/réponse/cible : variable dont la valeur dépend d autres variables Apprentissage supervisé & non supervisé

27 Fouille des données p. 9/? Nature des variables.. Indépendante & Dépendante Variable indépendante/explicative/prédictive : variable dont la valeur est obtenue par observation Variable dépendante/réponse/cible : variable dont la valeur dépend d autres variables Apprentissage supervisé & non supervisé Apprentissage non supervisé : pas de variable cible ex. regroupement (clustering).

28 Fouille des données p. 9/? Nature des variables.. Indépendante & Dépendante Variable indépendante/explicative/prédictive : variable dont la valeur est obtenue par observation Variable dépendante/réponse/cible : variable dont la valeur dépend d autres variables Apprentissage supervisé & non supervisé Apprentissage non supervisé : pas de variable cible ex. regroupement (clustering). Apprentissage supervisé : une variable cible (valeur à prédire) ex. classification.

29 Fouille des données p. 10/? Résultat du processus Connaissances sont extraites sous forme d un :

30 Fouille des données p. 10/? Résultat du processus Connaissances sont extraites sous forme d un : modèle : un résumé global de l ensemble de données applicable sur n importe quelle instance appartenant à l espace des données ;

31 Fouille des données p. 10/? Résultat du processus Connaissances sont extraites sous forme d un : modèle : un résumé global de l ensemble de données applicable sur n importe quelle instance appartenant à l espace des données ; motif (pattern) : résumé local d une région de l espace des données ; exemple : une règle.

32 Fouille des données p. 11/? Applications du Data Mining Domaines supervisés :

33 Fouille des données p. 11/? Applications du Data Mining Domaines supervisés : Chaque instance = p variables prédictives + 1 variable cible (à prédire)

34 Fouille des données p. 11/? Applications du Data Mining Domaines supervisés : Chaque instance = p variables prédictives + 1 variable cible (à prédire) Classification : variable cible discrète Exemple : diagnostiquer une maladie, etc.

35 Fouille des données p. 11/? Applications du Data Mining Domaines supervisés : Chaque instance = p variables prédictives + 1 variable cible (à prédire) Classification : variable cible discrète Exemple : diagnostiquer une maladie, etc. Régression : variable cible continue Exemple : estimer la valeur d un bien, etc.

36 Fouille des données p. 11/? Applications du Data Mining Domaines supervisés : Chaque instance = p variables prédictives + 1 variable cible (à prédire) Classification : variable cible discrète Exemple : diagnostiquer une maladie, etc. Régression : variable cible continue Exemple : estimer la valeur d un bien, etc. Domaines non supervisés :

37 Fouille des données p. 11/? Applications du Data Mining Domaines supervisés : Chaque instance = p variables prédictives + 1 variable cible (à prédire) Classification : variable cible discrète Exemple : diagnostiquer une maladie, etc. Régression : variable cible continue Exemple : estimer la valeur d un bien, etc. Domaines non supervisés : Regroupement(clustering) Exemple : détecter le profil utilisateur,etc.

38 Fouille des données p. 11/? Applications du Data Mining Domaines supervisés : Chaque instance = p variables prédictives + 1 variable cible (à prédire) Classification : variable cible discrète Exemple : diagnostiquer une maladie, etc. Régression : variable cible continue Exemple : estimer la valeur d un bien, etc. Domaines non supervisés : Regroupement(clustering) Exemple : détecter le profil utilisateur,etc. Association Exemple analyser les logs utilisateurs d un serveur web, etc.

39 Fouille des données p. 12/? Tâches du Data Mining Prédiction : Classification, Régression, Association.

40 Fouille des données p. 12/? Tâches du Data Mining Prédiction : Classification, Régression, Association. Description Visualisation, Regroupement, Association.

41 Fouille des données p. 13/? Conception d un algorithme DM Structure de modèle/motif : la forme des connaissances à extraire des données : arbre de décision, réseau de neurones.

42 Fouille des données p. 13/? Conception d un algorithme DM Structure de modèle/motif : la forme des connaissances à extraire des données : arbre de décision, réseau de neurones. Fonction d évaluation : permet de mesurer la qualité d un modèle ; Exemple : classification: taux d exemples bien classés.

43 Fouille des données p. 13/? Conception d un algorithme DM Structure de modèle/motif : la forme des connaissances à extraire des données : arbre de décision, réseau de neurones. Fonction d évaluation : permet de mesurer la qualité d un modèle ; Exemple : classification: taux d exemples bien classés. Méthode de recherche : stratégie utilisée pour parcourir l espace d hypothèses et pour trouver celle qui optimise la fonction d évaluation.

44 Fouille des données p. 13/? Conception d un algorithme DM Structure de modèle/motif : la forme des connaissances à extraire des données : arbre de décision, réseau de neurones. Fonction d évaluation : permet de mesurer la qualité d un modèle ; Exemple : classification: taux d exemples bien classés. Méthode de recherche : stratégie utilisée pour parcourir l espace d hypothèses et pour trouver celle qui optimise la fonction d évaluation. Stratégie de gestion des données : la façon de stocker, d indexer et d accéder aux données.

45 Fouille des données p. 14/? Côté Pratique.. Etude de la problématique de la classification

46 Fouille des données p. 14/? Côté Pratique.. Etude de la problématique de la classification Comment valider un classifieur.

47 Fouille des données p. 14/? Côté Pratique.. Etude de la problématique de la classification Comment valider un classifieur. Etude de l algorithme k plus proche voisins.

48 Fouille des données p. 14/? Côté Pratique.. Etude de la problématique de la classification Comment valider un classifieur. Etude de l algorithme k plus proche voisins. Utilisation du logiciel Weka.

49 Fouille des données p. 15/? La classification Types de classeurs Construction d un modèle arborescent permettant de prédire la classe d une donnée. Estimation directe de la classe d une donnée en fonction des exemples. Construction d un modèle réglable par l humain (les réseaux de neurones, et les machines à vecteurs supports).

50 Fouille des données p. 16/? Validation d un classeur - 1 L erreur d un classeur Er est la probabilité que ce classeur ne prédise pas correctement la classe d une donnée.

51 Fouille des données p. 16/? Validation d un classeur - 1 L erreur d un classeur Er est la probabilité que ce classeur ne prédise pas correctement la classe d une donnée. Le taux de succès est 1 Er.

52 Fouille des données p. 16/? Validation d un classeur - 1 L erreur d un classeur Er est la probabilité que ce classeur ne prédise pas correctement la classe d une donnée. Le taux de succès est 1 Er. L erreur apparente Erapp est mesurée sur les exemples utilisés pour la construction du classeur.

53 Fouille des données p. 16/? Validation d un classeur - 1 L erreur d un classeur Er est la probabilité que ce classeur ne prédise pas correctement la classe d une donnée. Le taux de succès est 1 Er. L erreur apparente Erapp est mesurée sur les exemples utilisés pour la construction du classeur. Estimer la qualité d un classeur : L ensemble d apprentissage X app ; L ensemble de test X test qui permet d estimer l erreur de classification ; on connaît la classe de chaque exemple dans cet l ensemble.

54 Fouille des données p. 17/? Validation d un classeur - 2 Mesure de qualité d un classeur : cas de classification binaire :

55 Fouille des données p. 17/? Validation d un classeur - 2 Mesure de qualité d un classeur : cas de classification binaire : VP/VN : Le nombre de vrais positifs/négatifs : les exemples de classe positive/négative et dont la classe est prédite comme positive/négative.

56 Fouille des données p. 17/? Validation d un classeur - 2 Mesure de qualité d un classeur : cas de classification binaire : VP/VN : Le nombre de vrais positifs/négatifs : les exemples de classe positive/négative et dont la classe est prédite comme positive/négative. FP/FN : Les exemples de classe négative/positive et dont la classe est prédite comme positive/négative.

57 Fouille des données p. 17/? Validation d un classeur - 2 Mesure de qualité d un classeur : cas de classification binaire : VP/VN : Le nombre de vrais positifs/négatifs : les exemples de classe positive/négative et dont la classe est prédite comme positive/négative. FP/FN : Les exemples de classe négative/positive et dont la classe est prédite comme positive/négative. Construction de la matrice de confusion VP FN - FP VN

58 Fouille des données p. 18/? Validation d un classeur - 3 Mesure de qualité d un classeur : cas de classification binaire :

59 Fouille des données p. 18/? Validation d un classeur - 3 Mesure de qualité d un classeur : cas de classification binaire : On définit dans la suite quatre mesures : La précision pour les positifs et les négatifs : V N V N+FN ; le rappel sur les positifs et les négatifs V P : V P+FN, : V N V N+FP. V P V P+FP, La précision mesure la proportion des exemples vraiment positifs parmi ceux qui étaient classés positifs. Le rappel mesure la proportion des exemples positifs trouvés parmi tous les exemples positifs.

60 Fouille des données p. 18/? Validation d un classeur - 3 Mesure de qualité d un classeur : cas de classification binaire : On définit dans la suite quatre mesures : La précision pour les positifs et les négatifs : V N V N+FN ; le rappel sur les positifs et les négatifs V P : V P+FN, : V N V N+FP. V P V P+FP, La précision mesure la proportion des exemples vraiment positifs parmi ceux qui étaient classés positifs. Le rappel mesure la proportion des exemples positifs trouvés parmi tous les exemples positifs.

61 Fouille des données p. 18/? Validation d un classeur - 3 Mesure de qualité d un classeur : cas de classification binaire : On définit dans la suite quatre mesures : La précision pour les positifs et les négatifs : V N V N+FN ; le rappel sur les positifs et les négatifs V P : V P+FN, : V N V N+FP. V P V P+FP, La précision mesure la proportion des exemples vraiment positifs parmi ceux qui étaient classés positifs. Le rappel mesure la proportion des exemples positifs trouvés parmi tous les exemples positifs.

62 Fouille des données p. 19/? Validation d un classeur - 4 Technique : validation croisée : Découper l ensemble d exemples en n sous ensembles disjoints. Chaque classe doit apparaître avec les même fréquence dans les n ensembles. Soit A,B,C une division en trois sous ensemble, Le classifieur construit à partir de A B est appelé AD A B, L erreur de généralisation calculée sur C est appelé Er c. Le taux d erreur est alors estimée par Er = Er A+Er B +Er c 3

63 Fouille des données p. 19/? Validation d un classeur - 4 Technique : validation croisée : Découper l ensemble d exemples en n sous ensembles disjoints. Chaque classe doit apparaître avec les même fréquence dans les n ensembles. Soit A,B,C une division en trois sous ensemble, Le classifieur construit à partir de A B est appelé AD A B, L erreur de généralisation calculée sur C est appelé Er c. Le taux d erreur est alors estimée par Er = Er A+Er B +Er c 3

64 Fouille des données p. 20/? Validation d un classeur - 5 Méthode Bootstrap : Un ensemble E : nous construisons l ensemble d apprentissage X app. Les exemples qui restent constituent l ensemble X test. on effectue N tirages aléatoires a partir de E avec remise. La probabilité qu un exemple x ne soit jamais tiré est égal à (1 1 N )N, N > +,e 1 = X app = 63.2, X gn = 36.8 E = E app E test

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

L exclusion mutuelle distribuée

L exclusion mutuelle distribuée L exclusion mutuelle distribuée L algorithme de L Amport L algorithme est basé sur 2 concepts : L estampillage des messages La distribution d une file d attente sur l ensemble des sites du système distribué

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme

Plus en détail

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com Intelligence Artificielle et Systèmes Multi-Agents Badr Benmammar bbm@badr-benmammar.com Plan La première partie : L intelligence artificielle (IA) Définition de l intelligence artificielle (IA) Domaines

Plus en détail

Evalua&on tests diagnos&ques. Arnaud Fontanet

Evalua&on tests diagnos&ques. Arnaud Fontanet Evalua&on tests diagnos&ques Arnaud Fontanet Résultats d un test diagnos&que Maladie «Gold standard» Test expérimental + a b a+b - c d c+d a+c b+d Evaluation tests diagnostiques. Arnaud Fontanet 2 Résultats

Plus en détail

LOGO. Module «Big Data» Extraction de Connaissances à partir de Données. Claudia MARINICA MCF, ETIS UCP/ENSEA/CNRS Claudia.Marinica@u-cergy.

LOGO. Module «Big Data» Extraction de Connaissances à partir de Données. Claudia MARINICA MCF, ETIS UCP/ENSEA/CNRS Claudia.Marinica@u-cergy. Module «Big Data» Extraction de Connaissances à partir de Données Claudia MARINICA MCF, ETIS UCP/ENSEA/CNRS Claudia.Marinica@u-cergy.fr 14 Janvier 2015 Pourquoi l extraction de connaissances à partir de

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI 1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage

Plus en détail

La fraude à la carte bancaire

La fraude à la carte bancaire Agenda Utilisation des réseaux sociaux dans la lutte contre la fraude Françoise Soulié Fogelman VP Innovation francoise@kxen.com 1. La fraude à la carte bancaire 2. La question des volumes 3. La création

Plus en détail

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1 Christophe CANDILLIER Cours de DataMining mars 2004 age 1 1. Introduction 2. rocessus du DataMining 3. Analyse des données en DataMining 4. Analyse en Ligne OLA 5. Logiciels 6. Bibliographie Christophe

Plus en détail

Bases de données documentaires et distribuées Cours NFE04

Bases de données documentaires et distribuées Cours NFE04 Bases de données documentaires et distribuées Cours NFE04 Introduction a la recherche d information Auteurs : Raphaël Fournier-S niehotta, Philippe Rigaux, Nicolas Travers prénom.nom@cnam.fr Département

Plus en détail

Grégoire de Lassence. Copyright 2006, SAS Institute Inc. All rights reserved.

Grégoire de Lassence. Copyright 2006, SAS Institute Inc. All rights reserved. Grégoire de Lassence 1 Grégoire de Lassence Responsable Pédagogie et Recherche Département Académique Tel : +33 1 60 62 12 19 gregoire.delassence@fra.sas.com http://www.sas.com/france/academic SAS dans

Plus en détail

M06/5/COMSC/SP1/FRE/TZ0/XX INFORMATIQUE NIVEAU MOYEN ÉPREUVE 1. Mardi 2 mai 2006 (après-midi) 1 heure 30 minutes INSTRUCTIONS DESTINÉES AUX CANDIDATS

M06/5/COMSC/SP1/FRE/TZ0/XX INFORMATIQUE NIVEAU MOYEN ÉPREUVE 1. Mardi 2 mai 2006 (après-midi) 1 heure 30 minutes INSTRUCTIONS DESTINÉES AUX CANDIDATS IB INFORMATIQUE NIVEAU MOYEN ÉPREUVE 1 DIPLOMA PROGRAMME PROGRAMME DU DIPLÔME DU BI PROGRAMA DEL DIPLOMA DEL BI M06/5/COMSC/SP1/FRE/TZ0/XX 22067017 Mardi 2 mai 2006 (après-midi) 1 heure 30 minutes INSTRUCTIONS

Plus en détail

RapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/2011. 1.1 Présentation. 1.2 Ressources

RapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/2011. 1.1 Présentation. 1.2 Ressources Master Maths Finances 2010/2011 Data Mining janvier 2011 RapidMiner 1 Introduction 1.1 Présentation RapidMiner est un logiciel open source et gratuit dédié au data mining. Il contient de nombreux outils

Plus en détail

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci http://liris.cnrs.fr/hamamache.kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de

Plus en détail

L apprentissage automatique

L apprentissage automatique L apprentissage automatique L apprentissage automatique L'apprentissage automatique fait référence au développement, à l analyse et à l implémentation de méthodes qui permettent à une machine d évoluer

Plus en détail

Qu est ce qu un réseau social. CNAM Séminaire de Statistiques Appliquées 13/11/2013. F.Soulié Fogelman 1. Utilisation des réseaux sociaux pour le

Qu est ce qu un réseau social. CNAM Séminaire de Statistiques Appliquées 13/11/2013. F.Soulié Fogelman 1. Utilisation des réseaux sociaux pour le Qui je suis Innovation Utilisation des réseaux sociaux pour le data mining Business & Decision Françoise Soulié Fogelman francoise.soulie@outlook.com Atos KDD_US CNAM Séminaire de Statistique appliquée

Plus en détail

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université

Plus en détail

Spécifications, Développement et Promotion. Ricco RAKOTOMALALA Université Lumière Lyon 2 Laboratoire ERIC

Spécifications, Développement et Promotion. Ricco RAKOTOMALALA Université Lumière Lyon 2 Laboratoire ERIC Spécifications, Développement et Promotion Ricco RAKOTOMALALA Université Lumière Lyon 2 Laboratoire ERIC Ricco? Enseignant chercheur (CNU.27) En poste à l Université Lyon 2 Faculté de Sciences Eco. Recherche

Plus en détail

Probabilités sur un univers fini

Probabilités sur un univers fini [http://mp.cpgedupuydelome.fr] édité le 7 août 204 Enoncés Probabilités sur un univers fini Evènements et langage ensembliste A quelle condition sur (a, b, c, d) ]0, [ 4 existe-t-il une probabilité P sur

Plus en détail

Laboratoire 4 Développement d un système intelligent

Laboratoire 4 Développement d un système intelligent DÉPARTEMENT DE GÉNIE LOGICIEL ET DES TI LOG770 - SYSTÈMES INTELLIGENTS ÉTÉ 2012 Laboratoire 4 Développement d un système intelligent 1 Introduction Ce quatrième et dernier laboratoire porte sur le développement

Plus en détail

Projet de Traitement du Signal Segmentation d images SAR

Projet de Traitement du Signal Segmentation d images SAR Projet de Traitement du Signal Segmentation d images SAR Introduction En analyse d images, la segmentation est une étape essentielle, préliminaire à des traitements de haut niveau tels que la classification,

Plus en détail

Filière Data Mining (Fouille de données) Pierre Morizet-Mahoudeaux

Filière Data Mining (Fouille de données) Pierre Morizet-Mahoudeaux Filière Data Mining (Fouille de données) Pierre Morizet-Mahoudeaux Plan Objectifs Débouchés Formation UVs spécifiques UVs connexes Enseignants et partenaires Structure générale des études à l UTC Règlement

Plus en détail

Transmission d informations sur le réseau électrique

Transmission d informations sur le réseau électrique Transmission d informations sur le réseau électrique Introduction Remarques Toutes les questions en italique devront être préparées par écrit avant la séance du TP. Les préparations seront ramassées en

Plus en détail

Business Intelligence avec Excel, Power BI et Office 365

Business Intelligence avec Excel, Power BI et Office 365 Avant-propos A. À qui s adresse ce livre? 9 1. Pourquoi à chaque manager? 9 2. Pourquoi à tout informaticien impliqué dans des projets «BI» 9 B. Obtention des données sources 10 C. Objectif du livre 10

Plus en détail

Historique. Architecture. Contribution. Conclusion. Définitions et buts La veille stratégique Le multidimensionnel Les classifications

Historique. Architecture. Contribution. Conclusion. Définitions et buts La veille stratégique Le multidimensionnel Les classifications L intelligence économique outil stratégique pour l entreprise Professeur Bernard DOUSSET dousset@irit.fr http://atlas.irit.fr Institut de Recherche en Informatique de Toulouse (IRIT) Equipe Systèmes d

Plus en détail

Les modes de recherche sur le Web 2.0

Les modes de recherche sur le Web 2.0 Les modes de recherche sur le Web 2.0 1 Sommaire 1. Contexte 2. Le collaboratif : les moteurs thématiques 3. La syndication des résultats de recherche 4. Les connaissances : des moteurs 2 1 1. Moteurs

Plus en détail

EXTRACTION DE CONNAISSANCES À PARTIR DE DONNÉES TEXTUELLES VUE D ENSEMBLE

EXTRACTION DE CONNAISSANCES À PARTIR DE DONNÉES TEXTUELLES VUE D ENSEMBLE ème Colloque National AIP PRIMECA La Plagne - 7- avril 7 EXTRACTION DE CONNAISSANCES À PARTIR DE DONNÉES TEXTUELLES VUE D ENSEMBLE Bruno Agard Département de Mathématiques et de Génie Industriel, École

Plus en détail

Apps Sage : les 10 étapes pour publier vos données dans le Cloud.

Apps Sage : les 10 étapes pour publier vos données dans le Cloud. Apps Sage : les 10 étapes pour publier vos données dans le Cloud. Produits concernés : Sage Customer View et Sage Reports Contexte Depuis Sage Data Manager, vous venez d installer Sage Business Sync (cf

Plus en détail

Apprentissage Automatique

Apprentissage Automatique Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs

Plus en détail

Datamining. Université Paris Dauphine DESS ID 2004/2005. Séries télévisées nominées aux oscars. Enseignant : Réalisé par : Mars 2005. Mr E.

Datamining. Université Paris Dauphine DESS ID 2004/2005. Séries télévisées nominées aux oscars. Enseignant : Réalisé par : Mars 2005. Mr E. Université Paris Dauphine DESS ID 2004/2005 Datamining Séries télévisées nominées aux oscars Mars 2005 Enseignant : Mr E. DIDAY Réalisé par : Mounia CHERRAD Anne-Sophie REGOTTAZ Sommaire Introduction...

Plus en détail

Agenda de la présentation

Agenda de la présentation Le Data Mining Techniques pour exploiter l information Dan Noël 1 Agenda de la présentation Concept de Data Mining ou qu est-ce que le Data Mining Déroulement d un projet de Data Mining Place du Data Mining

Plus en détail

Hervé Couturier EVP, SAP Technology Development

Hervé Couturier EVP, SAP Technology Development Hervé Couturier EVP, SAP Technology Development Hervé Biausser Directeur de l Ecole Centrale Paris Bernard Liautaud Fondateur de Business Objects Questions à: Hervé Couturier Hervé Biausser Bernard Liautaud

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane

Plus en détail

ENJEUX NUMÉRIQUES AUTOUR DU COMPTE PERSONNEL D ACTIVITÉ

ENJEUX NUMÉRIQUES AUTOUR DU COMPTE PERSONNEL D ACTIVITÉ ENJEUX NUMÉRIQUES AUTOUR DU COMPTE PERSONNEL D ACTIVITÉ 15 SEPTEMBRE 2015 7 rue de Bucarest 75008 Paris - +33 1 73 00 28 00 - backelite.com PRÉSENTATION Marie PETIT Responsable du conseil et de l expérience

Plus en détail

Le Cloud au LIG? Pierre Neyron PimLIG - 2013-04-14

Le Cloud au LIG? Pierre Neyron PimLIG - 2013-04-14 Le Cloud au LIG? Pierre Neyron PimLIG - 2013-04-14 Cloud = buzz word Employé à toutes les sauces... http://www.youtube.com/watch?v=rdkbo2qmyjq (pub SFR) tout le monde fait du cloud? Qui fait du cloud au

Plus en détail

Application de K-means à la définition du nombre de VM optimal dans un cloud

Application de K-means à la définition du nombre de VM optimal dans un cloud Application de K-means à la définition du nombre de VM optimal dans un cloud EGC 2012 : Atelier Fouille de données complexes : complexité liée aux données multiples et massives (31 janvier - 3 février

Plus en détail

AP 2nde G.T : «Organiser l information de manière visuelle et créative»

AP 2nde G.T : «Organiser l information de manière visuelle et créative» AP 2nde G.T : «Organiser l information de manière visuelle et créative» Les TICE, un mode d accès à mon autonomie bien sûr! «L'autonomie n'est pas un don! Elle ne survient pas par une sorte de miracle!

Plus en détail

D où que vous soyez, accédez à la gestion de votre entreprise

D où que vous soyez, accédez à la gestion de votre entreprise Les principaux atouts de la solution : Fonctionnement en mode Web pour un accès sécurisé d où que vous soyez (https) ou local Productivité optimisée notamment en saisie (pas d utilisation de la souris

Plus en détail

PROJET DE DIPLÔME HACKING & DESIGN

PROJET DE DIPLÔME HACKING & DESIGN PROJET DE DIPLÔME HACKING & DESIGN au service du design graphique GEOFFREY DORNE 2008-2009 THÉORIE HACKING DESIGNING LE HACKING C EST - BIDOUILLER - CRÉER DES MÉTA-OUTILS - DIFFUSER - CONNECTER - HACKER

Plus en détail

Implémentation parallèle de certains algorithmes de fouille de données avec le framework MapReduce

Implémentation parallèle de certains algorithmes de fouille de données avec le framework MapReduce Implémentation parallèle de certains algorithmes de fouille de données avec le framework MapReduce Algorithmes : K-means et Apriori Maria Malek LARIS-EISTI maria.malek@eisti.fr 1 Cloud Computing et MapReduce

Plus en détail

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique Objectifs Clustering On ne sait pas ce qu on veut trouver : on laisse l algorithme nous proposer un modèle. On pense qu il existe des similarités entre les exemples. Qui se ressemble s assemble p. /55

Plus en détail

CLINIMIX AVIS DE LA COMMISSION DE LA TRANSPARENCE

CLINIMIX AVIS DE LA COMMISSION DE LA TRANSPARENCE CLINIMIX AVIS DE LA COMMISSION DE LA TRANSPARENCE BAXTER_CLINIMIX N9G15 E et N12G20E_Avis CT_14-02-2007.pdf BAXTER_CLINIMIX N9G15E N12G20E N14G30 N17G35_Avis CT_12-12-2001.pdf BAXTER_CLINIMIX changement

Plus en détail

Votre Infrastructure est-elle? Business Intelligence. Améliorer la capacité d analyse et de décision de vos équipes

Votre Infrastructure est-elle? Business Intelligence. Améliorer la capacité d analyse et de décision de vos équipes Votre Infrastructure est-elle? Business Intelligence Améliorer la capacité d analyse et de décision de vos équipes Sommaire Introduction : Les domaines d application de la Business Intelligence p. 4 Vue

Plus en détail

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring ESSEC Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring Les méthodes d évaluation du risque de crédit pour les PME et les ménages Caractéristiques Comme les montants des crédits et des

Plus en détail

Masses de données. 1. Introduction 2. Problématiques 3. Socle de formation (non présenté) 4. Liens avec Formation INSA

Masses de données. 1. Introduction 2. Problématiques 3. Socle de formation (non présenté) 4. Liens avec Formation INSA Masses de données 1. Introduction 2. Problématiques 3. Socle de formation (non présenté) 4. Liens avec Formation INSA Rédacteurs : Mjo Huguet / N. Jozefowiez 1. Introduction : Besoins Informations et Aide

Plus en détail

UltraBackup NetStation 4. Guide de démarrage rapide

UltraBackup NetStation 4. Guide de démarrage rapide UltraBackup NetStation 4 Guide de démarrage rapide Table des matières 1 Fonctionnalités... 3 1.1 Ce qu UltraBackup NetStation permet de faire... 3 1.2 Ce qu UltraBackup NetStation ne permet pas de faire...

Plus en détail

FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis

FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis Joseph Salmon Télécom ParisTech Jeudi 6 Février Joseph Salmon (Télécom ParisTech) Big Data Jeudi 6 Février 1 / 18 Agenda Contexte et opportunités

Plus en détail

MASTER SIS PRO : logique et sécurité DÉTECTION D INTRUSIONS. Odile PAPINI, LSIS. Université de Toulon et du Var. papini@univ-tln.

MASTER SIS PRO : logique et sécurité DÉTECTION D INTRUSIONS. Odile PAPINI, LSIS. Université de Toulon et du Var. papini@univ-tln. MASTER SIS PRO : logique et sécurité DÉTECTION D INTRUSIONS Odile PAPINI, LSIS. Université de Toulon et du Var. papini@univ-tln.fr Plan Introduction Généralités sur les systèmes de détection d intrusion

Plus en détail

TRS: Sélection des sous-graphes représentants par l intermédiaire des attributs topologiques et K-medoïdes

TRS: Sélection des sous-graphes représentants par l intermédiaire des attributs topologiques et K-medoïdes TRS: Sélection des sous-graphes représentants par l intermédiaire des attributs topologiques et K-medoïdes Mohamed Moussaoui,Wajdi Dhifli,Sami Zghal,Engelbert Mephu Nguifo FSJEG, Université de Jendouba,

Plus en détail

July 1, 2013. Stéphan Clémençon (Télécom ParisTech) Mastère Big Data July 1, 2013 1 / 15

July 1, 2013. Stéphan Clémençon (Télécom ParisTech) Mastère Big Data July 1, 2013 1 / 15 Mastère Spécialisé Big Data Stéphan Clémençon Télécom ParisTech July 1, 2013 Stéphan Clémençon (Télécom ParisTech) Mastère Big Data July 1, 2013 1 / 15 Agenda Contexte et Opportunité Les grandes lignes

Plus en détail

Formation Actuaire Data Scientist. Programme au 24 octobre 2014

Formation Actuaire Data Scientist. Programme au 24 octobre 2014 Formation Actuaire Data Scientist Programme au 24 octobre 2014 A. Eléments logiciels et programmation Python 24h Objectif : Introduction au langage Python et sensibilisation aux grandeurs informatiques

Plus en détail

Visualisation en Fouille de Données

Visualisation en Fouille de Données Université Nice Sophia Antipolis Master Informatique, Fondements & Ingénierie (IFI) Visualisation en Fouille de Données Elaboré par : Abir DILOU Mouna REKIK Encadré par : Mr. Nicolas PASQUIER Année universitaire

Plus en détail

FRANCAIS ENGLISH DEUTSCH ITALIANO ESPANOL NEDERLANDS PORTUGUESES MANUEL UTILISATEUR USER S GUIDE BENUTZERHANDBUCH GUIDA PER L UTENTE GUIA DEL USUARIO

FRANCAIS ENGLISH DEUTSCH ITALIANO ESPANOL NEDERLANDS PORTUGUESES MANUEL UTILISATEUR USER S GUIDE BENUTZERHANDBUCH GUIDA PER L UTENTE GUIA DEL USUARIO PAVE NUMERIQUE CALCULATRICE MANUEL UTILISATEUR USER S GUIDE BENUTZERHANDBUCH GUIDA PER L UTENTE GUIA DEL USUARIO GEBRUIKERSGIDS MANUAL DO USUARIO FRANCAIS ENGLISH DEUTSCH ITALIANO ESPANOL NEDERLANDS PORTUGUESES

Plus en détail

Travailler avec les télécommunications

Travailler avec les télécommunications Travailler avec les télécommunications Minimiser l attrition dans le secteur des télécommunications Table des matières : 1 Analyse de l attrition à l aide du data mining 2 Analyse de l attrition de la

Plus en détail

Les technologies du Big Data

Les technologies du Big Data Les technologies du Big Data PRÉSENTÉ AU 40 E CONGRÈS DE L ASSOCIATION DES ÉCONOMISTES QUÉBÉCOIS PAR TOM LANDRY, CONSEILLER SENIOR LE 20 MAI 2015 WWW.CRIM.CA TECHNOLOGIES: DES DONNÉES JUSQU'À L UTILISATEUR

Plus en détail

Groupe Eyrolles, 2003, ISBN : 2-212-11317-X

Groupe Eyrolles, 2003, ISBN : 2-212-11317-X Groupe Eyrolles, 2003, ISBN : 2-212-11317-X 3 Création de pages dynamiques courantes Dans le chapitre précédent, nous avons installé et configuré tous les éléments indispensables à la mise en œuvre d une

Plus en détail

Algorithmes d'apprentissage

Algorithmes d'apprentissage Algorithmes d'apprentissage 1 Agents qui apprennent à partir d'exemples La problématique : prise de décision automatisée à partir d'un ensemble d'exemples Diagnostic médical Réponse à une demande de prêt

Plus en détail

7. ECONOMIE 7.1. TRAVAIL DE BUREAU ENCODEUR / ENCODEUSE DE DONNEES

7. ECONOMIE 7.1. TRAVAIL DE BUREAU ENCODEUR / ENCODEUSE DE DONNEES CCPQ Rue A. Lavallée, 1 1080 Bruxelles Tél. : 02 690 85 28 Fax : 02 690 85 78 Email : ccpq@profor.be www.enseignement.be 7. ECONOMIE 7.1. TRAVAIL DE BUREAU ENCODEUR / ENCODEUSE DE DONNEES PROFIL DE FORMATION

Plus en détail

Probabilité. Table des matières. 1 Loi de probabilité 2 1.1 Conditions préalables... 2 1.2 Définitions... 2 1.3 Loi équirépartie...

Probabilité. Table des matières. 1 Loi de probabilité 2 1.1 Conditions préalables... 2 1.2 Définitions... 2 1.3 Loi équirépartie... 1 Probabilité Table des matières 1 Loi de probabilité 2 1.1 Conditions préalables........................... 2 1.2 Définitions................................. 2 1.3 Loi équirépartie..............................

Plus en détail

Qu est-ce qu une probabilité?

Qu est-ce qu une probabilité? Chapitre 1 Qu est-ce qu une probabilité? 1 Modéliser une expérience dont on ne peut prédire le résultat 1.1 Ensemble fondamental d une expérience aléatoire Une expérience aléatoire est une expérience dont

Plus en détail

TP n 2 Concepts de la programmation Objets Master 1 mention IL, semestre 2 Le type Abstrait Pile

TP n 2 Concepts de la programmation Objets Master 1 mention IL, semestre 2 Le type Abstrait Pile TP n 2 Concepts de la programmation Objets Master 1 mention IL, semestre 2 Le type Abstrait Pile Dans ce TP, vous apprendrez à définir le type abstrait Pile, à le programmer en Java à l aide d une interface

Plus en détail

Mathématique et Automatique : de la boucle ouverte à la boucle fermée. Maïtine bergounioux Laboratoire MAPMO - UMR 6628 Université d'orléans

Mathématique et Automatique : de la boucle ouverte à la boucle fermée. Maïtine bergounioux Laboratoire MAPMO - UMR 6628 Université d'orléans Mathématique et Automatique : de la boucle ouverte à la boucle fermée Maïtine bergounioux Laboratoire MAPMO - UMR 6628 Université d'orléans Maitine.Bergounioux@labomath.univ-orleans.fr Plan 1. Un peu de

Plus en détail

6 - Le système de gestion de fichiers F. Boyer, UJF-Laboratoire Lig, Fabienne.Boyer@imag.fr

6 - Le système de gestion de fichiers F. Boyer, UJF-Laboratoire Lig, Fabienne.Boyer@imag.fr 6 - Le système de gestion de fichiers F. Boyer, UJF-Laboratoire Lig, Fabienne.Boyer@imag.fr Interface d un SGF Implémentation d un SGF Gestion de la correspondance entre la structure logique et la structure

Plus en détail

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems

Plus en détail

Distribution Uniforme Probabilité de Laplace Dénombrements Les Paris. Chapitre 2 Le calcul des probabilités

Distribution Uniforme Probabilité de Laplace Dénombrements Les Paris. Chapitre 2 Le calcul des probabilités Chapitre 2 Le calcul des probabilités Equiprobabilité et Distribution Uniforme Deux événements A et B sont dits équiprobables si P(A) = P(B) Si il y a équiprobabilité sur Ω, cad si tous les événements

Plus en détail

URECA Initiation Matlab 2 Laurent Ott. Initiation Matlab 2

URECA Initiation Matlab 2 Laurent Ott. Initiation Matlab 2 Initiation Matlab 2 1 Chaînes de caractères (string) Une chaîne de caractères (string en anglais) est une suite ordonnée de caractères (du texte, par exemple). Sous matlab, les chaînes de caractères sont

Plus en détail

Pentaho Business Analytics Intégrer > Explorer > Prévoir

Pentaho Business Analytics Intégrer > Explorer > Prévoir Pentaho Business Analytics Intégrer > Explorer > Prévoir Pentaho lie étroitement intégration de données et analytique. En effet, les services informatiques et les utilisateurs métiers peuvent accéder aux

Plus en détail

Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining.

Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining. 2 jours : Mardi 15 et mercredi 16 novembre 2005 de 9 heures 30 à 17 heures 30 Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining. Madame, Monsieur, On parle

Plus en détail

Outils pour les réseaux de neurones et contenu du CD-Rom

Outils pour les réseaux de neurones et contenu du CD-Rom Outils pour les réseaux de neurones et contenu du CD-Rom Depuis le développement théorique des réseaux de neurones à la fin des années 1980-1990, plusieurs outils ont été mis à la disposition des utilisateurs.

Plus en détail

Enterprise Scrum Organisation des développements chez exo. Agile Tour Rennes 2010 / 10 / 07

Enterprise Scrum Organisation des développements chez exo. Agile Tour Rennes 2010 / 10 / 07 Enterprise Scrum Organisation des développements chez exo Agile Tour Rennes 2010 / 10 / 07 Les Projets et Produits exo Open Source exo JCR exo Portal / GateIn / WebOS exo Social exo Content DMS, WCM, Workflow

Plus en détail

Reconstruction de bâtiments en 3D à partir de nuages de points LIDAR

Reconstruction de bâtiments en 3D à partir de nuages de points LIDAR Reconstruction de bâtiments en 3D à partir de nuages de points LIDAR Mickaël Bergem 25 juin 2014 Maillages et applications 1 Table des matières Introduction 3 1 La modélisation numérique de milieux urbains

Plus en détail

Présentation BAI -CITC

Présentation BAI -CITC Présentation BAI -CITC Expertise reconnue dans des niches technologiques Technologies embarquées Technologies sans contact Technologies d identification et d authentification Sécurité des objets connectés

Plus en détail

Évaluation d une architecture de stockage RDF distribuée

Évaluation d une architecture de stockage RDF distribuée Évaluation d une architecture de stockage RDF distribuée Maeva Antoine 1, Françoise Baude 1, Fabrice Huet 1 1 INRIA MÉDITERRANÉE (ÉQUIPE OASIS), UNIVERSITÉ NICE SOPHIA-ANTIPOLIS, I3S CNRS prénom.nom@inria.fr

Plus en détail

Le bilan neuropsychologique du trouble de l attention. Ania MIRET Montluçon le 4-12- 2009

Le bilan neuropsychologique du trouble de l attention. Ania MIRET Montluçon le 4-12- 2009 Le bilan neuropsychologique du trouble de l attention Ania MIRET Montluçon le 4-12- 2009 Introduction L attention est une fonction de base dont l intégrité est nécessaire au bon fonctionnement cognitif

Plus en détail

EXPLORATION DES BASES DE DONNÉES INDUSTRIELLES À L AIDE DU DATA MINING PERSPECTIVES

EXPLORATION DES BASES DE DONNÉES INDUSTRIELLES À L AIDE DU DATA MINING PERSPECTIVES EXPLORATION DES BASES DE DONNÉES INDUSTRIELLES À L AIDE DU DATA MINING PERSPECTIVES Bruno Agard (1), Andrew Kusiak (2) (1) Département de Mathématiques et de Génie Industriel, École Polytechnique de Montréal,

Plus en détail

2 Serveurs OLAP et introduction au Data Mining

2 Serveurs OLAP et introduction au Data Mining 2-1 2 Serveurs OLAP et introduction au Data Mining 2-2 Création et consultation des cubes en mode client-serveur Serveur OLAP Clients OLAP Clients OLAP 2-3 Intérêt Systèmes serveurs et clients Fonctionnalité

Plus en détail

AWS avancé. Surveiller votre utilisation d EC2

AWS avancé. Surveiller votre utilisation d EC2 10 AWS avancé Dans ce chapitre, nous bâtirons sur les bases que nous avons apprises jusqu ici. Nous étudierons des sujets plus avancés tels que la surveillance de votre utilisation d AWS, l utilisation

Plus en détail

nom : Collège Ste Clotilde

nom : Collège Ste Clotilde UNE CONFIGURATION INFORMATIQUE Objectif : Identifier les éléments principaux d une configuration L ordinateur enregistre des données qu il traite pour produire un résultat Sifflements 20 Notice 12 attache

Plus en détail

BAREME sur 40 points. Informatique - session 2 - Master de psychologie 2006/2007

BAREME sur 40 points. Informatique - session 2 - Master de psychologie 2006/2007 BAREME ur 40 point Informatique - eion 2 - Mater de pychologie 2006/2007 Bae de donnée PRET de MATERIEL AUDIO VISUEL. Remarque : Le ujet comporte 7 page. Vérifier qu il et complet avant de commencer. Une

Plus en détail

Système de contrôle du trafic d une ligne de métro Dossier de tests

Système de contrôle du trafic d une ligne de métro Dossier de tests Système de contrôle du trafic d une ligne de métro Dossier de tests Tests NI557/STL/M2/INFO/UPMC Action Date Auteur Statut Création 05/03/2012 P.Manoury En cours 1 Description et exigences fonctionnelles

Plus en détail

LES DIFFERENTS TYPES DE MESURE

LES DIFFERENTS TYPES DE MESURE LES DIFFERENTS TYPES DE MESURE Licence - Statistiques 2004/2005 REALITE ET DONNEES CHIFFREES Recherche = - mesure. - traduction d une réalité en chiffre - abouti à des tableaux, des calculs 1) Qu est-ce

Plus en détail

DATA ANALYTICS Des données aux connaissances et à la création de valeur

DATA ANALYTICS Des données aux connaissances et à la création de valeur DATA ANALYTICS Des données aux connaissances et à la création de valeur Sommaire Rencontres Inria Industrie p 3 Vos contacts au centre Inria Saclay - île-de-france p 4 Technologies Bertifier Sparklificator

Plus en détail

Exo7. Calculs de déterminants. Fiche corrigée par Arnaud Bodin. Exercice 1 Calculer les déterminants des matrices suivantes : Exercice 2.

Exo7. Calculs de déterminants. Fiche corrigée par Arnaud Bodin. Exercice 1 Calculer les déterminants des matrices suivantes : Exercice 2. Eo7 Calculs de déterminants Fiche corrigée par Arnaud Bodin Eercice Calculer les déterminants des matrices suivantes : Correction Vidéo ( ) 0 6 7 3 4 5 8 4 5 6 0 3 4 5 5 6 7 0 3 5 4 3 0 3 0 0 3 0 0 0 3

Plus en détail

Masters Spécialisés «Actuariat et Prévoyance» et «Actuariat et Finance»

Masters Spécialisés «Actuariat et Prévoyance» et «Actuariat et Finance» Masters Spécialisés «Actuariat et Prévoyance» et «Actuariat et Finance» Introduction au Data Mining K. EL HIMDI elhimdi@menara.ma 1 Sommaire du MODULE Partie 1 : Introduction au Data Mining Partie 2 :

Plus en détail

Sillage Météo. Notion de sillage

Sillage Météo. Notion de sillage Sillage Météo Les représentations météorologiques sous forme d animation satellites image par image sont intéressantes. Il est dommage que les données ainsi visualisées ne soient pas utilisées pour une

Plus en détail

2.4 Représentation graphique, tableau de Karnaugh

2.4 Représentation graphique, tableau de Karnaugh 2 Fonctions binaires 45 2.4 Représentation graphique, tableau de Karnaugh On peut définir complètement une fonction binaire en dressant son tableau de Karnaugh, table de vérité à 2 n cases pour n variables

Plus en détail

Groupe Informatique TechSolCom inc. 1450 City Councillors, b 340 Montreal, H3A2E6. Approbations et. par Félix Martineau

Groupe Informatique TechSolCom inc. 1450 City Councillors, b 340 Montreal, H3A2E6. Approbations et. par Félix Martineau Groupe Informatique TechSolCom inc. 1450 City Councillors, b 340 Montreal, H3A2E6 www.techsolcom.ca Tél: (514) 392-9997 Fax : (514) 392-9940 Approbations et par Félix Martineau http://atlassian.techsolcom.ca/

Plus en détail

NON-LINEARITE ET RESEAUX NEURONAUX

NON-LINEARITE ET RESEAUX NEURONAUX NON-LINEARITE ET RESEAUX NEURONAUX Vêlayoudom MARIMOUTOU Laboratoire d Analyse et de Recherche Economiques Université de Bordeaux IV Avenue. Leon Duguit, 33608 PESSAC, France tel. 05 56 84 85 77 e-mail

Plus en détail

Sauvegarde collaborative entre pairs Ludovic Courtès LAAS-CNRS

Sauvegarde collaborative entre pairs Ludovic Courtès LAAS-CNRS Sauvegarde collaborative entre pairs 1 Sauvegarde collaborative entre pairs Ludovic Courtès LAAS-CNRS Sauvegarde collaborative entre pairs 2 Introduction Pourquoi pair à pair? Utilisation de ressources

Plus en détail

Travaux pratiques. Compression en codage de Huffman. 1.3. Organisation d un projet de programmation

Travaux pratiques. Compression en codage de Huffman. 1.3. Organisation d un projet de programmation Université de Savoie Module ETRS711 Travaux pratiques Compression en codage de Huffman 1. Organisation du projet 1.1. Objectifs Le but de ce projet est d'écrire un programme permettant de compresser des

Plus en détail

Introduction à l Informatique Décisionnelle - Business Intelligence (7)

Introduction à l Informatique Décisionnelle - Business Intelligence (7) Introduction à l Informatique Décisionnelle - Business Intelligence (7) Bernard ESPINASSE Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille Septembre 2013 Emergence

Plus en détail

Scénario: Données bancaires et segmentation de clientèle

Scénario: Données bancaires et segmentation de clientèle Résumé Scénario: Données bancaires et segmentation de clientèle Exploration de données bancaires par des méthodes uni, bi et multidimensionnelles : ACP, AFCM k-means, CAH. 1 Présentation Le travail proposé

Plus en détail

Business Intelligence

Business Intelligence Pour aller plus loin Tous les détails de l offre Microsoft Business Intelligence : www.microsoft.com/france/decisionnel Contact Microsoft France : msfrance@microsoft.com Business Intelligence Votre Infrastructure

Plus en détail

Introduction à La Fouille de Données. Khai thác dữ liệu. Cours N 2. Cours M1 IA «Systèmes Intelligents & Multimédia» Jean-Daniel Zucker

Introduction à La Fouille de Données. Khai thác dữ liệu. Cours N 2. Cours M1 IA «Systèmes Intelligents & Multimédia» Jean-Daniel Zucker 1 /81 Cours IFI M1 Data Mining Introduction à La Fouille de Données Khai thác dữ liệu Cours N 2 Cours M1 IA «Systèmes Intelligents & Multimédia» Jean-Daniel Zucker Chercheur de l IRD à UMMISCO (Modélisation

Plus en détail

MABioVis. Bio-informatique et la

MABioVis. Bio-informatique et la MABioVis Modèles et Algorithmes pour la Bio-informatique et la Visualisation Visite ENS Cachan 5 janvier 2011 MABioVis G GUY MELANÇON (PR UFR Maths Info / EPI GRAVITE) (là, maintenant) - MABioVis DAVID

Plus en détail

GUIDE PRATIQUE DE L INDEXEUR : LES PRINCIPES DE L INDEXATION COLLABORATIVE

GUIDE PRATIQUE DE L INDEXEUR : LES PRINCIPES DE L INDEXATION COLLABORATIVE GUIDE PRATIQUE DE L INDEXEUR : LES PRINCIPES DE L INDEXATION COLLABORATIVE Qu est-ce que l indexation ou annotation- collaborative? Ce procédé permet aux internautes de participer directement à l indexation

Plus en détail

Améliorer les performances du site par l'utilisation de techniques de Web Mining

Améliorer les performances du site par l'utilisation de techniques de Web Mining Améliorer les performances du site par l'utilisation de techniques de Web Mining CLUB SAS 2001 17/18 octobre 2001 Stéfan Galissie LINCOLN stefan.galissie@lincoln.fr contact@web-datamining.net 2001 Sommaire

Plus en détail