LOGO. Module «Big Data» Extraction de Connaissances à partir de Données. Claudia MARINICA MCF, ETIS UCP/ENSEA/CNRS

Dimension: px
Commencer à balayer dès la page:

Download "LOGO. Module «Big Data» Extraction de Connaissances à partir de Données. Claudia MARINICA MCF, ETIS UCP/ENSEA/CNRS Claudia.Marinica@u-cergy."

Transcription

1 Module «Big Data» Extraction de Connaissances à partir de Données Claudia MARINICA MCF, ETIS UCP/ENSEA/CNRS 14 Janvier 2015

2 Pourquoi l extraction de connaissances à partir de données? Ø Données disponibles Ø Limites de l approche humaine Ø Nombreux besoins : Ø Industriels, Ø Médicaux, Ø Marketing, Ø

3 Extraction des Connaissances à partir de Données «l extraction d'informations originales, auparavant inconnues, potentiellement utiles à partir des données.» Pré-traitement Fouille Post-traitement [Fayyad et al., 1996] 5/49

4 Buts : exemples d application Ø diagnostic médical Ø profils de clients, mailing, accord de prêts bancaires,... Ø reconnaissance de caractères manuscrits Ø finance, prévision d évolutions de marchés Ø Customer Relationship Management (CRM) : trouver, gagner et garder ses clients! Ø détection de fraudes, Ø détection de mauvais payeurs,

5 Le pré traitement Ø Intégration des données à partir de différentes sources Ø Conversion des noms d attributs (CNo -> CustomerNumber) Ø Utilisation de la connaissance du domaine pour détecter les doublons (e.g., utiliser les codes postaux) Ø Vérifier la cohérence des données : Ø des contraintes spécifiques à l application Ø Résolution des incohérences Ø «Completion» Ø Le cas des valeurs manquantes Ø Le pré-traitement des données est souvent la tâche la plus coûteuse dans le processus KDD!

6 Le pré traitement Ø Discrétisation des attributs numériques Ø Indépendamment de la tâche de fouille de données Ø Ex. : partitionner le domaine des attributs en des intervalles de même longueur. Ø Spécifique de la tâche de fouille de données Ø Partitionner en des intervalles qui maximisent le gain d information par rapport à la classe Ø Génération d attributs dérivés : Ø Agrégation d un ensembles d attributs Ø Ex. : à partir d appels Ø nb minutes par jour, semaine, appels locaux... Ø Combinaison d attributs : Ø Ex. : variation de revenu (revenu revenu 2008)

7 Le pré traitement Ø Sélection des attributs Ø manuellement : Si les connaissances du domaine sont disponibles pour les attributs. Ø de façon automatique : Ø Trop d attributs -> des répercussions sur l étape de fouille de données Ø Choix des attributs primordial : Ø Ex. : glace à la fraise

8 Data Mining Ø Définition [Fayad et al. 96] La fouille de données est l application d algorithmes efficaces qui identifient les motifs contenus dans une base de données Ø Les différentes méthodes de fouille : Ø Clustering Ø Classification Ø Extraction de motifs fréquents Ø Autres tâches : regression, détection d outlier, etc.

9 Data Mining Ø Méthodes descriptives (ou non supervisées) : Ø objectif : trouver des «formes» interprétables qui permettent de décrire les données sans référence à une base d exemples. C est donc la construction d un modèle et la découverte de relations dans les données. Ø clustering (K-means, CAH), règles d associations, SOM, Ø Méthodes prédictives (ou supervisées) : Ø objectif : à partir d exemples, inférer sur les données pour réaliser des prédictions. En ce basant sur un ensemble d exemples, on infère par exemple les classes d appartenance d autres individus. Les classes sont donc ici connues. Ø classification, régression, k-ppv

10 Data Mining Ø Applications Ø Clustering Ø Segmentation, structuration d un ensemble de documents «web», déterminer des familles de protéines et des «superfamilles», découvertes de communautés Ø Classification : Ø prédiction de la fonction d une protéine, accorder un crédit, interpréter des images en astronomie, etc. Ø Motifs fréquents : Ø mise en rayon, promotion, améliorer la structure d un site web...

11 Evaluation Ø Présentation des motifs découverts avec une visualisation appropriée Ø Evaluation des motifs par l utilisateur Ø Si l évaluation n est pas satisfaisante, alors relancer la fouille avec : Ø des paramètres différents Ø d autres méthodes Ø d autres données Ø Si l évaluation est positive : Ø Intégrer les connaissances découvertes dans une base de connaissance Ø Utiliser ces connaissances dans les futures processus KDD

12 Evaluation Ø Intérêt des motifs découverts : Ø motifs déjà connus? Ø motifs surprenants? Ø motifs pertinents par rapport à l application? Ø Pouvoir prédictif Ø Quel est la précision du motif? Ø Dans combien de cas se produit il? Ø Peut-il se généraliser à d autres cas non couverts?

13 Données, information, connaissance

14 Fouille ou pas fouille? Ø Ce que la fouille de données n est pas : Ø Chercher un numéro de téléphone dans un annuaire téléphonique Ø Effectuer une recherche avec google Ø Ce que la fouille de données est : Ø Analyser des résultats de requêtes effectuées avec google. Ø Analyser la structuration des pages d un annuaire téléphonique

15 Méthodes discutées dans le cours Ø Fouille de motifs (MP) Ø Règle d association, algorithme Apriori Ø Fouille de séquences Ø Clustering (MP) Ø Apprentissage supervisé (AA)

16 10 LOGO Qu est ce qu une donnée? Ø Une collection d objets et leurs attributs ou caractéristiques Ø Type d attribut : Ø Qualitatif Ø Nominal Ø Ordinal Tid Refund Marital Status Attributes Taxable Income 1 Yes Single 125K No 2 No Married 100K No 3 No Single 70K No 4 Yes Married 120K No Cheat Ø Quantitatif Ø Discret Ø Continu Objects 5 No Divorced 95K Yes 6 No Married 60K No 7 Yes Divorced 220K No 8 No Single 85K Yes 9 No Married 75K No 10 No Single 90K Yes

17 Motifs fréquents et règles d association Ø Motivations : chercher des régularités dans les données Ø Analyse du «panier de la ménagère» Ø Quels sont les produits qui sont fréquemment achetés ensembles? Ø Applications : rayonnage, mailing, cross marketing...

18 Recherche de règles d associations Cette méthode a été introduite en 1993 par R. Agrawal, T. Imielinski et A. Swami du centre de recherche d IBM. v Forme : Corps -> Tête [support, confiance] Achat des 2 v Première «trouvaille»? Achat bières Achat couches «Les hommes qui achètent des couches le vendredi soir, ils ont la tendance d acheter également de la bière»

19 Les données TICKET 1 Farine Sucre Lait TICKET 2 Oeuf Sucre Chocolat TICKET 3 Farine Oeuf Sucre Chocolat TICKET 4 Oeuf Chocolat Thé Un ensemble T dont les m éléments sont appelés transactions

20 Principe de construction Contenu d un ticket de caisse TICKET 1 Farine Sucre Lait Création des associations Farine Sucre Sucre Farine Sucre Lait Lait Sucre Lait Farine Farine Lait Un ensemble I dont les n éléments sont appelés items I={Farine, Sucre, Lait, Œuf, Chocolat, Thé}

21 Structure des règles produites On obtient un ensemble de règles de la forme: {Lait, Œuf} {Chocolat} support = 10%, confiance= 25% Cela signifie que 10% des transactions contiennent à la fois les items Lait, Œuf et Chocolat et que 25% des transactions contenant Lait, Œuf contiennent aussi l item Chocolat

22 Les règles d association (plus formellement) Ø Soit I = {i1,i2,..., in} un ensemble de littéraux appelés items. Ø Un itemset X : un ensemble d items X I Ø Une base de données D consiste en un ensemble de transactions ti t.q. ti I Ø On dit que t contient X si X t Ø Les items d une transaction ou d un itemset sont triés suivant un ordre lexigographique Ø Longueur d un itemset = nombre d items qu il contient Ø k-itemset : itemset de longueur k

23 Définitions Ø Support absolu d un itemset X dans D : nombre de transactions qui contiennent X Ø Support relatif de X dans D : pourcentage de transactions de D qui contiennent X Ø Itemset fréquent X dans D : itemset X avec un support minsup Ø Règle d association : règle de la forme X -> Y avec Ø X I, Ø Y I, Ø X Y =

24 Structure des règles produites(2) v Une règle d association a la forme : X X Y où et avec la prémisse est X et la conclusion est Y I Y I X Y = Ο Le support est sup( X Y) = card t { T / X Y t} / card( T) La confiance est conf( X Y) = card card { t T / X Y t} { t T / X t}

25 Recherche des règles intéressantes (1) v Critère d extraction des règles A partir d un ensemble T de transactions, trouver toutes les règles avec un support sup>min_supp et une confiance conf>min_conf où min_supp et min_conf sont des seuils fixés a priori par l utilisateur. Si Chocolat est contenu dans beaucoup de tickets cela devient moins intéressant.

26 Algorithme de base Apriori C est l algorithme proposé par Agrawal et Srikant en La complexité est d ordre O(m). v Recherche des sous-ensembles de I présentant un support sup(x) supérieur à s 0. v Construction des règles dont la confiance est supérieure à c 0.

27 Découverte des règles d association Ø Deux étapes : Ø Découvrir tous les itemsets fréquents dans D Ø Générer les règles d association à partir des itemsets fréquents : Ø Pour tous les itemsets fréquents X : Ø Pour tous les A X : (qui satisfait la contrainte de support) Ø Générer la règle A (X A) (qui satisfait la contrainte de support) Ø Verifier la confiance de la règle

28 Extraction des motifs fréquents (approche naïve) Ø Générer tous les itemsets possibles, puis calculer leur support dans la base de données Ø Problèmes : Ø Comment garder en mémoire un nombre important d itemsets? Ø 100 items => itemsets possibles!!!! Ø Comment calculer le support d un nombre important d itemsets dans une grande base de données (100 million de transactions)?

29 Extraction des motifs fréquents Ø Propriété d anti-monotonie du support : Ø Tous les sous ensembles d un itemset fréquent sont fréquents Ø Si un itemset X n est pas fréquent alors il n existe pas d itemset Y t.q X inclus en Y qui soit fréquent

30 Extraction des motifs fréquents Ø Trouver les 1-itemsets fréquents, puis trouver les 2- itemsets fréquents... Ø Pour trouver les k+1-itemsets fréquents : Ø Seulement considérer les k+1-itemsets t.q. : Ø tous les k-sous-ensembles sont fréquents. Ø Calcul du support : Ø Une passe sur la base de données pour compter le support de tous les itemsets pertinents.

31 Algorithme Apriori Ck: Lk: set of candidate item sets of length k set of all frequent item sets of length k Apriori(D, minsup) L1 := {frequent 1-item sets in D}; k := 2; while Lk-1 do Ck := AprioriCandidateGeneration(Lk 1); for each transaction T D do CT := subset(ck, T); // all candidates from Ck, that are // contained in transaction T; for each candidate c CT do c.count++; Lk := {c Ck (c.count / D ) minsup}; k++; return k Lk;

32 Génération de candidats Propriétés de l ensemble Ck des k-itemsets candidats Sur-ensemble de Lk Significativement plus petit que tous k-itemsets possibles de I

33 Génération de candidats : la jointure

34 Génération de candidats : élagage Etape 2 : l élagage Supprimer tous les éléments de Ck qui ont un (k-1) sous-ensemble qui n appartient pas à Lk-1. Ex. : L3 = {(1 2 3), (1 2 4), (1 3 4), (1 3 5), (2 3 4)} Jointure : C4 = {( ), ( )} Elagage: suppression de ( ) car (3 4 5) n appartient pas à L3 Au final : C4 = {( )}

35 Construction de C 1 Item1 Nombre Farine 2 Sucre 3 Lait 1 Œuf 3 Chocolat 3 Thé 1 On décide de retenir un taux de support de 30%

36 Construction de C 2 Item1 Item2 Nombre Farine Sucre 2 Farine Œuf 1 Farine Chocolat 1 Sucre Œuf 2 Sucre Chocolat 2 Œuf Chocolat 3 L 2 contient 4 couples {Farine,Sucre}, {Sucre, Œuf}, {Sucre, Chocolat} et {Œuf, Chocolat}.

37 Construction de C 3 Item1 Item2 Item3 Nombre Sucre Oeuf Chocolat 2 Insert into C 3 Select p.item1, p.item2, q.item2 From L 2 p, L 2 q where p.item1=q.item1 and p.item2 < q.item2

38 Ensemble des sous-ensembles fréquents L ensemble L des sous-ensembles fréquents est l union des ensembles L 1, L K. L 1 ={Farine, Sucre, Œuf, Chocolat} L 2 ={(Farine,Sucre), (Sucre,Œuf), (Sucre,Chocolat), (Œuf,Chocolat)} L 3 ={(Sucre, Œuf, Chocolat)}

39 Génération des règles à partir des itemsets Pseudo-code : Pour chaque itemset fréquent I : Générer tous les sous-ensembles non vides X de I Pour chaque X de I : Si support(i)/support(x) min_conf alors produire la règle X => (I-X)

40 Construction des règles Pour chaque ensemble fréquent on construit des règles vérifiant la contrainte de seuil de confiance. Un algorithme simple pour produire des règles à partir d un sous-ensemble fréquent f est de considérer tous les sousensembles possibles g de f et de produire la règle g (f-g) si la condition sur la confiance est vérifiée. Cependant si une règle (f-g ) g vérifie la contrainte de confiance, alors, pour chaque partie h de g, la règle (f-h) h vérifie aussi la condition de confiance. Alors on commence par les règles ayant un seul conséquent, puis sur les règles retenues on génère les règles ayant deux conséquents.

41 Tableau des règles Sous-ensemble Règle Support Confiance {Farine, Sucre} Farine->Sucre 2/4 2/2 Sucre->Farine 2/4 2/3 {Sucre, Œuf} Sucre->Oeuf 2/4 2/3 Œuf->Sucre 2/4 2/3 {Sucre, Chocolat} Sucre->Chocolat 2/4 2/3 Chocolat->Sucre 2/4 2/3 {Œuf, Chocolat} Œuf->Chocolat 3/4 3/3 Chocolat->Oeuf 3/4 3/3 {Sucre, Œuf, Chocolat} Sucre->Œuf, Chocolat 2/4 2/3 Œuf, Chocolat->Sucre 2/4 2/3 Œuf->Sucre, Chocolat 2/4 2/3 Sucre, Chocolat-> Œuf 2/4 2/2 Chocolat->Sucre, Œuf 2/4 2/3 Sucre, Œuf->Chocolat 2/4 2/3

42 Tableau des règles intéressantes Liste des règles ayant une confiance égale à 1. Sous-ensemble Règle Confiance lift {Farine, Sucre} Farine->Sucre 2/2 4/3 {Œuf, Chocolat} Œuf->Chocolat 3/3 4/3 Chocolat->Oeuf 3/3 4/3 {Sucre, Œuf, Chocolat} {Sucre, Chocolat}-> Oeuf 2/2 4/3

43 Remarque Le nombre des combinaisons des items croît très rapidement Nombre Combinaisons Le nombre d items est égal à n. Le nombre de combinaisons de k items est égal à n! /( n k)! k!

44 Exercices 46/49

45 Recherche de séquences fréquentes v On est capable de conserver la trace du passage d un même client à différents instants v En plus de la recherche de règles d associations, il est possible de rechercher des séquences d achats fréquentes. v Chaque élément d une séquence fréquente peut être composée de plusieurs items.

46 Structure des données v I un ensemble d items v C un ensemble de clients v D un ensemble ordonné de dates v T un ensemble de transactions Chaque transaction est définie par v Un ensemble d items v Identifiant du client v La date de la transaction

47 Tableau des séquences

48 Séquences v Une séquence est une liste ordonnée de sousensembles d items. v Une relation d ordre partielle sur l ensemble des séquences a=(a 1,,a p ) et b=(b 1,,b p ) deux séquences a est contenu dans b s il existe des entiers i 1 < <i p tel que a 1 b,..., i1 a p b ip

49 Séquence de client v L ensemble des transactions d un client est une séquence particulière, appelée séquence de client. v Le support d une séquence est : sup(s)=(nombre de séquences de clients contenant s)/(nombre total de clients) v Séquence a de client supporte b si b est inclus dans a. v Une séquence qui a le minimum support est appelée large (frequent) itemset

50 Critère d extraction des séquences A partir d un ensemble T de transactions, trouver l ensemble des séquences présentant un support supérieur à s, paramètre de la méthode. Les séquences trouvées sont appelées séquences fréquentes.

51 Algorithme de base v Rechercher les séquences de longueur 1 ayant un support supérieur à s (large sequences). C est l ensemble des sous ensembles fréquents. v A partir des séquences trouvées dans l étape précédente, construire les séquences de longueur 2 avec un support supérieur à s. v Par itération, construire des séquences de longueur k avec un support supérieur à s à partir de celles trouvées pour une longueur k-1.

52 AprioriAll Algorithme v Trouver toutes les séquences fréquentes en 5 étapes : Sort Phase L(arge)itemset Phase Transformation Phase Sequence Phase Maximal Phase

53 AprioriAll Algorithme Customer-Sequence Version of the Database

54 AprioriAll Algorithme Litemset Phase min_sup_count=2 Apriori/DHP FP Growth

55 AprioriAll Algorithme Transformation Phase

56 AprioriAll Algorithme Sequence Phase Large 2-Sequences Customer Sequences Large 1-Sequences 2 Large 3-Sequences Large 4-Sequences Maximal Large Sequences

57 AprioriAll Algorithme Candidate Phase

58 AprioriAll Algorithme Discussion v L algorithme AprioriAll va générer un grand volume de séquences candidat v Scanner bcp de fois la BD v Difficulté dans la fouille de longue séquences

59 Extension de la méthode v Introduction de taxonomies v Introduction de contraintes temporelles Regroupement de transactions par fenêtre glissante Ajout de contraintes temporelles Comment vérifier ces contraintes temporelles

60 Correspondance de Galois { } { } G o H a o A a G f G o ora A a G f O G A O f = =, ), /( ) (, / ) ( ) ( ) ( : { } { } B a H a o O o B g B a ora O o B A g B O A g = =, ), /( ) (, / ) ( ) ( ) ( : intension extension (f,g) est une correspondance de Galois f et g sont deux fonctions monotones et décroissantes

61 Correspondance de Galois Farine Sucre Lait Œuf Chocolat Thé Ticket 1 X X X Ticket 2 X X X Ticket 3 X X X X Ticket 4 X X X

62 Correspondance de Galois Un itemset est fermé si aucun de ses super-ensembles immédiats a le même support que l itemset TID Items 1 ABC 2 ABCD 3 BCE 4 ACDE 5 DE support null A B C D E Fermés AB AC AD AE BC BD BE CD CE DE ABC ABD ABE ACD ACE ADE BCD BCE BDE CDE f(g(e)) = {E} f(g(d)) = {D} ABCD ABCE ABDE ACDE BCDE 0 ABCDE

63

Etude d Algorithmes Parallèles de Data Mining

Etude d Algorithmes Parallèles de Data Mining REPUBLIQUE TUNISIENNE MINISTERE DE L ENSEIGNEMENT SUPERIEUR, DE LA TECHNOLOGIE ET DE LA RECHERCHE SCIENTIFIQUE UNIVERSITE DE TUNIS ELMANAR FACULTE DES SCIENCES DE TUNIS DEPARTEMENT DES SCIENCES DE L INFORMATIQUE

Plus en détail

République Algérienne Démocratique et Populaire

République Algérienne Démocratique et Populaire République Algérienne Démocratique et Populaire وزارة التعليم العالي والبحث العلمي Ministère de l Enseignement Supérieur et de la Recherche Scientifique UNIVERSITE DES SCIENCES ET DE LA TECHNOLOGIE d ORAN

Plus en détail

Data Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.

Data Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto. des des Data Mining Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne 2012-2013 1/65 des des 1 2 des des 3 4 Post-traitement 5 représentation : 6 2/65 des des Définition générale Le

Plus en détail

Introduction au datamining

Introduction au datamining Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des

Plus en détail

Implémentation parallèle de certains algorithmes de fouille de données avec le framework MapReduce

Implémentation parallèle de certains algorithmes de fouille de données avec le framework MapReduce Implémentation parallèle de certains algorithmes de fouille de données avec le framework MapReduce Algorithmes : K-means et Apriori Maria Malek LARIS-EISTI maria.malek@eisti.fr 1 Cloud Computing et MapReduce

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme

Plus en détail

2.4 Représentation graphique, tableau de Karnaugh

2.4 Représentation graphique, tableau de Karnaugh 2 Fonctions binaires 45 2.4 Représentation graphique, tableau de Karnaugh On peut définir complètement une fonction binaire en dressant son tableau de Karnaugh, table de vérité à 2 n cases pour n variables

Plus en détail

Application de K-means à la définition du nombre de VM optimal dans un cloud

Application de K-means à la définition du nombre de VM optimal dans un cloud Application de K-means à la définition du nombre de VM optimal dans un cloud EGC 2012 : Atelier Fouille de données complexes : complexité liée aux données multiples et massives (31 janvier - 3 février

Plus en détail

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI 1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage

Plus en détail

Traitement et exploration du fichier Log du Serveur Web, pour l extraction des connaissances: Web Usage Mining

Traitement et exploration du fichier Log du Serveur Web, pour l extraction des connaissances: Web Usage Mining Traitement et exploration du fichier Log du Serveur Web, pour l extraction des connaissances: Web Usage Mining Mostafa HANOUNE*, Fouzia BENABBOU* *Université Hassan II- Mohammedia, Faculté des sciences

Plus en détail

Pourquoi l apprentissage?

Pourquoi l apprentissage? Pourquoi l apprentissage? Les SE sont basés sur la possibilité d extraire la connaissance d un expert sous forme de règles. Dépend fortement de la capacité à extraire et formaliser ces connaissances. Apprentissage

Plus en détail

Analyse de grandes bases de données en santé

Analyse de grandes bases de données en santé .. Analyse de grandes bases de données en santé Alain Duhamel Michaël Genin Mohamed Lemdani EA 2694 / CERIM Master 2 Recherche Biologie et Santé Journée Thématique Fouille de Données Plan. 1 Problématique.

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci http://liris.cnrs.fr/hamamache.kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de

Plus en détail

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com Intelligence Artificielle et Systèmes Multi-Agents Badr Benmammar bbm@badr-benmammar.com Plan La première partie : L intelligence artificielle (IA) Définition de l intelligence artificielle (IA) Domaines

Plus en détail

Correction du bac blanc CFE Mercatique

Correction du bac blanc CFE Mercatique Correction du bac blanc CFE Mercatique Exercice 1 (4,5 points) Le tableau suivant donne l évolution du nombre de bénéficiaires de minima sociaux en milliers : Année 2002 2003 2004 2005 2006 2007 2008 2009

Plus en détail

Spécificités, Applications et Outils

Spécificités, Applications et Outils Spécificités, Applications et Outils Ricco Rakotomalala Université Lumière Lyon 2 Laboratoire ERIC Laboratoire ERIC 1 Ricco Rakotomalala ricco.rakotomalala@univ-lyon2.fr http://chirouble.univ-lyon2.fr/~ricco/data-mining

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane

Plus en détail

INTRODUCTION AU DATA MINING

INTRODUCTION AU DATA MINING INTRODUCTION AU DATA MINING 6 séances de 3 heures mai-juin 2006 EPF - 4 ème année - Option Ingénierie d Affaires et de Projets Bertrand LIAUDET TP DE DATA MINING Le TP et le projet consisteront à mettre

Plus en détail

Data Mining. Master 1 Informatique - Mathématiques UAG

Data Mining. Master 1 Informatique - Mathématiques UAG Data Mining Master 1 Informatique - Mathématiques UAG 1.1 - Introduction Data Mining? On parle de Fouille de données Data Mining Extraction de connaissances à partir de données Knowledge Discovery in Data

Plus en détail

L'intelligence d'affaires: la statistique dans nos vies de consommateurs

L'intelligence d'affaires: la statistique dans nos vies de consommateurs L'intelligence d'affaires: la statistique dans nos vies de consommateurs Jean-François Plante, HEC Montréal Marc Fredette, HEC Montréal Congrès de l ACFAS, Université Laval, 6 mai 2013 Intelligence d affaires

Plus en détail

Introduction aux outils BI de SQL Server 2014. Fouille de données avec SQL Server Analysis Services (SSAS)

Introduction aux outils BI de SQL Server 2014. Fouille de données avec SQL Server Analysis Services (SSAS) MIT820: Entrepôts de données et intelligence artificielle Introduction aux outils BI de SQL Server 2014 Fouille de données avec SQL Server Analysis Services (SSAS) Description générale Ce tutoriel a pour

Plus en détail

IBM SPSS Direct Marketing 21

IBM SPSS Direct Marketing 21 IBM SPSS Direct Marketing 21 Remarque : Avant d utiliser ces informations et le produit qu elles concernent, lisez les informations générales sous Remarques sur p. 109. Cette version s applique à IBM SPSS

Plus en détail

Agenda de la présentation

Agenda de la présentation Le Data Mining Techniques pour exploiter l information Dan Noël 1 Agenda de la présentation Concept de Data Mining ou qu est-ce que le Data Mining Déroulement d un projet de Data Mining Place du Data Mining

Plus en détail

" # $ % % & ' ( ) * +,! '()*+ *, + ' +' + ' ' -+ - +.+. /0 / 1 0 12 1 1 2 34+ 4 1 +. 50 5 * 0 4 * 0 6! "##$ % &!

 # $ % % & ' ( ) * +,! '()*+ *, + ' +' + ' ' -+ - +.+. /0 / 1 0 12 1 1 2 34+ 4 1 +. 50 5 * 0 4 * 0 6! ##$ % &! "# $ %%& ' ( )*+, '()*+,'+''-++.+/0112134+1.50*406 "##$ %& 8CC "#$%& ' ( )* +,-./ 0 123 456+7 3 7-55-89.*/ 0 +3 *+:3 ;< =3 3-3 8 0 23 >-8-3 >5? //*/*0;* @A: *53,,3 / * $/ >B+? - 5, 2 34*56 7 /+#** //8

Plus en détail

Les enjeux du Big Data Innovation et opportunités de l'internet industriel. Datasio 2013

Les enjeux du Big Data Innovation et opportunités de l'internet industriel. Datasio 2013 Les enjeux du Big Data Innovation et opportunités de l'internet industriel François Royer froyer@datasio.com Accompagnement des entreprises dans leurs stratégies quantitatives Valorisation de patrimoine

Plus en détail

Hervé Couturier EVP, SAP Technology Development

Hervé Couturier EVP, SAP Technology Development Hervé Couturier EVP, SAP Technology Development Hervé Biausser Directeur de l Ecole Centrale Paris Bernard Liautaud Fondateur de Business Objects Questions à: Hervé Couturier Hervé Biausser Bernard Liautaud

Plus en détail

LES DIFFERENTS TYPES DE MESURE

LES DIFFERENTS TYPES DE MESURE LES DIFFERENTS TYPES DE MESURE Licence - Statistiques 2004/2005 REALITE ET DONNEES CHIFFREES Recherche = - mesure. - traduction d une réalité en chiffre - abouti à des tableaux, des calculs 1) Qu est-ce

Plus en détail

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems

Plus en détail

Analyse de situations contextuelles métiers : application à la documentation de maintenance dans l'aéronautique

Analyse de situations contextuelles métiers : application à la documentation de maintenance dans l'aéronautique MOTS-CLÉS : Analyse de situations contextuelles métiers : application à la documentation de maintenance dans l'aéronautique Hamdi Chaker*, Max Chevalier* Chantal Soulé-Dupuy*, André Tricot** * IRIT/Université

Plus en détail

Traitement des données avec Microsoft EXCEL 2010

Traitement des données avec Microsoft EXCEL 2010 Traitement des données avec Microsoft EXCEL 2010 Vincent Jalby Septembre 2012 1 Saisie des données Les données collectées sont saisies dans une feuille Excel. Chaque ligne correspond à une observation

Plus en détail

1 Modélisation d être mauvais payeur

1 Modélisation d être mauvais payeur 1 Modélisation d être mauvais payeur 1.1 Description Cet exercice est très largement inspiré d un document que M. Grégoire de Lassence de la société SAS m a transmis. Il est intitulé Guide de démarrage

Plus en détail

Grégoire de Lassence. Copyright 2006, SAS Institute Inc. All rights reserved.

Grégoire de Lassence. Copyright 2006, SAS Institute Inc. All rights reserved. Grégoire de Lassence 1 Grégoire de Lassence Responsable Pédagogie et Recherche Département Académique Tel : +33 1 60 62 12 19 gregoire.delassence@fra.sas.com http://www.sas.com/france/academic SAS dans

Plus en détail

Améliorer les performances du site par l'utilisation de techniques de Web Mining

Améliorer les performances du site par l'utilisation de techniques de Web Mining Améliorer les performances du site par l'utilisation de techniques de Web Mining CLUB SAS 2001 17/18 octobre 2001 Stéfan Galissie LINCOLN stefan.galissie@lincoln.fr contact@web-datamining.net 2001 Sommaire

Plus en détail

1S Modèles de rédaction Enoncés

1S Modèles de rédaction Enoncés Par l équipe des professeurs de 1S du lycée Parc de Vilgénis 1S Modèles de rédaction Enoncés Produit scalaire & Corrigés Exercice 1 : définition du produit scalaire Soit ABC un triangle tel que AB, AC

Plus en détail

Manipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner

Manipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner Le cas Orion Star Manipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner Le cas Orion Star... 1 Manipulation de données avec SAS Enterprise Guide et modélisation

Plus en détail

ricco.rakotomalala@univ-lyon2.fr http://chirouble.univ-lyon2.fr/~ricco/cours/ Publications, ressources, liens, logiciels,

ricco.rakotomalala@univ-lyon2.fr http://chirouble.univ-lyon2.fr/~ricco/cours/ Publications, ressources, liens, logiciels, Université Lumière Lyon 2 Tutoriels Tanagra - http://tutoriels-data-mining.blogspot.fr/ 1 ricco.rakotomalala@univ-lyon2.fr http://chirouble.univ-lyon2.fr/~ricco/cours/ Publications, ressources, liens,

Plus en détail

Groupe de Discussion Big Data Aperçu des technologies et applications. Stéphane MOUTON stephane.mouton@cetic.be

Groupe de Discussion Big Data Aperçu des technologies et applications. Stéphane MOUTON stephane.mouton@cetic.be Groupe de Discussion Big Data Aperçu des technologies et applications Stéphane MOUTON stephane.mouton@cetic.be Recherche appliquée et transfert technologique q Agréé «Centre Collectif de Recherche» par

Plus en détail

COURS SYRRES RÉSEAUX SOCIAUX INTRODUCTION. Jean-Loup Guillaume

COURS SYRRES RÉSEAUX SOCIAUX INTRODUCTION. Jean-Loup Guillaume COURS SYRRES RÉSEAUX SOCIAUX INTRODUCTION Jean-Loup Guillaume Le cours Enseignant : Jean-Loup Guillaume équipe Complex Network Page du cours : http://jlguillaume.free.fr/www/teaching-syrres.php Évaluation

Plus en détail

EXPLORATION DES BASES DE DONNÉES INDUSTRIELLES À L AIDE DU DATA MINING PERSPECTIVES

EXPLORATION DES BASES DE DONNÉES INDUSTRIELLES À L AIDE DU DATA MINING PERSPECTIVES EXPLORATION DES BASES DE DONNÉES INDUSTRIELLES À L AIDE DU DATA MINING PERSPECTIVES Bruno Agard (1), Andrew Kusiak (2) (1) Département de Mathématiques et de Génie Industriel, École Polytechnique de Montréal,

Plus en détail

Chapitre 9 : Informatique décisionnelle

Chapitre 9 : Informatique décisionnelle Chapitre 9 : Informatique décisionnelle Sommaire Introduction... 3 Définition... 3 Les domaines d application de l informatique décisionnelle... 4 Architecture d un système décisionnel... 5 L outil Oracle

Plus en détail

Accélérer l agilité de votre site de e-commerce. Cas client

Accélérer l agilité de votre site de e-commerce. Cas client Accélérer l agilité de votre site de e-commerce Cas client L agilité «outillée» devient nécessaire au delà d un certain facteur de complexité (clients x produits) Elevé Nombre de produits vendus Faible

Plus en détail

Masters Spécialisés «Actuariat et Prévoyance» et «Actuariat et Finance»

Masters Spécialisés «Actuariat et Prévoyance» et «Actuariat et Finance» Masters Spécialisés «Actuariat et Prévoyance» et «Actuariat et Finance» Introduction au Data Mining K. EL HIMDI elhimdi@menara.ma 1 Sommaire du MODULE Partie 1 : Introduction au Data Mining Partie 2 :

Plus en détail

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1 Christophe CANDILLIER Cours de DataMining mars 2004 age 1 1. Introduction 2. rocessus du DataMining 3. Analyse des données en DataMining 4. Analyse en Ligne OLA 5. Logiciels 6. Bibliographie Christophe

Plus en détail

Les 10 Secrets pour Réussir une Bonne Présentation! Bruno ROUSSELON Consultant Sage CRM Ludovic CRIQUET Consultant Sage CRM

Les 10 Secrets pour Réussir une Bonne Présentation! Bruno ROUSSELON Consultant Sage CRM Ludovic CRIQUET Consultant Sage CRM Les 10 Secrets pour Réussir une Bonne Présentation! Bruno ROUSSELON Consultant Sage CRM Ludovic CRIQUET Consultant Sage CRM Sommaire Introduction Les 10 secrets d une Bonne Démo Conclusion Secret N 1 :

Plus en détail

Contributions aux techniques de Prise de Décision et de Valorisation Financière

Contributions aux techniques de Prise de Décision et de Valorisation Financière No d ordre 2007-ISAL-0039 Année 2007 Thèse Contributions aux techniques de Prise de Décision et de Valorisation Financière Présentée devant L Institut National des Sciences Appliquées de Lyon Pour obtenir

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

Le théorème de Thalès et sa réciproque

Le théorème de Thalès et sa réciproque Le théorème de Thalès et sa réciproque I) Agrandissement et Réduction d une figure 1) Définition : Lorsque toutes les longueurs d une figure F sont multipliées par un même nombre k on obtient une autre

Plus en détail

Arbres binaires de décision

Arbres binaires de décision 1 Arbres binaires de décision Résumé Arbres binaires de décision Méthodes de construction d arbres binaires de décision, modélisant une discrimination (classification trees) ou une régression (regression

Plus en détail

Didier MOUNIEN Samantha MOINEAUX

Didier MOUNIEN Samantha MOINEAUX Didier MOUNIEN Samantha MOINEAUX 08/01/2008 1 Généralisation des ERP ERP génère une importante masse de données Comment mesurer l impact réel d une décision? Comment choisir entre plusieurs décisions?

Plus en détail

Techniques d analyse et de conception d outils pour la gestion du processus de segmentation des abonnés des entreprises de télécommunication

Techniques d analyse et de conception d outils pour la gestion du processus de segmentation des abonnés des entreprises de télécommunication Techniques d analyse et de conception d outils pour la gestion du processus de segmentation des abonnés des entreprises de télécommunication R. Carlos Nana Mbinkeu 1,3, C. Tangha 1, A. Chomnoue 1, A. Kuete

Plus en détail

Plan 1/9/2013. Génération et exploitation de données. CEP et applications. Flux de données et notifications. Traitement des flux Implémentation

Plan 1/9/2013. Génération et exploitation de données. CEP et applications. Flux de données et notifications. Traitement des flux Implémentation Complex Event Processing Traitement de flux de données en temps réel Romain Colle R&D Project Manager Quartet FS Plan Génération et exploitation de données CEP et applications Flux de données et notifications

Plus en détail

Les droites (d 1 ) et (d 2 ) sont sécantes en A Le point A est le point d intersection des 2 droites

Les droites (d 1 ) et (d 2 ) sont sécantes en A Le point A est le point d intersection des 2 droites I Droites perpendiculaires Lorsque deux droites se coupent, on dit qu elles sont sécantes Les droites (d 1 ) et (d 2 ) sont sécantes en A Le point A est le point d intersection des 2 droites Lorsque deux

Plus en détail

Rappels sur les suites - Algorithme

Rappels sur les suites - Algorithme DERNIÈRE IMPRESSION LE 14 septembre 2015 à 12:36 Rappels sur les suites - Algorithme Table des matières 1 Suite : généralités 2 1.1 Déition................................. 2 1.2 Exemples de suites............................

Plus en détail

Data 2 Business : La démarche de valorisation de la Data pour améliorer la performance de ses clients

Data 2 Business : La démarche de valorisation de la Data pour améliorer la performance de ses clients Data 2 Business : La démarche de valorisation de la Data pour améliorer la performance de ses clients Frédérick Vautrain, Dir. Data Science - Viseo Laurent Lefranc, Resp. Data Science Analytics - Altares

Plus en détail

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP)

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP) Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP) Définition (G. Gardarin) Entrepôt : ensemble de données historisées variant

Plus en détail

TP Bases de données réparties

TP Bases de données réparties page 1 TP Bases de données réparties requêtes réparties Version corrigée Auteur : Hubert Naacke, révision 5 mars 2003 Mots-clés: bases de données réparties, fragmentation, schéma de placement, lien, jointure

Plus en détail

Une comparaison de méthodes de discrimination des masses de véhicules automobiles

Une comparaison de méthodes de discrimination des masses de véhicules automobiles p.1/34 Une comparaison de méthodes de discrimination des masses de véhicules automobiles A. Rakotomamonjy, R. Le Riche et D. Gualandris INSA de Rouen / CNRS 1884 et SMS / PSA Enquêtes en clientèle dans

Plus en détail

Cours d Analyse. Fonctions de plusieurs variables

Cours d Analyse. Fonctions de plusieurs variables Cours d Analyse Fonctions de plusieurs variables Licence 1ère année 2007/2008 Nicolas Prioux Université de Marne-la-Vallée Table des matières 1 Notions de géométrie dans l espace et fonctions à deux variables........

Plus en détail

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique Objectifs Clustering On ne sait pas ce qu on veut trouver : on laisse l algorithme nous proposer un modèle. On pense qu il existe des similarités entre les exemples. Qui se ressemble s assemble p. /55

Plus en détail

Diagnostic de la dépression et prédiction de l efficacité d un traitement chez des patients atteints d un désordre dépressif majeur

Diagnostic de la dépression et prédiction de l efficacité d un traitement chez des patients atteints d un désordre dépressif majeur Université du Québec en Outaouais Département d informatique et d ingénierie Diagnostic de la dépression et prédiction de l efficacité d un traitement chez des patients atteints d un désordre dépressif

Plus en détail

Programmation linéaire

Programmation linéaire Programmation linéaire DIDIER MAQUIN Ecole Nationale Supérieure d Electricité et de Mécanique Institut National Polytechnique de Lorraine Mathématiques discrètes cours de 2ème année Programmation linéaire

Plus en détail

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.

Soit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée. ANALYSE 5 points Exercice 1 : Léonie souhaite acheter un lecteur MP3. Le prix affiché (49 ) dépasse largement la somme dont elle dispose. Elle décide donc d économiser régulièrement. Elle a relevé qu elle

Plus en détail

Note de cours. Introduction à Excel 2007

Note de cours. Introduction à Excel 2007 Note de cours Introduction à Excel 2007 par Armande Pinette Cégep du Vieux Montréal Excel 2007 Page: 2 de 47 Table des matières Comment aller chercher un document sur CVMVirtuel?... 8 Souris... 8 Clavier

Plus en détail

Séquence 2. Repérage dans le plan Équations de droites. Sommaire

Séquence 2. Repérage dans le plan Équations de droites. Sommaire Séquence Repérage dans le plan Équations de droites Sommaire 1 Prérequis Repérage dans le plan 3 Équations de droites 4 Synthèse de la séquence 5 Exercices d approfondissement Séquence MA0 1 1 Prérequis

Plus en détail

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT Ces exercices portent sur les items 2, 3 et 5 du programme d informatique des classes préparatoires,

Plus en détail

1 radian. De même, la longueur d un arc de cercle de rayon R et dont l angle au centre a pour mesure α radians est α R. R AB =R.

1 radian. De même, la longueur d un arc de cercle de rayon R et dont l angle au centre a pour mesure α radians est α R. R AB =R. Angles orientés Trigonométrie I. Préliminaires. Le radian Définition B R AB =R C O radian R A Soit C un cercle de centre O. Dire que l angle géométrique AOB a pour mesure radian signifie que la longueur

Plus en détail

http://mondomaine.com/dossier : seul le dossier dossier sera cherché, tous les sousdomaines

http://mondomaine.com/dossier : seul le dossier dossier sera cherché, tous les sousdomaines Principales fonctionnalités de l outil Le coeur du service suivre les variations de position d un mot-clé associé à une URL sur un moteur de recherche (Google - Bing - Yahoo) dans une locale (association

Plus en détail

IBM SPSS Direct Marketing

IBM SPSS Direct Marketing IBM SPSS Statistics 19 IBM SPSS Direct Marketing Comprenez vos clients et renforcez vos campagnes marketing Points clés Avec IBM SPSS Direct Marketing, vous pouvez : Comprendre vos clients de manière plus

Plus en détail

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21 IODAA de l 1nf0rmation à la Décision par l Analyse et l Apprentissage IODAA Informations générales 2 Un monde nouveau Des données numériques partout en croissance prodigieuse Comment en extraire des connaissances

Plus en détail

Exprimer ce coefficient de proportionnalité sous forme de pourcentage : 3,5 %

Exprimer ce coefficient de proportionnalité sous forme de pourcentage : 3,5 % 23 CALCUL DE L INTÉRÊT Tau d intérêt Paul et Rémi ont reçu pour Noël, respectivement, 20 et 80. Ils placent cet argent dans une banque, au même tau. Au bout d une année, ce placement leur rapportera une

Plus en détail

Introduc;on à l intelligence d affaires et aux entrepôts de données

Introduc;on à l intelligence d affaires et aux entrepôts de données MTI820 Entrepôts de données et intelligence d affaires Introduc;on à l intelligence d affaires et aux entrepôts de données C. Desrosiers Département de génie logiciel et des TI MTI820 Hiver 2011 S. ChaBi,

Plus en détail

Construction d un EDD avec SQL 2008 R2. D. Ploix - M2 Miage - EDD - Création

Construction d un EDD avec SQL 2008 R2. D. Ploix - M2 Miage - EDD - Création Construction d un EDD avec SQL 2008 R2 Plan Analyse du DW construit Construction de la base DW dans SQL 2008 Construction des tables de faits et dimensions Injection des données Étapes de l injection des

Plus en détail

Excel 2007 Niveau 3 Page 1 www.admexcel.com

Excel 2007 Niveau 3 Page 1 www.admexcel.com Excel 2007 Niveau 3 Page 1 TABLE DES MATIERES UTILISATION DE LISTES DE DONNEES... 4 REMARQUES PREALABLES SUR LES LISTES DE DONNEES... 4 METTRE EN FORME LE TABLEAU... 6 METTRE LA LISTE A JOUR... 7 a/ Directement

Plus en détail

Les algorithmes de fouille de données

Les algorithmes de fouille de données Février 2005 Les algorithmes de fouille de données DATAMINING Techniques appliquées à la vente, aux services client, interdictions. Cycle C Informatique Remerciements Je remercie les personnes, les universités

Plus en détail

Marketing. en 12 étapes clés. Une introduction au Marketing Automation Comment délivrer le bon contenu au bon moment à son interlocuteur

Marketing. en 12 étapes clés. Une introduction au Marketing Automation Comment délivrer le bon contenu au bon moment à son interlocuteur Marketing Automation en 12 étapes clés Une introduction au Marketing Automation Comment délivrer le bon contenu au bon moment à son interlocuteur Marketing Automation : pourquoi cela fonctionne mieux qu

Plus en détail

Enjeux mathématiques et Statistiques du Big Data

Enjeux mathématiques et Statistiques du Big Data Enjeux mathématiques et Statistiques du Big Data Mathilde Mougeot LPMA/Université Paris Diderot, mathilde.mougeot@univ-paris-diderot.fr Mathématique en Mouvements, Paris, IHP, 6 Juin 2015 M. Mougeot (Paris

Plus en détail

Visualisation en Fouille de Données

Visualisation en Fouille de Données Université Nice Sophia Antipolis Master Informatique, Fondements & Ingénierie (IFI) Visualisation en Fouille de Données Elaboré par : Abir DILOU Mouna REKIK Encadré par : Mr. Nicolas PASQUIER Année universitaire

Plus en détail

Travaux pratiques avec RapidMiner

Travaux pratiques avec RapidMiner Travaux pratiques avec RapidMiner Master Informatique de Paris 6 Spécialité IAD Parcours EDOW Module Algorithmes pour la Fouille de Données Janvier 2012 Prise en main Généralités RapidMiner est un logiciel

Plus en détail

Plan. Data mining (partie 2) Data Mining : Utilisateur ou Statisticien? Data Mining : Cocktail de techniques. Master MIAGE - ENITE.

Plan. Data mining (partie 2) Data Mining : Utilisateur ou Statisticien? Data Mining : Cocktail de techniques. Master MIAGE - ENITE. Plan Data mining (partie 2) Introduction 1. Les tâches du data mining 2. Le processus de data mining Master MIAGE - ENITE Spécialité ACSI 3. Les bases de l'analyse de données 4. Les modèles du data mining

Plus en détail

Les Entrepôts de Données

Les Entrepôts de Données Les Entrepôts de Données Grégory Bonnet Abdel-Illah Mouaddib GREYC Dépt Dépt informatique :: GREYC Dépt Dépt informatique :: Cours Cours SIR SIR Systèmes d information décisionnels Nouvelles générations

Plus en détail

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes. Promotion X 004 COURS D ANALYSE DES STRUCTURES MÉCANIQUES PAR LA MÉTHODE DES ELEMENTS FINIS (MEC 568) contrôle non classant (7 mars 007, heures) Documents autorisés : polycopié ; documents et notes de

Plus en détail

1 Recherche en table par balayage

1 Recherche en table par balayage 1 Recherche en table par balayage 1.1 Problème de la recherche en table Une table désigne une liste ou un tableau d éléments. Le problème de la recherche en table est celui de la recherche d un élément

Plus en détail

Les algorithmes de base du graphisme

Les algorithmes de base du graphisme Les algorithmes de base du graphisme Table des matières 1 Traçage 2 1.1 Segments de droites......................... 2 1.1.1 Algorithmes simples.................... 3 1.1.2 Algorithmes de Bresenham (1965).............

Plus en détail

Introduction à l Informatique Décisionnelle - Business Intelligence (7)

Introduction à l Informatique Décisionnelle - Business Intelligence (7) Introduction à l Informatique Décisionnelle - Business Intelligence (7) Bernard ESPINASSE Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille Septembre 2013 Emergence

Plus en détail

Présentation du module Base de données spatio-temporelles

Présentation du module Base de données spatio-temporelles Présentation du module Base de données spatio-temporelles S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Partie 1 : Notion de bases de données (12,5h ) Enjeux et principes

Plus en détail

Le Langage SQL version Oracle

Le Langage SQL version Oracle Université de Manouba École Supérieure d Économie Numérique Département des Technologies des Systèmes d Information Le Langage SQL version Oracle Document version 1.1 Mohamed Anis BACH TOBJI anis.bach@isg.rnu.tn

Plus en détail

Vecteurs. I Translation. 1. Définition :

Vecteurs. I Translation. 1. Définition : Vecteurs I Translation Soit A et B deux points du plan. On appelle translation qui transforme A en B la transformation du plan qui a tout point M associe le point M tel que [AM ] et [BM] aient le même

Plus en détail

Statistiques Descriptives à une dimension

Statistiques Descriptives à une dimension I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des

Plus en détail

Items étudiés dans le CHAPITRE N5. 7 et 9 p 129 D14 Déterminer par le calcul l'antécédent d'un nombre par une fonction linéaire

Items étudiés dans le CHAPITRE N5. 7 et 9 p 129 D14 Déterminer par le calcul l'antécédent d'un nombre par une fonction linéaire CHAPITRE N5 FONCTIONS LINEAIRES NOTION DE FONCTION FONCTIONS LINEAIRES NOTION DE FONCTION FONCTIONS LINEAIRES NOTION DE FONCTION Code item D0 D2 N30[S] Items étudiés dans le CHAPITRE N5 Déterminer l'image

Plus en détail

Continuité et dérivabilité d une fonction

Continuité et dérivabilité d une fonction DERNIÈRE IMPRESSIN LE 7 novembre 014 à 10:3 Continuité et dérivabilité d une fonction Table des matières 1 Continuité d une fonction 1.1 Limite finie en un point.......................... 1. Continuité

Plus en détail

La demande Du consommateur. Contrainte budgétaire Préférences Choix optimal

La demande Du consommateur. Contrainte budgétaire Préférences Choix optimal La demande Du consommateur Contrainte budgétaire Préférences Choix optimal Plan du cours Préambule : Rationalité du consommateur I II III IV V La contrainte budgétaire Les préférences Le choix optimal

Plus en détail

Les bases de données

Les bases de données Les bases de données Introduction aux fonctions de tableur et logiciels ou langages spécialisés (MS-Access, Base, SQL ) Yves Roggeman Boulevard du Triomphe CP 212 B-1050 Bruxelles (Belgium) Idée intuitive

Plus en détail

CONJUGUÉ D'UN POINT PAR RAPPORT À UN TRIANGLE

CONJUGUÉ D'UN POINT PAR RAPPORT À UN TRIANGLE CONJUGUÉ D'UN POINT PAR RAPPORT À UN TRIANGLE Jean Luc Bovet, Auvernier L'article de Monsieur Jean Piquerez (Bulletin de la SSPMP No 86), consacré aux symédianes me paraît appeler une généralisation. En

Plus en détail

RapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/2011. 1.1 Présentation. 1.2 Ressources

RapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/2011. 1.1 Présentation. 1.2 Ressources Master Maths Finances 2010/2011 Data Mining janvier 2011 RapidMiner 1 Introduction 1.1 Présentation RapidMiner est un logiciel open source et gratuit dédié au data mining. Il contient de nombreux outils

Plus en détail

Quatrième partie IV. Test. Test 15 février 2008 1 / 71

Quatrième partie IV. Test. Test 15 février 2008 1 / 71 Quatrième partie IV Test Test 15 février 2008 1 / 71 Outline Introduction 1 Introduction 2 Analyse statique 3 Test dynamique Test fonctionnel et structurel Test structurel Test fonctionnel 4 Conclusion

Plus en détail

DATA MINING FOR SCIENTISTS

DATA MINING FOR SCIENTISTS DATA MINING FOR SCIENTISTS LAYACHI BENTABET, Bishop s University, Winter 2007 Notes par Philippe Giabbanelli I. Une introduction à la fouille de données 1) Les Grandes Etapes Classification. On prédit

Plus en détail

Découverte du tableur CellSheet

Découverte du tableur CellSheet Découverte du tableur CellSheet l application pour TI-83 Plus et TI-84 Plus. Réalisé par Guy Juge Professeur de mathématiques et formateur IUFM de l académie de Caen Pour l équipe des formateurs T 3 Teachers

Plus en détail