Fouille des données Introduction

Save this PDF as:
 WORD  PNG  TXT  JPG

Dimension: px
Commencer à balayer dès la page:

Download "Fouille des données Introduction"

Transcription

1 Fouille des données p. 1/? Fouille des données Introduction Maria Malek Filière TSI EISTI

2 Fouille des données p. 2/? Vous avez dit? Data Mining?

3 Fouille des données p. 2/? Vous avez dit? Data Mining? Découverte de connaissances à partir de données? un processus itératif par lequel on extrait des connaissances valides, nouvelles, potentiellement utiles et compréhensibles [Fayyad et al., 1995]

4 Fouille des données p. 2/? Vous avez dit? Data Mining? Découverte de connaissances à partir de données? un processus itératif par lequel on extrait des connaissances valides, nouvelles, potentiellement utiles et compréhensibles [Fayyad et al., 1995] "Comment faire parler les données? "

5 Fouille des données p. 3/? Autour du data mining : les domaines Apprentissage Automatique (ML) DM : suppose la pré-existence de très grands volumes de données Data mining.

6 Fouille des données p. 3/? Autour du data mining : les domaines Apprentissage Automatique (ML) DM : suppose la pré-existence de très grands volumes de données Data mining. Statistiques, Analyse des données Stat : but = vérification d hypothèses. DM : but = découverte de nouvelles connaissances.

7 Fouille des données p. 4/? Processus du Data Mining - 1 Analyse du problème d application.

8 Fouille des données p. 4/? Processus du Data Mining - 1 Analyse du problème d application. Sélection et exploration des données évaluer la qualité des données, visualiser, analyser les distributions et les regroupements, détecter les insuffisances, pathologies des données.

9 Fouille des données p. 4/? Processus du Data Mining - 1 Analyse du problème d application. Sélection et exploration des données évaluer la qualité des données, visualiser, analyser les distributions et les regroupements, détecter les insuffisances, pathologies des données. Pré-traitement des données

10 Fouille des données p. 4/? Processus du Data Mining - 1 Analyse du problème d application. Sélection et exploration des données évaluer la qualité des données, visualiser, analyser les distributions et les regroupements, détecter les insuffisances, pathologies des données. Pré-traitement des données nettoyage bruit, valeurs manquantes, valeurs aberrantes,

11 Fouille des données p. 4/? Processus du Data Mining - 1 Analyse du problème d application. Sélection et exploration des données évaluer la qualité des données, visualiser, analyser les distributions et les regroupements, détecter les insuffisances, pathologies des données. Pré-traitement des données nettoyage bruit, valeurs manquantes, valeurs aberrantes, réduction sélection des instances sélection, extraction, combinaison des variables,

12 Processus du Data Mining - 1 Analyse du problème d application. Sélection et exploration des données évaluer la qualité des données, visualiser, analyser les distributions et les regroupements, détecter les insuffisances, pathologies des données. Pré-traitement des données nettoyage bruit, valeurs manquantes, valeurs aberrantes, réduction sélection des instances sélection, extraction, combinaison des variables, transformation discrétisation des variables continues, binarisation des variables nominales, ajout de nouvelles variables (induction constructive). Fouille des données p. 4/?

13 Processus du Data Mining - 1 Analyse du problème d application. Sélection et exploration des données évaluer la qualité des données, visualiser, analyser les distributions et les regroupements, détecter les insuffisances, pathologies des données. Pré-traitement des données nettoyage bruit, valeurs manquantes, valeurs aberrantes, réduction sélection des instances sélection, extraction, combinaison des variables, transformation discrétisation des variables continues, binarisation des variables nominales, ajout de nouvelles variables (induction constructive). Fouille des données p. 4/?

14 Fouille des données p. 5/? Processus du Data Mining - 4 L apprentissage «data mining» une méthode d extraction de connaissances.

15 Fouille des données p. 5/? Processus du Data Mining - 4 L apprentissage «data mining» une méthode d extraction de connaissances. Evaluation et interprétation des résultats critères différents suivant la tâche.

16 Fouille des données p. 6/? Les données?? Une donnée est un enregistrement,un individu (statistique), une instance (orienté objet), un point, un vecteur.

17 Fouille des données p. 6/? Les données?? Une donnée est un enregistrement,un individu (statistique), une instance (orienté objet), un point, un vecteur. Un attribut peut être de nature qualitative ou quantitative, ou même un enregistrement (comme la date).

18 Fouille des données p. 6/? Les données?? Une donnée est un enregistrement,un individu (statistique), une instance (orienté objet), un point, un vecteur. Un attribut peut être de nature qualitative ou quantitative, ou même un enregistrement (comme la date). Structure de base : un exemple/cas/observation = vecteur de p attributs ou variables chaque attribut prend sa valeur dans un domaine donné.

19 Fouille des données p. 6/? Les données?? Une donnée est un enregistrement,un individu (statistique), une instance (orienté objet), un point, un vecteur. Un attribut peut être de nature qualitative ou quantitative, ou même un enregistrement (comme la date). Structure de base : un exemple/cas/observation = vecteur de p attributs ou variables chaque attribut prend sa valeur dans un domaine donné. Ensemble d attribut - valeur : Techniques de logique d ordre 0 ou propositionnelle.

20 Fouille des données p. 6/? Les données?? Une donnée est un enregistrement,un individu (statistique), une instance (orienté objet), un point, un vecteur. Un attribut peut être de nature qualitative ou quantitative, ou même un enregistrement (comme la date). Structure de base : un exemple/cas/observation = vecteur de p attributs ou variables chaque attribut prend sa valeur dans un domaine donné. Ensemble d attribut - valeur : Techniques de logique d ordre 0 ou propositionnelle. Attributs & relations : Apprentissage relationnel & programmation inductive logique (logique de prédicats).

21 Fouille des données p. 7/? Les données : exemple - 1 NUM CIEL TEMP. HUMI. VENT CLASSE 1 ensoleillé élevé forte non N 2 ensoleillé élevé forte oui N 3 couvert élevé forte non P 4 pluvieux moyenne forte non P 5 pluvieux basse normale non P 6 pluvieux basse normale oui N 7 couvert basse normale oui P Table 1: Description des conditions météorologiques

22 Fouille des données p. 8/? Les données : exemple - 2 NUM CIEL TEMP. HUMI. VENT CLASSE 8 ensoleillé moyenne forte non N 9 ensoleillé basse normale non P 10 pluvieux moyenne normale non P 11 ensoleillé moyenne normale oui P 12 couvert moyenne forte oui P 13 couvert élevé normale non P 14 pluvieux moyenne forte oui N Table 2: Description des conditions météorologiques

23 Fouille des données p. 9/? Nature des variables.. Indépendante & Dépendante

24 Fouille des données p. 9/? Nature des variables.. Indépendante & Dépendante Variable indépendante/explicative/prédictive : variable dont la valeur est obtenue par observation

25 Fouille des données p. 9/? Nature des variables.. Indépendante & Dépendante Variable indépendante/explicative/prédictive : variable dont la valeur est obtenue par observation Variable dépendante/réponse/cible : variable dont la valeur dépend d autres variables

26 Fouille des données p. 9/? Nature des variables.. Indépendante & Dépendante Variable indépendante/explicative/prédictive : variable dont la valeur est obtenue par observation Variable dépendante/réponse/cible : variable dont la valeur dépend d autres variables Apprentissage supervisé & non supervisé

27 Fouille des données p. 9/? Nature des variables.. Indépendante & Dépendante Variable indépendante/explicative/prédictive : variable dont la valeur est obtenue par observation Variable dépendante/réponse/cible : variable dont la valeur dépend d autres variables Apprentissage supervisé & non supervisé Apprentissage non supervisé : pas de variable cible ex. regroupement (clustering).

28 Fouille des données p. 9/? Nature des variables.. Indépendante & Dépendante Variable indépendante/explicative/prédictive : variable dont la valeur est obtenue par observation Variable dépendante/réponse/cible : variable dont la valeur dépend d autres variables Apprentissage supervisé & non supervisé Apprentissage non supervisé : pas de variable cible ex. regroupement (clustering). Apprentissage supervisé : une variable cible (valeur à prédire) ex. classification.

29 Fouille des données p. 10/? Résultat du processus Connaissances sont extraites sous forme d un :

30 Fouille des données p. 10/? Résultat du processus Connaissances sont extraites sous forme d un : modèle : un résumé global de l ensemble de données applicable sur n importe quelle instance appartenant à l espace des données ;

31 Fouille des données p. 10/? Résultat du processus Connaissances sont extraites sous forme d un : modèle : un résumé global de l ensemble de données applicable sur n importe quelle instance appartenant à l espace des données ; motif (pattern) : résumé local d une région de l espace des données ; exemple : une règle.

32 Fouille des données p. 11/? Applications du Data Mining Domaines supervisés :

33 Fouille des données p. 11/? Applications du Data Mining Domaines supervisés : Chaque instance = p variables prédictives + 1 variable cible (à prédire)

34 Fouille des données p. 11/? Applications du Data Mining Domaines supervisés : Chaque instance = p variables prédictives + 1 variable cible (à prédire) Classification : variable cible discrète Exemple : diagnostiquer une maladie, etc.

35 Fouille des données p. 11/? Applications du Data Mining Domaines supervisés : Chaque instance = p variables prédictives + 1 variable cible (à prédire) Classification : variable cible discrète Exemple : diagnostiquer une maladie, etc. Régression : variable cible continue Exemple : estimer la valeur d un bien, etc.

36 Fouille des données p. 11/? Applications du Data Mining Domaines supervisés : Chaque instance = p variables prédictives + 1 variable cible (à prédire) Classification : variable cible discrète Exemple : diagnostiquer une maladie, etc. Régression : variable cible continue Exemple : estimer la valeur d un bien, etc. Domaines non supervisés :

37 Fouille des données p. 11/? Applications du Data Mining Domaines supervisés : Chaque instance = p variables prédictives + 1 variable cible (à prédire) Classification : variable cible discrète Exemple : diagnostiquer une maladie, etc. Régression : variable cible continue Exemple : estimer la valeur d un bien, etc. Domaines non supervisés : Regroupement(clustering) Exemple : détecter le profil utilisateur,etc.

38 Fouille des données p. 11/? Applications du Data Mining Domaines supervisés : Chaque instance = p variables prédictives + 1 variable cible (à prédire) Classification : variable cible discrète Exemple : diagnostiquer une maladie, etc. Régression : variable cible continue Exemple : estimer la valeur d un bien, etc. Domaines non supervisés : Regroupement(clustering) Exemple : détecter le profil utilisateur,etc. Association Exemple analyser les logs utilisateurs d un serveur web, etc.

39 Fouille des données p. 12/? Tâches du Data Mining Prédiction : Classification, Régression, Association.

40 Fouille des données p. 12/? Tâches du Data Mining Prédiction : Classification, Régression, Association. Description Visualisation, Regroupement, Association.

41 Fouille des données p. 13/? Conception d un algorithme DM Structure de modèle/motif : la forme des connaissances à extraire des données : arbre de décision, réseau de neurones.

42 Fouille des données p. 13/? Conception d un algorithme DM Structure de modèle/motif : la forme des connaissances à extraire des données : arbre de décision, réseau de neurones. Fonction d évaluation : permet de mesurer la qualité d un modèle ; Exemple : classification: taux d exemples bien classés.

43 Fouille des données p. 13/? Conception d un algorithme DM Structure de modèle/motif : la forme des connaissances à extraire des données : arbre de décision, réseau de neurones. Fonction d évaluation : permet de mesurer la qualité d un modèle ; Exemple : classification: taux d exemples bien classés. Méthode de recherche : stratégie utilisée pour parcourir l espace d hypothèses et pour trouver celle qui optimise la fonction d évaluation.

44 Fouille des données p. 13/? Conception d un algorithme DM Structure de modèle/motif : la forme des connaissances à extraire des données : arbre de décision, réseau de neurones. Fonction d évaluation : permet de mesurer la qualité d un modèle ; Exemple : classification: taux d exemples bien classés. Méthode de recherche : stratégie utilisée pour parcourir l espace d hypothèses et pour trouver celle qui optimise la fonction d évaluation. Stratégie de gestion des données : la façon de stocker, d indexer et d accéder aux données.

45 Fouille des données p. 14/? Côté Pratique.. Etude de la problématique de la classification

46 Fouille des données p. 14/? Côté Pratique.. Etude de la problématique de la classification Comment valider un classifieur.

47 Fouille des données p. 14/? Côté Pratique.. Etude de la problématique de la classification Comment valider un classifieur. Etude de l algorithme k plus proche voisins.

48 Fouille des données p. 14/? Côté Pratique.. Etude de la problématique de la classification Comment valider un classifieur. Etude de l algorithme k plus proche voisins. Utilisation du logiciel Weka.

49 Fouille des données p. 15/? La classification Types de classeurs Construction d un modèle arborescent permettant de prédire la classe d une donnée. Estimation directe de la classe d une donnée en fonction des exemples. Construction d un modèle réglable par l humain (les réseaux de neurones, et les machines à vecteurs supports).

50 Fouille des données p. 16/? Validation d un classeur - 1 L erreur d un classeur Er est la probabilité que ce classeur ne prédise pas correctement la classe d une donnée.

51 Fouille des données p. 16/? Validation d un classeur - 1 L erreur d un classeur Er est la probabilité que ce classeur ne prédise pas correctement la classe d une donnée. Le taux de succès est 1 Er.

52 Fouille des données p. 16/? Validation d un classeur - 1 L erreur d un classeur Er est la probabilité que ce classeur ne prédise pas correctement la classe d une donnée. Le taux de succès est 1 Er. L erreur apparente Erapp est mesurée sur les exemples utilisés pour la construction du classeur.

53 Fouille des données p. 16/? Validation d un classeur - 1 L erreur d un classeur Er est la probabilité que ce classeur ne prédise pas correctement la classe d une donnée. Le taux de succès est 1 Er. L erreur apparente Erapp est mesurée sur les exemples utilisés pour la construction du classeur. Estimer la qualité d un classeur : L ensemble d apprentissage X app ; L ensemble de test X test qui permet d estimer l erreur de classification ; on connaît la classe de chaque exemple dans cet l ensemble.

54 Fouille des données p. 17/? Validation d un classeur - 2 Mesure de qualité d un classeur : cas de classification binaire :

55 Fouille des données p. 17/? Validation d un classeur - 2 Mesure de qualité d un classeur : cas de classification binaire : VP/VN : Le nombre de vrais positifs/négatifs : les exemples de classe positive/négative et dont la classe est prédite comme positive/négative.

56 Fouille des données p. 17/? Validation d un classeur - 2 Mesure de qualité d un classeur : cas de classification binaire : VP/VN : Le nombre de vrais positifs/négatifs : les exemples de classe positive/négative et dont la classe est prédite comme positive/négative. FP/FN : Les exemples de classe négative/positive et dont la classe est prédite comme positive/négative.

57 Fouille des données p. 17/? Validation d un classeur - 2 Mesure de qualité d un classeur : cas de classification binaire : VP/VN : Le nombre de vrais positifs/négatifs : les exemples de classe positive/négative et dont la classe est prédite comme positive/négative. FP/FN : Les exemples de classe négative/positive et dont la classe est prédite comme positive/négative. Construction de la matrice de confusion VP FN - FP VN

58 Fouille des données p. 18/? Validation d un classeur - 3 Mesure de qualité d un classeur : cas de classification binaire :

59 Fouille des données p. 18/? Validation d un classeur - 3 Mesure de qualité d un classeur : cas de classification binaire : On définit dans la suite quatre mesures : La précision pour les positifs et les négatifs : V N V N+FN ; le rappel sur les positifs et les négatifs V P : V P+FN, : V N V N+FP. V P V P+FP, La précision mesure la proportion des exemples vraiment positifs parmi ceux qui étaient classés positifs. Le rappel mesure la proportion des exemples positifs trouvés parmi tous les exemples positifs.

60 Fouille des données p. 18/? Validation d un classeur - 3 Mesure de qualité d un classeur : cas de classification binaire : On définit dans la suite quatre mesures : La précision pour les positifs et les négatifs : V N V N+FN ; le rappel sur les positifs et les négatifs V P : V P+FN, : V N V N+FP. V P V P+FP, La précision mesure la proportion des exemples vraiment positifs parmi ceux qui étaient classés positifs. Le rappel mesure la proportion des exemples positifs trouvés parmi tous les exemples positifs.

61 Fouille des données p. 18/? Validation d un classeur - 3 Mesure de qualité d un classeur : cas de classification binaire : On définit dans la suite quatre mesures : La précision pour les positifs et les négatifs : V N V N+FN ; le rappel sur les positifs et les négatifs V P : V P+FN, : V N V N+FP. V P V P+FP, La précision mesure la proportion des exemples vraiment positifs parmi ceux qui étaient classés positifs. Le rappel mesure la proportion des exemples positifs trouvés parmi tous les exemples positifs.

62 Fouille des données p. 19/? Validation d un classeur - 4 Technique : validation croisée : Découper l ensemble d exemples en n sous ensembles disjoints. Chaque classe doit apparaître avec les même fréquence dans les n ensembles. Soit A,B,C une division en trois sous ensemble, Le classifieur construit à partir de A B est appelé AD A B, L erreur de généralisation calculée sur C est appelé Er c. Le taux d erreur est alors estimée par Er = Er A+Er B +Er c 3

63 Fouille des données p. 19/? Validation d un classeur - 4 Technique : validation croisée : Découper l ensemble d exemples en n sous ensembles disjoints. Chaque classe doit apparaître avec les même fréquence dans les n ensembles. Soit A,B,C une division en trois sous ensemble, Le classifieur construit à partir de A B est appelé AD A B, L erreur de généralisation calculée sur C est appelé Er c. Le taux d erreur est alors estimée par Er = Er A+Er B +Er c 3

64 Fouille des données p. 20/? Validation d un classeur - 5 Méthode Bootstrap : Un ensemble E : nous construisons l ensemble d apprentissage X app. Les exemples qui restent constituent l ensemble X test. on effectue N tirages aléatoires a partir de E avec remise. La probabilité qu un exemple x ne soit jamais tiré est égal à (1 1 N )N, N > +,e 1 = X app = 63.2, X gn = 36.8 E = E app E test

Introduction Cours Data Warhousing et Data Mining. Introduction. Dr A. DJEFFAL.

Introduction Cours Data Warhousing et Data Mining. Introduction. Dr A. DJEFFAL. 1ère année IA 2016-2017 www.abdelhamid-djeffal.net 1 / 26 Quoi? 2 / 26 Quoi? Rechercher des informations 2 / 26 Quoi? Rechercher des informations Laquelle? 2 / 26 Quoi? Rechercher des informations Laquelle?

Plus en détail

11 Objectifs et principes du Machine Learning

11 Objectifs et principes du Machine Learning Big Data : Informatique pour les données et calculs massifs 11 Objectifs et principes du Machine Learning Stéphane Vialle Stephane.Vialle@centralesupelec.fr http://www.metz.supelec.fr/~vialle Objectifs

Plus en détail

Éléments du programme de l option IAD

Éléments du programme de l option IAD Éléments du programme de l option IAD Maria Malek 19 octobre 2010 1 Module exploration des données - 134h Les cours propres à ce module sont : Apprentissage symbolique - 20h. Intelligence collective et

Plus en détail

Ingénierie d Aide à la Décision

Ingénierie d Aide à la Décision Ingénierie d Aide à la Décision p. 1/1 Ingénierie d Aide à la Décision Maria Malek, Hervé de Milleville Ecole Internationale des Sciences de Traitement de l Information (EISTI) http://www.eisti.fr/ mma/html-iad/iad.html

Plus en détail

Utilisation des méthodes Support Vector Machine (SVM) dans l analyse des bases de

Utilisation des méthodes Support Vector Machine (SVM) dans l analyse des bases de Utilisation des méthodes Support Vector Machine (SVM) dans l analyse des bases de données Abdelhamid DJEFFAL Encadré par: M.C. BABAHENINI Co-Encadré par: A. TALEB-AHMED Département d informatique, Laboratoire

Plus en détail

Apprentissage automatique. Arbres de décision

Apprentissage automatique. Arbres de décision Apprentissage automatique Arbres de décision Intérêts des arbres de décision Expressivité approximation de fonctions à valeurs discrètes capable d apprendre des expressions disjonctives Lisibilité peut

Plus en détail

Intelligence Artificielle

Intelligence Artificielle Intelligence Artificielle p. 1/1 Intelligence Artificielle Les arbres de décisions Maria Malek Département Systèmes Informatiques Formels & Intelligents Intelligence Artificielle p. 2/1 Extraire les connaissances

Plus en détail

Fouille de données : Approche de règles d association

Fouille de données : Approche de règles d association Chapitre 1 Fouille de données : Approche de règles d association 1.1 Introduction Nous présentons dans ce chapitre une approche assez récente de fouille de données qui est fondée sur la découverte de règles

Plus en détail

Expériences sur des données avec une boîte à outils (WEKA)

Expériences sur des données avec une boîte à outils (WEKA) Expériences sur des données avec une boîte à outils (WEKA) Projet DATA MANING Réalisé par :IKHIBI Fatima Ezzahra Soutenu par : Mr Antoine Cornuéjols Mr Yves Lechevallier Mr Edwin Diday Master II ISI Année

Plus en détail

Table des matières. Introduction

Table des matières. Introduction Table des matières Auteur Introduction XI XIII Chapitre 1 Méthodes de collecte de données qualitatives 1 1. Les fondements de l approche qualitative 1 1.1. Exploration 1 1.2. Explication 2 1.3. Révélation

Plus en détail

Techniques de DM pour la GRC dans les banques Page 42

Techniques de DM pour la GRC dans les banques Page 42 Techniques de DM pour la GRC dans les banques Page 42 V.1 Introduction Après avoir présenté l architecture de notre système dans le chapitre précédent et l illustration que ce système fait des opérations

Plus en détail

Table des matières. Préface, de Gilbert Saporta...V. Avant-propos...VII. 1. Panorama du data mining... 1

Table des matières. Préface, de Gilbert Saporta...V. Avant-propos...VII. 1. Panorama du data mining... 1 Table des matières Préface, de Gilbert Saporta...V Avant-propos...VII 1. Panorama du data mining... 1 1.1. Qu est-ce que le data mining?... 1 1.2. À quoi sert le data mining?... 5 1.2.1. Le data mining

Plus en détail

Apprentissage automatique à partir d exemples

Apprentissage automatique à partir d exemples Apprentissage automatique à partir d exemples DEA Génomique et Informatique année 2002-2003 Francois.Coste@irisa.fr Apprentissage? Machine Learning is the study of computer algorithms that automatically

Plus en détail

DIC9150 Concepts fondamentaux de l informatique cognitive

DIC9150 Concepts fondamentaux de l informatique cognitive DIC9150 Concepts fondamentaux de l informatique cognitive Forage de Données (Data-Mining) Roger Villemaire Département d informatique UQAM 29 novembre 2016 Plan 1 Données et Information 2 Traitement des

Plus en détail

Évaluation de l apprentissage: méthodes

Évaluation de l apprentissage: méthodes Évaluation de l apprentissage: méthodes Questions L induction est une forme d inférence faillible, il faut donc savoir évaluer sa qualité A. Cornuéjols LRI! Questions types: Quelle est la performance d

Plus en détail

Évaluation de l apprentissage: méthodes

Évaluation de l apprentissage: méthodes Évaluation de l apprentissage: méthodes Questions L induction est une forme d inférence faillible, il faut donc savoir évaluer sa qualité!! LRI!! Questions types: Quelle est la performance d un système

Plus en détail

Ingénierie d Aide à la Décision. Ecole Internationale des Sciences de Traitement de l Information (EISTI) mma/html-iad/iad.

Ingénierie d Aide à la Décision. Ecole Internationale des Sciences de Traitement de l Information (EISTI)  mma/html-iad/iad. Ingénierie d Aide à la Décision p. 1/1 Ingénierie d Aide à la Décision Ecole Internationale des Sciences de Traitement de l Information (EISTI) http://www.eisti.fr/ mma/html-iad/iad.html Ingénierie d Aide

Plus en détail

Évaluation de l apprentissage: méthodes

Évaluation de l apprentissage: méthodes Évaluation de l apprentissage: méthodes Questions L induction est une forme d inférence faillible, il faut donc savoir évaluer sa qualité A. Cornuéjols LRI Questions types: Quelle est la performance d

Plus en détail

Data Mining TP M2DS / Novembre 2017

Data Mining TP M2DS / Novembre 2017 Data Mining TP M2DS - 2017/2018 24 Novembre 2017 1 Installation de Knime Knime est un logiciel disponible gratuitement. Le lien suivant https://www.knime.org/ downloads/overview permet le téléchargement

Plus en détail

Aperçu. Introduction aux arbres de décision. Plan. Plan. Exemple. Liva Ralaivola

Aperçu. Introduction aux arbres de décision. Plan. Plan. Exemple. Liva Ralaivola Aperçu Introduction aux arbres de décision Liva Ralaivola LIF, UMR 6166 CNRS Université de Provence liva.ralaivola@lif.univ-mrs.fr (, +) (, +) (, +) => losange Forme carré cercle + Couleur bleue rouge

Plus en détail

Traitement du signal et ses applications

Traitement du signal et ses applications Traitement du signal et ses applications et machine learning - Introduction - Objectifs Des observations expérimentales à l élaboration de théories : Au 16 e siècle, J. Kepler élabore sa théorie du mouvement

Plus en détail

Aperçu. Introduction aux arbres de décision. Plan. Plan. Exemple. Liva Ralaivola. 21 mars Lecture d un arbre? Construction de l arbre?

Aperçu. Introduction aux arbres de décision. Plan. Plan. Exemple. Liva Ralaivola. 21 mars Lecture d un arbre? Construction de l arbre? Aperçu Introduction aux arbres de décision Liva Ralaivola LIF, UMR 6166 CNRS Université de Provence liva.ralaivola@lif.univ-mrs.fr 21 mars 2007 (, +) (, +) (, +) => Lecture d un arbre? Construction de

Plus en détail

UFR MIME. 6 Mars 2017

UFR MIME. 6 Mars 2017 L apprentissage automatique (2016-2017) UFR MIME Université 6 Mars 2017 Sommaire 1 2 3 Akinator http://fr.akinator.com/personnages/ Exemple simple Donnee qualitatives Patient Toux Fievre Poids Douleur

Plus en détail

LE DATA MINING (APPLIQUÉ AUX DONNÉES D APPRENTISSAGE): L ÉQUILIBRE ENTRE ÉTHIQUE ET EFFICACITÉ BEN-MANSON TOUSSAINT, PHD LABORATOIRE SITERE

LE DATA MINING (APPLIQUÉ AUX DONNÉES D APPRENTISSAGE): L ÉQUILIBRE ENTRE ÉTHIQUE ET EFFICACITÉ BEN-MANSON TOUSSAINT, PHD LABORATOIRE SITERE LE DATA MINING (APPLIQUÉ AUX DONNÉES D APPRENTISSAGE): L ÉQUILIBRE ENTRE ÉTHIQUE ET EFFICACITÉ BEN-MANSON TOUSSAINT, PHD LABORATOIRE SITERE DATA MINING Séminaire "Sécurité des données" - Ben-Manson TOUSSAINT

Plus en détail

FOUILLE DE FORUM INTERNET

FOUILLE DE FORUM INTERNET FOUILLE DE FORUM INTERNET Forum Web Intelligence & Usages Anna STAVRIANOU, Laboratoire ERIC anna.stavrianou@univ-lyon2.fr 4 février 2010 Caractéristiques d une discussion Sujet : «Y a-t-il trop de commémorations

Plus en détail

Apprentissage, réseaux de neurones et modèles graphiques (RCP209)

Apprentissage, réseaux de neurones et modèles graphiques (RCP209) Apprentissage, réseaux de neurones et modèles graphiques (RCP209) Arbres de décision Marin FERECATU (prenom.nom@cnam.fr) http ://cedric.cnam.fr/vertigo/cours/ml2/ Département Informatique Conservatoire

Plus en détail

UN PARCOURS BIG DATA EN ALTERNANCE DANS UNE LICENCE PROFESSIONNELLE

UN PARCOURS BIG DATA EN ALTERNANCE DANS UNE LICENCE PROFESSIONNELLE DOSSIER SPÉCIAL UN PARCOURS BIG DATA EN ALTERNANCE DANS UNE LICENCE PROFESSIONNELLE Sophie DUPUY-CHESSA 1, Sophie LAMBERT-LACROIX 2 et Gaëlle BLANCO-LAINE 3 TITLE A Big Data apprenticeship academic curriculum

Plus en détail

Réseaux de neurones Multicouches

Réseaux de neurones Multicouches Réseaux de neurones Multicouches Partie 1 Caractérisé par: état interne s S voisinage s 1,., s n fonction de transfert f changement d état s=f(s 1, s 2,.,s n ) s 1 s 2 Neurone élémentaire s=f(s 1, s 2,.,s

Plus en détail

2.3 Le framework OdefiX : Définir et explorer des modèles environnementaux

2.3 Le framework OdefiX : Définir et explorer des modèles environnementaux 2.3 Le framework OdefiX : Définir et explorer des modèles environnementaux Ce chapitre détaille le cadre proposé afin de développer divers systèmes d aide à la gestion de l eau et plus généralement d aide

Plus en détail

Ricco Rakotomalala. Université Lumière Lyon 2

Ricco Rakotomalala. Université Lumière Lyon 2 Université Lumière Lyon 2 Tutoriels Tanagra - http://tutoriels-data-mining.blogspot.fr/ 1 Tableau de données Variables, caractères, attributs, Descripteurs, champs, etc. Success Wages Job Refunding Y 0

Plus en détail

Etudiant : Nadine TOUNGOU. Professeur: Edwin DIDDAY

Etudiant : Nadine TOUNGOU. Professeur: Edwin DIDDAY Etudiant : Nadine TOUNGOU Professeur: Edwin DIDDAY Plan du projet 1 Etat de l art... 3 1.1 Définition... 3 1.2 Liste non exhaustive de quelques principaux logiciels :... 3 1.3 Les domaines d utilisation

Plus en détail

Réseaux de neurones Travaux Pratiques

Réseaux de neurones Travaux Pratiques Master informatique 1 2008/2009 Apprentissage par l exemple mai 2009 Réseaux de neurones Travaux Pratiques Cette séance de travaux pratiques se propose d étudier d abord l utilisation des réseaux de neurones

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Gilles Gasso INSA Rouen -Département ASI Laboratoire LITIS 3 septembre 206. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso Introduction au Data-Mining

Plus en détail

Mesures d évaluation Multi-classes Réduction de dimension

Mesures d évaluation Multi-classes Réduction de dimension Mesures d évaluation Multi-classes Réduction de dimension Cours 10 Nicolas Baskiotis nicolas.baskiotis@lip6.fr Master 1 DAC équipe MLIA, Laboratoire d Informatique de Paris 6 (LIP6) Université Pierre et

Plus en détail

L apprentissage automatique ( ) UFR MIME. 7 décembre Université Lille 3. K-plus proche Voisin (KNN/KPP) Lille 3.

L apprentissage automatique ( ) UFR MIME. 7 décembre Université Lille 3. K-plus proche Voisin (KNN/KPP) Lille 3. L apprentissage automatique (2016-2017) UFR MIME Université 7 décembre 2016 Sommaire 1 2 3 Pourquoi Faire l Apprentissage Apprentissage Au lieu de programmer les regles manuellement dans un programme,

Plus en détail

ANALYSE DES DONNEES METHODES DESCRIPTIVES. Pierre-Louis GONZALEZ

ANALYSE DES DONNEES METHODES DESCRIPTIVES. Pierre-Louis GONZALEZ ANALYSE DES DONNEES METHODES DESCRIPTIVES Pierre-Louis GONZALEZ ANALYSE DES DONNEES METHODES DESCRIPTIVES Analyse en Composantes Principales (A.C.P.) Analyse factorielle des correspondances simples (A.F.C.)

Plus en détail

Application du réseaux de neurones à l apprentissage supervisé. Ricco RAKOTOMALALA

Application du réseaux de neurones à l apprentissage supervisé. Ricco RAKOTOMALALA Application du réseaux de neurones à l apprentissage supervisé Ricco RAKOTOMALALA Tutoriels Tanagra - http://tutoriels-data-mining.blogspot.fr/ Métaphore biologique Fonctionnement du cerveau Transmission

Plus en détail

LAAS-CNRS. JAUMOUILLÉ Rodolphe

LAAS-CNRS. JAUMOUILLÉ Rodolphe 2009 LAAS-CNRS JAUMOUILLÉ Rodolphe [ Tutoriel pour le logiciel de Simulation de communications distribuées et de reconnaissance de formes d une SmartSurface] Tutoriel pour un logiciel permettant de simuler

Plus en détail

Arbres de décision. Applications en médecine. Michaël Genin. Université de Lille 2

Arbres de décision. Applications en médecine. Michaël Genin. Université de Lille 2 Arbres de décision Applications en médecine Michaël Genin Université de Lille 2 EA 2694 - Santé Publique : Epidémiologie et Qualité des soins michaelgenin@univ-lille2fr Plan 1 Introduction 2 Méthodologie

Plus en détail

LICENCE PROFESSIONNELLE

LICENCE PROFESSIONNELLE LICENCE PROFESSIONNELLE METIERS DE L'INFORMATIQUE : SYSTEMES D'INFORMATION ET GESTION DES DONNEES (SIGD) Contenu détaillé du parcours : BIG - DATA Contenu détaillé de la Licence Professionnelle MI-SIGD-Big-Data

Plus en détail

A.S. Indexation Multimédia RTP 9. Indexation, Recherche et Stockage d Informations Thème 2. Ph. Joly, équipe SAMOVA F. Sèdes, équipe SIG/D2S2

A.S. Indexation Multimédia RTP 9. Indexation, Recherche et Stockage d Informations Thème 2. Ph. Joly, équipe SAMOVA F. Sèdes, équipe SIG/D2S2 A.S. Indexation Multimédia RTP 9 Indexation, Recherche et Stockage d Informations Thème 2 Ph. Joly, équipe SAMOVA F. Sèdes, équipe SIG/D2S2 Equipes : Pyramide 2 e.c. 2 th. SAMoVA 5 e.c. 7 th. SIG 12 e.c.

Plus en détail

3.4 Arbres de décision

3.4 Arbres de décision 3.4 Arbres de décision Les arbres de décision représentent une méthode très efficace d apprentissage supervisé. Il s agit de partitionner un ensemble de données en des groupes les plus homogènes possible

Plus en détail

sites.google.com/site/latifadekhici

sites.google.com/site/latifadekhici DekhiciLatifa@gmail.com sites.google.com/site/latifadekhici Plan Représentation des connaissances Extraction des connaissances Représentation des connaissances Types Logique Réseaux sémantiques et Frames

Plus en détail

Dan Noël. Objectifs de la session. Option_Data Mining Modélisation dans Clementine

Dan Noël. Objectifs de la session. Option_Data Mining Modélisation dans Clementine Option_Data Mining Modélisation dans Clementine Dan Noël 1 Objectifs de la session Découvrir les outils de Clementine destinés à la création de modèles de Data Mining. 2 Le nœud TYPER Cet élément permet

Plus en détail

PRÉSENTATION DU PROJET IMAGIWEB

PRÉSENTATION DU PROJET IMAGIWEB PRÉSENTATION DU PROJET IMAGIWEB COMMENT ANALYSER LES DYNAMIQUES D OPINION SUR LE WEB 2.0? Julien VELCIN et Julien BOYADJIAN Journées d étude «Etudier le Web politique : Regards croisés» Lyon, le 12 mai

Plus en détail

Systèmes intélligents Les arbres de décision. Nadia Abchiche Laboratoire IBISC

Systèmes intélligents Les arbres de décision. Nadia Abchiche Laboratoire IBISC Systèmes intélligents Les arbres de décision Nadia Abchiche Laboratoire IBISC nadia.abchiche@ibisc.univ-evry.fr Définition Un arbre de décision est un outil d'aide à la décision qui représente une situation

Plus en détail

Camille Salou. Comment utiliser les histogrammes d'une image numérique

Camille Salou. Comment utiliser les histogrammes d'une image numérique Camille Salou Comment utiliser les histogrammes d'une image numérique ÉCOLE NATIONALE DES SCIENCES GEOGRAPHIQUES. 6 et 8 avenue Blaise Pascal 77455 Marne la Vallée Cedex 2 www.ensg.ign.fr IGN 2005 Table

Plus en détail

Réseau de neurone. Intelligence Artificielle et Systèmes Formels Master 1 I2L

Réseau de neurone. Intelligence Artificielle et Systèmes Formels Master 1 I2L Réseau de neurone Intelligence Artificielle et Systèmes Formels Master 1 I2L Sébastien Verel verel@lisic.univ-littoral.fr http://www-lisic.univ-littoral.fr/~verel Université du Littoral Côte d Opale Laboratoire

Plus en détail

Motifs séquentiels. Crédits. Fouille de Données et Apprentissage. Plan. C5 - Fouille de données complexes

Motifs séquentiels. Crédits. Fouille de Données et Apprentissage. Plan. C5 - Fouille de données complexes C5 - Fouille de données complexes Université de Rouen LITIS - Équipe TIBS-CISMeF lina.soualmia@chu-rouen.fr Crédits P.Poncelet (Montpellier) S.Ullman (Stanford) R.Rakotomalala (Lyon) N.Pasquier (Nice)

Plus en détail

Apprentissage automatique

Apprentissage automatique Séance 1 Bruno Bouzy bruno.bouzy@parisdescartes.fr www.mi.parisdescartes.fr/~bouzy Objectif Apercu de l'apprentissage automatique (AA) Techniques fondamentales et représentatives Problématiques: Classification

Plus en détail

Facilite l accès des secours en cas d urgence.

Facilite l accès des secours en cas d urgence. La solution Persocode ADomicile Permet, une gestion des accès automatisée à distance. Limite ou supprime la gestion des clés. Facilite l accès des secours en cas d urgence. Journée d information santé

Plus en détail

ANALYSE DES DONNEES PANORAMA DES METHODES. Pierre-Louis GONZALEZ

ANALYSE DES DONNEES PANORAMA DES METHODES. Pierre-Louis GONZALEZ ANALYSE DES DONNEES PANORAMA DES METHODES Pierre-Louis GONZALEZ ANALYSE DES DONNEES LES METHODES USUELLES Analyse en Composantes Principales (A.C.P.) Analyse factorielle des correspondances simples (A.F.C.)

Plus en détail

Analyse en Composantes Principales

Analyse en Composantes Principales Analyse en Composantes Principales Pr Roch Giorgi roch.giorgi@univ-amu.fr SESSTIM, Faculté de Médecine, Aix-Marseille Université, Marseille, France http://sesstim.univ-amu.fr/ Introduction (1) Étudier

Plus en détail

Activités informatiques

Activités informatiques Développement d un Système d Informations Statistiques sur les Entreprises (SISE) en Tunisie Documentation technique finale Activités informatiques Contrat de Jumelage n TU/07/AA/OT/02 Sommaire 1. INTRODUCTION...

Plus en détail

I-12 : Data Mining, analyse de données symboliques

I-12 : Data Mining, analyse de données symboliques PAYEN Etienne M2 Informatique décisionnelle Session 2005-2006 I-12 : Data Mining, analyse de données symboliques PREVENTION DES RISQUES NATURELS Mr Edwin DIDAY INTRODUCTION Le data mining consiste à extraire

Plus en détail

INF-550-3: NP-complétude et hypothèse de temps exponentiel

INF-550-3: NP-complétude et hypothèse de temps exponentiel Cours 3: NP-complétude et hypothèse de temps exponentiel Réduction polynomiale NP-complétude L hypothèse de temps exponentiel (ETH) Exploration arborescente 1-1 Complexité polynomiale On s intéresse à

Plus en détail

LA SOLUTION BOIS Chaudière à bûches CHAUDIÈRE SX EASY

LA SOLUTION BOIS Chaudière à bûches CHAUDIÈRE SX EASY LA SOLUTION BOIS Chaudière à bûches CHAUDIÈRE SX EASY UNE LONGUEUR D AVANCE AVEC MORVAN Le produit du marché qui intègre tout : combustion propre et performante avec sonde LAMBDA et ventilateur d extraction,

Plus en détail

(2ÈME ÉDITION) Antoine Cornuéjols et Laurent Miclet. Editions Eyrolles, 2009 Version du 9 décembre 2009

(2ÈME ÉDITION) Antoine Cornuéjols et Laurent Miclet. Editions Eyrolles, 2009 Version du 9 décembre 2009 i L APPRENTISSAGE ARTIFICIEL CONCEPTS ET ALGORITHMES. (2ÈME ÉDITION) Antoine Cornuéjols et Laurent Miclet Editions Eyrolles, 2009 Version du 9 décembre 2009 ii Table des matières Table des matières iii

Plus en détail

Fawaz Maamari Soft Energy

Fawaz Maamari Soft Energy Centre d échanges et de ressources pour la qualité environnementale des bâtiments et des aménagements en Rhône-Alpes UTILISATION DU LOGICIEL DIALUX 4.5 DANS LE CADRE D UNE Fawaz Maamari 01 décembre 2008

Plus en détail

Analyse en Composantes Principales

Analyse en Composantes Principales Analyse en Composantes Principales Pr Roch Giorgi roch.giorgi@univ-amu.fr SESSTIM, Faculté de Médecine, Aix-Marseille Université, Marseille, France http://sesstim.univ-amu.fr Objectif Étudier simultanément

Plus en détail

ENSIIE - WIA1 Intelligence Artificielle

ENSIIE - WIA1 Intelligence Artificielle ENSIIE - WIA1 Intelligence Artificielle 3ème cours - Arbres de décision Benjamin Piwowarski 13 octobre 2014 Benjamin Piwowarski WIA1 - IA - 3ème cours 13 octobre 2014 1 / 41 Episode précédent Au lieu de

Plus en détail

Chef D œuvre M2 IM 2013-2014. Revue de recette. Calibrage automatique de captures vidéo en caméra HD + Kinect

Chef D œuvre M2 IM 2013-2014. Revue de recette. Calibrage automatique de captures vidéo en caméra HD + Kinect 2013-2014 Chef D œuvre M2 IM Calibrage automatique de captures vidéo en caméra HD + Kinect Mathieu Bérengère Tardy Benjamin Vilardell Alexandre Revue de recette Clients: Christophe Collet Alain Crouzil

Plus en détail

Contenu. Sources et références. Classification supervisée. Classification supervisée vs. non-supervisée

Contenu. Sources et références. Classification supervisée. Classification supervisée vs. non-supervisée PJE : Analyse de comportements avec Twitter Classification supervisée Arnaud Liefooghe arnaud.liefooghe@univ-lille1.fr Master 1 Informatique PJE2 2012-2013 B. Derbel L. Jourdan A. Liefooghe Contenu Classification

Plus en détail

Eléments de Statistique Chapitre 1 : Introduction

Eléments de Statistique Chapitre 1 : Introduction Eléments de Statistique Chapitre 1 : INSA de Toulouse - 3ICBE Statistique Contexte Vocabulaire Environnement technologique Volume des données (600Mb séquenceur = GenBank 1982-1996) Nouveaux logiciels commerciaux,

Plus en détail

V.COSTENTIN && F.MOSKAWITZ MIAGE IUP 3 2003-2004 PROJET DATA MANING. Réalisé par. Véronique COSTENTIN et Fabien MOSKAWITZ. Professeur : M.

V.COSTENTIN && F.MOSKAWITZ MIAGE IUP 3 2003-2004 PROJET DATA MANING. Réalisé par. Véronique COSTENTIN et Fabien MOSKAWITZ. Professeur : M. 2003-2004 PROJET DATA MANING Réalisé par Véronique COSTENTIN et Fabien MOSKAWITZ Professeur : M. DIDAY 1 Sommaire INTRODUCTION... 3 1- PRESENTATION DU DATA MINING... 4 a) Historique... 4 b) Les raisons

Plus en détail

Gestion et valorisation des données capteur à l'échelle de l'exploitation dans le contexte du Big Data

Gestion et valorisation des données capteur à l'échelle de l'exploitation dans le contexte du Big Data Gestion et valorisation des données capteur à l'échelle de l'exploitation dans le contexte du Big Data Sandro Bimonte Irstea, TSFC, Clermont Ferrand Sandro.bimonte@irstea.fr Thème de Recherche MOTIVE www.irstea.fr

Plus en détail

Traitement de l image et du signal Partie TI

Traitement de l image et du signal Partie TI Traitement de l image et du signal Partie TI Emanuel Aldea http://hebergement.u-psud.fr/emi/453 Master Electronique, énergie électrique, automatique 1ère année Plan du cours Définition

Plus en détail

Examen. Une banque dispose des informations suivantes sur un ensemble de clients :

Examen. Une banque dispose des informations suivantes sur un ensemble de clients : Université Mohamed Khider-Biskra Faculté des sciences exactes et des sciences de la nature et de la vie Département d informatique Master IDM Fouille de Données Avancée 10 Jan 2016 10:00-11:30, S6 Examen

Plus en détail

Les problématiques de l apprentissage statistique

Les problématiques de l apprentissage statistique Les problématiques de l apprentissage statistique Des neuro-sciences à l intelligence "artificielle" Manuel Samuelides, Professeur à l ISAE manuel.samuelides@isae.fr Plan de l exposé 1 Emergence des systèmes

Plus en détail

Modélisation et analyse des trajectoires de soins par treillis de concepts

Modélisation et analyse des trajectoires de soins par treillis de concepts 1 / 29 Modélisation et analyse des trajectoires de soins par treillis de concepts Pr Nicolas Jay nicolas.jay@univ-lorraine.fr Le SNIIRAM pour la recherche en santé Rennes 27/06/2017 2 / 29 Pourquoi analyser

Plus en détail

Indexation et recherche visuo-textuelle des bases de données images

Indexation et recherche visuo-textuelle des bases de données images Indexation et recherche visuo-textuelle des bases de données images Hadi Akram LRSD, Département d informatique, Faculté des Sciences, Université Ferhat Abbas-Sétif 1, Algérie. akram_ha9@yahoo.fr Hadi

Plus en détail

Ricco RAKOTOMALALA. Ricco Rakotomalala Tutoriels Tanagra -

Ricco RAKOTOMALALA. Ricco Rakotomalala Tutoriels Tanagra - Ricco RAKOTOMALALA 1 1. Évaluation des performances 2. Erreur en resubstitution 3. Schéma apprentissage test 4. Validation croisée 5. Bootstrap 6. Influence du mode d échantillonnage 2 Évaluation des performances

Plus en détail

SYLLABUS DE L ORIENTATION IAD. Introduction aux méthodes de recherche opérationnelle, optimisation et aide à la décision

SYLLABUS DE L ORIENTATION IAD. Introduction aux méthodes de recherche opérationnelle, optimisation et aide à la décision SYLLABUS DE L ORIENTATION IAD Recherche opérationnelle Logique-Prolog Fouille de données Intelligence artificielle Informatique décisionnelle Projet 30h 40h 24h 20h 24h 20h Introduction aux méthodes de

Plus en détail

Cours 4 : Traitement de données quantitatives multivariées - Introduction au partitionnement de données. Guénaël CABANES et Basarab MATEI

Cours 4 : Traitement de données quantitatives multivariées - Introduction au partitionnement de données. Guénaël CABANES et Basarab MATEI Cours 4 : Traitement de données quantitatives multivariées - Introduction au partitionnement de données Guénaël CABANES et Basarab MATEI Généralités Exemple Introduction Guénaël CABANES et Basarab MATEI

Plus en détail

Les principes du droit appliqués au logiciel et à ses auteurs

Les principes du droit appliqués au logiciel et à ses auteurs Les principes du droit appliqués au logiciel et à ses auteurs 1 Séminaire Intech Sophia : 15 mai 2008 Sarah Dahl : responsable valorisation de la recherche à l UNSA Sabine Landivier : juriste contrats

Plus en détail

Erreur de prédiction

Erreur de prédiction Erreur de prédiction Hélène Milhem Institut de Mathématiques de Toulouse, INSA Toulouse, France IUP SID, 2011-2012 H. Milhem (IMT, INSA Toulouse) Erreur de prédiction IUP SID 2011-2012 1 / 27 PLAN Introduction

Plus en détail

QSOS Qualification et Sélection de logiciels Open Source Retour d expérience

QSOS Qualification et Sélection de logiciels Open Source Retour d expérience QSOS Qualification et Sélection de logiciels Open Source Retour d expérience Christophe Caron / Marc Wessner Mathématique, Informatique et Génome INRA Jouy-en-Josas 1 ReNaBi Réseau National de Bioinformatique

Plus en détail

Receiving Operating Characteristics Une autre manière d évaluer un modèle de prédiction. Ricco RAKOTOMALALA

Receiving Operating Characteristics Une autre manière d évaluer un modèle de prédiction. Ricco RAKOTOMALALA Receiving Operating Characteristics Une autre manière d évaluer un modèle de prédiction Ricco RAKOTOMALALA Tutoriels Tanagra - http://tutoriels-data-mining.blogspot.fr/ 1 Nécessité d évaluer les modèles

Plus en détail

Fouille de données. Approches supervisées

Fouille de données. Approches supervisées Fouille de données Approches supervisées 1 Plan du cours 1. Le pré-traitement des données 2. Méthodes non supervisées 3. Méthodes supervisées 4. Méthodes semi-supervisées 5. Fouille de données Web 2 Approches

Plus en détail

1 Les valeurs calculées par Weka

1 Les valeurs calculées par Weka Lorsqu on demande à Weka de construire un classifieur, il produit en même temps un ensemble de mesures de l erreur estimée. On se propose ici d expliquer comment sont définies, calculées et utilisées ces

Plus en détail

TUTORAT UE4 2010-2011 Biostatistiques Séance n 4 - Colle Semaine du 1/11/2010

TUTORAT UE4 2010-2011 Biostatistiques Séance n 4 - Colle Semaine du 1/11/2010 TUTORAT UE4 2010-2011 Biostatistiques Séance n 4 - Colle Semaine du 1/11/2010 Séance préparée par les tuteurs de l UE4 Sauf mention contraire, les tests sont réalisés en bilatéral avec α=5% QCM n 1 : Concernant

Plus en détail

UNIVERSITÉ DU QUÉBEC EN OUTAOUAIS CLASSIFICATION SUPERVISÉE DE DOCUMENTS ÉTUDE COMPARATIVE

UNIVERSITÉ DU QUÉBEC EN OUTAOUAIS CLASSIFICATION SUPERVISÉE DE DOCUMENTS ÉTUDE COMPARATIVE UNIVERSITÉ DU QUÉBEC EN OUTAOUAIS Département d informatique et d ingénierie CLASSIFICATION SUPERVISÉE DE DOCUMENTS ÉTUDE COMPARATIVE ESSAI PRÉSENTÉ COMME EXIGENCE PARTIELLE DE LA MAÎTRISE EN SCIENCES

Plus en détail

Comment choisir un outil de mesure dans un but d évaluation clinique? Diana Zidarov, pht Christiane Gauthier, M.Sc., pht

Comment choisir un outil de mesure dans un but d évaluation clinique? Diana Zidarov, pht Christiane Gauthier, M.Sc., pht Comment choisir un outil de mesure dans un but d évaluation clinique? Diana Zidarov, pht Christiane Gauthier, M.Sc., pht Que voulez-vous mesurer? Dimension / Construit Dimension / Construit Fonctions organiques

Plus en détail

Introduction. L apprentissage automatique ( ) UFR MIME. 7 décembre Université Lille 3. Introduction. Lille 3.

Introduction. L apprentissage automatique ( ) UFR MIME. 7 décembre Université Lille 3. Introduction. Lille 3. L apprentissage automatique (2016-2017) UFR MIME Université 7 décembre 2016 Sommaire 1 2 Intelligence Artificielle Intelligence : Capacité de percevoir l information Transformer en connaissance Appliqué

Plus en détail

Scénario : exempes de régression logistique

Scénario : exempes de régression logistique Résumé Scénario : exempes de régression logistique Ce scénation présente trois exemples de régression logistique ou binomiale en introduisant les questions de choix de modèle traitées avec SAS ou R. L

Plus en détail

Cours 1 Microprocesseurs

Cours 1 Microprocesseurs Cours 1 Microprocesseurs Jalil Boukhobza LC 206 boukhobza@univ-brest.fr 02 98 01 69 73 Jalil Boukhobza 1 But de ce cours Comprendre le fonctionnement de base d un microprocesseur séquentiel simple (non

Plus en détail

TP3 - Introduction à la classification supervisée

TP3 - Introduction à la classification supervisée TP3 - Introduction à la classification supervisée 1 Introduction et objectifs Ce TP a pour objectif de vous initier aux techniques de classification (apprentissage supervisé donc) sous Knime. Nous utiliserons

Plus en détail

PHAROS S.A.R.L. Le 26/11/2012 GENIE AUTOMATIQUE. NC-PHA-FRA-007 B GED Ingénierie présentation Générale 1

PHAROS S.A.R.L. Le 26/11/2012 GENIE AUTOMATIQUE. NC-PHA-FRA-007 B GED Ingénierie présentation Générale 1 NC-PHA-FRA-007 B GED Ingénierie présentation Générale 1 SOMMAIRE 1. Définition 2. Avantages 1. Document 2. Utilisateur 3. Projet 4. Entreprise 3. Maîtrise du circuit de validation documentaire 4. 1. Intégration

Plus en détail

Apprentissage supervisé par inférence d arbres de décisions

Apprentissage supervisé par inférence d arbres de décisions UC 2A : Big data et sciences du vivant Apprentissage supervisé par inférence d arbres de décisions Ce TP a pour objectif de tester les capacités d apprentissage d arbres de décisions en fonction de plusieurs

Plus en détail

Statistiques en Entreprise. Mathilde Mougeot, Université Paris-Diderot

Statistiques en Entreprise. Mathilde Mougeot, Université Paris-Diderot Statistiques en Entreprise Mathilde Mougeot, Université Paris-Diderot mathilde.mougeot@univ-paris-diderot.fr Introduction au cours Statistique de l entreprise 1 Les missions statistiques. Ex I,II,III 2

Plus en détail

MONDECA. Mondeca. offre et expertise. Axes de recherche et besoins

MONDECA. Mondeca. offre et expertise. Axes de recherche et besoins MONDECA MONDECA Mondeca offre et expertise Axes de recherche et besoins 2 Mondeca Paris Editeur de logiciel CA 1,6 M 17 personnes 3 REFERENCES 4 INTRODUCTION Data Data au sens d une chose, d un objet;

Plus en détail

Semestre 1. Volume horaire hebdomadaire. Cours TD TP T.Perso. Total. Calcul de Probabilité 3 1,5 1,5 6 84 2. Introduction à l Economie 1,5 1,5 3 42 2

Semestre 1. Volume horaire hebdomadaire. Cours TD TP T.Perso. Total. Calcul de Probabilité 3 1,5 1,5 6 84 2. Introduction à l Economie 1,5 1,5 3 42 2 3ème Année Semestre 1 N MODULES MATIERES Volume horaire hebdomadaire Cours TD TP T.Perso. Total Volume horaire semestriel (14 semaines) Coefficients Régime d'examen 1 Modèle Probabiliste 1,5 1,5 1,5 4,5

Plus en détail

Analyse des réseaux et géographie politique L ONU comme terrain de jeu

Analyse des réseaux et géographie politique L ONU comme terrain de jeu Analyse des réseaux et géographie politique L ONU comme terrain de jeu Laurent Beauguitte Groupe fmr http://groupefmr.hypotheses.org/ 24 octobre 2013 L. Beauguitte (groupe fmr) L ONU en réseaux 24 octobre

Plus en détail

Evaluation Ergonomique et Positionnement Qualitatif de la Jouabilité

Evaluation Ergonomique et Positionnement Qualitatif de la Jouabilité Evaluation Ergonomique et Positionnement Qualitatif de la Jouabilité la prise en main de votre jeu l'intuitivité de l'interface de jeu le rythme narratif d'une séquence la qualité de l'immersion du joueur

Plus en détail

SIO-6003 : Techniques de forage des données

SIO-6003 : Techniques de forage des données SIO-6003 : Techniques de forage des données NRC 17863 Hiver 2012 Temps consacré : 1-0-8 Crédit(s) : 3 Le cours décrit des techniques d'analyse de données pour découvrir des structures logiques signifiantes

Plus en détail

KOOLOG LOGICIELS DE PRÉVISION. KooLoG Forecast. Pour vos appels d offre. 3 e ÉDITION

KOOLOG LOGICIELS DE PRÉVISION. KooLoG Forecast. Pour vos appels d offre. 3 e ÉDITION Septembre 2012 Pour vos appels d offre LGICIELS DE PRÉVISI 3 e ÉDITI KLG KooLoG Forecast SupplyChainMagazine.fr 19, rue Saint-Georges - 94700 Maisons-Alfort 1. M de l'éditeur KLG 2. Appartenance à un groupe

Plus en détail

Séance 10: Arbres de classifications et Forêts aléatoires

Séance 10: Arbres de classifications et Forêts aléatoires Séance 10: Arbres de classifications et Forêts aléatoires Laboratoire de Statistique et Probabilités UMR 5583 CNRS-UPS www.lsp.ups-tlse.fr/gadat Dixième partie X Agrégation de modèles Introduction Algorithmes

Plus en détail

Veille technologique en télécommunications

Veille technologique en télécommunications Veille technologique en télécommunications Khalid EL HIMDI Ismail KASSOU Hamid MACHCHOUR 1 Techniques d analyse de contenus L analyse de contenus est au cœur de la gestion du cycle de vie de l information

Plus en détail

Apprentissage de concepts. (Référence : Tom Mitchell, Machine Learning, McGraw Hill, 1997)

Apprentissage de concepts. (Référence : Tom Mitchell, Machine Learning, McGraw Hill, 1997) Apprentissage de concepts (Référence : Tom Mitchell, Machine Learning, McGraw Hill, 1997) Apprentissage de concepts Définitions Espace de recherche : du général au spécifique L algorithme d élimination

Plus en détail