Data mining pour la recherche d'information contextuelle

Dimension: px
Commencer à balayer dès la page:

Download "Data mining pour la recherche d'information contextuelle"

Transcription

1 Data mining pour la recherche d'information contextuelle A. B I G OT, S. D É J E A N, L. L A P ORTE, J. M OTHE 1 GDR I3 : Journée sur la fouille de données Cadre FREMIT : Structure Fédérative de Recherche en Mathématiques et en Informatique de Toulouse Institut de Recherche en Informatique de Toulouse, UMR 5505 Institut de Mathématique de Toulouse, UMR 5219 Projet ANR CAAS: Analyse Contextuelle et Recherche d information Adaptative 2 1

2 RI Datamining et recherche d information Retrouver les documents pertinents pour une requête Modèle d indexation Modèle de recherche Ordonnancement des réponses Evaluer les résultats via des mesures de performance et collections de test 3 Relations entre les mesures d évaluation Analyse des paramètres de RI Requêtes répétées: apprendre le meilleur système Learning to rank dans les moteurs géo-référencés Relations entre les mesures d évaluation A. Baccini S. Déjean, L. Lafage & J. Mothe How many performance measures to evaluate Information Retrieval Systems? Knowledge and Information Systems, 2011 Objectifs Comparer les mesures d évaluation de RI Aider l utilisateur à en choisir un nombre minimal Méthode Analyse des relations entre 130 mesures calculées par trec_eval Regrouper les mesures dans des ensembles homogènes Etude massive des résultats de TREC ad hoc ( individus) 4 2

3 Relations entre les mesures d évaluation Données Matrice de données individus/lignes 130 variables / colonnes 5 Relations entre les mesures d évaluation Classification ascendante hiérarchique et ACP Distance Euclidienne + Ward K-means 6 CAAS - Analyse Contextuelle et Recherche d'information Adaptative 3

4 Datamining et recherche d information Relations entre les mesures d évaluation Analyse des paramètres de RI Requêtes répétées: apprendre le meilleur système Learning to rank dans les moteurs géo-référencés 7 Analyse des paramètres de RI Mining information retrieval results : Significant IR parameters S. Déjean, J. Mothe et al. IMMM, Objectifs : Quels paramètres influencent significativement les performances TREC ad hoc : 100 topics ; documents Terrier : plusieurs indexation, recherche, etc Matrice individus (individu: une requête traitée par une chaine de modules) Variables: 7 paramètres de traitement + MAP (mesure d évaluation) CAAS - Analyse Contextuelle et Recherche d'information Adaptative 4

5 Analysing IR parameters 9 Results ANOVA Gris sign. Analyse des paramètres de RI 10 Faciles Difficiles 5

6 Analyse des paramètres de RI Résultats CART - global 11 CAAS - Analyse Contextuelle et Recherche d'information Adaptative 12 CART Facile CAAS - Analyse Contextuelle et Recherche d'information Adaptative Difficile 6

7 Datamining et recherche d information Relations entre les mesures d évaluation Analyse des paramètres de RI Requêtes répétées: apprendre le meilleur système Learning to rank dans les moteurs géo-référencés 13 Requêtes répétées: apprendre le meilleur système Fusing different information retrieval systems according to query-topics: a study based on correlation in information retrieval systems and TREC topics A. Bigot, C. Chrisment, T. Dkaki, G. Hubert, J. Mothe Information Rretrieval Journal 14 Objectif Apprendre le paramétrage pour une requête donnée Méthode Apprentissage sur un sous ensemble/ Test sur le reste Analyse de l influence de la difficulté des requêtes sur les résultats 7

8 Repeated queries: learning the best parameters Résultats 15 Méthode MAP Meilleur système OneT2OneS (test) (+21%) OneT2ClusterS (test) 30 clusters (+20%) OneT2ClusterS (test) 12 clusters (+15%) ClusterT2ClusterS Difficile Facile Moyenne 0.36 (+9%) (+11%) (+24%) Datamining et recherche d information Relations entre les mesures d évaluation Analyse des paramètres de RI Requêtes répétées: apprendre le meilleur système Learning to rank dans les moteurs géo-référencés 16 8

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

Application de K-means à la définition du nombre de VM optimal dans un cloud

Application de K-means à la définition du nombre de VM optimal dans un cloud Application de K-means à la définition du nombre de VM optimal dans un cloud EGC 2012 : Atelier Fouille de données complexes : complexité liée aux données multiples et massives (31 janvier - 3 février

Plus en détail

THOT - Extraction de données et de schémas d un SGBD

THOT - Extraction de données et de schémas d un SGBD THOT - Extraction de données et de schémas d un SGBD Pierre-Jean DOUSSET (France), Benoît ALBAREIL (France) pj@miningdb.com, benoit@miningdb.com Mots clefs : Fouille d information, base de données, système

Plus en détail

TRAVAUX DE RECHERCHE DANS LE

TRAVAUX DE RECHERCHE DANS LE TRAVAUX DE RECHERCHE DANS LE DOMAINE DE L'EXPLOITATION DES DONNÉES ET DES DOCUMENTS 1 Journée technologique " Solutions de maintenance prévisionnelle adaptées à la production Josiane Mothe, FREMIT, IRIT

Plus en détail

Introduction au datamining

Introduction au datamining Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des

Plus en détail

Proposition des cadres d évaluation adaptés à un système de RI personnalisé

Proposition des cadres d évaluation adaptés à un système de RI personnalisé Proposition des cadres d évaluation adaptés à un système de RI personnalisé Mariam Daoud, Lynda Tamine-Lechani Laboratoire IRIT, Université Paul Sabatier 118 Route de Narbonne, F-31062 TOULOUSE CEDEX 9

Plus en détail

ProxiLens : Exploration interactive de données multidimensionnelles à partir de leur projection

ProxiLens : Exploration interactive de données multidimensionnelles à partir de leur projection ProxiLens : Exploration interactive de données multidimensionnelles à partir de leur projection Nicolas HEULOT (CEA LIST) Michaël AUPETIT (CEA LIST) Jean-Daniel FEKETE (INRIA Saclay) Journées Big Data

Plus en détail

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013 Cube de textes et opérateur d'agrégation basé sur un modèle vectoriel adapté Text Cube Model and aggregation operator based on an adapted vector space model Lamia Oukid, Ounas Asfari, Fadila Bentayeb,

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme

Plus en détail

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI 1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage

Plus en détail

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours Information du cours Informatique décisionnelle et data mining www.lia.univ-avignon.fr/chercheurs/torres/cours/dm Juan-Manuel Torres juan-manuel.torres@univ-avignon.fr LIA/Université d Avignon Cours/TP

Plus en détail

INTRODUCTION AU DATA MINING

INTRODUCTION AU DATA MINING INTRODUCTION AU DATA MINING 6 séances de 3 heures mai-juin 2006 EPF - 4 ème année - Option Ingénierie d Affaires et de Projets Bertrand LIAUDET TP DE DATA MINING Le TP et le projet consisteront à mettre

Plus en détail

Analyse de grandes bases de données en santé

Analyse de grandes bases de données en santé .. Analyse de grandes bases de données en santé Alain Duhamel Michaël Genin Mohamed Lemdani EA 2694 / CERIM Master 2 Recherche Biologie et Santé Journée Thématique Fouille de Données Plan. 1 Problématique.

Plus en détail

COURS DE DATA MINING 4 : MODELISATION NON-SUPERVISEE CLASSIFICATIONS AUTOMATIQUES

COURS DE DATA MINING 4 : MODELISATION NON-SUPERVISEE CLASSIFICATIONS AUTOMATIQUES COURS DE DATA MINING 4 : MODELISATION NON-SUPERVISEE CLASSIFICATIONS AUTOMATIQUES EPF 4/ 5 ème année - Option Ingénierie d Affaires et de Projets - Finance Bertrand LIAUDET 4 : Modélisation non-supervisée

Plus en détail

RI sociale : intégration de propriétés sociales dans un modèle de recherche

RI sociale : intégration de propriétés sociales dans un modèle de recherche RI sociale : intégration de propriétés sociales dans un modèle de recherche Ismail Badache 1 Institut de Recherche en Informatique de Toulouse, UMR 5505 CNRS, SIG 118 Route de Narbonne F-31062 Toulouse

Plus en détail

Techniques d analyse et de conception d outils pour la gestion du processus de segmentation des abonnés des entreprises de télécommunication

Techniques d analyse et de conception d outils pour la gestion du processus de segmentation des abonnés des entreprises de télécommunication Techniques d analyse et de conception d outils pour la gestion du processus de segmentation des abonnés des entreprises de télécommunication R. Carlos Nana Mbinkeu 1,3, C. Tangha 1, A. Chomnoue 1, A. Kuete

Plus en détail

Distinguer les requêtes pour améliorer la recherche d information XML

Distinguer les requêtes pour améliorer la recherche d information XML Lyon - France Distinguer les requêtes pour améliorer la recherche d information XML Kurt Englmeier ***, Gilles Hubert *, Josiane Mothe *,** *Institut de Recherche en Informatique de Toulouse Equipe SIG/EVI

Plus en détail

La segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM

La segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM La segmentation à l aide de EG-SAS A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM Définition de la segmentation - Au lieu de considérer une population dans son ensemble,

Plus en détail

Bases de données documentaires et distribuées Cours NFE04

Bases de données documentaires et distribuées Cours NFE04 Bases de données documentaires et distribuées Cours NFE04 Introduction a la recherche d information Auteurs : Raphaël Fournier-S niehotta, Philippe Rigaux, Nicolas Travers prénom.nom@cnam.fr Département

Plus en détail

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et

Plus en détail

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1 Christophe CANDILLIER Cours de DataMining mars 2004 age 1 1. Introduction 2. rocessus du DataMining 3. Analyse des données en DataMining 4. Analyse en Ligne OLA 5. Logiciels 6. Bibliographie Christophe

Plus en détail

Ingénierie et gestion des connaissances

Ingénierie et gestion des connaissances Master Web Intelligence ICM Option Informatique Ingénierie et gestion des connaissances Philippe BEAUNE Philippe.Beaune@emse.fr 18 novembre 2008 Passer en revue quelques idées fondatrices de l ingénierie

Plus en détail

Enjeux mathématiques et Statistiques du Big Data

Enjeux mathématiques et Statistiques du Big Data Enjeux mathématiques et Statistiques du Big Data Mathilde Mougeot LPMA/Université Paris Diderot, mathilde.mougeot@univ-paris-diderot.fr Mathématique en Mouvements, Paris, IHP, 6 Juin 2015 M. Mougeot (Paris

Plus en détail

Historique. Architecture. Contribution. Conclusion. Définitions et buts La veille stratégique Le multidimensionnel Les classifications

Historique. Architecture. Contribution. Conclusion. Définitions et buts La veille stratégique Le multidimensionnel Les classifications L intelligence économique outil stratégique pour l entreprise Professeur Bernard DOUSSET dousset@irit.fr http://atlas.irit.fr Institut de Recherche en Informatique de Toulouse (IRIT) Equipe Systèmes d

Plus en détail

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 04/04/2008 Stéphane Tufféry - Data Mining - http://data.mining.free.fr

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 04/04/2008 Stéphane Tufféry - Data Mining - http://data.mining.free.fr Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE 1 Plan du cours Qu est-ce que le data mining? A quoi sert le data mining? Les 2 grandes familles de techniques Le déroulement d un projet de data

Plus en détail

Data issues in species monitoring: where are the traps?

Data issues in species monitoring: where are the traps? Data issues in species monitoring: where are the traps? French breeding bird monitoring : Animations locales : - dealing with heterogenous data - working with multi-species multi-sites monitoring schemes

Plus en détail

ORDONNANCEMENT DES RÉSULTATS SUR LES MOTEURS DE RECHERCHE : PRINCIPES, LIMITES ET APPLICATIONS AU GÉORÉFÉRENCEMENT

ORDONNANCEMENT DES RÉSULTATS SUR LES MOTEURS DE RECHERCHE : PRINCIPES, LIMITES ET APPLICATIONS AU GÉORÉFÉRENCEMENT ORDONNANCEMENT DES RÉSULTATS SUR LES MOTEURS DE RECHERCHE : PRINCIPES, LIMITES ET APPLICATIONS AU GÉORÉFÉRENCEMENT Léa LAPORTE (*,**) laporte@irit.fr, lea@nomao.com (*)Institut de Recherche en Informatique

Plus en détail

Luc Grivel (*, **) Luc.Grivel@univ-paris1.fr

Luc Grivel (*, **) Luc.Grivel@univ-paris1.fr MAITRISER LE PROCESSUS DE TEXT MINING DANS LE CADRE D APPLICATIONS D INTELLIGENCE ECONOMIQUE, DE GESTION DE LA RELATION CLIENT OU DE GESTION DE CONNAISSANCES Luc Grivel (*, **) Luc.Grivel@univ-paris1.fr

Plus en détail

L écosystème Hadoop Nicolas Thiébaud ni.thiebaud@gmail.com. Tuesday, July 2, 13

L écosystème Hadoop Nicolas Thiébaud ni.thiebaud@gmail.com. Tuesday, July 2, 13 L écosystème Hadoop Nicolas Thiébaud ni.thiebaud@gmail.com HUG France 250 membres sur la mailing liste 30 présentations 9 meetups organisés, de 20 à 100 invités Présence de Cloudera, MapR, Hortonworks,

Plus en détail

Masses de données et calcul : à l IRIT. 8 octobre 2013

Masses de données et calcul : à l IRIT. 8 octobre 2013 Masses de données et calcul : la recherche en lien avec les Big Data à l IRIT 8 octobre 2013 08/10/2013 1 L IRIT en qq chiffres 700 personnes sur tous les sites toulousains 5 tutelles 7 thèmes et 21 équipes

Plus en détail

Extraction d informations stratégiques par Analyse en Composantes Principales

Extraction d informations stratégiques par Analyse en Composantes Principales Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 dousset@irit.fr 1 Introduction

Plus en détail

Evidence-based medicine en français

Evidence-based medicine en français Evidence-based medicine en français MÉDECINE FACTUELLE (Office de la langue française) Médecine fondée sur des faits démontrés Médecine fondée sur des preuves Médecine fondée sur des données probantes

Plus en détail

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université

Plus en détail

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence

Plus en détail

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci http://liris.cnrs.fr/hamamache.kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de

Plus en détail

Apprentissage statistique dans les graphes et les réseaux sociaux

Apprentissage statistique dans les graphes et les réseaux sociaux Apprentissage statistique dans les graphes et les réseaux sociaux Patrick Gallinari Collaboration : L. Denoyer, S. Peters Université Pierre et Marie Curie AAFD 2010 1 Plan Motivations et Problématique

Plus en détail

Adaptabilité d un MOOC aux styles d apprentissage. Hubert Kadima Directeur de Recherche LARIS/EISTI Email : hubert.kadima@eisti.fr

Adaptabilité d un MOOC aux styles d apprentissage. Hubert Kadima Directeur de Recherche LARIS/EISTI Email : hubert.kadima@eisti.fr Adaptabilité d un MOOC aux styles d apprentissage Hubert Kadima Directeur de Recherche LARIS/EISTI Email : hubert.kadima@eisti.fr Agenda 1. Contexte : l apprentissage dans le projet PLACIS 2. Choix du

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

Travaux pratiques avec RapidMiner

Travaux pratiques avec RapidMiner Travaux pratiques avec RapidMiner Master Informatique de Paris 6 Spécialité IAD Parcours EDOW Module Algorithmes pour la Fouille de Données Janvier 2012 Prise en main Généralités RapidMiner est un logiciel

Plus en détail

Titre : La BI vue par l intégrateur Orange

Titre : La BI vue par l intégrateur Orange Titre : La BI vue par l intégrateur Orange Résumé : L entité Orange IT&L@bs, partenaire privilégié des entreprises et des collectivités dans la conception et l implémentation de SI Décisionnels innovants,

Plus en détail

Agrégation des portefeuilles de contrats d assurance vie

Agrégation des portefeuilles de contrats d assurance vie Agrégation des portefeuilles de contrats d assurance vie Est-il optimal de regrouper les contrats en fonction de l âge, du genre, et de l ancienneté des assurés? Pierre-O. Goffard Université d été de l

Plus en détail

1 Complément sur la projection du nuage des individus

1 Complément sur la projection du nuage des individus TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent

Plus en détail

Nom du client. Date. Client Logo or project name

Nom du client. Date. Client Logo or project name Nom du client Date Client Logo or project name Presenta7on 7tle client name Date Linalis speaker Speaker 7tle Le Groupe Linalis Historique Crée en 2002 Présent en Suisse, France, au Royaume Uni et en Espagne

Plus en détail

VIPE CNAM 6 mars 2015. Frank Meyer Orange Labs / IMT / UCE / CRM-DA / PROF

VIPE CNAM 6 mars 2015. Frank Meyer Orange Labs / IMT / UCE / CRM-DA / PROF CNAM 6 mars 205 Frank Meyer Orange Labs / IMT / UCE / CRM-DA / PROF 2 UCE / CRM-DA / PROF Application prototype pour l apprentissage multi-label interactif 2 sous-applications en ligne (utilisable par

Plus en détail

PREPROCESSING PAR LISSAGE LOESS POUR ACP LISSEE

PREPROCESSING PAR LISSAGE LOESS POUR ACP LISSEE PREPROCESSING PAR LISSAGE LOESS POUR ACP LISSEE Jean-Paul Valois, Claude Mouret & Nicolas Pariset Total, 64018 Pau Cédex MOTS CLEFS : Analyse spatiale, ACP, Lissage, Loess PROBLEMATIQUE En analyse multivariée,

Plus en détail

ARDUIN Pierre-Emmanuel

ARDUIN Pierre-Emmanuel ARDUIN Pierre-Emmanuel Maître de conférences pierre-emmanuel.arduin@dauphine.fr Tél : +33(0)1.44.05.48.19 Bureau : A 702 Site web : Site web Poste actuel et responsabilités à Dauphine Responsable d'un

Plus en détail

Statistique Descriptive Multidimensionnelle. (pour les nuls)

Statistique Descriptive Multidimensionnelle. (pour les nuls) Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Multidimensionnelle (pour les nuls) (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219

Plus en détail

Recherche d information textuelle

Recherche d information textuelle Recherche d information textuelle Recherche Web B. Piwowarski CNRS / LIP6 Université Paris 6 benjamin@bpiwowar.net http://www.bpiwowar.net Master IP - 2014-15 Cours et travaux pratiques basés sur les documents

Plus en détail

Cartes de communautés pour l adaptation interactive de profils dans un système de filtrage d information

Cartes de communautés pour l adaptation interactive de profils dans un système de filtrage d information Cartes de communautés pour l adaptation interactive de profils dans un système de filtrage d information An-Te Nguyen* Nathalie Denos* Catherine Berrut* * Laboratoire CLIPS-IMAG 385 rue de la Bibliothèque,

Plus en détail

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems

Plus en détail

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com Intelligence Artificielle et Systèmes Multi-Agents Badr Benmammar bbm@badr-benmammar.com Plan La première partie : L intelligence artificielle (IA) Définition de l intelligence artificielle (IA) Domaines

Plus en détail

Data mining 1. Exploration Statistique

Data mining 1. Exploration Statistique PUBLICATIONS DU LABORATOIRE DE STATISTIQUE ET PROBABILITÉS Data mining 1 Exploration Statistique ALAIN BACCINI & PHILIPPE BESSE Version septembre 2004 mises à jour : wwwlspups-tlsefr/besse Laboratoire

Plus en détail

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données et le Data Mining Nous suivons le plan suivant : Fonctionnement de Spad Catalogue des méthodes (statistiques

Plus en détail

Big Data -Comment exploiter les données et les transformer en prise de décisions?

Big Data -Comment exploiter les données et les transformer en prise de décisions? IBM Global Industry Solution Center Nice-Paris Big Data -Comment exploiter les données et les transformer en prise de décisions? Apollonie Sbragia Architecte Senior & Responsable Centre D Excellence Assurance

Plus en détail

BIG DATA en Sciences et Industries de l Environnement

BIG DATA en Sciences et Industries de l Environnement BIG DATA en Sciences et Industries de l Environnement François Royer www.datasio.com 21 mars 2012 FR Big Data Congress, Paris 2012 1/23 Transport terrestre Traçabilité Océanographie Transport aérien Télémétrie

Plus en détail

Recherche de microblogs : quels critères pour raffiner les résultats des moteurs usuels de RI?

Recherche de microblogs : quels critères pour raffiner les résultats des moteurs usuels de RI? Recherche de microblogs : quels critères pour raffiner les résultats des moteurs usuels de RI? Firas Damak Karen Pinel-Sauvagnat Guillaume Cabanac Université de Toulouse IRIT UMR 5505 CNRS 118 route de

Plus en détail

Modèles pour données répétées

Modèles pour données répétées Résumé Les données répétées, ou données longitudinales, constituent un domaine à la fois important et assez particulier de la statistique. On entend par données répétées des données telles que, pour chaque

Plus en détail

MAP 553 Apprentissage statistique

MAP 553 Apprentissage statistique MAP 553 Apprentissage statistique Université Paris Sud et Ecole Polytechnique http://www.cmap.polytechnique.fr/~giraud/map553/map553.html PC1 1/39 Apprentissage? 2/39 Apprentissage? L apprentissage au

Plus en détail

2 Serveurs OLAP et introduction au Data Mining

2 Serveurs OLAP et introduction au Data Mining 2-1 2 Serveurs OLAP et introduction au Data Mining 2-2 Création et consultation des cubes en mode client-serveur Serveur OLAP Clients OLAP Clients OLAP 2-3 Intérêt Systèmes serveurs et clients Fonctionnalité

Plus en détail

Cairnalys est une société spécialisée dans le développement de la connaissance client et l analyse des campagnes d Emailing.

Cairnalys est une société spécialisée dans le développement de la connaissance client et l analyse des campagnes d Emailing. Mille lecteurs, Mille besoins différents 1- Société Qui sommes-nous? Cairnalys est une société spécialisée dans le développement de la connaissance client et l analyse des campagnes d Emailing. Notre méthode

Plus en détail

Fouille de données massives avec Hadoop

Fouille de données massives avec Hadoop Fouille de données massives avec Hadoop Sebastiao Correia scorreia@talend.com Talend 2013 AAFD'14 29-30 avril 2014 1 Agenda Présentation de Talend Définition du Big Data Le framework Hadoop 3 thématiques

Plus en détail

Nous désirons tout mettre en œuvre pour découvrir le travail d enseignant et surtout, améliorer nos

Nous désirons tout mettre en œuvre pour découvrir le travail d enseignant et surtout, améliorer nos L A P P R E N T I S S A G E E N P R O F O N D E U R Présenté par : Michael Lafontaine, CGA, M. Fisc. Bruce Lagrange, CA, M. Sc. Patricia Michaud, CA, MBA Francis Belzile, CA, M. Fisc. Janie Bérubé, CA,

Plus en détail

Introduction aux algorithmes MapReduce. Mathieu Dumoulin (GRAAL), 14 Février 2014

Introduction aux algorithmes MapReduce. Mathieu Dumoulin (GRAAL), 14 Février 2014 Introduction aux algorithmes MapReduce Mathieu Dumoulin (GRAAL), 14 Février 2014 Plan Introduction de la problématique Tutoriel MapReduce Design d algorithmes MapReduce Tri, somme et calcul de moyenne

Plus en détail

Parallélisation de l algorithme des k-médoïdes. Application au clustering de courbes.

Parallélisation de l algorithme des k-médoïdes. Application au clustering de courbes. Parallélisation de l algorithme des k-médoïdes. Application au clustering de courbes. Benjamin Auder 1 & Jairo Cugliari 2 1 Laboratoire LMO. Université Paris-Sud. Bât 425. 91405 Orsay Cedex, France. benjamin.auder@math.u-psud.fr

Plus en détail

Projet de mise en place de l Enquête Emploi du temps en Algérie

Projet de mise en place de l Enquête Emploi du temps en Algérie Projet de mise en place de l Enquête Emploi du temps en Algérie Mechti samia, Mokri samia, Roggaz Nacera Direction de la Population et de l Emploi, ONS Objectif L enquête Nationale sur l Emploi du temps

Plus en détail

Une Démarche pour la sélection d outils de cartographie des processus métiers

Une Démarche pour la sélection d outils de cartographie des processus métiers Une Démarche pour la sélection d outils de cartographie des processus métiers Résumé El Haddadi Anass, Atahran Ahmed, Ebobissé Yves, B. Bounabat anass.elhaddadi@gmail.com, atahran.ahmed@gmail.com, ebobisseyves@yahoo.fr,

Plus en détail

Étude d impact et Services Écosystémiques : Comment identifier et spatialiser les enjeux?

Étude d impact et Services Écosystémiques : Comment identifier et spatialiser les enjeux? Étude d impact et Services Écosystémiques : Comment identifier et spatialiser les enjeux? Roel PLANT 1,2 ; Pierre-André PISSARD 1 1 UMR TETIS / Irstea Montpellier 2 Institute for Sustainable Futures /

Plus en détail

ISFA 2 année 2002-2003. Les questions sont en grande partie indépendantes. Merci d utiliser l espace imparti pour vos réponses.

ISFA 2 année 2002-2003. Les questions sont en grande partie indépendantes. Merci d utiliser l espace imparti pour vos réponses. On considère la matrice de données : ISFA 2 année 22-23 Les questions sont en grande partie indépendantes Merci d utiliser l espace imparti pour vos réponses > ele JCVGE FM1 GM JCRB FM2 JMLP Paris 61 29

Plus en détail

EXTRACTION DE CONNAISSANCES À PARTIR DE DONNÉES TEXTUELLES VUE D ENSEMBLE

EXTRACTION DE CONNAISSANCES À PARTIR DE DONNÉES TEXTUELLES VUE D ENSEMBLE ème Colloque National AIP PRIMECA La Plagne - 7- avril 7 EXTRACTION DE CONNAISSANCES À PARTIR DE DONNÉES TEXTUELLES VUE D ENSEMBLE Bruno Agard Département de Mathématiques et de Génie Industriel, École

Plus en détail

Les études de cas Responsable: Monika Niederhuber, Pauline Bart

Les études de cas Responsable: Monika Niederhuber, Pauline Bart Geographic Information Technology Training Alliance (GITTA) presents: Les études de cas Responsable: Monika Niederhuber, Pauline Bart Table des matières 1. Les études de cas...2 1.1. Définitions et commentaires...

Plus en détail

Jean-Claude Kaufmann "L'invention de soi - Une théorie de l'identité"

Jean-Claude Kaufmann L'invention de soi - Une théorie de l'identité Séminaire de sociologie des migrations et des relations interethniques. Jean-Claude Kaufmann "L'invention de soi - Une théorie de l'identité" Introduction Le collectif comme ressource L'identité fournit

Plus en détail

Rôle des FAI et des Datacenters dans les dispositifs de cyber-sécurité Ou comment tenter de rendre l Internet plus sûr.

Rôle des FAI et des Datacenters dans les dispositifs de cyber-sécurité Ou comment tenter de rendre l Internet plus sûr. Rôle des FAI et des Datacenters dans les dispositifs de cyber-sécurité Ou comment tenter de rendre l Internet plus sûr Alain Cocconi FAI et Data Center: des réseaux différents, problématiques identiques.

Plus en détail

Analyse des réclamations d allocataires de la CAF : un cas d étude en fouille de données

Analyse des réclamations d allocataires de la CAF : un cas d étude en fouille de données Analyse des réclamations d allocataires de la CAF : un cas d étude en fouille de données Sabine Loudcher, Julien Velcin, Vincent Forissier, Cyril Broilliard et Philippe Simonnot Laboratoire ERIC, Université

Plus en détail

La structure de la base de données et l utilisation de PAST. Musée Royal de l Afrique Centrale (MRAC Tervuren)

La structure de la base de données et l utilisation de PAST. Musée Royal de l Afrique Centrale (MRAC Tervuren) La structure de la base de données et l utilisation de PAST La structure de la base de données données originales SPÉCIMENS Code des spécimens: Identification des spécimens individuels. Dépend du but de

Plus en détail

Dans cette définition, il y a trois notions clés: documents, requête, pertinence.

Dans cette définition, il y a trois notions clés: documents, requête, pertinence. Introduction à la RI 1. Définition Un système de recherche d'information (RI) est un système qui permet de retrouver les documents pertinents à une requête d'utilisateur, à partir d'une base de documents

Plus en détail

Étude de données multisources par simulation de capteurs et clustering collaboratif

Étude de données multisources par simulation de capteurs et clustering collaboratif Étude de données multisources par simulation de capteurs et clustering collaboratif Germain Forestier, Cédric Wemmert, Pierre Gançarski Université de Strasbourg - LSIIT - CNRS - UMR 75 Pôle API, Bd Sébastien

Plus en détail

Introduction à la Recherche d information

Introduction à la Recherche d information Introduction à la Recherche d information M. Boughanem bougha@irit.fr http://www.irit.fr/~mohand.boughanem Université Paul Sabatier de Toulouse Laboratoire IRIT 1 Plan Introduction à la Recherche d information

Plus en détail

Scénario: Données bancaires et segmentation de clientèle

Scénario: Données bancaires et segmentation de clientèle Résumé Scénario: Données bancaires et segmentation de clientèle Exploration de données bancaires par des méthodes uni, bi et multidimensionnelles : ACP, AFCM k-means, CAH. 1 Présentation Le travail proposé

Plus en détail

INF6304 Interfaces Intelligentes

INF6304 Interfaces Intelligentes INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie

Plus en détail

Exemple PLS avec SAS

Exemple PLS avec SAS Exemple PLS avec SAS This example, from Umetrics (1995), demonstrates different ways to examine a PLS model. The data come from the field of drug discovery. New drugs are developed from chemicals that

Plus en détail

Apprentissage symbolique et statistique à l ère du mariage pour tous

Apprentissage symbolique et statistique à l ère du mariage pour tous Apprentissage symbolique et statistique à l ère du mariage pour tous Stéphane Canu asi.insa-rouen.fr/enseignants/~scanu RFIA 2014, INSA Rouen 2 juillet 2014 Apprentissage : humain vs. machine Les apprentissages

Plus en détail

Christophe SANNIER christophe.sannier@sirs-fr.com

Christophe SANNIER christophe.sannier@sirs-fr.com Systèmes d Information à Référence Spatiale Utilisation d un Estimateur de Régression avec des Données Landsat pour l Estimation de l Etendu et des Changements du Couvert Forestier du Gabon de 1990 à 2010

Plus en détail

Jean-François Boulicaut & Mohand-Saïd Hacid

Jean-François Boulicaut & Mohand-Saïd Hacid e siècle! Jean-François Boulicaut & Mohand-Saïd Hacid http://liris.cnrs.fr/~jboulica http://liris.cnrs.fr/mohand-said.hacid Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205

Plus en détail

L évaluation du transfert des apprentissages suite à un programme de perfectionnement

L évaluation du transfert des apprentissages suite à un programme de perfectionnement L évaluation du transfert des apprentissages suite à un programme de perfectionnement Johann Jacob, M.A.P. et Richard Marceau, Ph. D. Centre de recherche et d expertise en évaluation (CREXE) Colloque annuel

Plus en détail

Évaluation de la pertinence des résultats en recherche d information géographique

Évaluation de la pertinence des résultats en recherche d information géographique Évaluation de la pertinence des résultats en recherche d information géographique Définition d un cadre expérimental et validation de l apport des dimensions de l information géographique Guillaume Cabanac

Plus en détail

CONSTRUIRE SES CARTES: LE DÉVELOPPEMENT D'OUTILS STATISTIQUES INTERACTIFS INTÉGRÉS À UN SYSTÈME D'INFORMATION GÉOGRAPHIQUE

CONSTRUIRE SES CARTES: LE DÉVELOPPEMENT D'OUTILS STATISTIQUES INTERACTIFS INTÉGRÉS À UN SYSTÈME D'INFORMATION GÉOGRAPHIQUE CONSTRUIRE SES CARTES: LE DÉVELOPPEMENT D'OUTILS STATISTIQUES INTERACTIFS INTÉGRÉS À UN SYSTÈME D'INFORMATION GÉOGRAPHIQUE Benoît OGIER UPRESA 6063 Laboratoire Modélisation et Traitement Graphique Université

Plus en détail

TRAITEMENT DES DONNEES MANQUANTES AU MOYEN DE L ALGORITHME DE KOHONEN

TRAITEMENT DES DONNEES MANQUANTES AU MOYEN DE L ALGORITHME DE KOHONEN TRAITEMENT DES DONNEES MANQUANTES AU MOYEN DE L ALGORITHME DE KOHONEN Marie Cottrell, Smaïl Ibbou, Patrick Letrémy SAMOS-MATISSE UMR 8595 90, rue de Tolbiac 75634 Paris Cedex 13 Résumé : Nous montrons

Plus en détail

Masters Spécialisés «Actuariat et Prévoyance» et «Actuariat et Finance»

Masters Spécialisés «Actuariat et Prévoyance» et «Actuariat et Finance» Masters Spécialisés «Actuariat et Prévoyance» et «Actuariat et Finance» Introduction au Data Mining K. EL HIMDI elhimdi@menara.ma 1 Sommaire du MODULE Partie 1 : Introduction au Data Mining Partie 2 :

Plus en détail

Le référentiel professionnel du Diplôme d Etat d Aide Médico-Psychologique

Le référentiel professionnel du Diplôme d Etat d Aide Médico-Psychologique A R D E Q A F Le référentiel professionnel du Diplôme d Etat d Aide Médico-Psychologique 1.1 Définition de la profession et du contexte de l intervention p. 2 1.2 Le référentiel d activités du Diplôme

Plus en détail

Résumés des projets de GMM5-2014/2015

Résumés des projets de GMM5-2014/2015 Résumés des projets de GMM5-2014/2015 Option MMS Statistical analysis of Raman Spectra skin to evaluate the benefit of Pierre Fabre s acne treatment cream Classification appliquée à la biologie structurale

Plus en détail

ACP Voitures 1- Méthode

ACP Voitures 1- Méthode acp=princomp(voit,cor=t) ACP Voitures 1- Méthode Call: princomp(x = voit, cor = T) Standard deviations: Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 2.1577815 0.9566721 0.4903373 0.3204833 0.2542759 0.1447788

Plus en détail

GUIDE PRATIQUE DE L INDEXEUR : LES PRINCIPES DE L INDEXATION COLLABORATIVE

GUIDE PRATIQUE DE L INDEXEUR : LES PRINCIPES DE L INDEXATION COLLABORATIVE GUIDE PRATIQUE DE L INDEXEUR : LES PRINCIPES DE L INDEXATION COLLABORATIVE Qu est-ce que l indexation ou annotation- collaborative? Ce procédé permet aux internautes de participer directement à l indexation

Plus en détail

Analyses multivariées avec R Commander (via le package FactoMineR) Qu est ce que R? Introduction à R Qu est ce que R?

Analyses multivariées avec R Commander (via le package FactoMineR) Qu est ce que R? Introduction à R Qu est ce que R? Analyses multivariées avec R Commander Analyses multivariées avec R Commander (via le package FactoMineR) Plate-forme de Support en Méthodologie et Calcul Statistique (SMCS) - UCL 1 Introduction à R 2

Plus en détail

Transformation IT de l entreprise BIG DATA, MÉTIERS ET ÉVOLUTION DES BASES DE DONNÉES

Transformation IT de l entreprise BIG DATA, MÉTIERS ET ÉVOLUTION DES BASES DE DONNÉES Transformation IT de l entreprise BIG DATA, MÉTIERS ET ÉVOLUTION DES BASES DE DONNÉES M a l g r é s o n ca r act è r e en apparence multiforme un enjeu central s est progressivement affirmé en matière

Plus en détail

Les datas = le fuel du 21ième sicècle

Les datas = le fuel du 21ième sicècle Les datas = le fuel du 21ième sicècle D énormes gisements de création de valeurs http://www.your networkmarketin g.com/facebooktwitter-youtubestats-in-realtime-simulation/ Xavier Dalloz Le Plan Définition

Plus en détail

Le cinquième chapitre

Le cinquième chapitre Le cinquième chapitre Objectif : présenter les supports matériels ou immatériels permettant d'étayer cette nouvelle approche de la fonction maintenance. I. Evolution du domaine technique - Différents domaines

Plus en détail

VISUALISATION DES DISTANCES ENTRE LES CLASSES DE LA CARTE DE KOHONEN POUR LE DEVELOPPEMENT D'UN OUTIL D'ANALYSE ET DE REPRESENTATION DES DONNEES

VISUALISATION DES DISTANCES ENTRE LES CLASSES DE LA CARTE DE KOHONEN POUR LE DEVELOPPEMENT D'UN OUTIL D'ANALYSE ET DE REPRESENTATION DES DONNEES VISUALISATION DES DISTANCES ENTRE LES CLASSES DE LA CARTE DE KOHONEN POUR LE DEVELOPPEMENT D'UN OUTIL D'ANALYSE ET DE REPRESENTATION DES DONNEES Patrick Rousset 1,2 et Christiane Guinot 3 1 CEREQ, Service

Plus en détail

Les clés pour bâtir une stratégie gagnante avec le channel

Les clés pour bâtir une stratégie gagnante avec le channel CONTENT SYNDICATION E-COMMERCE INTEGRATION business integration BUSINESS INTELLIGENCE Les clés pour bâtir une stratégie gagnante avec le channel Automatiser la génération de leads, simplifier vos processus

Plus en détail

THESE. Présentée devant. L Université Paul Sabatier de Toulouse. en vue de l obtention du

THESE. Présentée devant. L Université Paul Sabatier de Toulouse. en vue de l obtention du Laboratoire IRIT Pôle SIG-EVI THESE Présentée devant L Université Paul Sabatier de Toulouse en vue de l obtention du Doctorat de l Université Paul Sabatier Spécialité Informatique Par Nathalie HERNANDEZ

Plus en détail