INDEXATION des IMAGES

Save this PDF as:
 WORD  PNG  TXT  JPG

Dimension: px
Commencer à balayer dès la page:

Download "INDEXATION des IMAGES"

Transcription

1 INDEXATION des IMAGES Marine Campedel mars 2005

2 Plan du cours Généralités Méthodes Indexation textuelle Indexation par le contenu Récupération de l information (retrieval) Feedback utilisateur Évaluation des systèmes Démonstrations Conclusion

3 Généralités Quelques chiffres : INA : h video h audio de photos 82 Milliards de photos par an dans le monde 390 Millions d images indexées par Google 4250 films commerciaux par an (UNESCO) Motivations : Conservation d un patrimoine (culturel, scientifique, ) Valorisation en facilitant l accès et l exploration Exploitation commerciale (photos numériques, TV numérique, )

4 Généralités : quelles images? biomédical, satellitaires, photos, 2D ou 3D, 3 catégories générales Images d art (auteur, titre, ) Images documentaires (reliées à un texte) Images ordinaires Centres d intérêts actuels : Audio-vidéo, multimédia, 3D

5 Généralités : les acteurs Acteurs industriels QBIC (IBM), Virage, Netra NewPhenix (CEA)

6 Généralités : les acteurs Acteurs académiques VisualSeek (Columbia), IMEDIA (INRIA, Rocquencourt), RETIN (ETIS, Cergy), KIWI (Insa, Lyon), DIVAN (INA) Nombreux projets européens et nationaux

7 Généralités : définition Objectif de l indexation : faciliter l accès à des bases de données en extrayant une information synthétique. Fouille de données (Data Mining), Extraction de connaissances, Vision artificielle

8 Généralités Catalogue : Exploitation de données globales sur le document visuel, indépendantes du contenu Classification : Exploitation d une caractéristique globale du document visuel Indexation Exploitation d une analyse fine du contenu du document visuel

9 Introduction 1980 : Annotation textuelle des images 1990 : Indexation par la couleur, la forme et la texture 1993 : Requête en utilisant la similarité des images 1997 : Requête par images exemplaires et mesure de la pertinence (relevance feedback) 2000 : apprentissage sémantique et adaptation à l utilisateur Enjeux actuels : annotation interactive, formalisation de la connaissance (ontologies), grosses bases de données (problèmes de stockage, de vitesse d accès, ), données hétérogènes,

10 Indexation d images à partir du texte

11 Indexation d images à partir du texte ROME (AFP), :10:52 L'Italienne Clementina Cantoni arrive vendredi 10 juin sur le sol italien après 25 jours de détention en Afghanistan

12 Indexation d images à partir du texte

13 Indexation d images à partir du texte

14 Indexation d images à partir du texte Une image illustre un document mais le document ne décrit pas forcément l image ; Le texte accompagnateur d une image ne suffit généralement pas La richesse du contenu d une image dépend du domaine de connaissances de celui qui la regarde ; Nécessité de modéliser ce domaine Aspects subjectifs du contenu Plus facile de faire une description des objets contenus dans l image que des émotions qui en résultent

15 Indexation d images à partir du texte Avantages : exploite les outils d indexation textuelle, prise en compte plus aisée des aspects sémantiques. Inconvénients : vocabulaire limité difficultés de l annotation : définition du vocabulaire, temps d annotation >> temps réel, subjectivité, etc.

16 Indexation d images à partir du texte

17

18 Ontologies Nécessité de définir un langage de description Limité par le contexte de production Limite l utilisation Définition d ontologies : modélisation du contexte (objets/concepts et relations entre eux) de façon à lever toute ambiguïté d interprétation «Le problème fondamental est de respecter la diversité des langages et des représentations du monde, tout en permettant l'échange d'information.[ ] Identifier, modéliser les concepts d'un domaine, pertinents pour une/des applications, Se mettre d'accord, au sein d'une communauté, sur les termes employés pour se référer à ces concepts.»

19 Taxonomie / Nomenclature Réduction couramment utilisée : Classification Exemple : Corine Land cover Surfaces artificielles Surfaces cultivées Forêts et espaces semi naturels Surfaces humides eau Usine urbaine Transports Réseaux routiers Ports Aéroports

20 Indexation par le contenu : principe (1/2) Images Extraction de caractéristiques Requêtes utilisateur Sélection de caractéristiques Caractéristiques Caract.+ étiquettes Apprentissage Non supervisé Apprentissage supervisé Modèles Modèles étiquetés

21 Principe (2/2) Off-line : production d indexes issus de l analyse du contenu des images Extraction de caractéristiques pertinentes Réduction de la dimensionnalité Organisation par classification On-line : gestion des requêtes d un utilisateur «Gap sémantique» Relevance feedback

22 Extraction de caractéristiques (1/2) Caractéristiques : Spécifiques : points saillants, minuties, Générales : couleur, texture, forme Globale ou locale : Blocs arbitraires, segmentation, information topologique

23 Extraction de caractéristiques

24 Extraction de caractéristiques (2/2) Problème de représentation Caractéristiques numériques, symboliques, graphes, Invariances Translation, rotation, homothétie, non-linéaires?

25 Extraction de caractéristiques

26 Caractéristiques et notion de similarité

27 Images similaires?

28 Similarité de l information (1/5) Visuellement similaires?

29 Similarité de l information (2/5)

30 Similarité de l information (3/5) Deux images seront comparées par l intermédiaire des caractéristiques extraites Sim( Im1, Im2 ) = Sim( f(im1), f(im2) ), avec f la fonction d extraction des caractéristiques Mesures de similarités, distances (A) s( x, x ) = s( y, y ) > s( x, y ) (B) s( x, y ) = s( y, x ) (C) d( x, x) = 0 (D) d(x,y) = 0 x = y (E) d(x, y) <= d(x,z) + d(z,y) (F) d(x,y) <= max( d(x,z), d(z,y) ) similarité dissimilarité distance Ultra-métriqu

31 Similarité de l information (4/5) Distance euclidienne Distance euclidienne généralisée Malahanobis Chi2 Similarité en cosinus Combinaisons linéaires de similarités (ou distances)

32 Similarité de l information (5/5) Comparaison des caractéristiques après une transformation F «Truc du noyau» K(x,y) = < F (x), F (y)>, K semi-defini positif D(x,y) = <x,x> + <y,y> -2<x,y> devient D(F (x), F (y) ) = K(x,x) + K(y,y) -2K(x,y) Intérêt : la spécification de K définit implicitement F Intensivement utilisé pour ACP, la discrimination de Fisher, la classification SVM,

33 Réduction d information (1/2) Réduction de la dimensionnalité ACP Algorithmes de sélection Quantification (forme de clusterisation)

34 Réduction d information (2/2) Sélection = Mettre des poids sur chaque caractéristiques Automatiquement : Supervisé, non supervisé Supervisé, wrapper : SVM-RFE, Fisher, Non supervisé, filter : clusterisation des caractéristiques

35 Organisation de l information (1/2) Classification : données X (caractéristiques) et label Y Exemples : kppv, SVM, Bayes, arbres de décision (C45.1) Évaluation d une classification : Décompte des erreurs Validation croisée

36 Organisation de l information (2/2) Clusterisation : données X Partitionnement : kmeans Hiérarchique : arbres Minimiser la distance intra-classes et maximiser la distance inter-classes Évaluation : pas évidente Estimation du nombre de clusters : indexes de Calinsky, Davies Bouldin, Dunn, Mesure de la qualité?

37 Gestion de l information SGBD Systèmes de Gestion de Bases de données Gestion informatique : interaction avec les requêtes utilisateur, temps d accès, place mémoire, Relationnel : SQL, mysql Objet Relationnel-objet : Oracle, PostGreSQL

38 Requêtes Grande diversité Les systèmes imposent des types de requête : Recherche d une image dans une base Recherche d images similaires à une image exemplaire Recherche d images similaires à des images exemples et dissimilaires à d autres Recherche d images contenant une région de l image exemplaire

39 Feedback utilisateur (1/2) Défaut majeur des systèmes standards : l utilisateur doit s adapter au système Caractéristiques extraites automatiquement non intuitives Fossé entre la formulation des requêtes et le codage de l information Nécessité d adapter le système à l utilisateur Apprentissage : requêtes, mesures de similarités

40 Feedback utilisateur (2/2) Images Extraction de caractéristiques Requêtes utilisateur Sélection de caractéristiques Caractéristiques Caract.+ étiquettes Apprentissage Non supervisé Apprentissage supervisé Modèles Modèles étiquetés

41 Évaluation (1/2) Graphe de rappel-précision calculé en faisant varier le nombre de documents sélectionnés Documents pertinents Documents non pertinents Documents sélectionnés Documents non sélectionnés Documents trouvés et Documents oubliés : silence Documents hors contexte : bruit précision= documentstrouvés documentssélectionnés rappel = documentstrouvés documents pertinents

42 Évaluation (2/2) : autres critères Exploitation du rang de récupération Critère de validation de MPEG7 Rank*(k) = rang(k) si < K(q), 1.25K sinon AVR(q) : moyenne des rangs MRR(q) = AVR(q) 0.5( 1 + NG(q) ) NMRR(q) = MRR(q) / ( 1.25K 0.5(1+NG(q)) ) Critère final : moyenne des NMRR Notations : q = 1 requête ; k = une image pertinente pour la requête ; NG(q) nombre d images pertinentes pour la requête ; K limite de rang acceptable

43 Normalisation : MPEG 7 (1/2) MPEG : Motion Picture Expert group MPEG7 : A Multimedia Content Description Interface, normalisé en 2001 Standard de description du contenu de données multimédia + interprétation du sens de l information S appuie sur XML (langage à balises) Un éditeur gratuit d IBM (pour indexer des videos)

44 Normalisation : MPEG 7 (2/2) Définitions de caractéristiques bas niveau : //www-iplab.ece.ucsb.edu/publications/01ieeemanjunath.htm Évaluation des caractéristiques sur des bases étiquetées manuellement

45 Démonstrations Images 3D :

46 Démonstrations

47 Démonstrations Ding-Yun Chen, Xiao-Pei Tian, Yu-Te Shen and Ming Ouhyoung, "On Visual Similarity Based 3D Model Retrieval", Computer Graphics Forum (EUROGRAPHICS'03), Vol. 22, No. 3, pp , Sept. 2003

48 Démonstrations www-rocq.inria.fr/imedia/ikona Feedback utilisateur

49 Conclusion Indexation des images : problème non résolu Experts issus de domaines variés (informatique, traitement de l image, psycho visuel, apprentissage machine, ) Deux axes à étudier simultanément : Techniques d analyse d image donc d extraction et de comparaison de l information Pertinence de l information pour un utilisateur Produits commerciaux encore basiques quoique

INDEXATION des IMAGES. Marine Campedel http://www.tsi.enst.fr/~campedel 2006-2007

INDEXATION des IMAGES. Marine Campedel http://www.tsi.enst.fr/~campedel 2006-2007 INDEXATION des IMAGES Marine Campedel http://www.tsi.enst.fr/~campedel 2006-2007 Plan du cours Indeer? Historique Acteurs de l'indeation d'images Comment indeer? Indeation par le contenu Évaluation d'un

Plus en détail

INDEXATION des IMAGES satellitaires. Marine Campedel http://www.tsi.enst.fr/~campedel 2006-2007

INDEXATION des IMAGES satellitaires. Marine Campedel http://www.tsi.enst.fr/~campedel 2006-2007 INDEXATION des IMAGES satellitaires Marine Campedel http://www.tsi.enst.fr/~campedel 2006-2007 Plan du cours Indeer? Acteurs de l'indeation d'images satellitaires Comment indeer? Indeation par le contenu

Plus en détail

Journée Rencontres Académiques SCS

Journée Rencontres Académiques SCS Journée Rencontres Académiques SCS 24/01/2012 Prof. Frédéric Precioso Knowledge Extraction, Integration & Algorithms (KEIA) http://keia.i3s.unice.fr/ 2 /35 Permanents Célia Pereira da Costa, Christel Dartigues,

Plus en détail

Acquisition et gestion de contenus numériques multimédia

Acquisition et gestion de contenus numériques multimédia 08/10/2014 Acquisition et gestion de contenus numériques multimédia Introduction Valérie Gouet-Brunet et Michel Crucianu valerie.gouet@ign.fr, michel.crucianu@cnam.fr IGN / CNAM http://recherche.ign.fr/labos/matis/cours/master-siaw-mlv/

Plus en détail

Nouvelles de l AS fouille d images. Émergence de caractéristiques sémantiques

Nouvelles de l AS fouille d images. Émergence de caractéristiques sémantiques Nouvelles de l AS fouille d images Émergence de caractéristiques sémantiques Patrick GROS Projet TEXMEX IRISA - UMR 6074, CNRS, université de Rennes 1, INSA Rennes, INRIA L AS fouille d images Qu est-ce

Plus en détail

WEKA : c est quoi? Brigitte Bigi. 15 février 2011. LPL - Équipe C3I. Brigitte Bigi (LPL - Équipe C3I) WEKA : c est quoi? 15 février 2011 1 / 32

WEKA : c est quoi? Brigitte Bigi. 15 février 2011. LPL - Équipe C3I. Brigitte Bigi (LPL - Équipe C3I) WEKA : c est quoi? 15 février 2011 1 / 32 WEKA : c est quoi? Brigitte Bigi LPL - Équipe C3I 15 février 2011 Brigitte Bigi (LPL - Équipe C3I) WEKA : c est quoi? 15 février 2011 1 / 32 Introduction 1 Introduction 2 Classification supervisée 3 WEKA

Plus en détail

De 2 à 22 millions d'images; Création, Indexation et Recherche par le contenu avec PiRiA

De 2 à 22 millions d'images; Création, Indexation et Recherche par le contenu avec PiRiA De 2 à 22 millions d'images; Création, Indexation et Recherche par le contenu avec PiRiA contact : patrick.hède@cea.fr Commissariat à l'energie Atomique GdR isis : Passage à l'échelle dans la recherche

Plus en détail

De 2 à 22 millions d'images; Création, Indexation et Recherche par le contenu avec Piria

De 2 à 22 millions d'images; Création, Indexation et Recherche par le contenu avec Piria De 2 à 22 millions d'images; Création, Indexation et Recherche par le contenu avec Piria contact : patrick.hede@cea.fr Commissariat à l'energie Atomique List sensorielles 13/05/07 1 Plan Le CEA, le Lic2m

Plus en détail

Fouille de données spatiales Mr Dib Abderrahim & Dr Mohamed-Khireddine KHOLLADI

Fouille de données spatiales Mr Dib Abderrahim & Dr Mohamed-Khireddine KHOLLADI Fouille de données spatiales Mr Dib Abderrahim & Dr Mohamed-Khireddine KHOLLADI Introduction On assiste de plus en plus à la création d entrepôts de données. Les raisons sont multiples : 1. le tout numérique

Plus en détail

Fouille de Données et Media Sociaux Cours 2 Master DAC Data Science UPMC - LIP6

Fouille de Données et Media Sociaux Cours 2 Master DAC Data Science UPMC - LIP6 Fouille de Données et Media Sociaux Cours 2 Master DAC Data Science UPMC - LIP6 Ludovic Denoyer 21 septembre 2015 Ludovic Denoyer () FDMS 21 septembre 2015 1 / 1 Contexte Observation La plupart des bonnes

Plus en détail

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com Intelligence Artificielle et Systèmes Multi-Agents Badr Benmammar bbm@badr-benmammar.com Plan La première partie : L intelligence artificielle (IA) Définition de l intelligence artificielle (IA) Domaines

Plus en détail

STIC et risques. Des données à la connaissance. pour la gestion des risques 2007-2008

STIC et risques. Des données à la connaissance. pour la gestion des risques 2007-2008 STIC et risques Des données à la connaissance pour la gestion des risques 2007-2008 Marine www.tsi.enst.fr/~campedel Quid STIC? Signification de l acronyme? Système de Traitement des Infractions Constatées

Plus en détail

Support Vector Machines

Support Vector Machines Support Vector Machines Séparateurs à vaste marge Arnaud Revel revel.arnaud@gmail.com Plan 1 Introduction 2 Formalisation 3 Utilisation des noyaux 4 Cas multi-classes 5 Applications des SVM 6 Bibliographie

Plus en détail

Offre de formation de troisième cycle (LMD)

Offre de formation de troisième cycle (LMD) Offre de formation de troisième cycle (LMD) (Arrêté n 250 du 28 juillet 2009, fixant l organisation de la formation de troisième en vue de l obtention du diplôme de doctorat) Etablissement Faculté / Institut

Plus en détail

Introduction aux Bases de Données Relationnelles. Introduction aux Bases de Données Relationnelles Introduction- 1. Qu est-ce qu une base de données?

Introduction aux Bases de Données Relationnelles. Introduction aux Bases de Données Relationnelles Introduction- 1. Qu est-ce qu une base de données? Qu est-ce qu une base de données? Utilisez-vous des bases de données? Introduction aux Bases de Données Relationnelles explicitement? implicitement? Qui n utilise jamais de base de données? Département

Plus en détail

Indexation d'images. Cours Master IA&D. Techniques du traitement d'images. Antoine Manzanera - ENSTA /Unité d'électronique et d'informatique

Indexation d'images. Cours Master IA&D. Techniques du traitement d'images. Antoine Manzanera - ENSTA /Unité d'électronique et d'informatique Indexation d'images Cours Master IA&D Techniques du traitement d'images Antoine Manzanera - ENSTA /Unité d'électronique et d'informatique Indexation - Introduction Le sujet de ce cours est la recherche

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme

Plus en détail

Masses de données. 1. Introduction 2. Problématiques 3. Socle de formation (non présenté) 4. Liens avec Formation INSA

Masses de données. 1. Introduction 2. Problématiques 3. Socle de formation (non présenté) 4. Liens avec Formation INSA Masses de données 1. Introduction 2. Problématiques 3. Socle de formation (non présenté) 4. Liens avec Formation INSA Rédacteurs : Mjo Huguet / N. Jozefowiez 1. Introduction : Besoins Informations et Aide

Plus en détail

BASE DE DONNEES. OlivierCuré [ocure@univ-mlv.fr]

BASE DE DONNEES. OlivierCuré [ocure@univ-mlv.fr] BASE DE DONNEES 1 Contact Olivier Curé ocure@univ-mlv.fr http://www.univ-mlv.fr/~ocure Copernic 4B060 2 Objectifs du cours Présentation des concepts liés aux bases de données, aux modèles des bases de

Plus en détail

Systèmes de représentation multi-échelles pour l indexation et la restauration d archives médiévales couleur

Systèmes de représentation multi-échelles pour l indexation et la restauration d archives médiévales couleur 18/12/2003 p.1/50 Systèmes de représentation multi-échelles pour l indexation et la restauration d archives médiévales couleur Julien DOMBRE Laboratoire IRCOM-SIC, UMR-CNRS 6615. En partenariat avec le

Plus en détail

UE 8 Systèmes d information de gestion Le programme

UE 8 Systèmes d information de gestion Le programme UE 8 Systèmes d information de gestion Le programme Légende : Modifications de l arrêté du 8 mars 2010 Suppressions de l arrêté du 8 mars 2010 Partie inchangée par rapport au programme antérieur Indications

Plus en détail

Digital Workplace et Gestion des connaissances Concepts et mise en oeuvre

Digital Workplace et Gestion des connaissances Concepts et mise en oeuvre Avant-propos 1. Objectif du livre 17 2. Illustrations des exemples de ce livre 18 2.1 Office 365 comme plateforme technologique pour une digital workplace 18 2.2 SharePoint et Yammer à l honneur 18 3.

Plus en détail

Recommandation dans les réseaux sociaux professionnels

Recommandation dans les réseaux sociaux professionnels Recommandation dans les réseaux sociaux professionnels Application sur un réseau bibliographique 6 mai 2010 Objectif et Motivation Techniques utilisées Algorithme exhaustive de recherche de toutes les

Plus en détail

Introduction au datamining

Introduction au datamining Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des

Plus en détail

PLAte-forme Tsi Online - PLATO. 8 avril 2009 Présentation finale de l usage du financement sur crédit incitatif

PLAte-forme Tsi Online - PLATO. 8 avril 2009 Présentation finale de l usage du financement sur crédit incitatif PLAte-forme Tsi Online - PLATO 8 avril 2009 Présentation finale de l usage du financement sur crédit incitatif Contexte Recherches en indexation et fouilles de contenus multimédia au département TSI, Télécom

Plus en détail

Analyse Quantitative et Qualitative de données textuelles. Normand Péladeau, Ph.D. Président Recherches Provalis

Analyse Quantitative et Qualitative de données textuelles. Normand Péladeau, Ph.D. Président Recherches Provalis Analyse Quantitative et Qualitative de données textuelles Normand Péladeau, Ph.D. Président Recherches Provalis Les Produits de Recherches Provalis SIMSTAT (1989) Analyses Statistiques Simstat v2.5 Les

Plus en détail

Indexation 3D à partir de vues 2D

Indexation 3D à partir de vues 2D Indexation 3D à partir de vues 2D Thibault Napoléon 1 Télécom ParisTech - TSI Qu est ce que l indexation 3D? Recherche dans une grande base de donnée 3D Recherche par le contenu (la forme, la couleur...)

Plus en détail

Ingénierie d aide à la décision

Ingénierie d aide à la décision Ingénierie d aide à la décision Maria Malek 1 er septembre 2009 1 Objectifs et débouchés Nous proposons dans cette option deux grands axes pour l aide à la décision : 1. La recherche opérationnelle ; 2.

Plus en détail

Logiciel QDA Miner. Deuxième partie Gestion du livre des codes et codage manuel

Logiciel QDA Miner. Deuxième partie Gestion du livre des codes et codage manuel PLAN DE COURS «ANALYSE DE DONNEES TEXTUELLES» Trois approches pour l analyse de textes Analyse qualitative Analyse quantitative Fouille de textes Introduction au logiciel QDA Miner Introduction et gestion

Plus en détail

Bases de données Outils de gestion

Bases de données Outils de gestion 11/03/2010 Bases de données Outils de gestion Mise en place d outils pour gérer, stocker et utiliser les informations d une recherche biomédicale ent réalisé par L. QUINQUIS d épidémiologie et de biostatistique

Plus en détail

Ontologies et représentations symboliques des images. Marine Campedel

Ontologies et représentations symboliques des images. Marine Campedel Ontologies et représentations symboliques des images Marine Campedel www.tsi.enst.fr/~campedel 2006-2007 Plan du cours Représentation des connaissances : généralités Ontologie : de l'ontologie aux ontologies

Plus en détail

Couplage d une base de données documentaire à une visualisation interactive 3D sur l Internet

Couplage d une base de données documentaire à une visualisation interactive 3D sur l Internet Couplage d une base de données documentaire à une visualisation interactive 3D sur l Internet Romain Raffin, Jean-luc REY Aix-Marseille Université Plate-forme technologique PRISM Iut d Aix-Marseille romain.raffin[at]univ-amu.fr

Plus en détail

Apprentissage par méthodes à noyaux en reconnaissance d images

Apprentissage par méthodes à noyaux en reconnaissance d images Apprentissage par méthodes à noyaux en reconnaissance d images Alberto Bietti Table des matières Introduction 2 1 Apprentissage par méthodes à noyaux 2 1.1 Position du problème et motivation..........................

Plus en détail

Objectifs. Maîtriser. Pratiquer

Objectifs. Maîtriser. Pratiquer 1 Bases de Données Objectifs Maîtriser les concepts d un SGBD relationnel Les modèles de représentations de données Les modèles de représentations de données La conception d une base de données Pratiquer

Plus en détail

Motivation : pourquoi exploration de données? Nous nous noyons dans les données, mais manquons cruellement de connaissances

Motivation : pourquoi exploration de données? Nous nous noyons dans les données, mais manquons cruellement de connaissances 1 Introduction Définition et motivations Tâches de data mining (fouille de données, exploration de données) Techniques et algorithmes Exemples et applications 1 Motivation : pourquoi exploration de données?

Plus en détail

Classification Exemple : Enquête d opinion sur les OGM. Pauline Le Badezet Alexandra Lepage

Classification Exemple : Enquête d opinion sur les OGM. Pauline Le Badezet Alexandra Lepage Classification Exemple : Enquête d opinion sur les OGM Pauline Le Badezet Alexandra Lepage SOMMAIRE Introduction Méthodologie Méthode de partitionnement Classification Ascendante Hiérarchique Interprétation

Plus en détail

Évaluer les liens entre codage et les données structurées (variables) Introduction au gestionnaire de rapport et au journal de commandes

Évaluer les liens entre codage et les données structurées (variables) Introduction au gestionnaire de rapport et au journal de commandes Trois approches en analyse de texte L'Analyse Qualitative L'analyse de Contenu Quantitative (par dictionnaires) Le forage de texte ("Text Mining") Introduction aux logiciels de Provalis Research QDA Miner

Plus en détail

Apprentissage Automatique

Apprentissage Automatique Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs

Plus en détail

Outils Statistiques du Data Mining

Outils Statistiques du Data Mining Outils Statistiques du Data Mining Pr Roch Giorgi roch.giorgi@univ-amu.fr SESSTIM, Faculté de Médecine, Aix-Marseille Université, Marseille, France http://sesstim-orspaca.org http://optim-sesstim.univ-amu.fr

Plus en détail

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP)

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP) Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP) Définition (G. Gardarin) Entrepôt : ensemble de données historisées variant

Plus en détail

Systèmes d information et bases de données (niveau 1)

Systèmes d information et bases de données (niveau 1) Systèmes d information et bases de données (niveau 1) Cours N 1 Violaine Prince Plan du cours 1. Bibliographie 2. Introduction aux bases de données 3. Les modèles 1. Hiérarchique 2. Réseau 3. Relationnel

Plus en détail

N. Paparoditis, Laboratoire MATIS

N. Paparoditis, Laboratoire MATIS N. Paparoditis, Laboratoire MATIS Contexte: Diffusion de données et services locaux STEREOPOLIS II Un véhicule de numérisation mobile terrestre Lasers Caméras Système de navigation/positionnement STEREOPOLIS

Plus en détail

Base de données en mémoire

Base de données en mémoire Base de données en mémoire Plan Bases de données relationnelles OnLine Analytical Processing Difficultés de l OLAP Calculs en mémoire Optimisations 1 Base de données relationnelle Introduction Date Exemple

Plus en détail

Analyse de données textuelles Panorama des fonctions, des méthodes et des usages

Analyse de données textuelles Panorama des fonctions, des méthodes et des usages Analyse de données textuelles Panorama des fonctions, des méthodes et des usages Sylvie Dalbin Assistance & Techniques Documentaires DocForum, Le 17 Novembre 2005 Déroulé de l'intervention (1) 1. Définition

Plus en détail

Formation Actuaire Data-Scientist PROGRAMME

Formation Actuaire Data-Scientist PROGRAMME Formation Actuaire Data-Scientist PROGRAMME 15 Septembre 2014 Arthur Charpentier, Romuald Élie & Jérémie Jakubowicz 15914 Programme Séance inaugurale : révolu-on numérique besoins des entreprises cadre

Plus en détail

Une plate-forme interopérable. 4 décembre 2007

Une plate-forme interopérable. 4 décembre 2007 1 Une plate-forme interopérable 4 décembre 2007 Plan 2 Vers une nouvelle plate-forme: GeOxygene L expérience des plates-formes au COGIT. Architecture de GeOxygene Organisation générale de la plate-forme

Plus en détail

FOUILLE DE DONNEES. Anne LAURENT ECD. laurent@lirmm.fr

FOUILLE DE DONNEES. Anne LAURENT ECD. laurent@lirmm.fr FOUILLE DE DONNEES Anne LAURENT laurent@lirmm.fr ECD Pourquoi la fouille de données? Données disponibles Limites de l approche humaine Nombreux besoins : Industriels, Médicaux, Marketing, Qu est-ce que

Plus en détail

Initiation à la fouille de données et à l apprentissage automatiq

Initiation à la fouille de données et à l apprentissage automatiq Initiation à la fouille de données et à l apprentissage automatique 1 Laboratoire d Informatique Fondamentale de Marseille Université de Provence christophe.magnan@lif.univ-mrs.fr www.lif.univ-mrs.fr/

Plus en détail

1. Vue rapide des logiciels disponibles

1. Vue rapide des logiciels disponibles Voici une revue rapide des progiciels gratuits accessibles [FREE AND SHAREWARE] dans la section SUITES du site KDNUGGETS (http://www.kdnuggets.com/software/suites.html). L étude sera approfondie pour les

Plus en détail

Vectorisation du modèle d appariement pour la recherche d images par le contenu

Vectorisation du modèle d appariement pour la recherche d images par le contenu - Vectorisation du modèle d appariement pour la recherche d images par le contenu Hanen Karamti 1 MIRACL, Université de Sfax Route de Tunis Km 10 B.P. 242, 3021, Sfax, Tunisie karamti.hanen@gmail.com RÉSUMÉ.

Plus en détail

Statistique et analyse de données pour l assureur : des outils pour la gestion des risques et le marketing

Statistique et analyse de données pour l assureur : des outils pour la gestion des risques et le marketing Statistique et analyse de données pour l assureur : des outils pour la gestion des risques et le marketing Gilbert Saporta Chaire de Statistique Appliquée, CNAM ActuariaCnam, 31 mai 2012 1 L approche statistique

Plus en détail

Analyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57

Analyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57 Analyse de la vidéo Chapitre 4.1 - La modélisation pour le suivi d objet 10 mars 2015 Chapitre 4.1 - La modélisation d objet 1 / 57 La représentation d objets Plan de la présentation 1 La représentation

Plus en détail

Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs

Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs Journée organisée par le CRFCB Midi-Pyrénées / Languedoc-Roussillon

Plus en détail

MÉTHODES DE CLASSIFICATION

MÉTHODES DE CLASSIFICATION MÉTHODES DE CLASSIFICATION Pierre-Louis GONZALEZ MÉTHODES DE CLASSIFICATION Objet Opérer des regroupements en classes homogènes d un ensemble d individus. Données Les données se présentent en général sous

Plus en détail

Etat de l art sur l utilisation des techniques Web Sémantique en ECD

Etat de l art sur l utilisation des techniques Web Sémantique en ECD Etat de l art sur l utilisation des techniques Web Sémantique en ECD Hicham Behja ENSAM Meknès(1,2,3) Brigitte Trousse Projet AxIS INRIA Sophia Antipolis (2) Abdelaziz Marzak Faculté des sciences Casablanca

Plus en détail

STAR-CITY. Analyse et prédiction du trafic routier à l aide des technologies du web sémantique

STAR-CITY. Analyse et prédiction du trafic routier à l aide des technologies du web sémantique 1 STAR-CITY Analyse et prédiction du trafic routier à l aide des technologies du web sémantique IFT6282 Paul Molins ARTICLE Auteurs : Freddy Lécué, Simone Tallevi-Diotallevi, Jer Hayes, Robert Tucker,Veli

Plus en détail

BASES DE DONNÉES AVANCÉES

BASES DE DONNÉES AVANCÉES L3 Informatique Option : ISIL BASES DE DONNÉES AVANCÉES RAMDANI MED U-BOUIRA M. R A M D A N I @ U N I V - B O U I R A. D Z P E R S O. L I V E H O S T. F R Cours 5 : Evaluation et optimisation des requêtes

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane

Plus en détail

Indexation et interrogation de photos de presse décrites en MPEG-7

Indexation et interrogation de photos de presse décrites en MPEG-7 Indexation et interrogation de photos de presse décrites en MPEG-7 Emmanuel Bruno Jacques Le Maitre Elisabeth Murisasco Laboratoire SIS, Equipe Informatique Université de Toulon et du Var Bâtiment R, BP

Plus en détail

Gestion de Contenus Web (WCM)

Gestion de Contenus Web (WCM) Web Content Management 1 Gestion de Contenus Web (WCM) Bernd Amann Modelware : vers la modélisation et la sémantisation de l information École CEA-EDF-INRIA 16-27 juin 2003 Cours No 1 - Gestion de Contenus

Plus en détail

INDEXATION DE DOCUMENTS AUDIOVISUELS. Yannick Prié LIRIS UMR 5205 CNRS - Université Claude Bernard Lyon 1 Journées VISA 18 décembre 2008

INDEXATION DE DOCUMENTS AUDIOVISUELS. Yannick Prié LIRIS UMR 5205 CNRS - Université Claude Bernard Lyon 1 Journées VISA 18 décembre 2008 INDEXATION DE DOCUMENTS AUDIOVISUELS Yannick Prié LIRIS UMR 5205 CNRS - Université Claude Bernard Lyon 1 Journées VISA 18 décembre 2008 Présentation MCF informatique Université Claude Bernard Lyon 1 Equipe

Plus en détail

Qu est ce qu un Système d Information

Qu est ce qu un Système d Information Introduction Qu est ce qu un Système d Information Système = ensemble auto-réglable et interagissant avec l environnement qui fonctionne en vue d un objectif précis environnement entrées sorties régulation

Plus en détail

La compression vidéo avec le standard H.264/AVC

La compression vidéo avec le standard H.264/AVC Nicolas Sertier Emmanuel André Pierre Fritsch Supélec électif Audiovisuel numérique 24 janvier 2005 Plan Présentation générale 1 Présentation générale Origines et historique Caractéristiques 2 50 % de

Plus en détail

Recherche d'images par le contenu Application au monitoring Télévisuel à l'institut national de l'audiovisuel

Recherche d'images par le contenu Application au monitoring Télévisuel à l'institut national de l'audiovisuel Recherche d'images par le contenu Application au monitoring Télévisuel à l'institut national de l'audiovisuel Alexis Joly alexis.joly@inria.fr INRIA - IMEDIA Alexis Joly cours monitoring p. 1 Plan de l'exposé

Plus en détail

1 CM. Calendrier des examens - janvier 2016. Université de la Manouba Institut Supérieur des Arts Multimédias PREMIER SEMESTRE DE L A.

1 CM. Calendrier des examens - janvier 2016. Université de la Manouba Institut Supérieur des Arts Multimédias PREMIER SEMESTRE DE L A. 1 CM Lundi 04-01-2016 De 09h à 10h15 Techniques d'expressions vectorielles (DS) Pratique Lundi 04-01-2016 De 12h30 à 13h45 C2i 1 (DS) Pratique Mardi 05-01-2016 De 12h30 à 13h45 Traitement d'images numériques

Plus en détail

Master of Science HES-SO en Sciences de l information Rentrée Année académique 2015

Master of Science HES-SO en Sciences de l information Rentrée Année académique 2015 Master of Science HES-SO en Sciences de l information Rentrée Année académique 015 Formulaire relatif aux enseignements en prérequis en vue de demandes d équivalence Seuls les étudiants devant effectuer

Plus en détail

Gestion du parc informatique matériel et logiciel de l Ensicaen. Rapport de projet. Spécialité Informatique 2 e année. SAKHI Taoufik SIFAOUI Mohammed

Gestion du parc informatique matériel et logiciel de l Ensicaen. Rapport de projet. Spécialité Informatique 2 e année. SAKHI Taoufik SIFAOUI Mohammed 6, bd maréchal Juin F-14050 Caen cedex 4 Spécialité Informatique 2 e année Rapport de projet Gestion du parc informatique matériel et logiciel de l Ensicaen SAKHI Taoufik SIFAOUI Mohammed Suivi ENSICAEN

Plus en détail

Programme détaillé des enseignements

Programme détaillé des enseignements Programme détaillé des enseignements SEMESTRE S1 STATISTIQUES Méthodes d'estimation ponctuelle (méthodes des moments, du maximum de vraisemblances, bayésienne) et par intervalles de confiance. Statistiques

Plus en détail

Présentation du module Base de données spatio-temporelles

Présentation du module Base de données spatio-temporelles Présentation du module Base de données spatio-temporelles S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Partie 1 : Notion de bases de données (12,5h ) Enjeux et principes

Plus en détail

I. Bases de données. Exemples classiques d'applications BD. Besoins de description

I. Bases de données. Exemples classiques d'applications BD. Besoins de description I. Bases de données Exemples classiques d'applications BD Les besoins Qu est ce qu un SGBD, une BD Architecture d un SGBD Cycle de vie Plan du cours Gestion des personnels, étudiants, cours, inscriptions,...

Plus en détail

Bases de données multimédia

Bases de données multimédia Bases de données multimédia Séance 1 : Introduction Michel Crucianu (Cnam) Valérie Gouet-Brunet (IGN) http://cedric.cnam.fr/~crucianm/bdm.html Contenu du cours Introduction : motivations, applications,

Plus en détail

ACCÈS SÉMANTIQUE AUX BASES DE DONNÉES DOCUMENTAIRES

ACCÈS SÉMANTIQUE AUX BASES DE DONNÉES DOCUMENTAIRES ACCÈS SÉMANTIQUE AUX BASES DE DONNÉES DOCUMENTAIRES Techniques symboliques de traitement automatique du langage pour l indexation thématique et l extraction d information temporelle Thèse Défense publique

Plus en détail

Enjeux mathématiques et Statistiques du Big Data

Enjeux mathématiques et Statistiques du Big Data Enjeux mathématiques et Statistiques du Big Data Mathilde Mougeot LPMA/Université Paris Diderot, mathilde.mougeot@univ-paris-diderot.fr Mathématique en Mouvements, Paris, IHP, 6 Juin 2015 M. Mougeot (Paris

Plus en détail

Cours Fouille de données avancée

Cours Fouille de données avancée Ministère de l Enseignement Supérieur et de la Recherche Scientifique Université Mohamed Khider - Biskra Faculté des Sciences Exactes et des Sciences de la Nature et de la Vie Département d Informatique

Plus en détail

Visualisation d information

Visualisation d information Master SIAD 1 année Visualisation d information Jean-Yves Antoine http://www.info.univ-tours.fr/~antoine/ Master SIAD 1 année Visualisation d information Chapitre 1.0 Introduction Quand voir, c est comprendre

Plus en détail

Plan d Evaluation (phase 1) Version 1.1

Plan d Evaluation (phase 1) Version 1.1 Evaluation des Systèmes de Transcription enrichie d Emissions Radiophoniques (ESTER) Plan d Evaluation (phase 1) Version 1.1 Dernière mise à jour le 21 novembre 2003. 1 Préambule Ce document décrit le

Plus en détail

Analyse et modélisation de visages

Analyse et modélisation de visages Analyse et modélisation de visages Pascal Bourdon Laboratoire XLIM-SIC (UMR CNRS 7252) / Université de Poitiers pascal.bourdon@univ-poitiers.fr Analyse et modélisation de visages Plan Introduction Outils

Plus en détail

Accès au Contenu Informationnel pour les Masses de Données de Documents

Accès au Contenu Informationnel pour les Masses de Données de Documents Accès au Contenu Informationnel pour les Masses de Données de Documents Grappa LILLE 3 - UR Futurs INRIA MOSTRARE Laboratoire d Informatique de Paris 6 Laboratoire de Recherche en Informatique Orsay -

Plus en détail

UE Informatique Conception et Exploitation de Bases de Données

UE Informatique Conception et Exploitation de Bases de Données PeiP 1 ère année UE Informatique Conception et Exploitation de Bases de Données Session 2 : Généralités BD & MCD (Conception) 1. Retour sur MCD 3/28 Exemple d ambiguïté 1/4 Modéliser les informations suivantes

Plus en détail

Projet Business Object

Projet Business Object Projet Business Object Rapports parties 1 et 2 Alexandre DUPONT, Guillaume COUSIN, Laurent PACHAREU et Yoann KERMORVANT Etudiants en licence professionnelle Conception de Systèmes Décisionnels Page 1 sur

Plus en détail

GED: Gestion Electronique de Document (Support de cours) R. MAHMOUDI (mahmoudr@esiee.fr) www.research-ace.net/~mahmoudi 1 Gestion Electronique de Documents Plan du cours - Introduction générale - Spécificités

Plus en détail

2 Serveurs OLAP et introduction au Data Mining

2 Serveurs OLAP et introduction au Data Mining 2-1 2 Serveurs OLAP et introduction au Data Mining 2-2 Création et consultation des cubes en mode client-serveur Serveur OLAP Clients OLAP Clients OLAP 2-3 Intérêt Systèmes serveurs et clients Fonctionnalité

Plus en détail

Fusion de classifiers visuels et textuels pour un système de recherche d images

Fusion de classifiers visuels et textuels pour un système de recherche d images Fusion de classifiers visuels et textuels pour un système de recherche d images Sabrina Tollari, Hervé Glotin, Jacques Le Maitre Université du Sud Toulon-Var Giens, 16 juin 2004 1 Plan Problématique Du

Plus en détail

Business Intelligence avec Excel, Power BI et Office 365

Business Intelligence avec Excel, Power BI et Office 365 Avant-propos A. À qui s adresse ce livre? 9 1. Pourquoi à chaque manager? 9 2. Pourquoi à tout informaticien impliqué dans des projets «BI» 9 B. Obtention des données sources 10 C. Objectif du livre 10

Plus en détail

MODELISATION ET EXPERIENCE POUR L INDEXATION SYMBOLIQUE D IMAGES SUR LE WEB

MODELISATION ET EXPERIENCE POUR L INDEXATION SYMBOLIQUE D IMAGES SUR LE WEB UNIVERSITE JOSEPH FOURIER GRENOBLE I U.F.R EN INFORMATIQUE ET MATHEMATIQUES APPLIQUEES MR 2 INFORMATIQUE : Intelligence, Interaction et Information Projet présenté par : Isavella DIOLETI Sous la responsabilité

Plus en détail

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours Information du cours Informatique décisionnelle et data mining www.lia.univ-avignon.fr/chercheurs/torres/cours/dm Juan-Manuel Torres juan-manuel.torres@univ-avignon.fr LIA/Université d Avignon Cours/TP

Plus en détail

Introduction. 1. Une base de données : 2. Un SGBD :

Introduction. 1. Une base de données : 2. Un SGBD : Le modèle Entité-Association Introduction Les bases de données ont pris une place importante en informatique, et particulièrement dans le domaine de la gestion. L étude des bases de données a conduit au

Plus en détail

Généralités sur les bases de données

Généralités sur les bases de données Généralités sur les bases de données Qu est-ce donc qu une base de données? Que peut-on attendre d un système de gestion de bases de données? Que peut-on faire avec une base de données? 1 Des données?

Plus en détail

PLAN. Les systèmes d'information analytiques. Exemples de décisions

PLAN. Les systèmes d'information analytiques. Exemples de décisions Les systèmes d'information analytiques Dr A.R. Baba-ali Maitre de conferences USTHB PLAN Le cycle de decision Les composants analytiques ETL (Extract, Transform and Load) Entrepot de (Data warehouse) Traitement

Plus en détail

Séance 12: Algorithmes de Support Vector Machines

Séance 12: Algorithmes de Support Vector Machines Séance 12: Algorithmes de Support Vector Machines Laboratoire de Statistique et Probabilités UMR 5583 CNRS-UPS www.lsp.ups-tlse.fr/gadat Douzième partie XII Algorithmes de Support Vector Machines Principe

Plus en détail

Séance 1 Introduction aux bases de données

Séance 1 Introduction aux bases de données Introduction aux bases de données Séance 1 Introduction aux bases de données Sébastien Combéfis mardi 24 février 2015 Ce(tte) œuvre est mise à disposition selon les termes de la Licence Creative Commons

Plus en détail

Bases de données Cours 1 : Généralités sur les bases de données

Bases de données Cours 1 : Généralités sur les bases de données Cours 1 : Généralités sur les bases de données POLYTECH Université d Aix-Marseille odile.papini@univ-amu.fr http://odile.papini.perso.esil.univmed.fr/sources/bd.html Plan du cours 1 1 Qu est ce qu une

Plus en détail

Introduction aux Bases de Données 2004/2005

Introduction aux Bases de Données 2004/2005 Introduction aux Bases de Données 2004/2005 Chapitre 4 Les anciens modèles logiques Ecole Nationale Supérieur de Physique de Strasbourg Christian Wolf christian.wolf@ensps.u-strasbg.fr 4.1 Stockage physique

Plus en détail

WCUM pour l analyse d un site Web

WCUM pour l analyse d un site Web WCUM pour l analyse d un site Web Malika Charrad 1 Yves Lechevallier 2 Gilbert Saporta 3 Mohamed Ben Ahmed 4 1,4 Ecole Nationale des Sciences de l Informatique, Tunis 2 INRIA Rocquencourt, Paris 1,3 Conservatoire

Plus en détail

Le Catalogue des fonds culturels numérisés

Le Catalogue des fonds culturels numérisés Le Catalogue des fonds culturels numérisés Ministère de la Culture Mission de la Recherche et de la technologie http://www.numerique.culture.fr 1 Présentation générale : le programme de numérisation, outils,

Plus en détail

Logiciel libre dans un projet de coopération internationale Le projet SIST

Logiciel libre dans un projet de coopération internationale Le projet SIST Logiciel libre dans un projet de coopération internationale Le projet SIST Journée thématique, les logiciels libres en IST CNRS/Pist LR/Agropolis Montpellier 23 novembre 2007 Sommaire SOMMAIRE 1 - Présentation

Plus en détail

Indexation conceptuelle application au domaine biomédical. Mesures de similarité dans les ontologies. [Séminaire MIAD Montpellier SupAgro]

Indexation conceptuelle application au domaine biomédical. Mesures de similarité dans les ontologies. [Séminaire MIAD Montpellier SupAgro] [] Indexation conceptuelle application au domaine biomédical Mesures de similarité dans les ontologies Sylvie Ranwez Sébastien Harispe LGI2P de l école des mines d Alès équipe KID (Knowledge and Image

Plus en détail

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales Ecole des Hautes Etudes Commerciales HEC Alger Évolution des SGBDs par Amina GACEM Module Informatique 1ière Année Master Sciences Commerciales Evolution des SGBDs Pour toute remarque, question, commentaire

Plus en détail

Objectif du groupe GT1.1 Fusion de Données

Objectif du groupe GT1.1 Fusion de Données Objectif du groupe GT1.1 Fusion de Données Le groupe travaille dans trois directions Le vocabulaire (piloté par ADVITAM et l aide de SITE) L état de l art (piloté par SYROKKO) Deux applications illustratives

Plus en détail

Le Web sémantique, une infrastructure d'intégration de sources de données

Le Web sémantique, une infrastructure d'intégration de sources de données Le Web sémantique, une infrastructure d'intégration de sources de données Chantal Reynaud Université Paris X & LRI (Université Paris-Sud & CNRS), UR INRIA Futurs Plan de l'exposé 1. Importance du point

Plus en détail