Indexation conceptuelle application au domaine biomédical. Mesures de similarité dans les ontologies. [Séminaire MIAD Montpellier SupAgro]
|
|
- Marie-Paule Perrot
- il y a 8 ans
- Total affichages :
Transcription
1 [] Indexation conceptuelle application au domaine biomédical Mesures de similarité dans les ontologies Sylvie Ranwez Sébastien Harispe LGI2P de l école des mines d Alès équipe KID (Knowledge and Image analysis for Decision making) prenom.nom@mines-ales.fr Institut Mines-Télécom
2 Contexte de recherche de l équipe KID Capacité de traitement informatique associée aux connaissances tacites de l homme Interaction homme/machine pour une résolution conjointe de problèmes d apprentissage et de décision Nécessaire de : Extraire de la connaissance Comprendre et analyser l information Donner du sens Visualiser la connaissance Décider Rechercher, analyser, structurer, filtrer les informations à la lumière de modèles de connaissances 2 13/03/2015 Institut Mines-Télécom
3 Recherche d Information Conceptuelle Ressources Requête Indexation Index des documents Ontologie de domaine Appariement (distance sémantique)? Analyse/Indexation Index de la requête R E F O R M U L A T I O N Présentation des ressources jugées pertinentes 3 13/03/2015 Institut Mines-Télécom
4 Recherche d Information Conceptuelle De nombreux avantages Filtrer les informations et augmenter la précision ; désambiguïser (polysémie, synonymie ) Exploitation d information implicite ; Généralisation/spécialisation de la requête Exploiter TOUS les types de ressources (textes, images, gènes, personnes ) des inconvénients Domaine fermé Il faut avoir une ontologie et des ressources indexées Besoin de solution pour annoter les ressources avec des éléments de l ontologie 4 13/03/2015 Institut Mines-Télécom
5 Objectifs Indexation/annotation conceptuelle de ressources pour la mise à jour régulière des référentiels de connaissances et le partage de ces connaissances Textes (e.g. publications scientifiques, CR de consultation) Images (e.g. radiographies, photos, ECG) Vidéos Sons A framework for unifying ontologybased semantic similarity measures Algorithms Medical Informatics/methods Models, Theoretical Natural Language Processing Semantics Software L indexation est longue et requiert une forte expertise (du domaine et de l ontologie e.g. MeSH 2014 contient concepts) 5 13/03/2015 Institut Mines-Télécom
6 Etat de l art Des approches algorithmiques ont été proposées Textes : NLP, Machine Learning (MTI-2004, NCBO-2009, MaxMatcher- 2006, MetaMap-2001) Images : reconnaissance de forme Vidéos : analyse de son Sons : retranscription du son + NLP Idée : se baser sur des ressources déjà indexées E.g. PMRA (PubMed Related Articles) : basé sur une proximité linguistique (mots en commun) et sur une similarité sémantique (estimée entre les concepts du MeSH qui indexent les publications) PMRA* n utilise que la première phase 2 phases : Retrouver les documents qui sont "proches" du document à annoter Agréger les annotation de ces documents pour indexer le nouveau Souvent, simple classement des concepts récoltés en phase 1 MTI fréquence du concept dans le titre et l abstract v.s. le reste du document Machine-Learning (ML) : gradient boosting, reflective random indexing et Learning-To-Rank (LTR) 6 13/03/2015 Institut Mines-Télécom
7 Indexation conceptuelle par propagation d 7 d 11 d 3 d 12 d 10 d 5 d 6 d 8 d 2 d 1 d 13 d 9 d 4 Construire une carte sémantique sur laquelle les documents sont positionnés en fonction de leur similarité sémantique [travaux de thèse de Nicolas Fiorini] 7 13/03/2015 Institut Mines-Télécom
8 Indexation conceptuelle par propagation d 7 d 11 d 3 d 12 d 10 d 5 d 6 d x d 8 d 2 d 1 d 13 d 9 d 4 Déposer un nouveau document à indexer à proximité de ceux qu on estime proches [travaux de thèse de Nicolas Fiorini] 8 13/03/2015 Institut Mines-Télécom
9 Indexation conceptuelle par propagation d 7 d 11 d 3 d 12 d 10 d 5 d 6 d x d 8 d 2 d 1 d 13 d 9 d 4 Propagation des annotations des k-plus-proches voisins Synthèse : Mammals Carnivora Dog Cat Mammals / Carnivora Différentes stratégies possibles & différentes mesures sémantiques [travaux de thèse de Nicolas Fiorini] 9 13/03/2015 Institut Mines-Télécom
10 Indexation conceptuelle par propagation Prendre comme ensemble de départ l union de tous les concepts qui apparaissent dans l indexation des k-nn V : voisinage composé des k-nn 0 = d : document A d : annotation de d Optimisation d une fonction Objectif =argmax A 0 ( ), ( )= sim(, ) d j V Ne nécessite pas de phase d apprentissage sur un gros volume de données Annotation consistante et synthétique Fiorini, N., Ranwez, S., Ranwez, V. and Montmain, J. Indexation conceptuelle par propagation. Application à un corpus d articles scientifiques lieś au cancer, CORIA /03/2015 Institut Mines-Télécom
11 User-oriented Semantic Indexer (USI) Logiciel développé en Java Phase 1 : Détection des documents proches de celui à annoter Utilisation de PMRA* Phase 2 : Identification des k-nn En utilisant les k documents placés en tête de PMRA* Par positionnement sur une carte sémantique Calcul de l ensemble de départ des annotations (on peut filtrer pour ne conserver, par exemple, que ceux qui apparaissent 2 fois) Optimisation de la fonction objectif en tenant compte de distances sémantiques entre les concepts Fiorini, N., Ranwez, S., Montmain, J. and Ranwez, V. USI: a fast and accurate approach for conceptual document annotation, BMC Bioinformatics, to appear /03/2015 Institut Mines-Télécom
12 User-oriented Semantic Indexer (USI) Ontologie de domaine {c 1, c 2 } PMRA*(d i ) d 1 3 documents placés en tête d 1 d 2 K = {d 1, d 2, d 3 } A 0 = {c 1, c 2, c 3, c 4, c 5 } Medial search USI {c 2, c 3 } {c 2, c 3 } d 2 d 3 K = {d 1, d 2, d 3 } A 0+filter = {c 2, c 3 } USI_filter {c 2, c 3 } {c 3, c 4, c 5 } {c 6 } {c 5, c 7, c 8 } d 3 d 4 d 5 3-NN identifiés sur une carte sémantique d 1 d 2 d 4 d 3 d 5 K = {d 2, d 3, d 5 } A 0 = {c 2, c 3, c 4, c 5, c 7, c 8 } K = {d 2, d 3, d 5 } A 0+filter = {c 3, c 5 } USI+map {c 3, c 4, c 7 } USI_filter+map {c 3, c 5 } 12 13/03/2015 Institut Mines-Télécom
13 User-oriented Semantic Indexer (USI) Optimisation Stocker la matrice de distance des A 0 x A 0 concepts Optimisation algorithmique Résultats (1000 documents annotés par des experts avec le MeSH et leurs 50-NN) Pas d amélioration si on rajoute de nouveaux concepts (les pères des concepts présents dans A 0 ) Notre méthode se distingue de l état de l art : c est l ensemble des concepts proposés qui fait sens pour caractériser le doc de façon globale Ici on conserve les 50 premiers documents de PMRA* et k=20 Method F-score Semantic score Processing time (s) PMRA* + MetaMap + Clustering (MTI) N/A PMRA* + LTR PMRA* + USI PMRA* + USI filter PMRA* + USI + map PMRA* + USI filter + map /03/2015 Institut Mines-Télécom
14 Faire face à l imprécision En fonction de la densité et de l hétérogénéité de la carte, la précision du positionnement a plus ou moins d influence Fiorini, N., Ranwez, S., Montmain, J. and Ranwez, V. Coping with imprecision during a semi-automatic conceptual indexing process, IPMU 2014, Series: Communications in Computer and Information Science, Vol. 444, Springer /03/2015 Institut Mines-Télécom
15 User-oriented Semantic Indexer (USI) Challenge BioASQ 1 Indexer des documents de PubMed (titre abstract, écrits en anglais) Des experts les annotent manuellement et les deux annotations sont comparées Batch 1 semaine 2 : 3 ème Batch 1 semaine 3 : 3 ème Batch 1 semaine 4 : 4 ème Batch 1 semaine 5 : 2 ème 15 05/05/2015 Institut Mines-Télécom Modèle de présentation Mines Alès
16 User-oriented Semantic Indexer (USI) Une application grand public /03/2015 Institut Mines-Télécom
17 Annotation de cluster Dans certaines applications on veut considérer un ensemble de ressources : Clusters de gènes Ensemble de publications Regroupement d images (e.g. patients) E.g. analyse de résistance au zinc regrouper des gènes présentant des profils similaires sélectionner des profils en fonction du sens donné à ces profils Analyser des profils d'expression Pierre Berthomieu, Vincent Ranwez Quel sens donner à ces ensembles? Synthèse de l annotation ou annotation moyenne (e.g. sur-représentation statistique de concepts)? 17 13/03/2015 Institut Mines-Télécom
18 Annotation de cluster c 1 c 2 c 3 A combien doiton limiter le nombre de concepts??? c 4 c 5 c 6 c 7 c 8 c 9 c 10 c 11 c 13 c 14 c 12 Annoter par c 2 ou conserver {c 4, c 8 c 9 }? Gène 1 {c 8, c 9 }? Gène 2 {c 8, c 4, c 2 } Gène 3 {c 12, c 6, c 11 } Gène 4 {c 13, c 6, c 9 }? Gène 5 {c 13, c 14, c 9 } Faut-il rajouter les nœuds intermédiaires : c 10, c 5, c 4? 18 13/03/2015 Institut Mines-Télécom
19 Annotation de cluster {c 1, c 2 } {c 2, c 3 } Cluster identifié C d 1 d 2 1) Identifier les clusters 2) Pour chaque cluster déterminer l ensemble des concepts d annotation de départ (union de tous les concepts apparaissant dans les annotations des documents et de tous leurs parents) {c 3, c 4, c 5 } {c 6 } d 3 d 4 0 = ( ) 3) Fournir une annotation concise, non redondante, mais suffisamment précise =argmax A 0 ( ) {c 5, c 7, c 8 } d 5 ( )= 1 sim(, ) ( ) d C Annotation proche des documents du cluster A Pénalise une annotation longue et spécifique 19 13/03/2015 Institut Mines-Télécom
20 Annotation de cluster Validation en cours /03/2015 Institut Mines-Télécom
21 Mesures sémantiques Au cœur du processus de recherche d information Désambiguïser les termes d une requête Calculer le score de pertinence d une ressource Pour le clustering Appariement de ressources Annotation Synthèse de plusieurs annotations 21 13/03/2015 Institut Mines-Télécom
Apprentissage Automatique
Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs
Plus en détailDe la modélisation linguistique aux applications logicielles: le rôle des Entités Nommées en Traitement Automatique des Langues
De la modélisation linguistique aux applications logicielles: le rôle des Entités Nommées en Traitement Automatique des Langues Maud Ehrmann Joint Research Centre Ispra, Italie. Guillaume Jacquet Xerox
Plus en détailHervé Couturier EVP, SAP Technology Development
Hervé Couturier EVP, SAP Technology Development Hervé Biausser Directeur de l Ecole Centrale Paris Bernard Liautaud Fondateur de Business Objects Questions à: Hervé Couturier Hervé Biausser Bernard Liautaud
Plus en détailApprentissage statistique dans les graphes et les réseaux sociaux
Apprentissage statistique dans les graphes et les réseaux sociaux Patrick Gallinari Collaboration : L. Denoyer, S. Peters Université Pierre et Marie Curie AAFD 2010 1 Plan Motivations et Problématique
Plus en détailFORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis
FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis Joseph Salmon Télécom ParisTech Jeudi 6 Février Joseph Salmon (Télécom ParisTech) Big Data Jeudi 6 Février 1 / 18 Agenda Contexte et opportunités
Plus en détailRecherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA
RÉCITAL 2005, Dourdan, 6-10 juin 2005 Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA Siham Boulaknadel (1,2), Fadoua Ataa-Allah (2) (1) LINA FRE
Plus en détailAnticiper et prédire les sinistres avec une approche Big Data
Anticiper et prédire les sinistres avec une approche Big Data Julien Cabot Directeur Big Data Analytics OCTO jcabot@octo.com @julien_cabot OCTO 2013 50, avenue des Champs-Elysées 75008 Paris - FRANCE Tél
Plus en détailIntroduction de la journée
Introduction de la journée David Cohen Université Pierre et Marie Curie, APHP, GH Pitié Salpêtrière, Paris, France Service de Psychiatrie de l Enfant et de l Adolescent Institut des Systèmes Intelligents
Plus en détailIntégration de la dimension sémantique dans les réseaux sociaux
Intégration de la dimension sémantique dans les réseaux sociaux Application : systèmes de recommandation Maria Malek LARIS-EISTI maria.malek@eisti.fr 1 Contexte : Recommandation dans les réseaux sociaux
Plus en détailEntreprise et Big Data
Entreprise et Big Data Christophe Favart Chef Architecte, SAP Advanced Development, Business Information Technology Public Juin 2013 Agenda SAP Données d Entreprise Big Data en entreprise Solutions SAP
Plus en détailL écosystème Hadoop Nicolas Thiébaud ni.thiebaud@gmail.com. Tuesday, July 2, 13
L écosystème Hadoop Nicolas Thiébaud ni.thiebaud@gmail.com HUG France 250 membres sur la mailing liste 30 présentations 9 meetups organisés, de 20 à 100 invités Présence de Cloudera, MapR, Hortonworks,
Plus en détailÉvaluation d une architecture de stockage RDF distribuée
Évaluation d une architecture de stockage RDF distribuée Maeva Antoine 1, Françoise Baude 1, Fabrice Huet 1 1 INRIA MÉDITERRANÉE (ÉQUIPE OASIS), UNIVERSITÉ NICE SOPHIA-ANTIPOLIS, I3S CNRS prénom.nom@inria.fr
Plus en détailRessources lexicales au service de recherche et d indexation des images
RECITAL 2011, Montpellier, 27 juin - 1er juillet 2011 Ressources lexicales au service de recherche et d indexation des images Inga Gheorghita 1,2 (1) ATILF-CNRS, Nancy-Université (UMR 7118), France (2)
Plus en détailMapReduce. Malo Jaffré, Pablo Rauzy. 16 avril 2010 ENS. Malo Jaffré, Pablo Rauzy (ENS) MapReduce 16 avril 2010 1 / 15
MapReduce Malo Jaffré, Pablo Rauzy ENS 16 avril 2010 Malo Jaffré, Pablo Rauzy (ENS) MapReduce 16 avril 2010 1 / 15 Qu est ce que c est? Conceptuellement Données MapReduce est un framework de calcul distribué
Plus en détailLes modes de recherche sur le Web 2.0
Les modes de recherche sur le Web 2.0 1 Sommaire 1. Contexte 2. Le collaboratif : les moteurs thématiques 3. La syndication des résultats de recherche 4. Les connaissances : des moteurs 2 1 1. Moteurs
Plus en détailCommentWatcher. plateforme Web open-source pour analyser les discussions sur des forums en ligne. Marian-Andrei RIZOIU
CommentWatcher plateforme Web open-source pour analyser les discussions sur des forums en ligne Marian-Andrei RIZOIU 2ème octobre 2013 BLEND 2013 Lyon, France Contexte Laboratoire ERIC Université Lumière
Plus en détailBig Data et Graphes : Quelques pistes de recherche
Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université
Plus en détailClassification Automatique de messages : une approche hybride
RECIAL 2002, Nancy, 24-27 juin 2002 Classification Automatique de messages : une approche hybride O. Nouali (1) Laboratoire des Logiciels de base, CE.R.I.S., Rue des 3 frères Aïssiou, Ben Aknoun, Alger,
Plus en détailRecherche d Information(RI): Fondements et illustration avec Apache Lucene. par Majirus Fansi @majirus
1 Recherche d Information(RI): Fondements et illustration avec Apache Lucene par Majirus Fansi @majirus Résumé Fondements de la Recherche d Information (RI) Noyau de toute application de RI Éléments à
Plus en détailDéfinition et diffusion de signatures sémantiques dans les systèmes pair-à-pair
Définition et diffusion de signatures sémantiques dans les systèmes pair-à-pair Raja Chiky, Bruno Defude, Georges Hébrail GET-ENST Paris Laboratoire LTCI - UMR 5141 CNRS Département Informatique et Réseaux
Plus en détailIngénierie et gestion des connaissances
Master Web Intelligence ICM Option Informatique Ingénierie et gestion des connaissances Philippe BEAUNE Philippe.Beaune@emse.fr 18 novembre 2008 Passer en revue quelques idées fondatrices de l ingénierie
Plus en détailL usage des concepts du web sémantique dans le filtrage d information collaboratif
Ministère de l enseignement Supérieur et de la recherche scientifique Institut National d Informatique Alger Mémoire présenté pour l obtention du diplôme de Magistère Option : Ingénierie des Systèmes d
Plus en détailExploitation de hiérarchies sémantiques construites à partir du Trésor de la Langue Française informatisé (TLFi) pour la recherche d images
Exploitation de hiérarchies sémantiques construites à partir du Trésor de la Langue Française informatisé (TLFi) pour la recherche d images Inga Gheorghita 1,2,3 (1) Université de Lorraine, ATILF UMR 7118,
Plus en détailBig Data et Graphes : Quelques pistes de recherche
Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci http://liris.cnrs.fr/hamamache.kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de
Plus en détailUne plate-forme open-source de recherche d information sémantique
Une plate-forme open-source de recherche d information sémantique Ines Bannour, Haïfa Zargayouna Laboratoire d Informatique de l université Paris-Nord (LIPN) - UMR 7030 Université Paris 13 - CNRS 99, avenue
Plus en détailStructuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe
Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe Karima Dhouib, Sylvie Després Faiez Gargouri ISET - Sfax Tunisie, BP : 88A Elbustan ; Sfax karima.dhouib@isets.rnu.tn,
Plus en détailGestion de données incertaines et de leur provenance
Gestion de données incertaines et de leur provenance Pierre Senellart Séminaire INSERM & Institut TELEOM 7 octobre 2008 P. Senellart (TELEOM ParisTech) Données incertaines et provenance 07/10/2008 1 /
Plus en détailBusiness Intelligence avec Excel, Power BI et Office 365
Avant-propos A. À qui s adresse ce livre? 9 1. Pourquoi à chaque manager? 9 2. Pourquoi à tout informaticien impliqué dans des projets «BI» 9 B. Obtention des données sources 10 C. Objectif du livre 10
Plus en détailAnalyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57
Analyse de la vidéo Chapitre 4.1 - La modélisation pour le suivi d objet 10 mars 2015 Chapitre 4.1 - La modélisation d objet 1 / 57 La représentation d objets Plan de la présentation 1 La représentation
Plus en détailBIG Data et R: opportunités et perspectives
BIG Data et R: opportunités et perspectives Guati Rizlane 1 & Hicham Hajji 2 1 Ecole Nationale de Commerce et de Gestion de Casablanca, Maroc, rguati@gmail.com 2 Ecole des Sciences Géomatiques, IAV Rabat,
Plus en détailFouillez facilement dans votre système Big Data. Olivier TAVARD
Fouillez facilement dans votre système Big Data Olivier TAVARD A propos de moi : Cofondateur de la société France Labs Développeur (principalement Java) Formateur en technologies de moteurs de recherche
Plus en détailENOVIA 3DLive. IBM PLM Solutions 1 er Octobre 2007. Philippe Georgelin Sébastien Veret
ENOVIA 3DLive IBM PLM Solutions 1 er Octobre 2007 Philippe Georgelin Sébastien Veret La définition : Le Product Lifecycle Management est un ensemble de solutions qui permettent à une entreprise manufacturière
Plus en détailIndexation sémantique au moyen de coupes de redondance minimale dans une ontologie
TALN 25, Dourdan, 6 1 juin 25 Indexation sémantique au moyen de coupes de redondance minimale dans une ontologie Florian Seydoux & Jean-Cédric Chappelier Faculté Informatique et Communications Ecole Polytechnique
Plus en détailUne méthode d apprentissage pour la composition de services web
Une méthode d apprentissage pour la composition de services web Soufiene Lajmi * Chirine Ghedira ** Khaled Ghedira * * Laboratoire SOIE (ENSI) University of Manouba, Manouba 2010, Tunisia Soufiene.lajmi@ensi.rnu.tn,
Plus en détailDEMARRER UN PROJET BIGDATA EN QUELQUES MINUTES GRACE AU CLOUD
DEMARRER UN PROJET BIGDATA EN QUELQUES MINUTES GRACE AU CLOUD BIGDATA PARIS LE 1/4/2014 VINCENT HEUSCHLING @VHE74! 1 NOUS 100% Bigdata Infrastructure IT + Data Trouver vos opportunités Implémenter les
Plus en détailProposition des cadres d évaluation adaptés à un système de RI personnalisé
Proposition des cadres d évaluation adaptés à un système de RI personnalisé Mariam Daoud, Lynda Tamine-Lechani Laboratoire IRIT, Université Paul Sabatier 118 Route de Narbonne, F-31062 TOULOUSE CEDEX 9
Plus en détailBase de données bibliographiques Pubmed-Medline
Chapitre 1 ; Domaine 1 ; Documentation ; Champs référentiels 1.1.1, 1.1.2 et 1.1.3 Base de données bibliographiques Pubmed-Medline D r Patrick Deschamps,, 30 mai 2007 PLAN C2i métiers de la santé Introduction
Plus en détailProxiLens : Exploration interactive de données multidimensionnelles à partir de leur projection
ProxiLens : Exploration interactive de données multidimensionnelles à partir de leur projection Nicolas HEULOT (CEA LIST) Michaël AUPETIT (CEA LIST) Jean-Daniel FEKETE (INRIA Saclay) Journées Big Data
Plus en détailGroupe de Discussion Big Data Aperçu des technologies et applications. Stéphane MOUTON stephane.mouton@cetic.be
Groupe de Discussion Big Data Aperçu des technologies et applications Stéphane MOUTON stephane.mouton@cetic.be Recherche appliquée et transfert technologique q Agréé «Centre Collectif de Recherche» par
Plus en détailRecherche et veille documentaire scientifique
Recherche et veille documentaire scientifique Élodie Chattot BU Médecine Pharmacie juin 2006 Introduction Le but de cet atelier est de vous initier à la méthodologie de recherche documentaire scientifique,
Plus en détailEXTRACTION DE CONNAISSANCES À PARTIR DE DONNÉES TEXTUELLES VUE D ENSEMBLE
ème Colloque National AIP PRIMECA La Plagne - 7- avril 7 EXTRACTION DE CONNAISSANCES À PARTIR DE DONNÉES TEXTUELLES VUE D ENSEMBLE Bruno Agard Département de Mathématiques et de Génie Industriel, École
Plus en détailL évaluation d algorithmes d analyse vidéo Quelques pistes
L évaluation d algorithmes d analyse vidéo Quelques pistes Jean-François GOUDOU 1, Louise NAUD 1, Laurent GIULIERI 2, Jaonary RABARISOA 3, Olivier PIETQUIN 4, Dana CODREANU 5, Dijana PETROVSKA 6 1 THALES
Plus en détailCatalogue des formations Edition 2015
Antidot - Formations Catalogue des formations Edition 2015 : catalogue_formation_2015 Révision du 06.01.2015 Sommaire!!"##$%&'( )! $*$+,(-'(."##'+.'&( /!,'.0+"1"2%'( /!!."3'( /! $(3&"3"!(-4(5(.$,$1"24'(-'!(6"&#$,%"+!(7('-%,%"+()89:(;(
Plus en détailProgrammation parallèle et distribuée
Programmation parallèle et distribuée (GIF-4104/7104) 5a - (hiver 2015) Marc Parizeau, Département de génie électrique et de génie informatique Plan Données massives («big data») Architecture Hadoop distribution
Plus en détailProjet SINF2275 «Data mining and decision making» Projet classification et credit scoring
Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems
Plus en détailBig Data Concepts et mise en oeuvre de Hadoop
Introduction 1. Objectif du chapitre 9 2. Le Big Data 10 2.1 Introduction 10 2.2 Informatique connectée, objets "intelligents" et données collectées 11 2.3 Les unités de mesure dans le monde Big Data 12
Plus en détailEbauche Rapport finale
Ebauche Rapport finale Sommaire : 1 - Introduction au C.D.N. 2 - Définition de la problématique 3 - Etat de l'art : Présentatio de 3 Topologies streaming p2p 1) INTRODUCTION au C.D.N. La croissance rapide
Plus en détailMasses de données et calcul : à l IRIT. 8 octobre 2013
Masses de données et calcul : la recherche en lien avec les Big Data à l IRIT 8 octobre 2013 08/10/2013 1 L IRIT en qq chiffres 700 personnes sur tous les sites toulousains 5 tutelles 7 thèmes et 21 équipes
Plus en détailBig Graph Data Forum Teratec 2013
Big Graph Data Forum Teratec 2013 MFG Labs 35 rue de Châteaudun 75009 Paris, France www.mfglabs.com twitter: @mfg_labs Julien Laugel MFG Labs julien.laugel@mfglabs.com @roolio SOMMAIRE MFG Labs Contexte
Plus en détailConcepts clés associés aux outils logiciels, exemples
Chercheurs, les outils logiciels :: une voie originale pour valoriser votre expertise et et vos compétences!! Concepts clés associés aux outils logiciels, exemples Jeudi 2 octobre 2008 Gilles Bézard ICAM
Plus en détailLes datas = le fuel du 21ième sicècle
Les datas = le fuel du 21ième sicècle D énormes gisements de création de valeurs http://www.your networkmarketin g.com/facebooktwitter-youtubestats-in-realtime-simulation/ Xavier Dalloz Le Plan Définition
Plus en détail20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars 2013. 20 ans du SIAD -"Big Data par l'exemple" -Julien DULOUT
20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars 2013 20 ans du SIAD -"BigData par l'exemple" -Julien DULOUT Qui a déjà entendu parler du phénomène BigData? Qui a déjà
Plus en détailet les Systèmes Multidimensionnels
Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Datawarehouse (DW) Le Datawarehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées
Plus en détailBases de données Outils de gestion
11/03/2010 Bases de données Outils de gestion Mise en place d outils pour gérer, stocker et utiliser les informations d une recherche biomédicale ent réalisé par L. QUINQUIS d épidémiologie et de biostatistique
Plus en détailPrésentations personnelles. filière IL
Présentations personnelles filière IL Résumé Liste de sujets de présentations personnelles. Chaque présentation aborde un sujet particulier, l'objectif étant que la lecture du rapport ainsi que l'écoute
Plus en détailhttp://blog.khaledtannir.net
Algorithme de parallélisations des traitements Khaled TANNIR Doctorant CIFRE LARIS/ESTI http://blog.khaledtannir.net these@khaledtannir.net 2e SéRI 2010-2011 Jeudi 17 mars 2011 Présentation Doctorant CIFRE
Plus en détailAGATHE : une architecture générique à base d agents et d ontologies pour la collecte d information sur domaines restreints du Web
AGATHE : une architecture générique à base d agents et d ontologies pour la collecte d information sur domaines restreints du Web B. Espinasse*, S. Fournier* et F. Freitas** * LSIS UMR CNRS 6168, Universités
Plus en détailLamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013
Cube de textes et opérateur d'agrégation basé sur un modèle vectoriel adapté Text Cube Model and aggregation operator based on an adapted vector space model Lamia Oukid, Ounas Asfari, Fadila Bentayeb,
Plus en détailLa Convergence des outils de veille et des sources
La Convergence des outils de veille et des sources Atelier A1- i Expo 2006 31 mai 2006 «Référentiels et évaluation des outils de veille» Raymond Descout Vice-président Ventes et Marketing Europe, CEDROM-SNi
Plus en détailSujet de thèse CIFRE RESULIS / LGI2P
Ecole des Mines d Alès Laboratoire de Génie Informatique et d Ingénierie de Production LGI2P Nîmes Sujet de thèse CIFRE RESULIS / LGI2P Titre Domaine De l ingénierie des besoins à l ingénierie des exigences
Plus en détailPrésentation du module Base de données spatio-temporelles
Présentation du module Base de données spatio-temporelles S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Partie 1 : Notion de bases de données (12,5h ) Enjeux et principes
Plus en détailN. Paparoditis, Laboratoire MATIS
N. Paparoditis, Laboratoire MATIS Contexte: Diffusion de données et services locaux STEREOPOLIS II Un véhicule de numérisation mobile terrestre Lasers Caméras Système de navigation/positionnement STEREOPOLIS
Plus en détailSQL Server 2012 et SQL Server 2014
SQL Server 2012 et SQL Server 2014 Principales fonctions SQL Server 2012 est le système de gestion de base de données de Microsoft. Il intègre un moteur relationnel, un outil d extraction et de transformation
Plus en détailAcquisition des données - Big Data. Dario VEGA Senior Sales Consultant
Acquisition des données - Big Data Dario VEGA Senior Sales Consultant The following is intended to outline our general product direction. It is intended for information purposes only, and may not be incorporated
Plus en détailGuide de recherche documentaire à l usage des doctorants. Partie 1 : Exploiter les bases de données académiques
Guide de recherche documentaire à l usage des doctorants Partie : Exploiter les bases de données académiques Sylvia Cheminel Dernière mise à jour : décembre 04 PANORAMA DES SOURCES DOCUMENTAIRES ACADEMIQUES...
Plus en détailMulti-catégorisation de textes juridiques et retour de pertinence
Multi-catégorisation de textes juridiques et retour de pertinence Vincent Pisetta, Hakim Hacid et Djamel A. Zighed article paru dans G. Ritschard et C. Djeraba (eds), Extraction et gestion des Connaissances
Plus en détailBusiness-Insight Company Presentation
Brussel, March 1, 2013 Business-Insight Company Presentation The Business-Insight company creates the latest state-of-the-art softwares in the domain of predictive datamining. Predictive datamining techniques
Plus en détailTRS: Sélection des sous-graphes représentants par l intermédiaire des attributs topologiques et K-medoïdes
TRS: Sélection des sous-graphes représentants par l intermédiaire des attributs topologiques et K-medoïdes Mohamed Moussaoui,Wajdi Dhifli,Sami Zghal,Engelbert Mephu Nguifo FSJEG, Université de Jendouba,
Plus en détailPanorama des solutions analytiques existantes
Arnaud LAROCHE Julien DAMON Panorama des solutions analytiques existantes SFdS Méthodes et Logiciels - 16 janvier 2014 - Données Massives Ne sont ici considérés que les solutions autour de l environnement
Plus en détailUne proposition d extension de GML pour un modèle générique d intégration de données spatio-temporelles hétérogènes
303 Schedae, 2007 Prépublication n 46 Fascicule n 2 Une proposition d extension de GML pour un modèle générique d intégration de données spatio-temporelles hétérogènes Samya Sagar, Mohamed Ben Ahmed Laboratoire
Plus en détailRecherche d'images par le contenu Application au monitoring Télévisuel à l'institut national de l'audiovisuel
Recherche d'images par le contenu Application au monitoring Télévisuel à l'institut national de l'audiovisuel Alexis Joly alexis.joly@inria.fr INRIA - IMEDIA Alexis Joly cours monitoring p. 1 Plan de l'exposé
Plus en détailIntroduction. M2206 Intégration web. Introduction. Introduction 20/01/2014
Introduction M2206 Intégration web http://www.atinternet.fr/ressources/ressources/etudespubliques/barometre-des-moteurs/ Référencement des sites web et moteurs de recherche Introduction Introduction http://www.go-gulf.com/blog/social-networking-user/
Plus en détailDafoe Présentation de la plate-forme UIMA
Laboratoire d Informatique de l université Paris-Nord (UMR CNRS 7030) Institut Galilée - Université Paris-Nord 99, avenue Jean-Baptiste Clément 93430 Villetaneuse, France 11 juillet 2007 Plates-formes
Plus en détail4. SERVICES WEB REST 46
4. SERVICES WEB REST 46 REST REST acronyme de REpresentational State Transfert Concept introduit en 2000 dans la thèse de Roy FIELDING Est un style d architecture inspiré de l architecture WEB En 2010,
Plus en détailLaboratoire 4 Développement d un système intelligent
DÉPARTEMENT DE GÉNIE LOGICIEL ET DES TI LOG770 - SYSTÈMES INTELLIGENTS ÉTÉ 2012 Laboratoire 4 Développement d un système intelligent 1 Introduction Ce quatrième et dernier laboratoire porte sur le développement
Plus en détailJournées Big Data à l ENSAI Big Data: les challenges, les défis
Journées Big Data à l ENSAI Big Data: les challenges, les défis Stéphan Clémençon Télécom ParisTech November 22, 2013 Stéphan Clémençon (Télécom ParisTech) Big Data November 22, 2013 1 / 22 Agenda Contexte
Plus en détailComment interroger PubMed pour accéder aux revues en ligne AP-HP sur Intranet
Comment interroger PubMed pour accéder aux revues en ligne AP-HP sur Intranet SOMMAIRE Recherche à partir d'un terme 3 Recherche à partir de plusieurs termes ou expressions 5 Recherche par mots-clés via
Plus en détail4. Utilisation d un SGBD : le langage SQL. 5. Normalisation
Base de données S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Présentation du module Contenu général Notion de bases de données Fondements / Conception Utilisation :
Plus en détailAVRIL 2014. Au delà de Hadoop. Panorama des solutions NoSQL
AVRIL 2014 Panorama des solutions NoSQL QUI SOMMES NOUS? Avril 2014 2 SMILE, EN QUELQUES CHIFFRES 1er INTÉGRATEUR EUROPÉEN DE SOLUTIONS OPEN SOURCE 3 4 NOS EXPERTISES ET NOS CONVICTIONS DANS NOS LIVRES
Plus en détailHistorique. Architecture. Contribution. Conclusion. Définitions et buts La veille stratégique Le multidimensionnel Les classifications
L intelligence économique outil stratégique pour l entreprise Professeur Bernard DOUSSET dousset@irit.fr http://atlas.irit.fr Institut de Recherche en Informatique de Toulouse (IRIT) Equipe Systèmes d
Plus en détailKaizen Marketing Group Web Agency. Kaizen Marketing. - Stéphanie Héline-
Kaizen Marketing - Stéphanie Héline- 1 Référencement Web Paris 26 Juin 2013 Faire de la pub c est bien 12 Répondre à une requête c est mieux! 3 Comment recherchez-vous? Source : Google - 2012 Importance
Plus en détailLes ontologies pour l intégration sémantique : enjeux et défis
Les ontologies pour l intégration sémantique : enjeux et défis Chantal REYNAUD Université Paris-Sud XI, CNRS-LRI (Equipe IASI) INRIA-Futurs (Gemo) 1 Plan 1. L intégration sémantique du point de vue des
Plus en détailDECLARATION DES PERFORMANCES N 1
DECLARATION DES PERFORMANCES N 1 Résistance mécanique C18 EN 1912 : 2012 + EN 338 :2009 DECLARATION DES PERFORMANCES N 2 Résistance mécanique C24 EN 1912 : 2012 + EN 338 :2009 DECLARATION DES PERFORMANCES
Plus en détailAnalyse d images. Edmond.Boyer@imag.fr. Edmond Boyer UFRIMA 1
Analyse d images Edmond.Boyer@imag.fr Edmond Boyer UFRIMA 1 1 Généralités Analyse d images (Image Analysis) : utiliser un ordinateur pour interpréter le monde extérieur au travers d images. Images Objets
Plus en détailLa visualisation de données relationnelles au service de la recherche d informations
La visualisation de données relationnelles au service de la recherche d informations Eloïse Loubier Wahiba Bahsoun Institut de Recherche en Informatique de Toulouse IRIT-SIG, Université Paul Sabatier,
Plus en détailReconnaissance de visages 2.5D par fusion des indices de texture et de profondeur ICI 12/12/12
Reconnaissance de visages 2.5D par fusion des indices de texture et de profondeur ICI 12/12/12 2 Discrimination Invariance Expressions faciales Age Pose Eclairage 11/12/2012 3 Personne Inconnue Identité
Plus en détailRecherche bibliographique
Séminaire «Maîtrise de l information scientifique» Recherche bibliographique Dernière mise à jour : 07/01/2015 - Auteur : Frédérique Flamerie Recherche bibliographique : méthode & outils La recherche bibliographique
Plus en détailTRAVAUX DE RECHERCHE DANS LE
TRAVAUX DE RECHERCHE DANS LE DOMAINE DE L'EXPLOITATION DES DONNÉES ET DES DOCUMENTS 1 Journée technologique " Solutions de maintenance prévisionnelle adaptées à la production Josiane Mothe, FREMIT, IRIT
Plus en détailIntelligence Economique - Business Intelligence
Intelligence Economique - Business Intelligence Notion de Business Intelligence Dès qu'il y a une entreprise, il y a implicitement intelligence économique (tout comme il y a du marketing) : quelle produit
Plus en détailIntroduction à MapReduce/Hadoop et Spark
1 / 36 Introduction à MapReduce/Hadoop et Spark Certificat Big Data Ludovic Denoyer et Sylvain Lamprier UPMC Plan 2 / 36 Contexte 3 / 36 Contexte 4 / 36 Data driven science: le 4e paradigme (Jim Gray -
Plus en détailMailCube MC 2. 2,5 jours / homme / an. 33 milliards de kwh. 17 millions de. 3,1 millions de. nouvelle génération. Le spam en quelques chiffres :
Le spam en quelques chiffres : Pour faire face à cet afflux de courriers électroniques non désirés Vade Retro Technology lance une nouvelle génération de sa solution appliance MailCube. Le nouveau boîtier
Plus en détailAdaptabilité d un MOOC aux styles d apprentissage. Hubert Kadima Directeur de Recherche LARIS/EISTI Email : hubert.kadima@eisti.fr
Adaptabilité d un MOOC aux styles d apprentissage Hubert Kadima Directeur de Recherche LARIS/EISTI Email : hubert.kadima@eisti.fr Agenda 1. Contexte : l apprentissage dans le projet PLACIS 2. Choix du
Plus en détailIntroduction au Data-Mining
Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme
Plus en détailSAS BI DASHBOARD 4.3 : POUR LE MEILLEUR ET POUR LE FILTRE
SAS BI DASHBOARD 4.3 : POUR LE MEILLEUR ET POUR LE FILTRE En tant qu outils d aide à la décision, les tableaux de bord doivent répondre rapidement. Pour participer à cet effort de réactivité en termes
Plus en détailLIVRE BLANC Décembre 2014
PARSING MATCHING EQUALITY SEARCH LIVRE BLANC Décembre 2014 Introduction L analyse des tendances du marché de l emploi correspond à l évidence à une nécessité, surtout en période de tension comme depuis
Plus en détailChapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème
Chapitre IX L intégration de données Le problème De façon très générale, le problème de l intégration de données (data integration) est de permettre un accès cohérent à des données d origine, de structuration
Plus en détailTraitements linguistiques et business intelligence (BI) pour mieux comprendre ce que recherchent les visiteurs d'un site Web Le projet GALATEAS
Traitements linguistiques et business intelligence (BI) pour mieux comprendre ce que recherchent les visiteurs d'un site Web Le projet GALATEAS Domoina RABARIJAONA Ingénieur d'études et développement,
Plus en détailProgrammation parallèle et distribuée
Programmation parallèle et distribuée (GIF-4104/7104) 5a - (hiver 2014) Marc Parizeau, Département de génie électrique et de génie informatique Plan Mégadonnées («big data») Architecture Hadoop distribution
Plus en détailIntroduction aux systèmes temps réel. Iulian Ober IRIT ober@iut-blagnac.fr
Introduction aux systèmes temps réel Iulian Ober IRIT ober@iut-blagnac.fr Définition Systèmes dont la correction ne dépend pas seulement des valeurs des résultats produits mais également des délais dans
Plus en détail