Utilisation de la fouille de textes et de l extraction d informations en Génomique et Bioinformatique

Dimension: px
Commencer à balayer dès la page:

Download "Utilisation de la fouille de textes et de l extraction d informations en Génomique et Bioinformatique"

Transcription

1 Mastère BBSG-M2 Marseille Utilisation de la fouille de textes et de l extraction d informations en Génomique et Bioinformatique Bernard Jacq, IBDML CNRS-U2 Marseille

2 Plan Définitions : data mining, text mining, extraction d informations Mesures utilisées en extraction d information Validation des méthodes d extraction d information Un exemple concret d une méthode d extraction d informations portant sur des interactions chez la drosophile à partir d abstracts PubMed Un exemple d un outil finalisé d extractions d informations sur Internet: IHOP

3 Qu est-ce que le data mining? (fouille de données) Extraction non triviale d une information préalablement inconnue ou partiellement connue à partir de données. Exemples de data mining en génomique et protéomique : Clusterisation de gènes à partir de profils d expression d un microarray Classification fonctionnelle de protéines dans un réseau d interactions Identification par Blast de motifs conservés à partir d un protéome entier Cette information nouvelle extraite pourra par exemple être utilisée pour alimenter des BDDs biologiques

4 Pourquoi le Data Mining? Parce que les données sont là et qu il y en a beaucoup! Produire des données en masse est largement inutile si les données sont peu et/ou mal exploitées Parce que cela correspond à un nouveau type d utilisation qui va au delà de la recherche d information. Parce qu au niveau informatique, de nouvelles possibilités existent: - disques de grande capacité - processeurs plus rapides (et/ou parallelisation) - outils efficaces de visualisation - informations interconnectées - dévelopement de la recherche en fouille de textes

5 Un cas particulier de data mining : Le text mining (fouille de textes) Problème : Les textes expriment un très vaste domaine d informations diversifiées, mais la façon dont cette information est décrite la rend difficile à analyser de façon automatique But : des techniques spécifiques sont nécessaires pour analyser automatiquement des textes Défis principaux du text mining : L information est présente sous une forme non structurée (texte libre) Cette forme n est pas directement accessible à l analyse par les ordinateurs Volume de données disponible énorme (ex : Medline + projet Biomed Central)

6 Extraction d informations (EI) Qu est ce que l extraction d informations? - Soit un ensemble de textes écrit en language naturel. - A partir de chaque texte, extraire une information concernant des classes prédéfinies d entités et de relations et placer cette information dans des champs définis (d un fichier, d une BDD). Exemple : un ensemble de dépêches AFP concernant les nouvelles internationales. Tâche : A partir d une analyse automatique des textes, remplir une base de données sur des attentats en renseignant le lieu, la date, les faits (type d attentat, nb de victimes, ), l origine présumée ou revendiquée. L EI peut être vue comme l activité d instanciation de champs spécifiques d une BDD structurée en utilisant comme source une information non structurée de type texte libre.

7 Différences fondamentales entre Recherche d informations (RI) et Extraction d informations (EI) Ce que l EI n est pas : la Recherche d informations (RI) La tâche de recherche d informations (RI) : étant donné une requête d un utilisateur et une collection de documents, identifier un sousensemble de ceux-ci répondant aux critères de la requête Exemple : Trouver des résumés Medline décrivant des gènes humains surexprimés lors de l analyse moléculaire de biopsies de cancer du sein Stratégie : recherche informatique à partir de combinaisons de motsclés (gene expression, EST, microarray, breast cancer, overexpression, )

8 Dans les objectifs : Différences fondamentales entre Recherche d informations (RI) et Extraction d informations (EI) La RI sélectionne des documents potentiellement pertinents à partir d un ensemble l EI extrait l information pertinente des documents Dans les résultats : La RI propose les documents potentiellement pertinents à l utilisateur l EI propose des faits pertinents à l utilisateur ou à un programme informatique

9 Pourquoi l extraction d informations (EI) est-elle difficile? Parce que le langage naturel (écrit) est difficile (parfois pour les humains, toujours pour les ordinateurs): - le language naturel est flexible. Il y a toujours plusieurs façons d exprimer la même idée. - le language naturel est ambigu. Une phrase peut être interprétée de différentes manières. - le language est dynamique. Il évolue constamment.

10 Flexibilité, ambiguité, dynamisme du language - Flexibilité:. Engrailed contrôle la transcription de polyhomeotic. Polyhomeotic est soumis au contrôle transcriptionnel d engrailed. Le 1er intron du gène polyhomeotic contient plusieurs sites de fixation pour le facteur de transcription engrailed - Ambiguité:. Chirac aime mieux de Villepin que Sarkozy. phrase grammaticalement correcte mais ambiguë, car deux significations possibles : A. Chirac aime mieux de Villepin qu il n aime Sarkozy B. Chirac aime mieux de Villepin que Sarkozy n aime de Villepin. - Dynamisme:. Des mots nouveaux apparaissent : courriel, cédérom, chimiquier, pacs, cybercafé,.. Des mots disparaissent ou vont disparaître du language : manant, paltoquet, souillon, mobylette, Haute-Volta.. Des mots anciens sont réutilisés avec un sens identique ou nouveau : Abracadabrantesque (Rimbaud 1871, Chirac 2001), écrémage.

11 Obstacles à une E.I. efficace Quantité de données Differents types de données Non-standardisation des données limites de l état de l art des systèmes d E.I. Difficulté de conception de systèmes d E.I. génériques Pas ou peu de systèmes d E.I. commercialisés Intérêt manifesté par les biologistes pour l E.I? Trop peu d interdisciplinarité (biologistes / informaticiens)

12 Mesures d évaluation utilisées en EI Pourquoi vouloir mesurer les performances de l EI? Pour pouvoir comparer les performances de différents systèmes d EI => Utilisation de différentes mesures : Précision Rappel F- mesure

13 EVALUATION DES PERFORMANCES ENSEMBLE A ANALYSER INFORMATIONS FAUSSES INFORMATIONS VRAIES

14 EVALUATION DES PERFORMANCES ENSEMBLE A ANALYSER INFORMATIONS NON EXTRAITES UTILISATION D UN INFORMATIONS EXTRAITES PROGRAMME D EXTRACTION D INFORMATIONS Quelle est la qualité des informations extraites? Quelle proportion des informations qu il y avait à trouver a effectivement été trouvée par le programme? Parmi les informations effectivement extraites par le programme, quelle proportion est exacte?

15 EVALUATION DES PERFORMANCES ENSEMBLE A ANALYSER INFORMATIONS VRAIES INFORMATIONS EXTRAITES

16 VRAIS NEGATIFS EVALUATION DES PERFORMANCES ENSEMBLE A ANALYSER FAUX POSITIFS INFORMATIONS VRAIES VRAIS POSITIFS INFORMATIONS EXTRAITES TROUVEES FAUX NEGATIFS COMMENT EVALUER LES PERFORMANCES DE LA METHODE?

17 Mesures utilisées en EI Les résultats de toute prédiction doivent tenir compte de quatre résultats : - Vrais Positifs (VP) (TP) (Anglais) - Vrais Négatifs (VN) (TN) - Faux Positifs (FP) (FP) - Faux Négatifs (FN) (FN) Matrice de confusion : Echantillon + Echantillon - Prédiction + VP FP Prédiction - FN VN

18 Mesures utilisées en EI Rappel (pourcentage de ce qui était correct dans ce qui est trouvé par le système) R = VP/(VP+FN) «Parmi les réponses justes qu il fallait donner, quel pourcentage le système en a t il trouvé?» Synonymes de Rappel : Sensibilité (Sensitivity), Taux de vrais positifs, recall (E) Précision (pourcentage de réponses correctes trouvées par le système) P = VP/(VP+FP) «Parmi les réponses que le système a donné, quel est le pourcentage de réponses justes?» Synonymes de Précision : Sélectivité, Precision (E)

19 Mesures utilisées en EI Rappel (pourcentage de ce qui était correct dans ce qui est trouvé par le système) R = VP/(VP+FN) (Recall) Synonymes de Rappel : sensibilité (Sensitivity), Taux de vrais positifs Précision (pourcentage de réponses correctes trouvées par le système) P = VP/(VP+FP) (Precision) Synonymes de Précision : sélectivité F-mesure (combinaison pondérée de rappel et précision) F = 2 P x R/(P + R) NB : On utilise parfois 2 autres termes : Spécificité (Specificity) S = VN /VN+FP (Taux de vrais négatifs) Exactitude (Accuracy) J= VP+VN/(VP+VN+FP+FN) (Nbre de prédictions justes/nbre total de prédictions)

20 Mesures utilisées en EI NB : TAUX DE PRECISION ET DE RAPPEL VARIENT EN SENS INVERSE Système «idéal» Rappel Système «efficace mais peu précis» Système «précis mais peu efficace» 0 50 % 100% Précision

21 Exemple (équilibré) de comparaisons de résultats de différents systèmes d EI classifier TP TN FP FN Accuracy A % B % C % D % B, C, D sont meilleurs que A B est-il meilleur que C et D? C est-il meilleur que B et D? D est-il meilleur que B et C? L exactitude (Accuracy) ne suffit pas!

22 Exemple (déséquilibré) classifier TP TN FP FN Accuracy A % B % C % D % D est meilleur que A B est-il meilleur que A, C et D? Une bonne exactitude ne signifie rien si l échantillon est déséquilibré

23 Comparaison des performances de prediction L exactitude paraît être la bonne mesure d évaluation Mais elle est efficace seulement quand les populations positives et négatives sont de taille équivalente Le rappel et la précision pris ensemble constituent une meilleure mesure d évaluation Que faire dans un cas où A a un meilleur rappel que B et N une meilleure précision que A?

24 L utilité de la F-Mesure Moyenne harmonique du rappel et de la précision F = 2 * rappel * precision rappel + precision D est meilleur que A B est-il meilleur que A, C et D? classifier TP TN FP FN Accuracy A % B % C % D %

25 L utilité de la F-Mesure D est meilleur que A B est-il meilleur que A, C et D? classifier TP TN FP FN Accuracy F-measure A % 33% B % undefined C % 40% D % 46% Non conforme à l intuition

26 Pause..

27 Validation de systèmes d EI Dans la mise au point de systèmes d extraction d infor mation, il faut séparer échantillons d apprentissage (utilisés pour mettre au point la méthode) et de test (validation) Il n y a pas de rapport fixe à utiliser entre nombre d échantillons d apprentissage et de test mais ils sont classiquement dans un rapport 2:1 La proportion d instances des differentes classes à identifier dans les tests doit être similaire à la proportion dans les échantillons d apprentissage Que faire si la quantité de données est insuffisante pour avoir 1/3 d échantillons pour le test?

28 Validation croisée 1.Test 2.Train 3.Train 4.Train 5.Train 1.Train 2.Test 3.Train 4.Train 5.Train 1.Train 2.Train 3.Test 4.Train 5.Train 1.Train 2.Train 3.Train 4.Test 5.Train 1.Train 2.Train 3.Train 4.Train 5.Test Diviser les échantillons en k parts équivalentes Chaque part contient une proportion similaire d échantillons des différentes classes On utilise chaque part pour tester l ensemble des autres parts La performance finale est la moyenne des tests individuels

29 Validation croisée Le classifieur (extracteur) peut ne pas être capable de prédire correctement si la quantité totale de données disponibles est trop petite. Mais la qualité du test peut ne pas être bonne si la proportion de données utilisées pour le test est trop petite.? p % q %? Apprentissage Test

30 Un cas extrême, la méthode du Leave-One-Out A partir de N échantillons disponibles dans le jeu de données, un classifieur est entrainé sur (N -1) échantillons, et testé sur L échantillon laissé de côté Ceci est répété N fois, jusqu à ce que chaque échantillon ait été inclus une fois comme échantillon de validation croisée. Les résultats sont moyennés sur les N tests pour estimer la performance de prédiction du classifieur. Données Test Données Test Données N Expérience 1 Expérience 2 Expérience N Test

31 Exemple concret d extraction d informations Les «message understanding conferences» State of the art Evaluation Results in Open International Competition (MUC 7, 1998 ) Task Recall Precision P & R Named Entity Coreference Template Element (entity + attributes) Template Relation Scenario Template

32 Le traitement automatique du language But ultime: «compréhension» automatique du language écrit par un ordinateur Très difficile, sinon impossible Essayer d atteindre des sous-objectifs plus réalistes: - désambiguisation des mots - reconnaissance de phrases - associations sémantiques Deux grandes classes d approches : - linguistique informatique - statistique textuelle

33 La loi de Zipf Objectifs: Etude linguistique des écrits littéraires en étudiant les biais de fréquence d utilisation des mots travaux: analyse du texte «Ulysse» de J. Joyce: Comptage des mots : mots Classement par fréquence décroissante et numérotation par rang d apparition Le produit du rang par la fréquence est proche d une constante (invt prop.) Courbe fréquence=f(rang) proche de 1/x (ou log (freq)= log (rang) est linéaire décroissante)

34 Interprétation du contenu en information d un texte en zones des lois hyperboliques Texte contrôlé Texte libre

35 Un exemple concret d extraction d informations scientifiques en protéomique fonctionnelle Acquisition automatisée de données d interactions génétiques et moléculaires à partir de résumés Medline par statistique textuelle

36 Buts But générique : Extraire de l information sur les interactions moléculaires et génétiques à partir de textes (résumés Medline) Objectifs spécialisés : Est-ce qu un résumé donné contient des phrases décrivant une (des) interaction(s)? Quels en sont les partenaires et le type d interaction? Etablir des listes exhaustives d interactions extraites de la littérature pour plusieurs espèces modèles Moyens : Préparer des corpora tests annotés pour les interactions Mettre au point des méthodes adaptées Développer un outil intégrant ces méthodes

37 Sources d information sur les interactions Avant 1997: pas de bases de données d interactions Depuis 1997: plusieurs bases de données d interactions, mais non exhaustives (EcoCyc, DIP, KEGG, BIND, Mint, FlyNets,...) Données fragmentaires présentes dans les bases de données moléculaires et génétiques telles que SwissProt, GenBank, FlyBase, De très nombreuses données sur les interactions sont présentes dans les bases de données bibliographiques mais d une façon non-explicite et non-standardisée

38 Exemples de descriptions textuelles diversité Importante dans la façon de décrire les d interactions interactions dans les textes The 1.28 gene is directly activated by Dfd in the maxillary segment but not in the mandibular segment. Antp activation depends on brm interaction with the promoter E2f and Dp gene products interact and cooperate to give sequence specific DNA binding and optimal trans-activation Spatially restricted expression of dpp in the visceral mesoderm is regulated by the homeotic genes Ubx and abd-a trx is necessary for normal levels of abd-a protein accumulation. Using a combination of promoter fusion-p-transformation assays, and in vitro DNA-binding assays coupled with site-directed mutagenesis, we establish a direct link between dl-binding sites and twi expression in the early embryo Increasing the number of wild type copies of amx does not modify the bib mutant phenotype

39 Mise en évidence d interactions (1) Identification des partenaires The 1.28 gene is directly activated by Dfd in the maxillary segment but not in the mandibular segment. Antp activation depends on on brm brm interaction interaction with with the the promoter promoter E2f E2f and and Dp Dp gene gene products interact and and cooperate to to give give sequence specific DNA binding and optimal trans-activation Spatially Spatially restricted restricted expression of of dpp dpp in in the the visceral visceral mesoderm mesoderm is is regulated by the homeotic genes Ubx and abd-a trx is is necessary for normal levels of of abd-a protein accumulation. Using a combination of promoter fusion-p-transformation assays, and in vitro DNA-binding assays coupled with site-directed mutagenesis, we establish a direct link between dl-binding sites and twi expression in in the early embryo Increasing the number of wild type copies of amx does not modify the bib mutant phenotype

40 Mise en évidence d interactions (2) Identification des partenaires Identification d un vocabulaire interaction-specifique The 1.28 gene is is directly activated by by Dfd Dfd in the in the maxillary segment but not but in the not mandibular in the mandibular segment. segment. Antp Antp activation depends depends on on brm brm interaction interaction with with the the promoter promoter E2f E2f and and Dp Dp gene gene products products interact interact and and cooperate cooperate to give to give sequence sequence specific specific DNA DNA binding binding and and optimal optimal trans-activation trans-activation Spatially restricted expression of dpp in the visceral mesoderm is regulated Spatially by restricted the homeotic expression genes Ubx of dpp and in abd-a the visceral mesoderm is trx regulated is necessary by the for homeotic normal levels genes of Ubx abd-a and protein abd-a accumulation. Using trx is a necessary combination for of normal promoter levels fusion-p-transformation of abd-a protein accumulation. assays, and in vitro Using DNA-binding a combination assays of coupled promoter with fusion-p-transformation site-directed mutagenesis, assays, weand establish in vitro a direct DNA-binding link between assays dl-binding coupled with sites site-directed and twi expression mutagenesis, in the early we embryo establish a direct link between dl-binding sites and twi expression Increasing the early the embryo number of wild type copies of amx does not modify the bib Increasing mutant phenotype the number of wild type copies of amx does not modify the bib mutant phenotype

41 Stratégie générale d extraction d information sur les interactions Utilisation de méthodes de statistique textuelle (et non de linguistique) Séparer le problème en deux sous-tâches : - détecter les noms de gènes/protéines dans les phrases - détecter parmi les phrases positives celles décrivant des interactions Intégration des méthodologies développées dans un outil nouveau capable d assurer deux fonctions : - outil d aide à l annotation pour les gènes/protéines et les interactions dans des jeux de résumés de référence - extracteur d interactions automatique multi-espèces (mais espèce-spécifique) dans les abstracts Medline

42 Prediction d interactions dans les textes : analyse d un jeu de phrases Synopsis de la chaîne de traitements FlyBase (1996) (23 Mo) 9500 genes Extraction of pertinent fields Cutting out into sentences entries (10 Mo) Reformatting elimination of identical sentences Filtering 4200 sentences 1228 genes Selection 1200 sentences with 2 gene names 550 genes Tagging of genes and proteins occurrences of genes 165 occurrences of proteins semantic treatment > 1585 lemmes Expert biological validation 1200 sentences: 653 Y sentences, 491 N, 56 I thèse Violaine Pillet

43 Analysis of the vocabulary present in the corpus: Conservation of stemmed words for which frequency is 4 only: 455 / 1585 stemmed words Principal component analysis of vocabulary with respect to belonging to Y, N or I groups Y a t il un vocabulaire specifique utilisé pour décrire les interactions?

44 Y a t il un vocabulaire specifique utilisé pour décrire les interactions?

45 Stratégie de prediction d interactions : Calcul d un indice de probabilité d interaction (IPI) Calcul d un «poids» pour chaque terme des listes Y et N valeur positive pour les termes Y valeur négative pour les termes N Remplacer tous les termes par leurs poids dans chacune des 1200 phrases Calcul de la somme des poids pour chaque phrase: IPI Analyse des IPIs pour comparer phrases Y et N

46 Variation de l indice de probabilité d interaction (IPI) pour les 3 groupes de phrases (Y,N,I) du corpus d entraînement 1200 phrases avec 2 noms de gènes : 653 phrases Y, 56 phrases I et 491 phrases N IPI phrases I 492 phrases Y phrases N 87,3% des phrases Y ont un IPI 0 Taux de rappel : 87,3% Taux de précision : 85,7% 0 Nombre de phrases 649

47 0,60 Variation de l indice de probabilité d interaction (IPI) pour 3 groupes de phrases (Y,N,I) d un corpus test (Medline) 313 phrases avec 2 noms de gènes : 104 Y et 209 N 0,40 0,20 phrases Y phrases N 0, ,20-0,40-0,60-0,80 74% des phrases Y ont un IPI 0 Taux de rappel : 74% Taux de précision : 61,7% -1,00 0 Number of sentences 313

48 Extraction d informations pratique en biologie sur Internet Un exemple concret : IHOP (Information Hyperlinked Over Proteins) A. Valencia, Protein Design Group, madrid

49 [SEARCH] Defining information for the gene Interaction information on the gene Minimal information on the gene

50

51 C est tout pour le cours!

De la modélisation linguistique aux applications logicielles: le rôle des Entités Nommées en Traitement Automatique des Langues

De la modélisation linguistique aux applications logicielles: le rôle des Entités Nommées en Traitement Automatique des Langues De la modélisation linguistique aux applications logicielles: le rôle des Entités Nommées en Traitement Automatique des Langues Maud Ehrmann Joint Research Centre Ispra, Italie. Guillaume Jacquet Xerox

Plus en détail

LIVRE BLANC Décembre 2014

LIVRE BLANC Décembre 2014 PARSING MATCHING EQUALITY SEARCH LIVRE BLANC Décembre 2014 Introduction L analyse des tendances du marché de l emploi correspond à l évidence à une nécessité, surtout en période de tension comme depuis

Plus en détail

Introduction aux bases de données: application en biologie

Introduction aux bases de données: application en biologie Introduction aux bases de données: application en biologie D. Puthier 1 1 ERM206/Technologies Avancées pour le Génome et la Clinique, http://tagc.univ-mrs.fr/staff/puthier, puthier@tagc.univ-mrs.fr ESIL,

Plus en détail

Apprentissage Automatique

Apprentissage Automatique Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs

Plus en détail

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com Intelligence Artificielle et Systèmes Multi-Agents Badr Benmammar bbm@badr-benmammar.com Plan La première partie : L intelligence artificielle (IA) Définition de l intelligence artificielle (IA) Domaines

Plus en détail

Base de données bibliographiques Pubmed-Medline

Base de données bibliographiques Pubmed-Medline Chapitre 1 ; Domaine 1 ; Documentation ; Champs référentiels 1.1.1, 1.1.2 et 1.1.3 Base de données bibliographiques Pubmed-Medline D r Patrick Deschamps,, 30 mai 2007 PLAN C2i métiers de la santé Introduction

Plus en détail

Bases de données documentaires et distribuées Cours NFE04

Bases de données documentaires et distribuées Cours NFE04 Bases de données documentaires et distribuées Cours NFE04 Introduction a la recherche d information Auteurs : Raphaël Fournier-S niehotta, Philippe Rigaux, Nicolas Travers prénom.nom@cnam.fr Département

Plus en détail

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI 1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems

Plus en détail

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY

UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY UTILISATION DE LA PLATEFORME WEB D ANALYSE DE DONNÉES GALAXY Yvan Le Bras yvan.le_bras@irisa.fr Cyril Monjeaud, Mathieu Bahin, Claudia Hériveau, Olivier Quenez, Olivier Sallou, Aurélien Roult, Olivier

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

Plan 1/9/2013. Génération et exploitation de données. CEP et applications. Flux de données et notifications. Traitement des flux Implémentation

Plan 1/9/2013. Génération et exploitation de données. CEP et applications. Flux de données et notifications. Traitement des flux Implémentation Complex Event Processing Traitement de flux de données en temps réel Romain Colle R&D Project Manager Quartet FS Plan Génération et exploitation de données CEP et applications Flux de données et notifications

Plus en détail

Guide de recherche documentaire à l usage des doctorants. Partie 1 : Exploiter les bases de données académiques

Guide de recherche documentaire à l usage des doctorants. Partie 1 : Exploiter les bases de données académiques Guide de recherche documentaire à l usage des doctorants Partie : Exploiter les bases de données académiques Sylvia Cheminel Dernière mise à jour : décembre 04 PANORAMA DES SOURCES DOCUMENTAIRES ACADEMIQUES...

Plus en détail

Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA

Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA RÉCITAL 2005, Dourdan, 6-10 juin 2005 Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA Siham Boulaknadel (1,2), Fadoua Ataa-Allah (2) (1) LINA FRE

Plus en détail

Les bases de données transcriptionnelles en ligne

Les bases de données transcriptionnelles en ligne Les bases de données transcriptionnelles en ligne Différents concepts en régulation transcriptionnelle sites de fixation - in vitro/vivo? - quelle technique? - degré de confiance? facteur de transcription

Plus en détail

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST. La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST. Gaël Le Mahec - p. 1/12 L algorithme BLAST. Basic Local Alignment Search Tool est un algorithme de recherche

Plus en détail

INTRODUCTION AU DATA MINING

INTRODUCTION AU DATA MINING INTRODUCTION AU DATA MINING 6 séances de 3 heures mai-juin 2006 EPF - 4 ème année - Option Ingénierie d Affaires et de Projets Bertrand LIAUDET TP DE DATA MINING Le TP et le projet consisteront à mettre

Plus en détail

3. SPÉCIFICATIONS DU LOGICIEL. de l'expression des besoins à la conception. Spécifications fonctionnelles Analyse fonctionnelle et méthodes

3. SPÉCIFICATIONS DU LOGICIEL. de l'expression des besoins à la conception. Spécifications fonctionnelles Analyse fonctionnelle et méthodes PLAN CYCLE DE VIE D'UN LOGICIEL EXPRESSION DES BESOINS SPÉCIFICATIONS DU LOGICIEL CONCEPTION DU LOGICIEL LA PROGRAMMATION TESTS ET MISE AU POINT DOCUMENTATION CONCLUSION C.Crochepeyre Génie Logiciel Diapason

Plus en détail

INF6304 Interfaces Intelligentes

INF6304 Interfaces Intelligentes INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie

Plus en détail

Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe

Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe Karima Dhouib, Sylvie Després Faiez Gargouri ISET - Sfax Tunisie, BP : 88A Elbustan ; Sfax karima.dhouib@isets.rnu.tn,

Plus en détail

Bases de données des mutations

Bases de données des mutations Bases de données des mutations CFMDB CFTR2 CFTR-France / Registre Corinne THEZE, Corinne BAREIL Laboratoire de génétique moléculaire Montpellier Atelier Muco, Lille, 25-27 septembre 2014 Accès libre http://www.genet.sickkids.on.ca/app

Plus en détail

Identification de nouveaux membres dans des familles d'interleukines

Identification de nouveaux membres dans des familles d'interleukines Identification de nouveaux membres dans des familles d'interleukines Nicolas Beaume Jérôme Mickolajczak Gérard Ramstein Yannick Jacques 1ère partie : Définition de la problématique Les familles de gènes

Plus en détail

Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant

Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant Master de Bioinformatique et Biologie des Systèmes Toulouse http://m2pbioinfo.biotoul.fr Responsable : Pr. Gwennaele Fichant Parcours: Master 1 : Bioinformatique et biologie des Systèmes dans le Master

Plus en détail

MABioVis. Bio-informatique et la

MABioVis. Bio-informatique et la MABioVis Modèles et Algorithmes pour la Bio-informatique et la Visualisation Visite ENS Cachan 5 janvier 2011 MABioVis G GUY MELANÇON (PR UFR Maths Info / EPI GRAVITE) (là, maintenant) - MABioVis DAVID

Plus en détail

N 334 - SIMON Anne-Catherine

N 334 - SIMON Anne-Catherine N 334 - SIMON Anne-Catherine RÉALISATION D UN CDROM/DVD CONTENANT DES DONNÉES DU LANGAGE ORAL ORGANISÉES EN PARCOURS DIDACTIQUES D INITIATION LINGUISTIQUE A PARTIR DES BASES DE DONNÉES VALIBEL Introduction

Plus en détail

Travaux pratiques avec RapidMiner

Travaux pratiques avec RapidMiner Travaux pratiques avec RapidMiner Master Informatique de Paris 6 Spécialité IAD Parcours EDOW Module Algorithmes pour la Fouille de Données Janvier 2012 Prise en main Généralités RapidMiner est un logiciel

Plus en détail

Annales du Contrôle National de Qualité des Analyses de Biologie Médicale

Annales du Contrôle National de Qualité des Analyses de Biologie Médicale Annales du Contrôle National de Qualité des Analyses de Biologie Médicale ARN du virus de l hépatite C : ARN-VHC ARN-VHC 03VHC1 Novembre 2003 Edité : mars 2006 Annales ARN-VHC 03VHC1 1 / 8 ARN-VHC 03VHC1

Plus en détail

Cette Leçon va remplir ces attentes spécifiques du curriculum :

Cette Leçon va remplir ces attentes spécifiques du curriculum : Dev4Plan1 Le Plan De Leçon 1. Information : Course : Français Cadre Niveau : Septième Année Unité : Mes Relations Interpersonnelles Thème du Leçon : Les Adjectifs Descriptifs Date : Temps : 55 minutes

Plus en détail

et les Systèmes Multidimensionnels

et les Systèmes Multidimensionnels Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Datawarehouse (DW) Le Datawarehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées

Plus en détail

Linked Open Data. Le Web de données Réseau, usages, perspectives. Eric Charton. Eric Charton

Linked Open Data. Le Web de données Réseau, usages, perspectives. Eric Charton. Eric Charton Linked Open Data Le Web de données Réseau, usages, perspectives Sommaire Histoire du Linked Open Data Structure et évolution du réseau Utilisations du Linked Open Data Présence sur le réseau LOD Futurs

Plus en détail

Gestion collaborative de documents

Gestion collaborative de documents Gestion collaborative de documents ANT box, le logiciel qui simplifie votre GED Les organisations (entreprises, collectivités, associations...) génèrent chaque jour des millions de documents, e-mails,

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

Ecole Technique «Transformation de données documentaires» Poitiers, 14-16 mars 2011. Atelier 1: Sphinx. import, conversion, export de données

Ecole Technique «Transformation de données documentaires» Poitiers, 14-16 mars 2011. Atelier 1: Sphinx. import, conversion, export de données Ecole Technique «Transformation de données documentaires» Poitiers, 14-16 mars 2011 Atelier 1: Sphinx import, conversion, export de données Introduction à la Recherche d'ist via le Web INRA Grignon, 03/2011

Plus en détail

Gestion de références bibliographiques

Gestion de références bibliographiques Mars 2011 Gestion de références bibliographiques Outil pour gérer ses bibliographies personnelles sur le web. Il est intégré à Web of Science (WOS). La version web est une version allégée de EndNote (ne

Plus en détail

IBM SPSS Direct Marketing

IBM SPSS Direct Marketing IBM SPSS Statistics 19 IBM SPSS Direct Marketing Comprenez vos clients et renforcez vos campagnes marketing Points clés Avec IBM SPSS Direct Marketing, vous pouvez : Comprendre vos clients de manière plus

Plus en détail

Laboratoire 4 Développement d un système intelligent

Laboratoire 4 Développement d un système intelligent DÉPARTEMENT DE GÉNIE LOGICIEL ET DES TI LOG770 - SYSTÈMES INTELLIGENTS ÉTÉ 2012 Laboratoire 4 Développement d un système intelligent 1 Introduction Ce quatrième et dernier laboratoire porte sur le développement

Plus en détail

Recherche et veille documentaire scientifique

Recherche et veille documentaire scientifique Recherche et veille documentaire scientifique Élodie Chattot BU Médecine Pharmacie juin 2006 Introduction Le but de cet atelier est de vous initier à la méthodologie de recherche documentaire scientifique,

Plus en détail

Learning Object Metadata

Learning Object Metadata Page 1 of 7 Learning Object Metadata Le LOM (Learning Object Metadata), est un schéma de description de ressources d enseignement et d apprentissage. Le LOM peut être utilisé pour décrire des ressources

Plus en détail

Dan Istrate. Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier

Dan Istrate. Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier Détection et reconnaissance des sons pour la surveillance médicale Dan Istrate le 16 décembre 2003 Directeur de thèse : Eric Castelli Co-Directeur : Laurent Besacier Thèse mené dans le cadre d une collaboration

Plus en détail

Amélioration de la fiabilité d inspection en CND grâce à la fusion d information : applications en rayons X et ultrasons

Amélioration de la fiabilité d inspection en CND grâce à la fusion d information : applications en rayons X et ultrasons Amélioration de la fiabilité d inspection en CND grâce à la fusion d information : applications en rayons X et ultrasons Ahmad OSMAN 1a, Valérie KAFTANDJIAN b, Ulf HASSLER a a Fraunhofer Development Center

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme

Plus en détail

Ingénierie et gestion des connaissances

Ingénierie et gestion des connaissances Master Web Intelligence ICM Option Informatique Ingénierie et gestion des connaissances Philippe BEAUNE Philippe.Beaune@emse.fr 18 novembre 2008 Passer en revue quelques idées fondatrices de l ingénierie

Plus en détail

Sécuristation du Cloud

Sécuristation du Cloud Schémas de recherche sur données chiffrées avancés Laboratoire de Cryptologie Thales Communications & Security 9 Avril 215 9/4/215 1 / 75 Contexte Introduction Contexte Objectif Applications Aujourd hui

Plus en détail

Gestion obligataire passive

Gestion obligataire passive Finance 1 Université d Evry Séance 7 Gestion obligataire passive Philippe Priaulet L efficience des marchés Stratégies passives Qu est-ce qu un bon benchmark? Réplication simple Réplication par échantillonnage

Plus en détail

PRÉSENTATION PRODUIT. Plus qu un logiciel, la méthode plus efficace de réconcilier.

PRÉSENTATION PRODUIT. Plus qu un logiciel, la méthode plus efficace de réconcilier. PRÉSENTATION PRODUIT Plus qu un logiciel, la méthode plus efficace de réconcilier. Automatiser les réconciliations permet d optimiser l utilisation des ressources et de générer plus de rentabilité dans

Plus en détail

L apprentissage automatique

L apprentissage automatique L apprentissage automatique L apprentissage automatique L'apprentissage automatique fait référence au développement, à l analyse et à l implémentation de méthodes qui permettent à une machine d évoluer

Plus en détail

Gènes Diffusion - EPIC 2010

Gènes Diffusion - EPIC 2010 Gènes Diffusion - EPIC 2010 1. Contexte. 2. Notion de génétique animale. 3. Profil de l équipe plateforme. 4. Type et gestion des données biologiques. 5. Environnement Matériel et Logiciel. 6. Analyses

Plus en détail

Chapitre 2. Eléments pour comprendre un énoncé

Chapitre 2. Eléments pour comprendre un énoncé Chapitre 2 Eléments pour comprendre un énoncé Ce chapitre est consacré à la compréhension d un énoncé. Pour démontrer un énoncé donné, il faut se reporter au chapitre suivant. Les tables de vérité données

Plus en détail

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 25/12/2006 Stéphane Tufféry - Data Mining - http://data.mining.free.fr

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 25/12/2006 Stéphane Tufféry - Data Mining - http://data.mining.free.fr 1 Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE 2 Plan du cours Qu est-ce que le data mining? A quoi sert le data mining? Les 2 grandes familles de techniques Le déroulement d un projet de data

Plus en détail

et Active Directory Ajout, modification et suppression de comptes, extraction d adresses pour les listes de diffusion

et Active Directory Ajout, modification et suppression de comptes, extraction d adresses pour les listes de diffusion et Active Directory Ajout, modification et suppression de comptes, extraction d adresses pour les listes de diffusion Copyright 2009 Alt-N Technologies. 3 allée de la Crabette Sommaire Résumé... 3 MDaemon

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane

Plus en détail

Information utiles. cinzia.digiusto@gmail.com. webpage : Google+ : http://www.ibisc.univ-evry.fr/ digiusto/

Information utiles. cinzia.digiusto@gmail.com. webpage : Google+ : http://www.ibisc.univ-evry.fr/ digiusto/ Systèmes de gestion de bases de données Introduction Université d Evry Val d Essonne, IBISC utiles email : cinzia.digiusto@gmail.com webpage : http://www.ibisc.univ-evry.fr/ digiusto/ Google+ : https://plus.google.com/u/0/b/103572780965897723237/

Plus en détail

MASTER SIS PRO : logique et sécurité DÉTECTION D INTRUSIONS. Odile PAPINI, LSIS. Université de Toulon et du Var. papini@univ-tln.

MASTER SIS PRO : logique et sécurité DÉTECTION D INTRUSIONS. Odile PAPINI, LSIS. Université de Toulon et du Var. papini@univ-tln. MASTER SIS PRO : logique et sécurité DÉTECTION D INTRUSIONS Odile PAPINI, LSIS. Université de Toulon et du Var. papini@univ-tln.fr Plan Introduction Généralités sur les systèmes de détection d intrusion

Plus en détail

Recherche bibliographique

Recherche bibliographique Séminaire «Maîtrise de l information scientifique» Recherche bibliographique Dernière mise à jour : 07/01/2015 - Auteur : Frédérique Flamerie Recherche bibliographique : méthode & outils La recherche bibliographique

Plus en détail

Le ranking de Augure Influencers La méthodologie AIR en détails

Le ranking de Augure Influencers La méthodologie AIR en détails Le ranking de Augure Influencers La méthodologie AIR en détails V1.0 Octobre 2014 Oualid Abderrazek Product Marketing Sommaire 1. Contexte...3 2. L algorithme...3 a. Exposition...4 b. Echo...4 c. Niveau

Plus en détail

Collecter des informations statistiques

Collecter des informations statistiques Collecter des informations statistiques FICHE MÉTHODE A I Les caractéristiques essentielles d un tableau statistique La statistique a un vocabulaire spécifique. L objet du tableau (la variable) s appelle

Plus en détail

Quels outils pour prévoir?

Quels outils pour prévoir? modeledition SA Quels outils pour prévoir? Les modèles de prévisions sont des outils irremplaçables pour la prise de décision. Pour cela les entreprises ont le choix entre Excel et les outils classiques

Plus en détail

Enjeux mathématiques et Statistiques du Big Data

Enjeux mathématiques et Statistiques du Big Data Enjeux mathématiques et Statistiques du Big Data Mathilde Mougeot LPMA/Université Paris Diderot, mathilde.mougeot@univ-paris-diderot.fr Mathématique en Mouvements, Paris, IHP, 6 Juin 2015 M. Mougeot (Paris

Plus en détail

Les 10 grands principes de l utilisation du data mining pour une gestion de la relation client réussie

Les 10 grands principes de l utilisation du data mining pour une gestion de la relation client réussie Les 10 grands principes de l utilisation du data mining pour une gestion de la relation client réussie Découvrir les stratégies ayant fait leurs preuves et les meilleures pratiques Points clés : Planifier

Plus en détail

LE LEAN MINING ET LES DÉFIS ASSOCIÉS À LA SST. Nadeau, S., Morency, F., Nsangou, J.-R. École de technologie supérieure

LE LEAN MINING ET LES DÉFIS ASSOCIÉS À LA SST. Nadeau, S., Morency, F., Nsangou, J.-R. École de technologie supérieure LE LEAN MINING ET LES DÉFIS ASSOCIÉS À LA SST École de technologie supérieure 2 Qu est-ce que le lean mining? Une contextualisation des principes du lean manufacturing au secteur minier. 3 Qu est-ce que

Plus en détail

Principes de bonne pratique :

Principes de bonne pratique : Principes de bonne pratique : Recommandations en vue de la création de bases de données génétiques nationales Le présent document a été élaboré par le Groupe d experts d INTERPOL sur le suivi des techniques

Plus en détail

Gestion des références bibliographiques. Comment simplifier la gestion des références bibliographiques?

Gestion des références bibliographiques. Comment simplifier la gestion des références bibliographiques? Gestion des références bibliographiques Comment simplifier la gestion des références bibliographiques? Objectifs de la formation Créer votre base de données personnelle de références bibliographiques.

Plus en détail

à moyen Risque moyen Risq à élevé Risque élevé Risq e Risque faible à moyen Risq Risque moyen à élevé Risq

à moyen Risque moyen Risq à élevé Risque élevé Risq e Risque faible à moyen Risq Risque moyen à élevé Risq e élevé Risque faible Risq à moyen Risque moyen Risq à élevé Risque élevé Risq e Risque faible à moyen Risq Risque moyen à élevé Risq L e s I n d i c e s F u n d a t a é Risque Les Indices de faible risque

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

4. SERVICES WEB REST 46

4. SERVICES WEB REST 46 4. SERVICES WEB REST 46 REST REST acronyme de REpresentational State Transfert Concept introduit en 2000 dans la thèse de Roy FIELDING Est un style d architecture inspiré de l architecture WEB En 2010,

Plus en détail

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21 IODAA de l 1nf0rmation à la Décision par l Analyse et l Apprentissage IODAA Informations générales 2 Un monde nouveau Des données numériques partout en croissance prodigieuse Comment en extraire des connaissances

Plus en détail

basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB www.enseirb.fr/~legal Olivier Augereau Formation UML

basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB www.enseirb.fr/~legal Olivier Augereau Formation UML basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB www.enseirb.fr/~legal Olivier Augereau Formation UML http://olivier-augereau.com Sommaire Introduction I) Les bases II) Les diagrammes

Plus en détail

Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments»

Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments» Master In silico Drug Design Semestre 2 Spécialité «Analyse in silico des complexes macromolécules biologiques-médicaments» 30NU01IS INITIATION A LA PROGRAMMATION (6 ECTS) Responsables : D. MESTIVIER,

Plus en détail

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université

Plus en détail

Problématiques de recherche. Figure Research Agenda for service-oriented computing

Problématiques de recherche. Figure Research Agenda for service-oriented computing Problématiques de recherche 90 Figure Research Agenda for service-oriented computing Conférences dans le domaine ICWS (International Conference on Web Services) Web services specifications and enhancements

Plus en détail

Commande Prédictive des. Convertisseurs Statiques

Commande Prédictive des. Convertisseurs Statiques Commande Prédictive des Convertisseurs Statiques 1 Classification des méthodes de commande pour les convertisseurs statiques Commande des convertisseurs Hystérésis MLI Cde Linéaire Fuzzy Logic Sliding

Plus en détail

Institut d Informatique & d Initiative Sociale

Institut d Informatique & d Initiative Sociale Institut d Informatique & d Initiative Sociale 89, Bd Aristide Briand 13300 Salon de Provence Tél : 04 90 56 18 31 Fax : 04 90 56 91 66 e-mail : contact@3is-formation.eu 3IS Centre de formation agréé code

Plus en détail

ENDNOTE X2 SOMMAIRE. 1. La bibliothèque EndNote 1.1. Créer une nouvelle bibliothèque 1.2. Ouvrir une bibliothèque EndNote 1.3. Fermer une bibliothèque

ENDNOTE X2 SOMMAIRE. 1. La bibliothèque EndNote 1.1. Créer une nouvelle bibliothèque 1.2. Ouvrir une bibliothèque EndNote 1.3. Fermer une bibliothèque 1 ENDNOTE X2 SOMMAIRE 1. La bibliothèque EndNote 1.1. Créer une nouvelle bibliothèque 1.2. Ouvrir une bibliothèque EndNote 1.3. Fermer une bibliothèque 2. Manipuler une bibliothèque EndNote 2.1. La saisie

Plus en détail

Cours 1 : Qu est-ce que la programmation?

Cours 1 : Qu est-ce que la programmation? 1/65 Introduction à la programmation Cours 1 : Qu est-ce que la programmation? Yann Régis-Gianas yrg@pps.univ-paris-diderot.fr Université Paris Diderot Paris 7 2/65 1. Sortez un appareil qui peut se rendre

Plus en détail

Hervé Couturier EVP, SAP Technology Development

Hervé Couturier EVP, SAP Technology Development Hervé Couturier EVP, SAP Technology Development Hervé Biausser Directeur de l Ecole Centrale Paris Bernard Liautaud Fondateur de Business Objects Questions à: Hervé Couturier Hervé Biausser Bernard Liautaud

Plus en détail

Annotation collaborative en ligne de l'archive manuscrite

Annotation collaborative en ligne de l'archive manuscrite Annotation collaborative en ligne de l'archive manuscrite Jean-Daniel Fekete INRIA Futurs & LRI Projet IN-SITU Jean-Daniel.Fekete@inria.fr http://www.lri.fr/~fekete Hammamet - Tunisie CFD'02 1 Plan p Le

Plus en détail

TRAITEMENT AUTOMATIQUE DES LANGUES. Licence d'informatique 2ème Année Semestre 1. Département d'informatique Université de Caen Basse-Normandie

TRAITEMENT AUTOMATIQUE DES LANGUES. Licence d'informatique 2ème Année Semestre 1. Département d'informatique Université de Caen Basse-Normandie TRAITEMENT AUTOMATIQUE DES LANGUES Licence d'informatique 2ème Année Semestre 1 Département d'informatique Université de Caen Basse-Normandie https://dias.users.greyc.fr/?op=paginas/tal.html Plan Définition

Plus en détail

SAS ENTERPRISE MINER POUR L'ACTUAIRE

SAS ENTERPRISE MINER POUR L'ACTUAIRE SAS ENTERPRISE MINER POUR L'ACTUAIRE Conférence de l Association des Actuaires I.A.R.D. 07 JUIN 2013 Sylvain Tremblay Spécialiste en formation statistique SAS Canada AGENDA Survol d Enterprise Miner de

Plus en détail

TEXT MINING Tour d Horizon

TEXT MINING Tour d Horizon TEXT MINING Tour d Horizon Media Campus WAN IFRA "Structurer, optimiser et valoriser son contenu éditorial : les outils de text mining" 24 novembre 2009, PARIS Philippe BONNY Cabinet de Conseil et d Etudes

Plus en détail

! Text Encoding Initiative

! Text Encoding Initiative Format XML: suite! le contenu d un élément est la concaténation de! texte! et d éléments (imbrication)! => structure arborescente! pas de chevauchement de balises! => exemple : une analyse syntagmatique

Plus en détail

Analyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57

Analyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57 Analyse de la vidéo Chapitre 4.1 - La modélisation pour le suivi d objet 10 mars 2015 Chapitre 4.1 - La modélisation d objet 1 / 57 La représentation d objets Plan de la présentation 1 La représentation

Plus en détail

Un dictionnaire électronique pour apprenant de l'arabe (langue seconde) basé sur corpus

Un dictionnaire électronique pour apprenant de l'arabe (langue seconde) basé sur corpus JEP-TALN 2004, Traitement Automatique de l Arabe, Fès, 20 avril 2004 Un dictionnaire électronique pour apprenant de l'arabe (langue seconde) basé sur corpus ZAAFRANI Riadh Faculté des Sciences Juridiques,

Plus en détail

UNE EXPERIENCE, EN COURS PREPARATOIRE, POUR FAIRE ORGANISER DE L INFORMATION EN TABLEAU

UNE EXPERIENCE, EN COURS PREPARATOIRE, POUR FAIRE ORGANISER DE L INFORMATION EN TABLEAU Odile VERBAERE UNE EXPERIENCE, EN COURS PREPARATOIRE, POUR FAIRE ORGANISER DE L INFORMATION EN TABLEAU Résumé : Cet article présente une réflexion sur une activité de construction de tableau, y compris

Plus en détail

EXTRACTION DE CONNAISSANCES À PARTIR DE DONNÉES TEXTUELLES VUE D ENSEMBLE

EXTRACTION DE CONNAISSANCES À PARTIR DE DONNÉES TEXTUELLES VUE D ENSEMBLE ème Colloque National AIP PRIMECA La Plagne - 7- avril 7 EXTRACTION DE CONNAISSANCES À PARTIR DE DONNÉES TEXTUELLES VUE D ENSEMBLE Bruno Agard Département de Mathématiques et de Génie Industriel, École

Plus en détail

Accès instantané aux mots et aux locutions Le dictionnaire électronique offre une traduction rapide d'un mot ou d'une locution

Accès instantané aux mots et aux locutions Le dictionnaire électronique offre une traduction rapide d'un mot ou d'une locution @promt Office 8.0 Description abrégée Spécifiquement conçu pour la maison et les petites entreprises Traduction de documents, de courriers électroniques et de messages instantanés ICQ Traduction de pages

Plus en détail

sentée e et soutenue publiquement pour le Doctorat de l Universitl

sentée e et soutenue publiquement pour le Doctorat de l Universitl Du rôle des signaux faibles sur la reconfiguration des processus de la chaîne de valeur de l organisation : l exemple d une centrale d achats de la grande distribution française Thèse présent sentée e

Plus en détail

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci http://liris.cnrs.fr/hamamache.kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de

Plus en détail

Analyse,, Conception des Systèmes Informatiques

Analyse,, Conception des Systèmes Informatiques Analyse,, Conception des Systèmes Informatiques Méthode Analyse Conception Introduction à UML Génie logiciel Définition «Ensemble de méthodes, techniques et outils pour la production et la maintenance

Plus en détail

Le langage SQL Rappels

Le langage SQL Rappels Le langage SQL Rappels Description du thème : Présentation des principales notions nécessaires pour réaliser des requêtes SQL Mots-clés : Niveau : Bases de données relationnelles, Open Office, champs,

Plus en détail

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1 Christophe CANDILLIER Cours de DataMining mars 2004 age 1 1. Introduction 2. rocessus du DataMining 3. Analyse des données en DataMining 4. Analyse en Ligne OLA 5. Logiciels 6. Bibliographie Christophe

Plus en détail

Bases de données Outils de gestion

Bases de données Outils de gestion 11/03/2010 Bases de données Outils de gestion Mise en place d outils pour gérer, stocker et utiliser les informations d une recherche biomédicale ent réalisé par L. QUINQUIS d épidémiologie et de biostatistique

Plus en détail

Sujet de thèse CIFRE RESULIS / LGI2P

Sujet de thèse CIFRE RESULIS / LGI2P Ecole des Mines d Alès Laboratoire de Génie Informatique et d Ingénierie de Production LGI2P Nîmes Sujet de thèse CIFRE RESULIS / LGI2P Titre Domaine De l ingénierie des besoins à l ingénierie des exigences

Plus en détail

TRAVAUX DE RECHERCHE DANS LE

TRAVAUX DE RECHERCHE DANS LE TRAVAUX DE RECHERCHE DANS LE DOMAINE DE L'EXPLOITATION DES DONNÉES ET DES DOCUMENTS 1 Journée technologique " Solutions de maintenance prévisionnelle adaptées à la production Josiane Mothe, FREMIT, IRIT

Plus en détail

Introduction à la méthodologie de la recherche

Introduction à la méthodologie de la recherche MASTER DE RECHERCHE Relations Économiques Internationales 2006-2007 Introduction à la méthodologie de la recherche geraldine.kutas@sciences-po.org Les Etapes de la Recherche Les étapes de la démarche Etape

Plus en détail

La base de données dans ArtemiS SUITE

La base de données dans ArtemiS SUITE 08/14 Vous préférez passer votre temps à analyser vos données plutôt qu à chercher un fichier? La base de données d ArtemiS SUITE vous permet d administrer et d organiser confortablement vos données et

Plus en détail

Entreposage de données complexes pour la médecine d anticipation personnalisée

Entreposage de données complexes pour la médecine d anticipation personnalisée Manuscrit auteur, publié dans "9th International Conference on System Science in Health Care (ICSSHC 08), Lyon : France (2008)" Entreposage de données complexes pour la médecine d anticipation personnalisée

Plus en détail

AGROBASE : un système de gestion de données expérimentales

AGROBASE : un système de gestion de données expérimentales AGROBASE : un système de gestion de données expérimentales Daniel Wallach, Jean-Pierre RELLIER To cite this version: Daniel Wallach, Jean-Pierre RELLIER. AGROBASE : un système de gestion de données expérimentales.

Plus en détail

Méthodes d évolution de modèle produit dans les systèmes du type PLM

Méthodes d évolution de modèle produit dans les systèmes du type PLM Résumé de thèse étendu Méthodes d évolution de modèle produit dans les systèmes du type PLM Seyed Hamedreza IZADPANAH Table des matières 1. Introduction...2 2. Approche «Ingénierie Dirigée par les Modèles»

Plus en détail