TP Recherche d'information
|
|
|
- Violette Boivin
- il y a 10 ans
- Total affichages :
Transcription
1 Master Modélisation Informatique des Connaissances et du Raisonnement (MICR) Cours Recherche et Extraction d'information TP Recherche d'information L'objectif global du TP de Recherche d'information est de faire tourner un moteur de recherche sur des données d'évaluation réelles (à la façon d'une campagne d'évaluation), et d'évaluer dans ce cadre plusieurs stratégies de recherche. Les trois séances du TP correspondent aux trois tâches suivantes : indexation des documents : choix et extraction des termes d'indexation utilisation d'un moteur de recherche : le moteur proposé est un petit moteur jouet implémentant le modèle vectoriel et réalisé en Java évaluation des résultats pour différentes stratégies Le travail se fait en binôme. Il sera évalué sur la base d'un rapport présentant les différentes stratégies évaluées et leurs résultats des programmes et scripts utilisés. Le rapport et les programmes devront être envoyés par e mail, après la dernière séance, à l'adresse [email protected] paris13.fr dans un seul message, dont le sujet doit commencer par la balise [TP RI]. Utiliser la même adresse e mail pour toute question concernant le TP. 1
2 TP Recherche d'information Séance 1 (06/03/2009) Pré traitement L'objectif de la première séance sera d'extraire les termes d'indexation des documents en vue de leur indexation. Différents pré traitements sont à disposition pour cette opération. Avant toute chose, récupérez l'archive TP_RI.tgz depuis votre compte SERCAL. Cette archive est située sur le répertoire ~rozenknop/micr_rei/tp_ri. Par exemple, en ligne de commande : cp ~rozenknop/micr_rei/tp_ri/tp_ri.tgz. (Vous pouvez aussi utiliser un gestionnaire de fichiers ; dans ce cas, il faut taper le chemin d'accès complet les répertoires intermédiaires ne sont pas ouverts en lecture!). Décompressez l'archive quelque part et lancez la prise en compte de l'environnement local de travail (pour l'utilisation du programme d'analyse). Par exemple, en ligne de commande : mkdir TP cd TP tar xvfz TP_RI.tgz cd TP_RI source TP_RI.env Le répertoire de travail est structuré de la façon suivante : 2
3 + data + corpus + test + assessments + sources + preprocessing + stemmers + stoplist + tagger + searchengine + evaluation + docs Les données Le corpus d'évaluation : 3000 documents et 60 requêtes extraits de la campagne d'évaluation CLEF 2003 Un corpus de test au même format : il peut être utilisé pour la mise au point des programmes (pour diminuer les temps de traitements) Les jugements de pertinence (pour l'évaluation) Les programmes Les programmes de prétraitement pour extraire les termes d'indexation Des stemmers Une stoplist Un outil pour la désambiguïsation morphosyntaxique Le moteur de recherche en java Les programmes pour l'évaluation Les documents (contient le présent énoncé) La première étape de l'indexation est l'analyse des documents. Plusieurs outils (disponibles gratuitement sur le Web) vous sont fournis dans le répertoire sources/preprocessing pour analyser les documents : ces outils sont présentés plus précisément plus bas. Vous devez réaliser pour ce TP des programmes ou scripts permettant d'appliquer les différents outils aux documents, disponibles au format XML pour extraire les termes à indexer, et les mettre dans le format d'entrée de l'indexeur (défini ci dessous). Vous êtes libres d'utiliser le(s) language(s) que vous voulez pour cela (je conseille l'utilisation de scripts Perl ou Python, mais un ensemble de scripts shell ou des programmes JAVA, C++ ou autres sont tout à fait envisageables). Les termes d'indexation à garder doivent pouvoir être : les formes de surface (mots tels qu'il apparaissent dans le texte original), les stems (après application d'un stemmer), les lemmes ou les couples lemmes+catégorie grammaticale (après l'application d'un tagger). L'indexeur utilisé dans le moteur de recherche prend en entrée des fichiers au format suivant : chaque ligne représente un document 3
4 l'espace est le caractère séparateur au sein de chaque ligne le premier élément de la ligne est le nom du document les éléments suivants de la ligne sont les termes d'indexation retenus pour ce document (il sont dans l'ordre des mots du texte du document original et ils peuvent être répétés). Un exemple de fichier XML et de fichiers à produire sont disponibles dans le répertoire data/test le fichier test.xml est un exemple de fichier XML contenant le corpus le fichier test.porter.txt est un exemple de fichier prétraité par le stemmer de Porter et reformaté pour être fourni en entrée de l'indexeur. le fichier test.tagger.txt est un exemple de fichier prétraité par une désambiguïsation morpho syntaxique et reformaté pour être fourni en entrée de l'indexeur. Concrètement: <DOC> <DOCID>TPREI DOC.0001</DOCID> corpus <TEXT> Italie: création d'un Parti démocratique monarchiste.... </TEXT> </DOC>... pré traitement ce que vous devez programmer TPREI DOC.0001italie création parti démocratique... TPREI DOC.0002 nouvel an obus sarajevo corpus pré traité tokeniseur stemmer savoy1 stemmer savoy2 stemmer porter pos tagger stoplist Présentation des outils : Pour pouvoir utiliser les outils de pré traitement, il faut compiler les programmes nécessaires et les installer, en faisant : cd TP_RI/sources/preprocessing make install Les outils de pré traitement disponibles dans ce répertoire sont les suivants : un tokeniseur simple en perl, qui prend du texte en entrée et sort le texte tokenisé (sur la sortie standard). 4
5 pour le lancer, utiliser la commande tokenizer.pl nom_de_fichier trois stemmers différents : le stemmer de Martin Porter et deux stemmers proposés par Jacques Savoy : Ces stemmers prennent en entrée un fichier contenant un texte tokenisé et donnent en sortie le même texte avec les termes tronqués. Pour lancer les stemmers, utiliser les commandes respectives stemmer porter fre nom_de_fichier stemmer savoy1 fre nom_de_fichier stemmer savoy2 fre nom_de_fichier une stoplist du français, de Jacques Savoy également: pour utiliser la stoplist, un programme perl est proposé, qui prend un texte en entrée et qui donne en sortie le même texte sans les mots de la stoplist. Ce programme est lancé avec la commande apply stoplist.pl fichier_stoplist nom_de_fichier un analyseur permettant de faire la désambiguïsation morpho syntaxique : le tree tagger, de Helmut Schmid : stuttgart.de/projekte/corplex/treetagger/decisiontreetagger.html Ce programme prend en entrée un fichier contenant le texte tokenisé et produit en sortie le texte étiqueté au format suivant : mot catégorie lemme La DET:ART le Grèce NAM Grèce entend VER:pres entendre promouvoir VER:infi promouvoir le DET:ART le livre NOM livre blanc ADJ blanc de PRP de la DET:ART le Commission NOM commission Le programme est lancé avec la commande 5
6 tree tagger french nom_de_fichier Le traitement étant plus complexe qu'un simple stemming, le traitement est relativement long : l'analyse du corpus complet (les 3000 documents) peut prendre 30 minutes ou plus. 6
7 TP Recherche d'information Séance 2 (13/03/2009) Moteur de recherche La deuxième séance a pour but d'utiliser un moteur de recherche pour indexer les documents et de rechercher les documents pertinents par rapport aux requêtes proposées. La compilation et l'installation du moteur de recherche se font par la commande : cd TP_RI/sources/searchengine make install Les prétraitements des documents étant faits, l'indexation des documents s'effectue par la commande : indexer.sh nom_index nom_de_fichier En sortie, le fichier nom_index contiendra alors l'index inversé des documents : cet index est lisible (format texte), et contient la structure inversée des documents ainsi que le lexique des documents (liste des mots). Les requêtes sont contenues dans le fichier XML TP_RI/data/corpus/topics.xml (pour la mise au point, un exemple de requête au même format se trouve dans le fichier dans le fichier TP_RI/data/test/topictest.xml). Ce fichier XML est au format des requêtes TREC. Le moteur de recherche prend en entrée un index et un fichier de requêtes analysées, au même format que les documents analysés : chaque ligne représente une requête le premier élément de la ligne est l'identifiant de la requête les éléments suivants de la ligne sont les termes d'indexation retenus pour la requête Un script Perl est fourni pour faire la conversion entre le fichier XML des requêtes et un fichier au même format que ceux des documents, permettant l'utilisation des programmes/scripts développés dans la première partie. Ce script s'utilise de la façon suivante : reformat.pl [t][d][n] topics_file.xml > topics_file_2.xml les options t,d,n indiquent les parties des requêtes à utiliser (t pour title, d pour desc, n pour narr). Ces options sont fournies pour permettre de tester les différences de performances en utilisant plus ou moins d'éléments dans les requêtes. Le programme de recherche prend en entrée le fichier contenant l'index et le fichier contenant les requêtes analysées et lance la recherche pour chacune des requêtes. Il retourne un maximum de 1000 documents par requête, au format TREC. Ce format 7
8 est décrit ici à titre informatif : chaque ligne représente un document retourné pour une requête, et contient les éléments suivants, séparés par des espaces : le premier élément de la ligne est l'identifiant de la requête le deuxième élément de la ligne est constant et vaut 1 le troisième élément de la ligne est l'identifiant du document retourné le quatrième élément de la ligne est le rang du document dans la liste des documents retournés (ce rang commence à 0 et finit à 999). Les documents doivent être rangés dans l'ordre de leur rang le cinquième élément de la ligne est le score associé au document (ce score doit être décroissant avec le rang: plus le document est pertinent, plus le score est élevé) le dernier élément de la ligne est un identifiant du résultat (il est le même sur toutes les lignes du fichier): cet identifiant est utile pour comparer des résultats. La commande pour lancer le moteur de recherche est la suivante : searchengine.sh index topics weighting_scheme runid Le premier argument est le nom du fichier contenant l'index, le second argument est le nom du fichier contenant les requêtes analysées, le troisième argument est le schéma de pondération (au format SMART), le dernier argument est l'identifiant du test :un fichier contenant le résultat au format TREC est produit, qui a le nom de l'identifiant du test. 8
9 TP Recherche d'information Séance 3 (20/03/2009) Evaluation La troisième séance de TP a pour objectif l'évaluation des résultats de différentes stratégies de recherche sur le corpus d'évaluation présent dans le répertoire TP_RI/data. Ce répertoire contient : corpus/corpus.xml: une collection de documents composée de 3010 documents ; corpus/topics.xml: une collection de requêtes composée de 60 requêtes au format TREC ; assessments/qrels: des résultats de référence : la liste des documents pertinents pour chacune des 60 requêtes. La compilation et l'installation des programmes pour l'évaluation se font par la commande : cd TP_RI/sources/evaluation make install Les programmes d'évaluation disponibles sont : le programme d'évaluation standard trec_eval : il prend en entrée un fichier de résultat retourné par le moteur de recherche et un fichier de jugements de pertinence (ce fichier est disponible dans le répertoire TP_RI/data/assessments). La syntaxe de l'appel à ce programme est la suivante (avec redirection de la sortie standard sur un fichier) : trec_eval qrels results > results.eval où qrels est le nom du fichier contenant les résultats de référence results est le nom du fichier contenant les résultats du moteur de recherche results.eval contient le résultat de l'évaluation : Vous pouvez regarder directement le fichier d'évaluation : le format de cette évaluation est de la forme mesure1 requête valeur mesure2 requête valeur... Par défaut, les valeurs données sont une moyenne sur toutes les requêtes (le champ de la deuxième colonne vaut «all»). Les valeurs calculées contiennent en particulier : num_ret = nombre (absolu) de documents retournés num_rel = nombre (absolu) de documents pertinent num_rel_ret = nombre (absolu) de documents pertinents retournés 9
10 map = précision moyenne ircl_prn.0.xx = valeur interpolée de précision pour un rappel de 0.xx Le détail complet de toutes les mesures peut être obtenu en faisant trec_eval h un programme Perl, nommé ireval.pl, qui permet d'interpréter les résultats du programme trec_eval, et sortir les courbes précision/rappel avec gnuplot (programme interactif pour l'affichage de courbes sous Linux/Unix). Il prend en entrée la sortie du programme trec_eval. La syntaxe d'appel de ce programme est la suivante : ireval.pl results.eval Pour lancer les courbes comparatives de plusieurs résultats, il suffit de faire ireval.pl results1.eval results2.eval Pour comparer les résultats sur certaines valeurs (par exemple, précision moyenne) on peut faire ireval.pl text value=map results1.eval results2.eval ou ireval.pl best value=map results1.eval results2.eval Plus d'informations sont disponibles avec l'option h un programme Perl nommé Wilcoxon.pl qui applique le test de Wilcoxon sur deux résultat pour établir si la différence est statistiquement significative, basé sur l'implémentation du test de Wilocoxon par Rob van Son, disponible à l'adresse : Ce programme s'utilise avec la syntaxe : Wilcoxon.pl value=map qrels results1 results2 la valeur indiquée est la mesure sur laquelle on veut faire le test (sans option, fait le test sur toutes les mesures) L'évaluation complète d'une stratégie de recherche se fait avec les étapes suivantes (les premières étapes ont pu être réalisées dans les séances précédentes) : lancer l'analyse sur la collection (avec les options souhaitées : stemming, stoplist...) créer un fichier d'index à partir de cette analyse lancer l'analyse sur les requêtes (avec les mêmes options) lancer le moteur de recherche avec l'index et les requêtes analysées lancer le programme trec_eval pour évaluer les résultats obtenus La comparaison des résultats obtenus avec différentes stratégies de recherche se fait 10
11 par la comparaison des courbes précision/rappel, par la comparaison de valeurs de performance globales, comme la précision moyenne (map), et par des tests statistiques pour vérifier si les différences sont significatives. Parmi les choses à évaluer, vous pourrez regarder en particulier les suivantes : influence du choix des termes d'indexation sur les résultats : application ou non d'un stemmer ou d'un tagger (avec les catégories ou non) ; utilisation ou non d'une stoplist (comparer aussi les tailles d'index) ; influence des champs utilisés dans la requête (titre, description, narratif) comparer les résultats de différents schémas de pondération du modèle vectoriel comparer les résultats des différentes requêtes : quelles requêtes sont plus difficiles quelle que soit la stratégie utilisée? Qu'est ce qui les rend difficiles? par exemple, quels sont les mots de la requête que le moteur n'a pas trouvés, pourquoi certains documents pertinents ont été ratés? Pour des comparaisons avancées, vous pouvez également, si vous le souhaitez, tester sur ce corpus d'évaluation d'autres moteurs de recherche disponibles sur Internet (des vrais moteurs), implémentant d'autres modèles de recherche : Lemur (Indri) : Apache Lucene : Terrier : MG : zettair : 11
Dans cette définition, il y a trois notions clés: documents, requête, pertinence.
Introduction à la RI 1. Définition Un système de recherche d'information (RI) est un système qui permet de retrouver les documents pertinents à une requête d'utilisateur, à partir d'une base de documents
MEDIAplus elearning. version 6.6
MEDIAplus elearning version 6.6 L'interface d administration MEDIAplus Sommaire 1. L'interface d administration MEDIAplus... 5 2. Principes de l administration MEDIAplus... 8 2.1. Organisations et administrateurs...
TRAITEMENT AUTOMATIQUE DES LANGUES. Licence d'informatique 2ème Année Semestre 1. Département d'informatique Université de Caen Basse-Normandie
TRAITEMENT AUTOMATIQUE DES LANGUES Licence d'informatique 2ème Année Semestre 1 Département d'informatique Université de Caen Basse-Normandie https://dias.users.greyc.fr/?op=paginas/tal.html Plan Définition
1 Démarrage de Marionnet
Institut Galilée Administration Système Année 2011-2012 INFO 2ème année Master Info 1 Master Image & Réseau 1 T.P. 1 Administration Système Le logiciel Marionnet (www.marionnet.org) offre la possibilité
1 Description générale de VISFIELD
Guide d utilisation du logiciel VISFIELD Yann FRAIGNEAU LIMSI-CNRS, Bâtiment 508, BP 133 F-91403 Orsay cedex, France 11 décembre 2012 1 Description générale de VISFIELD VISFIELD est un programme écrit
[ GLPI et OCS pour Gentoo 2006] ArtisanMicro. Alexandre BALMES
2006 ArtisanMicro Alexandre BALMES [ GLPI et OCS pour Gentoo 2006] Ce document de 10 pages vous perm et de créer un serveur w eb pour l utilisation de G LPIet O CSinventory sur la distribution Gentoo 2006.
Documentation utilisateur, manuel utilisateur MagicSafe Linux. Vous pouvez télécharger la dernière version de ce document à l adresse suivante :
Documentation utilisateur, manuel utilisateur MagicSafe Linux. Vous pouvez télécharger la dernière version de ce document à l adresse suivante : http://www.hegerys.com/documentation/magicsafe-windows-doc.pdf
Hadoop / Big Data. Benjamin Renaut <[email protected]> MBDS 2014-2015
Hadoop / Big Data Benjamin Renaut MBDS 2014-2015 TP 1 Méthodologie Map/Reduce - programmation Hadoop. 1 Installer VirtualBox (https://www.virtualbox.org/). Importer la machine
Serveur Acronis Backup & Recovery 10 pour Linux. Update 5. Guide d'installation
Serveur Acronis Backup & Recovery 10 pour Linux Update 5 Guide d'installation Table des matières 1 Avant l'installation...3 1.1 Composants d'acronis Backup & Recovery 10... 3 1.1.1 Agent pour Linux...
Trier les ventes (sales order) avec Vtiger CRM
Trier les ventes (sales order) avec Vtiger CRM Dans l'activité d'une entreprise, on peut avoir besoin d'un outil pour trier les ventes, ce afin de réaliser un certain nombre de statistiques sur ces ventes,
Thunderbird en version Portable
Thunderbird en version Portable Utiliser la version portable de Thunderbird pour utiliser sa messagerie académique Intérêts : L'utilisation de Thunderbird Portable va vous permettre entre autres et depuis
Chapitre 1 Introduction
Les éléments à télécharger sont disponibles à l'adresse suivante : http://www.editions-eni.fr Saisissez la référence ENI de l'ouvrage SOBI10SHA dans la zone de recherche et validez. Cliquez sur le titre
UwAmp. Serveur d'evaluation
UwAmp Serveur d'evaluation Aide sur UwAmp From UwAmp Wiki Jump to: navigation, search Tous les tutoriaux et aide sur l'installation et l'utilisation de UwAmp sont référencé sur cette page. Vous pouvez
Titre: Version: Dernière modification: Auteur: Statut: Licence:
Titre: Mise en œuvre de mod_webobjects Version: 2.0 Dernière modification: 2010/09/06 20:00 Auteur: Aurélien Minet Statut: version finale Licence: Creative Commons
Créer son premier package.deb. 19 août 2011 1
Créer son premier package.deb 19 août 2011 1 Créer son premier package.deb Atelier animé par Mohammed Adnène Trojette organisé par la Team Ubuntu Tunisie Prérequis une distribution dérivée de Debian les
PLAN DE CLASSIFICATION UNIFORME DES DOCUMENTS DU MSSS
PLAN DE CLASSIFICATION UNIFORME DES DOCUMENTS DU MSSS Février 2011 Édition produite par : Le Service de l accès à l information et des ressources documentaires du ministère de la Santé et des Services
Business Intelligence avec SQL Server 2012
Editions ENI Business Intelligence avec SQL Server 2012 Maîtrisez les concepts et réalisez un système décisionnel Collection Solutions Informatiques Table des matières Les éléments à télécharger sont disponibles
TP réseau Android. Bidouilles Tomcat. a) Installer tomcat : il suffit de dézipper l'archive apache-tomcat-8.0.15-windowsx64.zip.
TP réseau Android Ce TP utilise tomcat 8, sous windows et des.bat windows. On peut trouver ce serveur web et conteneur d'applications web à http://tomcat.apache.org/download-80.cgi. Il se trouve dans l'archive
Fiche n 25 01/03/2002. Power Archiver
Service informatique Enseignement Recherche Fiche n 25 01/03/2002 Power Archiver Power Archiver vous permet de compresser ou décompresser un ou plusieurs fichier(s) afin de les stocker sur votre disque
Séance 0 : Linux + Octave : le compromis idéal
Séance 0 : Linux + Octave : le compromis idéal Introduction Linux est un système d'exploitation multi-tâches et multi-utilisateurs, basé sur la gratuité et développé par une communauté de passionnés. C'est
Gestion collaborative de documents
Gestion collaborative de documents ANT box, le logiciel qui simplifie votre GED Les organisations (entreprises, collectivités, associations...) génèrent chaque jour des millions de documents, e-mails,
1. Cliquez sur dans le coin supérieur gauche de l'écran 2. Sélectionnez la Langue de l'interface désirée 3. Cliquez sur
NOTIFICATIONS GUIDE Le module Notifications permet de retrouver des notifications en utilisant les champs spécifiques de la base de données du Registre central des notifications (RCN). Il comporte une
Introduction...3. Objectif...3. Manipulations...3. La Sauvegarde...4. Les différents types...4. Planification...4. Les outils...5
Système d'exploitation Sommaire Introduction...3 Objectif...3 Manipulations...3 La Sauvegarde...4 Les différents types...4 Planification...4 Les outils...5 Quelques commandes...5 La commande tar...5 La
MANUEL D INSTALLATION D UN PROXY
MANUEL D INSTALLATION D UN PROXY Squid, SquidGuard, Dansguardian Dans ce guide on va détailler l installation et la configuration d une solution proxy antivirale en utilisant les outils ; squid, dansguardian,
PROCEDURE D'INSTALLATION OPENREPORTS
PROCEDURE D'INSTALLATION OPENREPORTS Table des matières Prérequis...2 1 Installation linux...2 2 Installation JAVA...3 2.1 Installation de la jdk...3 2.2 Configuration de l'environnement...3 3 Installation
Introduction: 1. définition d un ETL 2. importance et diversité des données spatiales utilitédes ETL géographiques
1 2 Introduction: 1. définition d un ETL 2. importance et diversité des données spatiales utilitédes ETL géographiques 3 ETL = extracto-chargeur = datadumping La Business Intelligence, BI, (ou informatique
TP n 2 : Installation et administration du serveur ProFTP. Partie 1 : Fonctionnement du protocole FTP (pas plus de 15min)
TP n 2 : Installation et administration du serveur ProFTP Objectifs du TP Comprendre le fonctionnement du protocole FTP Installation et compilation d un paquet source Configuration, lancement et administration
Projet Administration Réseaux
EL KHATIT Zouhair, L3 ASR N : 20072486 Projet Administration Réseaux Thème : SFTP & SCPOnly I- SFTP (Secure File Transfer Protocol) : Introduction: Le SFTP permet de transférer des fichiers par une connexion
Installation et paramétrage. Accès aux modèles, autotextes et clip- art partagés
DSI Documentation utilisateurs Installation et paramétrage Accès aux modèles, autotextes et clip- art partagés Auteur : Yves Crausaz Date : 21 septembre 2006 Version : 1.04 Glossaire OOo : Abréviation
DITA XML Olivier Carrère - www.redaction-technique.org
DITA XML Olivier Carrère - www.redaction-technique.org Préface 2 Table des matières 3 Sommaire Chapitre 1: Contenu d entreprise : améliorer la qualité, réduire les coûts...5 Chapitre 2: Du document à la
Titre: Version: Dernière modification: Auteur: Statut: Licence:
Titre: Installation de WebObjects 5.3 Version: 2.1 Dernière modification: 2011/02/17 11:00 Auteur: Aurélien Minet Statut: version finale Licence: Creative Commons
Guide de configuration de la Voix sur IP
Le serveur Icewarp Guide de configuration de la Voix sur IP Version 11 Mai 2014 i Sommaire Guide de configuration VoIP 1 Présentation... 1 Configuration... 1 Configuration réseau... 1 Configuration du
StreamServe Persuasion SP4
StreamServe Persuasion SP4 Manuel d installation Rév. A StreamServe Persuasion SP4 - Manuel d installation Rév. A 2001-2009 STREAMSERVE, INC. TOUS DROITS RESERVES Brevet américain n 7,127,520 Aucune partie
Interface PC Vivago Ultra. Pro. Guide d'utilisation
Interface PC Vivago Ultra Pro Guide d'utilisation Version 1.03 Configuration de l'interface PC Vivago Ultra Configuration requise Avant d'installer Vivago Ultra sur votre ordinateur assurez-vous que celui-ci
DA MOTA Anthony - Comparaison de technologies : PhoneGap VS Cordova
DA MOTA Anthony - Comparaison de technologies : PhoneGap VS Cordova I. Introduction Dans une période où la plasticité peut aider à réduire les coûts de développement de projets comme des applications mobile,
Module ebay pour PrestaShop Guide du vendeur
Module ebay pour PrestaShop Guide du vendeur Basé sur le module d'extension version 1.7.1, publié en 04/2014 Version du document : 1.4, 08/2014 1 Informations et aide Généralités Pour obtenir des informations
Hadoop / Big Data. Benjamin Renaut <[email protected]> MBDS 2014-2015
Hadoop / Big Data Benjamin Renaut MBDS 2014-2015 TP 3 TP noté Méthodologie Map/Reduce - programmation Hadoop - Sqoop Préparation du TP 1 Importer la machine virtuelle.ova du
Authentification avec CAS sous PRONOTE.net 2011. Version du lundi 19 septembre 2011
1 Authentification avec CAS sous PRONOTE.net 2011 Version du lundi 19 septembre 2011 2 1 - Vocabulaire employé et documentation... 3 1.1 - SSO (Single Sign-On)... 3 1.2 - CAS (Central Authentication Service)...
Déploiement, administration et configuration
Office 365 Déploiement, administration et configuration Mickaël GILARDEAU Table des matières 1 Les éléments à télécharger sont disponibles à l'adresse suivante : http://www.editions-eni.fr Saisissez la
Projet Viticulture - TP 3 : bases de données distantes BTS Services informatiques aux organisations
Projet Viticulture TP 3 : bases de données externes Description du thème Partie 1 : bases de données locales SQLite Partie 2 : projet H2O stockage local Partie 3 : bases de données distantes Partie 4 :
Auteur LARDOUX Guillaume Contact [email protected] Année 2014 DEVELOPPEMENT MOBILE AVEC CORDOVA
Auteur LARDOUX Guillaume Contact [email protected] Année 2014 DEVELOPPEMENT MOBILE AVEC CORDOVA Sommaire 1. Introduction 2. Installation 3. Fonctionnement 4. Développement 5. Démonstration 2
Installation d'une galerie photos Piwigo sous Microsoft Windows.
Installation d'une galerie photos Piwigo sous Microsoft Windows. By ARNOULD Julien Introduction : Piwigo est un logiciel de galerie photo pour le web, bâti autour d'une communauté active d'utilisateurs
Serveur proxy Squid3 et SquidGuard
Serveur proxy Squid3 et SquidGuard 1. Prérequis & installation Une adresse fixe le paquet wget, squid3 et squidguard apt-get install wget squid3 squidguard Il faut ensuite créer les répertoires suivants
Service de réplication des données HP pour la gamme de disques Continuous Access P9000 XP
Service de réplication des données HP pour la gamme de disques Continuous Access P9000 XP Services HP Care Pack Données techniques Le service de réplication des données HP pour Continuous Access offre
Installation de Concrete 5
2013 2014 Installation de Concrete 5 Projet Métier du Travail Auteur POIRET Johann Membres du projet Poiret Johann Clercin Kévin Responsable de la formation et tuteur Motamed Cina Client Master Boulogne/Mer
Base de Connaissances
Base de Connaissances La section Base de Connaissances fournit des réponses aux questions qui se posent le plus couramment lors de l'utilisation de DevInfo 7. Cliquez sur une catégorie ci- dessous pour
PHP 5.4 Développez un site web dynamique et interactif
Editions ENI PHP 5.4 Développez un site web dynamique et interactif Collection Ressources Informatiques Table des matières Table des matières 1 Chapitre 1 Introduction 1. Objectif de l'ouvrage.............................................
Documentation d'installation Plateforme femme actuelle
Smile Motoristes Internet page 1/7 Documentation d'installation Plateforme femme actuelle Smile 2006 Motoristes Internet page 1/7 Smile Motoristes Internet page 2/7 1 Historique du document Vers. Date
TP réseaux 4 : Installation et configuration d'un serveur Web Apache
TP réseaux 4 : Installation et configuration d'un serveur Web Apache Objectifs Installer, configurer, lancer et administrer le serveur Web Apache sous Linux Données de base machine fonctionnant sous Linux
Symantec Backup Exec Remote Media Agent for Linux Servers
Annexe I Symantec Backup Exec Remote Media Agent for Linux Servers Cette annexe traite des sujets suivants : A propos de Remote Media Agent Comment fonctionne Remote Media Agent Conditions requises pour
E-mail : [email protected] - Web : http://www.nqicorp.com
- 5, rue Soutrane - 06560 Valbonne Sophia-Antipolis E-mail : [email protected] - Web : http://www.nqicorp.com NQI Orchestra 3.3 - Guide d'installation Linux....................................................................
Capture Pro Software. Démarrage. A-61640_fr
Capture Pro Software Démarrage A-61640_fr Prise en main de Kodak Capture Pro Software et de Capture Pro Limited Edition Installation du logiciel : Kodak Capture Pro Software et Network Edition... 1 Installation
SQL Parser XML Xquery : Approche de détection des injections SQL
SQL Parser XML Xquery : Approche de détection des injections SQL Ramahefy T.R. 1, Rakotomiraho S. 2, Rabeherimanana L. 3 Laboratoire de Recherche Systèmes Embarqués, Instrumentation et Modélisation des
PRODIGE V3. Manuel utilisateurs. Consultation des métadonnées
PRODIGE V3 Manuel utilisateurs Consultation des métadonnées Pour plus d'information sur le dispositif : à remplir par chaque site éventuellement 2 PRODIGE V3 : Consultation des métadonnées SOMMAIRE 1.
Guide de la documentation des produits BusinessObjects XI
Guide de la documentation des produits XI Vous trouverez la dernière version de ce guide et de tous les guides PDF sur le site http://support.businessobjects.com/documentation. Quelques uns de ces guides
TP Bases de données réparties
page 1 TP Bases de données réparties requêtes réparties Version corrigée Auteur : Hubert Naacke, révision 5 mars 2003 Mots-clés: bases de données réparties, fragmentation, schéma de placement, lien, jointure
Programmation des Applications Réparties. Parsers XML DOM et SAX
Programmation des Applications Réparties Parsers XML DOM et SAX Luiz Angelo Steffenel [email protected] Steffenel Programmation des Applications Réparties Master M1-2007-2008 1 Comment
Le Langage De Description De Données(LDD)
Base de données Le Langage De Description De Données(LDD) Créer des tables Décrire les différents types de données utilisables pour les définitions de colonne Modifier la définition des tables Supprimer,
«Vous éditez, nous archivons!»
LE LOGICIEL D'ARCHIVAGE ET DE CONSULTATION DE VOS DOCUMENTS DE GESTION (Graphiques et caractères) alliant PUISSANCE DES OUTILS INTERNET & SIMPLICITE D'UTILISATION «Vous éditez, nous archivons!» LOGISUD
CREATION D UNE EVALUATION AVEC JADE par Patrick RUER (www.mathenvideo.comuv.com)
TABLE DES MATIERES I) Le logiciel JADE 2 II) Etablissements 3 1) Configuation de l établissement 3 2) Importation des classes avec SCONET 4 3) Les groupes d élèves 6 4) Les variables supplémentaires 6
Analyse tarifaire en ligne (TAO) de l'omc
Analyse tarifaire en ligne (TAO) de l'omc L'analyse tarifaire en ligne (TAO) permet d'effectuer des recherches et d'analyser les données tarifaires conservées dans deux bases de données de l'omc, à savoir
TeamViewer 9 Manuel Management Console
TeamViewer 9 Manuel Management Console Rév 9.2-07/2014 TeamViewer GmbH Jahnstraße 30 D-73037 Göppingen www.teamviewer.com Sommaire 1 A propos de la TeamViewer Management Console... 4 1.1 A propos de la
Introduction 3. Niveaux d Utilisateurs..3 Apprendre les fonctions administratives de di Monitoring...4. C H A P I T R E 1: Création de cadres...
Contenu Introduction 3 Niveaux d Utilisateurs..3 Apprendre les fonctions administratives de di Monitoring.....4 C H A P I T R E 1: Création de cadres... 4 Comprendre les cadres de di Monitoring 5 Accès
L'intégration de Moodle à l'université Rennes 2 Haute Bretagne
L'intégration de Moodle à l'université Rennes 2 Haute Bretagne Intervenant : Arnaud Saint-Georges Centre de Ressources Informatiques de l'université Rennes 2 Haute Bretagne Arnaud.Saint-Georges @uhb.fr.
Sage CRM. 7.2 Guide de Portail Client
Sage CRM 7.2 Guide de Portail Client Copyright 2013 Sage Technologies Limited, éditeur de ce produit. Tous droits réservés. Il est interdit de copier, photocopier, reproduire, traduire, copier sur microfilm,
Hébergement WeboCube. Un système performant et sécurisé. Hébergement géré par une équipe de techniciens
Hébergement WeboCube Le service d'hébergement WeboCube a pour but de sécuriser la présence internet grâce à un suivi personnalisé et une maintenance active de votre serveur internet. Un espace de gestion
Microsoft OSQL OSQL ou l'outil de base pour gérer SQL Server
Microsoft OSQL OSQL ou l'outil de base pour gérer SQL Server Suite à mon précédent article concernant MSDE, je me suis rendu compte à partir des commentaires que de nombreux utilisateurs avaient des problèmes
Les méthodes utilisées pour compresser, puis décompresser un fichier pour en faire une archive, pour les débutants.
Les méthodes utilisées pour compresser, puis décompresser un fichier pour en faire une archive, pour les débutants. Bonjour à tous! Nous allons dans ce tutoriel expliquer comment compresser puis décompresser
IMPORTATION, CRÉATION, MANIPULATION, EXPORTATION DE DONNÉES STATISTIQUES
IMPRTATIN, CRÉATIN, MANIPULATIN, EXPRTATIN DE DNNÉES STATISTIQUES Bernard Dupont [email protected] [email protected] Bien que l'analyse et le traitement des données ne soient pas sa vocation
Création d'un site neutre et présentation des éléments de la page d'accueil
Création d'un site neutre et présentation des éléments de la page d'accueil Alkante Page 1/8 Table des matières Préambule... 3 Création d'un site neutre... 3 Rubriques de pages éditoriales...5 Contenu
Le service FTP. M.BOUABID, 04-2015 Page 1 sur 5
Le service FTP 1) Présentation du protocole FTP Le File Transfer Protocol (protocole de transfert de fichiers), ou FTP, est un protocole de communication destiné à l échange informatique de fichiers sur
Qu'est-ce qu'un moteur de recherche. Moteur de recherche sur Internet
Initiation à la navigation sur Internet avec le moteur de recherches Google 1/ 5 Qu'est-ce qu'un moteur de recherche Moteur de recherche sur Internet Un moteur de recherche est un site Internet comme un
EXTRANET STUDENT. Qu'est ce que Claroline?
EXTRANET STUDENT http://extranet.arts2.be http://extranet.artsaucarre.be Les bases de l'utilisation de la plateforme Claroline, l'extranet d'arts² Qu'est ce que Claroline?... 1 Débuter... 2 Créer un compte...
FreeNAS 0.7.1 Shere. Par THOREZ Nicolas
FreeNAS 0.7.1 Shere Par THOREZ Nicolas I Introduction FreeNAS est un OS basé sur FreeBSD et destiné à mettre en œuvre un NAS, système de partage de stockage. Pour faire simple, un NAS est une zone de stockage
Mesurer les performances (CPU) sous Linux
Titre : Mesurer les performances (CPU) sous Linux Date : 22/07/2015 Page : 1/7 Mesurer les performances (CPU) sous Linux Résumé : Il existe des outils permettant de tracer les temps CPU utilisés (profiling).
SQL Server 2012 - Administration d'une base de données transactionnelle avec SQL Server Management Studio (édition enrichie de vidéos)
Présentation 1. Introduction 13 2. Présentation de SQL Server 14 2.1 Qu'est-ce qu'un SGBDR? 14 2.2 Mode de fonctionnement Client/Serveur 16 2.3 Les plates-formes possibles 17 2.4 Les composants de SQL
(Langage de commandes) Les commandes sont données par l'utilisateur grâce au clavier, à partir d'une "invite" ou "prompt" (par exemple "c:\>" )
Système d Exploitation d : MS-DOS MicroSoft Disk Operating System C est un système d exploitation développé par la société Microsoft. Il offre une interface textuelle basée sur un ensemble de commandes.
Manuel de l'utilisateur d'intego VirusBarrier Express et VirusBarrier Plus
Manuel de l'utilisateur d'intego VirusBarrier Express et VirusBarrier Plus Bienvenue dans le manuel de l'utilisateur d'intego VirusBarrier Express et VirusBarrier Plus. VirusBarrier Express est un outil
Sauvegarder automatiquement ses documents
Sauvegarder automatiquement ses documents Par Clément JOATHON Dernière mise à jour : 22/09/2014 Il n'y a rien de pire que de perdre ses documents suite à un problème avec son ordinateur. Qu'ils s'agissent
Configuration d'un annuaire LDAP
Le serveur Icewarp Configuration d'un annuaire LDAP Version 10.3 Juillet 2011 Icewarp France / DARNIS Informatique i Sommaire Configuration d'un annuaire LDAP 1 Introduction... 1 Qu'est-ce que LDAP?...
Télécharger et Installer OpenOffice.org sous Windows
Télécharger et Installer OpenOffice.org sous Windows Version Date Auteur Commentaires 1.00 15/11/2008 Denis Bourdillon Création du document. Mise en forme de texte 1/15 Saison 2008-2009 Table des matières
E-mail : [email protected] - Web : http://www.nqicorp.com
- 5, rue Soutrane - 06560 Valbonne Sophia-Antipolis E-mail : [email protected] - Web : http://www.nqicorp.com NQI Orchestra 3.3 - Guide d'installation Windows.................................................................
Mise en oeuvre d'une base de données mono-utilisateur avec SQLite
Mise en oeuvre d'une base de données mono-utilisateur avec SQLite Utilisation de SQLite dans le logiciel CASSIS Plan Le contexte scientifique avec le logiciel CASSIS La problématique avec Mysql La solution
Cours Modélisation et Programmation avec tableur
Cours Modélisation et Programmation avec tableur Eléments de base du tableur Excel Avertissement : Ce document ne prétend pas être exhaustif et remplacer la documentation d'excel ou l'aide en ligne; son
Projet 2. Gestion des services enseignants CENTRE D ENSEIGNEMENT ET DE RECHERCHE EN INFORMATIQUE. G r o u p e :
CENTRE D ENSEIGNEMENT ET DE RECHERCHE EN INFORMATIQUE Projet 2 Gestion des services enseignants G r o u p e : B E L G H I T Y a s m i n e S A N C H E Z - D U B R O N T Y u r i f e r M O N T A Z E R S i
Date de diffusion : Rédigé par : Version : Mars 2008 APEM 1.4. Sig-Artisanat : Guide de l'utilisateur 2 / 24
Guide Utilisateur Titre du projet : Sig-Artisanat Type de document : Guide utilisateur Cadre : Constat : Les Chambres de Métiers doivent avoir une vision prospective de l'artisanat sur leur territoire.
TP de réseaux : Domain Name Server.
ADJIDO Idjiwa, ARIB El Mehdi, CLOIREC Olivier Groupe 1 TP de réseaux : Domain Name Server. Introduction... 2 Présentation du Système de nom de domaines... 2 Le DNS... 2 L accès aux machines... 2 Le fichier
FileZilla. Sauvegarder son site Guppy à l aide de. Sommaire:
FileZilla http://filezilla.sourceforge.net/ Sauvegarder son site Guppy à l aide de Sommaire: P. 2 Téléchargement et installation P. 3 Paramétrage du transfert P. 3 L'environnement de Filezilla P. Sauvegarde
Qlik Sense Desktop. Qlik Sense 2.0.2 Copyright 1993-2015 QlikTech International AB. Tous droits réservés.
Qlik Sense Desktop Qlik Sense 2.0.2 Copyright 1993-2015 QlikTech International AB. Tous droits réservés. Copyright 1993-2015 QlikTech International AB. Tous droits réservés. Qlik, QlikTech, Qlik Sense,
W4 BPM WORKSPACE. MANUEL DE SUPERVISION FONCTIONNELLE Référence: W4WK_SUPERVISION_020_FR
W4 BPM WORKSPACE MANUEL DE SUPERVISION FONCTIONNELLE Référence: W4WK_SUPERVISION_020_FR Les prochaines mises à jour de ce document seront disponibles sur www.myw4.com W4 BPM WORKSPACE MANUEL DE SUPERVISION
Outils pour la pratique
Cinquième partie Outils pour la pratique 121 CHAPITRE 1 Les bases des séances de TP Avant de lire cettre section, il est suggéré de relire vos notes de cours se rapportant au système d exploitation Unix.
GUIDE D UTILISATION DE L ISU SEPTEMBRE 2013 GUIDE D UTILISATION DU NAVIGATEUR UIS.STAT (VERSION BÊTA)
GUIDE D UTILISATION DE L ISU SEPTEMBRE 2013 GUIDE D UTILISATION DU NAVIGATEUR UIS.STAT (VERSION BÊTA) Publié en 2013 par : Institut de statistiques de l UNESCO C.P. 6128, Succursale Centre-Ville Montréal,
Manuel d'utilisation d'apimail V3
Manuel d'utilisation d'apimail V3 I Préambule Page 3 II Présentation Page 4 III Mise en route Configuration Page 5 Messagerie Serveur smtp Serveur pop Compte pop Mot de passe Adresse mail Laisser les messages
FORMATION PcVue. Mise en œuvre de WEBVUE. Journées de formation au logiciel de supervision PcVue 8.1. Lieu : Lycée Pablo Neruda Saint Martin d hères
FORMATION PcVue Mise en œuvre de WEBVUE Journées de formation au logiciel de supervision PcVue 8.1 Lieu : Lycée Pablo Neruda Saint Martin d hères Centre ressource Génie Electrique Intervenant : Enseignant
BTS SIO SISR3 TP 1-I Le service Web [1] Le service Web [1]
SISR3 TP 1-I Le service Web [1] Objectifs Comprendre la configuration d'un service Web Définir les principaux paramètres d'exécution du serveur Gérer les accès aux pages distribuées Mettre à disposition
