Ecole Technique «Transformation de données documentaires» Poitiers, 14-16 mars 2011. Atelier 1: Sphinx. import, conversion, export de données

Documents pareils
Guide de formation EndNote Web Interface EndNote Web

La recherche avec l interface COLLEGE

Le Sphinx Millenium Modes opératoires Préparer, administrer, Dépouiller les enquêtes

Gestion de références bibliographiques

CAHIER DES CHARGES de la formation : «Excel pour les bibliomètres»

Europresse.com. Pour les bibliothèques publiques et de l enseignement. Votre meilleur outil de recherche en ligne. Guide version 1.

Importation automatique de notice d article de Pubmed dans EndNote

AVANT-PROPOS INTRODUCTION INSTALLATION INSTALLER LE PLUGIN ZOTERO INSTALLER LE MODULE DE CITATION...

Localisation des fonctions

Mendeley, pour gérer sa bibliographie et la partager. Patricia Volland-Nail

Memento de la recherche documentaire en santé

Focus sur : Comparatif de 3 logiciels de gestion des références bibliographiques

Cycle de formation certifiante Sphinx

Recherche bibliographique

EndNote Basic. Un logiciel en ligne pour gérer les références bibliographiques. Sandrine(Wolff(&(David(Vivarès( Définition

Recherche. Instructions d utilisation de ce Tutoriel. Suite d une action. Explication d un exemple, information supplémentaire. Avertissement. Astuce.

Google Analytics - Analysez le trafic de votre site pour améliorer ses performances inclut Universal Analytics (2ième édition)

ZOTERO Un outil gratuit de gestion de bibliographies

Formation continue des personnels URCA. Offre de la Bibliothèque Universitaire

MATHÉMATIQUES ET SCIENCES HUMAINES

La recherche documentaire et la recherche d informations professionnelles. BU Sciences BIU Montpellier PPE 2012

Formation à BCDI abonnement du 27 mars et du 21 avril 2009 LEGTA Dardilly

Recherche et veille documentaire scientifique

Rédiger : le numérique dans la préparation de la thèse

GKR. Geological Knowledge Representation Base de connaissances métallogéniques

Logiciel Le Sphinx Plus 2 version 5. Le Sphinx Développement Chavanod

Initiation à la recherche documentaire

findit.lu Les guides d utilisation Leçon 17

Gestion collaborative de documents

EndNote X.5 Logiciel de gestion bibliographique

Maîtriser l'utilisation des outils bureautiques. Maîtriser le logiciel de traitement de texte - Word. Maitriser le logiciel tableur - Excel

SOMMAIRE Thématique : Bureautique

Veille Internet avec les flux RSS, recherche et veille sur les réseaux sociaux

ENDNOTE X2 SOMMAIRE. 1. La bibliothèque EndNote 1.1. Créer une nouvelle bibliothèque 1.2. Ouvrir une bibliothèque EndNote 1.3. Fermer une bibliothèque

EndNote Web. Quick Reference Card THOMSON SCIENTIFIC

Un outil open source de gestion de bibliographies

A l Aise Web - Liens sponsorisés

Les modes de recherche sur le Web 2.0

Je catalogue, tu FRBRises, il/elle googlise. L évolution des catalogues et les bibliothécaires Vendredi 29 mars 2013 Manufacture des tabacs

Historique. Architecture. Contribution. Conclusion. Définitions et buts La veille stratégique Le multidimensionnel Les classifications

Panorama des contenus

Catalogue des formations Médecine et paramédical

Les documents primaires / Les documents secondaires

Initiation à la bureautique

3 logiciels «gratuits» pour gérer sa bibliographie

Le travail collaboratif : guide des services

FORMATION EXCEL NIVEAU 2

PUBMED. Vous pouvez rentrer l adresse de ce support dans vos favoris :

«Dire et écrire» pour réaliser une composition en travail collaboratif en géographie. Agnès Dullin, lycée J. Racine 20 rue du Rocher, Paris

EndNote : outil de gestion bibliographique

Diigo : fonctions avancées

Manuel d utilisation de Zotero

FORMATION EXCEL NIVEAU 2

Guide de recherche documentaire à l usage des doctorants. Partie 1 : Exploiter les bases de données académiques

EndNote X7.

Mode d emploi. Alex ALBER Université F. Rabelais (Tours) / UMR C.I.T.E.R.E.S Chercheur associé au Centre d Etudes de l Emploi

Découvrez tout l univers des enquêtes et de l analyse de données

1. Introduction / Identification

PRÉSENTATION DE LOGICIELS DE GESTION DE RÉFÉRENCES BIBLIOGRAPHIQUES

Commerce International. à référentiel commun européen

PREMIER MINISTRE SECRÉTARIAT GÉNÉRAL DU GOUVERNEMENT

Chaîne opératoire de réalisation d une base de données. ANF «Comment concevoir une base de données» (29-30/01/2015)

Une passion, une formation, un métier... pour votre avenir

: seul le dossier dossier sera cherché, tous les sousdomaines

Programme de la formation en référencement LYON/PARIS 2015

Atelier 3 Gestion bibliographique - niveau 1. Principes de la bibliographie et prise en main de Zotero

Base de données bibliographiques Pubmed-Medline

DES OUTILS DE RECHERCHE À VOTRE MESURE, LA SUITE JURIBISTRO MD DU CAIJ : COMMENT MIEUX EXPLOITER CES OUTILS? PLAN DE FORMATION

Maitriser Zotero en 10 étapes : comment faire une bibliographie

Initiation à Mendeley AUT2012

Recherche bibliographique avec PubMed/MedLine

Synthèse de la journée d'animation pédagogique régionale du 9 février 2011

PLATEFORME DE GESTION DE CONGRÈS SCIENTIFIQUES

ENDNOTE WEB POWERED BY THOMSON REUTERS WEB OF KNOWLEDGE SM

Les nouveaux sites documentaires de l IRD

Comment automatiser la création d index multiples avec Word Paul-Henri Dumas - URFIST

Concepteur réalisateur graphique

Europresse.com. Pour bibliothèque d enseignement Pour bibliothèque publique. Consulter facilement la presse. Guide version 1.

MENER UNE RECHERCHE D INFORMATION

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données

KIELA CONSULTING. Microsoft Office Open Office Windows - Internet. Formation sur mesure

Les utilisations pédagogiques du Tableau Numérique Interactif (TNI) dans l enseignement d Économie-Gestion :

Tableaux comparatifs entre éditions Standard, Professionnelle, Entreprise

BUREAUTIQUE. 1 Journée. Maîtriser les fonctions de base du logiciel

4. Personnalisation du site web de la conférence

ETUDE DE PERCEPTION PRODUIT

Quelques exemples d utilisation de documents pédagogique multimédia pris en formation de formateurs à la méthodologie documentaire.

LEXIQUE DES TERMES DOCUMENTAIRES LES PLUS COURANTS

Sommaire Installation... 3 Alimentation de la base Zotero...6 Gestion de la base Zotero... 9 Création d'une bibliographie... 17

Guide d'utilisation. Repérez plus d'information avec nos nouvelles options de recherche plus puissantes!

La Veille Scientifique

... Cahier des charges Site Internet Office de Tourisme Lesneven - Côte des Légendes MAITRE D OUVRAGE

NORMES DE PRÉSENTATION DES MANUSCRITS

Pourquoi une stratégie de sites dédiés? Laurent-Pierre GILLIARD AEC 14/06/2007 Vincent MOREAU SYSTONIC 09/06/2006

BREVE PRESENTATION DU SERVICE «EDITEURS ACADEMIQUES ENLIGNE» ELISABETH DE PABLO (MSH- ESCOM, 1997)

PLATEFORME DE GESTION DE CONGRÈS SCIENTIFIQUES. 12 mars 2015

PRISE EN MAIN RAPIDE

Concevoir sa stratégie de recherche d information

Transcription:

Ecole Technique «Transformation de données documentaires» Poitiers, 14-16 mars 2011 Atelier 1: Sphinx import, conversion, export de données Introduction à la Recherche d'ist via le Web INRA Grignon, 03/2011 1

Plan de l atelier 1 - Sphinx Sphinx: contexte général d utilisation du logiciel Import de données: corpus Wos tabulé corpus Wos balisé (plain text) corpus Pubmed/Medline balisé (tags) Traitements des données importées (recodage de nouvelles variables): analyses lexicale: exples mc thématiques et pays agrégation de données tableaux croisés Export de données format fiche format tabulé

Sphinx contexte général d utilisation (1/2) import de données libres ou structurées de différentes natures : textuelles, numériques, codées,.. production d analyses quantitatives (nombres occurrences) et qualitatives (analyses lexicales), des bilans statistiques, des analyses multivariées (An. factorielles multiples) contexte d utilisation (inra): analyse de contenus, (bibliométrie) pas de gestion bibliographique

Sphinx - contexte général d utilisation (2/2) Chaîne type de traitement des données Bdd bibliographiques (Wos, Medline, ProdInra, références aux formats: tabulé, balisé, annoté SPHINX Import: analyse format données typage données Création de la base Sphinx (questionnaire) Analyse des données (variables) production de résultats Exploitation / diffusion des résultats : rapport export Cartographie (atelier 5)

Sphinx: import corpus Wos tabulé - étape 1/4: sélection du fichier sélection type fichier de données contrôle rapide de la structure

Sphinx: import corpus Wos tabulé - étape 2/4: gestion des séparateurs gestion des séparateurs entre champs / notices repérage des intitulés de champs

Sphinx: import corpus Wos tabulé - étape 3/4: typage des variables TI = type «texte» pour analyses lexicales attribution des types : texte / numérique / codé / fermé / aux différentes variables: détermine les traitements possibles

détection automatique de contenus non-conformes aux types de variables rectification par l utilisateur Sphinx: import corpus Wos tabulé - étape 4/4: détection / rectification d erreurs BP / EP = lettres dans une variable «numérique» Enregistrement base Sphinx = questionnaire

Sphinx: import corpus Wos balisé - étape 1/5: préparation du corpus (pré-import Sphinx) lancer la macro word à partir de Sphinx pour baliser le corpus

Sphinx: import corpus Wos balisé - étape 2/5: préparation du corpus (éxécution de la macro word) <balises>

Sphinx: import corpus Wos balisé - étape 3/5: validation des balises corpus balisé ou annoté? comment sont écrites les balises?

Sphinx: import corpus Wos balisé - étape 4/5: fonction des intitulés balisés analyse Sphinx par défaut correction utilisateur FN et VR: ne pas considérer comme balis PT identifie une nouvelle notice confirmer / modifier le choix automatique des balises

Sphinx: import corpus Wos balisé - étape 5/5: typage des variables confirmer / modifier le choix automatique des balises Procédure commune au différents formats d imports

Sphinx: import Pubmed / Medline - étape 1/2: pubmed > endnote

Sphinx: import Pubmed / Medline - étape 2/2: EndNote > Sphinx Import de données externes : Idem format tabulé Wos (diapo 5)

Sphinx: analyse lexicale - démarche générale (dictionnaires thématiques) Index du lexique Classés par occurrences Ordre alphabétique Racine ------------------------------- - MCa - MCb - MCc - MCd - - - - - MCn Sélection de mots-clés (thèmes, pays,...) MC thématique 1 MC thématique 2 MC thématique 3 Enregistrement dans des dictionnaires Dictionnaire 1 Dictionnaire 2 Dictionnaire 3 Création (recodage) de nouvelles variables

Sphinx: analyse lexicale TI-AB-DE - étape 1/3: fusion des variables TI+AB+DE TI AB DE Recodage d une nouvelle variable TI / AB / DE Analyse lexicale intérêt: analyse lexicale globale sur les contenus de TI, AB et DE

Sphinx: fusionner des variables - étape 1/3: fusion des variables TI+AB+DE (imp. écran)

Sphinx: analyse lexicale TI-AB-DE - étape 2/3: recherche de termes dans l index

Sphinx: analyse lexicale TI-AB-DE - étape 3/3: regroupement des mots dans 1 dictionnaire 1ère méthode: les termes appartenant à une thématique sont identifiés dans une liste thématique mais restent sélectionnables séparément. Exple: tous les mots contenant water sont listés à plat dans le dictionnaire «water» Syntaxe du dictionnaire de regroupement: Intérêt: regrouper dans un même tableau tous les termes définissant un sujet

Sphinx: analyse lexicale TI-AB-DE - étape 3/3: ajout des mots dans 1 dictionnaire 2 ème méthode: tous les termes apparentés sont regroupés automatiquement sous un terme générique. Exple: tous les mots contenant water sont regroupés sous «water» Syntaxe du dictionnaire de regroupement: #water=water*=freshwater=groundwater=groundwaters=wastewater=water =waterlogging=watermarks=waters=watershed=watersheds Intérêt: Synthétiser plusieurs environnements thématiques dans un même tableau, chaque domaine étant étiqueté par un terme générique.

Sphinx: analyse lexicale C1 - repérage des noms de pays (1/2) Index des termes de C1 Ajout des pays Marquage des pays Dictionnaire des noms de pays

Sphinx: analyse lexicale C1 - tableau des noms de pays (2/2) Index des termes de C1 Recodage Tableau d effectifs de la variable «pays»

Sphinx: analyse lexicale C1 - agrégation des pays par zones géographiques (2/2) Index des termes de C1 Pays par zones géo.

mc Sphinx: tableaux croisés d effectifs équipes ou Cartographie gephi (voir atelier 5)

Sphinx: formats d export - (1/2) choix du format: tabulé ou fiche

Sphinx: formats d export - (2/2) filtrer les données exportées un profil est construit par sélection et combinaison de modalités choisies dans les variables