Introduction. Pourquoi une suite? Boîte à outils, mais pas boîte noire

Documents pareils
Introduction à la méthodologie de la recherche

INF 1250 INTRODUCTION AUX BASES DE DONNÉES. Guide d étude

Introduction à la B.I. Avec SQL Server 2008

Pourquoi l apprentissage?

MÉTHODOLOGIE PROJET SYSTÈME D INFORMATION DÉCISIONNEL BI - BUSINESS INTELLIGENCE. En résumé :

HERMES SYSTEM et BEWISE souhaitent vous offrir les meilleures compétences.

La Geo-Business Intelligence selon GALIGEO avec 26/10/2005 1

données en connaissance et en actions?

Document d accompagnement. de la 1 re à la 8 e année. Exemples de tâches et corrigés. 1 re année Tâche Corrigé... 7 Tâche Corrigé...

UNE FORMATION POUR APPRENDRE À PRÉSENTER DES DONNÉES CHIFFRÉES : POUR QUI ET POURQUOI? Bénédicte Garnier & Elisabeth Morand

Groupe Eyrolles, 2006, ISBN :

Physique Chimie. Utiliser les langages scientifiques à l écrit et à l oral pour interpréter les formules chimiques

Mises en relief. Information supplémentaire relative au sujet traité. Souligne un point important à ne pas négliger.

ANNEXE 4. Réaliser un diagnostic de sécurité Principales méthodes de collecte d information. (Module 3, partie I, section 2.5)

THOT - Extraction de données et de schémas d un SGBD

EXAMEN CRITIQUE D UN DOSSIER TECHNIQUE

Banque d outils d aide à l évaluation diagnostique

STATUTS DE LA SECTION DE LANCY DU PARTI SOCIALISTE SUISSE

Bernard FOURNIER. Chargé de cours au Département de Sciences politiques. Faculté de Droit. Université de Liège.

Septième cycle GUIDE POUR LE SUIVI DES PROJETS, L ÉTABLISSEMENT DE RAPPORTS, LA RÉVISION ET LA PROLONGATION DE PROJETS

Master CCI. Compétences Complémentaires en Informatique. Livret de l étudiant

S3CP. Socle commun de connaissances et de compétences professionnelles

S8 - INFORMATIQUE COMMERCIALE

DiFiQ. Diplôme Finance Quantitative. Une formation en partenariat. Ensae Dauphine Bärchen

Table des matières. Comment utiliser efficacement cet ouvrage pour en obtenir les meilleurs résultats?... 5

Parlez-vous chinois? Allumer l appareil. Commencer. Le premier écran de l application

Décrets, arrêtés, circulaires

Gestion collaborative de documents

TRANSPORT ET LOGISTIQUE :

OBSERVATOIRE IMMOBILIER D ENTREPRISE

LA NÉGOCIATION COMMERCIALE EN PRATIQUE

Animer une association

TERMES DE RÉFÉRENCE RELATIFS A LA «FORMATION PROFESSIONNELLE EN ORACLE»

TERMES DE RÉFÉRENCE AXE : FORMATION CREATION ET GESTION DE BASES DE DONNEES

REFERENTIEL DE CERTIFICATION

BI2 : Un profil UML pour les Indicateurs Décisionnels

Scrum Le guide pratique de la méthode agile la plus populaire 3 e édition Claude Aubry 320 pages Dunod, 2013

INDUSTRIALISATION ET RATIONALISATION

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION

l accueil des usagers

Nom de l application

Gestion du parc informatique matériel et logiciel de l Ensicaen. Rapport de projet. Spécialité Informatique 2 e année. SAKHI Taoufik SIFAOUI Mohammed

Accélérer l agilité de votre site de e-commerce. Cas client

Mini-Rapport d Audit basé sur la méthode d analyse MEHARI

Introduction à Business Objects. J. Akoka I. Wattiau

Intégration du référentiel hydrographique Bd Carthage dans le Système d Information de l agence de l eau Adour Garonne

NOM : Prénom : Date de naissance : Ecole : CM2 Palier 2

Atelier Gestion des incidents. Mardi 9 Octobre 2007

CATALOGUE FORMATIONS DOMAINE Bases de données

La pratique de la gestion des services. Lier les composants techniques avec les services d opérations dans la CMDB

THÉORIE ET PRATIQUE DE L AUDIT INTERNE

Manuel Utilisateur. Boticely

agiles Les services et les processus Retours d expérience basés sur ITIL v3 études, développement & intégration

DEMANDE D INFORMATION RFI (Request for information)

Attestation de maîtrise des connaissances et compétences au cours moyen deuxième année

Fiche : lectures obligatoires

Entrepôt de données 1. Introduction

Jedox rafraîchit les rapports du fabricant de boissons MBG

«L utilisation d un intranet permet-il la mise en place d un travail collaboratif et/ou coopératifs? Pour quelles compétences?»

LECTURE CRITIQUE. Accompagner les enseignants et formateurs dans la conception d une formation en ligne

L INTELLIGENCE COLLECTIVE ORIENTÉE PROJET

LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN

LE RÔLE DE LA STATISTIQUE DANS UN PROCESSUS DE PRISE DE DÉCISION

A.E.C. GESTION DES APPLICATIONS TECHNOLOGIE DE L'INFORMATION LEA.BW

Programme Pédagogique National du DUT «Gestion administrative et commerciale» Présentation de la formation

En direct de la salle de presse du Journal virtuel

Statuts de la «ChâBal» Maison de Quartier et Jardin Robinson de Châtelaine-Balexert

PRIX DE L INITIATIVE NUMERIQUE CULTURE, COMMUNICATION, MEDIAS.

GESTIONNAIRE DES DONNEES SIG

Software Application Portfolio Management

Génie logiciel avec UML. Notions sur le langage UML adapté pour les cours du programme Techniques de l informatique

L INTEGRATION D UN NOUVEAU COLLABORATEUR

Niveau linguistique Berlitz 1 Niveau A1 du CECRL

Stella-Jones pilier du secteur grâce à IBM Business Analytics

Cycle de vie du logiciel. Unified Modeling Language UML. UML: définition. Développement Logiciel. Salima Hassas. Unified Modeling Language

4.2 Unités d enseignement du M1

BUSINESS INTELLIGENCE

CONSEIL & FORMATION EN MANGEMENT ET RESSOURCES HUMAINES. Du sens pour progresser et réussir ensemble. Coaching d'équipe

TP2_1 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3

INTRODUCTION GENERALE...1 LA CONNEXION ODBC :...1. CONNEXION AU TRAVERS D EXCEL(tm)...6. LOGICIEL QUANTUM GIS (Qgis)... 10

6 ème FONCTIONS. Pratiquer une démarche scientifique et technologique. Capacités

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données

INTRODUCTION AUX BASES de DONNEES

PostgreSQL. Formations. SQL avancé Calendrier... 18

ÉVALUATION DES PRODUITS COMMERCIAUX OFFRANT DES CAPACITÉS

QUESTIONS. décembre 2014

Schéma relationnel et contraintes d intégrité : le cas ConduiteAuto

RÈGLEMENT SUR L ÉVALUATION DES PASSIFS DE NATURE ACTUARIELLE

Gestion de production

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21

SIMULER ET CONCEVOIR LE TRAVAIL FUTUR

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement

Activités. Boîte à idées pour remplir la fiche de poste * Direction. Animation d équipe et organisation du travail. Conduite de projets

L évaluation de la performance de la communication media

ARRETE n 333 CM du 10 avril 2006 portant fixation du tarif des huissiers en matière civile et commerciale. (JOPF du 20 avril 2006, n 16, p.

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Système d information pour la gestion d un réseau d Université

La classification automatique de données quantitatives

Statuts. Article I Désignation

Séminaire éducation Focus Rythmes scolaires Compte-rendu 11 mars 2014

Transcription:

Pourquoi une suite? Introduction Ce nouvel ouvrage fait suite à «Traiter des données historiques» paru en 2001 dont il se veut le prolongement et un complément. Plusieurs sollicitations ont concouru pour nous remettre à l ouvrage. Ce furent d abord des comptes rendus de lecture dans lesquels les auteurs pointaient l absence de telle ou telle méthode qu ils jugeaient fertile dans le champ historique. Nous ne pouvions qu être réceptifs à ces suggestions, mais le périmètre que nous nous étions fixés à l époque pour ce premier ouvrage obéissait à la règle suivante : n aborder que des méthodes et outils que nous avions expérimentés dans le cadre de nos enseignements universitaires. À partir de là, l idée d une suite a commencé à cheminer et a pris forme pour répondre, d abord, aux besoins des étudiants qui exploraient des chantiers historiques ouverts récemment. Ce fut aussi la lecture du livre de Claire Lemercier et Claire Zalc, Méthodes quantitatives pour l'historien qui ouvrait de nombreuses pistes et l appétit pour les explorer. Cet ouvrage résulte d une collaboration bicéphale : histoire et mathématiques. La partie historique du tandem avait des sources et soumettait hypothèses et questionnements... à la partie «matheuse». Laquelle, pour y répondre, suggérait outils et méthodes, et s empressait de les mettre en œuvre. Restait alors la nécessité de décrire toutes ces démarches, en les illustrant au besoin d exemples pédagogiques, sous une forme comestible pour des historiens. Boîte à outils, mais pas boîte noire Notre ambition est d offrir une panoplie de méthodes, en exposant pour chacune : 9

Les concepts de base sous-jacents, avec le vocabulaire qui les décrit. Au fil du texte, nous avons choisi de donner des explications aussi simples que possible en reléguant, pour les lecteurs intéressés, dans des «enclos mathématiques» des présentations plus formalisées (i.e. avec des formules mathématiques). Le type des données qu elles traitent et le formatage approprié pour être soumis à un logiciel. L usage pratique détaillé d un logiciel pour opérer les traitements. Les aides à l interprétation des résultats. En bref, notre souci a été de concilier théorie et pratique Chacune des parties correspond à une famille d outils : La première partie est consacrée à des compléments sur les bases de données. Le premier chapitre s adresse à des lecteurs désireux d organiser et de mettre éventuellement en ligne une base de données historiques. Le second expose comment extraire la substantifique moelle d une base de données via l interrogation en langage SQL. La deuxième partie est vouée à l analyse de données multidimensionnelles. Autrement dit, comment traiter des données qui décrivent les individus statistiques par de nombreuses variables (dans le premier ouvrage, nous nous étions limités à 2). Sont étudiées les méthodes de classification, l Analyse en Composantes Principales (pour des variables quantitatives), l Analyse des Correspondances Multiples (pour les variables qualitatives). À ces méthodes exploratoires, nous avons adjoint une méthode de nature «explicative» : la régression logistique. La temporalité s introduit dans la troisième partie sous l appellation d analyse longitudinale. Le chapitre Analyse des Séquences vise à comparer et classifier des parcours temporels décrits comme une succession d états. Le chapitre Event History 10

Analysis s intéresse au rythme de propagation d un événement au sein d une population. La quatrième partie est consacrée à l Analyse des Réseaux Sociaux, application de la théorie mathématique des graphes à l étude de liens entre acteurs sociaux. Dans cette partie, nous nous sommes limités à trois thèmes : la cohésion, la centralité, les rôles et positions. La cinquième partie présente un SIG et l usage que peut en faire un historien. Nous présentons alors le géoréférencement, la vectorisation des fonds et l analyse des données. L acquisition d une «boîte à outils» n implique pas l usage de tous les outils de la boîte. Nous nous sommes donc efforcés de rendre, autant que faire se peut, indépendants les différents chapitres afin qu un lecteur intéressé par telle méthode puisse trouver dans le chapitre qui lui est consacré tous les éléments nécessaires. Ce parti pris de rédaction a une contrepartie : d inévitables redites dans certains chapitres. Et des exceptions : nous avons dû commettre quelques infractions à cette règle : Le chapitre III «Nuage de points» est une introduction utile aux trois méthodes d analyse multidimensionnelle présentées dans cette partie. Le chapitre IV d introduction au logiciel de Statistique R est indispensable pour aborder les chapitres V, VI, VII, VIII, IX, X qui recourent systématiquement à ses services. Le chapitres XI d introduction à la théorie des graphes et à l analyse des réseaux, le chapitre XII de présentation du logiciel Pajek, sont requis pour les autres chapitres de cette partie. Les méthodes de classification exposées au chapitre V sont utilisées dans les chapitres IX et XV. 11

Les exemples Chaque méthode est illustrée par le traitement complet d un ou deux exemples relevant du champ historique. Certains, comme le réseau des familles florentines, sont bien connus et peuvent être considérés comme du domaine public, d autres sont issus de données originales. Les deux bases de données servant d exemple au chapitre II sont interrogeables via des requêtes SQL sur le site : http://jacquescellier.fr/histoire Tous les fichiers sources des exemples (formats divers : excel, R, pajek ) y sont aussi téléchargeables, ainsi que d autres documents. Les logiciels Contrairement aux méthodes présentées dans le premier ouvrage qui pouvaient être mises en œuvre avec des logiciels dits de «bureautique», les méthodes exposées dans ce deuxième tome, requièrent des logiciels spécialisés. Pour d évidentes raisons, nous nous sommes orientés vers des logiciels, sinon libres au sens «officiel», mais du moins gratuit. Parfois, le choix s est imposé «naturellement» : MySQL pour la gestion des bases de données, R pour tous les traitements statistiques abordés dans les parties II et III. Pour l analyse des réseaux sociaux et la cartographie, le choix fut plus épineux, mais il fallut bien trancher. Les sujets non abordés Avec une boîte à outils se pose naturellement le choix des outils dont on veut la garnir. Faute d opérer une sélection toujours discutable mais nécessaire, il ne s agit plus d une boîte mais d un entrepôt Il existe donc des thèmes auxquels nous avons délibérément renoncé pour des raisons variées : absence de compétence de notre part sur le sujet, trop grande complexité de mise en œuvre, nécessité de longs développements 12

pour les aborder, parfois l ombre d un doute sur la solidité des fondations, ou tout simplement l existence d ouvrages traitant très bien du sujet. C est ainsi, par exemple, que nous avons renoncé à présenter des outils utilisés pour les méthodes d analyse de discours ou pour l édition partagée des textes, comme ARCANE, par exemple. 13