La gestion des données

Documents pareils
Chapitre 1 : Introduction aux bases de données

Chapitre 9 : Informatique décisionnelle

Business Intelligence : Informatique Décisionnelle

et les Systèmes Multidimensionnels

Entrepôt de données 1. Introduction

Le terme «ERP» provient du nom de la méthode MRP (Manufacturing Ressource Planning) utilisée dans les années 70 pour la gestion et la planification

Méthodologie de conceptualisation BI

Simplifier la gestion de l'entreprise

Bases de Données Avancées

La gestion des données de référence ou comment exploiter toutes vos informations

Guide de configuration de SQL Server pour BusinessObjects Planning

En synthèse. HVR pour garantir les échanges sensibles de l'entreprise

Un datawarehouse est un entrepôt de données (une base de données) qui se caractérise par des données :

Intelligence Economique - Business Intelligence

Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation

Business & High Technology

Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise.

En savoir plus pour bâtir le Système d'information de votre Entreprise

Fiche méthodologique Rédiger un cahier des charges

Les bases de données Page 1 / 8

Contrôle interne et organisation comptable de l'entreprise

Objectif. Participant. Prérequis. Oracle BI Suite EE 10g R3 - Développer des référentiels. 5 Jours [35 Heures]

Introduction à la B.I. Avec SQL Server 2008

L information et la technologie de l informationl

DOSSIER SOLUTION CA ERwin Modeling. Comment gérer la complexité des données et améliorer l agilité métier?

Enquête 2014 de rémunération globale sur les emplois en TIC

PROGRAMME DU CONCOURS DE RÉDACTEUR INFORMATICIEN

Contexte : «l e-business» TECHNIQUES DE MARKETING EN LIGNE. Contexte : «l e-business» Création de valeur 02/02/12

Module 0 : Présentation de Windows 2000

Annuaires LDAP et méta-annuaires

CHAPITRE 1. Introduction aux bases de données

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

AXIAD Conseil pour décider en toute intelligence

Formation Méthode MDM. Architecture et procédés de modélisation des données de référence

Le rôle croissant de la mobilité au travail

Concepts et définitions

POLITIQUE DE BIOSÉCURITÉ

Prise en main du BusinessObjects XI R2 Service Pack 2/ Productivity Pack

La problématique. La philosophie ' ) * )

Bases de Données. Stella MARC-ZWECKER. Maître de conférences Dpt. Informatique - UdS

Ici, le titre de la. Tableaux de bords de conférence

Université du Québec à Trois-Rivières Politique de gestion des documents actifs, semi-actifs et inactifs de l'u.q.t.r.

Gestion de la Relation Client (GRC)

IBM Software Big Data. Plateforme IBM Big Data

CONCEPTION Support de cours n 3 DE BASES DE DONNEES

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)

ITIL V3. Exploitation des services : Les fonctions

Thème 5. Proposition d'une activité d'exploration élève : Micro-trottoir «Qu'est-ce qu'une entreprise?»

Communiqué de Lancement

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales

Base de l'informatique. Généralité et Architecture Le système d'exploitation Les logiciels Le réseau et l'extérieur (WEB)

Workflow/DataWarehouse/DataMining LORIA - Université d automne Informatique décisionnelle - L. Mirtain 1

ManageEngine IT360 : Gestion de l'informatique de l'entreprise

URBANISME DES SYSTÈMES D INFORMATION

ITIL : Premiers Contacts

Cédric Gendre Inra, ESR Toulouse

Prestations d audit et de conseil 2015

ÉCONOMIE ET GESTION LYCÉES TECHNOLOGIQUE ET PROFESSIONNEL

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

Les Entrepôts de Données. (Data Warehouses)

INF 1250 INTRODUCTION AUX BASES DE DONNÉES. Guide d étude

Projet : Réalisation d une base de. données. Sujet : Gestion des ressources humaines. Logiciel : Microsoft Access

Windows Server Chapitre 4 : Active Directory Gestion des utilisateurs, des ordinateurs et des groupes

Nouveau Web Client marquant, Cumulus Video Cloud, optimisations de la base de données, et plus..

Qlik Sense Desktop. Qlik Sense Copyright QlikTech International AB. Tous droits réservés.

Architecture d'entreprise : Guide Pratique de l'architecture Logique

UE 8 Systèmes d information de gestion Le programme

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours

WHITE PAPER Une revue de solution par Talend & Infosense

CONSEIL DE L'EUROPE COMITÉ DES MINISTRES RECOMMANDATION N R (87) 15 DU COMITÉ DES MINISTRES AUX ÉTATS MEMBRES

Bases de Données. Plan

MASTER I : Responsable en Gestion Métiers du Management Commercial Titre RNCP II

OASIS Date de publication

Annexe : La Programmation Informatique

Théories de la Business Intelligence

Les PGI. A l origine, un progiciel était un logiciel adapté aux besoins d un client.

Introduction : présentation de la Business Intelligence

Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION. Mentions Ingénierie des Systèmes d Information Business Intelligence

Annexe sur la maîtrise de la qualité

Windows Server Chapitre 3 : Le service d annuaire Active Directory: Concepts de base

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION

Base de données clients outil de base du CRM

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

Conservation des documents numériques

Programme «Analyste Programmeur» Diplôme d état : «Développeur Informatique» Homologué au niveau III (Bac+2) (JO N 176 du 1 août 2003) (34 semaines)

Nouveautés FDS Pour créer des équipements 2D et les publier à partir d'autocad

INDUSTRIALISATION ET RATIONALISATION

Business Intelligence avec SQL Server 2012

Présentation du module Base de données spatio-temporelles

Développement spécifique d'un système d information

[ Sécurisation des canaux de communication

Accélérateur de votre RÉUSSITE

Nom-Projet MODELE PLAN DE MANAGEMENT DE PROJET

RÉFLEXION STRATÉGIQUE QUANT À LA MISE EN PLACE D'UN PROJET E-BUSINESS

Urbanisation des Systèmes d Information Architecture d Entreprise. 04 Architecture du SI : identifier et décrire les services, structurer le SI

360 feedback «Benchmarks»

Document d accompagnement pour le référentiel national du C2i niveau 2 Métiers de l environnement et de l aménagement durables

BI2B est un cabinet de conseil expert en Corporate Performance Management QUI SOMMES-NOUS?

Gestion Electronique des Documents et la qualité documentaire au cœur du développement durable.

SYSTEME INFORMATIQUE DES DECHETS INDUSTRIELS ET DANGEREUX «SIDID «Sommaire

Transcription:

Faculté Administration et échanges internationaux Master 1 - AEI Spécialité Commerce Electronique Technologies des systèmes d information Polycopie 2015/2016 Page 1

Objectifs du chapitre Décrire les notions liées à l'organisation des fichiers et les problèmes posés par la gestion des données lorsqu'elles sont exploitées selon des modalités informatiques traditionnelles d'organisation technique en fichiers. Décrire l'organisation de l'information dans un système de gestion de base de données et identifier les spécificités des principaux modèles de base de données. Appliquer les principes importants dans la conception d'une base de données. Identifier les tendances en matière de bases de données. Définir les principaux défis posés par la gestion des données et les solutions applicables. Page 2

Plan du chapitre Organisation des données selon des modalités traditionnelles d exploitation des fichiers Gestion des données par l utilisation d une base de données Création d une base de données Tendance en bases et exploitation de données Nouvelles possibilités Page 3

Organisation des données selon des modalités traditionnelles d exploitation des fichiers Un système d'information efficace doit fournir aux utilisateurs une information disponible en temps voulu, fiable et pertinente. Une information est pertinente lorsqu'elle est utile et adaptée au travail à effectuer et aux décisions à prendre. Grâce à des fichiers organisés et entretenus de manière adéquate, les entreprises stockent les données dont les utilisateurs ont besoin pour les consulter, les modifier ou éventuellement les effacer. Notions et termes liés à l'organisation des fichiers La gestion informatique des données suppose que celles-ci soient numérisées. Le bit est l'unité élémentaire de données que peut traiter un ordinateur (un bit égale un signal binaire, ou «binary digit», représenté couramment par l'alternative duale : valeur 1 ou valeur 0). L'échelon de représentation suivant est l'octet («byte» en anglais), qui représente un caractère (chiffre, lettre, etc.) dans une combinaison de huit bits, d'où l'appellation «octet». Le regroupement de caractères en un mot, un groupe de mots ou en un nombre complet se nomme «champ» ou «zone». Le regroupement de champs connexes (nom de l'étudiant, son adresse, son cursus, etc.) constitue un enregistrement. Page 4

Organisation des données selon des modalités traditionnelles d exploitation des fichiers Un groupe d'enregistrements du même type forme un fichier. Cette organisation se poursuit jusqu'aux bases de données (voir figure 3.1).11 y a des fichiers permanents ou de référence (par exemple, les fichiers «étudiants», «professeurs», «cours»), des fichiers mouvements qui contiennent les données des transactions (par exemple, les fichiers «absences», «notes», «plannings») et des fichiers historiques qui contiennent les données des périodes clôturées. Figure 3.1 - Hiérarchie des données Page 5

Organisation des données selon des modalités traditionnelles d exploitation des fichiers Problèmes posés par le cadre traditionnel d'exploitation des fichiers La plupart des organisations se sont informatisées graduellement, application après application. Les systèmes avaient tendance à se développer indépendamment les uns des autres, sans tenir compte d'un plan directeur ni d'une structuration homogène des données. Chaque application (voir figure 3.3) était un ensemble homogène constitué de programmes organisés en chaînes de traitements associées à des fichiers structurés spécifiquement pour cette application. Fichiers dérivés Fichier maître éléments de données de A à Z Comptabil ité Utilisat eurs Programme D applicatio n 1 A B C D Finances Utilisat eurs Programme D applicatio n 2 A B D E Ventes et Marketing Utilisat eurs Programme D applicatio n 3 A B E G Fabricati on Utilisat eurs Programme D applicatio n 4 A B F G Figure 3.3 : Traitement traditionnel des fichiers Page 6

Organisation des données selon des modalités traditionnelles d exploitation des fichiers Redondance et incohérence des données On parle de «redondance des données» lorsque celles-ci sont stockées dans des fichiers différents. C'est le cas quand les divisions, les secteurs fonctionnels et les groupes d'une même organisation recueillent indépendamment les uns des autres les mêmes données dans des formats structurés différemment. La redondance des données entraîne un gaspillage des ressources de stockage et mène à l'incohérence des données, où les mêmes attributs peuvent avoir différentes valeurs. Par exemple, le changement d'adresse du client Dupont peut avoir été actualisé dans une seule des trois applications, mais pas dans les deux autres. Interdépendance des données et des programmes L'interdépendance des données et des programmes est le couplage, la relation étroite qui se crée entre la structuration des données stockées dans les fichiers et les programmes nécessaires pour les mettre à jour et les entretenir. Tous les programmes doivent décrire l'emplacement et la nature des données avec lesquelles ils travaillent. Dans un cadre traditionnel d'exploitation des fichiers, pour toute modification apportée aux données, il faut effectuer un changement dans les programmes qui y ont accès. Page 7

Organisation des données selon des modalités traditionnelles d exploitation des fichiers De telles modifications de programmation peuvent coûter des millions d'euros lorsqu'on met en application des programmes qui exigent une révision des données. Manque de souplesse Un système de fichiers traditionnel peut produire des rapports périodiques si l'on déploie des efforts de programmation adéquats, mais il ne peut créer facilement et rapidement des rapports ponctuels et inédits. Les informations demandées se trouvent quelque part dans le système, mais elles sont trop difficiles à récupérer. Pour regrouper les données exigées dans un nouveau fichier de travail nécessaire à la production d'un rapport ad hoc, il faudrait mobiliser plusieurs programmeurs pendant un temps conséquent. Manque de sécurité Puisqu'il y a peu de contrôle cohérent dans ce type de gestion des données, l'accès à l'information et sa diffusion sont difficilement contrôlables. La fiabilité des données de synthèse peut être fortement mise en cause. Page 8

Organisation des données selon des modalités traditionnelles d exploitation des fichiers Manque de disponibilité et problèmes de partage des données Puisque les informations contenues dans différents fichiers et parties de l'organisation ne sont pas reliables entre elles, il est pratiquement impossible de réunir ces informations et d'y accéder rapidement. L'information ne circule pas correctement entre les différents secteurs de l'entreprise. Si les managers disposent de valeurs différentes provenant de systèmes différents pour représenter une même réalité, ils pourraient être amenés à ne plus utiliser ces systèmes, étant donné le manque de fiabilité de leurs données. Page 9

Gestion des données par l utilisation d une base de données Une base de données est un ensemble de données organisées de façon à servir efficacement plusieurs applications par l'unification de la conception de leur structure. Une seule base de données peut ainsi alimenter en données partagées plusieurs applications. Par exemple, la base de données «Personnel» unique pour tous les services de l'entreprise sera mise à jour par des transactions gérées par l'application «Gestion de production» et par l'application «Commandes». Cela permettra ensuite, en temps réel ou différé, que toutes les applications y ayant accès manipulent toutes la bonne information dans le même état d'actualisation. Les systèmes de gestion de base de données Un Système de gestion de base de données (SGBD) est un logiciel technique qui aide une organisation à unifier la conception et la structuration des données, à les gérer efficacement et à en permettre l'accès au moyen de programmes d'application. Un SGBD sert d'interface entre les programmes d'application et les fichiers de données physiques. Lorsqu'on veut obtenir une donnée telle que la paie brute, le SGBD la trouve dans la base de données et la met à disposition du programme d'application. Un SGBD élimine la plupart des instructions de définition de données présentes dans les programmes traditionnels. Le gain de productivité concernant les travaux d'analyseprogrammation est présent à la création des logiciels applicatifs, mais surtout lors de la satisfaction des besoins en maintenance adaptative et évolutive des logiciels. Page 10

Gestion des données par l utilisation d une base de données La vue physique montre comment les données sont réellement organisées et structurées techniquement dans le média de stockage. Un logiciel de gestion de base de données permet, à partir des différentes vues logiques associées aux applications, d'accéder à la base de données. La description logique de la base de données qui est le répertoire des données est nommée le «dictionnaire de données». La formalisation des relations entre les données est appelée «schéma conceptuel», tandis que les spécifications qui précisent comment sont stockées les données du schéma conceptuel sont nommées «schéma physique», ou «schéma interne». Un ensemble spécifique de données contenues dans une base de données, ou «vue», requis par chaque utilisateur ou application est appelé «sous-schéma», ou «schéma externe». Par exemple, pour la base de données de ressources humaines illustrée à la figure 3.4, le programme qui calcule des indemnités de retraite pourrait utiliser un sous-schéma regroupant le nom, l'adresse, le numéro d'assurance sociale, le régime de retraite et les données «mouvements» sur les indemnités de retraite. Page 11

Gestion des données par l utilisation d une base de données Figure 3.4- l environnement des bases de données Un système de gestion de base de données est un logiciel technique qui comporte trois composants principaux : Un langage de définition des données. Un langage de manipulation des données. Un dictionnaire de données. Le langage de définition des données est le langage formel qu'utilisent les programmeurs pour préciser le contenu et la structure de la base de données. Il définit chaque élément de données tel qu'il apparaît dans la base de données et avant qu'il ne soit transformé dans le format exigé par les programmes d'application. Page 12

Tendance en bases et exploitation de données Analyse multidimensionnelle des données Les décideurs doivent fréquemment analyser des données d'une manière non prévue lors de la conception initiale des logiciels applicatifs. Par exemple, une entreprise qui vend quatre produits (écrous, boulons et vis) dans des zones commerciales géographiques distinctes veut connaître les résultats des ventes par produit pour chacune de ces régions et les comparer à ses prévisions. Ce type d'analyse des données s'appelle le «traitement analytique en ligne» (On Line Analytical Process, OLAP). Le terme générique «infocentre», ou «business intelligence», désigne l'ensemble des outils logiciels dédiés. Certains progiciels sont fournis par l'éditeur du SGBD et d'autres sont proposés avec une offre applicative [module BW [Business Warehouse) avec SAP/R3). Mais la plupart sont des progiciels que les entreprises implantent en complément de ceux déjà existants. Parmi ceux-ci, l'un des plus répandus est le progiciel BO (Business Objects), qui comprend une interface de type Web nommée «WebI» ( Web Intelligence). Page 13

Tendance en bases et exploitation de données Les datawarehouses et leur exploitation Les décideurs ont besoin d'une information concise et fiable sur les activités courantes, pour la plupart des entreprises, on ne dispose que des données courantes - les données historiques ne sont disponibles que par l'intermédiaire de rapports spéciaux de systèmes d'information, dont la production est longue. Les données sont souvent réparties dans des systèmes opérationnels distincts, les utilisateurs et les spécialistes des systèmes d'information doivent souvent passer beaucoup de temps à repérer et à recueillir des données. Les datawarehouses (entrepôts de données) contribuent à résoudre ce problème. En effet, ils permettent de regrouper en temps différé des données opérationnelles clés qui proviennent de différents sources et systèmes. Définition d'un datawarehouse Un datawarehouse, composé d'une base de données et de ses outils, regroupe et stocke les données courantes et historiques qui pourraient présenter un intérêt pour les managers d'une entreprise. Les données proviennent de plusieurs systèmes opérationnels et de sources externes, chacun possédant des modèles différents de données. Elles sont répliquées dans la base de données du datawarehouse à intervalle régulier. Les données sont normalisées et consolidées dans des indicateurs significatifs par métiers afin d'être utilisables pour des analyses de gestion et pour des prises de décision ciblées (on parle alors de «méta-données»). Page 14

Tendance en bases et exploitation de données Le datawarehouse (voir figure 3.12) doit être soigneusement conçu à la fois par les spécialistes en gestion et les spécialistes en systèmes pour s'assurer de sa pertinence et de sa fiabilité. Figure 3.12- Composants d un datawarehouse L'exploitation multidimensionnelle des données du datawarehouse est un dispositif logiciel à la fois puissant et rentable, mais qui soulève certaines interrogations en matière de protection de la vie privée. En effet, par ces dispositifs d'exploration («datamining»), il est possible de combiner des données provenant de diverses sources pour dresser un «profil de données» détaillé de chacun d'entre nous : nos revenus, nos habitudes en matière de conduite automobile, nos opinions politiques. Page 15

Tendance en bases et exploitation de données Avantages des datawarehouses La combinaison «datawarehouse + datamining» offre aux décideurs non seulement une information améliorée, mais une facilité d'accès aux données. De nombreuses entreprises exploitent toujours leurs fonctions transactionnelles de base sur d'anciens systèmes, tant pour des raisons de continuité opérationnelle que de coûts de remplacement importants. Plusieurs de ces systèmes utilisent un SGBD hiérarchique, voire des systèmes de fichiers encore plus anciens sans base de données, où l'information est difficile d'accès pour les utilisateurs. Les datawarehouses, exploités sur des systèmes dédiés à cette fonction, offrent aux décideurs un accès illimité aux données dont ils ont besoin. Bases de données et Web Web et bases de données hypermédias Les sites Web utilisent des bases de données hypermédias pour stocker l'information sous forme de pages reliées contenant du texte, des sons, des vidéos et des graphiques. Les bases de données hypermédias permettent de stocker des blocs d'information sous forme de nœuds reliés par les liens que l'utilisateur a établis (voir figure 3.13). La recherche de données ne nécessite pas le suivi d'une structure prédéterminée. Au contraire, l'utilisateur peut accéder à des informations connexes. La relation entre les enregistrements est moins structurée que dans le cas d'un SGBD traditionnel. Une base de données hypermédia permet à l'utilisateur d'accéder à des sujets dans un site Web dans l'ordre qu'il souhaite. Page 16

Tendance en bases et exploitation de données Figure 3.13- Une base de donnée hypermédias Relier les bases de données au Web Divers logiciels permettent désormais aux utilisateurs d'utiliser le Web pour accéder aux données stockées dans les systèmes traditionnels des organisations. (voir figure 3.14). Figure 3.14- Une base de donnée hypermédias Page 17

Nouvelles possibilités La gestion efficace des données d'une entreprise exige davantage que la sélection d'un modèle logique associé à un SGBD. Une base de donnée est un référentiel et une discipline organisationnelle, une méthode qui nécessite des changements organisationnels et conceptuels. Opportunités Les entreprises sont conscientes des avantages en termes de performance organisationnelle qui découlent d'une meilleure organisation et surtout de meilleures utilisations de leurs données. Un grand nombre d'entre elles investissent donc dans les technologies dites d'«infocentre», en combinant datawarehouse et datamining et ergonomie des accès via des interfaces de type navigateur Web. Défis La gestion efficace des données s'avère une tâche ardue pour les entreprises. Un véritable cadre d'exploitation d'une base de données requiert des changements dans la façon dont une entreprise définit et utilise ses données. Il représente généralement un investissement et des coûts de fonctionnement très importants. Obstacles organisationnels à un cadre d'exploitation de bases de données L'implantation d'une base de données nécessite des changements organisationnels importants, eu égard au rôle de l'information (et des managers de l'information), à la répartition du pouvoir entre les cadres supérieurs, à la propriété et au partage de l'information et au consensus organisationnel. Page 18

Nouvelles possibilités Considérations coûts-bénéfices Malgré l'argent dépensé en matériel et en logiciels pour créer un environnement de base de données, une entreprise risque de ne pas récolter les bénéfices escomptés si elle refuse d'apporter les changements organisationnels requis. Les techniques logicielles du SGBD offrent les potentialités de la cohérence, mais c'est l'organisation qui, par ses choix fonctionnels et sa vigilance managériale quotidienne, concrétisera ces potentialités. Solutions Les éléments essentiels d'un cadre d'exploitation d'une base de données sont : (1) l'administration des données, (2) la méthodologie de planification et de modélisation des données, (3) la technologie, la gestion et les utilisateurs de la base de données (voir figure 3.15). Figure 3.15 - Éléments organisationnels de l'exploitation des bases de données Page 19

Nouvelles possibilités Administration des données Les dirigeants de l'entreprise doivent reconnaître le rôle stratégique de l'information et prendre une part active dans la gestion et la planification de la cohérence de l'information en tant que ressource de l'entreprise. Autrement dit, l'organisation doit créer la fonction d'administration des données. Ces responsabilités comprennent l'élaboration d'une politique de l'information, le contrôle du modèle logique de la base de données, la création du dictionnaire de données et le suivi de l'utilisation des données. Méthodologie de planification et de modélisation des données Pour élaborer une base de données, il faut tenir compte des besoins en information de l'ensemble des activités, processus et opérations (par opposition aux besoins ponctuels, individuels ou locaux). Cette analyse permanente permet de définir les entités clés ainsi que les attributs et les relations qui constituent les données de l'entreprise. Technologie, gestion et utilisateurs de la base de données Une base de données exige un nouveau logiciel (le SGBD) et du personnel doté de nouvelles compétences au sein de sa DSI. En charge des aspects techniques (implémentation du logiciel SGBD, etc.), cette cellule implémentera et maintiendra la base de données physique, les relations logiques entre ses éléments et les procédures et règles d'accès. La fonction qu'elle remplit est nommée «administration de la base de données». Pour optimiser l'accès aux données et la qualité des utilisations, il faut consacrer des ressources techniques, financières et humaines à la formation des utilisateurs finaux. Page 20