Alimenter un entrepôt de données par des données issues de services web. Une approche médiation pour le prototype DaWeS
|
|
|
- Charlotte Normandin
- il y a 10 ans
- Total affichages :
Transcription
1 Alimenter un entrepôt de données par des données issues de services web. Une approche médiation pour le prototype DaWeS John Samuel LIMOS (Laboratoire d Informatique, de Modélisation et d Optimisation des Systèmes), Ecole Doctorale Sciences Pour l Ingénieur Université Blaise Pascal, Aubière Résumé Toute entreprise a besoin d optimiser son fonctionnement afin d être la plus compétitive possible. Les plus grandes d entre elles ont les ressources pour maintenir d énormes bases (appelées entrepôts) de données d exploitation. Ces données permettent de calculer des indicateurs de performance, induisant une meilleure compréhension du fonctionnement des processus métier sous-jacents. Ceci aboutit à un meilleur pilotage d entreprise ainsi qu à un meilleur respect des normes internationales de qualité. Les petites et moyennes entreprises ont quant à elles des moyens plus réduits pour conserver et utiliser leurs données d exploitation. Par ailleurs, elles dépendent de plus en plus de multiples services web pour leurs tâches quotidiennes. Ne pouvant pas assumer le coût d un entrepôt de données, il serait intéressant qu elles puissent disposer d un autre service capable de gérer lui-même les statistiques sur leur utilisation. DaWeS est une plateforme gérant des entrepôts de données dynamiques, alimentés automatiquement par des services web hétérogènes via leur API (c est-à-dire les interfaces logicielles permettant d accéder à ces services web), et ayant la capacité de réagir (le plus) automatiquement (possible). 1 L entrepôt de données et Les Services Web L arrivée d internet et des smartphones a changé nos vies quotidiennes. On est toujours connecté sur internet avec nos amis et notre famille grâce à beaucoup de services web. Également les entreprises, en particulier les petites entreprises utilisent beaucoup de services web de manière quotidienne. Les services web permettent aux entreprises de se recentrer sur leur coeur de métier plutôt que de dépenser temps et argent à gérer un parc matériel et logiciel complexe. Dans ce contexte, quelle que soit sa taille, une entreprise est confrontée au problème de l accès à ses données de fonctionnement. Ces dernières sont souvent réparties sur toute la surface du globe, comme par exemple pour une grande entreprise. Université de Lyon, CNRS, INSA-Lyon, LIRIS, UMR-CNRS 5205, Labex IMU, [email protected]
2 qui a des filiales internationales, ou une PME qui utilisent des services web sans même connaître leur localisation. Les entreprises sont dépendantes de nombreux services maitrisent communément dans une seule spécialité. Par exemple, il y a divers services web pour faire la gestion des ressources humaines, l organisation de campagnes marketing, la gestion de projets, les réseaux sociaux etc. Ces entreprises perdent du même coup le contrôle direct, complet et sans restriction de leurs propres données métier ainsi que des données relatives à leur utilisation. L accès aux données sauvegardées sur les services web par le navigateur internet n est pas faisable à l échelle. Les fournisseurs de services web offrent les API (interfaces de programmation d application) pour permettre l accès aux données à distance. L API autorise seulement les propriétaires et les sites webs autorisés par des propriétaires d accéder aux données. Les API diffèrent significativement d un service web à l autre, en raison de l usage de différents formats de message, mécanismes d authentification, accords de niveau de service, limitations d accès, types de données, et choix des entrées, sorties et erreurs associées aux services. Les API sont majoritairement décrites en langue naturelle dans des pages web. Ainsi, intégrer plusieurs services au sein d une même application demande un effort de développement certain. En vue de pallier à ce problème, la communauté académique et industrielle a mis au point des langages standards et compréhensibles par les machines pour la description des API, comme notamment WSDL, SAWSDL, hrests [6]). L usage de ces langages doit permettre une automatisation de l intégration des services web au sein d applications plus complexes. Dans les faits, ils ne sont encore que très peu utilisés par l industrie de par l investissement en temps d apprentissage qu ils nécessitent. Les développeurs dans une entreprise ecrivent des logiciels (applications) utilisant des APIs de leur services d utilisation pour accéder et manipuler des données. Souvent les services web évoluent considerant les besoins de leur nombreux clients. Ils changent non seulement l interface de service web accessible par le navigateur internet mais également l API. Ils ajoutent des nouveux options et enlèvent les options les moins utilisées. Cette évolution de services est un grande problème car les développeurs d entreprise ont besoin de reprogrammer les logiciels pour garder l accès aux données. Le pire des cas c est lorsque les services web ferment leur site web et les API, alors les entreprises perdent l integralité de leurs données. Dans une entreprise, chaque département/équipe à sa propre base de données et des fichiers pour gérer des données concernant leurs besoins quotidiens. L entrepôt de données [4, 5] offre un endroit unique pour accéder et comprendre la démarche de l entreprise et de ses départements. Habituellement, et en simplifiant, alimenter un entrepôt de donnée nécessite un certain nombre d opérations en partie manuelles, comme le nettoyage (pour enlever certaines données erronées) ou la restructuration des données (pour qu elles s adaptent à l organisation interne dans l entrepôt). Ceci vient du fait qu on veut intégrer des données de sources très différentes comme des bases de données relationnelles, des fichiers texte, des tableaux de données, des fichiers XML,... Dans notre cas, les données
3 proviennent de services web, c est-à-dire qu on les obtient en faisant appel aux fonctions disponibles dans les API correspondantes. Ces fonctions nécessitent souvent des paramètres en entrées. Par exemple, un service de gestion de projets pourra nous permettre d obtenir les statistiques des projets terminés sur une certaine période. Il faut cependant lui préciser la date de début et la date de fin de la période afin qu il fournisse les données associées. Initié par la société Rootsystem 1, ce travail est centré sur la création d une solution logicielle pour Littlecrowd 2, nommée DaWeS pour Data Warehous fed with Web Services, c est-à-dire entrepôt de données alimenté par des services web. DaWeS est capable de fournir en ligne un entrepôt de données personnalisé pour les petites et moyennes entreprises qui utilisent des services web et qui souhaitent avoir un meilleur archivage et contrôle de leurs données métier. Son intérêt est double : d abord proposer un archivage pérenne des données passées et présentes de l entreprise, et ensuite permettre la définition et le calcul faciles d indicateurs de performance métier en cachant à l utilisateur la complexité inhérente à ces tâches effectuées à partir des données hétérogènes de nombreux services web. Cette solution respecte les deux contraintes suivantes : 1. elle permet l intégration de services web réels, c est-à-dire dont les API sont décrites sur des pages web en langage naturel et non par des langages complexes compréhensibles par les machines (mais très peu utilisés) 2. et elle doit pouvoir être administrée par un petit nombre de personnes. Il doit en effet être facile d ajouter, modifier ou supprimer une API, rendant ainsi possible la gestion d une large offre d API. La nécessité de la première contrainte vient du contexte que l on a décrit plus haut, renforcée par une étude [9, 11] que nous avons effectuée sur une douzaine de services web issus de trois domaines (marketing en ligne, gestion de projets et support aux utilisateurs). En termes techniques, cette étude nous a permis de faire le profil type d un service web actuel : décrit en langage naturel dans une page HTML, respectant une plus ou moins grande partie de l architecture REST, utilisant un mécanisme d authentification HTTP simple avec GET, utilisant XML ou JSON comme formats de message, les types de données chaîne de caractères, date et énumération, et l invocation de ressources dynamiques et de séquence d opérations. Ces caractéristiques sont focalisées sur la simplicité. Cette situation est d ailleurs confirmée par ProgrammableWeb 3, un annuaire en ligne de plus de dix mille API dans lequel une grande majorité sont des services REST qui partagent le profil précédent. La nécessité de la seconde contrainte vient de la société Rootsystem qui ne compte que deux salariés à temps complet. Permettre à une équipe d administrateurs réduite de gérer une offre de services réels étendue est tout l enjeu scientifique et industriel de cette thèse http ://
4 Rêquêts API Services Web Réponse API Extraction et Transformation de Réponse Traitement des Requêtes Indicateurs de performance Requête d'archives Requête d'indicateurs de performance Données Historique Schéma d'archives Données d'archives Base de Données pour archives Schéma d'i.p Données d'i.p. Base de Donnés Pour I.P Étage d'archives Étage d'indicateurs de performance Figure 1. DaWeS : Architecture 2 DaWeS : Architecture, Expériences et Résultats Le prototype (Fig. 1) que nous avons développé DaWeS [8, 9, 11] et démontré [12] est basé sur trois modules principaux : un adaptateur générique pour relier le médiateur aux API des services web et permettre l extraction et la transformation de réponses API, un module de réécriture de requêtes contenant les liens entre le médiateur et les sources et permettant de définir les données à récupérer (cf. l étage des archives), et un module de calcul des indicateurs de performance (cf. l étage d indicateurs de performance). Relier des sources de données en se basant sur leur structure, avant même de manipuler les données, est l approche dite «virtuelle» du problème de l intégration de données[3]. De nombreux travaux ont été menés relativement à ce problème, en particulier centrés sur la notion de médiateur. La principale question est ici de concevoir une interface de requête (le médiateur) permettant d interroger facilement (en une seule requête) un ensemble de sources hétérogènes et autonomes. Dans notre cas, les ressources sont les services web, avec la particularité que ceux-ci imposent des schémas de requêtage bien précis (paramètres en entrées) appelés «access patterns» [7]. Une deuxième particularité de notre problème est que notre médiateur doit pouvoir être souple et nous renvoyer toutes les informations possibles, même en l absence de certains paramètres d entrée. On dit qu il doit gérer des «informations incomplètes» [2]. Enfin la troisième exigence est de concevoir un médiateur pouvant réagir le plus automatiquement possible aux évolutions des sources afin, par exemple, qu une même requête puisse être réexécutée telle quelle même après un changement de structuration dans les données d une source.
5 Pour répondre à ce problème, sans utiliser les standards les plus avancés en matière de description d API de services web, nous proposons une approche semi-automatique caractérisée par la volonté de réduire autant que possible les étapes de développement traditionnel dans l administration de DaWeS. Pour ce faire nous proposons une approche par médiation pour la partie ETL (extraction, transformation et chargement des données) de DaWeS (c est-à-dire le lien entre DaWeS et les services web). L approche médiation est bien connue dans le domaine de l intégration d informations depuis une quinzaine d années. Au sein de DaWeS, elle permet de clairement identifier les tâches automatisables de celles devant être faites manuellement. De plus elle permet l usage de langages déclaratifs uniquement pour les étapes manuelles (SQL, datalog, XML, XSLT). Ainsi, la gestion de DaWeS, qui est a priori un travail de développement pour intégrer des API à la plateforme, devient une tâche d administration et de paramétrage de composants. Le temps nécessaire à sa réalisation en est grandement amoindri et c est ce qui permet à une petite équipe d administrateurs de pouvoir gérer des centaines d API de services web. Ainsi, dans DaWeS, est implementé un module d ETL complet basé sur une approche médiation et sur l usage d un wrappeur HTTP d API de services web générique. Le résultat est un entrepôt d entrepôts de données dont une part du schéma de stockage des données est dynamiquement créé en fonction des API intégrées. D un point de vue théorique, DaWeS a fait émerger deux problèmes importants. Le premier est celui du traitement des valeurs incomplètes. L approche médiation [3] respecte un traitement rigoureux des données issues des services web, impliquant, en résumé, que certaines données, pourtant présentes dans les services, ne peuvent pas être utilisées parce qu elles ne sont pas confirmées par d autres services vus comme incomplets. Justifiée sur le plan théorique, cette contrainte n est pas satisfaisante dans le contexte industriel où l on veut pouvoir récupérer toutes les données possibles. Pour pallier à ce problème nous proposons dans DaWeS une heuristique [8] de relaxation de l algorithme de réécriture de requêtes [1] qui est au coeur de la médiation. Le deuxième problème rencontré est celui du nombre d accès aux API. En simplifiant, une requête posée à DaWeS, par exemple pour l obtention de données pour la construction d un indicateur de performance, est réécrite en plusieurs requêtes chacune d elle étant traduite par un certain nombre d appels aux services web via leurs API. Or appeler un service web peut-être très coûteux. Cela dépend de la politique de tarification du fournisseur de ce service qui dépend elle-même de nombreux paramètres (qualité du service demandé, de la connexion réseau, du nombre d appels déjà effectués,...). Il devient donc nécessaire d optimiser la réécriture de la requête initiale afin de minimiser le nombre de ces appels tout en conservant les mêmes résultats. Face à cette problématique, nous ne proposons pas, dans ce travail, d optimisation en tant que telle. Par contre nous proposons une méthodologie pour l obtention d une borne supérieure [10] sur le nombre d appels requis après réécriture. Cette borne se veut un outil d évaluation des futures méthodes d optimisation de réécriture.
6 Nous avons validé DaWeS par les tests suivants. D abord, des expérimentations qualitatives ont été menées sur des services web réels dans les trois domaines précédemment cités. Puis, une première série de tests aléatoires quantitatifs a été effectuée pour tester le passage à l échelle. 3 Conclusion et perspectives L offre de services web disponibles étant en constante progression, l adéquation avec les demandes des PME étant croissante, les besoins d avancées dans le domaine de l intégration de données sont de plus en plus importants. Cette thèse [8] traite de l établissement d une plateforme logicielle nommée DaWeS permettant le déploiement et la gestion en ligne d entrepôts de données alimentés par des données provenant de services web et personnalisés à destination des petites et moyennes entreprises nécessitant moins d effort de programmation. Ce travail s articule autour du développement et de l expérimentation de DaWeS. L idée principale implémentée dans DaWeS est l utilisation d une approche virtuelle d intégration de données (la médiation) en tant que processus ETL (extraction, transformation et chargement des données) pour les entrepôts de données gérés par DaWeS. A cette fin, un algorithme classique de réécriture de requêtes (l algorithme inverse-rules) a été adapté et testé. Une étude théorique sur la sémantique des requêtes conjonctives et datalog [10] exprimées avec des relations munies de limitations d accès (correspondant aux services web) a été menée. Cette dernière permet l obtention de bornes supérieures sur les nombres d appels aux services web requis dans l évaluation de telles requêtes. Des expérimentations ont été menées sur des services web réels dans trois domaines : le marketing en ligne, la gestion de projets et les services d aide aux utilisateurs. De nombreuses questions ouvertes se posent alors à la recherche et à l industrie. Premièrement, comment peut on réduire ou optimiser le nombre d appel à l API? Puis, Est ce que l ajout d un mécanisme avancé de traitement des erreurs peut il aider à réagir automatiquement aux échecs de l API? Finalement, qu elle interface d intégration visuelle et quels outils de visualisations pertinents sont nécessaires à l utilisateur afin d améliorer et d accélérer l analyse du contenu de son entrepôt de données? Remerciements Je souhaite remercier la Région Auvergne et le FEDER pour le financement de ce projet de recherche. Je voudrais également remercier Farouk Toumani et Christophe Rey de LIMOS, Université Blaise Pascal pour leur direction ainsi que Rootsystem pour avoir initié ce travail. Enfin merci à A. Duranthon pour la relecture. Références [1] Duschka, O.M., Genesereth, M.R., Levy, A.Y. : Recursive query plans for data integration. J. Log. Program. 43(1), (2000)
7 [2] Grahne, G., Kiricenko, V. : Towards an algebraic theory of information integration. Inf. Comput. 194(2), (2004) [3] Halevy, A.Y. : Answering queries using views : A survey. VLDB J. 10(4), (2001) [4] Inmon, W.H. : Building the Data Warehouse. John Wiley & Sons, Inc., New York, NY, USA (1992) [5] Kimball, R. : The Data Warehouse Toolkit : Practical Techniques for Building Dimensional Data Warehouses. John Wiley (1996) [6] Kopecký, J., Gomadam, K., Vitvar, T. : hrests : An html microformat for describing restful web services. In : Proceedings of the 2008 IEEE/WIC/ACM International Conference on Web Intelligence and Intelligent Agent Technology - Volume 01. pp WI-IAT 08, IEEE Computer Society, Washington, DC, USA (2008), [7] Rajaraman, A., Sagiv, Y., Ullman, J.D. : Answering queries using templates with binding patterns (extended abstract). In : Proceedings of the fourteenth ACM SIGACT-SIGMOD-SIGART symposium on Principles of database systems. pp PODS 95 (1995) [8] Samuel, J. : Feeding a data warehouse with data coming from web services. A mediation approach for the DaWeS prototype. Theses, Université Blaise Pascal - Clermont-Ferrand II (Oct 2014), tel [9] Samuel, J. : Towards a data warehouse fed with web services. In : The Semantic Web : Trends and Challenges - 11th International Conference, ESWC PhD Symposium Lecture Notes in Computer Science, vol. 8465, pp Springer (2014), [10] Samuel, J., Momège, B. : An upper bound on the number of accesses for Datalog α Last queries. In : Base de Données Avancés (BDA 2014) (2014), session Jeune Chercheur [11] Samuel, J., Rey, C. : Dawes : Datawarehouse fed with web services. In : Actes du XXXIIème Congrès INFORSID, Lyon, France, Mai pp (2014), [12] Samuel, J., Rey, C., Martin, F., Peyron, L. : Mediation-based web services fed data warehouse. In : 10e journées francophones sur les Entrepôts de Données et l Analyse en ligne (EDA 2014), Vichy. RNTI, vol. B-10, pp Hermann, Paris (Juin 2014), démo
UE 8 Systèmes d information de gestion Le programme
UE 8 Systèmes d information de gestion Le programme Légende : Modifications de l arrêté du 8 mars 2010 Suppressions de l arrêté du 8 mars 2010 Partie inchangée par rapport au programme antérieur Indications
4. SERVICES WEB REST 46
4. SERVICES WEB REST 46 REST REST acronyme de REpresentational State Transfert Concept introduit en 2000 dans la thèse de Roy FIELDING Est un style d architecture inspiré de l architecture WEB En 2010,
et les Systèmes Multidimensionnels
Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Datawarehouse (DW) Le Datawarehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées
Entreposage de données complexes pour la médecine d anticipation personnalisée
Manuscrit auteur, publié dans "9th International Conference on System Science in Health Care (ICSSHC 08), Lyon : France (2008)" Entreposage de données complexes pour la médecine d anticipation personnalisée
Bien architecturer une application REST
Olivier Gutknecht Bien architecturer une application REST Avec la contribution de Jean Zundel Ce livre traite exactement du sujet suivant : comment faire pour que les services web et les programmes qui
Problématiques de recherche. Figure Research Agenda for service-oriented computing
Problématiques de recherche 90 Figure Research Agenda for service-oriented computing Conférences dans le domaine ICWS (International Conference on Web Services) Web services specifications and enhancements
L A B U S I N E S S. d a t a g i n f o r m a t i o n g a c t i o n
L A B U S I N E S S I N T E L L I G E N C E D U X X I e m e S I E C L E A T A W A D * d a t a g i n f o r m a t i o n g a c t i o n domaines d expertise : Modélisation des données Intégration des données
Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION
Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION Classe de terminale de la série Sciences et Technologie du Management et de la Gestion Préambule Présentation Les technologies de l information
Sélection d un moteur de recherche pour intranet : Les sept points à prendre en compte
Sélection d un moteur de recherche pour intranet : Les sept points à prendre en compte 1Les bases : vos objectifs 2 Sélection d un moteur de recherche pour intranet : Les sept points à prendre en compte
SECTION 5 BANQUE DE PROJETS
SECTION 5 BANQUE DE PROJETS INF 4018 BANQUE DE PROJETS - 1 - Banque de projets PROJET 2.1 : APPLICATION LOGICIELLE... 3 PROJET 2.2 : SITE WEB SÉMANTIQUE AVEC XML... 5 PROJET 2.3 : E-LEARNING ET FORMATION
CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012
CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE Edition 2012 AGENDA Qui sommes nous? Présentation de Keyrus Keyrus : Expert en formations BI Nos propositions de formation 3 modes de formations Liste des
DOSSIER SOLUTION CA ERwin Modeling. Comment gérer la complexité des données et améliorer l agilité métier?
DOSSIER SOLUTION CA ERwin Modeling Comment gérer la complexité des données et améliorer l agilité métier? CA ERwin Modeling fournit une vue centralisée des définitions de données clés afin de mieux comprendre
Intelligence Economique - Business Intelligence
Intelligence Economique - Business Intelligence Notion de Business Intelligence Dès qu'il y a une entreprise, il y a implicitement intelligence économique (tout comme il y a du marketing) : quelle produit
Plan de cours. 1. Mise en contexte. 2. Place du cours dans le programme. 3. Descripteur du cours
Faculté des sciences Centre de formation en technologies de l information Plan de cours Cours : INF 735 Entrepôt et forage de données Trimestre : Hiver 2015 Enseignant : Robert J. Laurin 1. Mise en contexte
Introduction à la B.I. Avec SQL Server 2008
Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide
Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise.
Solutions PME VIPDev Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise. Cette offre est basée sur la mise à disposition de l ensemble de nos compétences techniques et créatives au service
Devenez un véritable développeur web en 3 mois!
Devenez un véritable développeur web en 3 mois! L objectif de la 3W Academy est de former des petits groupes d élèves au développement de sites web dynamiques ainsi qu à la création d applications web
Architectures d'intégration de données
Architectures d'intégration de données Dan VODISLAV Université de Cergy-ontoise Master Informatique M1 Cours IED lan Intégration de données Objectifs, principes, caractéristiques Architectures type d'intégration
Les Entrepôts de Données
Les Entrepôts de Données Grégory Bonnet Abdel-Illah Mouaddib GREYC Dépt Dépt informatique :: GREYC Dépt Dépt informatique :: Cours Cours SIR SIR Systèmes d information décisionnels Nouvelles générations
Business Intelligence
avec Excel, Power BI et Office 365 Téléchargement www.editions-eni.fr.fr Jean-Pierre GIRARDOT Table des matières 1 Avant-propos A. À qui s adresse ce livre?..................................................
BI2 : Un profil UML pour les Indicateurs Décisionnels
BI2 : Un profil UML pour les Indicateurs Décisionnels Sandro Bimonte Irstea, TSCF, 9 Av. Blaise Pascal, 63178, Aubière, France [email protected] Thème de Recherche MOTIVE www.irstea.fr 2 Plan Motivations
BIRT (Business Intelligence and Reporting Tools)
BIRT (Business Intelligence and Reporting Tools) Introduction Cette publication a pour objectif de présenter l outil de reporting BIRT, dans le cadre de l unité de valeur «Data Warehouse et Outils Décisionnels»
QU EST-CE QUE LE DECISIONNEL?
La plupart des entreprises disposent d une masse considérable d informations sur leurs clients, leurs produits, leurs ventes Toutefois ces données sont cloisonnées par les applications utilisées ou parce
Business & High Technology
UNIVERSITE DE TUNIS INSTITUT SUPERIEUR DE GESTION DE TUNIS Département : Informatique Business & High Technology Chapitre 8 : ID : Informatique Décisionnelle BI : Business Intelligence Sommaire Introduction...
SQL SERVER 2008, BUSINESS INTELLIGENCE
SGBD / Aide à la décision SQL SERVER 2008, BUSINESS INTELLIGENCE Réf: QLI Durée : 5 jours (7 heures) OBJECTIFS DE LA FORMATION Cette formation vous apprendra à concevoir et à déployer une solution de Business
Solution A La Gestion Des Objets Java Pour Des Systèmes Embarqués
International Journal of Engineering Research and Development e-issn: 2278-067X, p-issn: 2278-800X, www.ijerd.com Volume 7, Issue 5 (June 2013), PP.99-103 Solution A La Gestion Des Objets Java Pour Des
Optimisez les coûts de possession de votre information et redonnez de la capacité d investissement au DSI
CGI Dbox Dites oui à notre solution exclusive de décommissionnement et réduisez les coûts tout en conservant l intégrité de votre patrimoine informationnel Optimisez les coûts de possession de votre information
Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION. Mentions Ingénierie des Systèmes d Information Business Intelligence
É C O L E D I N G É N I E U R D E S T E C H N O L O G I E S D E L I N F O R M A T I O N E T D E L A C O M M U N I C A T I O N Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION Mentions
SQL. Oracle. pour. 4 e édition. Christian Soutou Avec la participation d Olivier Teste
Christian Soutou Avec la participation d Olivier Teste SQL pour Oracle 4 e édition Groupe eyrolles, 2004, 2005, 2008, 2010, is BN : 978-2-212-12794-2 Partie III SQL avancé La table suivante organisée en
Introduction au domaine du décisionnel et aux data warehouses
Data warehouse Introduction au domaine du décisionnel et aux data warehouses http://dwh.crzt.fr STÉPHANE CROZAT Paternité - Partage des Conditions Initiales à l'identique : http://creativecommons.org/licenses/by-sa/2.0/fr/
Intégration de données hétérogènes et réparties. Anne Doucet [email protected]
Intégration de données hétérogènes et réparties Anne Doucet [email protected] 1 Plan Intégration de données Architectures d intégration Approche matérialisée Approche virtuelle Médiateurs Conception
4. Utilisation d un SGBD : le langage SQL. 5. Normalisation
Base de données S. Lèbre [email protected] Université de Strasbourg, département d informatique. Présentation du module Contenu général Notion de bases de données Fondements / Conception Utilisation :
Architecture N-Tier. Ces données peuvent être saisies interactivement via l interface ou lues depuis un disque. Application
Architecture Multi-Tier Traditionnellement une application informatique est un programme exécutable sur une machine qui représente la logique de traitement des données manipulées par l application. Ces
Laboratoire 4 Développement d un système intelligent
DÉPARTEMENT DE GÉNIE LOGICIEL ET DES TI LOG770 - SYSTÈMES INTELLIGENTS ÉTÉ 2012 Laboratoire 4 Développement d un système intelligent 1 Introduction Ce quatrième et dernier laboratoire porte sur le développement
Business Intelligence avec Excel, Power BI et Office 365
Avant-propos A. À qui s adresse ce livre? 9 1. Pourquoi à chaque manager? 9 2. Pourquoi à tout informaticien impliqué dans des projets «BI» 9 B. Obtention des données sources 10 C. Objectif du livre 10
Accélérer l agilité de votre site de e-commerce. Cas client
Accélérer l agilité de votre site de e-commerce Cas client L agilité «outillée» devient nécessaire au delà d un certain facteur de complexité (clients x produits) Elevé Nombre de produits vendus Faible
Une méthode d apprentissage pour la composition de services web
Une méthode d apprentissage pour la composition de services web Soufiene Lajmi * Chirine Ghedira ** Khaled Ghedira * * Laboratoire SOIE (ENSI) University of Manouba, Manouba 2010, Tunisia [email protected],
Guide de référence pour l achat de Business Analytics
Guide de référence pour l achat de Business Analytics Comment évaluer une solution de décisionnel pour votre petite ou moyenne entreprise : Quelles sont les questions à se poser et que faut-il rechercher?
Formula Negator, Outil de négation de formule.
Formula Negator, Outil de négation de formule. Aymerick Savary 1,2, Mathieu Lassale 1,2, Jean-Louis Lanet 1 et Marc Frappier 2 1 Université de Limoges 2 Université de Sherbrooke Résumé. Cet article présente
Découvrir les vulnérabilités au sein des applications Web
Applications Web Découvrir les vulnérabilités au sein des applications Web Les vulnérabilités au sein des applications Web sont un vecteur majeur du cybercrime. En effet, selon le rapport d enquête 2012
Entreprises Solutions
ERP Entreprises Solutions Choisir un progiciel de gestion intégrée Questions de technologie? 1 Dans le choix d une solution de gestion intégrée de type PGI/ERP, les aspects fonctionnels sont clés. L entreprise
OPEN DATA : CHALLENGES ET PERSPECTIVES D ENTREPOSAGE
OPEN DATA : CHALLENGES ET PERSPECTIVES D ENTREPOSAGE «Journée Open Data» 5 Novembre 2013 Présenté par : Imen Megdiche Directeur de thèse : Pr. Olivier Teste (SIG-IRIT) Co-directeur de thèse : Mr. Alain
W4 - Workflow La base des applications agiles
W4 - Workflow La base des applications agiles, W4 [email protected] Vous avez dit «workflow»? Processus : Enchaînement ordonné de faits ou de phénomènes, répondant à un certain schéma et
BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise
BUSINESS INTELLIGENCE Une vision cockpit : utilité et apport pour l'entreprise 1 Présentation PIERRE-YVES BONVIN, SOLVAXIS BERNARD BOIL, RESP. SI, GROUPE OROLUX 2 AGENDA Définitions Positionnement de la
BABEL LEXIS : UN SYSTÈME ÉVOLUTIF PERMETTANT LA CRÉATION, LE STOCKAGE ET LA CONSULTATION D OBJETS HYPERMÉDIAS
Quatrième colloque hypermédias et apprentissages 275 BABEL LEXIS : UN SYSTÈME ÉVOLUTIF PERMETTANT LA CRÉATION, LE STOCKAGE ET LA CONSULTATION D OBJETS HYPERMÉDIAS Anne-Olivia LE CORNEC, Jean-Marc FARINONE,
Méthodologie de conceptualisation BI
Méthodologie de conceptualisation BI Business Intelligence (BI) La Business intelligence est un outil décisionnel incontournable à la gestion stratégique et quotidienne des entités. Il fournit de l information
Bases de données Cours 1 : Généralités sur les bases de données
Cours 1 : Généralités sur les bases de données POLYTECH Université d Aix-Marseille [email protected] http://odile.papini.perso.esil.univmed.fr/sources/bd.html Plan du cours 1 1 Qu est ce qu une
Objectif : Passer de l analyse métier et fonctionnelle à la définition des applications qui
Formation PARTIE 1 : ARCHITECTURE APPLICATIVE DUREE : 5 h Objectif : Passer de l analyse métier et fonctionnelle à la définition des applications qui automatisent les fonctions Définir une architecture
Conception, architecture et urbanisation des systèmes d information
Conception, architecture et urbanisation des systèmes d information S. Servigne Maître de Conférences, LIRIS, INSA-Lyon, F-69621 Villeurbanne Cedex e-mail: [email protected] 1. Introduction
THEME PROJET D ELABORATION D UNE BASE DE DONNEES SOUS LE SERVEUR MYSQL
. THEME PROJET D ELABORATION D UNE BASE DE DONNEES SOUS LE SERVEUR MYSQL Mr MEZRED MOHAMED Ingénieur météorologue INTRODUCTION Il existe de nombreuses manières de construire une base de données. En effet,
Drive your success. «Un écosystème complexe implique une capacité de gestion temps réel des aléas» www.imagina-international.com
Drive your success «Un écosystème complexe implique une capacité de gestion temps réel des aléas» www.imagina-international.com ATEN, dix avantages au service de votre entreprise Qualité de mise en œuvre
Introduction Big Data
Introduction Big Data SOMMAIRE Rédacteurs : Réf.: SH. Lazare / F. Barthélemy AXIO_BD_V1 QU'EST-CE QUE LE BIG DATA? ENJEUX TECHNOLOGIQUES ENJEUX STRATÉGIQUES BIG DATA ET RH ANNEXE Ce document constitue
Solution. collaborative. de vos relations clients.
Solution collaborative de vos relations clients. Le Collaborative Relationship Management : une autre vision du CRM L un des enjeux majeurs dans les relations qu une entreprise entretient avec ses clients
Parcours en deuxième année
Parcours en deuxième année Unités d Enseignement (UE) ECTS Ingénierie des réseaux haut 4 débit Sécurité des réseaux et 4 télécoms Réseaux mobiles et sans fil 4 Réseaux télécoms et 4 convergence IP Infrastructure
«Innovation Intelligence» La valorisation des données massives au service des partenariats R&D. Expernova Université d été GFII 11-09-2014
«Innovation Intelligence» La valorisation des données massives au service des partenariats R&D Expernova Université d été GFII 11-09-2014 [Une tendance forte à l Open Innovation ] «Le monde est devenu
Chapitre 1 : Introduction aux bases de données
Chapitre 1 : Introduction aux bases de données Les Bases de Données occupent aujourd'hui une place de plus en plus importante dans les systèmes informatiques. Les Systèmes de Gestion de Bases de Données
Masses de données. 1. Introduction 2. Problématiques 3. Socle de formation (non présenté) 4. Liens avec Formation INSA
Masses de données 1. Introduction 2. Problématiques 3. Socle de formation (non présenté) 4. Liens avec Formation INSA Rédacteurs : Mjo Huguet / N. Jozefowiez 1. Introduction : Besoins Informations et Aide
Stages 2014-2015 ISOFT : UNE SOCIETE INNOVANTE. Contact : Mme Lapedra, [email protected]
Stages 2014-2015 ISOFT : UNE SOCIETE INNOVANTE Contact : Mme Lapedra, [email protected] ISoft, éditeur de logiciels, est spécialisé dans l informatique décisionnelle et l analyse de données. Son expertise
Cette première partie pose les enjeux de la BI 2.0 et son intégration dans le SI de l entreprise. De manière progressive, notre approche situera le
Partie I BI 2.0 Cette première partie pose les enjeux de la BI 2.0 et son intégration dans le SI de l entreprise. De manière progressive, notre approche situera le SI classique avec l intégration de la
Bases de Données Avancées
1/26 Bases de Données Avancées DataWareHouse Thierry Hamon Bureau H202 - Institut Galilée Tél. : 33 1.48.38.35.53 Bureau 150 LIM&BIO EA 3969 Université Paris 13 - UFR Léonard de Vinci 74, rue Marcel Cachin,
1 Actuate Corporation 2012. + de données. + d analyses. + d utilisateurs.
1 Actuate Corporation 2012 + de données. + d analyses. + d utilisateurs. Actuate et BIRT Actuate est l Editeur spécialiste de la Business Intelligence et le Reporting qui a créé le projet Open Source BIRT
Techniques d interaction dans la visualisation de l information Séminaire DIVA
Techniques d interaction dans la visualisation de l information Séminaire DIVA Zingg Luca, [email protected] 13 février 2007 Résumé Le but de cet article est d avoir une vision globale des techniques
Master Informatique Aix-Marseille Université
Aix-Marseille Université http://masterinfo.univ-mrs.fr/ Département Informatique et Interactions UFR Sciences Laboratoire d Informatique Fondamentale Laboratoire des Sciences de l Information et des Systèmes
Entrepôt de données 1. Introduction
Entrepôt de données 1 (data warehouse) Introduction 1 Présentation Le concept d entrepôt de données a été formalisé pour la première fois en 1990 par Bill Inmon. Il s agissait de constituer une base de
CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS
CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS Nazih Selmoune (*), Zaia Alimazighi (*) [email protected], [email protected] (*) Laboratoire des systèmes
Introduction au développement SharePoint. Version 1.0
Introduction au développement SharePoint Version 1.0 Z 2 Introduction au développement SharePoint 09/05/09 Sommaire 1 SharePoint : les bases... 3 1.1 Débuter sous SharePoint... 3 1.2 Connaissances Requises...
IT203 : Systèmes de gestion de bases de données. A. Zemmari [email protected]
IT203 : Systèmes de gestion de bases de données A. Zemmari [email protected] 1 Informations pratiques Intervenants : Cours : (A. Zemmari [email protected]) TDs, TPs : S. Lombardy et A. Zemmari Organisation
Pentaho Business Analytics Intégrer > Explorer > Prévoir
Pentaho Business Analytics Intégrer > Explorer > Prévoir Pentaho lie étroitement intégration de données et analytique. En effet, les services informatiques et les utilisateurs métiers peuvent accéder aux
GOUVERNANCE DES IDENTITES ET DES ACCES ORIENTEE METIER : IMPORTANCE DE CETTE NOUVELLE APPROCHE
GOUVERNANCE DES IDENTITES ET DES ACCES ORIENTEE METIER : IMPORTANCE DE CETTE NOUVELLE APPROCHE RÉSUMÉ Depuis des années, les responsables de la sécurité de l information et les responsables opérationnels
Analyse comparative entre différents outils de BI (Business Intelligence) :
Analyse comparative entre différents outils de BI (Business Intelligence) : Réalisé par: NAMIR YASSINE RAGUI ACHRAF Encadré par: PR. L. LAMRINI Dans le domaine d économies des Big Data et Open Data, comment
Mise à jour : Octobre 2011
FICHE TECHNIQUE Architecture VIGILENS Mise à jour : Octobre 2011 VIGILENS SARL 53, rue Vauban F 69006 LYON www.vigilens.net Sommaire 1. Intégration de VIGILENS dans l architecture de l entreprise... 3
Solution. collaborative. de vos relations clients.
Solution collaborative de vos relations clients. Le Collaborative Relationship Management : une autre vision du CRM L un des enjeux majeurs dans les relations qu une entreprise entretient avec ses clients
Modélisation Multidimensionnelle des Tableaux de Bord Prospectifs
Modélisation Multidimensionnelle des Tableaux de Bord Prospectifs Zaia Alimazighi (*), Nazih Selmoune (*) (Alimazighi, Selmoune)@wissal.dz (*) Laboratoire des systèmes informatiques (LSI), Faculté d Electronique
Entrepôts de données. NEGRE Elsa Université Paris-Dauphine 2015-2016
Entrepôts de données NEGRE Elsa Université Paris-Dauphine 2015-2016 Contexte et problématique Le processus de prise de décision L entrepôt de données Définition Différence avec un SGBD Caractéristiques
Information utiles. [email protected]. webpage : Google+ : http://www.ibisc.univ-evry.fr/ digiusto/
Systèmes de gestion de bases de données Introduction Université d Evry Val d Essonne, IBISC utiles email : [email protected] webpage : http://www.ibisc.univ-evry.fr/ digiusto/ Google+ : https://plus.google.com/u/0/b/103572780965897723237/
Un datawarehouse est un entrepôt de données (une base de données) qui se caractérise par des données :
Page 1 of 6 Entrepôt de données Un article de Wikipédia, l'encyclopédie libre. L'entrepôt de données, ou datawarehouse, est un concept spécifique de l'informatique décisionnelle, issu du constat suivant
PLATEFORME MÉTIER DÉDIÉE À LA PERFORMANCE DES INSTALLATIONS DE PRODUCTION
PLATEFORME MÉTIER DÉDIÉE À LA PERFORMANCE DES INSTALLATIONS DE PRODUCTION KEOPS Automation Espace Performance 2B, rue du Professeur Jean Rouxel BP 30747 44481 CARQUEFOU Cedex Tel. +33 (0)2 28 232 555 -
Atelier 1. Portails documentaires : BioLib et Cemadoc
Atelier 1 Portails documentaires : BioLib et Cemadoc Intervenants Emmanuelle Jannes-Ober, responsable de la médiathèque - Institut Pasteur Odile Hologne, chef du service de l infomation scientifique et
Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales
Ecole des Hautes Etudes Commerciales HEC Alger Évolution des SGBDs par Amina GACEM Module Informatique 1ière Année Master Sciences Commerciales Evolution des SGBDs Pour toute remarque, question, commentaire
L externalisation de vos logiciels entreprises : une solution aux problèmes de coûts, de sécurités et de réactivités
Bureau Virtuel L externalisation de vos logiciels entreprises : une solution aux problèmes de coûts, de sécurités et de réactivités Que ce soit par la communication, par les échanges ou par la collaboration,
Solutions de gestion de la sécurité Livre blanc
Solutions de gestion de la sécurité Livre blanc L intégration de la gestion des identités et des accès avec l authentification unique Objectif : Renforcer la politique de sécurité et améliorer la productivité
WINDOWS AZURE ET LES ÉDITEURS DE LOGICIELS
WINDOWS AZURE ET LES ÉDITEURS DE LOGICIELS GUIDE POUR LES DÉCIDEURS DAVID CHAPPELL JUILLET 2009 PARRAINÉ PAR MICROSOFT CORPORATION TABLE DES MATIERES Les éditeurs de logiciels et le cloud computing...
ETUDE ET IMPLÉMENTATION D UNE CACHE L2 POUR MOBICENTS JSLEE
Mémoires 2010-2011 www.euranova.eu MÉMOIRES ETUDE ET IMPLÉMENTATION D UNE CACHE L2 POUR MOBICENTS JSLEE Contexte : Aujourd hui la plupart des serveurs d application JEE utilise des niveaux de cache L1
Intelligence d affaires nouvelle génération
Intelligence d affaires nouvelle génération Sept étapes vers l amélioration de l intelligence d affaires par l entremise de la recherche de données À PROPOS DE CETTE ÉTUDE Les approches traditionnelles
IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21
IODAA de l 1nf0rmation à la Décision par l Analyse et l Apprentissage IODAA Informations générales 2 Un monde nouveau Des données numériques partout en croissance prodigieuse Comment en extraire des connaissances
BUSINESS INTELLIGENCE
GUIDE COMPARATIF BUSINESS INTELLIGENCE www.viseo.com Table des matières Business Intelligence :... 2 Contexte et objectifs... 2 Une architecture spécifique... 2 Les outils de Business intelligence... 3
Résumé CONCEPTEUR, INTEGRATEUR, OPERATEUR DE SYSTEMES CRITIQUES
Aristote ----- Cloud Interopérabilité Retour d'expérience L A F O R C E D E L I N N O V A T I O N Résumé Les systèmes d'information logistique (SIL) sont des outils qui amènent des gains de productivité
S8 - INFORMATIQUE COMMERCIALE
S8 - INFORMATIQUE COMMERCIALE Les savoirs de l Informatique Commerciale doivent être abordés en relation avec les autres savoirs (S4 à S7). Les objectifs généraux sont : o de sensibiliser les étudiants
L Edition Pilotée XL
L Edition Pilotée XL Piloter son activité, une nécessité Processus décisionnel: «Exploiter les données de l entreprise dans le but de faciliter la prise de décision» Etre informé en permanence sur l état
La dernière base de données de Teradata franchit le cap du big data grâce à sa technologie avancée
Communiqué de presse Charles-Yves Baudet Twitter: Les clients de Teradata Teradata Corporation peuvent [email protected] tirer parti de plusieurs + 33 1 64 86 76 14 + 33 (0) 1 55 21 01 48/49 systèmes,
Comment gérer toutes mes tâches logicielles d automatisation dans un seul environnement?
Comment gérer toutes mes tâches logicielles d automatisation dans un seul environnement? Avec Totally Integrated Automation Portal : un seul environnement de développement intégré pour toutes vos tâches
Hervé Couturier EVP, SAP Technology Development
Hervé Couturier EVP, SAP Technology Development Hervé Biausser Directeur de l Ecole Centrale Paris Bernard Liautaud Fondateur de Business Objects Questions à: Hervé Couturier Hervé Biausser Bernard Liautaud
D une part, elles ne peuvent faire table rase de la richesse contenue dans leur système d information.
PACBASE «Interrogez le passé, il répondra présent.». Le Module e-business Les entreprises doivent aujourd hui relever un triple défi. D une part, elles ne peuvent faire table rase de la richesse contenue
INTRODUCTION AUX TECHNOLOGIES D INGENIERIE DES DONNEES DIRIGEE PAR LES MODELES
INTRODUCTION AUX TECHNOLOGIES D INGENIERIE DES DONNEES DIRIGEE PAR LES MODELES Les contenus de ce document sont la propriété exclusive de la société REVER. Ils ne sont transmis qu à titre d information
MyReport, une gamme complète. La Business Intelligence en toute simplicité : Concevez, partagez, actualisez! pour piloter votre activité au quotidien.
MyReportle reporting sous excel La Business Intelligence en toute simplicité : Concevez, partagez, actualisez! MyReport, une gamme complète pour piloter votre activité au quotidien. En rendant les données
Cours Base de données relationnelles. M. Boughanem, IUP STRI
Cours Base de données relationnelles 1 Plan 1. Notions de base 2. Modèle relationnel 3. SQL 2 Notions de base (1) Définition intuitive : une base de données est un ensemble d informations, (fichiers),
Développer des Applications Internet Riches (RIA) avec les API d ArcGIS Server. Sébastien Boutard Thomas David
Développer des Applications Internet Riches (RIA) avec les API d ArcGIS Server Sébastien Boutard Thomas David Le plan de la présentation Petit retour sur les environnements de développement ArcGIS Server
