Curriculum Vitae. Dr. Julien Aligon

Dimension: px
Commencer à balayer dès la page:

Download "Curriculum Vitae. Dr. Julien Aligon"

Transcription

1 Curriculum Vitae Dr. Julien Aligon 1

2 Table des matières 1 Profil Général Cursus Expérience professionnelle Compétences techniques Activités d Enseignement Aperçu des actitivités Détails des enseignements Autres activités d enseignement Activités de Recherche Introduction Contexte Général de ma Thèse Définitions de Mesures de Similarité à Trois Niveaux Proposition d un Système de Recommandation de Sessions OLAP, basé sur des Mesures de Similarité Définitions de Mesures de Qualité pour la Recommandation de Sessions OLAP Perspectives de recherche de ma thèse Un Outil pour l Aide à la Conception de Sessions Un Benchmark pour les sessions OLAP Adaptation du Système de Recommandation dans d autres contextes Personnalisation de requêtes OLAP Extraction de règles d association Filtrage des règles Traduction des règles en préférences Extraction de Motifs Fréquents Appliquée aux Données de Renault Perspectives de travail sur la Fouille de Traces Utilisateurs Autres activités de recherche Publications 21 A Pièces jointes au dossier 23 2

3 1 Profil Général 1.1 Cursus 2010/2013 Doctorat de l Université François Rabelais Tours, spécialité informatique, Similaritybased Recommendation of OLAP Sessions. Thèse réalisée au Laboratoire Informatique (LI, EA 6300, équipe BDTLN), soutenue le 13 décembre 2013 (Mention Très Honorable). 2008/2010 Master Système d Information et Analyse Décisionnelle (SIAD) de l Université François Rabelais Tours (Mention Assez Bien). Stage de recherche réalisé au Laboratoire Informatique (LI, EA 6300, équipe BDTLN) de l Université François Rabelais Tours 2005/2008 Licence Informatique de l Université François Rabelais Tours (Mention Assez Bien) 2005 Baccalauréat Scientifique (Mention Assez Bien), Lycée Saint- Joseph, Vendôme (41) 3

4 1.2 Expérience professionnelle depuis mars 2015 Post-Doctorat au LINA (Laboratoire Informatique de Nantes), équipe DUKe. Il s agit, à l aide de techniques de fouille de données, d extraire les informations pertinentes issues de données textuelles rattachées à des objets du patrimoine français. Ces données sont hébergées par la société TOPIC-TOPOS et sont consultables sur un site internet public. L objectif, à terme, est de pouvoir recommander des objets du patrimoine à des utilisateurs du site. sept févr Ingénieur de Recherche, à l Université François Rabelais Tours ATER à temps complet (192 heures équivalent TD), à l Université François Rabelais Tours Doctorant Contractuel à Charge d enseignement (DCACe, Bourse Ministérielle, 192 heures équivalent TD), à l Université François Rabelais Tours. Jan-Fév 2012 Juil-Aout 2009 Stage de recherche de quatre semaines au Lucentia Research Group de l Université d Alicante (Espagne), encadré par le Pr. Juan Trujillo. Ce stage a permis d initier une approche pour résumer et naviguer entre des logs de requêtes OLAP. 100 heures d enseignement auprès des détenus de la maison d arrêt de Blois afin de leur faire valider le B2I (Brevet Informatique et Internet), dans le cadre d un stage non obligatoire en Master 1 SIAD. 1.3 Compétences techniques Calculs parallèles et distribués Formation à Hadoop/MapReduce Fouille de données Fouille de traces, extraction de règles d association/séquences fréquentes, mesures de similarités, clustering etc. Décisionnel Entrepôts de données, OLAP, Reporting, API Mondrian Langage de programmation Java, Java EE, PHP, Javascript Méthodologie UML, Design Pattern 2 Activités d Enseignement 2.1 Aperçu des actitivités Mes trois années de doctorat et mon année d ATER à temps complet m ont permis d enseigner au département Informatique de l Antenne Universitaire de Blois sur 4

5 sur toutes les années de Licence (L1, L2, L3, L3 Professionnelle Qualité et Sécurité des Système d Information (QSSI)) mais aussi sur toutes les années de Master (M1, M2 Système d Information et Aide à la Décision (SIAD)) ainsi qu en Master 2 BI (Business Intelligence, formation en anglais). Une bonne partie de mes enseignements est consacrée au langage objet Java mais également aux entrepôts de données et plus généralement aux bases données. Le tableau présenté ci-dessous récapitule l ensemble des enseignements effectués entre 2010 et 2014 pour chaque année d étude. Année : ATER TP TD CM Eq. TD Méthodologie : ateliers pédagogiques - L1 Maths-Info Structures de données et de programme - L1 Maths-Info Génie Logiciel - L1 Maths-Info 8 8 Tutorat personnalisé - L1 Maths-Info 1 1 Conception Objet - L2 Info Développement Objet - L3 Info Complexité et graphes - L3 Info Bases de données - L3 Pro QSSI Modélisation Multidimensionnelle - M1 SIAD Projet Décisionnel - M1 SIAD Entrepôts de données & analyse en ligne - M2 SIAD 6 4 Intégration et qualité des données - M2 SIAD Année : DCACe TP TD CM Eq. TD Méthodologie : ateliers pédagogiques - L1 Maths-Info Structures de données et de programme - L1 Maths-Info Tutorat personnalisé - L1 Maths-Info 1 1 Conception Objet - L2 Info Bases de données - L3 Pro QSSI Entrepôts de données & analyse en ligne - M2 SIAD 6 6 Intégration et qualité des données - M2 SIAD Année : DCACe TP TD CM Eq. TD Méthodologie : ateliers pédagogiques - L1 Maths-Info Structures de données et de programme - L1 Maths-Info Tutorat personnalisé - L1 Maths-Info 1 1 Conception Objet - L2 Info Bases de données - L3 Pro QSSI Entrepôts de données & analyse en ligne - M2 SIAD Data Warehouses - M2 BI Année : DCACe TP TD CM Eq. TD Méthodologie : ateliers pédagogiques - L1 Maths-Info Structures de données et de programme - L1 Maths-Info Logique pour l informatique - L2 Info 4 4 Conception Objet - L2 Info ECS - L2 Info Total : 384 5

6 Le détail de chacune des activités est donné Section 2.2. D un point de vu factuel, on peut résumer que, globalement, j ai eu à réaliser 90% des TPs, 65% des TDs et 33% des CMs. 2.2 Détails des enseignements Méthodologie : ateliers pédagogiques - L1 Maths-Info - 58 h éq. TD Pendant mes quatre années d enseignement, j ai eu la responsabilité de l enseignement de la méthodologie en L1 Mathématiques-Informatique. Cet enseignement a pour objectif de fournir aux étudiants de L1 les bons réflexes de programmation au travers d un projet Java encadré sur chaque séance. Dans un soucis de lier les concepts vus en mathématiques et en programmation Java, j ai proposé aux étudiants d implémenter des algorithmes simples de chiffrement. Afin de rendre également ce projet plus ludique, j ai créé une application graphique permettant aux étudiants de facilement manipuler les algorithmes qu ils ont programmés. Cela permet aussi de montrer aux étudiants que l interaction avec un programme informatique ne se réalise pas qu avec une simple console. Structures de données et de programme - L1 Maths-Info - 73 h éq. TD Sous la responsabilité du Dr. Mohamed Taghelit, j ai eu la charge d enseigner pendant les quatre dernières années la gestion des fichiers en Java aux L1 Mathématiques- Informatique. D autres concepts nécessaires à la bonne compréhension de la gestion des fichiers sont également abordés comme le principe des hiérarchies des classes, ou bien le gestionnaire d exception en Java. J ai également participé à l élaboration des sujets d examen ainsi qu à leurs corrections. Génie Logiciel - L1 Maths-Info - 8 h éq. TD Sous la responsabilité du Pr. Thomas Devogele, j ai eu la charge d enseigner des TDs sur les bonnes pratiques de débogage auprès des L1 Mathématiques-Informatique, pour l année Logique pour l informatique - L1 Maths-Info - 4 h éq. TD Sous la responsabilité du Pr. Jean-Yves Antoine, j ai assuré deux séances de TD auprès des L2 Informatique (en ) concernant la programmation logique à l aide de l outil SWI- Prolog. L objectif pour les étudiants concernant ces TDs est de mettre en pratique les concepts théoriques du cours, que sont notamment la déduction et la récursivité. J ai également participé à l élaboration des sujets d examen ainsi qu à leurs corrections. Tutorat personnalisé - L1 Maths-Info - 3 h éq. TD J ai eu en charge pendant ces trois dernières années, sous la responsabilité du Pr. Jean-Yves Antoine, de tutorer 4 à 6 étudiants dont le parcours dans le secondaire pouvait laisser prévoir de grandes difficultés en L1 Mathématiques-Informatique. J ai donc été amené à avoir plusieurs rendez-vous tout au long de l année avec chacun d eux pour repérer leurs difficultés, répondre à leurs inquiétudes mais également leur conseiller des voies de réorientation. 6

7 ECS - L2 Maths-Info - 16 h éq. TD Cet enseignement réalisé en a pour but de fournir des connaissances avancées en Java et Web pour les étudiants de L2 Informatique, ayant pour projet de finir leur formation de licence informatique à l étranger (programme ECS). J ai notamment abordé avec les étudiants les concepts de threads pour la programmation Java ainsi que le langage de script PHP pour le Web. Les étudiants ont eu à réaliser un mini-projet pour chacun de ces concepts. Conception Objet - L2 Info h éq. TD Sous la responsabilité du Pr. Thomas Devogele, j ai eu en charge d enseigner les concepts de base en interface graphique Java (API SWING) auprès des L2 Informatique entre les années 2010 et Une grande partie de cette charge a été consacrée à l encadrement d un projet que j ai rédigé. Ce projet demande aux étudiants d ajouter une interface graphique à un précédent projet assuré par le Pr. Thomas Devogele. J ai également participé à l élaboration des sujets d examen ainsi qu à leurs corrections. Pour l année , cet enseignement a été entièrement assuré sous ma responsabilité. Développement Objet - L3 Info - 31 h éq. TD Cet enseignement a été porté sous la responsabilité conjointe du Dr. Chedlia Chakroun et de moi-même auprès des L3 Informatique pour l année J ai eu notamment en charge d enseigner des concepts poussés, en Java, que sont : les Threads, l API native de Base de Données et l utilisation d une API externe pour la réalisation de statistiques graphiques (JF reechart). J ai réalisé l ensemble des cours (à l exception des Threads) et TPs. Les étudiants ont également eu à réaliser un projet, que j ai rédigé, demandant à construire une application graphique (utilisant l API Swing) et permettant de lancer des requêtes SQL sur une base de données, dont les résultats sont renvoyés à l utilisateur. Diverses statistiques doivent être également produites, portant notamment sur les requêtes passées (stockées dans un log), et affichant par exemple le nombre de tuples en fonction du temps. Complexité et Graphes - L3 Info - 23 h éq. TD Cet enseignement a été porté sous la responsabilité conjointe du Dr. Chedlia Chakroun et de moi-même auprès des L3 Informatique pour l année J ai eu notamment en charge d enseigner une partie des concepts de complexité (les différentes classes de complexité, les problèmes NP-complet, les réductions polynomiales, la programmation dynamique) mais aussi des concepts de théorie des graphes (problème du voyageur du commerce, problème du sac à dos). J ai eu également à élaborer un projet sur la réalisation et la comparaison de différentes implémentations relatives au problème du voyageur de commerce (approche optimale, gloutonne et empirique). Bases de données - L3 Pro QSSI - 42 h éq. TD Sous la responsabilité du Pr. Thomas Devogele (et précédemment le Dr. Veronika Peralta), j ai eu en charge l ensemble des TPs de bases de données pour les L3 QSSI. L objectif des ces TPs est d appliquer les concepts vus en cours, à travers l utilisation d une base de données Oracle 11g. Les étudiants doivent notamment créer une base à partir d un schéma de base de données vu précédemment en TD, en prenant notamment en compte les contraintes 7

8 d intégrité possibles. Ils ont également à créer des vues matérialisées ainsi qu à interroger le dictionnaire Oracle. Une fois la base de données créée, ils ont à exprimer plusieurs requêtes en SQL, de difficultés croissantes, où sont notamment abordés les concepts de jointure et de groupement. Chaque TP étant noté, j ai eu la charge de corriger chacun d entre eux. Projet Décisionnel - M1 SIAD - 19 h éq. TD Sous la responsabilité du Dr. Veronika Peralta, j ai participé au suivi de projet d étude des Master 1 SIAD pour l année L objectif de ce projet était de développer une application d aide au suivi des étudiants et de l analyse de leurs réussites, à destination des enseignants du département informatique. Le coeur de ce projet était notamment de construire un entrepôt de données, intégrant différentes informations sur les étudiants, et permettant donc de naviguer parmi ces données. J ai eu notamment en charge d évaluer la partie veille technologique et surtout la partie gestion de projet (diagramme de Gantt, analyse des risques) des différents groupes d étudiants, pour chaque phase du projet. Chaque fin de phase donnait également lieu à une soutenance en anglais que j évaluais pour partie. Modélisation Multidimensionnelle - M1 SIAD h éq. TD Sous la responsabilité du Dr. Veronika Peralta, j ai au en charge les TPs de modélisation multidimensionnelle auprès des Master 1 SIAD pour l année Ces TPs reprennent, en partie, ceux effectués dans l enseignement Entrepôts de données & analyse en ligne pour les M2 SIAD entre les années (les concepts de base en modélisation multidimensionnelle sont désormais abordés dès le Master 1). Plus particulièrement, il s agit ici de faire pratiquer par les étudiants la mise en place de schémas multidimensionnels. Entrepôts de données & analyse en ligne - M2 SIAD - 16 h éq. TD Sous la responsabilité du Dr. Veronika Peralta et du Dr. Patrick Marcel, j ai eu en charge les TPs d analyse en ligne auprès des M2 SIAD pendant ces trois dernières années. Au cours de ces TPs, j ai abordé avec les étudiants la mise en place de schémas multidimensionnels en utilisant l outil Schema Workbench (Pentaho) pour une utilisation avec le serveur OLAP Mondrian (Pentaho). Les étudiants ont eu également à optimiser un entrepôt de données, préalablement construit, en utilisant l outil Aggregation Designer (Pentaho), et permettant de matérialiser les agrégats intéressants (qui réduiront le temps d exécution d une requête OLAP). J ai également eu l opportunité de réaliser des TPs autour des stratégies de stockage pour les bases de données relationnelles (orientées ligne, avec Oracle et colonne avec MonetDB) hébergeant des entrepôts de données. Les étudiants devaient lancer les même requêtes OLAP sur ces deux types de bases de données, comparer leurs temps d exécution, et étudier l impact de la création d index, pour la stratégie orientée ligne, vis à vis de l orientée colonne. J ai aussi participé à l élaboration, le suivi, ainsi qu à la correction des projets. Ces projets, renouvelés chaque année, sont systématiquement basés sur des données réelles provenant de différents organismes. En l occurence, j ai participé, pour l année , à plusieurs réunions avec l Observatoire de l Economie et des Territoires de Loir-et-Cher pour aboutir à l obtention de données pertinentes à analyser. 8

9 Intégration et qualité des données - M2 SIAD - 14 h éq. TD Sous la responsabilité du Dr. Veronika Peralta, j ai eu notamment en charge les TPs d intégration et de qualité des données entre les années La qualité et l intégration des données se sont faites par l utilisation des outils proposés par Talend, à partir des données brutes issues du projet Entrepôts de données & analyse en ligne. A noter que j ai également assuré les TPs d intégration et de qualité des données pour l année (intégré dans la formation Entrepôts de données & analyse en ligne), qui a notamment donné lieu à l élaboration d un tutoriel en anglais pour l utilisation de l ETL proposé par Oracle (OWB) à destination des étudiants. Data Warehouses - M2 BI - 6 h éq. TD Cet enseignement qui s est déroulé en (sous la responsabilité du Dr. Veronika Peralta et du Dr. Patrick Marcel), reprend les même objectifs décrits pour les enseignements Entrepôts de données & analyse en ligne ainsi que Intégration et qualité des données des M2 SIAD. La différence notable est que chaque TP que j ai assuré devait se dérouler en anglais (autant sur la rédaction des sujet, qu à l oral) puisque cette formation était proposée aux anglophones. 2.3 Autres activités d enseignement Voici décrit ci-dessous les activités complémentaires auxquelles j ai participé : Visite de stage en entreprise pour un étudiant de L3 QSSI Evaluation des stages de L3 (écrit + oral) Séminaire sur le doctorat et la recherche auprès des L1 et L3 Séminaire de recherche auprès des M2 SIAD Promotion de l enseignement supérieur et du département informatique auprès des lycéens de la ville de Vendôme (41) Participation à des forums lycéens sur Blois (41) Participation aux portes ouvertes de l Université François-Rabelais Tours 3 Activités de Recherche 3.1 Introduction Mes travaux de recherche effectués lors des cinq dernières années s articulent très clairement autour de la thématique Masse de données et, plus particulièrement, sur l analyse de traces utilisateurs et les systèmes de recommandations. Mes travaux de thèses, développés Section 3.2, portent sur la problématique de recommandation de séquences de requêtes, dans un contexte multidimensionnel (OLAP) au travers de techniques par filtrage collaboratif. Pendant mes années de doctorat, j ai également été amené à travailler sur la personnalisation de requêtes OLAP, développé Section 3.4. En outre, ces travaux de recherche m ont aussi amenés à travailler dans un contexte international, à de multiples reprises, avec une équipe italienne de l université de Bologne (Prof. Stefano Rizzi et Matteo Golfarelli). Dans le cadre de mes perspectives de thèse, j ai aussi été amené à implémenter intégralement, en langage Java, une appli- 9

10 cation d assistance à la composition de requêtes et de sessions OLAP (détaillé Section 3.3.1). Mes travaux issus de mon poste d ingénieur de recherche, et détaillés Section 3.5, portent sur l extraction de motifs fréquents, sur plateforme Hadoop, à partir de logs web de configurations de voitures fournis par la société Renault. En particulier, la liste de mes publications est disponible Section Contexte Général de ma Thèse Les travaux de recherche de ma thèse portent sur l aide à la conception de sessions d analyse dans les bases de données multidimensionnelles. Plus particulièrement, l OLAP (On-Line Analytical Processing) est le paradigme principal pour accéder aux données multidimensionnelles dans les entrepôts de données. L OLAP fournit notamment un ensemble d opérations qui transforment une requête multidimensionnelle en une autre, de sorte que les requêtes OLAP sont normalement formulées sous la forme de séquences appelées Sessions OLAP. Alors qu il est universellement reconnu que les outils OLAP ont un rôle clé dans l exploration souple et efficace des cubes multidimensionnels dans les entrepôts de données, il est aussi communément admis que le nombre important d agrégations et sélections possibles, qui peuvent être exploités sur les données, peut désorienter l expérience utilisateur. Ainsi, mon travail porte sur la problématique de recommandation de requêtes, en collaboration avec une équipe de recherche des professeurs Stefano Rizzi et Matteo Golfarelli de l université de Bologne (Italie). Une des suppositions de l approche est que toute la séquence de requêtes OLAP est une valeur en soi car il donne à l utilisateur une vue différente et complémentaire de l information. Pour cette raison, nous proposons une approche dont le but est de recommander une séquence de requêtes OLAP. En cohérence avec les approches de filtrage collaboratif, l objectif est de réutiliser les sessions passées réalisées par d autres utilisateurs. Ainsi, le système de recommandation est composé de trois phases dont la première sélectionne un ensemble de recommandations possibles parmi les sessions passées (phase de Selection), puis les classes (phase de Ranking) et finalement adapte la meilleure recommandation au contexte de la session courante (phase de T ailoring). Pour prendre en compte les sessions précédentes dans le système de recommandation, nous proposons de définir des mesures de similarité entre les sessions. Ces mesures de similarité sont utilisées lors des phases de Selection et Ranking en respectant l aspect séquentiel des sessions. La comparaison des sessions OLAP est fondée sur des besoins spécifiques afin de proposer des mesures de similarité entre les sessions, adaptées au contexte OLAP. Ces exigences ont conduit à proposer une approche à deux niveaux, comprenant une mesure de similarité entre les requêtes et une mesure de similarité entre séquences (basée sur l algorithme de Smith-Waterman pour aligner des sous-séquences). Pour évaluer la pertinence du système de recommandation et des mesures de similarité, un ensemble de mesures de qualité est proposé (tels que l adaptation, la nouveauté, l évidence, etc.), définies à partir de critères de qualité exprimés dans le cadre de la recommandation de sessions. Bien évidemment, le système de recommandation, mais aussi les propositions de mesures de similarité doivent pouvoir être testés à partir de sessions 10

11 passées. Mes travaux ont donc mené également à proposer un ensemble de générateurs de logs synthétiques pour tester le système et les mesures. Des logs réels ont aussi été obtenus pour montrer que l approche est efficace à partir d analyse diverses. En outre, les évaluations ont montré que le système de recommandation est capable de proposer des sessions pertinentes, bien adapté au contexte de la session courante, tout en étant informative pour l utilisateur. Les détails des différents travaux de recherche énumérés dans cette section, à savoir les définitions de mesures de similarités à trois niveaux, le système de recommandation mais aussi la définition de critères de qualité pour les recommandations, sont disponibles Sections 3.2.1, and Définitions de Mesures de Similarité à Trois Niveaux Le système de recommandation proposé repose uniquement sur l utilisation de l expression de requête saisie par l utilisateur, notamment pour des raisons d efficacité en terme de temps de calcul. Ainsi la définition de requête repose sur un modèle basé sur des fragments et est composé de trois éléments à savoir : le group-by set (correspondant aux niveaux d analyses choisis pour chaque hiérarchie disponible sur un cube de données), l ensemble des prédicats de sélections et l ensemble des mesures (permettant de réaliser des agrégations). La mesure de similarité entre requêtes doit par conséquent prendre en compte cette définition. Pour cela, cette mesure combine une mesure de similarité par type d éléments du modèle de requête. La similarité entre group-by set repose principalement sur les distances entre les niveaux des hiérarchies, au travers du treillis des group-by set. La similarité entre ensemble de prédicats de sélections repose à la fois sur les distances entre niveaux de prédicats mais aussi sur les différences de valeurs de sélections. La similarité entre ensemble de mesures repose sur l utilisation classique de l Index de Jaccard. Plusieurs similarités entre sessions ont été proposées pour ce travail, intégrant la mesure de similarité entre requêtes. En particulier, chacune de ces propositions est une extension au contexte de l OLAP de mesures classiques disponibles en Recherche d Information tels que le Coefficient de Dice, TF-IDF, la Distance de Levenshtein, et l alignement de sous-séquences. Ces différentes propositions ont été comparées entre elles par des tests subjectifs (auprès d étudiants et de chercheurs) et objectifs (en produisant différents types de comportements de sessions similaires). Les résultats ont très clairement montrés que l alignement de sous-séquences (basé sur l algorithme de Smith- Waterman) surpassait toutes les autres mesures. Plusieurs similarités entre groupes de sessions sont aussi proposées, intégrant la mesure de similarité entre sessions. Chacune de ces mesures est une extension de mesures classique tels que l Accuracy (basé sur la précision et le rappel), la distance de Hausdorff et l index de Jaccard Proposition d un Système de Recommandation de Sessions OLAP, basé sur des Mesures de Similarité Le système de recommandation proposé est composé des trois phases suivantes : 11

12 1. La phase de Selection identifie dans un log un ensemble de sessions constituant des futures pertinents pour la session courante. 2. La phase de Ranking détermine parmi ces sessions, celle dont une sous-séquence sera une recommandation de base. 3. La phase de T ailoring adapte la recommandation de base à la session courante. En particulier, la phase de Selection identifie l ensemble des sessions pertinentes en comparant chaque session du log avec la session courante. Pour ce faire, la mesure de similarité, basé sur l alignement de séquences, est utilisée de telle sorte qu un alignement avec la fin des requêtes de la session courante et le début des requêtes des sessions du log sera avantagé. Ainsi, la séquence de requêtes suivant la sous-séquences de la session du log alignée sera considéré comme une possible recommandation. La phase de Ranking affecte un score pour chaque session obtenue dans la phase précédente. L idée est de spécifier un score important pour les sessions incluant des requêtes retrouvées fréquemment parmi les autres sessions proches, pour une même position dans la séquence de requête. L extension de l alignement de sous-séquences est ici aussi utilisée. La phase de T ailoring cherche à adapter le contexte de la recommandation ayant le meilleure score de la phase de Ranking avec le contexte de la session courante. Pour cela, deux types de règles d association sont extraites. Le premier extrait les règles à partir de la session courante et de la session du log incluant la recommandation. En effet, l idée est de pouvoir trouver quels sont les fragments de requêtes fréquemment associées entre ces deux sessions. Ainsi, les fragments de la recommandation correspondant à des fragments de corps de règles sont remplacées par des fragments de session courante, situées en tête de règle. Le second type de règle identifie les invariant de la session courante en cherchant les associations fréquentes entre fragments de ses différentes requêtes. Ainsi si un fragment de la recommandation correspond à un fragment de corps de règle, alors le fragment de tête pourra être ajouté. Finalement, le système de recommandation fourni à l utilisateur des recommandations synthétisé, à partir de sessions passées Définitions de Mesures de Qualité pour la Recommandation de Sessions OLAP Un ensemble de mesures de qualités sont définie pour vérifier la qualité des recommandations produite par le système. Six mesures de qualités sont proposées, telles que Relevance, F oresight, N ovelty, Adaptation et Obviousness et Accuracy. La mesure de Relevance est simplement le score obtenu pendant la phase de Ranking. La mesure de F oresight indique à quel point la dernière requête de la session courante est loin de la première requête de la session recommandée. La mesure de N ovelty identifie comment la session recommandée est distante des sessions du log. La mesure d Adaptation cherche à savoir à quel point la session recommandée est bien adaptée au contexte de la session courante en terme de fragments. La mesure d Obviousness indique la proportion de requêtes, de la session recommandée, retrouvée à l identique dans le session courante. La mesure d Accuracy, classique dans les techniques centrée utilisateur pour 12

13 mesurer la qualité d un système, cherche à savoir si la session recommandée est proche de celle attendue. Les tests réalisés à partir de ces mesures, notamment basés sur des logs synthétiques et réels en utilisant le principle de la validation croisée, ont montrée que les recommandation fournies sont très proches de la session courante en terme d Adaptation et de F oresight, et proposent très peu de requêtes identiques à la session courante (Obviousness) et semblent informatives pour l utilisateur (N ovelty). En particulier, les tests d Accuracy ont montré que la phase de T ailoring améliorait sensiblement les résultats en terme de précision et et rappel, notamment pour des logs incluant des sessions très éparses. 3.3 Perspectives de recherche de ma thèse Un Outil pour l Aide à la Conception de Sessions Quand un utilisateur commence tout juste à réaliser sa session, le système de recommandation ne peut généralement pas proposer de requêtes puisque peu de requêtes sont disponibles. Le problème de Démarrage à Froid, bien connu dans le contexte de la recommandation, pourrait être en partie évité grâce à des techniques de résumé (que j ai développé dans [10] et [8]). En effet, l idée serait qu un utilisateur puisse explorer les requêtes passées dans le but d identifier des requêtes intéressantes. Mais puisque la taille d un log de requêtes est très importante, l utilisateur pourrait être submergé par la quantité d information disponible. Ainsi, seules les requêtes les plus pertinentes du log seraient présentées à l utilisateur, sous une forme organisée, et dont des opérateurs de navigation permettraient de les explorer facilement. Une première expérience a été réalisée dans [7] et présente un outil OLAP (nommé F alseto pour Former AnalyticaL Sessions for less Tedious Olap ) permettant d assister un utilisateur à la composition de requêtes et de sessions, à l aide de fonctionnalités holistiques. En effet, l utilisateur a la possibilité de résumer, naviguer, lancer des requêtes et réutiliser des sessions passées. Dans les détails, cet outil est basé sur un framework incluant : un langage d édition de requêtes OLAP permettant d ajouter/supprimer un élément (group-by set, conditions de sélections, mesures), mais aussi d opérateur de navigation similaires à ceux que l on peut traditionnellement trouver en OLAP (drill-down, roll-up, slice-and-dice) un langage de manipulation de logs incluant cinq opérateurs, inspirés de l algèbre relationnel, que sont la sélection σ, le groupement/aggrégation π, la jointure, l union et la différence \. Cette relation de spécialisation est ainsi à la base du système de résumé permettant d en avoir un aperçu fidèle, mais concis. En outre, l utilisateur a la possibilité d utiliser des fonctionnalités holistiques, implémentés dans F alseto, permettant de : fouiller dans les logs : l outil implémente deux versions de l opérateur de sélection σ θ,s. En fonction d une session s, le système permet de filtrer le log à l aide d une fonction θ qui peut être soit une mesure de similarité (l implémentation est basé 13

14 sur l extension de Smith-Waterman, comme décrit Section 3.2.1) ou une relation de spécialisation entre sessions. La relation de spécialisation entre sessions, elle même basé sur une relation de spécialisation entre requêtes (voir [8] pour plus de détails), permet de facilement décrire des groupes de requêtes ou de sessions à différents niveaux de détails. résumer et navigation dans les logs : l outil implémente l opérateur de groupement/aggregation π θ (s, s ) pour naviguer dans un log de manière conviviale. En effet, à l aide de techniques de clustering, des paires de sessions similaires sont formés et l opérateur π θ (s, s ) permet de les aggréger afin d en avoir une vue plus générale (à l aide de la relation de spécialisation décrite ci-dessus). recevoir des recommandations : le système de recommandation proposé pendant ma thèse est inclus dans cet outil (voir Section 3.2). Figure 1 Interface utilisateur de l outil F alseto Puisque cet outil repose sur l exploitation de logs, une collecte de sessions d analyse a aussi été conduite auprès d étudiants de Master. A cette fin, un protocole de récolte de sessions a été proposé et plusieurs questionnaires, avec un nombre limité de questions, construits autour d un même cube de données, ont été distribués aux étudiants afin de conduire eux-mêmes leurs analyses. Cet ensemble de sessions obtenues a ensuite permis de valider les différentes approches proposées. L implémentation et les éléments nécessaires au fonctionnement de l outil sont disponibles à l adresse suivante : La Figure 1 donne un aperçu de l interface utilisateur. 14

15 3.3.2 Un Benchmark pour les sessions OLAP Pour mener et simuler des tests, il semble important d avoir à disposition une plateforme de référence pour vérifier la qualité de sessions d analyse sur un cube de données. En effet, bien que la qualité des données soit un domaine largement étudié, la qualité des processus d interrogation de bases de données ne l ai pas encore. Ainsi, la proposition de facteurs de qualité pour les requêtes et sessions d analyse pourrait permettre le développement d une plateforme vérifiant et validant des approches centrées utilisateurs. Plus précisément, cette plateforme pourrait mesurer dans quelles proportions les approches sont efficaces en terme de pertinence des réponses, d effort fourni pour effectuer l analyse OLAP etc. En outre, cela supposerait d étendre la définition de session en la complétant par le plus d information possibles, tel que les opérations OLAP Adaptation du Système de Recommandation dans d autres contextes Puisque d autres domaines, autres que l OLAP, sont aussi confrontés au problème de séquences complexes, il semble intéressant d adapter le système de recommandation à ces contextes. Par exemple, dans le contexte de la fouille de données, les séquences complexes peuvent être vues comme des séquences de tâches de fouilles de données. Bien évidemment, la similarité de sessions à deux-niveaux doit être adaptée à chaque domaine spécifique. 3.4 Personnalisation de requêtes OLAP Le but de la personnalisation est de fournir une information pertinente à un utilisateur ou groupes d utilisateurs avec la meilleure interaction possible. Dans le contexte OLAP, la personnalisation semble bénéfique, parce que les requêtes peuvent être très complexes et peuvent retourner un nombre important de données. Dans le but de rendre l expérience utilisateur la plus agréable possible, une approche proactive de personnalisation de requêtes a été proposée. Cette approche associe un langage de requête basé sur MDX pour exprimer des préférences et des techniques de fouille de données pour annoter automatiquement une requête courante. En premier lieu, les requêtes MDX, effectué par un utilisateur donné et stockées dans un log, sont fouillés pour en extraire un ensemble de règles d associations qui reflètent les clauses de requêtes fréquentes (détaillé Section 3.4.1). Puis, selon une requête utilisateur spécifique, un sous-ensemble de règles pertinentes et valides est sélectionné (détaillé Section 3.4.2). Finalement, les règles sélectionné sont traduites en une préférence qui est utilisé pour annoter la requête de l utilisateur (détaillé Section 3.4.3) Extraction de règles d association Pour des raisons d efficacité, la phase d extraction de règles d association est réalisé off-line, avant que la session de requêtes courante ne commence. Cette phase consiste à exécuter un algorithme de fouille de données sur chaque log de requête utilisateur pour en extraire un ensemble R de règles d association, dont les valeurs de support et confiance sont au dessus d un certain seuil. 15

16 3.4.2 Filtrage des règles Quand l utilisateur est en train d écrire sa requête MDX q, un sous-ensemble de règles R q R est sélectionné. Chaque règle dans R q est pertinente, c est à dire que son antécédent correspond à un élément de la requête q, et valide, c est à dire que la préférence pourrait être traduite dans q pour ordonner les faits retournés par q. Afin d exprimer une complexité de préférences désirée, l utilisateur a la possibilité de choisir un nombre α (entier positif) de préférences. A partir de R q, un ensemble d éléments F α de requêtes est généré de manière à ce que α préférences soient incluses dans l expression de préférence général Traduction des règles en préférences Chaque fragment de F α est traduit en un constructeur de base de préférence. Les constructeurs résultants sont ensuite unis et composés, par l utilisation de l opérateur de Pareto, en une expression de préférence p. Ensuite, la requête q est annotée avec l expression de préférence p, traduite à l aide du moteur de préférence mymdx 1, et exécutée. 3.5 Extraction de Motifs Fréquents Appliquée aux Données de Renault Ce travail s est effectué en étroite collaboration entre les sociétés Cyrès (spécialisé dans les structures Hadoop, basé sur le site de Tours), Renault (site de Le Plessis- Robinson) ainsi que les équipes OC (spécialisé dans l optimisation et l ordonnancement) et BDTLN (pour la partie fouille de données) du laboratoire informatique de l université de Tours. Plus précisément, les travaux de ce projet portent sur l extraction de motifs fréquents, sur plateforme Hadoop, à partir de logs web fournis par Renault. En particulier, ces logs contiennent les différentes étapes des utilisateurs configurant une nouvelle voiture au travers du site internet de Renault. L objectif principal est de trouver des motifs fréquents, mais pertinents, permettant d identifier et de décrire des usages pour un modèle de voiture particulier (par exemple, étudier les configurations de voiture les plus demandées). Un premier travail a été d identifier, dans la littérature, des algorithmes de fouille de motifs fréquents adaptés au contexte MapReduce. Classiquement, l objectif de la plupart de ces propositions est de répondre au problème qu est l équilibre de la charge de traitement. Notamment, deux algorithmes efficaces, à savoir BigFim et DistEclat 2, sont proposés. Dist-Eclat utilise un équilibre de charge basé sur un top-k de motifs fréquents générés par l algorithme classique Eclat. Eclat se basant sur une base de données verticale et sur l utilisation de TID-list (liste de transactions se rapportant aux items), 1. Preference-Based Datacube Analysis with myolap, Paolo Biondi and Matteo Golfarelli and Stefano Rizzi, ICDE Frequent Itemset Mining for Big Data, Sandy Moens, Emin Aksehirli and Bart Goethals, Big Data

17 l exécution sous MapReduce peut être efficace si le volume de ces TID-list reste limité. Quant à BigFim, celui-ci équilibre la charge par un top-k de motifs fréquents générés par l utilisation de l algorithme Apriori. L avantage ici est de ne pas avoir à gérer des TID-list. Mais Apriori étant très coûteux, l exécution peut être ralenti si le top-k à explorer est trop important. Ainsi, ces deux algorithmes ont été utilisés dans le cadre de ce projet pour fouiller les logs de configuration. Bien évidemment, et préalablement à tout travail de fouille, un travail de découpage et filtrage des logs a été effectué. En particulier, un travail a été réalisé sur l extraction de sessions à partir des séquences de configuration présentes dans les logs. Ainsi les sessions utilisateurs considérées comme triviales (par exemple, seulement une ou deux requêtes sont présentes) ont permis de filtrer logs initiaux, améliorant ainsi leur qualité. Concernant le problème de la pertinence des motifs fréquents extraits, mais bien que classique dans le domaine de la fouille de données, un travail de filtrage des motifs a également été entrepris. En effet, au vu de la masse de motifs extraits, il est essentiel d en diminuer le nombre et de se focaliser sur les items les plus pertinents pour Renault. Ainsi, la première étape a été de se focaliser sur les motifs clos. En effet, un motif étant clos lorsqu il n a pas le même support que tout super-motif, il permet de définir une représentation condensée et sans perte de l information. Une seconde étape a été de filtrer les singletons possédant une valeur de support très élevée et qui n apportent aucune valeur ajoutée aux motifs extraits. Par exemple, il est facilement compréhensible que Renault considère comme triviale une configuration de voiture incluant un volant à gauche (en France, bien sûr). Le même principe a aussi été effectué pour des ensembles d items très fréquents. Un autre travail, en cours, est d identifier des motifs émergeants à l aide de mesures originales de taux de croissance et de taux d inattendu. L idée est d extraire des motifs fréquents à partir d un ensemble de configurations dites initiales (typiquement les configurations proposées par Renault lors d une première connexion sur le configurateur de voiture) et d un autre ensemble de configurations finales (la voiture désirée par l utilisateur). La comparaison, pour un même motif donné entre ces deux classes de configurations, permet d obtenir un ensemble de motifs émergeants à l aide des mesures de taux de croissance et d inattendu. Plus particulièrement, le taux de croissance d un motif donné est basé sur les différences de support entre les deux classes considérées. Le taux d inattendu est, quant à lui, calculé à partir des taux de croissance des partitions du motif considéré. L extraction de ces motifs émergeant s est, pour l instant, limité à un jeu de données raisonnable (dû à une complexité exponentielle de l algorithme d extraction de motifs émergeants) Le passage à l échelle, à l aide de techniques MapReduce, est à l étude. 3.6 Perspectives de travail sur la Fouille de Traces Utilisateurs Au vu des logs fournis par Renault, différentes pistes restent à explorer. Parmi celles ci, un objectif est de comprendre les usages de configuration de voiture au fil du temps : cela suppose de pouvoir extraire des motifs émergeants pour différentes périodes de temps. 17

18 D autres objectifs concernent l étude des séquences utilisateurs. L extraction de séquences fréquentes permettrait d identifier des cycles possibles de configurations, afin de savoir si les utilisateurs suivent bien un ordre de configuration de voiture supposé. Dans un soucis d améliorer l interaction avec l utilisateur, on pourrait également chercher à identifier les configurations trop complexes et réfléchir ainsi aux moyens à mettre en place pour faciliter la configuration d une nouvelle voiture. Bien évidemment, comme pour l extraction de motifs fréquents, la masse de données à traiter est très volumineuse. Cela implique donc de paralléliser, au mieux, les tâches de fouille de séquences. Etrangement, et au mieux de nos connaissances, il semble que peu de travaux traitent du problème de l adaptation de l extraction de séquences fréquentes au contexte Map/Reduce. Ainsi, un travail en cours est de proposer un algorithme de fouille de séquences, basé sur l algorithme classique de PrefixSpan, adapté à Hadoop. Une autre tâche viserait à établir un état de l art sur les langages de haut niveau (tels que Pig Latin) utilisés au dessus de Hadoop pour conduire des tâches d exploration de données. Cela permettra par la suite de proposer un nouveau langage pour y inclure des fonctionnalités de fouille de données, en particulier d extraction de motifs locaux. 18

19 3.7 Autres activités de recherche Séminaire à l étranger : Présentation d un projet de recherche sur la navigation parmi les requêtes OLAP passées, ainsi que de mes travaux de thèse au Lucentia Research Group, Université d Alicante (Espagne), Janvier Séminaires doctorants : Présentation de mon sujet de thèse, LI, Tours, 20 Mai 2011 (en anglais). Présentation du papier [5], LI, Tours, 17 Février 2012 (en anglais). Présentation du papier [9], LI, Tours, 28 Juin 2013 (en anglais). Séminaire interne : Présentation d algorithmes d extraction de motifs fréquents sur plateforme Hadoop, LI, Tours, 12 Décembre Ecoles d été : Web Intelligence 2010 (WI 2010), Le Web centré sur l utilisateur, Saint-Germain- Au-Mont-d Or, 5 au 9 juillet 2010, France. First European Business Intelligence Summer School (ebiss 2011), July , Ecole Centrale Paris, France. Comité : Membre du comité d organisation des 9ème Journées Francophone sur les Entrepôts de Données et l Analyse en Ligne (EDA), 13 et 14 juin 2013, Blois, France. (Mise en place du site web et du module d inscription) Membre du comité de programme de la session démonstration des 10ème Journées Francophone sur les Entrepôts de Données et l Analyse en Ligne (EDA), 05 et 06 juin 2014, Vichy, France. Responsable de sessions : Responsable de la session Query P rocessing and P hysical Design, Atelier International DOLAP 2014, Shanghaï, Chine. Relectures d articles (en tant que relecteur additionnel) : CIIA 2011 : Third International Conference on Computer Science and its Applications, Saida, Algeria, December 13-15, EGC 2011 : 11ème Conférence Internationale Francophone sur l Extraction et la Gestion des Connaissances, 25 au 29 janvier 2011, Brest, France. ICWIT 2012 : 4th International conference on Web and Information Technologies, Sidi Bel Abbes, Algeria, April 29-30, MoRe-BI 2012 : 2nd International Workshop on Modeling and Reasoning for Business Intelligence, Florence, Italy, October 17, EGC 2013 : 13ème Conférence Internationale Francophone sur l Extraction et la Gestion des Connaissances, 29 janvier - 01 février 2013, Toulouse, France. 19

20 EDA 2013 : 9ème Journée Francophone sur les Entrepôts de Données et l Analyse en Ligne, 13 et 14 juin 2013, Blois, France. ER 2013 : 32nd International Conference on Conceptual Modeling, November 11-13, 2013, Hong Kong. Dawak 2014 : 16th International Conference on Data Warehousing and Knowledge Discovery, September 1-5, 2014, Munich, Germany. EDA 2015 : 11ème Journée Francophone sur les Entrepôts de Données et l Analyse en Ligne, 2 et 3 avril 2015, Bruxelles, Belgique. Nomination : Nominé pour le prix du meilleur papier académique [11]. 20

21 4 Publications Les publications indiquées ci-dessous ont toutes été soumises à un comité de lecture (à l exception de [8] qui est un papier invité). Références Thèse de doctorat [1] Julien Aligon. Similarity-based Recommendation of OLAP Sessions Université François Rabelais Tours, Journaux [2] Julien Aligon, Enrico Gallinucci, Matteo Golfarelli, Patrick Marcel and Stefano Rizzi. A collaborative filtering approach for recommending OLAP sessions. In DSS (Decision Support Systems), Volume 69, January 2015, Pages (Facteur d Impact : en 2013) [3] Julien Aligon, Matteo Golfarelli, Patrick Marcel, Stefano Rizzi and Elisa Turricchia. Similarity Measures for OLAP Sessions. In KAIS, Volume 39, Number (Facteur d Impact : en 2011 et en 2010) Disponible en version on-line : 2Fs #page-1 Chapitre de livre [4] Julien Aligon, Patrick Marcel and Elsa Negre. Summarizing and querying logs of OLAP queries. In Advances in Knowledge Discovery and management, vol. 3 (AKDM-3), post-proceedings of EGC 2011, Studies in Computational Intelligence, Springer Conférences internationales [5] Julien Aligon, Matteo Golfarelli, Patrick Marcel, Stefano Rizzi and Elisa Turricchia. Mining Preferences from OLAP Query Logs for Proactive Personalization. In Proc. 15th East European Conference Advances in Databases and Information Systems, ADBIS LNCS. September [6] Julien Aligon, Patrick Marcel and Elsa Negre. A Framework for Summarizing a Log of OLAP queries. 1st International Conference on Machine and Web Intelligence, ICMWI 2010, special track on OLAP and Datawarehouse. IEEE. October

22 Ateliers internationaux [7] Julien Aligon, Kamal Boulil, Patrick Marcel and Veronika Peralta. A Holistic Approach to OLAP Sessions Composition : The Falseto Experience. In Proceedings of the 17th International Workshop on Data Warehousing and OLAP, DOLAP 2014, Shanghai, China, November 3-7, November [8] Julien Aligon, Dominique Li, Patrick Marcel and Arnaud Soulet. Towards a logical framework for OLAP query log manipulation. In Proc. 6th International Workshop on Personalized Access, Profile Management, and Context Awareness in Databases, PersDB August (invited paper). Conférences nationales [9] Julien Aligon. Gathering Real OLAP Analysis Sessions : A Feedback. In Proc. 9èmes journées francophones sur les Entrepôts de Données et l Analyse en ligne, EDA June (papier court, 21 soumissions, 29% acceptées en version courte). [10] Julien Aligon and Patrick Marcel. Summarizing former sessions for user-centric OLAP. In Proc. 8èmes journées francophones sur les Entrepôts de Données et l Analyse en ligne, EDA June (17 soumissions, 35% acceptées en version longue) [11] Julien Aligon, Patrick Marcel and Elsa Negre. Résumés et interrogations de logs de requêtes OLAP. In Proc. 11ème Conférence Internationale Francophone sur l Extraction et la Gestion des Connaissances, EGC Janvier (131 soumissions, 26% acceptées en version longue) Travaux Annexes [12] Julien Aligon, Matteo Golfarelli, Patrick Marcel, Stefano Rizzi and Elisa Turricchia. OLAP session exercices. similarityform.aspx. [13] Julien Aligon, Matteo Golfarelli, Patrick Marcel, Veronika Peralta and Stefano Rizzi. Questionnaires et Résultats pour les logs réels. aligon.fr/index.php/research-activities/real-olap-logs/. 22

Introduction à la B.I. Avec SQL Server 2008

Introduction à la B.I. Avec SQL Server 2008 Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide

Plus en détail

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012 CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE Edition 2012 AGENDA Qui sommes nous? Présentation de Keyrus Keyrus : Expert en formations BI Nos propositions de formation 3 modes de formations Liste des

Plus en détail

et les Systèmes Multidimensionnels

et les Systèmes Multidimensionnels Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Datawarehouse (DW) Le Datawarehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées

Plus en détail

Chapitre 9 : Informatique décisionnelle

Chapitre 9 : Informatique décisionnelle Chapitre 9 : Informatique décisionnelle Sommaire Introduction... 3 Définition... 3 Les domaines d application de l informatique décisionnelle... 4 Architecture d un système décisionnel... 5 L outil Oracle

Plus en détail

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation Base de données S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Présentation du module Contenu général Notion de bases de données Fondements / Conception Utilisation :

Plus en détail

Bases de Données Avancées

Bases de Données Avancées 1/26 Bases de Données Avancées DataWareHouse Thierry Hamon Bureau H202 - Institut Galilée Tél. : 33 1.48.38.35.53 Bureau 150 LIM&BIO EA 3969 Université Paris 13 - UFR Léonard de Vinci 74, rue Marcel Cachin,

Plus en détail

Business Intelligence avec Excel, Power BI et Office 365

Business Intelligence avec Excel, Power BI et Office 365 Avant-propos A. À qui s adresse ce livre? 9 1. Pourquoi à chaque manager? 9 2. Pourquoi à tout informaticien impliqué dans des projets «BI» 9 B. Obtention des données sources 10 C. Objectif du livre 10

Plus en détail

BIRT (Business Intelligence and Reporting Tools)

BIRT (Business Intelligence and Reporting Tools) BIRT (Business Intelligence and Reporting Tools) Introduction Cette publication a pour objectif de présenter l outil de reporting BIRT, dans le cadre de l unité de valeur «Data Warehouse et Outils Décisionnels»

Plus en détail

Travail de diplôme 2011 Business Intelligence Open Source SpagoBI/Talend Résumé

Travail de diplôme 2011 Business Intelligence Open Source SpagoBI/Talend Résumé ESNE Travail de diplôme 2011 Business Intelligence Open Source SpagoBI/Talend Résumé I.Cirillo 2010-2011 Introduction Le laboratoire de base de données de l ESNE a mis en place, il y a quelques années,

Plus en détail

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...) Avant-propos 1. À qui s'adresse ce livre? 15 2. Pré-requis 15 3. Objectifs du livre 16 4. Notations 17 Introduction à la Business Intelligence 1. Du transactionnel au décisionnel 19 2. Business Intelligence

Plus en détail

Analyse comparative entre différents outils de BI (Business Intelligence) :

Analyse comparative entre différents outils de BI (Business Intelligence) : Analyse comparative entre différents outils de BI (Business Intelligence) : Réalisé par: NAMIR YASSINE RAGUI ACHRAF Encadré par: PR. L. LAMRINI Dans le domaine d économies des Big Data et Open Data, comment

Plus en détail

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement Introduction Phases du projet Les principales phases du projet sont les suivantes : La mise à disposition des sources Des fichiers Excel sont utilisés pour récolter nos informations L extraction des données

Plus en détail

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani Datawarehouse: Cubes OLAP Marlyse Dieungang Khaoula Ghilani Table des matières 1 Data Warehouse 3 1.1 Introduction............................ 3 1.1.1 Définition......................... 3 1.1.2 Architecture........................

Plus en détail

Cursus Sage ERP X3 Outils & Développement. Le parcours pédagogique Sage ERP X3 Outils et Développement

Cursus Sage ERP X3 Outils & Développement. Le parcours pédagogique Sage ERP X3 Outils et Développement Cursus Outils & Développement Vous êtes Consultant, Chef de Projets, Directeur des Systèmes d Information, Directeur Administratif et Financier, Optez pour les «formations Produits» Nous vous proposons

Plus en détail

Introduction à ORACLE WAREHOUSE BUILDER Cédric du Mouza

Introduction à ORACLE WAREHOUSE BUILDER Cédric du Mouza Introduction à ORACLE WAREHOUSE BUILDER Cédric du Mouza Avant de commencer à travailler avec le produit, il est nécessaire de comprendre, à un haut niveau, les problèmes en réponse desquels l outil a été

Plus en détail

BI = Business Intelligence Master Data-Science

BI = Business Intelligence Master Data-Science BI = Business Intelligence Master Data-Science UPMC 25 janvier 2015 Organisation Horaire Cours : Lundi de 13h30 à 15h30 TP : Vendredi de 13h30 à 17h45 Intervenants : Divers industriels (en cours de construction)

Plus en détail

Les Entrepôts de Données

Les Entrepôts de Données Les Entrepôts de Données Grégory Bonnet Abdel-Illah Mouaddib GREYC Dépt Dépt informatique :: GREYC Dépt Dépt informatique :: Cours Cours SIR SIR Systèmes d information décisionnels Nouvelles générations

Plus en détail

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

Le tout fichier Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique Introduction à l informatique : Information automatisée Le premier ordinateur Définition disque dure, mémoire, carte mémoire, carte mère etc Architecture d un ordinateur Les constructeurs leader du marché

Plus en détail

CURRICULUM VITAE. Informations Personnelles

CURRICULUM VITAE. Informations Personnelles CURRICULUM VITAE Informations Personnelles NOM: BOURAS PRENOM : Zine-Eddine STRUCTURE DE RATTACHEMENT: Département de Mathématiques et d Informatique Ecole Préparatoire aux Sciences et Techniques Annaba

Plus en détail

INF 1250 INTRODUCTION AUX BASES DE DONNÉES. Guide d étude

INF 1250 INTRODUCTION AUX BASES DE DONNÉES. Guide d étude INF 1250 INTRODUCTION AUX BASES DE DONNÉES Guide d étude Sous la direction de Olga Mariño Télé-université Montréal (Québec) 2011 INF 1250 Introduction aux bases de données 2 INTRODUCTION Le Guide d étude

Plus en détail

Entrepôts de données. NEGRE Elsa Université Paris-Dauphine 2015-2016

Entrepôts de données. NEGRE Elsa Université Paris-Dauphine 2015-2016 Entrepôts de données NEGRE Elsa Université Paris-Dauphine 2015-2016 Contexte et problématique Le processus de prise de décision L entrepôt de données Définition Différence avec un SGBD Caractéristiques

Plus en détail

Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION. Mentions Ingénierie des Systèmes d Information Business Intelligence

Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION. Mentions Ingénierie des Systèmes d Information Business Intelligence É C O L E D I N G É N I E U R D E S T E C H N O L O G I E S D E L I N F O R M A T I O N E T D E L A C O M M U N I C A T I O N Programme scientifique Majeure ARCHITECTURE DES SYSTEMES D INFORMATION Mentions

Plus en détail

SQL SERVER 2008, BUSINESS INTELLIGENCE

SQL SERVER 2008, BUSINESS INTELLIGENCE SGBD / Aide à la décision SQL SERVER 2008, BUSINESS INTELLIGENCE Réf: QLI Durée : 5 jours (7 heures) OBJECTIFS DE LA FORMATION Cette formation vous apprendra à concevoir et à déployer une solution de Business

Plus en détail

Business Intelligence

Business Intelligence avec Excel, Power BI et Office 365 Téléchargement www.editions-eni.fr.fr Jean-Pierre GIRARDOT Table des matières 1 Avant-propos A. À qui s adresse ce livre?..................................................

Plus en détail

Traitement et exploration du fichier Log du Serveur Web, pour l extraction des connaissances: Web Usage Mining

Traitement et exploration du fichier Log du Serveur Web, pour l extraction des connaissances: Web Usage Mining Traitement et exploration du fichier Log du Serveur Web, pour l extraction des connaissances: Web Usage Mining Mostafa HANOUNE*, Fouzia BENABBOU* *Université Hassan II- Mohammedia, Faculté des sciences

Plus en détail

Didacticiel Études de cas. Description succincte de Pentaho Data Integration Community Edition (Kettle).

Didacticiel Études de cas. Description succincte de Pentaho Data Integration Community Edition (Kettle). 1 Objectif Description succincte de Pentaho Data Integration Community Edition (Kettle). L informatique décisionnelle («Business Intelligence BI» en anglais, ça fait tout de suite plus glamour) fait référence

Plus en détail

TP2 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3

TP2 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3 TP2 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3 30/11/2011 Plan du TP 2 Rappel sur la chaine de BI Présentation de la suite Microsoft BI Ateliers sur SSIS (2H) Ateliers sur RS (2H) 3 Rappel sur la chaine de

Plus en détail

UE 8 Systèmes d information de gestion Le programme

UE 8 Systèmes d information de gestion Le programme UE 8 Systèmes d information de gestion Le programme Légende : Modifications de l arrêté du 8 mars 2010 Suppressions de l arrêté du 8 mars 2010 Partie inchangée par rapport au programme antérieur Indications

Plus en détail

Didier MOUNIEN Samantha MOINEAUX

Didier MOUNIEN Samantha MOINEAUX Didier MOUNIEN Samantha MOINEAUX 08/01/2008 1 Généralisation des ERP ERP génère une importante masse de données Comment mesurer l impact réel d une décision? Comment choisir entre plusieurs décisions?

Plus en détail

SQL Server 2012 et SQL Server 2014

SQL Server 2012 et SQL Server 2014 SQL Server 2012 et SQL Server 2014 Principales fonctions SQL Server 2012 est le système de gestion de base de données de Microsoft. Il intègre un moteur relationnel, un outil d extraction et de transformation

Plus en détail

TP2_1 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3

TP2_1 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3 TP2_1 DE BUSINESS INTELLIGENCE ISIMA ZZ3 F3 03/11/2014 Plan du TP 2 Présentation de la suite Microsoft BI Ateliers sur SSIS (2H) Ateliers sur RS (2H) 3 Présentation de la suite Microsoft BI Présentation

Plus en détail

BUSINESS INTELLIGENCE

BUSINESS INTELLIGENCE GUIDE COMPARATIF BUSINESS INTELLIGENCE www.viseo.com Table des matières Business Intelligence :... 2 Contexte et objectifs... 2 Une architecture spécifique... 2 Les outils de Business intelligence... 3

Plus en détail

Méthodologie de conceptualisation BI

Méthodologie de conceptualisation BI Méthodologie de conceptualisation BI Business Intelligence (BI) La Business intelligence est un outil décisionnel incontournable à la gestion stratégique et quotidienne des entités. Il fournit de l information

Plus en détail

Licence Professionnelle en Statistique et Informatique Décisionnelle (S.I.D.)

Licence Professionnelle en Statistique et Informatique Décisionnelle (S.I.D.) Université de Lille 2 - Droit et Santé Ecole Supérieure des Affaires & Institut Universitaire de Technologie (IUT-C) Département Statistique et Traitement Informatique des Données Licence Professionnelle

Plus en détail

Hervé Couturier EVP, SAP Technology Development

Hervé Couturier EVP, SAP Technology Development Hervé Couturier EVP, SAP Technology Development Hervé Biausser Directeur de l Ecole Centrale Paris Bernard Liautaud Fondateur de Business Objects Questions à: Hervé Couturier Hervé Biausser Bernard Liautaud

Plus en détail

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise BUSINESS INTELLIGENCE Une vision cockpit : utilité et apport pour l'entreprise 1 Présentation PIERRE-YVES BONVIN, SOLVAXIS BERNARD BOIL, RESP. SI, GROUPE OROLUX 2 AGENDA Définitions Positionnement de la

Plus en détail

DEMARREZ RAPIDEMENT VOTRE EVALUATION

DEMARREZ RAPIDEMENT VOTRE EVALUATION Pentaho Webinar 30 pour 30 DEMARREZ RAPIDEMENT VOTRE EVALUATION Resources & Conseils Sébastien Cognet Ingénieur avant-vente 1 Vous venez de télécharger une plateforme moderne d intégration et d analyses

Plus en détail

Master CCI. Compétences Complémentaires en Informatique. Livret de l étudiant

Master CCI. Compétences Complémentaires en Informatique. Livret de l étudiant Master CCI Compétences Complémentaires en Informatique Livret de l étudiant 2014 2015 Master CCI Le Master CCI (Compétences Complémentaires en Informatique) permet à des étudiants de niveau M1 ou M2 dans

Plus en détail

Présentations personnelles. filière IL

Présentations personnelles. filière IL Présentations personnelles filière IL Résumé Liste de sujets de présentations personnelles. Chaque présentation aborde un sujet particulier, l'objectif étant que la lecture du rapport ainsi que l'écoute

Plus en détail

Urbanisation des SI-NFE107

Urbanisation des SI-NFE107 OLAP Urbanisation des SI-NFE107 Fiche de lecture Karim SEKRI 20/01/2009 OLAP 1 Introduction PLAN OLAP Les différentes technologies OLAP Plate formes et Outils 20/01/2009 OLAP 2 Informatique décisionnelle

Plus en détail

MANAGEMENT DES SERVICES INFORMATIQUES

MANAGEMENT DES SERVICES INFORMATIQUES MANAGEMENT DES SERVICES SOMMAIRE SAP BO DASHBOARDS 4.0 3 Nouveautés SAP BO Web Intelligence BI 4 3 SAP BO Web Intelligence 4 Niveau 1 4 SAP BO Web Intelligence 4 Niveau 2 4 SAP BO Web Intelligence XI3

Plus en détail

Objectif. Participant. Prérequis. Oracle BI Suite EE 10g R3 - Développer des référentiels. 5 Jours [35 Heures]

Objectif. Participant. Prérequis. Oracle BI Suite EE 10g R3 - Développer des référentiels. 5 Jours [35 Heures] Objectif Utiliser les techniques de gestion de la mise en cache pour contrôler et améliorer les performances des requêtes Définir des mesures simples et des mesures calculées pour une table de faits Créer

Plus en détail

DOSSIER SOLUTION CA ERwin Modeling. Comment gérer la complexité des données et améliorer l agilité métier?

DOSSIER SOLUTION CA ERwin Modeling. Comment gérer la complexité des données et améliorer l agilité métier? DOSSIER SOLUTION CA ERwin Modeling Comment gérer la complexité des données et améliorer l agilité métier? CA ERwin Modeling fournit une vue centralisée des définitions de données clés afin de mieux comprendre

Plus en détail

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles) SGBDR Systèmes de Gestion de Bases de Données (Relationnelles) Plan Approches Les tâches du SGBD Les transactions Approche 1 Systèmes traditionnels basés sur des fichiers Application 1 Gestion clients

Plus en détail

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2014

CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2014 CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE Edition 2014 SOMMAIRE Présentation de Keyrus Les modes de formation Liste des formations, Plan de cours & Pré-requis IBM Cognos QlikView Microsoft Talend Oracle

Plus en détail

Présentation du module Base de données spatio-temporelles

Présentation du module Base de données spatio-temporelles Présentation du module Base de données spatio-temporelles S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Partie 1 : Notion de bases de données (12,5h ) Enjeux et principes

Plus en détail

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales Ecole des Hautes Etudes Commerciales HEC Alger Évolution des SGBDs par Amina GACEM Module Informatique 1ière Année Master Sciences Commerciales Evolution des SGBDs Pour toute remarque, question, commentaire

Plus en détail

AVRIL 2014. Au delà de Hadoop. Panorama des solutions NoSQL

AVRIL 2014. Au delà de Hadoop. Panorama des solutions NoSQL AVRIL 2014 Panorama des solutions NoSQL QUI SOMMES NOUS? Avril 2014 2 SMILE, EN QUELQUES CHIFFRES 1er INTÉGRATEUR EUROPÉEN DE SOLUTIONS OPEN SOURCE 3 4 NOS EXPERTISES ET NOS CONVICTIONS DANS NOS LIVRES

Plus en détail

MASTER LPL : LANGUE ET INFORMATIQUE (P)

MASTER LPL : LANGUE ET INFORMATIQUE (P) MASTER LPL : LANGUE ET INFORMATIQUE (P) RÉSUMÉ DE LA FORMATION Type de diplôme := Master Domaine : Arts, Lettres, Langues Mention : LITTERATURE, PHILOLOGIE, LINGUISTIQUE Spécialité : LANGUE ET INFORMATIQUE

Plus en détail

Panorama des solutions analytiques existantes

Panorama des solutions analytiques existantes Arnaud LAROCHE Julien DAMON Panorama des solutions analytiques existantes SFdS Méthodes et Logiciels - 16 janvier 2014 - Données Massives Ne sont ici considérés que les solutions autour de l environnement

Plus en détail

Cécile MAUNIER. Maître de Conférences Sciences de Gestion Responsable pédagogique - Master 1 Marketing, Vente TITRES UNIVERSITAIRES

Cécile MAUNIER. Maître de Conférences Sciences de Gestion Responsable pédagogique - Master 1 Marketing, Vente TITRES UNIVERSITAIRES Cécile MAUNIER Maître de Conférences Sciences de Gestion Responsable pédagogique - Master 1 Marketing, Vente IAE REUNION 24 avenue de la Victoire CS 92003 Saint Denis Cedex 09 ( : 02 62 47 99 01 E- mail

Plus en détail

Formation Cloudera Data Analyst Utiliser Pig, Hive et Impala avec Hadoop

Formation Cloudera Data Analyst Utiliser Pig, Hive et Impala avec Hadoop Passez au niveau supérieur en termes de connaissance grâce à la formation Data Analyst de Cloudera. Public Durée Objectifs Analystes de données, business analysts, développeurs et administrateurs qui ont

Plus en détail

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours Information du cours Informatique décisionnelle et data mining www.lia.univ-avignon.fr/chercheurs/torres/cours/dm Juan-Manuel Torres juan-manuel.torres@univ-avignon.fr LIA/Université d Avignon Cours/TP

Plus en détail

Entrepôt de données 1. Introduction

Entrepôt de données 1. Introduction Entrepôt de données 1 (data warehouse) Introduction 1 Présentation Le concept d entrepôt de données a été formalisé pour la première fois en 1990 par Bill Inmon. Il s agissait de constituer une base de

Plus en détail

Livret du Stagiaire en Informatique

Livret du Stagiaire en Informatique Université François-Rabelais de Tours Campus de Blois UFR Sciences et Techniques Département Informatique Livret du Stagiaire en Informatique Licence 3ème année Master 2ème année Année 2006-2007 Responsable

Plus en détail

Plan de cours ADM 992C Page 1. École des sciences de la gestion Département de management et technologie Université du Québec à Montréal

Plan de cours ADM 992C Page 1. École des sciences de la gestion Département de management et technologie Université du Québec à Montréal Plan de cours ADM 992C Page 1 École des sciences de la gestion Département de management et technologie Université du Québec à Montréal ADM-992C LES TECHNOLOGIES D'AIDE À LA PRISE DE DÉCISION DANS LES

Plus en détail

Introduction à l Informatique Décisionnelle - Business Intelligence (7)

Introduction à l Informatique Décisionnelle - Business Intelligence (7) Introduction à l Informatique Décisionnelle - Business Intelligence (7) Bernard ESPINASSE Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille Septembre 2013 Emergence

Plus en détail

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc) 87 FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc) Dans le cadre de la réforme pédagogique et de l intérêt que porte le Ministère de l Éducation

Plus en détail

La problématique. La philosophie ' ) * )

La problématique. La philosophie ' ) * ) La problématique!" La philosophie #$ % La philosophie &'( ' ) * ) 1 La philosophie +, -) *. Mise en oeuvre Data warehouse ou Datamart /01-2, / 3 13 4,$ / 5 23, 2 * $3 3 63 3 #, 7 Datawarehouse Data warehouse

Plus en détail

Bases de données cours 1

Bases de données cours 1 Bases de données cours 1 Introduction Catalin Dima Objectifs du cours Modèle relationnel et logique des bases de données. Langage SQL. Conception de bases de données. SQL et PHP. Cours essentiel pour votre

Plus en détail

Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise.

Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise. Solutions PME VIPDev Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise. Cette offre est basée sur la mise à disposition de l ensemble de nos compétences techniques et créatives au service

Plus en détail

METIERS DES LANGUES ET CULTURES ETRANGERES

METIERS DES LANGUES ET CULTURES ETRANGERES Mention : METIERS S LANGUES ET CULTURES ETRANGERES Domaine : Spécialité : Volume horaire étudiant : Niveau : MASTER 2 année ARTS LETTRES LANGUES ET VEILLE DOCUMENTAIRE INTERNATIONALE M2 120 ES 120 h 48/78

Plus en détail

Expert technique J2EE

Expert technique J2EE EHRET Guillaume 25, rue de la Richelandiere 42100 SAINT ETIENNE 32 ans - Célibataire Expert technique J2EE Domaines de compétences Environnement et langages Expertise en programmation Java et en architecture

Plus en détail

Bruno ASDOURIAN Lecteur en Sciences de la Communication et des Médias Université de Fribourg Suisse

Bruno ASDOURIAN Lecteur en Sciences de la Communication et des Médias Université de Fribourg Suisse Bruno ASDOURIAN Lecteur en Sciences de la Communication et des Médias Université de Fribourg Suisse Chercheur en Sciences de l Information et de la Communication Laboratoire IRSIC EA 4262 France Grand-Places

Plus en détail

L information et la technologie de l informationl

L information et la technologie de l informationl L information et la technologie de l informationl CRM & informatique décisionnelled CRM CRM & informatique décisionnelle. d 1 2 3 Les Les fondements managériaux managériaux du du CRM. CRM. Les Les fondements

Plus en détail

Big Data On Line Analytics

Big Data On Line Analytics Fdil Fadila Bentayeb Lb Laboratoire ERIC Lyon 2 Big Data On Line Analytics ASD 2014 Hammamet Tunisie 1 Sommaire Sommaire Informatique décisionnelle (BI Business Intelligence) Big Data Big Data analytics

Plus en détail

FreeAnalysis. Schema Designer. Cubes

FreeAnalysis. Schema Designer. Cubes FreeAnalysis Schema Designer Cubes Charles Martin et Patrick Beaucamp BPM Conseil Contact : charles.martin@bpm-conseil.com, patrick.beaucamp@bpm-conseil.com Janvier 2013 Document : BPM_Vanilla_FreeAnalysisSchemaDesigner_v4.2_FR.odt

Plus en détail

UNIVERSITÉ DE LORRAINE Master MIAGE (Méthodes Informatiques Appliquées à la Gestion des Entreprises)

UNIVERSITÉ DE LORRAINE Master MIAGE (Méthodes Informatiques Appliquées à la Gestion des Entreprises) UNIVERSITÉ DE LORRAINE Master MIAGE (Méthodes s Appliquées à la Gestion des Entreprises) 1 Description générale L UFR Mathématiques et propose le Master avec trois spécialisations en deuxième année : ACSI

Plus en détail

Business Intelligence avec SQL Server 2012

Business Intelligence avec SQL Server 2012 Editions ENI Business Intelligence avec SQL Server 2012 Maîtrisez les concepts et réalisez un système décisionnel Collection Solutions Informatiques Table des matières Les éléments à télécharger sont disponibles

Plus en détail

Mon métier, mon parcours

Mon métier, mon parcours Mon métier, mon parcours Anthony, ingénieur d études diplômé d un Master Réseaux, application documentaire, ingénierie et sécurité Les métiers de l Informatique Le domaine Sciences, Technologies, Santé

Plus en détail

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université

Plus en détail

Bases de Données. Stella MARC-ZWECKER. stella@unistra.u-strasbg.fr. Maître de conférences Dpt. Informatique - UdS

Bases de Données. Stella MARC-ZWECKER. stella@unistra.u-strasbg.fr. Maître de conférences Dpt. Informatique - UdS Bases de Données Stella MARC-ZWECKER Maître de conférences Dpt. Informatique - UdS stella@unistra.u-strasbg.fr 1 Plan du cours 1. Introduction aux BD et aux SGBD Objectifs, fonctionnalités et évolutions

Plus en détail

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013 Cube de textes et opérateur d'agrégation basé sur un modèle vectoriel adapté Text Cube Model and aggregation operator based on an adapted vector space model Lamia Oukid, Ounas Asfari, Fadila Bentayeb,

Plus en détail

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION Classe de terminale de la série Sciences et Technologie du Management et de la Gestion Préambule Présentation Les technologies de l information

Plus en détail

Business Intelligence avec SQL Server 2012

Business Intelligence avec SQL Server 2012 Editions ENI Business Intelligence avec SQL Server 2012 Maîtrisez les concepts et réalisez un système décisionnel Collection Solutions Informatiques Extrait Alimenter l'entrepôt de données avec SSIS Business

Plus en détail

Le langage SQL Rappels

Le langage SQL Rappels Le langage SQL Rappels Description du thème : Présentation des principales notions nécessaires pour réaliser des requêtes SQL Mots-clés : Niveau : Bases de données relationnelles, Open Office, champs,

Plus en détail

Business & High Technology

Business & High Technology UNIVERSITE DE TUNIS INSTITUT SUPERIEUR DE GESTION DE TUNIS Département : Informatique Business & High Technology Chapitre 8 : ID : Informatique Décisionnelle BI : Business Intelligence Sommaire Introduction...

Plus en détail

Pentaho : Comparatif fonctionnel entre la version Communautaire (gratuite) et la version Entreprise (payante) Table des matières

Pentaho : Comparatif fonctionnel entre la version Communautaire (gratuite) et la version Entreprise (payante) Table des matières Pentaho : Comparatif fonctionnel entre la version Communautaire (gratuite) et la version Entreprise (payante) Table des matières 1 2 3 4 PRÉSENTATION DE PENTAHO...2 LISTING DES COMPOSANTS DE LA PLATE-FORME...4

Plus en détail

Nom de l application

Nom de l application Ministère de l Enseignement Supérieur et de la Recherche Scientifique Direction Générale des Etudes Technologiques Institut Supérieur des Etudes Technologiques de Gafsa Département Technologies de l Informatique

Plus en détail

Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème

Chapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème Chapitre IX L intégration de données Le problème De façon très générale, le problème de l intégration de données (data integration) est de permettre un accès cohérent à des données d origine, de structuration

Plus en détail

Mercredi 15 Janvier 2014

Mercredi 15 Janvier 2014 De la conception au site web Mercredi 15 Janvier 2014 Loïc THOMAS Géo-Hyd Responsable Informatique & Ingénierie des Systèmes d'information loic.thomas@anteagroup.com 02 38 64 26 41 Architecture Il est

Plus en détail

GPC Computer Science

GPC Computer Science CYCLE ISMIN P2015 GPC Computer Science P LALEVÉE lalevee@emse.fr @p_lalevee A3.01 0442616715 C YUGMA yugma@emse.fr A3.01 0442616715 01/09/2014 Présentation GPC CS - Ph. Lalevée - C Yugma 1 Scolarité Site

Plus en détail

En route vers le succès avec une solution de BI intuitive destinée aux entreprises de taille moyenne

En route vers le succès avec une solution de BI intuitive destinée aux entreprises de taille moyenne Présentation du produit SAP s SAP pour les PME SAP BusinessObjects Business Intelligence, édition Edge Objectifs En route vers le succès avec une solution de BI intuitive destinée aux entreprises de taille

Plus en détail

Je découvre Lina Maintenance

Je découvre Lina Maintenance Je découvre Lina Maintenance Une interface simple et ergonomique pour optimiser la maintenance de vos équipements 1 Sommaire Présentation 4 La plateforme Lina 5 Référentiel 6 Agenda et données personnelles

Plus en détail

BI = Business Intelligence Master Data-ScienceCours 3 - Data

BI = Business Intelligence Master Data-ScienceCours 3 - Data BI = Business Intelligence Master Data-Science Cours 3 - Datawarehouse UPMC 8 février 2015 Rappel L Informatique Décisionnelle (ID), en anglais Business Intelligence (BI), est l informatique à l usage

Plus en détail

Business Intelligence avec SQL Server 2014 Maîtrisez les concepts et réalisez un système décisionnel

Business Intelligence avec SQL Server 2014 Maîtrisez les concepts et réalisez un système décisionnel Avant-propos 1. À qui s'adresse ce livre? 9 2. Les pré-requis 10 3. Les objectifs du livre 11 Introduction 1. Présentation du décisionnel 13 1.1 La notion de décideur 14 1.2 Les facteurs d'amélioration

Plus en détail

OLAP : Mondrian + Pentaho. Maguelonne Teisseire Hugo Alatrista Salas hugo.alatrista- salas@teledetec9on.fr Flavien Bouillot

OLAP : Mondrian + Pentaho. Maguelonne Teisseire Hugo Alatrista Salas hugo.alatrista- salas@teledetec9on.fr Flavien Bouillot OLAP : Mondrian + Pentaho Maguelonne Teisseire Hugo Alatrista Salas hugo.alatrista- salas@teledetec9on.fr Flavien Bouillot Outils Open Source Mondrian : serveur OLAP JFreeReport : ou9l de «Repor9ng» KeHle

Plus en détail

LANGAGUE JAVA. Public Développeurs souhaitant étendre leur panel de langages de programmation

LANGAGUE JAVA. Public Développeurs souhaitant étendre leur panel de langages de programmation ING 01 LANGAGUE JAVA Durée : 21 heures 1090 HT / jour Dates : à définir en 2012 Concevoir et développer des programmes en langage Java Comprendre le fonctionnement de la machine virtuelle S approprier

Plus en détail

PRÉSENTATION GÉNÉRALE

PRÉSENTATION GÉNÉRALE PRÉSENTATION GÉNÉRALE Cadrage institutionnel : Arrêté du 27 août 2013 fixant le cadre national des formations dispensées au sein des masters «métiers de l enseignement, de l éducation et de la formation»

Plus en détail

Comment booster vos applications SAP Hana avec SQLSCRIPT

Comment booster vos applications SAP Hana avec SQLSCRIPT DE LA TECHNOLOGIE A LA PLUS VALUE METIER Comment booster vos applications SAP Hana avec SQLSCRIPT 1 Un usage optimum de SAP Hana Votre contexte SAP Hana Si vous envisagez de migrer vers les plateformes

Plus en détail

DEVELOPPEMENTS DE SERVICES INTRANET ET INTERNET A L EFPG

DEVELOPPEMENTS DE SERVICES INTRANET ET INTERNET A L EFPG DEVELOPPEMENTS DE SERVICES INTRANET ET INTERNET A L EFPG Auteurs : J. Rouis *, M. Rueff **, L. Chagas **, J. C. Sohm ** * ingénieur recherche à l EFPG, chargée du développement du site du CERIG. ** enseignants

Plus en détail

Table des matières PRESENTATION DU LANGAGE DS2 ET DE SES APPLICATIONS. Introduction

Table des matières PRESENTATION DU LANGAGE DS2 ET DE SES APPLICATIONS. Introduction PRESENTATION DU LANGAGE DS2 ET DE SES APPLICATIONS Depuis SAS 9.2 TS2M3, SAS propose un nouveau langage de programmation permettant de créer et gérer des tables SAS : le DS2 («Data Step 2»). Ces nouveautés

Plus en détail

Guide de référence pour l achat de Business Analytics

Guide de référence pour l achat de Business Analytics Guide de référence pour l achat de Business Analytics Comment évaluer une solution de décisionnel pour votre petite ou moyenne entreprise : Quelles sont les questions à se poser et que faut-il rechercher?

Plus en détail

SQL Serveur 2012+ Programme de formation. France Belgique Suisse - Canada. Formez vos salariés pour optimiser la productivité de votre entreprise

SQL Serveur 2012+ Programme de formation. France Belgique Suisse - Canada. Formez vos salariés pour optimiser la productivité de votre entreprise SQL Serveur 2012+ Programme de formation France Belgique Suisse - Canada Microsoft Partner Formez vos salariés pour optimiser la productivité de votre entreprise Dernière mise à jour le : Avril 2014 Des

Plus en détail

DESCRIPTIF DE MODULE S5 GSI

DESCRIPTIF DE MODULE S5 GSI Option SIM DESCRIPTIF DE MODULE S5 GSI : Gouvernance et Systèmes d Information COORDONNATEUR DU MODULE : Département : Ce module a pour but d enseigner les méthodes, les règles et les pratiques nécessaires

Plus en détail

LIVRE BLANC Décembre 2014

LIVRE BLANC Décembre 2014 PARSING MATCHING EQUALITY SEARCH LIVRE BLANC Décembre 2014 Introduction L analyse des tendances du marché de l emploi correspond à l évidence à une nécessité, surtout en période de tension comme depuis

Plus en détail

Évaluation et implémentation des langages

Évaluation et implémentation des langages Évaluation et implémentation des langages Les langages de programmation et le processus de programmation Critères de conception et d évaluation des langages de programmation Les fondations de l implémentation

Plus en détail

QU EST-CE QUE LE DECISIONNEL?

QU EST-CE QUE LE DECISIONNEL? La plupart des entreprises disposent d une masse considérable d informations sur leurs clients, leurs produits, leurs ventes Toutefois ces données sont cloisonnées par les applications utilisées ou parce

Plus en détail