Vers l'olap sémantique pour l'analyse en ligne des données complexes



Documents pareils
Les Entrepôts de Données

Formations et diplômes. Rapport d'évaluation. Master Finance. Université Jean Monnet Saint-Etienne - UJM. Campagne d évaluation (Vague A)

Licence professionnelle Systèmes d information, méthodes et outils

Entrepôt de données 1. Introduction

Évolution de schémas dans les entrepôts de données mise à jour de hiérarchies de dimension pour la personnalisation des analyses

Rapport d évaluation du master

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21

Licence professionnelle METINET : Concepteur et Gestionnaire de Sites Internet

Collabora'on IRISA/INRA sur le transfert de nitrates et l améliora'on de la qualité des eaux des bassins versants:

ISTEX, vers des services innovants d accès à la connaissance

Introduction à la B.I. Avec SQL Server 2008

Université du Sud-Toulon Var IUT Toulon Var PROGRAMME DE LA FORMATION. Licence Professionnelle Management des Organisations

Spécificités, Applications et Outils

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours

Licence Professionnelle en Statistique et Informatique Décisionnelle (S.I.D.)

RÉSUMÉ DESCRIPTIF DE LA CERTIFICATION (FICHE RÉPERTOIRE)

La classification automatique de données quantitatives

Licence professionnelle Prospection et protection des ressources souterraines

Rapport d évaluation du master

Licence Professionnelle Développeur et administrateur de systèmes d information

UFR d Informatique. FORMATION MASTER Domaine SCIENCES, TECHNOLOGIE, SANTE Mention INFORMATIQUE

Intelligence Economique - Business Intelligence

Pédagogie : A Lyon 1 : DESS en informatique documentaire (avec Enssib), DEUST doc, IUP DIST, DEA SIC puis à Lyon 3

DUT Statistique et Traitement Informatique des Données (S.T.I.D.)

MASTER LETTRES PARCOURS INGENIERIE EDITORIALE ET COMMUNICATION

Big Data On Line Analytics

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

Master CST. Culture Scientifique et Technologique. IUFM «Célestin Freinet Académie de Nice» Service Communication - IUFM

IENAC. Vous voulez devenir INGENIEUR ENAC? 3 statuts, 2 sites, 1 seul diplôme. En partenariat avec

Licence professionnelle Radioprotection, démantèlement et déchets nucléaires : chargé de projets

Formation de chargés de missions d'évaluation, intervenants dans les organisations (Fonction publique, entreprises, Santé)

Rapport d évaluation de la licence professionnelle

Rapport d évaluation de la licence professionnelle

Datawarehouse: Cubes OLAP. Marlyse Dieungang Khaoula Ghilani

MASTER INFORMATIQUE COLLABORATIVE EN ENTREPRISE (ICE)

SQL SERVER 2008, BUSINESS INTELLIGENCE

MASTER RECHERCHE MEDIATIONS DES SCIENCES. Mention HISTOIRE, PHILOSOPHIE ET. Histoire et Philosophie des Sciences. Année 2007/2008

RÉPERTOIRE

Les Entrepôts de Données. (Data Warehouses)

Filière Data Mining (Fouille de données) Pierre Morizet-Mahoudeaux

Filière Fouille de Données et Décisionnel FDD (Data Mining) Pierre Morizet-Mahoudeaux

MASTER 2 SCIENCES HUMAINES ET SOCIALES Mention Psychologie. Spécialité : Recherches en psychologie

CommentWatcher. plateforme Web open-source pour analyser les discussions sur des forums en ligne. Marian-Andrei RIZOIU

Big Data et Graphes : Quelques pistes de recherche

Institut. Master MIAGE. Master SIC. d Administration des Entreprises de Paris. Sorbonne Graduate Business school

Un diplôme cohabilité avec l université de Lyon 2, une formation supérieure unique en communication.

Entreposage de données complexes pour la médecine d anticipation personnalisée

MASTER LPL : LANGUE ET INFORMATIQUE (P)

Oracle Décisionnel : Modèle OLAP et Vue matérialisée D BILEK

APPEL A PROJETS SERVICE REGIONALE DE L APPRENTISSAGE

sous réserve de validation des modifications DROIT ECONOMIE GESTION SCIENCES DU MANAGEMENT FINANCE

Plan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation

Business & High Technology

Mastère spécialisé. «Ingénierie de l innovation et du produit nouveau De l idée à la mise en marché»

Mastère spécialisé MS : «Ingénierie de l innovation et du produit nouveau

MASTER MANAGEMENT DES RH ET DU DÉVELOPPEMENT SOCIAL SPÉCIALITÉ GESTION STRATÉGIQUE DES RESSOURCES HUMAINES À FINALITÉ PROFESSIONNELLE

Master Information et communication spécialité Produits et services multimédia

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)

CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS

MASTER ECONOMIE APPLIQUEE

Sécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL

Fiche n 1 : Personnel salarié Chargé d enseignement vacataire

Le Master Mathématiques et Applications

MASTER PROFESSIONNEL INFORMATION ET COMMUNICATION DANS L ESPACE LOCAL ET REGIONAL ICELR.2008/2009

Urbanisation des SI-NFE107

Entrepôts de données. NEGRE Elsa Université Paris-Dauphine

Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement

Rapport d évaluation de la licence professionnelle

CQP ADMINISTRATEUR DE BASES DE DONNÉES (ABD)

et les Systèmes Multidimensionnels

FICHE DE POSTE. Date de rédaction : 20/02/15. Argumentaire général

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP)

Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining.

Licence professionnelle Commerce en banque-assurance

Apprentissage Automatique

Les dossiers de l enseignement scolaire. l Éducation nationale et la formation professionnelle en France

SGBDR. Systèmes de Gestion de Bases de Données (Relationnelles)

En route vers le succès avec une solution de BI intuitive destinée aux entreprises de taille moyenne

Master Informatique Aix-Marseille Université

Stages ISOFT : UNE SOCIETE INNOVANTE. Contact : Mme Lapedra, stage@isoft.fr

Licence professionnelle Bibliothécaire

La Geo-Business Intelligence selon GALIGEO avec 26/10/2005 1

Chapitre 9 : Informatique décisionnelle

DUT Gestion Logistique et Transport. Organisation des études. Un passeport pour l étranger & formation bilingue.

Business Intelligence avec SQL Server 2012

Rapport d évaluation de la licence professionnelle

Master professionnel Urbanisme : stratégie, projets, maîtrise d ouvrage (USPMO)

Accélérer l agilité de votre site de e-commerce. Cas client

Big Data et Graphes : Quelques pistes de recherche

Rapport d évaluation du master

Master de Bioinformatique et Biologie des Systèmes Toulouse Responsable : Pr. Gwennaele Fichant

Rapport d évaluation de la licence professionnelle

Réseau National de Laboratoires * * * * * * * * * *

Présentation du cursus Animateur de Cluster et de réseaux territoriaux Etat du 14 avril 2013

Votre Infrastructure est-elle? Business Intelligence. Améliorer la capacité d analyse et de décision de vos équipes

TRAVAUX DE RECHERCHE DANS LE

MASTER MANAGEMENT DES RH ET DU DÉVELOPPEMENT SOCIAL SPÉCIALITÉ SCIENCES DES ORGANISATIONS ET DES INSTITUTIONS À FINALITÉS RECHERCHE ET PROFESSIONNELLE

Transcription:

Vers l'olap sémantique pour l'analyse en ligne des données complexes Sabine Loudcher Habilitation à Diriger des Recherches Laboratoire ERIC, IUT Lumière Université Lyon 2 29 juin 2011

Parcours Diplômes 1992 : DESS de Statistique et Informatique Socio-Economiques, Université Lyon 2 Carrière universitaire 1994-1996 : Doctorant avec une bourse de docteur-ingénieur du CNRS, Université Lyon 1 1994 : DEA d Ingénierie Informatique, Université Lyon 1 INSA 1996 : Doctorat d Informatique, Université Lyon 1, laboratoire MASS (URA 934 CNRS -Lyon 1), Pr D.A. ZIGHED (directeur de thèse) Statistique Informatique 1996-1998 : ATER, Université Lyon 3 Depuis 1998 : Maître de Conférences à l'université Lyon 2 (IUT Lumière, laboratoire ERIC) Parcours Enseignement Responsabilités Recherche 2

Parcours Enseignement Recherche Responsabilités Parcours Enseignement Responsabilités Recherche 3

Parcours Enseignement Recherche Responsabilités 4

Enseignement Maître de conférences 2011 Vacataire, doctorant, ATER 1998 1992 DUT Probabilités Statistique Licence professionnelle Algorithmique et programmation Data Mining Multidimensional Data Analysis Master 1 Bases de données et tableur Systèmes ère année d'information décisionnels Master recherche et professionnel 2 Analyse de données Logiciels statistiques ème année Apprentissage automatique Méthodologie de rédaction de mémoire 800 heures 250 à 300 heures par an Parcours Enseignement Responsabilités Recherche 5

Encadrement pédagogique Maître de conférences 2011 1998 1992 Encadrement d étudiants en stage en entreprise Etudiants en alternance Accompagnement en entreprise Tuteur enseignant Encadrement de projets pédagogiques Parcours Enseignement Responsabilités Recherche 6

Parcours Enseignement Recherche Responsabilités 7

Implication universitaire Responsabilités pédagogiques, administratives et institutionnelles Chef du département STID Chargée de mission pour la direction de l IUT Commission de spécialistes, groupe d experts, jurys d IGE Directeur adjoint du laboratoire ERIC 1998 2003 2011 Parcours Enseignement Responsabilités Recherche 8

Chef du département STID (1998-2002) Création puis direction du département STID Définition des orientations stratégiques et pédagogiques du diplôme Mise en place d une pédagogie de l alternance efficace et adaptée Relations avec les milieux professionnels et les partenaires institutionnels Réflexion sur les débouchés de la formation Première évaluation quadriennale Gestion financière et administrative du département Parcours Enseignement Responsabilités Recherche 9

Chargée de mission pour l IUT (2003-2010) Responsable du projet «Observatoire Etudiants» Mise en place du projet Conception en ligne de tableaux de bord sur le recrutement, la formation et le devenir des étudiants Encadrement de l équipe de développement Pilotage des enquêtes sur l insertion professionnelle des apprentis dans l enseignement supérieur de la région Rhône-Alpes Collaboration étroite avec le comité régional Forma-Sup de l apprentissage et les rectorats Expertise statistique Encadrement de l équipe de développement Représentation de l université Lyon 2 dans les instances régionales pilotant l apprentissage dans l enseignement supérieur Conseil d Administration du CFA Forma-Sup ARL Comité régional Forma-Sup Parcours Enseignement Responsabilités Recherche 10

Directeur adjoint du laboratoire (2003-) Depuis 2003, sous la direction de Nicolas Nicoloyannispuis de Djamel Zighed Gestion financière (élaboration et suivi du budget) Gestion des ressources humaines Communication (site Web, plaquettes, ) Relations avec les services internes de l université Fonctionnement administratif et quotidien du laboratoire Préparation des évaluations du laboratoire Préparation des décisions discutées en conseil de direction et votées en conseil de laboratoire Fonctions et missions accrues et renforcées depuis 2010 Parcours Enseignement Responsabilités Recherche 11

Parcours Enseignement Recherche Responsabilités 12

Thématique scientifique Informatique décisionnelle, entrepôts de données et analyse en ligne Collecter, organiser, stocker et analyser l information Aider la prise de décision Avènement des données complexes Données multi-format, multi-structure, multi-source, multi-modal, multi-version, riches en sémantique Remise en cause du processus d entreposage et d analyse Nouveaux problèmes de recherche : intégration, stockage, modélisation et analyse des données complexes 13

Positionnement des travaux Contexte OLAP et données complexes (DC) Problèmes Pas d outils automatiques Pas d extraction de connaissances Vocation de l analyse en ligne (OLAP) Opérateurs OLAP inadaptés pour les DC Analyse interactive et multidimensionnelle des données de l'entrepôt Agrégation des données pour résumer, explorer, visualiser Représentation sous forme de cube et manipulation avec des opérateurs Comment agréger les DC? Comment visualiser les DC? Comment prendre en compte la sémantique contenue dans les DC? 14

Problématique de recherche Analyse en ligne des données complexes Enrichir les Créer une analyse Prendre en compte la possibilités de l OLAP adaptée aux DC sémantique - Explication - Prédiction - Visualisation - Régions intéressantes - Agrégation sémantique 15

Contributions Originalité Combinaison de l OLAP et de la fouille de données Analyse plus intéressante Question non triviale Combinaison de l OLAP et de la recherche d information Analyse explicative par recherche guidée de règles d'association Analyse prédictive avec les arbres de régression Visualisation dansuncubededcavecune méthode factorielle Détection de régions intéressantes avec une méthode factorielle Agrégation sémantique avec une méthode de classification 16

Contributions Cinq nouvelles approches OPReT AROX CoDaViC ORCA OpAC 17

Contribution Analyse explicative par une recherche guidée de règles d'association OPReT AROX CoDaViC ORCA OpAC 18

Analyse explicative par une recherche guidée de règles d'association Problème CA (en euro) T1 T2 T3 T4 Imprimante 9400 10000 12600 10500 MP3 20500 13700 54400 21000 PC 13100 14600 15200 12300 PC portable 11400 12000 28000 10000 CA Juin Juillet Août (en euro) Jeunes 9300 24300 19100 MP3 Adultes 1200 600 1600 Agés 300 Pourquoi les ventes de lecteurs MP3 sont-elles particulièrement élevées au 3 ème trimestre? Les mois des mois de juillet, août et les jeunes consommateurs sont associés aux ventes élevées de lecteurs MP3 Pas d outils OLAP automatiques pour expliquer les relations et les associations Besoin d une nouvelle possibilité d analyse : l explication Comment expliquer automatiquement des phénomènes? Comment détecter des associations? 19

Analyse explicative par une recherche guidée de règles d'association Motivation Utiliser le principe des règles d association Technique de fouille de données avec le même objectif Structure multidimensionnelle, un contexte favorable Contribution: AROX (Association Rules Operator for explication) Positionnement Travaux de (Kamber 1997), (Zhu 1998), (Imielinski 2002), (Tjioe et Taniar 2005) Fouille guidée par une méta-règle Règles inter-dimensionnelles Recherche des motifs fréquents et des règles dans la structure multidimensionnelle Modification de la définition du support et de la confiance pour l adapter à l OLAP 20

Analyse explicative par une recherche guidée de règles d'association Principe Support et confiance basés sur la mesure R : Continent= Amérique Année= 2009 Produit = MP3 Nb de 2009 2010 Définition classique : comptage des faits ventes Amérique Europe Amérique Europe NB( Amérique, MP3,2009) Supp( R) = PC 1200 800 950 500 NB( All, All, All) PC portable 2500 2400 2800 3010 NB( Amérique, MP3,2009) Conf ( R) = NB( Amérique, All,2009) MP3 11600 5900 11400 9100 Chiffre 2009 2010 d affaires Amérique Europe Amérique Europe PC 60000 33000 28000 10000 PC portable 500000 560700 420000 544000 MP3 116000 118000 57000 41000 Nouvelle définition : avec la mesure SUM CA( Amérique, MP3,2009) Supp( R) = SUM ( All, All, All) SUM Conf ( R) = SUM CA CA CA ( Amérique, MP3,2009) ( Amérique, All,2009) 21

Contribution Analyse prédictive avec les arbres de régression OPReT AROX CoDaViC ORCA OpAC 22

Analyse prédictive avec les arbres de régression Problème Magasins M1 14,5 13 12,5 M2 M3 M4 M5 14 12,5 12 13,5 13 PC? 11,5 11 MP3 Produits 11,5 10,5 Télé Années Besoin d analyse de l utilisateur : «qu est ce qui se passe si?» Comment, à partir des cellules pleines voisines, donner une valeur à une cellule vide désignée par l utilisateur? Pas d opérateurs OLAP classiques, nouveau besoin d analyse en ligne : la prédiction Comment intégrer la prédiction dans l OLAP? 23

Analyse prédictive avec les arbres de régression Motivation Dans le cadre du WhatIf Analysis(Golfarelli2006) Couplageentre l'olap et la fouille de données pour prédire la mesure Positionnement Travaux de (Han et S. Cheng 1998), (Sarawagi 1998), (BC. Chen 2005, 2006), (Y. Chen et J. Pei 2001, 2006), (Palpanas 2001, 2005) Prédire la valeur d'une mesure pour un nouveau fait et compléter le cube Placer l'utilisateur au centre ; donner des indicateurs de qualité Fournir un modèle utilisable dans l OLAP, facilement interprétable, sans hypothèse Intégrer une démarche complète d apprentissage supervisé Contribution: OPReT(Online Prediction by Regression Tree) 24

Analyse prédictive avec les arbres de régression Principe 1. Contexte d analyse 2. Modèle de prédiction 3. Interprétation du modèle 4. Prédiction OLAP Sous-cube de données Construction Validation Taux d erreur moyen Réduction de l erreur Règles de décision Indicateurs (support, écart-type) Choix des cellules Valeurs prédites intégrées Intégration visuelle M1 M2 M3 M4 M5 14,5 14 13,5 13? 13 12,5 12,5 12? 11,5 11 11,5? 10,5 1.. n.. 70% des faits pour l apprentissage 30% pour le test mq.. Avg : 10,9 2009 2010 Avg : 12,4 Avg : 9,41 {MP3}, {PC} {Télé} {MP3}, {PC} {Télé} Avg : 11,6 Avg : 14 Avg : 9,1 Avg : 11 R (X Y; S; σ ) M1 M2 M3 M4 M5 14,5 14 13,5 13 14,1 13 12,5 12,5 12 11,8 11,5 11,5 11,2 11 10,5 2010 2009 11,62 11,62 PC 11,62 11,62 11,62 11,62 MP3 Télé Calcul des nouveaux agrégats lors d un forage vers le haut Télé MP3 PC Télé MP3 PC 25

Analyse en ligne des données complexes Avènement des données complexes Verrous scientifiques posés par les données complexes dans l analyse en ligne Visualiser l'information contenue dans les cubes de DC Organiser les cubes de DC pour améliorer la visualisation et détecter des régions intéressantes Agréger des données complexes Prendre en compte le contenu sémantique des données Exemple de l analyse des publications scientifiques Publications = données complexes, entités sémantiques Publication = {auteurs, titre, document, date, support, } 26

Analyse en ligne des données complexes Modélisation multidimensionnelle des publications Status Author Keyword Theme Metaheme Id_status Id_author Id_word Id_theme Id_metatheme status #Id_status name picture labo Publication #Id_author #Id_year #Id_type #Id_theme word #Id_metatheme theme metatheme #Id_word Period Id_period period start end Year Id_year #Id_period year Document Id_doc Title Abstract Body #Id_support #Id_doc Support Id_support pages volume number edition booktitle Type Id_type #Id_scope type Scope Id_scope scope 27

Contribution Visualisation et détection de régions intéressantes OPReT AROX CoDaViC ORCA OpAC 28

Visualisation et régions intéressantes Problèmes Pas d outils de visualisation OLAP adaptés aux données complexes Les faits = des données comportant du texte, des images, Pas toujours une mesure ou pas de mesure numérique Exploration OLAP manuelle et intuitive du cube Navigation parfois longue et non triviale Eparsité des cubes de données complexes Modalités des dimensions ordonnées selon un ordre pré-établi Comment représenter l information contenue dans un cube de DC? Comment organiser le cube de DC pour détecter des régions intéressantes? 29

Détection de régions intéressantes Problème S1 S2 S3 S4 S5 S6 S7 S8 Auth1 Auth2 Auth3 Auth4 Auth5 Auth6 Auth7 Auth8 Auth9 Aut10 S2 S6 S3 S1 S7 S5 S4 S8 Auth1 Auth3 Auth5 Auth7 Auth8 Auth4 Auth2 Aut10 Auth9 Auth6 30

Visualisation et régions intéressantes Motivations Positionnement Peu de travaux :(Ordonez2009), (Aouiche& Lemire 2008), (Morin 2007), (Sureau &Venturini 2009) Pas de réduction de l éparsité, pas de compression Visualiser en ligne l information contenue dans un cube Visualisation adaptée aux DC, prise en compte du contenu sémantique Aucune hypothèse sur les données Guiderl utilisateur vers les régions intéressantes Réorganiser intelligemment les dimensions et modalités du cube Détecter les faits intéressants ainsi que leurs liens Deux contributions CoDaViC(Complex Data Visualization by Correspondences) ORCA (Operator for Reorganization by multiple Correspondence Analysis) 31

Visualisation et régions intéressantes Principe Deux méthodes factorielles Analyse des correspondances (AFC) Analyse des correspondances multiples (ACM) Cube de données complexes Au minimum dénombrement des faits Tableaux de contingence Une méthode factorielle pour Réduire l espace de représentation Produire des axes factoriels (nouvelles dimensions) Créer un nouvel espace de représentation des faits Visualiser l information dans le cube OLAP Mettre en évidence des points de vue intéressants pour l analyse 32

Visualisation avec une méthode factorielle Principe 1. Contexte d analyse 2. Tableau de contingence 3. Analyse factorielle 4. Visualisation Sous-cube de données Opérateurs OLAP Axes factoriels Projection des faits Interprétation des proximités Synthèse graphique Drill down possible Auteur 1 Auteur 2 Auteur 3 Auteur 4 Auteur 1 Auteur 2 Auteur 3 Auteur 4 Auteur 1 Mot clé 3 Mot clé 1 Auteur 2 Mot clé1 Mot clé 2 Auteur 5 Mot clé 2 Mot clé 3 Mot clé 1 Mot clé 4 Mot clé 3 Mot clé 4 2007 2009 2008 Mot clé 4 Mot clé 2 Auteur 3 Auteur 4 33

34

Détection de régions intéressantes Principe Eparsité = 63% HI(C ini ) = 14% Eparsité = 63% HI(C arr ) = 25% Gain = 78% 35

Contribution Agrégation sémantique par classification OPReT AROX CoDaViC ORCA OpAC 36

Agrégation sémantique par classification Problème Classiquement, hiérarchies de dimensions fixées par l expert Pas d agrégation sémantique Pas d agrégation adaptée aux DC Keyword 1 Keyword 2 Keyword 3 Keyword 4 Full professor Author 1 Author 2 Author 3 Associate professor Author 4 2009 2008 2007 Nombre de publications en 2008 Author 5 Author 3 Author 1 Author 4 Author 2 Nombre de publications avec le mot-clé keyword 2 37

Agrégation sémantique par classification Motivation Agrégation sémantique Agrégation des faits selon leur proximité Exploitation des mesures pour l agrégation Création d une hiérarchie de dimension Classification Ascendante Hiérarchique (CAH) Hiérarchie de partitions = hiérarchie d une dimension Opérations roll-up et drill-down possibles Stratégie ascendante vs descendante Contribution: OpAC(Operator for Aggregation by Clustering) 38

Agrégation sémantique par classification Principe 1. Individus et variables de la classification 2. Classification 3. Evaluation des agrégats Choix des individus et des variables Règles à respecter Author 1 Author 2 Author 3 Author 4 Variables de la CAH Ascendante hiérarchique Choix de la partition Critère de séparabilité des classes KW 1 KW 2 KW 3 2008 2009 KW 1 KW 2 KW 3 KW 4 2009 2008 2007 Individus de la CAH Author 1 Author 2 Author 3 Author 4 39

Expérimentation, implémentation Validation expérimentale Données classiques Données complexes (mammographies, publications) Plates-formes logicielles MiningCubes: analyse en ligne des données complexes PUMA: application dédiée à l analyse des publications 40

Conclusion scientifique Problématique de l analyse en ligne des données complexes Cinq verrous scientifiques abordés Premiers résultats intéressants et encourageants Démonstration de la pertinence et faisabilité de combiner l'olap à d'autres techniques d analyse Evolution significative de l OLAP S adapter aux données complexes Dépasser ses propres limites 41

Projet scientifique Défi scientifique : extraire et analyser (en ligne) la sémantique Vers une nouvelle génération d'analyse en ligne : OLAP sémantique Création d un nouveau thème de recherche : problèmes théoriques, méthodologiques et technologiques Verrous scientifiques Couvrir toutes les caractéristiques des données complexes Modéliser toutes les formes de données complexes, leur sémantique et leurs liens Analyser en ligne les données complexes Intégrer les connaissances de l'utilisateur dans l'analyse Formaliser l OLAP sémantique 42

Projet scientifique Projet interdisciplinaire entre les laboratoires ERIC et ICAR (Lyon 2- ENS-CNRS) Interactions orales Identification automatique de phénomènes complexes (conflit, plainte,...) Base de données CLAPI : corpus oraux, transcriptions, documents XML Entrepôt de corpus Analyses appropriées Prise en compte de la sémantique contenue dans les corpus 43

Encadrement scientifique Co-encadrement de la thèse de RiadhBEN MESSAOUD, 2003-2006 Participation à la thèse d AbdellahSAIR, Ecole Nationale des Sciences Appliquées, Agadir Maroc, depuis septembre 2009 Formation à la recherche DEA, RiadhBEN MESSAOUD, 2003 Master recherche, NourredineMOKTARI, 2005 Master recherche, Michel El RAHI, 2006 Master recherche, Slimane DJOUADI, 2006 Master recherche, Anouck BODIN-NIEMCZUK, 2007 Master recherche, Loic MABIT, 2009 Master recherche et professionnel, YoucefMECHEHOUD, Moussa ZOUBIRI, Caroline CHAILLET, 2010 44

Production scientifique Ouvrage International : 1 Revues Chapitres Conférences Internationales : 6 Nationales : 1 Internationaux : 7 Internationales : 14 Francophones : 12 dont DMBI, IJWET, IJDWM, RTSI-ISI dont CAISE, PKDD, DB&IS, DOLAP, CIKM, Inforsid, EGC 45

Animation et expertise scientifique Comités éditoriaux ou de pilotage : EDA, IJBET, WMCD Comités de programme ou de lecture : JDS 2003, PKDD2004, ISWC'04, ASD06 à ASD10, EDA06 à EDA11, IIS 2008, RNTI, TSI, Comités d'organisation : SFC 1997, PKDD 2000, JDS 2003, EDA 2005, INFORSID 2013 Expertise: dossiers de financement CIFRE-ANR Groupes de travail ou associations scientifiques : groupe de travail sur la Fouille de Données complexes, action Spécifique CNRS STIC GaFoDonnées: sous-groupe de travail GafOLAP), Société Française de Statistique (SFdS), Société Francophone de Classification (SFC) 46

Merci pour votre attention