Visualisation interactive pour la découverte de connaissances : GeoECD

Dimension: px
Commencer à balayer dès la page:

Download "Visualisation interactive pour la découverte de connaissances : GeoECD"

Transcription

1 Visualisation interactive pour la découverte de connaissances : GeoECD Saïd KAROUACH, Bernard. DOUSSET {karouach, dousset}@irit.fr Université Paul Sabatier - IRIT/SIG, 118, route de Narbonne Toulouse cedex4 Mots-clés : découverte de connaissances, données textuelles, visualisation d information, visualisation interactive, visualisation par cartes géographiques. Key-words : knowledge discovery/texmining, information visualization,, interactive visualization, visualization by geographic maps. Palabras claves : explotación minera del texto, visualización de la información, visualización interactiva, visualización por geográficas las correspondencias. Résumé : Dans le cadre général de l'aide à la décision, l'extraction de Connaissances à partir de Données (ECD) est devenu un nouveau thème de recherche qui a déjà largement démontré son importance scientifique et économique et apparaît, maintenant, comme un domaine stratégique. L'ECD utilise la visulisation pour exhiber la composante informationnelle profonde contenue dans les données brutes et pour faciliter le processus de découverte de connaissances associé dans ses phases d'analyse et d'interprétation par les experts du domaine. Nos préoccupations s'inscrivent dans le contexte précédent et nous proposons l'approche et les concepts supportés par notre outil de visualisation destiné à aider l'utilisateur dans sa démarche de découverte de connaissances à partir de données textuelles. Cet outil de visualisation s'adresse aux deux facettes citées précédemment. Nous lui avons adjoint une composante interactive pour accroître son efficacité, notamment, en permettant à un groupe d'utilisateurs (éventuellement distants et en simultané) d'intervenir dans le processus de découverte de connaissances. Une particularité de notre proposition concerne la problématique de la fusion ou de l'association de données textuelles avec des données externes pour gérer un mécanisme de géoréférencement logique. Une deuxième particularité concerne la visualisation de ces résultats sur des cartes géographiques avec différents niveaux de granularité (continent, zone, pays). IRIT - DELTA VEILLE 301

2 VSST' Introduction La croissance exponentielle du volume des informations disponibles dans les bases de données et la nécessité d'une réactivité efficace de la part des décideurs face à ces masses d'informations, ont stimulé, cette dernière décennie, le développement rapide de l'extraction de Connaissances à partir des Données (ECD). L'ECD a été définie comme "l'extraction, à partir des données, d'une information implicite, inconnue auparavant et potentiellement utile" [7]. Cette caractérisation a été revue par différents auteurs mais tous s'accordent sur le fait qu'il s'agit d'extraire des connaissances pertinentes et intelligibles a priori non connues et ce à partir d'une grande masse de données. Dans ce papier, nous présentons l'outil GeoECD permettant une visualisation interactive des résultats d'un processus d'ecd. GeoECD traduit des données géoréférencées logiquement par des cartes géographiques. Pour différencier notre proposition de celles qui existent dans le contexte des systèmes d'informations géographiques, notons que nos sources de données sont externes à notre système, de nature textuelles et souvent de formats hétérogènes. L'interface visuelle de GeoECD permet de matérialiser des résultats selon différents niveaux d'agrégation et/ou de détails en fonction du besoin et du point de vue (sélection d'une zone spatiale) de l'utilisateur. Cet outil intègre une composante ergonomique associée à la perception visuelle des nuances de couleur, pour mieux différencier les informations affichées, et afin d améliorer le processus d'interprétation de ces données par l'utilisateur. Après un bref rappel du processus de découverte de connaissances, nous caractérisons quelques outils de visualisation dans le domaine de l'ecd, en incluant ceux du logiciel Tétralogie, developpé dans l'équipe IRIT/SIG. En effet, Tétralogie ( a servi de support pour la réalisation de GeoECD qui en est une composante additionnelle. Afin de cibler notre papier sur la visualisation en ECD, nous décrivons notre proposition sans détailler le processus d'ecd qui permet de produire l'information à présenter. Nous mettons l'accent sur l'aspect interactif et coopératif de GeoECD ainsi que sur sa composante communicative avec les outils de visualisation existant déjà dans Tétralogie. 2 Processus de découverte de connaissances La Découverte de Connaissances à partir de Donneées ou ECD est définie comme ''le processus non trivial qui consiste à identifier dans des données, des schéma nouveaux, valides, potentiellement utiles et surtout compréhensibles et utilisables'' [7]. Ce processus (cf Figure 1), semi-automatique et itératif, est constitué de plusieurs étapes allant de la sélection et la préparation des données à l'interprétation des résultats, en passant par la phase de l'extraction de connaissances : le Data Mining ( DM ). Le DM (ou la fouille de données) est le coeur de ce processus car il permet d'extraire de l'information des données. Néanmoins, c'est une étape souvent difficile à mettre en oeuvre, coûteuse et dont les Figure 1Etapes du processus de l'ecd 302

3 résultats doivent être interprétés et relativisés. Notons egalement qu'en situation réelle, pour l'aide à la décision, une très grande majorité des résultats recherchés s'obtient uniquement par requêtes, par analyse multi-dimensionnelle ou grâce aux outils de visualisation. Les algorithmes de découverte de connaissance mis au point résolvent, en général, des problèmes typiques [1, 7] de classification, segmentation, modélisation de dépendances, association, identification de séquences, recherche d'exceptions dans une collection de données très volumineuse et hétérogène. 2.1 ECD et visualisation de l'information L'extraction de connaissances nécessite de fournir à l'utilisateur des informations interprétables. Ainsi, les outils d'ecd s'appuient sur des techniques de visualisation qui sont étroitement liées au problème d'intelligibilité [12, 22]. Ces techniques sont utilisées pour la représentation de l'information ou/et pour l'aide à la découverte de connaissances. La visualisation de l'information consiste à traduire, à transcrire ou encore à coder l'information retenue dans une forme visuelle pertinente : il s'agit de construire un schéma graphique, une image, etc. adéquat par rapport à l'information, qu'il faut communiquer ainsi que les relations logiques sousjacentes. Il faut donc considérer chaque type de représentation visuelle (tableaux, schémas, organigrammes, graphiques, cartes, plans, dessins figuratifs, photographies, etc.) comme une forme de communication spécifique, comme un langage possédant ses règles et son code. Il s'agit de formes d'expression relativement conventionnelles qui doivent être respectées si l'on veut garantir l'efficacité de la communication. En ECD, on distingue deux types d'outils de visualisation [12] : Outils de visualisation des résultats : Les systèmes d'ecd produisent un nombre élevé de résultats : arbre de décision, grille de scores, base de règles, modèle de régression, réseau de neurones, etc. La forme des résultats varie en fonction des approches utilisées dans l'étape de découverte. Les outils de visualisation doivent restituer la connaissance extraite pour qu'elle soit réellement utile. Ces outils varient en fonction des approches utilisées dans l'étape de découverte et de la nature des résultats obtenus. Pour des informations hiérarchiques, on utilise souvent un dendogramme [8, 9], des arbres hyperboliques [14], des arbres coniques [20] ou des arborescences semblables à celles des gestionnaires de fichiers [11]. Pour les informations non hiérarchiques, il peut s'agir de visualisations à deux dimensions comme dans les cartes de Kohonen [13]. Les associations découvertes peuvent, quant à elles, être représentées par des graphes [15] ou des arbres de décision [18] lorsqu'il s'agit d'associations sous forme de règles. Pour les associations de similitude, des représentations sous forme de graphes [21] ou de cartes à plusieurs dimensions [17] sont les plus appropriées. Outils de visualisation pour l'aide à la découverte de connaissances : Ces outils doivent aider les utilisateurs en leur fournissant des représentations synthétiques des informations et des interfaces de visualisation interactives [12]. Ils doivent permettre à l'utilisateur de detecter les connaissances effectivement utiles parmi l'ensemble des données. Les principes de visualisation multidimensionnelle utilisés dans les systèmes OLAP sont parmi les plus répandus dans cette catégorie [4, 22]. Ils permettent de visualiser des mesures en fonction de différentes dimensions. Ces principes sont généralement appliqués à des données structurées. Certains travaux visent cependant à généraliser cette approche à des informations non structurées [16, 19]. Les principes utilisés dans Tétralogie se situent également dans cette catégorie d'approche. Cet outil permet d'obtenir des vues synthétiques sur un ensemble de documents textuels en fonction de différentes dimensions (auteurs des documents, date de publication, concepts issus du contenu des documents, etc...). Il s'appuie pour cela sur des techniques d'analyse de données (classifications, analyses factorielles etc.) et appliquées dynamiquement à un sous ensemble des informations detectées semi-automatiquement comme potentiellement intéressantes [16]. D'autres outils [5, 10] ont été développés dans ce sens pour les deux modes de visualisation. Certains sont commercialisés, d'autres sont sous forme de prototypes universitaires et/ou support de validation de nouveaux algorithmes d'extraction de connaissances. On peut citer par exemple : DBMiner, VisualMine, MineSet, Clementine,... IRIT - DELTA VEILLE 303

4 VSST' Visualisation par cartes géographiques 3.1 Introduction L'ECD utilise souvent la visualisation dans toutes ses phases, et, elle exige des affichages fortement interactifs et dynamiques. En cartographie, chaque méthode de présentation est basée sur l'utilisation d'une ou plusieurs des variables visuelles présentées par Jacques Bertin [3] : position, la taille, la valeur (degré d'obscurité), la couleur (tonalité), la texture, l'orientation, et la forme. Le principe général de la présentation de données est le suivant : "les variables visuelles doivent avoir un niveau d'organisation au moins égal à celui des composants qu'elles représentent". La visualisation par des cartes géographiques est apparue avec la naissance des Systèmes d'informations Géographiques (SIG). Parmi les cartes les plus utilisées, on peut citer : les cartes de Chorpleth [2] ou cartes choroplèthes. Une carte de choropleth est une carte dans laquelle la couleur et/ou la nuance des zones change selon la densité, la concentration, ou l'importance d'une variable. Les valeurs numériques pour la variable tracée sont divisées en classes de données qui sont assignées par un codage de couleur. Les tonalités plus légères correspondent à des valeurs plus basses, alors que des tonalités plus foncées correspondent à des valeurs plus élevées. GeoECD est inspiré de ce type de cartes. D une part cet outil manipule des données géoréférencées sans aucune classification préalable; d'autre part, il fusionne ces données avec des données externes au sytème Tétralogie. Il utilise certaines variables de Bertin: position, couleur et taille pour favoriser de manière significative l'exploration de données. 3.2 Informations manipulées Les données textuelles que nous analysons (documents Web, corpus bibliographique, groupe de discussions ``NewsGroups'',...) étant multi-formes, nous utilisons des thesaurus pour détecter, uniformiser et agréger les termes d'origines géographiques. Par exemple, dans certaines bases documentaires semi-structurées l'adresse peut ne contenir que le nom d'une région ; il doit être possible d'extraire les informations géographiques d'autres niveaux si nécessaire (par exemple, le pays). Nous nous appuyons pour cela sur une hiérarchie d'agrégation générique du type : Université Paul Sabatier Toulouse Haute Garonne France Europe Lorsque le traitement sémantique s'arrête à la granularité pays, Tétralogie fournit des tables de contingences croisant cette entité avec une autre dimension (concepts, auteurs, sources, dates,...). En effet, il est également possible de croiser les valeurs des pays entre eux dans le cas d'études de collaborations internationales. GeoECD prend alors le relais et propose plusieurs points de vue pour pondérer, filtrer et afficher les informations sur une carte. Il est alors possible d'utiliser différentes hiérarchies d'agrégation en fonction de l'objectif visé par l'utilisateur. Bien que de nombreuses hiérarchies soient prédéfinies, il est toujours possible pour l'utilisateur de définir ses propres hiérarchies. Ainsi, GeoECD s'intéresse aux tables de contingences pour lesquelles au moins une dimension est le pays. Ces tables sont généralement de grande taille pouvant aller jusqu'à N 3000, 3000 N où N représente le nombre de pays étudiés. 3.3 Pondération des données Le principe de l'outil GeoECD est de projeter sur une carte les données pour lesquelles la dimension géographique est présente. Mais, comme il n'est pas toujours pertinent de représenter les données absolues (première place souvent monopolisée par les USA, disparités des rangs et des tailles des pays, distribution des typologies de références), notre outil propose des pondération de ces données par un certain nombre d'informations externes relatives aux pays (PNB, population, superficie) afin de relativiser l'importance de ces données et d'estimer leur réelle potentialité. Par exemple, dans le cadre d'une analyse des collaborations entre différents organismes de recherche sur un domaine, une pondération par le PNB permet de voir si l'effort de coopération est proportionnel à la taille économique de tel ou tel pays, ou bien si l'investissement dans un domaine est proportionnellement plus fort dans un pays que dans un autre. De la même manière, le rapport à la population peut donner 304

5 une indication sur l'effort consenti par habitant et le rapport à la surface utile pour l'adéquation avec les potentialités d'application d'une technique connexe à cette mesure (domaine agricole, observation de la terre, pollution, productivité d'un secteur, etc). Le fait de pouvoir appliquer aux données les pondérations précédentes permet également de faire apparaître de façon explicite certains éléments pertinents utiles à la décision. Citons par exemple : un recentrage sur les pays économiquement forts, un isolement dû à des problèmes politiques, une stratégie de prise de contrôle à l'échelle d'un continent ou d'une région économique. 3.4 Codage des données sous forme de couleurs Le principe de transformation des données matricielles en données géographiques repose sur un codage de couleurs. Les données issues d'une table de contingence sont traduites en intensité d'une couleur choisie pour représenter l'information. Le modèle de couleurs adopté par GeoECD est le RVB (rouge, vert, bleu). Pour bien représenter le positionnement des pays sur la carte avec des nuances de couleurs différentes, nous affectons à chacun de ces pays un niveau calculé en fonction de sa valeur dans la matrice M, éventuellement pondérée par une propriété (PNB, population, superficie). Les pays non présents dans la matrice M sont identifiés par une couleur particulière. Plus spécifiquement, pour définir un spectre de nuances adapté à la distribution des pays présents, le modèle utilisé pour coder l'intensité de coloration est défini par la famille des fonctions fint(., n), non linéaires d'ordre n de type : et M i = j M ij est la marginale du pays i dans la matrice M et p ik une propriété (type de pondération). L'intensité de couleur d'un pays sur la carte traduit le rang de celui-ci. Allure de la fonction de l intensité de couleur On remarque que ces fonctions sont strictement croissantes, ainsi pour n = 1, l'intensité de la couleur de chaque pays présent est équivalente à la quantité X i correspondante. Pour n > 1, l'intensité augmente en bas de l'échelle, et donc l'accent est mis sur les pays de faible valeur X i. Au contraire, lorsque n < 1, l'intensité diminue en bas de l'échelle et les pays les plus présents bénéficient de plus de nuances pour être distingués. Afin d'avoir une idée sur le pourcentage de la force d'un pays, une échelle graduée des intensités de couleur est dynamiquement tracée en fonction de la valeur de n choisie. A chaque type de pondération par les données externes, nous associons une couleur de base différente afin de distinguer les vues obtenues. Par exemple, pour une pondération par la population, la couleur de base sera le cyan (cf figure 2). Sur cette figure, le grenat indique des pays absents (pour lesquels aucune donnée n'est visualisée). IRIT - DELTA VEILLE 305

6 VSST' Les types de vues de GeoECD Vues absolues et relatives Figure 2 Vue relative à la population L'interface adoptée pour GeoECD offre la possibilité d'avoir des vues en deux modes complémentaires : absolu ou relatif. En mode absolu, les différentes données sont visualisées sans pondération. En revanche, en mode relatif les données sont pondérées en fonction d'une propriété relative aux différents pays. Figure 3 Vue en mode absolu La figure 3 est un exemple de représentation des informations en mode absolu alors que la figure 2 représente les mêmes données en mode relatif (à la population des pays dans ce cas). Comme précédemment, sur la figure 3, la couleur grenat représente des pays absents. L'intensité lumineuse est représentative de l'importance d'une caracteristique d'un pays. Sur ces figures (3, 2), on peut remarquer que les Etats-Unis sont prédominants lorsque l'on visualise les données absolues. Cette prédominance n'est pas conservée en mode relatif ( par rapport à la population). 306

7 3.5.2 Zoom sur une zone géographique Une vue globale sur la carte du monde est bien entendu souvent incontournable, mais un zoom sur une région (cf Fig.4) est souvent très utile comme pour l'europe où les pays sont de petite taille. D'autres zones ont aussi leur intérêt comme le G8, l'europe communautaire, la zone Euro, l'opep, le bassin méditerranéen, le quart monde, le tiers monde, les pays francophones, les pays hispaniques, etc. La possibilité de définir soi-même des régions est un atout indiscutable pour la compréhension de certains phénomènes stratégiques : zone concurrentielle, zone d'expansion, zone déjà couverte, pays émergents, etc. L'interface de GeoECD offre à l'utilisateur la possibilité de visualiser les informations sur la carte du monde ou sur une partie du monde. Ainsi, l'utilisateur peut focaliser son intérêt sur un pays, un continent ou une région particulière qu'il doit lui même définir : zone concurrentielle, pays potentiels,... Figure 4 Vue en mode absolu avec un zoom sur l'asie Vues filtrées L'utilisateur peut focaliser son étude sur certains éléments et choisir les items à visualiser dans l'autre dimension. Dans ce cas, seules les variables sélectionnées (à gauche sur la carte) par l'utilisateur, seront prises en compte lors du calcul de Xi. Par exemple, pour des tables de contingences faisant intervenir les pays et le temps (via des périodes), c'est à dire des matrices de type Pays-Périodes ou Périodes-Pays, l'utilisateur pourra, s'il s'intéresse à l'évolution d'un critère ou d'un phénomène donné, filtrer successivement les données sur les différentes années ou périodes. Il obtiendra les vues correspondantes avec la possibilité de visualiser simultanément plusieurs cartes et il pourra ensuite les comparer suivant les mêmes pondérations. IRIT - DELTA VEILLE 307

8 VSST'2001 Figure 5 Vue filtrée sur les Pays-Bas Notons que dans le cas d'une matrice Pays-Pays, la seconde dimension (les colonnes de la matrice) devient la variable à visualiser, on obtient ainsi les coopérations internationales. Si on ne choisit qu'un pays, il est possible de connaître sa couverture internationale. Par exemple, dans la figure 5, les données ont été filtrées sur les Pays-Bas. Ainsi, seules les collaborations entre les Pays-Bas et les autres pays sont visualisées. La figure 6 matérialise les collaborations internationales de la Belgique. On peut noter que les deux pays possèdent quelques collaborateurs communs avec des degrés différents dans certaines régions (exemple Pays-Bas avec le USA). Mais sur le continent asiatique, ils n'ont pas les mêmes politiques de coopération. La coloration orange schèmatise les pays non collaborateurs du pays sélectionné. Figure 6 Vue filtrée sur la Belgique 308

9 3.6 Visualisation d'une classification Dans Tétralogie, le résultat d'une classification ascendante hiérarchique (CAH) est visualisé par un arbre planaire intéractif (cf Fig.7). Grâce au choix de cette représentation, il est possible de couper l'arbre à différents niveaux. Si l'arbre est coupé proche de sa racine, le nombre de classes est petit, mais des éléments relativement éloignés peuvent être regroupés (forte distance intra-classe). Au contraire, plus l'arbre est coupé proche de ses feuilles, plus les classes sont petites et les objets proches à l'intérieur d'une classe. Dans Tétralogie, l'utilisateur peut aussi visualiser le contenu d'une classe et Figure 7 Arbre CAH dans Tétralogie archiver son contenu dans un fichier. Après une CAH des pays selon une autre dimension (dont les valeurs servent de critère de classification), l'utilisateur peut directement visualiser l'organisation en classes des différents pays sur la carte du monde (cf Fig 8). Chaque niveau de coupure choisi est instantanément matérialisé sous une forme imagée dont l'interprétation est intuitive. Les couleurs utilisées ont alors une sémantique particulière puisque les pays de la même classe se voient attribuer la même couleur. Ce type de carte est un cas particulier des cartes de Choropleth. Figure 8 Visualisation des résultats d'une CAH Les deux types de visualisation d'une classification peuvent être considérées comme complémentaires. La visualisation par GeoECD et donc la répartition spatiale des classes peut permettre d'expliquer les phénomènes observés par exemple par des proximités géographiques qui n'auraient pas été détectées via une visualisation sous forme de dendogramme. On pense par exemple à des données medicales (maladie, phénomènes d'épidémie), des données relatives à l'environnement (phénomènes de pollution). IRIT - DELTA VEILLE 309

10 VSST' Interactivité Il y a plusieurs niveaux d'interactivité dans GeoECD : Choix du mode des vues : absolu ou relatif. Choix du type de vue : monde, continent, zone géographique prédéfinie ou paramétrée par l'utilisateur. Choix de la courbe de correspondance entre amplitude et nuances des couleurs (linéaire ou prévilégiant les faibles ou les forts amplitudes). Filtrage par sélection des items de l'autre dimension (périodes, acteurs du domaine, mots-clés,...). Interactivité entre les cartes elles-mêmes. Par exemple, à partir d'une vue donnée, l'utilisateur peut exporter cette vue sur une autre carte. Ceci est utile dans plusieurs cas : comparer deux points de vue sur le même écran mais sur deux cartes différentes, piloter à distance des cartes sur les écrans des autres utilisateurs connectés à la même analyse. Ce processus est basé coté émetteur sur la notion d'exportation (communication) des paramètres de la vue et coté récepteur sur la prise en compte totale ou partielle de ceux-ci. Communication avec le module de classification. 4 Conclusion Dans ce papier, nous avons présenté notre approche de visualisation interactive à partir de données textuelles. Cette approche permet notamment de: construire incrémentalement, via une hiérarchie d'agrégation, une représentation de l'information à explorer. visualiser des résultats d'analyse détaillée pour certains niveaux de granularité. caractériser des informations à caractère exceptionnel qui peuvent être révélatrice de phénomènes pertinents notamment à travers l'utilisation des couleurs. gérer les activités collaboratives effectuées par un groupe de travail où différents acteurs sont amenés à confronter les résultats de leurs analyses. faire des regroupements via plusieurs analyses pour renforcer ou contredire quelques tendances qui semblent se dégager dans des analyses particulières. Cette approche est implantée dans GeoECD qui étend les fonctionnalités de Tétralogie. Les figures illustrant ce papier sont issues d'une étude menée avec l'outil que nous avons développé pour palier notre approche. GeoECD a été utilisé pour conduire des études, notamment pour l'analyse des collaborations des organismes de recherches de l'inra, qui a permis de matérialiser l'évolution des comportements et des coopérations internationnales de ces organismes. Nous avons focalisé notre présentation sur l'aspect visualisation sans détailler le processus ECD qui permet de construire les tables de contingence ainsi que le processus de géoréférencement logique. Par ailleurs, l'aspect rédactionnel limite la présentation de l'aspect dynamique des caractéristiques de notre interface, aspect qui peut être démontrer à travers des présentations et manipulations du système GeoECD. Notons également l'importance des couleurs qu'une impression en noir et blanc ne saurait retranscrire. L'utilisation de GeoECD a été restreinte aux données produites par Tétralogie où la dimension géographique est présente dans les données. Toutefois, GeoECD est conçu pour être utilisable pour le même type de données issues d'autres systèmes. Ses qualités additionnelles sont l'interactivité, la communication entre les cartes et avec d'autres modules de Tétralogie (arbres de classification, cartes factorielles, Tableur,...) et la possibilité de pondérer les données brutes fournies par la phase d'analyse par des caractéristiques diverses (des propriétés des pays dans notre cas). Cette pondération permet de faire surgir de façon explicite certains éléments pertinents utiles à la décision. Bibliographie [1.] AGRAWAL (R.) et SWAMI (A.). Database mining : A performance perspective. IEEE trans. Knowledge and data engineering, vol. 5, n 6, Décembre 1993, pp [2.] ANDRIENKO (G.) et ANDRIENKO (N.). Interactive maps for visual data exploration. In : International Journal Geographical Information Science. pp Special Issue on Visualization for exploration of Spatial data. 310

11 [3.] BERTIN (J.). The semiology of graphics. University of Wisconsin Press, [4.] CHAUDHURI (S.) et DAYAL (U.). An overview of data warehousing and olap technology. ACM SIGMOD, vol. 26, n 1, Mai [5.] COOK (D.J.). Data visualization: [6.] DEL BIMBO (A.). Visual Information Retrieval. - Morgan Kaufmann Inc., juin [7.] FAYYAD (U.M.), PIATETSKY-SHAPIRO (G.), SMYTH (P.) et UTHURUSAMY (R.). Advances in Knowledge Discovery and Data Mining. AAAI/MIT Press, 1996, ISBN : [8.] DIDAY (E.), et al.. Classification automatique des données : Environnement statistique et informatique. Edition Dunod, [9.] DKAKI (T.). Outils mathématiques et méthodes automatiques pour la veille technologique. Thèse, Université Paul Sabatier - IRIT, France, Août [10.] Kdnuggets [11.] KEIM (D. A.) et KRIEGEL (H-P.). Fractal approaches for visualizing huge hierarchies. IEEE Symposium on Visual Languages, [12.] KEIM (D. A.) et KRIEGEL (H-P.). Visualization techniques for mining large databases : A comparison. IEEE Trans. Knowledge and data Engineering, vol. 8, n 6, 1996, pp [13.] KOHONEN (T.). Self-Organizing Maps. Springer Series in Information Sciences, [14.] LAMPING (J.), RAO (R.) et PIROLLI (P.). A focus+context technique based on hyperbolic geometry for visualizing large hierarchies. Proceeding of the ACM CHI'95 Conference on human Factors in Computing Systems, [15.] LEHN (R.). Un système interactif de visualisation et de fouille de règles pour l'extraction de connaissances dans les bases de données. Thèse, IRIN Université de Nantes, France, Décembre [16.] MOTHE (J.) et al. Information mining: use of the document dimensions to analyse interactively a document set. 23rd BCS European Colloquium on IR Research, April [17.] MOTHE (J.) et DKAKI (T.). Interactive multidimensional document visualization. Proceedings of the 21st Annual International ACM SIGIR (Poster), Août 1998, pp [18.] QUINLAN (J. R.). C4.5 : Programs for machine learning. Morgan Kaufman, [19.] RAJMAN (M.) et BESANÇON (R.). Text mining - knowledge extraction from unstructured textual data. Proc. of 6th Conference of International Federation of Classification Societies (IFCS-98), Juillet 1998, pp [20.] ROBERTSON (G.G.), MACKINLAY (J.D.) et CARD (S.K.). Cone trees : animated 3D visualisations of hierarchical information. Proceeding of the ACM CHI'91 Conference on human Factors in Computing Systems, 1991, pp [21.] SARKAR (M.) et BROWN (M.). Graphical fisheye views of graphs. Proceeding of the ACM CHI'92 Conference on human Factors in Computing Systems, 1992, pp [22.] THEARLING (K.) et al. Visualizing data mining models. Proceedings of the Integration of Data Mining and Data Visualization Workshop, IRIT - DELTA VEILLE 311

Extraction d informations stratégiques par Analyse en Composantes Principales

Extraction d informations stratégiques par Analyse en Composantes Principales Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 dousset@irit.fr 1 Introduction

Plus en détail

sont appliquées à des fonds documentaires, sont destinées à fournir des informations pertinentes sur la structure globale plutôt que sur le contenu.

sont appliquées à des fonds documentaires, sont destinées à fournir des informations pertinentes sur la structure globale plutôt que sur le contenu. Introduction Les techniques informatiques permettent de stocker et d accéder à des quantités sans cesse croissantes de données, disponibles en ligne ou via des centres documentaires fermés. Cette profusion

Plus en détail

Historique. Architecture. Contribution. Conclusion. Définitions et buts La veille stratégique Le multidimensionnel Les classifications

Historique. Architecture. Contribution. Conclusion. Définitions et buts La veille stratégique Le multidimensionnel Les classifications L intelligence économique outil stratégique pour l entreprise Professeur Bernard DOUSSET dousset@irit.fr http://atlas.irit.fr Institut de Recherche en Informatique de Toulouse (IRIT) Equipe Systèmes d

Plus en détail

SIG ET ANALYSE EXPLORATOIRE

SIG ET ANALYSE EXPLORATOIRE SIG ET ANALYSE EXPLORATOIRE VERS DE NOUVELLES PRATIQUES EN GÉOGRAPHIE Jean-Marc ORHAN Equipe P.A.R.I.S., URA 1243 du CNRS Paris Résumé L'offre actuelle dans le domaine des logiciels de type Système d'information

Plus en détail

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données et le Data Mining Nous suivons le plan suivant : Fonctionnement de Spad Catalogue des méthodes (statistiques

Plus en détail

Entrepôt de données 1. Introduction

Entrepôt de données 1. Introduction Entrepôt de données 1 (data warehouse) Introduction 1 Présentation Le concept d entrepôt de données a été formalisé pour la première fois en 1990 par Bill Inmon. Il s agissait de constituer une base de

Plus en détail

TRAVAUX DE RECHERCHE DANS LE

TRAVAUX DE RECHERCHE DANS LE TRAVAUX DE RECHERCHE DANS LE DOMAINE DE L'EXPLOITATION DES DONNÉES ET DES DOCUMENTS 1 Journée technologique " Solutions de maintenance prévisionnelle adaptées à la production Josiane Mothe, FREMIT, IRIT

Plus en détail

THOT - Extraction de données et de schémas d un SGBD

THOT - Extraction de données et de schémas d un SGBD THOT - Extraction de données et de schémas d un SGBD Pierre-Jean DOUSSET (France), Benoît ALBAREIL (France) pj@miningdb.com, benoit@miningdb.com Mots clefs : Fouille d information, base de données, système

Plus en détail

CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS

CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS Nazih Selmoune (*), Zaia Alimazighi (*) Selmoune@lsi-usthb.dz, Alimazighi@wissal.dz (*) Laboratoire des systèmes

Plus en détail

PRODIGE V3. Manuel utilisateurs. Consultation des métadonnées

PRODIGE V3. Manuel utilisateurs. Consultation des métadonnées PRODIGE V3 Manuel utilisateurs Consultation des métadonnées Pour plus d'information sur le dispositif : à remplir par chaque site éventuellement 2 PRODIGE V3 : Consultation des métadonnées SOMMAIRE 1.

Plus en détail

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1 Christophe CANDILLIER Cours de DataMining mars 2004 age 1 1. Introduction 2. rocessus du DataMining 3. Analyse des données en DataMining 4. Analyse en Ligne OLA 5. Logiciels 6. Bibliographie Christophe

Plus en détail

Chapitre 9 : Informatique décisionnelle

Chapitre 9 : Informatique décisionnelle Chapitre 9 : Informatique décisionnelle Sommaire Introduction... 3 Définition... 3 Les domaines d application de l informatique décisionnelle... 4 Architecture d un système décisionnel... 5 L outil Oracle

Plus en détail

OSIRIS/ Valorisation des données PORTAIL BO MANUEL UTILISATEUR

OSIRIS/ Valorisation des données PORTAIL BO MANUEL UTILISATEUR OSIRIS/ Valorisation des données PORTAIL BO MANUEL UTILISATEUR HISTORIQUE DES VERSIONS Vers. Date Rédacteur Objet de la modification 1.00 Juillet 2007 GTBO_AGRI Création du document 1.01 Février 2009 SAMOA

Plus en détail

modélisation solide et dessin technique

modélisation solide et dessin technique CHAPITRE 1 modélisation solide et dessin technique Les sciences graphiques regroupent un ensemble de techniques graphiques utilisées quotidiennement par les ingénieurs pour exprimer des idées, concevoir

Plus en détail

Université de Bangui. Modélisons en UML

Université de Bangui. Modélisons en UML Université de Bangui CRM Modélisons en UML Ce cours a été possible grâce à l initiative d Apollinaire MOLAYE qui m a contacté pour vous faire bénéficier de mes connaissances en nouvelles technologies et

Plus en détail

Introduction à la B.I. Avec SQL Server 2008

Introduction à la B.I. Avec SQL Server 2008 Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide

Plus en détail

Communiqué de Lancement

Communiqué de Lancement Direction du Marketing Produits Sage - Division Mid Market Communiqué de Lancement Rapprochement Bancaire 1000 Produit : Rapprochement Bancaire 1000 Bases de Données : Oracle - MS/SQL Server Microsoft

Plus en détail

Qu'est ce que le KM? M. Prax a d'abord défini le KM par la négative. Le KM n'est pas :

Qu'est ce que le KM? M. Prax a d'abord défini le KM par la négative. Le KM n'est pas : Compte-rendu : «Les enjeux des TIC : le Knowledge Management» Conférence du 3 ème millénaire, Salon Initiatives du jeudi 18 octobre 2001 Orateur : Jean-Yves Prax, Directeur de POLIA CONSULTING Face à un

Plus en détail

Travaux pratiques avec RapidMiner

Travaux pratiques avec RapidMiner Travaux pratiques avec RapidMiner Master Informatique de Paris 6 Spécialité IAD Parcours EDOW Module Algorithmes pour la Fouille de Données Janvier 2012 Prise en main Généralités RapidMiner est un logiciel

Plus en détail

La carte, le territoire et l'explorateur où est la visualisation? Jean-Daniel Fekete Equipe-projet AVIZ INRIA Jean-Daniel.Fekete@inria.fr www.aviz.

La carte, le territoire et l'explorateur où est la visualisation? Jean-Daniel Fekete Equipe-projet AVIZ INRIA Jean-Daniel.Fekete@inria.fr www.aviz. La carte, le territoire et l'explorateur où est la visualisation? Jean-Daniel Fekete Equipe-projet AVIZ INRIA Jean-Daniel.Fekete@inria.fr www.aviz.fr Quelques exemples 1 La campagne de Russie de Napoléon

Plus en détail

Business Intelligence avec SQL Server 2012

Business Intelligence avec SQL Server 2012 Editions ENI Business Intelligence avec SQL Server 2012 Maîtrisez les concepts et réalisez un système décisionnel Collection Solutions Informatiques Extrait Alimenter l'entrepôt de données avec SSIS Business

Plus en détail

Introduction au datamining

Introduction au datamining Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des

Plus en détail

Le Futur de la Visualisation d Information. Jean-Daniel Fekete Projet in situ INRIA Futurs

Le Futur de la Visualisation d Information. Jean-Daniel Fekete Projet in situ INRIA Futurs Le Futur de la Visualisation d Information Jean-Daniel Fekete Projet in situ INRIA Futurs La visualisation d information 1.Présentation 2.Bilan 3.Perspectives Visualisation : 3 domaines Visualisation scientifique

Plus en détail

PRODIGE V3. Manuel utilisateurs. Consultation des métadonnées

PRODIGE V3. Manuel utilisateurs. Consultation des métadonnées PRODIGE V3 Manuel utilisateurs Consultation des métadonnées Pour plus d'information sur le dispositif : à remplir par chaque site éventuellement 2 PRODIGE V3 : Consultation des métadonnées SOMMAIRE 1.

Plus en détail

Traitement numérique de l'image. Raphaël Isdant - 2009

Traitement numérique de l'image. Raphaël Isdant - 2009 Traitement numérique de l'image 1/ L'IMAGE NUMÉRIQUE : COMPOSITION ET CARACTÉRISTIQUES 1.1 - Le pixel: Une image numérique est constituée d'un ensemble de points appelés pixels (abréviation de PICture

Plus en détail

Visualisation d information interactive

Visualisation d information interactive Visualisation d information interactive Jean-Daniel Fekete & Frédéric Vernier INRIA Futurs/LRI & LIMSI Jean-Daniel.Fekete@inria.fr & Frederic.Vernier@limsi.fr Visualisation The eye the window of the soul,

Plus en détail

Cédric Gendre Inra, ESR Toulouse

Cédric Gendre Inra, ESR Toulouse ODR, Bases de données administratives à différentes échelles spatiales Cédric Gendre Inra, ESR Toulouse 2èmes journées de recherches en sciences sociales INRA SFER CIRAD 11 & 12 décembre 2008 LILLE, France

Plus en détail

Techniques d interaction dans la visualisation de l information Séminaire DIVA

Techniques d interaction dans la visualisation de l information Séminaire DIVA Techniques d interaction dans la visualisation de l information Séminaire DIVA Zingg Luca, luca.zingg@unifr.ch 13 février 2007 Résumé Le but de cet article est d avoir une vision globale des techniques

Plus en détail

Analyse de grandes bases de données en santé

Analyse de grandes bases de données en santé .. Analyse de grandes bases de données en santé Alain Duhamel Michaël Genin Mohamed Lemdani EA 2694 / CERIM Master 2 Recherche Biologie et Santé Journée Thématique Fouille de Données Plan. 1 Problématique.

Plus en détail

Introduction à l Informatique Décisionnelle - Business Intelligence (7)

Introduction à l Informatique Décisionnelle - Business Intelligence (7) Introduction à l Informatique Décisionnelle - Business Intelligence (7) Bernard ESPINASSE Professeur à Aix-Marseille Université (AMU) Ecole Polytechnique Universitaire de Marseille Septembre 2013 Emergence

Plus en détail

Une proposition d extension de GML pour un modèle générique d intégration de données spatio-temporelles hétérogènes

Une proposition d extension de GML pour un modèle générique d intégration de données spatio-temporelles hétérogènes 303 Schedae, 2007 Prépublication n 46 Fascicule n 2 Une proposition d extension de GML pour un modèle générique d intégration de données spatio-temporelles hétérogènes Samya Sagar, Mohamed Ben Ahmed Laboratoire

Plus en détail

Conception d'applications de base de données ios plus rapides Guide Pratique FileMaker

Conception d'applications de base de données ios plus rapides Guide Pratique FileMaker Conception d'applications de base de données ios plus rapides Guide Pratique FileMaker Table des Matières Introduction... 3 Conception de modèles... 3 Conception de bases de données... 5 Conception pour

Plus en détail

RapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/2011. 1.1 Présentation. 1.2 Ressources

RapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/2011. 1.1 Présentation. 1.2 Ressources Master Maths Finances 2010/2011 Data Mining janvier 2011 RapidMiner 1 Introduction 1.1 Présentation RapidMiner est un logiciel open source et gratuit dédié au data mining. Il contient de nombreux outils

Plus en détail

Aider à la décision. - La matrice d Eisenhower - Le diagramme de Pareto - Les arbres d objectifs - Le diagramme d affinités - La méthode Philips 6.

Aider à la décision. - La matrice d Eisenhower - Le diagramme de Pareto - Les arbres d objectifs - Le diagramme d affinités - La méthode Philips 6. Guide méthodologique du travail en commun Aider à la décision > Hiérarchiser les priorités > Choisir les bonnes solutions > Hiérarchiser les priorités - La matrice d Eisenhower - Le diagramme de Pareto

Plus en détail

TP SIN Traitement d image

TP SIN Traitement d image TP SIN Traitement d image Pré requis (l élève doit savoir): - Utiliser un ordinateur Objectif terminale : L élève doit être capable de reconnaître un format d image et d expliquer les différents types

Plus en détail

Contenus détaillés des habiletés du Profil TIC des étudiants du collégial

Contenus détaillés des habiletés du Profil TIC des étudiants du collégial Contenus détaillés des habiletés du des étudiants du collégial Auteur(s) : Équipe de travail du réseau REPTIC. Version originale REPTIC Version en date du : 5 octobre 2009 Comment citer ce document : Équipe

Plus en détail

Utilisation d outils de Visual Data Mining pour l exploration d un ensemble de règles d association

Utilisation d outils de Visual Data Mining pour l exploration d un ensemble de règles d association Utilisation d outils de Visual Data Mining pour l exploration d un ensemble de règles d association Gwenael Bothorel, Mathieu Serrurier, Christophe Hurter To cite this version: Gwenael Bothorel, Mathieu

Plus en détail

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence

Plus en détail

Le cinquième chapitre

Le cinquième chapitre Le cinquième chapitre Objectif : présenter les supports matériels ou immatériels permettant d'étayer cette nouvelle approche de la fonction maintenance. I. Evolution du domaine technique - Différents domaines

Plus en détail

TEXT MINING. 10.6.2003 1 von 7

TEXT MINING. 10.6.2003 1 von 7 TEXT MINING 10.6.2003 1 von 7 A LA RECHERCHE D'UNE AIGUILLE DANS UNE BOTTE DE FOIN Alors que le Data Mining recherche des modèles cachés dans de grandes quantités de données, le Text Mining se concentre

Plus en détail

Introduction: 1. définition d un ETL 2. importance et diversité des données spatiales utilitédes ETL géographiques

Introduction: 1. définition d un ETL 2. importance et diversité des données spatiales utilitédes ETL géographiques 1 2 Introduction: 1. définition d un ETL 2. importance et diversité des données spatiales utilitédes ETL géographiques 3 ETL = extracto-chargeur = datadumping La Business Intelligence, BI, (ou informatique

Plus en détail

Date de diffusion : Rédigé par : Version : Mars 2008 APEM 1.4. Sig-Artisanat : Guide de l'utilisateur 2 / 24

Date de diffusion : Rédigé par : Version : Mars 2008 APEM 1.4. Sig-Artisanat : Guide de l'utilisateur 2 / 24 Guide Utilisateur Titre du projet : Sig-Artisanat Type de document : Guide utilisateur Cadre : Constat : Les Chambres de Métiers doivent avoir une vision prospective de l'artisanat sur leur territoire.

Plus en détail

La segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM

La segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM La segmentation à l aide de EG-SAS A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM Définition de la segmentation - Au lieu de considérer une population dans son ensemble,

Plus en détail

Une méthode d apprentissage pour la composition de services web

Une méthode d apprentissage pour la composition de services web Une méthode d apprentissage pour la composition de services web Soufiene Lajmi * Chirine Ghedira ** Khaled Ghedira * * Laboratoire SOIE (ENSI) University of Manouba, Manouba 2010, Tunisia Soufiene.lajmi@ensi.rnu.tn,

Plus en détail

Introduction : présentation de la Business Intelligence

Introduction : présentation de la Business Intelligence Les exemples cités tout au long de cet ouvrage sont téléchargeables à l'adresse suivante : http://www.editions-eni.fr Saisissez la référence ENI de l'ouvrage RI3WXIBUSO dans la zone de recherche et validez.

Plus en détail

MEDIAplus elearning. version 6.6

MEDIAplus elearning. version 6.6 MEDIAplus elearning version 6.6 L'interface d administration MEDIAplus Sommaire 1. L'interface d administration MEDIAplus... 5 2. Principes de l administration MEDIAplus... 8 2.1. Organisations et administrateurs...

Plus en détail

CommandCenter Génération 4

CommandCenter Génération 4 Notes importantes: Lors de l'installation de cette version logicielle SE Génération 4 8.11.2456-13, la mise à jour peut rester jusqu'à 25 minutes au même pourcentage (p. ex., 82 %) dans la phase d'installation

Plus en détail

TEXT MINING ET INTELLIGENCE ECONOMIQUE : AUJOURD HUI ET DEMAIN

TEXT MINING ET INTELLIGENCE ECONOMIQUE : AUJOURD HUI ET DEMAIN TEXT MINING ET INTELLIGENCE ECONOMIQUE : AUJOURD HUI ET DEMAIN Xavier Polanco Unité de Recherche et Innovation Institut de l Information Scientifique et Technique Centre National de la Recherche Scientifique

Plus en détail

Infrastructure - Capacity planning. Document FAQ. Infrastructure - Capacity planning. Page: 1 / 7 Dernière mise à jour: 16/04/14 16:09

Infrastructure - Capacity planning. Document FAQ. Infrastructure - Capacity planning. Page: 1 / 7 Dernière mise à jour: 16/04/14 16:09 Document FAQ Infrastructure - Capacity planning EXP Page: 1 / 7 Table des matières Détails de la fonctionnalité... 3 I.Généralités... 3 II.Configuration... 3 III.Vue globale des capacités...3 IV.Vue par

Plus en détail

BANQUES DE DONNÉES PÉDAGOGIQUES

BANQUES DE DONNÉES PÉDAGOGIQUES 223 Daniel BURET, Jean-Claude BLANCHARD. HISTORIQUE L'EPI a entrepris en 1989 de créer des bases d'énoncés mathématiques destinées aux enseignants pour la production de documents et accompagnées d'un outil

Plus en détail

Analyse tarifaire en ligne (TAO) de l'omc

Analyse tarifaire en ligne (TAO) de l'omc Analyse tarifaire en ligne (TAO) de l'omc L'analyse tarifaire en ligne (TAO) permet d'effectuer des recherches et d'analyser les données tarifaires conservées dans deux bases de données de l'omc, à savoir

Plus en détail

Architecture d'entreprise : Guide Pratique de l'architecture Logique

Architecture d'entreprise : Guide Pratique de l'architecture Logique Guides Pratiques Objecteering Architecture d'entreprise : Guide Pratique de l'architecture Logique Auteur : Version : 1.0 Copyright : Softeam Equipe Conseil Softeam Supervisée par Philippe Desfray Softeam

Plus en détail

Jean-Daniel Fekete Directeur de Recherche, Resp. équipe-projet AVIZ INRIA

Jean-Daniel Fekete Directeur de Recherche, Resp. équipe-projet AVIZ INRIA La visualisation d information pour comprendre et interagir avec les données Jean-Daniel Fekete Directeur de Recherche, Resp. équipe-projet AVIZ INRIA Jean-Daniel.Fekete@inria.fr, www.aviz.fr, @jdfaviz

Plus en détail

Master Exploration Informatique des données Data Mining & Business Intelligence. Evelyne CHARIFOU Priscillia CASSANDRA

Master Exploration Informatique des données Data Mining & Business Intelligence. Evelyne CHARIFOU Priscillia CASSANDRA Master Exploration Informatique des données Data Mining & Business Intelligence Groupe 5 Piotr BENSALEM Ahmed BENSI Evelyne CHARIFOU Priscillia CASSANDRA Enseignant Françoise FOGELMAN Nicolas DULIAN SOMMAIRE

Plus en détail

Introduction. I Étude rapide du réseau - Apprentissage. II Application à la reconnaissance des notes.

Introduction. I Étude rapide du réseau - Apprentissage. II Application à la reconnaissance des notes. Introduction L'objectif de mon TIPE est la reconnaissance de sons ou de notes de musique à l'aide d'un réseau de neurones. Ce réseau doit être capable d'apprendre à distinguer les exemples présentés puis

Plus en détail

Business & High Technology

Business & High Technology UNIVERSITE DE TUNIS INSTITUT SUPERIEUR DE GESTION DE TUNIS Département : Informatique Business & High Technology Chapitre 8 : ID : Informatique Décisionnelle BI : Business Intelligence Sommaire Introduction...

Plus en détail

Business Intelligence avec SQL Server 2012

Business Intelligence avec SQL Server 2012 Editions ENI Business Intelligence avec SQL Server 2012 Maîtrisez les concepts et réalisez un système décisionnel Collection Solutions Informatiques Table des matières Les éléments à télécharger sont disponibles

Plus en détail

et les Systèmes Multidimensionnels

et les Systèmes Multidimensionnels Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Datawarehouse (DW) Le Datawarehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées

Plus en détail

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine

Plus en détail

Pentaho Business Analytics Intégrer > Explorer > Prévoir

Pentaho Business Analytics Intégrer > Explorer > Prévoir Pentaho Business Analytics Intégrer > Explorer > Prévoir Pentaho lie étroitement intégration de données et analytique. En effet, les services informatiques et les utilisateurs métiers peuvent accéder aux

Plus en détail

BASE. Vous avez alors accès à un ensemble de fonctionnalités explicitées ci-dessous :

BASE. Vous avez alors accès à un ensemble de fonctionnalités explicitées ci-dessous : BASE BioArray Software Environment (BASE) est une base de données permettant de gérer l importante quantité de données générées par des analyses de bio-puces. BASE gère les informations biologiques, les

Plus en détail

Initiation d une base de donnée documentaire et réglementaire

Initiation d une base de donnée documentaire et réglementaire Initiation d une base de donnée documentaire et réglementaire Rapport Septembre 2007 Sommaire Chapitre 1 : Présentation de l outil «Base de donnée» du Pays Marennes Oléron.. p.5 1. Définition et principe...

Plus en détail

Parcours FOAD Formation EXCEL 2010

Parcours FOAD Formation EXCEL 2010 Parcours FOAD Formation EXCEL 2010 PLATE-FORME E-LEARNING DELTA ANNEE SCOLAIRE 2013/2014 Pôle national de compétences FOAD Formation Ouverte et A Distance https://foad.orion.education.fr Livret de formation

Plus en détail

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours Information du cours Informatique décisionnelle et data mining www.lia.univ-avignon.fr/chercheurs/torres/cours/dm Juan-Manuel Torres juan-manuel.torres@univ-avignon.fr LIA/Université d Avignon Cours/TP

Plus en détail

Les diagrammes de modélisation

Les diagrammes de modélisation L approche Orientée Objet et UML 1 Plan du cours Introduction au Génie Logiciel L approche Orientée Objet et Notation UML Les diagrammes de modélisation Relations entre les différents diagrammes De l analyse

Plus en détail

Le "tout fichier" Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique

Le tout fichier Le besoin de centraliser les traitements des fichiers. Maitriser les bases de données. Historique Introduction à l informatique : Information automatisée Le premier ordinateur Définition disque dure, mémoire, carte mémoire, carte mère etc Architecture d un ordinateur Les constructeurs leader du marché

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

Formats d images. 1 Introduction

Formats d images. 1 Introduction Formats d images 1 Introduction Lorsque nous utilisons un ordinateur ou un smartphone l écran constitue un élément principal de l interaction avec la machine. Les images sont donc au cœur de l utilisation

Plus en détail

INTELLIGENCE ECONOMIQUE : ENJEUX ET RETOUR D EXPERIENCE PILOTE DANS SEPT PMI DE BOURGOGNE

INTELLIGENCE ECONOMIQUE : ENJEUX ET RETOUR D EXPERIENCE PILOTE DANS SEPT PMI DE BOURGOGNE INTELLIGENCE ECONOMIQUE : ENJEUX ET RETOUR D EXPERIENCE PILOTE DANS SEPT PMI DE BOURGOGNE BUSINESS INTELLIGENCE : GOALS AND RESULTS OF A PILOT EXPERIMENT INVOLVING SEVEN SMEs FROM BOURGOGNE Ludovic DENOYELLE,

Plus en détail

Solution A La Gestion Des Objets Java Pour Des Systèmes Embarqués

Solution A La Gestion Des Objets Java Pour Des Systèmes Embarqués International Journal of Engineering Research and Development e-issn: 2278-067X, p-issn: 2278-800X, www.ijerd.com Volume 7, Issue 5 (June 2013), PP.99-103 Solution A La Gestion Des Objets Java Pour Des

Plus en détail

Alphonse Carlier, Intelligence Économique et Knowledge Management, AFNOR Éditions, 2012.

Alphonse Carlier, Intelligence Économique et Knowledge Management, AFNOR Éditions, 2012. 1 Du même auteur chez le même éditeur Alphonse Carlier, Intelligence Économique et Knowledge Management, AFNOR Éditions, 2012. AFNOR 2013 Couverture : création AFNOR Éditions Crédit photo 2011 Fotolia

Plus en détail

Rapport d'analyse des besoins

Rapport d'analyse des besoins Projet ANR 2011 - BR4CP (Business Recommendation for Configurable products) Rapport d'analyse des besoins Janvier 2013 Rapport IRIT/RR--2013-17 FR Redacteur : 0. Lhomme Introduction...4 La configuration

Plus en détail

INTRODUCTION GENERALE...1 LA CONNEXION ODBC :...1. CONNEXION AU TRAVERS D EXCEL(tm)...6. LOGICIEL QUANTUM GIS (Qgis)... 10

INTRODUCTION GENERALE...1 LA CONNEXION ODBC :...1. CONNEXION AU TRAVERS D EXCEL(tm)...6. LOGICIEL QUANTUM GIS (Qgis)... 10 PROGRAMME RÉGIONAL DE RENFORCEMENT DE LA COLLECTE DES DONNÉES STATISTIQUES DES PECHES DANS LES ÉTATS MEMBRES ET DE CREATION D UNE BASE DE DONNÉES REGIONALE Manuel de formation TABLE DES MATIERES INTRODUCTION

Plus en détail

Les Utilisateurs dans SharePoint

Les Utilisateurs dans SharePoint Les Utilisateurs dans SharePoint La gestion des utilisateurs dans SharePoint SharePoint dont le cœur est l'outil collaboratif, Windows SharePoint Services. Chaque utilisateur (ou collaborateur) peut créer

Plus en détail

La Geo-Business Intelligence selon GALIGEO avec 26/10/2005 1

La Geo-Business Intelligence selon GALIGEO avec 26/10/2005 1 La Geo-Business Intelligence selon GALIGEO avec ESRI 2005 session «Décisionnel» 26/10/2005 1 La Business Intelligence : Une Définition La Business intelligence permet l utilisation des données opérationnelles

Plus en détail

Réflexion sur la mise en place d'un système mobile d'aide à la navigation destiné aux services d'urgence basée sur une solution libre.

Réflexion sur la mise en place d'un système mobile d'aide à la navigation destiné aux services d'urgence basée sur une solution libre. Réflexion sur la mise en place d'un système mobile d'aide à la navigation destiné aux services d'urgence basée sur une solution libre. Denis Fouquet * Jean-Michel Follin ** Laboratoire de Géodésie et de

Plus en détail

ERGONOMIE GESTION DES DONNEES CLIENT. Gestion données client Vue 360 (Obligatoire) Données récupérées. Données calculées

ERGONOMIE GESTION DES DONNEES CLIENT. Gestion données client Vue 360 (Obligatoire) Données récupérées. Données calculées ERGONOMIE Fonctionnalités Standard Dev Spécifique Non-couverte la solution propose une aide en ligne (multilingue, contextuelle, Accès par touche/clic, messages d' erreurs explicites, Accès au manuel utilisateur)

Plus en détail

IBM SPSS Direct Marketing

IBM SPSS Direct Marketing IBM SPSS Statistics 19 IBM SPSS Direct Marketing Comprenez vos clients et renforcez vos campagnes marketing Points clés Avec IBM SPSS Direct Marketing, vous pouvez : Comprendre vos clients de manière plus

Plus en détail

Outil de gestion et de suivi des projets

Outil de gestion et de suivi des projets Outil de gestion et de suivi des projets Proposition technique et commerciale Amselem Jonathan - Corniglion Benoit - Sorine Olivier Troche Mariela - Zekri Sarah 08 Sommaire I. Les atouts de la proposition

Plus en détail

EXTRACTION DE CONNAISSANCES À PARTIR DE DONNÉES TEXTUELLES VUE D ENSEMBLE

EXTRACTION DE CONNAISSANCES À PARTIR DE DONNÉES TEXTUELLES VUE D ENSEMBLE ème Colloque National AIP PRIMECA La Plagne - 7- avril 7 EXTRACTION DE CONNAISSANCES À PARTIR DE DONNÉES TEXTUELLES VUE D ENSEMBLE Bruno Agard Département de Mathématiques et de Génie Industriel, École

Plus en détail

O b s e r v a t o i r e E V A P M. Taxonomie R. Gras - développée

O b s e r v a t o i r e E V A P M. Taxonomie R. Gras - développée O b s e r v a t o i r e E V A P M É q u i p e d e R e c h e r c h e a s s o c i é e à l ' I N R P Taxonomie R. Gras - développée Grille d'analyse des objectifs du domaine mathématique et de leurs relations

Plus en détail

Extrait du site de l'oseo (ex.anvar) http://www.anvar.fr/projlanc.htm. Reste à déterminer les points incontournables

Extrait du site de l'oseo (ex.anvar) http://www.anvar.fr/projlanc.htm. Reste à déterminer les points incontournables Extrait du site de l'oseo (ex.anvar) http://www.anvar.fr/projlanc.htm Notez que vous trouverez les fiches citées à chaque étape sur le site (Normalement, les liens ont été conservés et fonctionnent) Reste

Plus en détail

IMPORTATION, CRÉATION, MANIPULATION, EXPORTATION DE DONNÉES STATISTIQUES

IMPORTATION, CRÉATION, MANIPULATION, EXPORTATION DE DONNÉES STATISTIQUES IMPRTATIN, CRÉATIN, MANIPULATIN, EXPRTATIN DE DNNÉES STATISTIQUES Bernard Dupont Bernard.Dupont@univ-lille1.fr ahm.bahah@yahoo.fr Bien que l'analyse et le traitement des données ne soient pas sa vocation

Plus en détail

Business Intelligence simple et efficace

Business Intelligence simple et efficace Business Intelligence simple et efficace avec Excel et PowerPivot Jean-Philippe GOUIGOUX Table des matières 1 Chapitre 1 Présentation de PowerPivot A. L analyse de données.....................................................

Plus en détail

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com Intelligence Artificielle et Systèmes Multi-Agents Badr Benmammar bbm@badr-benmammar.com Plan La première partie : L intelligence artificielle (IA) Définition de l intelligence artificielle (IA) Domaines

Plus en détail

Laboratoire 4 Développement d un système intelligent

Laboratoire 4 Développement d un système intelligent DÉPARTEMENT DE GÉNIE LOGICIEL ET DES TI LOG770 - SYSTÈMES INTELLIGENTS ÉTÉ 2012 Laboratoire 4 Développement d un système intelligent 1 Introduction Ce quatrième et dernier laboratoire porte sur le développement

Plus en détail

MODELISATION UN ATELIER DE MODELISATION «RATIONAL ROSE»

MODELISATION UN ATELIER DE MODELISATION «RATIONAL ROSE» MODELISATION UN ATELIER DE MODELISATION «RATIONAL ROSE» Du cours Modélisation Semi -Formelle de Système d Information Du Professeur Jean-Pierre GIRAUDIN Décembre. 2002 1 Table de matière Partie 1...2 1.1

Plus en détail

CommentWatcher. plateforme Web open-source pour analyser les discussions sur des forums en ligne. Marian-Andrei RIZOIU

CommentWatcher. plateforme Web open-source pour analyser les discussions sur des forums en ligne. Marian-Andrei RIZOIU CommentWatcher plateforme Web open-source pour analyser les discussions sur des forums en ligne Marian-Andrei RIZOIU 2ème octobre 2013 BLEND 2013 Lyon, France Contexte Laboratoire ERIC Université Lumière

Plus en détail

Domaine 1 : S approprier un environnement informatique de travail. Domaine 3 : Créer, produire, traiter et exploiter des données.

Domaine 1 : S approprier un environnement informatique de travail. Domaine 3 : Créer, produire, traiter et exploiter des données. Les différents domaines sont : Domaine 1 : S approprier un environnement informatique de travail. Domaine 2 : Adopter une attitude responsable. Domaine 3 : Créer, produire, traiter et exploiter des données.

Plus en détail

ORACLE TUNING PACK 11G

ORACLE TUNING PACK 11G ORACLE TUNING PACK 11G PRINCIPALES CARACTÉRISTIQUES : Conseiller d'optimisation SQL (SQL Tuning Advisor) Mode automatique du conseiller d'optimisation SQL Profils SQL Conseiller d'accès SQL (SQL Access

Plus en détail

Travailler avec les télécommunications

Travailler avec les télécommunications Travailler avec les télécommunications Minimiser l attrition dans le secteur des télécommunications Table des matières : 1 Analyse de l attrition à l aide du data mining 2 Analyse de l attrition de la

Plus en détail

3 Les premiers résultats des plans d'actions

3 Les premiers résultats des plans d'actions 3 Les premiers résultats des plans d'actions Les résultats que nous avons obtenus en ce qui concerne les plans d'action, résultent de l'analyse de 48 entreprises seulement. Revenons sur notre échantillon.

Plus en détail

Google Drive, le cloud de Google

Google Drive, le cloud de Google Google met à disposition des utilisateurs ayant un compte Google un espace de 15 Go. Il est possible d'en obtenir plus en payant. // Google Drive sur le web Se connecter au site Google Drive A partir de

Plus en détail

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems

Plus en détail

Entreposage de données complexes pour la médecine d anticipation personnalisée

Entreposage de données complexes pour la médecine d anticipation personnalisée Manuscrit auteur, publié dans "9th International Conference on System Science in Health Care (ICSSHC 08), Lyon : France (2008)" Entreposage de données complexes pour la médecine d anticipation personnalisée

Plus en détail

Spécificités, Applications et Outils

Spécificités, Applications et Outils Spécificités, Applications et Outils Ricco Rakotomalala Université Lumière Lyon 2 Laboratoire ERIC Laboratoire ERIC 1 Ricco Rakotomalala ricco.rakotomalala@univ-lyon2.fr http://chirouble.univ-lyon2.fr/~ricco/data-mining

Plus en détail

ÉCONOMIE ET GESTION LYCÉES TECHNOLOGIQUE ET PROFESSIONNEL

ÉCONOMIE ET GESTION LYCÉES TECHNOLOGIQUE ET PROFESSIONNEL ÉCONOMIE ET GESTION LYCÉES TECHNOLOGIQUE ET PROFESSIONNEL Au niveau du second degré, l'économie et gestion recouvre un ensemble de champs disciplinaires relevant de l'économie, du droit, des sciences de

Plus en détail

LibreOffice Calc : introduction aux tableaux croisés dynamiques

LibreOffice Calc : introduction aux tableaux croisés dynamiques Fiche logiciel LibreOffice Calc 3.x Tableur Niveau LibreOffice Calc : introduction aux tableaux croisés dynamiques Un tableau croisé dynamique (appelé Pilote de données dans LibreOffice) est un tableau

Plus en détail

Guide de l'utilisateur : Surveillance MédiaSource Analytique

Guide de l'utilisateur : Surveillance MédiaSource Analytique Guide de l'utilisateur : Surveillance MédiaSource Analytique Chapitre 1 : Bienvenue à Surveillance MédiaSource Analytique 2 À propos de Surveillance MédiaSource Analytique 2 Choisir le ton d'un article

Plus en détail

Nom-Projet MODELE PLAN DE MANAGEMENT DE PROJET

Nom-Projet MODELE PLAN DE MANAGEMENT DE PROJET Nom-Projet MODELE PLAN DE MANAGEMENT DE PROJET Glossaire La terminologie propre au projet, ainsi que les abréviations et sigles utilisés sont définis dans le Glossaire. Approbation Décision formelle, donnée

Plus en détail