Historique. Architecture. Contribution. Conclusion. Définitions et buts La veille stratégique Le multidimensionnel Les classifications



Documents pareils
Extraction d informations stratégiques par Analyse en Composantes Principales

La classification automatique de données quantitatives

TRAVAUX DE RECHERCHE DANS LE

Introduction au datamining

Big Data et Graphes : Quelques pistes de recherche

INF6304 Interfaces Intelligentes

La visualisation de données relationnelles au service de la recherche d informations

La Veille Scientifique

Marc SALLIERES CEO ALTIC

INTRODUCTION AU DATA MINING

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)

Ecole Technique «Transformation de données documentaires» Poitiers, mars Atelier 1: Sphinx. import, conversion, export de données

Introduction au Data-Mining

Big Data et Graphes : Quelques pistes de recherche

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données

Introduction au Data-Mining

THOT - Extraction de données et de schémas d un SGBD

Recherche bibliographique

Apprentissage Automatique

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

et les Systèmes Multidimensionnels

Concevoir et déployer un data warehouse

La Geo-Business Intelligence selon GALIGEO avec 26/10/2005 1

En vue de l'obtention du. Présentée et soutenue par Eloïse LOUBIER Le 09 Octobre 2009

Business & High Technology

Cycle de formation certifiante Sphinx

La segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM

BUSINESS INTELLIGENCE

Agrégation des portefeuilles de contrats d assurance vie

Logiciel XLSTAT version rue Damrémont PARIS

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

données en connaissance et en actions?

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar

Introduction à la B.I. Avec SQL Server 2008

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

Le théorème de Perron-Frobenius, les chaines de Markov et un célèbre moteur de recherche

Compte-rendu re union Campus AAR 3 mars 2015

Data Mining. Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.

Journée : Apport de l'intelligence Economique pour la gouvernance stratégique de l'entreprise

Stages ISOFT : UNE SOCIETE INNOVANTE. Contact : Mme Lapedra, stage@isoft.fr

Chapitre 9 : Informatique décisionnelle

Business Intelligence

Localisation des fonctions

GKR. Geological Knowledge Representation Base de connaissances métallogéniques

Intelligence économique : proposition d un outil dédié à l analyse relationnelle

Agenda de la présentation

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

ProxiLens : Exploration interactive de données multidimensionnelles à partir de leur projection

Datawarehouse and OLAP

Maîtriser l'utilisation des outils bureautiques. Maîtriser le logiciel de traitement de texte - Word. Maitriser le logiciel tableur - Excel

2 Serveurs OLAP et introduction au Data Mining

Recherche d information en langue arabe : influence des paramètres linguistiques et de pondération de LSA

Intégration de données hétérogènes et réparties. Anne Doucet

Panorama des problématiques de traitement de l information. Larbi Aït Hennani, Fatma Bouali, Vincent Vandewalle

L information et la technologie de l informationl

CONFIGURATION DE BASE. 6, Rue de l'industrie BP130 SOULTZ GUEBWILLER Cedex. Fax.: Tel.:

3 Approximation de solutions d équations

Spécifications, Développement et Promotion. Ricco RAKOTOMALALA Université Lumière Lyon 2 Laboratoire ERIC

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Spécificités, Applications et Outils

Rappels sur les suites - Algorithme

: seul le dossier dossier sera cherché, tous les sousdomaines

Modélisation multi-agents - Agents réactifs

Les Entrepôts de Données

X2BIRT : Mettez de l interactivité dans vos archives

Classification non supervisée

SAP BusinessObjects Web Intelligence (WebI) BI 4

Introduction : présentation de la Business Intelligence

Masses de données et calcul : à l IRIT. 8 octobre 2013

NOTE SUR LA MODELISATION DU RISQUE D INFLATION

Software Application Portfolio Management

QU EST-CE QUE LE DECISIONNEL?

Business Intelligence avec Excel, Power BI et Office 365

Mise en œuvre de l architecture SINP. Forum ATEN des TIC 4 juin Y. Lebeau MEDDE/DGALN/DEB/PEM4

Examen de la saisine Définition de l'architecture du SINP. Contributeurs : Frédéric Gosselin, Pascal Dupont

Cours de Génie Logiciel

FazaANGEL supervision pro-active

1 - PRESENTATION GENERALE...

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

SQL Server 2014 Administration d'une base de données transactionnelle avec SQL Server Management Studio

Chaînes de Markov au lycée

Scénario: Données bancaires et segmentation de clientèle

De la production collaborative à la capitalisation des connaissances Le rôle des documentalistes

Introduction. I Étude rapide du réseau - Apprentissage. II Application à la reconnaissance des notes.

EXCEL & XLCubed 10 raisons d en faire l assise de votre Managed Self-Service BI

TRAITEMENT DES DONNEES MANQUANTES AU MOYEN DE L ALGORITHME DE KOHONEN

Le CRM en BFI : une approche du pilotage stratégique

BUSINESS INTELLIGENCE. Une vision cockpit : utilité et apport pour l'entreprise

Cognit Ive Cas d utilisation

SQL SERVER 2008, BUSINESS INTELLIGENCE

CONCEPTION ET REALISATION D'UN GENERATEUR DE TABLEAUX DE BORD PROSPECTIFS MULTIDIMENSIONNELS

Nos Solutions PME VIPDev sont les Atouts Business de votre entreprise.

Les algorithmes de base du graphisme

MABioVis. Bio-informatique et la

Formations 2015 Bureautique

Introduction à l informatique temps réel Pierre-Yves Duval (cppm)

Traitement bas-niveau

Calculer avec Sage. Revision : 417 du 1 er juillet 2010

Transcription:

L intelligence économique outil stratégique pour l entreprise Professeur Bernard DOUSSET dousset@irit.fr http://atlas.irit.fr Institut de Recherche en Informatique de Toulouse (IRIT) Equipe Systèmes d Information Généralisés (SIG) Université Paul Sabatier (Toulouse III)

Plan de la présentation Historique Architecture Contribution Définitions et buts La veille stratégique Le multidimensionnel Les classifications Interactivité Travail en équipe Principe général en analyse textuelle en analyse exploratoire en géostratégie en dessin de graphes bilan perspectives 04/03/2010 TETRALOGIE 2

Historique Architecture Contribution Définitions et buts mémoriser & organiser Veille stratégique Informations élaborées analyser & interpréter Informations utiles diffuser l information endogène valider et diffuser l information exogène Secteurs d activité Scénarios Stratégie Connaissance Connaissance diffusion restreinte élaborer choisir synthétiser Décideur évaluer & collecter Sources identifier & sélectionner déterminer & hiérarchiser Cibles Cycle de l intelligence économique 04/03/2010 TETRALOGIE 3

Historique Architecture Contribution Définitions et buts Etudier l environnement et l évolution Des marchés Des coopérations Des alliances Des fusions Des acquisitions Des participations Des implantations De l'innovation Des ruptures Des transferts de technologie Des dépôts de brevets Des équipes de recherche De la terminologie Des sources d information Des publications De la mode De la publicité Des appels d'offres 04/03/2010 TETRALOGIE 4

Historique Architecture Contribution Définitions et buts Depuis toutes les sources d information électronique Bases bibliographiques Web of science (SCI) Science direct Pascal, Francis (CNRS) Chemical abstract, Biosis Current Contents, Inspec, Cnki, Cqvip (Chine), Serveurs spécialisés Dialog, Stn, Questel, Derwent, Presse Factiva, Journaux électroniques Agences: Afp, Reuters, Internet Brevets : Uspto, Esp@cenet Bio: Pubmed, Biospace Pages web, sites web Blogs, news-groups Flux RSS, streaming, Intranet SI propriétaire/sgbd Data warehouse Indexations Web-logs Mails, Streams, 04/03/2010 TETRALOGIE 5

Historique Architecture Contribution Définitions et buts Information explicite Information implicite 04/03/2010 TETRALOGIE 6

Historique Architecture Contribution Définitions et buts Base CQVIP (chinois) Information explicite!!! Information implicite 04/03/2010 (Réseau des acteurs) TETRALOGIE 7

Historique Architecture Contribution Définitions et buts l information explicite (exogène) l information implicite (endogène) Maturité de l information L information consciente collective (CC) L information consciente individuelle (CI) L information inconsciente collective (IC) L information inconsciente individuelle (II) La terminologie émergente Les concepts émergents cohérence, simultanéité, consensus 04/03/2010 TETRALOGIE 8

Historique Architecture Contribution La veille stratégique Le processus de veille stratégique comporte 5 phases : la sélection des données utiles : terminologie, dates, acteurs (auteurs, organismes, pays ) la préparation des données : pré-traitements : nettoyages [Zipf49], synonymies [Porter80] transformations : modèle de représentation des données [Salton89] l analyse des données: classifications, règles d'associations, séquences,... l interprétation et l évaluation : basées en grande partie sur les visualisations l exploitation et donc la prise de décision 04/03/2010 TETRALOGIE 9

Historique Architecture Contribution Le multidimensionnel Les analyses multidimensionnelles Fondements : Spearman & Pearson dès 1904 Analyse canonique et ACP : [Hotteling35] Analyse des correspondances : [Hirschfeld35] et [Guttman41] Analyse procustéennes : [Schonemann65] En France Analyse Factorielle des Correspondances : [Benzécri73] Analyse de deux tableaux : [Lafosse85] Compléments en analyse procustéenne : [Fichet87] 04/03/2010 TETRALOGIE 10

Historique Architecture Contribution Les classifications Classifications Taxonomie par CAH [Sokal63] Centres mobiles [Forgy65] Nuées dynamiques [Diday71] Partitionnements Itératifs : Minimisation de la coupure [KL70], [FM82] Spectraux : VP de la matrice de Laplace [Hall70], [Hagen91] Multi-niveaux : regroupement + itératif KMETIS [Karypis98] Stochastiques : Markov CLustering [Van Dongen00] 04/03/2010 TETRALOGIE 11

Historique Architecture Etat de l art Contribution Interactivité Pourquoi un système interactif? En Amont de l analyse l interactivité sert à : choisir les sources d information mettre au point les équations de recherche évaluer les corpus (volume, pertinence, bruit) choisir et valider le format optimal de sortie superviser la collecte du corpus contrôler les dictionnaires (forme et volume) choisir les filtres (+ et -, thématiques, granularité,...) valider les synonymies et l indexation (Multi-termes) termes) 04/03/2010 TETRALOGIE 12

Historique Architecture Etat de l art Contribution Interactivité Pourquoi un système interactif? Pendant l analyse elle permet de sélectionner et contrôler les matrices de croisement choisir les méthodes à déployer piloter ces méthodes (localement ou à distance) extraire les connaissances grâce aux visualisations choisir les vues à conserver consulter les experts à distance restituer l analyse au décideur éventuellement mettre l analyse en ligne via XPlor 04/03/2010 TETRALOGIE 13

Historique Architecture Etat de l art Contribution Documentaliste Travail en équipe Connexions entre acteurs de la veille Décideur BD CD Serveur Web Expert Analyste 04/03/2010 TETRALOGIE 14

Historique Architecture Etat de l art Contribution Principe général BD 1' Corpus 1 Métadonnées Métadonnées Dico 1 Cooc CD Corpus 2 Métadonnées Méta 2 Niv. Dico 2 3 D Web Corpus 3 Corpus 4 Métadonnées Métadonnées Métadonnées Dico 04/03/2010 TETRALOGIE 15 3 X

Historique Architecture Contribution Dictionnaire + ou - en analyse textuelle Extraction des dictionnaires Courbe de charge Dictionnaire de synonymes 04/03/2010 TETRALOGIE 16

Historique Architecture Contribution en analyse textuelle Détection des multi-termestermes Dictionnaire de mots vides Dictionnaire de multi-termes Dictionnaire de synonymes Seuil de détection statistique Traitement syntaxique Traitement morphologique Traitement statistique 04/03/2010 TETRALOGIE 17

Historique Architecture Contribution en analyse textuelle Croisements 2D Filtre positif ou négatif Dictionnaire de synonymes Matrice carrée Courbe de charge Matrice asymétrique 04/03/2010 TETRALOGIE 18

Historique Architecture Contribution pour le traitement des matrices en analyse exploratoire proposition de plusieurs algorithmes de tris génération supervisée de matrices de croisement tableur 3D adapté aux matrices de grande taille (zooms 2 et 3D) pour les analyses multidimensionnelles visualisations interactives en 3D et 4 D synchronisation de cartes locales ou distantes visualisation de trajectoires et rotations procustéennes (AFCM) pour les classifications arbres hiérarchiques interactifs avec exportation des classes partitionnement de graphes, graphes de classes segmentation pour les cartes géographiques 04/03/2010 TETRALOGIE 19

Historique Architecture Contribution en analyse exploratoire Algorithmes de tris de matrices Tri par classes de connexité Tri par blocs diagonaux 04/03/2010 TETRALOGIE 20

Historique Architecture Contribution en analyse exploratoire Analyse en composantes principales (ACP) s applique aux données quantitative comme les tableaux individus x variables elle utilise un espace réduit de 2 à 4 D Cartes deux des cartes coordonnées en sont en déduites 4D celle des coordonnées des individus cercle de corrélation des variables Synchronisation Cercle des corrélations 04/03/2010 TETRALOGIE 21

Historique Architecture Contribution en analyse exploratoire Analyse factorielle des correspondances multiple (AFCM) nous l appliquons aux matrices de cooccurrences 3D la 3 variable est le plus souvent le temps L AFC peut être appliquée à un des tableaux (les autres sont projetés) à tous les tableaux empilés à la somme des tableaux ( cas statique) Chaque ligne est représentée par une série de points On peut tracer des trajectoires 04/03/2010 TETRALOGIE 22

Historique Architecture Contribution Analyse procustéenne en analyse exploratoire Evolution non standard G2 G3 G1 Enlever: la translation moyenne la rotation moyenne l homothétie moyenne G4 04/03/2010 TETRALOGIE 23

Historique Architecture Contribution d ) de( g, h) ( g i hi)² dm( A, B) e( k, l) Min d x y e ( xk, yl ) méthode non supervisée k l dm( A, B) de( xk, yl ) Max d ( A, B) i 1, n k, l k, l A B on a le choix de la distance (euclidienne, max, sigma, ) on a le choix du mode d agrégation (centre, inf, sup, moyenne) elle part des éléments disjoints et agrège les plus proches elle construit des classes imbriquées la hiérarchie peut être représentée par un dendogramme plusieurs niveaux de coupure sont possibles on peut exporter la classification Niveau de coupure à 8 classes de( A, B Niveau de coupure à 4 classes en analyse exploratoire Classification ascendante hiérarchique (CAH) 04/03/2010 TETRALOGIE 24

Historique Architecture Contribution en analyse exploratoire Classification par partition CPP (Centres mobiles) supervisée k classes 1 représentant choix en 3D coloration icônes 4 classes 6 classes 04/03/2010 TETRALOGIE 25

Historique Architecture Contribution en visualisation Pondération par des données externes Carte en valeurs absolues Carte pondérée par la population Choix de la pondération Carte pondérée par le PNB Carte pondérée par la superficie 04/03/2010 TETRALOGIE 26

Historique Architecture Contribution en visualisation Segmentation et importation de classes Pays non présents dans la dernière période. Pays en récession Pays en forte croissance Carte en mode relatif : étude de tendances Exportation d une classification Effectifs des classes Niveau de coupure 04/03/2010 TETRALOGIE 27

Historique Architecture Contribution en visualisation Convergence Placement Placement rapide circulaire initial du placement en aléatoire fonction des d un sommets tri. Algorithme de [Fruchterman91] Attraction : f a vi, v Répulsion : f j a r( vi, v j) ij d k d k ² r ij ij a 04/03/2010 IRIT/SIG 28

Historique Architecture Contribution en visualisation Graphe de clusters 04/03/2010 IRIT/SIG 29

Historique Architecture Contribution en visualisation Graphe partitionné 04/03/2010 IRIT/SIG 30

Historique Architecture Contribution en visualisation Graphe évolutif 04/03/2010 IRIT/SIG 31

Historique Architecture Contribution Philosophie de notre plate-forme dédiée à l IE Bilan c est un ensemble cohérent de prototypes inter-opérants, qui utilise un standard unique pour le format des données, son interface graphique est homogène, elle permet de partager ressources et méthodes via le réseau. Son utilisation en recherche support d évaluation de méthodes, d outils et de produits d IE, vaste base d exemples, à l échelle, déjà analysés. Domaine d application : l IE et la veille stratégique veille scientifique (scientométrie, indicateurs, évaluation) veille technologique (propriété industrielle, produits, procédés) veille économique (marchés, concurrents, substituts, ) 04/03/2010 TETRALOGIE 32

Historique Architecture Contribution Dans le cadre de l Intelligence économique, cette approche doit permettre le recueil, le suivi, le traitement, la diffusion ciblée et la protection de l information stratégique l accès systématique à l information implicite l émulation des compétences via les réseaux une culture collective interne (partage et émulation) Perspectives une culture collective externe (logique de réseau d acteurs) éventuellement, une culture proactive (influence, lobbying, contre-information/rumeurs, extraction des signaux faibles, décryptage des réseaux, ) 04/03/2010 TETRALOGIE 33