RAPPORT DE PROJET DATA MINING

Dimension: px
Commencer à balayer dès la page:

Download "RAPPORT DE PROJET DATA MINING"

Transcription

1 DEA 127 : INFORMATIQUE SYSTEMES INTELLIGENTS RAPPORT DE PROJET DATA MINING «Analyse des endettements par niveau de développement des pays» Réalisé par : BELEM MAHAMADOU Sous la direction de : M. EDWIN DIDAY

2 TABLE DES MATIERES INTRODUCTION... 3 II ETAT DE L ART DU DATA MINING... 4 II.1 LES ENJEUX DE DATA MINING... 4 II.2 DOMAINES D APPLICATION... 4 II.3 LES LOGICIELS DE DATA MINING... 5 II.4 LE LOGICIEL SODAS... 5 II ETUDE CONCEPTUELLE... 6 III.1 LES INDIVIDUS ET LES CONCEPTS... 6 III.2 LES VARIABLES... 6 III.3 LA STRUCTURE DE LA BASE DE DONNEES... 7 III.4 LES REQUETES... 9 II.5 IMPORTATION DES DONNEES IV APPLICATION DES METHODES DE SODAS IV.1 LA METHODE SOE IV.2 LA METHODE PCM IV.3 LA METHODE PYR IV.4 LA METHODE DIV IV.5 LA METHODE TREE IV.6 LA METHODE STAT IV.7 LA METHODE SCLUST CONCLUSION.30 Projet Data Minin-2004/2005-DEA127 2

3 INTRODUCTION De no jours, le monde de l entreprise est caractérisé par une concurrence de plus en plus accrue. Cette intensification de la concurrence oblige les entreprises à renforcer leur marketing à travers une analyse détaillée des besoins des clients pour aboutir à de nouvelles connaissances. Ce qui dénote quelque part la conservation des masses de données importantes sur les profils et les achats des clients. Ainsi, des systèmes opérationnels qui ont permis l automatisation des traitements de masse, les entreprises se tournent de plus en plus vers des systèmes décisionnels qui ont une valeur ajoutée concurrentielle réelle. C est face à ce besoin croissant que le data mining fit son apparition. Ce présent projet a pour objectif de nous faire mieux connaître le data mining et son utilité à travers une application sur le logiciel SODAS. Dans notre document, nous parlerons premièrement de l état de l art du data mining, en seconde partie nous présenterons notre sujet d étude et en troisième partie, nous présenterons les différentes méthodes de SODAS appliquées sur notre base, les résultats obtenus et leurs interprétations. Projet Data Minin-2004/2005-DEA127 3

4 II ETAT DE L ART DU DATA MINING II.1 LES ENJEUX DE DATA MINING De nos jours, le monde des entreprises drainent des quantités énormes d informations pouvant atteindre des milliards d informations par jour. Plus la quantité d informations collectées devient importante, leur exploitation devient très complexe. Si l esprit humain est disposé à analyser des donner de petites quantités et d en tirer des connaissances, il lui par contre impossible d analyser simultanément des plusieurs millions de données produites par des systèmes opérationnels qui ne permettent aucune décision stratégique. Pourtant les entreprises ont besoin d exploiter ces données pour mener à bien leurs activités. Avec la concurrence grandissante, les entreprises savent que la maîtrise de l information est un élément incontournable pour face à cette nouvelle donne. Ce qui nécessite des outils performants ayant une valeur ajoutée concurrentielle et permettant une exploitation stratégique des données. C est face à ses différentes exigences du monde de l entreprise que les outils comme le data mining ont fait apparition. Et furent rapidement adoptés car répondant au mieux aux attentes des décideurs. Il s agît à partir des données détaillées, d effectuer un résumé, à l aide des concepts sous-jacents afin de mieux les appréhender. II.2 DOMAINES D APPLICATION Les domaines d application de Data Mining sont très variés. Parmi ces domaines d application, nous avons : 1. Le laboratoires pharmaceutiques 2. Les banques 3. L assurance 4. L aéronautique, automobile et industries 5. transport 6. Télécommunication 7. Gestion d eau 8. Energie 9. etc Projet Data Minin-2004/2005-DEA127 4

5 II.3 LES LOGICIELS DE DATA MINING Il existe de nous jours plusieurs logiciels de data mining dont : 1. Intelligent Miner d IBM permettant de faire la segmentation, la discrimination, la prédiction, les associations et les séries chronologiques. 2. Clementine de SPSS 3. SAS entrepise Miner de SAS 4. TeraMiner de NCR pour la prédiction, la discrimination, la factorisation, la typologie. 5. KXEN components de KXEN 6. SPAD, du CISIA 7. Smart Miner, de Grimmer Soft, etc. II.4 LE LOGICIEL SODAS Le logiciel SODAS est un logiciel lire issu du projet EUROSTAT et destiné à l analyse des données symboliques. Son idée générale est la suivante : à partir d une base de données, construire un tableau de données symboliques, parfois muni de règles et de taxonomies, dans le but de décrire des concepts résumant un vaste ensemble de données, analyser ensuite ce tableau pour en extraire des connaissances par des méthodes d analyse de données symboliques. Une analyse de données dans SODAS se réalise selon les étapes suivantes : 1. Partir d une base de données relationnelle ; 2. Définir un contexte par des unités statistiques de premier niveau liées à un concept et des variables décrivant ces unités. Ce contexte est ainsi défini par une requête à la base ; 3. on construit un tableau de données symboliques dont les nouvelles unités sont des concepts décrits par généralisation des propriétés des unités statistiques de premier niveau qui leur sont associés. 4. un fichier d objets symboliques est créé sur lequel on peut appliquer les différentes méthodes d analyse de données symboliques. Projet Data Minin-2004/2005-DEA127 5

6 II ETUDE CONCEPTUELLE Le but de notre étude est d analyser les endettements des pays liés à leur niveau de développement. Ainsi cette analyse permettra de comparer le niveau d endettement des pays ayant le même niveau de développement et d observer les caractéristiques liées à chaque groupe. III.1 LES INDIVIDUS ET LES CONCEPTS La base de données de notre projet comporte des données sur 156 pays, extraites à partir des indicateurs de la Banque Mondiale et les rapports des Nations Unies, pour l année Il faut noter que notre base de données a déjà fait l objet d une étude qui s est intéressée aux niveaux de richesse des pays recensés. Contrairement à cette étude, notre analyse portera sur les endettements des pays liés à leur niveau de développement. Ainsi, à travers notre base de données nous avons dégagé 12 concepts qui sont les suivants : 1. Pays développé endettement Elevé 2. Pays développé endettement faible 3. Pays développé endettement hors classement 4. Pays développé endettement modéré 5. Pays émergent endettement élevé 6. Pays émergent endettement faible 7. Pays émergent endettement hors classement 8. Pays émergent endettement modéré 9. Pays émergent endettement élevé 10. Pays en voie de développement endettement faible 11. Pays en voie de développement endettement hors classement 12. Pays en voie de développement endettement modéré 13. Pays en voie de développement endettement élevé Comme individus, nous avons les 156 pays de notre base de données. III.2 LES VARIABLES Elles sont de deux sortes : 1. les variables qualitatives le niveau de richesse économique Projet Data Minin-2004/2005-DEA127 6

7 le niveau de développement associé au niveau d endettement le continent le niveau d alphabétisation 2. les variables quantitatives le produit national brut par habitant (PNB /habitant, en USD) le taux d inflation (en pourcentage) le taux de croissance de la population (en pourcentage) le montant des investissements directs étrangers (en pourcentage) le taux d exportation par rapport par rapport au PNB (en pourcentage) le taux d importation par rapport par rapport au PNB (en pourcentage) III.3 LA STRUCTURE DE LA BASE DE DONNEES La base de données est constituée des tables suivantes : 1. Pays : La table décrit les différents pays de notre étude. Elle comporte des données aussi bien qualitatives que quantitatives concernant chacun de ses pays 2. Richesse : décrit les différents niveaux de richesse 3. Développement : décrit les différents niveaux de développement 4. Endettement : décrit les différents niveaux d endettement 5. Continent : liste des différents continents 6. Analphabétisme : liste des niveaux d analphabétisme. Pour donner une meilleure présentation de notre base de données nous allons décrire les attributs des différentes tables. Table Pays Désignation Description Type Id_Pays Identifiant du pays Texte pays Le nom du pays Texte Id_richesse L identifiant du niveau d endettement Texte Id_developpement Le niveau de développement Texte Id_endettement Le niveau d endettement Texte Id_continent Le continent Texte PNB/Habitant Le produit national brut par habitant Réel Projet Data Minin-2004/2005-DEA127 7

8 Exportation Les exportations Réel Importation Les importations réalisées par le pays Réel Investissements directs étrangers Les investissements directs étrangers Réel inflation Le taux d inflation Réel Croissance population Le taux de croissance Réel Tableau 1 : description de la table Pays Table Richesse Désignation Description Type Id_Richesse Identifiant du niveau de richesse Texte Niveau de richesse économique Niveau de richesse économique Texte Tableau 2 : Description de la table richesse Table développement Désignation Description Type Id_Developpement L identifiant du niveau de développement Texte Niveau de développement Le niveau de développement Texte Tableau 3 : description de la table développement Table Endettement Désignation Description Type Id_Endettement Identifiant du niveau d endettement Texte Niveau d endettement Description du niveau d endettement Texte Tableau 4 : Description de la table Endettement Table continent Projet Data Minin-2004/2005-DEA127 8

9 Désignation Description Type Id_Continent L identifiant du continent Texte Continent Le nom du continent Texte Tableau 5 : description de la table continent Table Analphabétisme Désignation Description Type Id_Analphabétisme Identifiant du niveau d analphabétisme Texte Niveau d analphabétisme Le niveau d analphabétisme Texte Tableau 6 : Description de la table Analphabétisme Le schéma relationnel de notre base de données se présente ainsi : Figure 1 : Schéma de la base de données III.4 LES REQUETES DB2SO est un élément du logiciel SODAS qui permet à l utilisateur de construire un ensemble d assertions à partir de données stockées dans une base de données relationnelle. Il est supposé Projet Data Minin-2004/2005-DEA127 9

10 qu un ensemble d individus est stocké dans une base de données et que ces individus sont distribués dans des groupes. Alors, DB2SO peut construire une assertion pour chaque groupe d individus. Dans ce processus, les variables mère/fille et les taxonomies sur des domaines de variables peuvent aussi être associées à des assertions générées. Pour que SODAS puisse exploiter les données de notre base, il convient de préparer la structure des tables en fonctions de convention propres aux données symboliques. Pour ce faire, nous avons crée les requêtes suivantes : 1. Requete_Pays_Endettement Cette première requête renvoie les individus du premier ordre et leur description. Elle permet ainsi de ressortir de la base les individus, les concepts puis les caractéristiques des individus. Figure 2 : Construction de la requête Requete_Pays_Endettement 2. Requete_Taxo Cette requête permettra de déterminer la taxonomie de notre base. Cette taxonomie sera utilisée pour établir des lien entre les pays et leur continent. Projet Data Minin-2004/2005-DEA127 10

11 Figure 3 : construction de la requête_taxo 3. Requête AddSingle Comme variables de classe, nous avons choisi le niveau d endettement. II.5 IMPORTATION DES DONNEES Ces requêtes nous ont donc permis de disposer les données de manières exploitables pour DB2SO, et par de même SODAS. Le module DB2SO est accessible via le menu SODAS file > import... > importation (DB2SO) : Dans la fenêtre SodasDB, cliquer sur File > New puis sur Nouveau pour indiquer le type de driver : Projet Data Minin-2004/2005-DEA127 11

12 Après avoir sélectionné le driver Microsoft Access, il faut maintenant sélectionner la source de données ODBC de votre base de données. Une fois la source de données ODBC créée, il faut la lier à la base de données sur laquelle l étude s effectuera. Projet Data Minin-2004/2005-DEA127 12

13 Après avoir spécifié la base de données, on spécifie la requête d extraction des individus. La figure suivante vient confirmer l extraction des individus à travers la requête spécifiée. Ensuite, on crée la taxonomie sur la variable continent. Projet Data Minin-2004/2005-DEA127 13

14 Toutes les données nécessaires étant maintenant introduites, il ne reste plus qu à les exporter vers SODAS pour pouvoir les exploiter. IV IV.1 APPLICATION DES METHODES DE SODAS LA METHODE SOE Notre analyse se fera en deux parties qui concerneront les pays en voie de développement et les pays émergents. Le troisième groupe c est à dire les pays développés ne fournit pas assez d informations. 1. les pays en voie de développement On constate que les pays très endettés sont majoritairement africains (57%), américains (19%), asiatiques (17%) et très peu de pays européens (0.02%). Par contre le nombre de pays européens augmente considérablement parmi les pays en voie de développement faiblement endetté (20%) avec une majorité des pays africains (38%), américains et asiatiques (24%) On remarque que les importations sont plus élevées dans les pays en voie de développement très endetté par contre les exportations sont moins importantes que dans les autres pays en voie de développement. Projet Data Minin-2004/2005-DEA127 14

15 L inflation se situe entre 5,2 et 408 dans les pays en voie de développement très endettés, entre 5,1 et 185 dans les pays en voie de développement faiblement endettés et 5.0 et 59 dans les pays en voie de développement modérément endettés. Quant au PNB/habitant, il est entre [100, 7480] dans les pays très endettés, [20, 9250] dans les pays faiblement endettés et [220, 3830] dans les pays ayant un endettement modéré. Les figures suivantes appuient nos différents commentaires. Projet Data Minin-2004/2005-DEA127 15

16 2. Les pays émergents Les pays émergents très endettés sont des pays américains (100%) ayant un niveau de richesse économique moyennement élevé. Le niveau d importation dans ces pays reste faible (entre 2,4% et 20,7%) par rapport aux pays émergents faiblement endettés (entre 16,3% et 75,2%). Aussi l exportation reste faible dans ces pays que dans les pays faiblement (entre 25,9% et 71,5%) et modérément (entre 125,9 et 240,5%) endettés. Les pays émergents faiblement endettés sont en majorité américains (50%), européens (25%), et asiatiques (25%). Par contre, les pays européens (63%) sont majoritaires parmi les pays Projet Data Minin-2004/2005-DEA127 16

17 modérément endettés alors que les pays asiatiques et américains représentent respectivement 25% et 13% de ces pays. Les figures suivantes confirment les interprétations faites. Projet Data Minin-2004/2005-DEA127 17

18 A travers ces deux analyses, nous constatons que les pays européens se situent plutôt parmi les pays faiblement endettés. Ce qui s explique par le fait que d une part que ces pays ont une meilleure gestion de leur ressource et d autre part, ils bénéficient du niveau de croissance économique du continent européen. La grande présence des pays africains parmi les pays en voie développement montre le retard du continent africain par rapport aux autres continents. Projet Data Minin-2004/2005-DEA127 18

19 IV.2 LA METHODE PCM La méthode PCM donne les résultats suivants : Correlations Matrix, initiales Variables/principals components PC1...PC4 PNB/habitant_($) Exportations_(%_PNB) Importations_(%_PNB) Investissements_Directs_Etrangers_($) Inflation Croissance_population_(%) Nous constatons que le PNB, les exportations et les investissements directs étrangers sont fortement corrélés avec l axe PC1. L axe PC2 explique mieux les importations et la croissance de la population. L axe PC3 explique mieux les investissements directs étrangers. L inflation est fortement corrélées à L axe PC4. Ainsi, nous avons choisi l axe PC1 et l axe PC2 pour la représentation graphique de nos résultats. Pour faciliter la lecture des résultats, nous avons répartis les graphiques en trois parties : 1. Les pays en voie de développement 2. Les pays émergents Projet Data Minin-2004/2005-DEA127 19

20 3. Les pays développés A travers ces graphiques, nous remarquons d une part que les groupes qui sont situés le plus à droite sont ceux dont le PNB, le taux d exportation et le niveau des investissements directs étrangers sont les plus importants et d autre part les groupes qui sont situés le plus en haut sont ceux dont le taux d importation et le taux de croissance de la population sont les plus élevés. Ainsi, nous pouvons dire plus on avance vers la droite de l axe PC1, le PNB, le taux d exportation et les investissement directs étrangers augmentent et inversement. Mais lorsqu on se déplace vers Projet Data Minin-2004/2005-DEA127 20

21 le haut de l axe PC2, le taux d importation et le taux de croissance de la population augmentent et inversement. IV.3 LA METHODE PYR Le modèle d échantillonnage pyramidal généralise les hiérarchies en permettant les classes nondisjointes à un niveau donné au lieu d une partition. De plus, les échantillons de la pyramide sont des intervalles. La méthode proposée permet d échantillonner des données plus complexes que les modèles tabulaires peuvent traiter, en considérant la variation des valeurs prises par les variables. Les données en entrée pour PYR sont une matrice de données symboliques ou une matrice ou une matrice de distance. S il s agît de matrice de données symboliques, le résultat sera une pyramide symbolique, dans ce cas, le critère d agrégation sera le «degré de généralité». S il s agit de matrice de distance, le résultat sera une pyramide numérique (classique) et le critère d agrégation, le «Maximum». Dans notre cas, nous avons construit deux pyramides. La première pyramide est réalisée en fonction des variables taux d importation et taux d exportation et la seconde en tenant de toutes les variables. Ainsi, nous constatons au niveau de la première pyramide que les pays ayant un niveau d endettement hors classement sont regroupés. Cela peut s expliquer peut être par la similitude de leur politique d importation et d exportation. Nous constatons aussi que les pays ayant un endettement modéré, faible ou très élevés sont regroupés à partir de la pyramide P39. Dans ce second groupe les pays en voie de développement ayant un endettement faible ou modéré sont proches. De même, les pays ayant un endettement modéré ou faible ou tendance à se regrouper. Un autre constat important, est le regroupement des pays émergeants faiblement endettés et les pays développés moins endettés. Cela peut s expliquer par le fait que les pays émergents ont une politique d exportation et d importation un peu similaire. Projet Data Minin-2004/2005-DEA127 21

22 Projet Data Minin-2004/2005-DEA127 22

23 IV.4 LA METHODE DIV La méthode d échantillonnage DIV est une méthode d échantillonnage hiérarchique qui regroupe tous les objets en seul échantillon et procède par division successive de chaque échantillon formé. A chaque étape, un échantillon est divisé en deux selon une question binaire. Cette question binaire induit la meilleure partition en deux selon l extension du critère d inertie : maximiser la variance interclasse et minimiser la variance interclasse. L algorithme s arrête après k-1 divisions où K est le nombre d échantillons donné par l utilisateur. Les données en entrée pour DIV sont une matrice de données classique ou une matrice de données symboliques. Nous avons appliqué cette méthode aux paramètres suivants : l PNB/Habitant, le niveau de richesse et le niveau d endettement THE CLUSTERING TREE : the number noted at each node indicates the order of the divisions - Ng <-> yes and Nd <-> no Classe 1 (Ng=2)!! [PNB/habitant_($) <= ]!!! Classe 5 (Nd=4)!! [PNB/habitant_($) <= ]!!!! Classe 3 (Ng=2)!!!!! [PNB/habitant_($) <= ]!!! Classe 4 (Nd=1)!! [PNB/habitant_($) <= ]! Classe 2 (Nd=1) L échantillon est divisé en deux parties selon que lepnb/habitant est supérieur à (classe 2 : il s agît des pays les "Pays développés Endettement Hors classement") ou inférieur ou égal à La classe ayant un PNB/habitant inférieur ou égal à se divise en deux en fonction que le PNB/habitant est inférieur ou égal à 6977,500 ou pas. Projet Data Minin-2004/2005-DEA127 23

24 Les deux nouvelles classes vont à leur tour se diviser en deux. Ainsi, l échantillon ayant un PNB/habitant supérieur à 6977,500 se divise en deux selon que le PNB/Habitant est supérieur à (classe 4 : les pays "Pays en voie de développement Endettement Hors classement" ) ou inférieur ou égal à (il s agît de la classe 3 comportant les "Pays émergent Endettement Hors classement", les "Pays émergent Endettement Hors classement", les "Pays développés Endettement Faible" et les "Pays développés Endettement Hors classement" ). Quant au dernier échantillon, c est à dire ceux qui ont un PNB/Habitant inférieur ou égal à 6977,500 se divise en deux selon que le PNB/habitant est supérieur à 3417,500 (classe 5 ) ou inférieur ou égal à 3417,500 (classe 1 comportant les "Pays en voie de développement Endettement Modéré" "Pays émergent Endettement Faible" ). On constate que les pays développés ayant un niveau d endettement hors classement, ont le PNB/Habitant le plus important THE CLUSTERING TREE : the number noted at each node indicates the order of the divisions - Ng <-> yes and Nd <-> no THE CLUSTERING TREE : the number noted at each node indicates the order of the divisions - Ng <-> yes and Nd <-> no Classe 1 (Ng=3)!! [Niveau_d'endettement <= Faible]!!!! Classe 3 (Ng=2)!!!!! [Niveau_d'endettement <= Elevé]!!! Classe 4 (Nd=2)!! [Niveau_de_Richesse_économique <= Moyennement élevée]!! Classe 2 (Ng=2)!!! [Niveau_de_Richesse_économique <= Elevé - Membres de l'ocde]! Classe 5 (Nd=1) Projet Data Minin-2004/2005-DEA127 24

25 IV.5 LA METHODE TREE Pour la réalisation de cette méthode, nous avons choisi comme variable de classe le niveau d endettement et comme variables prédictives, le PN/Habitant, le taux d inflation, le taux de croissance et l importation. Le listing suivant représente le résultat de la méthode : ================================== EDITION OF DECISION TREE ================================== PARAMETERS : Learning Set : 10 Number of variables : 4 Max. number of nodes: 7 Soft Assign : ( 1 ) FUZZY Criterion coding : ( 3 ) LOG-LIKELIHOOD Min. number of object by node : 5 Min. size of no-majority classes : 2 Min. size of descendant nodes : 1.00 Frequency of test set : IF ASSERTION IS TRUE (up)! --- x [ ASSERTION ]! IF ASSERTION IS FALSE (down) [ 8 ]Modéré ( )!!----4[ PNB/habitant_($) <= ]!!! [ 9 ]Elevé ( )!!----2[ PNB/habitant_($) <= ]!!! [ 5 ]Faible ( )!!----1[ PNB/habitant_($) <= ]! [ 3 ]Hors classement ( ) A travers l analyse des résultats obtenus, il s en sort que le PNB/Habitant est la variable la plus explicative. Projet Data Minin-2004/2005-DEA127 25

26 On constate aussi que les pays ayant un PNB/Habitant supérieur à 9120 ont un niveau d endettement hors classement. Les pays ayant un PNB/Habitant inférieur ou égal à 9120, se divisent premièrement en deux groupes : 1. Ceux dont le PNB/Habitant est supérieur à 7480, ont un niveau d endettement faible ; 2. Ceux dont le PNB/Habitant est inférieur ou égal à 7480, on constate à ce niveau deux autres groupes : les pays ayant un PNB/Habitant supérieur à 4710, ont un endettement élevé et les autres ont un endettement modéré Projet Data Minin-2004/2005-DEA127 26

27 IV.6 LA METHODE STAT La méthode STAT de SODAS nous permet d utiliser des statistiques classiques étendues aux variables symboliques. STAT est donc un ensemble de méthodes permettant de voir sous forme de document texte ou de graphe les statistiques élémentaires relatives à nos données symboliques. Nous avons appliqué la méthode STAT sur les variables exportation et importation.. Projet Data Minin-2004/2005-DEA127 27

28 Biplots pour les variables d intervalles : On constate que les plus gros importateurs et exportateurs sont des pays développés à endettement hors classement. Les pays développés faiblement endettés viennent en seconde position sur le plan exportation mais importent moins que la plus part des pays en voie de développement et émergeants. Les plus petits exportateurs et importateurs sont des pays émergeants très endettés. Projet Data Minin-2004/2005-DEA127 28

29 On constate également que les pays en voie de développement en tendance à se regrouper ainsi que les pays émergeants. Les pays développés en endettement hors classement importent entre 8,44 et 161,145. les plus grands importateurs sont parmi ces pays. Par contre les pays émergeants ayant un endettement élevé importent entre 12,42 et 20,71 et constituent par conséquent des faibles importateurs IV.7 LA METHODE SCLUST On constate à partir de graphique que la classe Prototyp5 comporte uniquement les pays avec un niveau endettement hors classement et un niveau de richesse OCDE. Par contre la classe Prototype 1 comportement essentiellement les pays en voie de développement faiblement ou très endettés. Projet Data Minin-2004/2005-DEA127 29

30 CONCLUSION A travers ce projet, nous avons pu en effet consolider les connaissances acquises et d enrichir notre expérience en matière d analyse. A travers le sujet choisi «développement des pays», on constate que le date mining peut être appliqué dans tous les domaines et s avère utile pour tous les décideurs. Néanmoins, cet projet ne s est pas terminé sans difficulté. La base de donnée ayant fait l objet d autre projet, malgré notre volonté de faire une étude totalement différente de la première, la limitation des données nous faisait énormément dans le choix des variables lors de l application des méthodes. Ce qui a entraîné un certain retard dans la réalisation de ce projet. Projet Data Minin-2004/2005-DEA127 30

Datamining. Université Paris Dauphine DESS ID 2004/2005. Séries télévisées nominées aux oscars. Enseignant : Réalisé par : Mars 2005. Mr E.

Datamining. Université Paris Dauphine DESS ID 2004/2005. Séries télévisées nominées aux oscars. Enseignant : Réalisé par : Mars 2005. Mr E. Université Paris Dauphine DESS ID 2004/2005 Datamining Séries télévisées nominées aux oscars Mars 2005 Enseignant : Mr E. DIDAY Réalisé par : Mounia CHERRAD Anne-Sophie REGOTTAZ Sommaire Introduction...

Plus en détail

DATA MINING - Analyses de données symboliques sur les restaurants

DATA MINING - Analyses de données symboliques sur les restaurants Master 2 Professionnel - Informatique Décisionnelle DATA MINING - Analyses de données symboliques sur les restaurants Etudiants : Enseignant : Vincent RICHARD Edwin DIDAY Seghir SADAOUI SOMMAIRE I Introduction...

Plus en détail

Projet de Datamining Supervisé (SODAS) Analyse des régions françaises

Projet de Datamining Supervisé (SODAS) Analyse des régions françaises Master 2 ème Année Ingénierie Statistique et financière Projet de Datamining Supervisé (SODAS) Analyse des régions françaises Réalisé par : Nicolas CHAIGNEAUD Nora SLIMANI Année universitaire 2007-2008

Plus en détail

Critères pour avoir la meilleure équipe!

Critères pour avoir la meilleure équipe! PROJET DATAMINING Basket-ball professionnel "NBA" : Critères pour avoir la meilleure équipe! Réalisé par : Anasse LAHLOU KASSI Houssam Eddine HOUBAINE DESS TIO DESS ID Année Scolaire : SOMMAIRE INTRODUCTION...

Plus en détail

Introduction à la B.I. Avec SQL Server 2008

Introduction à la B.I. Avec SQL Server 2008 Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide

Plus en détail

Université Paris IX DAUPHINE DATE : 24/04/06

Université Paris IX DAUPHINE DATE : 24/04/06 Master Informatique Décisionnelle Application des outils de l'informatique Décisionnelle en entreprise ETUDE SUR LES MARQUES ET LES CONTRUCTEUR DES VÉHICULES APPARTENANT AUX CLIENTS D UNE COMPAGNIE D ASSURANCE

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme

Plus en détail

Data Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.

Data Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto. des des Data Mining Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne 2012-2013 1/65 des des 1 2 des des 3 4 Post-traitement 5 représentation : 6 2/65 des des Définition générale Le

Plus en détail

Introduction au datamining

Introduction au datamining Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des

Plus en détail

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems

Plus en détail

INTRODUCTION AU DATA MINING

INTRODUCTION AU DATA MINING INTRODUCTION AU DATA MINING 6 séances de 3 heures mai-juin 2006 EPF - 4 ème année - Option Ingénierie d Affaires et de Projets Bertrand LIAUDET TP DE DATA MINING Le TP et le projet consisteront à mettre

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

La segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM

La segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM La segmentation à l aide de EG-SAS A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM Définition de la segmentation - Au lieu de considérer une population dans son ensemble,

Plus en détail

Agenda de la présentation

Agenda de la présentation Le Data Mining Techniques pour exploiter l information Dan Noël 1 Agenda de la présentation Concept de Data Mining ou qu est-ce que le Data Mining Déroulement d un projet de Data Mining Place du Data Mining

Plus en détail

Travailler avec les télécommunications

Travailler avec les télécommunications Travailler avec les télécommunications Minimiser l attrition dans le secteur des télécommunications Table des matières : 1 Analyse de l attrition à l aide du data mining 2 Analyse de l attrition de la

Plus en détail

Spécificités, Applications et Outils

Spécificités, Applications et Outils Spécificités, Applications et Outils Ricco Rakotomalala Université Lumière Lyon 2 Laboratoire ERIC Laboratoire ERIC 1 Ricco Rakotomalala ricco.rakotomalala@univ-lyon2.fr http://chirouble.univ-lyon2.fr/~ricco/data-mining

Plus en détail

Manipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner

Manipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner Le cas Orion Star Manipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner Le cas Orion Star... 1 Manipulation de données avec SAS Enterprise Guide et modélisation

Plus en détail

WEBSELL. Projet DATAMINING

WEBSELL. Projet DATAMINING WEBSELL Projet DATAMINING Analyse des données dans le cadre d une étude de banchmarking DESS ID Session 2005/2006 Mariam GASPARIAN [ Page 1 ] SOMMAIRE 1. INTRODUCTION... 3 2. METHODES ET OUTILS... 4 2.1.

Plus en détail

Travaux pratiques avec RapidMiner

Travaux pratiques avec RapidMiner Travaux pratiques avec RapidMiner Master Informatique de Paris 6 Spécialité IAD Parcours EDOW Module Algorithmes pour la Fouille de Données Janvier 2012 Prise en main Généralités RapidMiner est un logiciel

Plus en détail

et les Systèmes Multidimensionnels

et les Systèmes Multidimensionnels Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Datawarehouse (DW) Le Datawarehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées

Plus en détail

IBM SPSS Direct Marketing

IBM SPSS Direct Marketing IBM SPSS Statistics 19 IBM SPSS Direct Marketing Comprenez vos clients et renforcez vos campagnes marketing Points clés Avec IBM SPSS Direct Marketing, vous pouvez : Comprendre vos clients de manière plus

Plus en détail

Des données à la connaissance client. A la découverte de la plateforme de connaissance client knowlbox

Des données à la connaissance client. A la découverte de la plateforme de connaissance client knowlbox Des données à la connaissance client A la découverte de la plateforme de connaissance client knowlbox Livre blanc mai 2013 A l heure du Big Data, les entreprises s interrogent davantage sur leurs données.

Plus en détail

GUIDE D UTILISATION DU CENTRE DE DONNÉES DE L ISU

GUIDE D UTILISATION DU CENTRE DE DONNÉES DE L ISU GUIDE D UTILISATION DU CENTRE DE DONNÉES DE L ISU Table des matières Page I. DÉMARRER... 4 1. Comment accéder au Centre de données de l ISU?... 4 2. Quels sont les types de tableaux statistiques disponibles

Plus en détail

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION

Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION Sciences de Gestion Spécialité : SYSTÈMES D INFORMATION DE GESTION Classe de terminale de la série Sciences et Technologie du Management et de la Gestion Préambule Présentation Les technologies de l information

Plus en détail

Enjeux mathématiques et Statistiques du Big Data

Enjeux mathématiques et Statistiques du Big Data Enjeux mathématiques et Statistiques du Big Data Mathilde Mougeot LPMA/Université Paris Diderot, mathilde.mougeot@univ-paris-diderot.fr Mathématique en Mouvements, Paris, IHP, 6 Juin 2015 M. Mougeot (Paris

Plus en détail

Exploiter les statistiques d utilisation de SQL Server 2008 R2 Reporting Services

Exploiter les statistiques d utilisation de SQL Server 2008 R2 Reporting Services Exploiter les statistiques d utilisation de SQL Server 2008 R2 Reporting Services Nous verrons dans cet article comment exploiter simplement les données de Log de SQL Server 2008 R2 Reporting Services

Plus en détail

Didacticiel Études de cas. Description succincte de Pentaho Data Integration Community Edition (Kettle).

Didacticiel Études de cas. Description succincte de Pentaho Data Integration Community Edition (Kettle). 1 Objectif Description succincte de Pentaho Data Integration Community Edition (Kettle). L informatique décisionnelle («Business Intelligence BI» en anglais, ça fait tout de suite plus glamour) fait référence

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane

Plus en détail

Licence Professionnelle en Statistique et Informatique Décisionnelle (S.I.D.)

Licence Professionnelle en Statistique et Informatique Décisionnelle (S.I.D.) Université de Lille 2 - Droit et Santé Ecole Supérieure des Affaires & Institut Universitaire de Technologie (IUT-C) Département Statistique et Traitement Informatique des Données Licence Professionnelle

Plus en détail

Hervé Couturier EVP, SAP Technology Development

Hervé Couturier EVP, SAP Technology Development Hervé Couturier EVP, SAP Technology Development Hervé Biausser Directeur de l Ecole Centrale Paris Bernard Liautaud Fondateur de Business Objects Questions à: Hervé Couturier Hervé Biausser Bernard Liautaud

Plus en détail

ESIEA PARIS 2011-2012

ESIEA PARIS 2011-2012 ESIEA PARIS 2011-2012 Examen MAT 5201 DATA MINING Mardi 08 Novembre 2011 Première Partie : 15 minutes (7 points) Enseignant responsable : Frédéric Bertrand Remarque importante : les questions de ce questionnaire

Plus en détail

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP)

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP) Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP) Définition (G. Gardarin) Entrepôt : ensemble de données historisées variant

Plus en détail

LIVRE BLANC Décembre 2014

LIVRE BLANC Décembre 2014 PARSING MATCHING EQUALITY SEARCH LIVRE BLANC Décembre 2014 Introduction L analyse des tendances du marché de l emploi correspond à l évidence à une nécessité, surtout en période de tension comme depuis

Plus en détail

Didier MOUNIEN Samantha MOINEAUX

Didier MOUNIEN Samantha MOINEAUX Didier MOUNIEN Samantha MOINEAUX 08/01/2008 1 Généralisation des ERP ERP génère une importante masse de données Comment mesurer l impact réel d une décision? Comment choisir entre plusieurs décisions?

Plus en détail

RapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/2011. 1.1 Présentation. 1.2 Ressources

RapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/2011. 1.1 Présentation. 1.2 Ressources Master Maths Finances 2010/2011 Data Mining janvier 2011 RapidMiner 1 Introduction 1.1 Présentation RapidMiner est un logiciel open source et gratuit dédié au data mining. Il contient de nombreux outils

Plus en détail

Evaluation de l impact des indicateurs du. Cost of Doing Business sur le taux de croissance de Maurice

Evaluation de l impact des indicateurs du. Cost of Doing Business sur le taux de croissance de Maurice Evaluation de l impact des indicateurs du Cost of Doing Business sur le taux de croissance de Maurice Janvier 205 TABLE DE MATIERES I. Introduction... II. La Méthodologie... 3 III. Analyse Empirique...

Plus en détail

Exemple PLS avec SAS

Exemple PLS avec SAS Exemple PLS avec SAS This example, from Umetrics (1995), demonstrates different ways to examine a PLS model. The data come from the field of drug discovery. New drugs are developed from chemicals that

Plus en détail

basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB www.enseirb.fr/~legal Olivier Augereau Formation UML

basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB www.enseirb.fr/~legal Olivier Augereau Formation UML basée sur le cours de Bertrand Legal, maître de conférences à l ENSEIRB www.enseirb.fr/~legal Olivier Augereau Formation UML http://olivier-augereau.com Sommaire Introduction I) Les bases II) Les diagrammes

Plus en détail

SUGARCRM MODULE RAPPORTS

SUGARCRM MODULE RAPPORTS SUGARCRM MODULE RAPPORTS Référence document : SYNOLIA_Support_SugarCRM_Module_Rapports_v1.0.docx Version document : 1.0 Date version : 2 octobre 2012 Etat du document : En cours de rédaction Emetteur/Rédacteur

Plus en détail

Historique. Architecture. Contribution. Conclusion. Définitions et buts La veille stratégique Le multidimensionnel Les classifications

Historique. Architecture. Contribution. Conclusion. Définitions et buts La veille stratégique Le multidimensionnel Les classifications L intelligence économique outil stratégique pour l entreprise Professeur Bernard DOUSSET dousset@irit.fr http://atlas.irit.fr Institut de Recherche en Informatique de Toulouse (IRIT) Equipe Systèmes d

Plus en détail

Transmission d informations sur le réseau électrique

Transmission d informations sur le réseau électrique Transmission d informations sur le réseau électrique Introduction Remarques Toutes les questions en italique devront être préparées par écrit avant la séance du TP. Les préparations seront ramassées en

Plus en détail

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1 Christophe CANDILLIER Cours de DataMining mars 2004 age 1 1. Introduction 2. rocessus du DataMining 3. Analyse des données en DataMining 4. Analyse en Ligne OLA 5. Logiciels 6. Bibliographie Christophe

Plus en détail

Introduction aux outils BI de SQL Server 2014. Fouille de données avec SQL Server Analysis Services (SSAS)

Introduction aux outils BI de SQL Server 2014. Fouille de données avec SQL Server Analysis Services (SSAS) MIT820: Entrepôts de données et intelligence artificielle Introduction aux outils BI de SQL Server 2014 Fouille de données avec SQL Server Analysis Services (SSAS) Description générale Ce tutoriel a pour

Plus en détail

Communiqué de Lancement

Communiqué de Lancement Direction du Marketing Produits Sage - Division Mid Market Communiqué de Lancement Rapprochement Bancaire 1000 Produit : Rapprochement Bancaire 1000 Bases de Données : Oracle - MS/SQL Server Microsoft

Plus en détail

Business Intelligence

Business Intelligence avec Excel, Power BI et Office 365 Téléchargement www.editions-eni.fr.fr Jean-Pierre GIRARDOT Table des matières 1 Avant-propos A. À qui s adresse ce livre?..................................................

Plus en détail

En route vers le succès avec une solution de BI intuitive destinée aux entreprises de taille moyenne

En route vers le succès avec une solution de BI intuitive destinée aux entreprises de taille moyenne Présentation du produit SAP s SAP pour les PME SAP BusinessObjects Business Intelligence, édition Edge Objectifs En route vers le succès avec une solution de BI intuitive destinée aux entreprises de taille

Plus en détail

Business & High Technology

Business & High Technology UNIVERSITE DE TUNIS INSTITUT SUPERIEUR DE GESTION DE TUNIS Département : Informatique Business & High Technology Chapitre 8 : ID : Informatique Décisionnelle BI : Business Intelligence Sommaire Introduction...

Plus en détail

1 Modélisation d être mauvais payeur

1 Modélisation d être mauvais payeur 1 Modélisation d être mauvais payeur 1.1 Description Cet exercice est très largement inspiré d un document que M. Grégoire de Lassence de la société SAS m a transmis. Il est intitulé Guide de démarrage

Plus en détail

Traitement des données avec Microsoft EXCEL 2010

Traitement des données avec Microsoft EXCEL 2010 Traitement des données avec Microsoft EXCEL 2010 Vincent Jalby Septembre 2012 1 Saisie des données Les données collectées sont saisies dans une feuille Excel. Chaque ligne correspond à une observation

Plus en détail

Techniques d analyse et de conception d outils pour la gestion du processus de segmentation des abonnés des entreprises de télécommunication

Techniques d analyse et de conception d outils pour la gestion du processus de segmentation des abonnés des entreprises de télécommunication Techniques d analyse et de conception d outils pour la gestion du processus de segmentation des abonnés des entreprises de télécommunication R. Carlos Nana Mbinkeu 1,3, C. Tangha 1, A. Chomnoue 1, A. Kuete

Plus en détail

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données et le Data Mining Nous suivons le plan suivant : Fonctionnement de Spad Catalogue des méthodes (statistiques

Plus en détail

Etude d un cas industriel : Optimisation de la modélisation de paramètre de production

Etude d un cas industriel : Optimisation de la modélisation de paramètre de production Revue des Sciences et de la Technologie RST- Volume 4 N 1 /janvier 2013 Etude d un cas industriel : Optimisation de la modélisation de paramètre de production A.F. Bernate Lara 1, F. Entzmann 2, F. Yalaoui

Plus en détail

Améliorer les performances du site par l'utilisation de techniques de Web Mining

Améliorer les performances du site par l'utilisation de techniques de Web Mining Améliorer les performances du site par l'utilisation de techniques de Web Mining CLUB SAS 2001 17/18 octobre 2001 Stéfan Galissie LINCOLN stefan.galissie@lincoln.fr contact@web-datamining.net 2001 Sommaire

Plus en détail

Les 10 grands principes de l utilisation du data mining pour une gestion de la relation client réussie

Les 10 grands principes de l utilisation du data mining pour une gestion de la relation client réussie Les 10 grands principes de l utilisation du data mining pour une gestion de la relation client réussie Découvrir les stratégies ayant fait leurs preuves et les meilleures pratiques Points clés : Planifier

Plus en détail

INF6304 Interfaces Intelligentes

INF6304 Interfaces Intelligentes INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie

Plus en détail

BI = Business Intelligence Master Data-Science

BI = Business Intelligence Master Data-Science BI = Business Intelligence Master Data-Science UPMC 25 janvier 2015 Organisation Horaire Cours : Lundi de 13h30 à 15h30 TP : Vendredi de 13h30 à 17h45 Intervenants : Divers industriels (en cours de construction)

Plus en détail

Chapitre 9 : Informatique décisionnelle

Chapitre 9 : Informatique décisionnelle Chapitre 9 : Informatique décisionnelle Sommaire Introduction... 3 Définition... 3 Les domaines d application de l informatique décisionnelle... 4 Architecture d un système décisionnel... 5 L outil Oracle

Plus en détail

Analyse prédictive. L essor et la valeur de l analyse prédictive dans la prise de décisions

Analyse prédictive. L essor et la valeur de l analyse prédictive dans la prise de décisions ÉTUDE TECHNIQUE Analyse prédictive L essor et la valeur de l analyse prédictive dans la prise de décisions «Donnez-moi un point d appui et un levier et je soulèverai le monde.» Archimède, 250 av. J.-C.

Plus en détail

Accélérer l agilité de votre site de e-commerce. Cas client

Accélérer l agilité de votre site de e-commerce. Cas client Accélérer l agilité de votre site de e-commerce Cas client L agilité «outillée» devient nécessaire au delà d un certain facteur de complexité (clients x produits) Elevé Nombre de produits vendus Faible

Plus en détail

Contribution des industries créatives

Contribution des industries créatives RÉSUMÉ - Septembre 2014 Contribution des industries créatives à l économie de l UE en termes de PIB et d emploi Évolution 2008-2011 2 Contribution des industries créatives à l économie de l UE en termes

Plus en détail

PRÉSENTATION PRODUIT. Plus qu un logiciel, la méthode plus efficace de réconcilier.

PRÉSENTATION PRODUIT. Plus qu un logiciel, la méthode plus efficace de réconcilier. PRÉSENTATION PRODUIT Plus qu un logiciel, la méthode plus efficace de réconcilier. Automatiser les réconciliations permet d optimiser l utilisation des ressources et de générer plus de rentabilité dans

Plus en détail

Installation Client (licence réseau) de IBM SPSS Modeler 14.2

Installation Client (licence réseau) de IBM SPSS Modeler 14.2 Installation Client (licence réseau) de IBM SPSS Modeler 14.2 Les instructions suivantes permettent d installer IBM SPSS Modeler Client version 14.2 en utilisant un licence réseau. Ce présent document

Plus en détail

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation

4. Utilisation d un SGBD : le langage SQL. 5. Normalisation Base de données S. Lèbre slebre@unistra.fr Université de Strasbourg, département d informatique. Présentation du module Contenu général Notion de bases de données Fondements / Conception Utilisation :

Plus en détail

Les Entrepôts de Données

Les Entrepôts de Données Les Entrepôts de Données Grégory Bonnet Abdel-Illah Mouaddib GREYC Dépt Dépt informatique :: GREYC Dépt Dépt informatique :: Cours Cours SIR SIR Systèmes d information décisionnels Nouvelles générations

Plus en détail

Comment bien débuter sa consolidation?

Comment bien débuter sa consolidation? Comment bien débuter sa consolidation? Sommaire I. Introduction... 2 Connexion à So Conso... 2 Ordre d importation... 3 II. Fichiers d import Excel... 3 Taux de conversion... 3 Taux d impôts... 6 Les entités...

Plus en détail

INTERSYSTEMS CACHÉ COMME ALTERNATIVE AUX BASES DE DONNÉES RÉSIDENTES EN MÉMOIRE

INTERSYSTEMS CACHÉ COMME ALTERNATIVE AUX BASES DE DONNÉES RÉSIDENTES EN MÉMOIRE I N T E RS Y S T E M S INTERSYSTEMS CACHÉ COMME ALTERNATIVE AUX BASES DE DONNÉES RÉSIDENTES EN MÉMOIRE David Kaaret InterSystems Corporation INTERSySTEMS CAChé CoMME ALTERNATIvE AUx BASES de données RéSIdENTES

Plus en détail

Dossier I Découverte de Base d Open Office

Dossier I Découverte de Base d Open Office ETUDE D UN SYSTEME DE GESTION DE BASE DE DONNEES RELATIONNELLES Définition : Un SGBD est un logiciel de gestion des données fournissant des méthodes d accès aux informations. Un SGBDR permet de décrire

Plus en détail

Utiliser Access ou Excel pour gérer vos données

Utiliser Access ou Excel pour gérer vos données Page 1 of 5 Microsoft Office Access Utiliser Access ou Excel pour gérer vos données S'applique à : Microsoft Office Access 2007 Masquer tout Les programmes de feuilles de calcul automatisées, tels que

Plus en détail

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI 1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage

Plus en détail

Changer la source d'une requête dans SAS Enterprise Guide. Ce document explique comment changer la table source de la tâche Filtre et requêtes.

Changer la source d'une requête dans SAS Enterprise Guide. Ce document explique comment changer la table source de la tâche Filtre et requêtes. SAS, Cognos, Stata, Eviews, conseil, expertise, formation, mining, datamining, statistique, connaissance Changer la source d'une requête dans SAS Enterprise Guide client, valeur client, CRM, fidélisation,

Plus en détail

4. Résultats et discussion

4. Résultats et discussion 17 4. Résultats et discussion La signification statistique des gains et des pertes bruts annualisés pondérés de superficie forestière et du changement net de superficie forestière a été testée pour les

Plus en détail

Apprentissage Automatique

Apprentissage Automatique Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs

Plus en détail

Merise. Introduction

Merise. Introduction Merise Introduction MERISE:= Méthode d Etude et de Réalisation Informatique pour les Systèmes d Entreprise Méthode d Analyse et de Conception : Analyse: Etude du problème Etudier le système existant Comprendre

Plus en détail

Gestion de la relation client : l expérience du Crédit du Nord

Gestion de la relation client : l expérience du Crédit du Nord Gestion de la relation client : l expérience du Crédit du Nord Etat des lieux des processus de DataMining mis en place au Crédit du Nord, des premiers essais de score automatisé à la construction d un

Plus en détail

Automatiser la création de comptes utilisateurs Active Directory

Automatiser la création de comptes utilisateurs Active Directory Automatiser la création de comptes d utilisateurs Active Directory Sommaire 1 Introduction : Les techniques d automatisation... 2 2 Les commandes DS : créer des utilisateurs avec les outils en ligne d

Plus en détail

Intelligence Economique - Business Intelligence

Intelligence Economique - Business Intelligence Intelligence Economique - Business Intelligence Notion de Business Intelligence Dès qu'il y a une entreprise, il y a implicitement intelligence économique (tout comme il y a du marketing) : quelle produit

Plus en détail

La relation bancaire avec la clientèle des particuliers : revue de la littérature

La relation bancaire avec la clientèle des particuliers : revue de la littérature Direction de la stratégie Service de Veille et d Intelligence économiques et stratégiques du Groupe Mission de la Recherche @res @rgos Note de synthèse La relation bancaire avec la clientèle des particuliers

Plus en détail

Le langage SQL Rappels

Le langage SQL Rappels Le langage SQL Rappels Description du thème : Présentation des principales notions nécessaires pour réaliser des requêtes SQL Mots-clés : Niveau : Bases de données relationnelles, Open Office, champs,

Plus en détail

Arbres binaires de décision

Arbres binaires de décision 1 Arbres binaires de décision Résumé Arbres binaires de décision Méthodes de construction d arbres binaires de décision, modélisant une discrimination (classification trees) ou une régression (regression

Plus en détail

La base de données dans ArtemiS SUITE

La base de données dans ArtemiS SUITE 08/14 Vous préférez passer votre temps à analyser vos données plutôt qu à chercher un fichier? La base de données d ArtemiS SUITE vous permet d administrer et d organiser confortablement vos données et

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

catégorie - développement rh

catégorie - développement rh Mise en œuvre d un outil de développement des compétences 360 Feedback au sein de l Université du Courrier du Groupe La Poste Marion TREMINTIN Diplômée d un DESS Gestion Stratégique des Ressources Humaines

Plus en détail

QU EST-CE QUE LE DECISIONNEL?

QU EST-CE QUE LE DECISIONNEL? La plupart des entreprises disposent d une masse considérable d informations sur leurs clients, leurs produits, leurs ventes Toutefois ces données sont cloisonnées par les applications utilisées ou parce

Plus en détail

IBM Software Business Analytics. IBM Cognos FSR Automatisation du processus de reporting interne

IBM Software Business Analytics. IBM Cognos FSR Automatisation du processus de reporting interne IBM Software Business Analytics IBM Cognos FSR Automatisation du processus de reporting interne 2 IBM Cognos - FSR Automatisation des processus de reporting interne IBM Cognos Financial Statement Reporting

Plus en détail

La nouvelle planification de l échantillonnage

La nouvelle planification de l échantillonnage La nouvelle planification de l échantillonnage Pierre-Arnaud Pendoli Division Sondages Plan de la présentation Rappel sur le Recensement de la population (RP) en continu Description de la base de sondage

Plus en détail

Le CRM en BFI : une approche du pilotage stratégique

Le CRM en BFI : une approche du pilotage stratégique Le CRM en BFI : une approche du pilotage stratégique Sébastien Pasquet, Responsable de missions Le CRM (Customer Relationship Management) s est développé depuis 10 ans essentiellement par l intégration

Plus en détail

Initiation à la Programmation en Logique avec SISCtus Prolog

Initiation à la Programmation en Logique avec SISCtus Prolog Initiation à la Programmation en Logique avec SISCtus Prolog Identificateurs Ils sont représentés par une suite de caractères alphanumériques commençant par une lettre minuscule (les lettres accentuées

Plus en détail

Vision prospective et obstacles à surmonter pour les assureurs

Vision prospective et obstacles à surmonter pour les assureurs smart solutions for smart leaders Le «Big Data» assurément Rédigé par Pascal STERN Architecte d Entreprise Vision prospective et obstacles à surmonter pour les assureurs Un avis rendu par la cour de justice

Plus en détail

Liberez votre potentiel COURS PROGRAMME 2014

Liberez votre potentiel COURS PROGRAMME 2014 Liberez votre potentiel R COURS PROGRAMME 2014 Table des matières À propos de Evolia Training Page 1 A propos de nos services Page 2 Témoignages Page 3 Biométrie Consultance et Formation en Biométrie Page

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

Cybermarché et analyse comportementale

Cybermarché et analyse comportementale Cybermarché et analyse comportementale Antoine-Eric Sammartino aesammartino@e-laser.fr Séminaire Data Mining - Educasoft Formations 18 juin 2001-1- MENU Le Groupe LaSer Le processus Data Mining L industrialisation

Plus en détail

2 Serveurs OLAP et introduction au Data Mining

2 Serveurs OLAP et introduction au Data Mining 2-1 2 Serveurs OLAP et introduction au Data Mining 2-2 Création et consultation des cubes en mode client-serveur Serveur OLAP Clients OLAP Clients OLAP 2-3 Intérêt Systèmes serveurs et clients Fonctionnalité

Plus en détail

SQL SERVER 2008, BUSINESS INTELLIGENCE

SQL SERVER 2008, BUSINESS INTELLIGENCE SGBD / Aide à la décision SQL SERVER 2008, BUSINESS INTELLIGENCE Réf: QLI Durée : 5 jours (7 heures) OBJECTIFS DE LA FORMATION Cette formation vous apprendra à concevoir et à déployer une solution de Business

Plus en détail

CDC Entreprises présente son étude annuelle : Le capital investissement dans les PME en France

CDC Entreprises présente son étude annuelle : Le capital investissement dans les PME en France CDC Entreprises présente son étude annuelle : Le capital investissement dans les PME en France Communiqué de presse Paris, le 20 novembre 2012 CDC Entreprises, filiale de la Caisse des Dépôts, gère dans

Plus en détail

Les ERP. Enterprise Resource Planning

Les ERP. Enterprise Resource Planning Les ERP Enterprise Resource Planning Plan L'entreprise Structure Environnement Organisation Les ERP Définition Caractéristiques Architecture Coûts. Fonctions Exemples Le projet ERP L'EDI EAI Etude de cas

Plus en détail

DUT Statistique et Traitement Informatique des Données (S.T.I.D.)

DUT Statistique et Traitement Informatique des Données (S.T.I.D.) UNIVERSITÉ DE LILLE 2 IUT DE ROUBAIX DÉPARTEMENT STATISTIQUE ET TRAITEMENT INFORMATIQUE DES DONNÉES DUT Statistique et Traitement Informatique des Données OBJECTIFS : (S.T.I.D.) Il s agit d une formation

Plus en détail

SEMINAIRE SUR LA COMPILATION DES STATISTIQUES DU COMMERCE INTERNATIONAL DES MARCHANDISES ( Abuja, 30 Août 2 Septembre 2005 )

SEMINAIRE SUR LA COMPILATION DES STATISTIQUES DU COMMERCE INTERNATIONAL DES MARCHANDISES ( Abuja, 30 Août 2 Septembre 2005 ) SEMINAIRE SUR LA COMPILATION DES STATISTIQUES DU COMMERCE INTERNATIONAL DES MARCHANDISES ( Abuja, 30 Août 2 Septembre 2005 ) PRESENTATION DE LA PRODUCTION DES STATISTIQUES DOUANIERES GUINEE Conakry I -

Plus en détail

THOT - Extraction de données et de schémas d un SGBD

THOT - Extraction de données et de schémas d un SGBD THOT - Extraction de données et de schémas d un SGBD Pierre-Jean DOUSSET (France), Benoît ALBAREIL (France) pj@miningdb.com, benoit@miningdb.com Mots clefs : Fouille d information, base de données, système

Plus en détail