Critères pour avoir la meilleure équipe!

Dimension: px
Commencer à balayer dès la page:

Download "Critères pour avoir la meilleure équipe!"

Transcription

1 PROJET DATAMINING Basket-ball professionnel "NBA" : Critères pour avoir la meilleure équipe! Réalisé par : Anasse LAHLOU KASSI Houssam Eddine HOUBAINE DESS TIO DESS ID Année Scolaire :

2 SOMMAIRE INTRODUCTION... 1 I. ETAT DE L ART : QU EST CE QUE LE DATAMINING? POURQUOI LE DATAMINING? COMMENT? CLASSIFICATION DES OUTILS ET LOGICIELS DE DATAMINING Les outils Open Source Les autres outils et logiciels Datamining SODAS (Symbolic Official Data Analysis System)... 6 II. PROBLEMATIQUE CONTEXTE DESCRIPTION DE LA BASE DE DONNEES Le schéma relationnel Description des variables CHOIX DES INDIVIDUS ET CONCEPTS LES REQUETES DEFINISSANTS LES CONCEPTS La requête Principale La requête addsingle La requête Taxonomie III. UTILISATION DU MODULE DB2SO SOUS SODAS CREATION DE LA CONNEXION EXECUTION DES REQUETES ENREGISTREMENT DU FICHIER SODAS IV. UTILISATION DES METHODES DE SODAS POUR L ANALYSE DES DONNEES LA METHODE VIEW (SOE DANS L ANCIENNE VERSION) : Présentation de la méthode VIEW : Application de la méthode VIEW Interprétation des résultats LA METHODE DSTAT : Présentation de la méthode DSTAT Application de la méthode DSTAT Interprétation des résultats LA METHODE TREE Présentation de la méthode TREE Application de la méthode TREE Interprétation des résultats LA METHODE PYR Présentation de la méthode PYR Application de la méthode PYR Interprétation des résultats LA METHODE DIV Présentation de la méthode DIV Application de la méthode DIV Interprétation des résultats LA METHODE PCM Présentation de la méthode PCM Application de la méthode PCM V. LES "PEPITES" DE L ANALYSE CONCLUSION... 41

3 Introduction Ce document est le rapport de notre projet Datamining. Ce projet est réalisé par le logiciel SODAS. Le but principal est d utiliser une base de données dont il faut extraire les informations importantes pour l analyse. Cela est fait à travers l ensemble des méthodes et techniques vues dans le cours. Pour notre analyse, nous allons utiliser une base de données de Basket-ball professionnel : "NBA". Le rapport élaborera en premier lieu une présentation de l état de l art (datamining), le positionnement de SODAS sur le marché des logiciels du datamining. Ensuite il posera la problématique et présentera la base de données utilisée avec une justification des différents choix (individus, concepts, etc.). Et enfin, il affichera les rapports, graphiques, et résultats avec leurs explications. Enseignant : M. DIDAY 1

4 I. Etat de l art : 1. Qu est ce que le Datamining? En informatique, le développement des moyens de stockage (bases de données) et de calcul permet le traitement et l analyse d un ensemble de données très volumineux. Et récemment, le perfectionnement des interfaces Hommes-Machines offre aux utilisateurs, des possibilités d utilisation et de mise en oeuvre très simples des outils logiciels. Cette évolution, ainsi que la popularisation de nouvelles méthodes algorithmiques (réseaux de neurones) et outils graphiques, ont conduit au développement et à la commercialisation d un ensemble d outils et logiciels intégrant un sous-ensemble de méthodes statistiques et algorithmiques sous la terminologie de Data Mining, dont l objectif est la prospection ou fouille de données. Le datamining est une étape du Knowledge Discovery in Database (KDD) ou extraction de données qui consiste en la fouille de la base de données en se basant sur certaines règles et techniques. Ces extractions permettent de dégager des informations potentiellement utiles. Le but principal du datamining est d extraire des "pépites" (données pour l analyse) dans une "mine" (base de données) sans se salir les mains. 2. Pourquoi le Datamining? Les différents secteurs et domaines sur le marché sont en pleine expansion. Les entreprises sont en effet très motivées pour tirer parti et amortir, par une aide à la décision quantifiée, les coûts de stockage significatifs (souvent des teras octets) que leur service informatique s emploie à administrer. C est là ou l approche du Datamining prend notamment place. Différents exemples peuvent être cités à ce niveau : - La Gestion de la Relation Client (GRC) ou plus connu, en anglais, sous Customer Relationship Management (CRM), où il faut fidéliser et choyer les clients, et ce dans un but lucratif. Cependant, la base de données client contient souvent un nombre important de clients. La question qui se pose est comment choisir le bon client pour la bonne campagne, segmentation, produit, etc.? - Le développement et contrôle de qualité des applications industrielles. En effet, le contrôle de qualité est une phase très importantes lors de la réalisation d applications. Par contre, si le nombre de processus et d applications est très important, souvent dans le milieu industriel, il faut savoir les gérer parfaitement sans erreurs ou ambiguïté. - Etc. On peut constater que le Datamining n est pas limité à un secteur ou milieu précis. En effet, cette technique devient utile dès que l entreprise est confrontée à un volume de données important. Enseignant : M. DIDAY 2

5 3. Comment? Le Datamining est une technique nécessitant, au préalable, une préparation des données pour que leur exploration soit cohérente et intéressante. C est à ce niveau qu intervient la notion de l entrepôt de données (Data WareHouse). Un entrepôt de données, dont la mise en place est assuré par un gestionnaire de données (data manager) est un ensemble de bases relationnelles extraites des données brutes de l entreprise. Ces bases sont nettoyées et homogénéisées, à travers des outils d Extraction, de Transformation et de Chargement (ETL), dans le but d être stockées dans l entrepôt. Une fois ces données sont préparées et nettoyées, elles deviennent à ce stade prêtes à être exploitées. Leur exploitation se fait via les techniques de Datamining. Plusieurs outils et logiciels de Datamining, sont disponibles actuellement sur le marché. Ces outils permettent de s interfacer avec la base de données (entrepôt de données) et d y accéder dans le but d extraire les informations potentiellement utiles comme cité auparavant. L entrepôt de données est utilisé notamment quand le nombre de données est très significatif, ou plusieurs bases de données existent mais sont hétérogènes et non consolidées. Les outils Datamining peuvent aussi explorer des bases de données relationnelles sans avoir besoin d un entrepôt de données. Il suffit que l information soit bien stockée et cohérente pour en tirer profit. Par exemple, pour notre projet, nous allons travailler sur une base de données Access. Pour notre projet, nous allons utiliser le logiciel SODAS. Il serait donc intéressant de faire le tour du marché des outils et logiciels Datamining pour connaître le positionnement de SODAS. 4. Classification des outils et logiciels de Datamining Dans cette partie, nous allons faire une présentation rapide d une liste, non exhaustive, de logiciels les plus connus et utilisé sur le marché du Datamining Les outils Open Source Certains peuvent être intéressé par des outils libres. Voici une liste, non exhaustive, d outils Open Source pour le Datamining. Cette liste se restreint aux logiciels qui nous ont parus efficaces R-projet R est un langage et une infrastructure spécialisés pour les traitements statistiques. Il est l'un des nombreux projets GNU distribué sous licence GPL (logiciel libre). R est écrit en langage compilé (principalement en C), ce qui autorise de bonnes performances. La qualité de cet environnement et son ouverture ont permis à une myriade de théoriciens, statisticiens et informaticiens de compléter cette plate-forme d'un nombre impressionnant de fonctionnalités. Des dizaines de packages offrant des milliers de fonctions en font probablement la plate-forme la plus complète. Cependant l'outil n est pas considéré comme étant très simple à utiliser. Enseignant : M. DIDAY 3

6 Comme on peut le constater sur l image, R utilise plusieurs techniques intéressantes (classification hiérarchique,..) : Pour plus d informations ou téléchargement du logiciel : Scilab et Mixmod : Scilab est un langage et une infrastructure spécialisés pour les traitements mathématiques numériques et la modélisation. Scilab est un projet de l'inria et de l'ecole Nationale des Ponts et Chaussées. Sa licence autorise une utilisation gratuite ainsi que la modification des sources. Scilab supporte un spectre très large d'applications, et de nombreuses contributions sont opérationnelles sur cette plate-forme. Mixmod est une contribution de l'inria, du Laboratoire de Mathématique de Besançon et du Laboratoire Heudiasys de Compiègne qui fonctionne sur Scilab. Mixmod propose des fonctionnalités de clustering (analyse discriminante et maximum de vraisemblance). Mixmod est relativement simple d'utilisation et s'avère adapté pour un volume raisonnable de données. Pour plus d informations ou téléchargement du Scilab : Pour plus d informations ou téléchargement Mixmod : Enseignant : M. DIDAY 4

7 Autoclass-c : C est un logiciel spécialisé notamment dans le Clustering (analyse discriminante et maximum de vraisemblance). Développé par un laboratoire de la NASA et disponible dans le domaine publique. Outil performant écrit en C qui n'a plus évolué depuis le milieu Les autres outils et logiciels Datamining SAS : La solution logicielle intégrée SAS est un outil très puissant. Il permet des analyses rapides sur de très grosses bases de données. Il est très convivial : il dispose d'une interface composée d'icônes et de flèches permettant une visualisation générale de la totalité du projet. Il est aussi très complet : Il dispose d'une grande richesse analytique et permet aussi l'intégration de toutes les méthodes statistiques SPAD : Créé en 1985 dans sa version Dos, SPAD est le logiciel français pionnier dans les analyses exploratoires et le Datamining. Connu et reconnu pour sa convivialité et son efficacité, il possède les principales techniques statistiques liées au Datamining : - Description automatique des variables ; - Analyse exploratoire multidimensionnelle (ACP, AFC, ACM et Classifications) ; - Réseaux de neurones ; - Analyse discriminante ; - Segmentation ; - Etc XLSTAT : Addinsoft est l'éditeur d'xlstat. XLSTAT est un logiciel implémentant dans Microsoft Excel des fonctionnalités d'analyse de données et de statistiques. Le module central, XLSTAT-Pro, comprend plus de 40 outils d'analyse de données et de statistiques. Des modules avancés sont également disponibles ou en cours de développement (tableaux croisés dynamiques, séries chronologiques) Clementine : Clementine, l'atelier de Datamining, est un outil SPSS. Il accompagne l'entreprise dans la gestion de sa relation client. Enseignant : M. DIDAY 5

8 Clementine intègre l'ensemble des techniques statistiques pour la valorisation et la modélisation des données : - Arbres de décision ; - Statistiques ; - Règles d associations ; - Etc. Son interface visuelle et intelligente facilite le processus de Datamining et permet à l'utilisateur d'exploiter pleinement ses connaissances métier. Solution globale d'entreprise, Clementine permet le déploiement des modèles créés à chaque acteur de l'entreprise Set Analyser : Business Objects propose un outil d'analyse des données issues de l'e-business et du CRM : Le logiciel Set Analyser. Set Analyzer s'appuie sur les fonctionnalités d'interrogation, de reporting et d'analyse multidimensionnelle OLAP de Business Objects et de Web Intelligence. Cette liste n est pas exhaustive, d autres logiciels et outils existent et qui sont aussi performants et très utilisés, tels que : - Oracle ; - IBM ; - CART ; - Etc SODAS (Symbolic Official Data Analysis System) SODAS est un logiciel issu d un projet, appelé aussi SODAS, de EUROSTAT. Ce logiciel répond aux principales qualités d'un outil de Datamining. C est un projet à vocation européenne. Le projet regroupait donc plusieurs laboratoires et centres de différents pays européens. On peut citer : - CISIA : Paris ; - DIB-UNIBA : Bari ; - DMS : Naples ; - INRIA : Paris ; - LEAD : Lisbonne ; - LISE-DAUPHINE : Paris ; - Etc. Deux versions sont actuellement disponibles sur le site : Enseignant : M. DIDAY 6

9 - La version La version 2.5 Ce logiciel est destiné à des utilisateurs "métier" sans compétences statistiques ou informatiques particulières. En effet son ergonomie, sa convivialité, et la facilité pour sa mise en oeuvre et d'interprétation le rendent accessible à des utilisateurs non statisticiens. Malgré la simplicité du logiciel, il n est néanmoins pas un outil se résumant à de simples "clicks ", il permet à l utilisateur les possibilités de saisir ses propres paramètres. Les résultats fournis par l'outil sont clairs et compréhensibles : ils ne contiennent pas trop de termes techniques et statistiques par exemple. SODAS est un logiciel permettant l analyse des données symboliques. L objectif principal de SODAS est d expliquer un ensemble de concepts définis dans la base de données. En effet, à partir de l ensemble des variables expliquant les individus de la base de données, on construit des concepts. Les concepts peuvent être définis comme étant des substances secondes (second ordre), contrairement au variables qui sont définis comme des substances premier (principal). Parmi les exemples qu on peut citer pour les concepts : - Catégorie socioprofessionnelle ; - Buts marqués ; - Etc. Ce sont donc des variables qualitatives, qui peuvent être définis dans des intervalles Un concept est défini par : Son intension : Ensembles de propriétés du concept ; Son extension : Ensembles des individus qui satisfaisant ses propriétés. Pour l analyse des données dans SODAS, il faut suivre un ensemble d étapes : o Construire une base de données relationnelle (ORACLE, ACCESS, etc.) o Définir un contexte : des unités statistiques de premier niveau (habitants, familles, entreprises, etc.) ; des variables qui les décrivent ; des concepts (villes, groupes socio-économiques, scénario d'accident,...). Chaque unité statistique de premier niveau est associée à un concept (par exemple, chaque habitant est associé à sa ville). Ce contexte est défini par une requête de la base. On construit alors un tableau de données symboliques dont les nouvelles unités statistiques sont les concepts décrits par généralisation des propriétés des unités statistiques de premier niveau qui leur sont associés. Ainsi, chaque concept est décrit par des variables dont les valeurs peuvent être des histogrammes, des intervalles, des valeurs uniques (éventuellement munies de règles et de taxonomies) etc., selon le type de variables et le choix de l'utilisateur. Enseignant : M. DIDAY 7

10 Parmi les fonctionnalités du logiciel SODAS : analyser les données symboliques sous forme d histogrammes, d étoiles les comparer par des calculs de dissimilarité les classifier donner une représentation graphique et une description symbolique des classes obtenues Elaborer une hiérarchie divisive, une hiérarchie ou pyramide ascendante de concepts donner une représentation graphique plane des classes (ACP ) discriminer les classes (analyse factorielle discriminante, arbres de décision)... Ainsi, le logiciel SODAS peut se résumer par le schéma figure ci-dessous : Avantages de l analyse de données symboliques : L analyse des données symboliques offre certains avantages par rapport aux approches classiques. Enseignant : M. DIDAY 8

11 D abord, elle peut s appliquer à des données complexes. En effet, elle part de donnés symboliques (histogrammes, intervalle ) munies de règles et de taxonomies et fournit en sortie des connaissances nouvelles sous formes d objets symboliques. De plus, elle utilise des outils adaptés à la manipulation d objets symboliques de généralisation et spécialisation, d ordre et de treillis, de calculs d extension, d intension et de mesures de ressemblances ou d adéquation tenant compte des connaissances sousjacentes basées sur les règles et taxonomies. Ce type d analyse fournit des représentations graphiques exprimant entre autres la variation interne des descriptions symboliques. Rappelons qu en analyse factorielle, un objet symbolique sera représenté par une zone et pas seulement par un point. L interface utilisateur : Une nouvelle version de SODAS est actuellement disponible. En effet, avant il existait la version 1.2 de SODAS. Maintenant une nouvelle version 2.5 est disponible. Pour les deux versions de SODAS, la fenêtre principale se compose de 3 éléments principaux. Version 1.2 : 1. La barre d outils de la fenêtre principale comporte 5 menus. 2. La fenêtre Methods de la fenêtre principale propose, par groupe, les différentes méthodes disponibles. 3. La fenêtre Chaining de la fenêtre principale gère l enchaînement des méthodes appliquées à la base choisie. Enseignant : M. DIDAY 9

12 Version 2.5 : 1. La barre d outils de la fenêtre principale comporte 5 menus. 2. La fenêtre Methods de la fenêtre principale propose, par groupe, les différentes méthodes disponibles. 3. La fenêtre Chaining de la fenêtre principale gère l enchaînement des méthodes appliquées à la base choisie. On peut constater qu il y a un changement au niveau des icônes et de la présentation. Par exemple, dans la fenêtre Methods, les différentes techniques statistiques sont maintenant regroupées par méthode. Et on peut choisir la méthode dans le menu déroulant Enseignant : M. DIDAY 10

13 Afin d analyser les données de la base, nous devons enrichir la filière définie précédemment grâce à des méthodes (Methods). Nous pouvons, soit utiliser les filières prédéfinies, (Model/Predefined chaining) soit composer nous même une filière en enchaînant des méthodes issues de la fenêtre Methods. Pour insérer de nouvelles méthodes, il suffit de cliquer sur Insert Method dans le menu Method du Chaining. Un carré vide apparaît alors sous l icône BASE ; il faut alors sélectionner la méthode à appliquer, dans la fenêtre Methods et la faire glisser jusqu à l emplacement vide. Les méthodes constituant maintenant la filière sont affichées à la suite de l icône BASE, selon l ordre défini par l utilisateur, dans lequel elles vont s enchaîner. Chaque méthode est représentée par une icône à gauche de laquelle se trouve son nom ainsi qu une description sommaire. La couleur de l icône de la méthode renseigne sur son état : - Gris : la méthode n est pas encore paramétrée ; - Rouge : la méthode est paramétrée. Il va de soit que les méthodes qui viennent d être insérées sont grisées. Chaque méthode est numérotée dans la filière : ce numéro apparaît dans une petite boîte située à gauche de la méthode. Une fois encore la couleur nous renseigne, elle indique le statut de la méthode : 1. Gris : la méthode ne peut être exécutée car elle n est pas paramétrée ; 2. Vert : la méthode est exécutable car elle est paramétrée ; 3. Rouge : la méthode est désactivée. Elle est exécutable mais l utilisateur en interdit l exécution (menu Methods puis Desactive method). Par la suite, nous devons paramétrer la méthode. Pour cela, il suffit de double-cliquer sur l icône de la méthode. Une fenêtre structurée en fiches à onglets s ouvre : elle regroupe l ensemble des différents paramètres de la méthode. Une fois les méthodes paramétrées, l affichage de la filière change : toutes les méthodes sont maintenant exécutables (les icônes sont rouges). Toute exécution d une filière doit être obligatoirement précédée de sa sauvegarde (menu Chaining puis Save chaining as et saisie d un nom dont l extension est.fil). Une fois cette opération effectuée, la filière est exécutée en cliquant sur le sous-menu Run chaining du menu chaining. Enseignant : M. DIDAY 11

14 II. Problématique 1. Contexte Notre analyse est orientée sport professionnel. En effet, nous allons faire une analyse sur des données concernant le basket-ball professionnel : NBA. Durant cette analyse, nous allons essayer de définir les critères pertinents permettant d avoir les meilleures équipes (les mieux classées) NBA. Nous allons donc explorer selon certaines techniques et méthodes (les plus pertinentes) d analyses existantes dans SODAS pour arriver à cette fin. Nos données sont organisées, comme il sera expliqué plus en détail dans le point qui suit, selon une structure permettant cette analyse : - Joueur ; - Equipe ; - Pays ; - Etc. Chacune d entre elles est composée d un ensemble de variables permettant une exploration intéressante et optimale des données. Sources : Les sources de nos enregistrements sont, majoritairement, deux sites : (rubriques Basket-ball) A noter que pour certaines données (âge, taille, ) qu on n a pas trouvé sur ces sites pour certains joueurs, nous avons donc fais une recherche à travers les moteurs de recherche (Yahoo, google, ). Enseignant : M. DIDAY 12

15 2. Description de la base de données 2.1. Le schéma relationnel Le schéma relationnel de notre base de données est le suivant : Remarque : comme notre analyse concerne les équipes NBA, qui sont des équipes américaines, nous avons jugé raisonnable de garder les termes en anglais. Les noms des tables et des attributs (variables) sont en anglais. Ces données seront traduites pendant leur explication dans le point qui suit (2.2) de ce chapitre Description des variables Voici une description de l ensemble des variables (attributs) de chacune des tables de notre base de données : La table Player : C est la table Joueur. Champs PlayerID CountryNo PlayerName TeamName Age Jersey Description Identifiant du joueur (clé primaire) Identifiant Pays (clé étrangère) Nom du joueur Nom de l équipe Age du joueur Numéro du maillot Enseignant : M. DIDAY 13

16 Wage(M ) Points Position Height Weight La table Team : C est la table Equipe. Champs TeamNo TeamName Foundation President CoachNo ArenaNo MascotNo Nb_games Nb_games_won Nb_games_lost Standing Standing_type PointsM PointsC La table Country : C est la table Pays. Champs CountryNo Country Continent Salaire (revenu) en millions d euros Le nombre de points marqués par le joueur La position du joueur dans le terrain (attaque, rebond, centre) Taille du joueur en centimètre Poids du joueur en kilogrammes Description Identifiant équipe (clé primaire) Nom équipe Année de fondation de l équipe Le président de l équipe (club) Identifiant entraîneur (clé étrangère) Identifiant stade de l équipe (clé étrangère) Identifiant drapeau de l équipe (clé étrangère) Nombre de matchs joués Nombre de matchs gagnés Nombre de matchs perdus Classement Type classement (bon, moyen, mauvais) Points marqués par l équipe Points encaissés par l équipe Description Identifiant pays (clé primaire) Nom pays Nom continent Enseignant : M. DIDAY 14

17 La table Coach : C est la table Entraîneur. Champs CoachNo CoachName CoachAge CoachNationality La table Arena : C est la table Stade. Champs ArenaNo ArenaName Capacity LocationNo Foundation Description Identifiant entraîneur (clé primaire) Nom de l entraîneur Age de l entraîneur Nationalité de l entraîneur Description Identifiant du stade (clé primaire) Nom du stade Capacité du stade Identifiant location (clé étrangère) Année de fondation du stade La table Location : C est la table Location. Champs LocationNo LocationName LocationPopulation La table Mascot : C est la table Drapeau. Champs MascotNo MascotName MascotSpecies MascotColor Description Identifiant location (clé étrangère) Nom location (Etat/ville) Nombre habitants dans la ville Description Identifiant Drapeau (clé primaire) Nom du drapeau Description du drapeau Couleur du drapeau Enseignant : M. DIDAY 15

18 3. Choix des individus et concepts L objectif de cette étude est d analyser le profil des équipes participant au championnat NBA. Elle permettra de mieux connaître les particularités des équipes les mieux classées, et les dissimilarités par rapport à celles en fin du classement. Les individus c est à dire l unité statistique de premier ordre de cette étude sont les joueurs, qui sont au nombre de 145 à participer au championnat NBA. Les concepts sont donc les équipes, et elles sont au nombre de 29 dans notre base de données "NBA.mdb". 4. Les requêtes définissants les concepts Dans ce point, nous allons présenter la liste des requêtes définies dans la base de données Access, et qui vont être appelées dans le module DB2SO de SODAS pour l analyse. Trois requêtes sont nécessaires pour notre analyse : 1. La requête "Principale" ; 2. La requête "AddSingle" ; 3. La requête "AddTaxo". Chacune de ces requêtes sera expliquée et présentée sous format SQL (comme dans Access) ; ci-dessous La requête Principale Cette première requête renvoie les individus du premier ordre et leur description. Elle permet ainsi d extraire de la base de données : 1. Les individus ; 2. Les concepts ; 3. Les caractéristiques des individus. Voici, en SQL, cette requête : SELECT Player.Playername, Team.TeamName, Player.Age, Player.Height, Player.Weight, Player.[Wage (M )], Player.Points, Player.Position, Country.Country, Country.Continent FROM Team INNER JOIN (Country INNER JOIN PlayerON Country.CountryNo = Player.CountryNo) ON Team.TeamName = Player.Teamname; 4.2. La requête addsingle Cette deuxième requête renvoie les concepts avec la liste des variables les expliquant. Elle permet donc d ajouter des variables pour les concepts. Enseignant : M. DIDAY 16

19 Voici, en SQL, cette requête : SELECT Team.TeamName, Team.Foundation, Team.Nb_games, Team.Nb_games_won, Team.Nb_games_lost, Team.Standing, Team.Standing_type, Team.PointsM, Team.PointsC FROM Team; 4.3. La requête Taxonomie Cette requête permet de faire la taxonomie entre le pays d origine du joueur et le continent auquel appartient ce pays. Voici, en SQL, cette requête : SELECT Country, Continent FROM Country; Enseignant : M. DIDAY 17

20 III. Utilisation du module DB2SO sous SODAS DB2SO est le module de SODAS qui permet d extraire les individus de la base de données vers SODAS en créant les concepts correspondants pour chaque groupe de ces individus. DB2SO se base essentiellement pour cela sur la requête «Principale» (précédemment présentée). 1. Création de la connexion Sous SOSAS, on choisit d importer avec DB2SO sous le menu Import de Sodas File : Cela nous permettra d importer la base de données Access sous Sodas. Ensuite, sous DB2SO il faut choisir comme source de données le Driver Ms Access : Enseignant : M. DIDAY 18

21 Après, on choisit la base de données "nba.mdb" : 2. Exécution des requêtes Maintenant que la base de données est sélectionnée sous le module DB2SO, il faut exécuter les requêtes pré-établies sous MS Access : Principale, AddSingle, et AssTaxo. Tout d abord, on commence par l exécution de la première requête permettant d extraire les individus. C est la requête Principale : Enseignant : M. DIDAY 19

22 Comme on peut le constater,et contrairement à l ancienne version de SODAS, la nouvelle version permet d exécuter les requêtes en sélectionnant tout simplement la requête désirée et en cliquant sur OK. Rappel : La requête exécutée suite à cette procédure est : Select * From Principale Le résultat de l exécution de cette requête est le suivant : On peut constater que SODAS a importé 8 variables, dont 3 qualitatives (Position, Country, Continent), et 5 quantitatives (Age, Height, Weight, Wage (M ), Points). Les 29 assertions (concepts), qui sont les équipes, ont bien été importées par SODAS. La deuxième requête qui va être exécutée est la requête AddSingle. Cette requête permet d ajouter des colonnes de description du concept dans SODAS. Voici l exécution de cette requête : On choisit "Add single-valued variables" dans le menu Modify de DB2SO: Enseignant : M. DIDAY 20

23 Après, on définit la requête : La requête exécutée, suite à cette procédure, est la suivante : Select * From AddSingle Le résultat de cette requête est le suivant : On peut constater que les sept variables relatives aux concepts (Foundation, Nb_games, Nb_games_won, Nb_games_lost, Standing, PointsM, PointsC) ont bien été ajoutées. La dernière requête à exécuter est AddTaxo. Cette requête permettra d établir le lien entre le continent et le pays de chaque joueur. Elle sera utile à SODAS. Enseignant : M. DIDAY 21

24 La procédure de l exécution de la requête est la suivante : Dans le menu Modify de DB2SO, choisir Create a Taxonomy : Il faut choisir après la requête AddTaxo. Et dans la variable on choisit la variable Country : La requête exécutée, suite à cette procédure, est la suivante : Select * From AddTaxo Enseignant : M. DIDAY 22

25 Le résultat de cette requête est le suivant : On peut constater que les 13 nœuds (pays) ont été pris en compte par SODAS. En faisant un view de la taxonomie, on a la fenêtre, comme montré ci-dessus, présentant la structure de la taxonomie. Maintenant, le fichier est prêt pour être exploité sous SODAS. Il faut l enregistrer et l exporter. C est ce qu on va voir dans le point qui suit. 3. Enregistrement du fichier SODAS Après avoir enregistré le fichier, dans lequel les requêtes ont été exécutées, on doit l exporter sous format SODAS pour qu il soit exploité dans SODAS. Pour cela, on fait Export sous le menu File de SODAS : Le logiciel SODAS nous propose de nommer le fichier Enseignant : M. DIDAY 23

26 IV. Utilisation des méthodes de SODAS pour l analyse des données Sous SODAS, dans la fenêtre Chaining on double click sur BASE pour choisir le fichier SODAS exporté et enregistré au préalable : Ensuite, pour chaque méthode, il suffit de cliquer avec le bouton droit sur la base dans la partie Chaining et faire Insert Method pour insérer une méthode d analyse. Ensuite, il suffit de glisser la méthode depuis la fenêtre Methods dans le Chaining. Par exemple, pour la méthode View, voici sa représentation : Ensuite, il faut définir les paramètres de la méthode, et l exécuter. 1. La méthode VIEW (SOE dans l ancienne version) : 1.1. Présentation de la méthode VIEW : La méthode VIEW permet à un utilisateur à partir d un fichier SODAS, de sélectionner les objets symboliques avec la liste des variables qualitatives et quantitatives correspondantes qu il veut analyser, il peut ensuite les visualiser sur un tableau croisé ou sous forme de graphiques 2D ou 3D (étoile Zoom). Enseignant : M. DIDAY 24

27 Ces visualisations graphiques existent en deux modes. En effet il est possible d afficher un graphe par concept ou d afficher l ensemble des concepts dans le même graphe afin de faciliter leur comparaison. Dans le cadre de notre étude, nous avons jugé intéressant pour notre analyse de retenir deux équipes en haut du classement, une au milieu et deux en bas du classement. Cela nous permettra de connaître et découvrir les critères permettant d avoir les meilleures équipes en NBA Application de la méthode VIEW On choisit les paramètres de la méthode : Variable et objets symboliques. Ceci en cliquant avec le bouton droit sur la méthode insérée dans la fenêtre Chaining ou en double cliquant sur la méthode. Ensuite, on exécute la méthode (bouton droit puis execute Method ou click sur F5) pour obtenir le fichier exécuté. Voici un écran après représentant la fenêtre Chaining après l exécution : Remarques : Comme vous pouvez le constater, ici pour la méthode DSTAT, par la suite il suffit de refaire la même procédure comme pour VIEW pour insérer n importe quelle méthode et l exécuter. C est ce qui permet de construire un Chaining (un enchaînement de méthode) qu on peut exécuter en une seule fois ou bien méthode par méthode. A droite de view, on peut voir deux icônes : - La première sous forme de fichier : le fichier d exécution ; - La deuxième sous forme d écran : les résultats de l exécution. Il suffit après de cliquer sur l icône rouge pour avoir le résultat. Au début, un tableau représentant les données obtenues est affiché. Il a la forme suivante : Enseignant : M. DIDAY 25

RAPPORT DE PROJET DATA MINING

RAPPORT DE PROJET DATA MINING DEA 127 : INFORMATIQUE SYSTEMES INTELLIGENTS RAPPORT DE PROJET DATA MINING «Analyse des endettements par niveau de développement des pays» Réalisé par : BELEM MAHAMADOU Sous la direction de : M. EDWIN

Plus en détail

Projet Data Mining. Projet SODAS :

Projet Data Mining. Projet SODAS : UNIVERSITE PARIS DAUPHINE DEA 127 : SYSTEME INTELLIGENT Projet Data Mining décembre 2004 Projet SODAS : Etude sur les footballeurs évoluant en Ligue 1 durant la saison 2002-2003 Responsable : Edwin DIDAY

Plus en détail

DATA MINING : ANALYSE DE LA BASE DE DONNEES «ACTIFS.MDB»

DATA MINING : ANALYSE DE LA BASE DE DONNEES «ACTIFS.MDB» EUZENADE Anne-Laure DESS 220 Informatique de gestion Université de Paris Dauphine DATA MINING : ANALYSE DE LA BASE DE DONNEES «ACTIFS.MDB» ANALYSE DE DONNEES E. DIDAY SOMMAIRE INTRODUCTION...1 I. PRESENTATION

Plus en détail

Projet Data Mining L Analyse des contrats d assurance vie DESS-ID 2004-2005. Projet Data Mining. L Analyse des contrats d Assurance Vie

Projet Data Mining L Analyse des contrats d assurance vie DESS-ID 2004-2005. Projet Data Mining. L Analyse des contrats d Assurance Vie DESS-ID 2004-2005 Projet Data Mining L Analyse des contrats d Assurance Vie Sous la direction de M.DIDAY Edwin M.ZHOU Zhiqiang Travaux réalisés par CHRIRAA Mostafat SUN Yue Feng - 1 - Sommaire 1. Introduction..

Plus en détail

DESS Informatique Décisionnelle Université Paris Dauphine. Projet Datamining. Offres de location d appartements à Paris

DESS Informatique Décisionnelle Université Paris Dauphine. Projet Datamining. Offres de location d appartements à Paris DESS Informatique Décisionnelle Université Paris Dauphine Projet Datamining Offres de location d appartements à Paris Encadrant : Mr. DIDAY Mai 2004 VILLE Clarisse VIVIER Julien SOMMAIRE INTRODUCTION...

Plus en détail

BIRT (Business Intelligence and Reporting Tools)

BIRT (Business Intelligence and Reporting Tools) BIRT (Business Intelligence and Reporting Tools) Introduction Cette publication a pour objectif de présenter l outil de reporting BIRT, dans le cadre de l unité de valeur «Data Warehouse et Outils Décisionnels»

Plus en détail

Data Mining Location de voiture

Data Mining Location de voiture Pôle Info 3 Master ID Data Mining Location de voiture Responsables : M. DIDAY Réalisé par: Fatimaezzahra HOUDAF Fatima LANSEUR Année universitaire:2oo5/2006 Page 1 sur 34 Table des Matières Table des Matières...

Plus en détail

Introduction à la B.I. Avec SQL Server 2008

Introduction à la B.I. Avec SQL Server 2008 Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide

Plus en détail

DATA MINING - Analyses de données symboliques sur les restaurants

DATA MINING - Analyses de données symboliques sur les restaurants Master 2 Professionnel - Informatique Décisionnelle DATA MINING - Analyses de données symboliques sur les restaurants Etudiants : Enseignant : Vincent RICHARD Edwin DIDAY Seghir SADAOUI SOMMAIRE I Introduction...

Plus en détail

IUT STID, 1 ère année Découverte de logiciels statistiques Prise en main du logiciel SPAD

IUT STID, 1 ère année Découverte de logiciels statistiques Prise en main du logiciel SPAD Université de Perpignan - IUT de Carcassonne Vivien ROSSI Année 2006/2007 IUT STID, 1 ère année Découverte de logiciels statistiques Prise en main du logiciel SPAD Ce document est tiré du site : http ://www.stat.ucl.ac.be/ispersonnel/lecoutre/stats/spad/

Plus en détail

PROJET DATAMINING. Recherche des profils patients dépassant la durée normale de séjour au centre hospitalier de Poissy-St Germain en Laye

PROJET DATAMINING. Recherche des profils patients dépassant la durée normale de séjour au centre hospitalier de Poissy-St Germain en Laye 2007-2008 Master MIAGE & DECISION Spécialité : Informatique décisionnelle PROJET DATAMINING Recherche des profils patients dépassant la durée normale de séjour au centre hospitalier de Poissy-St Germain

Plus en détail

Carine Krier Lise Moro DESS Informatique Décisionnelle. Quels facteurs justifient la réussite d un étudiant au poleinfo3 de dauphine?

Carine Krier Lise Moro DESS Informatique Décisionnelle. Quels facteurs justifient la réussite d un étudiant au poleinfo3 de dauphine? Carine Krier Lise Moro DESS Informatique Décisionnelle Quels facteurs justifient la réussite d un étudiant au poleinfo3 de dauphine? Enseignant : Edwin Diday Mars 2005 SOMMAIRE 1 Etat de l art... 3 1.1

Plus en détail

Introduction à Business Objects. J. Akoka I. Wattiau

Introduction à Business Objects. J. Akoka I. Wattiau Introduction à Business Objects J. Akoka I. Wattiau Introduction Un outil d'aide à la décision accès aux informations stockées dans les bases de données et les progiciels interrogation génération d'états

Plus en détail

Thibault Denizet. Introduction à SSIS

Thibault Denizet. Introduction à SSIS Thibault Denizet Introduction à SSIS 2 SSIS - Introduction Sommaire 1 Introduction à SQL Server 2008 Integration services... 3 2 Rappel sur la Business Intelligence... 4 2.1 ETL (Extract, Transform, Load)...

Plus en détail

PROJET DE DATA MINING SUR DES DONNEES CINEMATOGRAPHIQUES AVEC LE LOGICIEL SODAS

PROJET DE DATA MINING SUR DES DONNEES CINEMATOGRAPHIQUES AVEC LE LOGICIEL SODAS UNIVERSITE PARIS-IX - Novembre 2004- DAUPHINE PROJET DE DATA MINING SUR DES DONNEES CINEMATOGRAPHIQUES AVEC LE LOGICIEL SODAS Réalisé par : Sonia GUEHIS -DEA 127- Encadré par: Mr Edwin DIDAY TABLE DES

Plus en détail

INF1473 - Entreposage et prospection de Données. Utilisation de SSIS SQL Server 2005

INF1473 - Entreposage et prospection de Données. Utilisation de SSIS SQL Server 2005 Utilisation de SSIS SQL Server 2005 A la fin de cet atelier, l étudiant sera en mesure de : Comprendre le processus de prétraitement de données (intégration, transformation, sélection et réduction) à l

Plus en détail

V ERSION EXPERIMENTALE

V ERSION EXPERIMENTALE V ERSION EXPERIMENTALE Cette version de Sipina v 3.0 n est pas, et ne sera jamais, définitive, elle sert d outil de recherche, elle a plus une vocation d outil d expérimentation que de logiciel dédié au

Plus en détail

Type du document MANUEL UTILISATEUR. Titre. Création carte situation: Manuel Utilisateur v 2.0. Création carte situation. Diffusion.

Type du document MANUEL UTILISATEUR. Titre. Création carte situation: Manuel Utilisateur v 2.0. Création carte situation. Diffusion. Type du document MANUEL UTILISATEUR Titre Création carte situation Date 14/05/2008 19/05/2009 Version 1.0 2.0 Auteur S Barthon S Barthon Commentaires Création du document Ajout de l utilisation de ArcGis

Plus en détail

Antonio Rodrigues (DESS SITN)

Antonio Rodrigues (DESS SITN) : Etude d une base de données sur les plantes d eau douce Février 2004 A l attention de Mr Diday SOMMAIRE I. INTRODUCTION 3 II. PRESENTATION GENERALE 4 II.1. LE DATAMINING 4 II.1.1. PRESENTATION 4 II.1.2.

Plus en détail

INTRODUCTION A L UTILISATION DE SYSTAT

INTRODUCTION A L UTILISATION DE SYSTAT 1 INTRODUCTION A L UTILISATION DE SYSTAT F. Lyazrhi D. Concordet 2 Systat est un logiciel statistique qui permet de préparer les graphiques et de faire des calculs nécessaires à l analyse des données.

Plus en détail

IMPLANTATION D UNE BASE DE DONNEES SOUS MS-ACCESS 97

IMPLANTATION D UNE BASE DE DONNEES SOUS MS-ACCESS 97 Stage STT050 - Novembre 2000 Page 1 IMPLANTATION D UNE BASE DE DONNEES SOUS MS-ACCESS 97 GENERALITES SUR MS-ACCESS Fonctionnalités de MS-ACCESS Access 97 est un produit Microsoft de type SGBDR (Système

Plus en détail

La problématique. La philosophie ' ) * )

La problématique. La philosophie ' ) * ) La problématique!" La philosophie #$ % La philosophie &'( ' ) * ) 1 La philosophie +, -) *. Mise en oeuvre Data warehouse ou Datamart /01-2, / 3 13 4,$ / 5 23, 2 * $3 3 63 3 #, 7 Datawarehouse Data warehouse

Plus en détail

ACCESS 2013. Système de Gestion de Bases de Données Relationnelles

ACCESS 2013. Système de Gestion de Bases de Données Relationnelles Access est un logiciel permettant de gérer des données en masse : une liste de clients ou de fournisseurs, un stock de produits, des commandes, des salariés, un club de tennis, une cave à vin, une bibliothèque,

Plus en détail

Objectif du groupe GT1.1 Fusion de Données

Objectif du groupe GT1.1 Fusion de Données Objectif du groupe GT1.1 Fusion de Données Le groupe travaille dans trois directions Le vocabulaire (piloté par ADVITAM et l aide de SITE) L état de l art (piloté par SYROKKO) Deux applications illustratives

Plus en détail

DATAMINING. Etude et analyse des ventes d une chaîne de magasins

DATAMINING. Etude et analyse des ventes d une chaîne de magasins SILVI Stéphanie WAREMBOURG Pierre-Alexandre DESS 220 Informatique de Gestion Université Paris Dauphine DATAMINING Etude et analyse des ventes d une chaîne de magasins Tuteur : Monsieur Edwin DIDAY Promotion

Plus en détail

Didacticiel Études de cas. Description succincte de Pentaho Data Integration Community Edition (Kettle).

Didacticiel Études de cas. Description succincte de Pentaho Data Integration Community Edition (Kettle). 1 Objectif Description succincte de Pentaho Data Integration Community Edition (Kettle). L informatique décisionnelle («Business Intelligence BI» en anglais, ça fait tout de suite plus glamour) fait référence

Plus en détail

NVU, Notepad++ (ou le bloc-note), MySQL, PhpMyAdmin. HTML, PHP, cas d utilisation, maquettage, programmation connaissances en HTML, PHP et SQL

NVU, Notepad++ (ou le bloc-note), MySQL, PhpMyAdmin. HTML, PHP, cas d utilisation, maquettage, programmation connaissances en HTML, PHP et SQL Prise en main de NVU et Notepad++ (conception d application web avec PHP et MySql) Propriétés Intitulé long Formation concernée Matière Présentation Description Conception de pages web dynamiques à l aide

Plus en détail

Module 2 Création d un formulaire simple

Module 2 Création d un formulaire simple Form Builder Développement d un formulaire Sauvegarde d un formulaire Établir une connexion avec le serveur Fenêtre de navigation Assistant de création de blocs (Data Block Wizard) Assistant de mise en

Plus en détail

Manuel d utilisation du progiciel ELODIE V1.1.004. Pour la version de démonstration du progiciel. Version du 4 Mars 2011. Réf : DESE/ENV - 11.

Manuel d utilisation du progiciel ELODIE V1.1.004. Pour la version de démonstration du progiciel. Version du 4 Mars 2011. Réf : DESE/ENV - 11. Manuel d utilisation du progiciel ELODIE V1.1.004 Pour la version de démonstration du progiciel. Version du 4 Mars 2011. Réf : DESE/ENV - 11.024 2 Table des matières 1. INTRODUCTION... 4 2. CONNEXION A

Plus en détail

Datamining. Université Paris Dauphine DESS ID 2004/2005. Séries télévisées nominées aux oscars. Enseignant : Réalisé par : Mars 2005. Mr E.

Datamining. Université Paris Dauphine DESS ID 2004/2005. Séries télévisées nominées aux oscars. Enseignant : Réalisé par : Mars 2005. Mr E. Université Paris Dauphine DESS ID 2004/2005 Datamining Séries télévisées nominées aux oscars Mars 2005 Enseignant : Mr E. DIDAY Réalisé par : Mounia CHERRAD Anne-Sophie REGOTTAZ Sommaire Introduction...

Plus en détail

Module 3 Exécution, interrogation d un formulaire

Module 3 Exécution, interrogation d un formulaire Module 3 Exécution, interrogation d un formulaire Manipulation du module Form Le module Form est un programme source qui peut être enregistré dans la base de données ou dans un fichier binaire sur le disque

Plus en détail

Didier MOUNIEN Samantha MOINEAUX

Didier MOUNIEN Samantha MOINEAUX Didier MOUNIEN Samantha MOINEAUX 08/01/2008 1 Généralisation des ERP ERP génère une importante masse de données Comment mesurer l impact réel d une décision? Comment choisir entre plusieurs décisions?

Plus en détail

Entrepôt de données 1. Introduction

Entrepôt de données 1. Introduction Entrepôt de données 1 (data warehouse) Introduction 1 Présentation Le concept d entrepôt de données a été formalisé pour la première fois en 1990 par Bill Inmon. Il s agissait de constituer une base de

Plus en détail

Applications XIR2/26

Applications XIR2/26 Desktop Intelligence XI Niveau Support d applications Desktop Intelligence XI Niveau Applications XIR/6 v Ce document ne peut en aucun cas, en partie ou en totalité, être copié, photocopié, reproduit,

Plus en détail

Business & High Technology

Business & High Technology UNIVERSITE DE TUNIS INSTITUT SUPERIEUR DE GESTION DE TUNIS Département : Informatique Business & High Technology Chapitre 8 : ID : Informatique Décisionnelle BI : Business Intelligence Sommaire Introduction...

Plus en détail

Business Intelligence avec SQL Server 2012

Business Intelligence avec SQL Server 2012 Editions ENI Business Intelligence avec SQL Server 2012 Maîtrisez les concepts et réalisez un système décisionnel Collection Solutions Informatiques Extrait Alimenter l'entrepôt de données avec SSIS Business

Plus en détail

Analyse de données textuelles Panorama des fonctions, des méthodes et des usages

Analyse de données textuelles Panorama des fonctions, des méthodes et des usages Analyse de données textuelles Panorama des fonctions, des méthodes et des usages Sylvie Dalbin Assistance & Techniques Documentaires DocForum, Le 17 Novembre 2005 Déroulé de l'intervention (1) 1. Définition

Plus en détail

Mise en œuvre d un Site Sharepoint-V1

Mise en œuvre d un Site Sharepoint-V1 Mise en œuvre d un Site Sharepoint- MAJ 20/01/2015 Ce document décrit le paramétrage pour la mise en œuvre des fonctionnalités standard de Microsoft SharePoint 2013 NADAP et SharePoint NADAP ( Nouvelle

Plus en détail

Document d aide à la découverte de l outil d analyse de données Analyza. SOMMAIRE

Document d aide à la découverte de l outil d analyse de données Analyza. SOMMAIRE Guide Analyza Document d aide à la découverte de l outil d analyse de données Analyza. SOMMAIRE 1. Interface 2. Tableaux de bord 3. Indicateurs 4. Filtres 5. Permissions 6. Alertes 7. Flux de données 8.

Plus en détail

MÉTHODES DE CLASSIFICATION

MÉTHODES DE CLASSIFICATION MÉTHODES DE CLASSIFICATION Pierre-Louis GONZALEZ MÉTHODES DE CLASSIFICATION Objet Opérer des regroupements en classes homogènes d un ensemble d individus. Données Les données se présentent en général sous

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

Outils Statistiques du Data Mining

Outils Statistiques du Data Mining Outils Statistiques du Data Mining Pr Roch Giorgi roch.giorgi@univ-amu.fr SESSTIM, Faculté de Médecine, Aix-Marseille Université, Marseille, France http://sesstim-orspaca.org http://optim-sesstim.univ-amu.fr

Plus en détail

GUIDE D UTILISATION DU CENTRE DE DONNÉES DE L ISU

GUIDE D UTILISATION DU CENTRE DE DONNÉES DE L ISU GUIDE D UTILISATION DU CENTRE DE DONNÉES DE L ISU Table des matières Page I. DÉMARRER... 4 1. Comment accéder au Centre de données de l ISU?... 4 2. Quels sont les types de tableaux statistiques disponibles

Plus en détail

Recueil des Fiches Concepteurs : Mise en œuvre d un site SharePoint 2013 Juin 2015

Recueil des Fiches Concepteurs : Mise en œuvre d un site SharePoint 2013 Juin 2015 Recueil des s s : Mise en œuvre d un site SharePoint 2013 Juin 2015 Ce document décrit le paramétrage pour la mise en œuvre des fonctionnalités standard de Microsoft SharePoint 2013. NADAP et SharePoint

Plus en détail

Créer le schéma relationnel d une base de données ACCESS

Créer le schéma relationnel d une base de données ACCESS Utilisation du SGBD ACCESS Polycopié réalisé par Chihab Hanachi et Jean-Marc Thévenin Créer le schéma relationnel d une base de données ACCESS GENERALITES SUR ACCESS... 1 A PROPOS DE L UTILISATION D ACCESS...

Plus en détail

FCA SI2 GUIDE RAPIDE DE L UTILISATEUR

FCA SI2 GUIDE RAPIDE DE L UTILISATEUR FCA SI2 GUIDE RAPIDE DE L UTILISATEUR Introduction...2 1 Démarrage...3 1.1 Se connecter...3 1.2 Mettre à jour son Profil...3 1.3 Fonctionnalités du Système...4 2 Comment faire pour...5 2.1 Naviguer d un

Plus en détail

FOUILLE DE DONNEES. Anne LAURENT ECD. laurent@lirmm.fr

FOUILLE DE DONNEES. Anne LAURENT ECD. laurent@lirmm.fr FOUILLE DE DONNEES Anne LAURENT laurent@lirmm.fr ECD Pourquoi la fouille de données? Données disponibles Limites de l approche humaine Nombreux besoins : Industriels, Médicaux, Marketing, Qu est-ce que

Plus en détail

Business Intelligence

Business Intelligence avec Excel, Power BI et Office 365 Téléchargement www.editions-eni.fr.fr Jean-Pierre GIRARDOT Table des matières 1 Avant-propos A. À qui s adresse ce livre?..................................................

Plus en détail

1 Modélisation d être mauvais payeur

1 Modélisation d être mauvais payeur 1 Modélisation d être mauvais payeur 1.1 Description Cet exercice est très largement inspiré d un document que M. Grégoire de Lassence de la société SAS m a transmis. Il est intitulé Guide de démarrage

Plus en détail

Utiliser Access ou Excel pour gérer vos données

Utiliser Access ou Excel pour gérer vos données Page 1 of 5 Microsoft Office Access Utiliser Access ou Excel pour gérer vos données S'applique à : Microsoft Office Access 2007 Masquer tout Les programmes de feuilles de calcul automatisées, tels que

Plus en détail

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)

SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...) Avant-propos 1. À qui s'adresse ce livre? 15 2. Pré-requis 15 3. Objectifs du livre 16 4. Notations 17 Introduction à la Business Intelligence 1. Du transactionnel au décisionnel 19 2. Business Intelligence

Plus en détail

Université Paris IX DAUPHINE DATE : 24/04/06

Université Paris IX DAUPHINE DATE : 24/04/06 Master Informatique Décisionnelle Application des outils de l'informatique Décisionnelle en entreprise ETUDE SUR LES MARQUES ET LES CONTRUCTEUR DES VÉHICULES APPARTENANT AUX CLIENTS D UNE COMPAGNIE D ASSURANCE

Plus en détail

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données et le Data Mining Nous suivons le plan suivant : Fonctionnement de Spad Catalogue des méthodes (statistiques

Plus en détail

CENTRE DE FORMATION SUPPORT DE COURS - EXCEL 2013 - PERFECTIONNEMENT SUPPORT DE COURS EXCEL 2013 - PERFECTIONNEMENT RÉVÉLATEUR DE COMPÉTENCES

CENTRE DE FORMATION SUPPORT DE COURS - EXCEL 2013 - PERFECTIONNEMENT SUPPORT DE COURS EXCEL 2013 - PERFECTIONNEMENT RÉVÉLATEUR DE COMPÉTENCES RÉVÉLATEUR DE COMPÉTENCES SUPPORT DE COURS EXCEL 2013 - PERFECTIONNEMENT CENTRE DE FORMATION BUREAUTIQUE - INFOGRAPHIE PAO - 3D - WEB - WEBMARKETING MANAGEMENT - TECHNIQUES DE VENTE - COMMUNICATION - EFFICACITÉ

Plus en détail

1 Partie A : administration d une base de donnée à travers PhpMyAdmin

1 Partie A : administration d une base de donnée à travers PhpMyAdmin Ce TP se compose en 2 sections : une section de prise en main (sur ordinateur) et une section d exercice (sur papier) concernant l algèbre relationnelle. 1 Partie A : administration d une base de donnée

Plus en détail

26 Centre de Sécurité et de

26 Centre de Sécurité et de 26 Centre de Sécurité et de Maintenance La fenêtre du Centre de sécurité et de maintenance (CSM) rassemble tous les outils nécessaires au contrôle, à l analyse, à la maintenance, à la sauvegarde et au

Plus en détail

Logiciel Statistique : SPSS

Logiciel Statistique : SPSS Faculté des Sciences Économiques et de Gestion de Tunis Logiciel Statistique : SPSS Notes du cours pour les étudiants du Master Recherche en Marketing, Management & Finance Dr. Jalila ATTAFI 2011-2012

Plus en détail

Corporation Dignité Travail 35 + CDT35+ Formation. Perfectionnement sur Microsoft Excel Durée 6 heures. Par Raymond Vachon Technicien en informatique

Corporation Dignité Travail 35 + CDT35+ Formation. Perfectionnement sur Microsoft Excel Durée 6 heures. Par Raymond Vachon Technicien en informatique Corporation Dignité Travail 35 + CDT35+ Formation Perfectionnement sur Microsoft Excel Durée 6 heures Par Raymond Vachon Technicien en informatique Introduction Le logiciel Excel est un chiffrier électronique

Plus en détail

Spring IDE. Mise en œuvre. Eclipse

Spring IDE. Mise en œuvre. Eclipse A Spring IDE Bien que Spring mette à disposition d intéressants mécanismes afin d améliorer l architecture des applications Java EE en se fondant sur l injection de dépendances et la programmation orientée

Plus en détail

Installation Client (licence réseau) de IBM SPSS Modeler 14.2

Installation Client (licence réseau) de IBM SPSS Modeler 14.2 Installation Client (licence réseau) de IBM SPSS Modeler 14.2 Les instructions suivantes permettent d installer IBM SPSS Modeler Client version 14.2 en utilisant un licence réseau. Ce présent document

Plus en détail

Les solutions SAS pour les Petites et Moyennes Entreprises

Les solutions SAS pour les Petites et Moyennes Entreprises BROCHURE SOLUTION Les solutions SAS pour les Petites et Moyennes Entreprises Sur un marché aussi compétitif que celui des Petites et Moyennes Entreprises, le temps et l efficacité sont deux valeurs prioritaires

Plus en détail

Sage 100 CRM Guide de l Import Plus avec Talend Version 8. Mise à jour : 2015 version 8

Sage 100 CRM Guide de l Import Plus avec Talend Version 8. Mise à jour : 2015 version 8 Sage 100 CRM Guide de l Import Plus avec Talend Version 8 Mise à jour : 2015 version 8 Composition du progiciel Votre progiciel est composé d un boîtier de rangement comprenant : le cédérom sur lequel

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

Installation Client (licence de site) de IBM SPSS Modeler 14.2

Installation Client (licence de site) de IBM SPSS Modeler 14.2 Installation Client (licence de site) de IBM SPSS Modeler 14.2 Les instructions suivantes permettent d installer IBM SPSS Modeler Client version 14.2 en utilisant un licence de site. Ce présent document

Plus en détail

SUGARCRM MODULE RAPPORTS

SUGARCRM MODULE RAPPORTS SUGARCRM MODULE RAPPORTS Référence document : SYNOLIA_Support_SugarCRM_Module_Rapports_v1.0.docx Version document : 1.0 Date version : 2 octobre 2012 Etat du document : En cours de rédaction Emetteur/Rédacteur

Plus en détail

BUSINESS INTELLIGENCE

BUSINESS INTELLIGENCE GUIDE COMPARATIF BUSINESS INTELLIGENCE www.viseo.com Table des matières Business Intelligence :... 2 Contexte et objectifs... 2 Une architecture spécifique... 2 Les outils de Business intelligence... 3

Plus en détail

10 Etats rapides. Introduction

10 Etats rapides. Introduction 10 Etats rapides Introduction La génération d états récapitulatifs est l une des tâches les plus courantes et les plus élémentaires en matière de gestion de données. L éditeur d états rapides est l un

Plus en détail

Traitement des données avec Microsoft EXCEL 2010

Traitement des données avec Microsoft EXCEL 2010 Traitement des données avec Microsoft EXCEL 2010 Vincent Jalby Septembre 2012 1 Saisie des données Les données collectées sont saisies dans une feuille Excel. Chaque ligne correspond à une observation

Plus en détail

UltraBackup NetStation 4. Guide de démarrage rapide

UltraBackup NetStation 4. Guide de démarrage rapide UltraBackup NetStation 4 Guide de démarrage rapide Table des matières 1 Fonctionnalités... 3 1.1 Ce qu UltraBackup NetStation permet de faire... 3 1.2 Ce qu UltraBackup NetStation ne permet pas de faire...

Plus en détail

La Clé informatique. Formation Excel XP Aide-mémoire

La Clé informatique. Formation Excel XP Aide-mémoire La Clé informatique Formation Excel XP Aide-mémoire Septembre 2005 Table des matières Qu est-ce que le logiciel Microsoft Excel?... 3 Classeur... 4 Cellule... 5 Barre d outil dans Excel...6 Fonctions habituelles

Plus en détail

SQL Server 2014 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services, Power BI...)

SQL Server 2014 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services, Power BI...) Avant-propos 1. À qui s'adresse ce livre? 15 2. Pré-requis 15 3. Objectifs du livre 16 4. Notations 17 Introduction à la Business Intelligence 1. Du transactionnel au décisionnel 19 2. Business Intelligence

Plus en détail

ReportBuilder. Pour EBP Bâtiment et EBP Devis et Facturation. Guide d initiation et de prise en main

ReportBuilder. Pour EBP Bâtiment et EBP Devis et Facturation. Guide d initiation et de prise en main ReportBuilder Pour EBP Bâtiment et EBP Devis et Facturation Guide d initiation et de prise en main Edité par EBP Informatique, Rue de Cutesson, BP 95 78513 Rambouillet Cedex Tél : 01 34 94 80 20, Fax :

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme

Plus en détail

Propriétés. Utilisation du logiciel GanttProject Type de ressource. Mode opératoire. Niveau Matière

Propriétés. Utilisation du logiciel GanttProject Type de ressource. Mode opératoire. Niveau Matière Propriétés Description Titre Utilisation du logiciel GanttProject Type de ressource Mode opératoire Niveau Matière Public Professeur Description Ce document est un guide d'utilisation pas à pas du logiciel

Plus en détail

Introduction aux outils BI de SQL Server 2014. Fouille de données avec SQL Server Analysis Services (SSAS)

Introduction aux outils BI de SQL Server 2014. Fouille de données avec SQL Server Analysis Services (SSAS) MIT820: Entrepôts de données et intelligence artificielle Introduction aux outils BI de SQL Server 2014 Fouille de données avec SQL Server Analysis Services (SSAS) Description générale Ce tutoriel a pour

Plus en détail

GUIDE DE DÉMARRAGE RAPIDE

GUIDE DE DÉMARRAGE RAPIDE INDUSTRIAL AUTOMATION Interactive Graphical SCADA System INSIGHT AND OVERVIEW GUIDE DE DÉMARRAGE RAPIDE Page 1 de 27 Guide de démarrage rapide pour IGSS FREE50 Introduction Ce guide a pour but de vous

Plus en détail

clef primaire ; clef étrangère ; projection ; restriction ; jointure ; SQL ; SELECT ; FROM ; WHERE

clef primaire ; clef étrangère ; projection ; restriction ; jointure ; SQL ; SELECT ; FROM ; WHERE Cas Neptune hôtel Base de données et langage SQL Propriété Intitulé long Formation concernée Matière Notions Transversalité Présentation Description Neptune Hôtel. L interrogation d une base de données

Plus en détail

INTRODUCTION GENERALE...1 LA CONNEXION ODBC :...1. CONNEXION AU TRAVERS D EXCEL(tm)...6. LOGICIEL QUANTUM GIS (Qgis)... 10

INTRODUCTION GENERALE...1 LA CONNEXION ODBC :...1. CONNEXION AU TRAVERS D EXCEL(tm)...6. LOGICIEL QUANTUM GIS (Qgis)... 10 PROGRAMME RÉGIONAL DE RENFORCEMENT DE LA COLLECTE DES DONNÉES STATISTIQUES DES PECHES DANS LES ÉTATS MEMBRES ET DE CREATION D UNE BASE DE DONNÉES REGIONALE Manuel de formation TABLE DES MATIERES INTRODUCTION

Plus en détail

Extraction d informations stratégiques par Analyse en Composantes Principales

Extraction d informations stratégiques par Analyse en Composantes Principales Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 dousset@irit.fr 1 Introduction

Plus en détail

Agenda de la présentation

Agenda de la présentation Le Data Mining Techniques pour exploiter l information Dan Noël 1 Agenda de la présentation Concept de Data Mining ou qu est-ce que le Data Mining Déroulement d un projet de Data Mining Place du Data Mining

Plus en détail

Logiciels fondamentaux

Logiciels fondamentaux Logiciels fondamentaux Mac OS Mac OS est le système d exploitation des ordinateurs Macintosh (OS est l abrégé de Operating System). C est le logiciel incontournable qui gère l ordinateur du démarrage jusqu

Plus en détail

1. Vue rapide des logiciels disponibles

1. Vue rapide des logiciels disponibles Voici une revue rapide des progiciels gratuits accessibles [FREE AND SHAREWARE] dans la section SUITES du site KDNUGGETS (http://www.kdnuggets.com/software/suites.html). L étude sera approfondie pour les

Plus en détail

Guide utilisateur S.I.G Système d Information Géographique

Guide utilisateur S.I.G Système d Information Géographique Guide utilisateur S.I.G Système d Information Géographique Taper l adresse du site dans Internet Explorer : http://sig.siceco.fr En cas de problèmes sur l identifiant et/ou Mot de passe contacter : M.

Plus en détail

ANALYSE : OUTIL D ANALYSE DE DONNEES POUR LES SCIENCES HUAMINES MANUEL DE L UTILISATEUR : PRISE EN MAIN

ANALYSE : OUTIL D ANALYSE DE DONNEES POUR LES SCIENCES HUAMINES MANUEL DE L UTILISATEUR : PRISE EN MAIN Pôle Informatique de Recherche et d Enseignement en Histoire ANALYSE : OUTIL D ANALYSE DE DONNEES POUR LES SCIENCES HUAMINES MANUEL DE L UTILISATEUR : PRISE EN MAIN A. PREMIER PAS 1. INTEGRATION DU TABLEAU

Plus en détail

Classification Exemple : Enquête d opinion sur les OGM. Pauline Le Badezet Alexandra Lepage

Classification Exemple : Enquête d opinion sur les OGM. Pauline Le Badezet Alexandra Lepage Classification Exemple : Enquête d opinion sur les OGM Pauline Le Badezet Alexandra Lepage SOMMAIRE Introduction Méthodologie Méthode de partitionnement Classification Ascendante Hiérarchique Interprétation

Plus en détail

Initiation Access 2003

Initiation Access 2003 Initiation Access 2003 Sommaire Introduction...3 1. Création d une base...3 1.1. Modélisation...3 1.2. Création de la base...4 2. Les tables...5 2.1. Création d'une table en mode Création...5 2.2. Les

Plus en détail

Business Intelligence avec SQL Server 2012

Business Intelligence avec SQL Server 2012 Editions ENI Business Intelligence avec SQL Server 2012 Maîtrisez les concepts et réalisez un système décisionnel Collection Solutions Informatiques Table des matières Les éléments à télécharger sont disponibles

Plus en détail

Instructions d installation de IBM SPSS Modeler Server 14.2 pour Windows

Instructions d installation de IBM SPSS Modeler Server 14.2 pour Windows Instructions d installation de IBM SPSS Modeler Server 14.2 pour Windows IBM SPSS Modeler Server peut être installé et configuré de manière à s exécuter en mode d analyse réparti, avec une ou plusieurs

Plus en détail

Université Paris 1 Panthéon Sorbonne UFR 06. Fiche de TD VBA

Université Paris 1 Panthéon Sorbonne UFR 06. Fiche de TD VBA 1 / 13 Fiche de TD VBA L objectif de cette fiche est de faire un rappel (voire une présentation rapide) du langage de programmation VBA et de son usage sur des documents Excel et Access. Pour rappel, VBA

Plus en détail

MEGA Architecture. Guide de démarrage

MEGA Architecture. Guide de démarrage MEGA Architecture Guide de démarrage MEGA 2009 SP5 1ère édition (mars 2011) Les informations contenues dans ce document pourront faire l objet de modifications sans préavis et ne sauraient en aucune manière

Plus en détail

Le Sphinx Millenium Modes opératoires d'analyse de données Traitements et analyses avec Le Sphinx Plus²

Le Sphinx Millenium Modes opératoires d'analyse de données Traitements et analyses avec Le Sphinx Plus² Le Sphinx Millenium Modes opératoires d'analyse de données Traitements et analyses avec Le Sphinx Plus² Le Sphinx Développement Parc Altaïs 74650 CHAVANOD Tél : 33 / 4.50.69.82.98. Fax : 33 / 4.50.69.82.78.

Plus en détail

Module 22 : Les tableaux croisés dynamiques* contenu de 2010*

Module 22 : Les tableaux croisés dynamiques* contenu de 2010* Module 22 : Les tableaux croisés dynamiques* contenu de 2010* 22.0 Introduction On aurait pu appeler ce module Résumer rapidement les données. Excel possède un outil puissant qui permet de résumer les

Plus en détail

GUIDE Excel (version débutante) Version 2013

GUIDE Excel (version débutante) Version 2013 Table des matières GUIDE Excel (version débutante) Version 2013 1. Créer un nouveau document Excel... 3 2. Modifier un document Excel... 3 3. La fenêtre Excel... 4 4. Les rubans... 4 5. Saisir du texte

Plus en détail

Traitement des données avec EXCEL 2007

Traitement des données avec EXCEL 2007 Traitement des données avec EXCEL 2007 Vincent Jalby Octobre 2010 1 Saisie des données Les données collectées sont saisies dans une feuille Excel. Chaque ligne correspond à une observation (questionnaire),

Plus en détail

Chapitre 9 : Informatique décisionnelle

Chapitre 9 : Informatique décisionnelle Chapitre 9 : Informatique décisionnelle Sommaire Introduction... 3 Définition... 3 Les domaines d application de l informatique décisionnelle... 4 Architecture d un système décisionnel... 5 L outil Oracle

Plus en détail

L Assistant graphique

L Assistant graphique Activité 2 : Les graphiques avec Excel Un graphique transforme les données en images. Il est un élément visuel qui facilite la compréhension de données statistiques. Cette activité permet d apprendre comment

Plus en détail

Bases de la Bureautique septembre 2014

Bases de la Bureautique septembre 2014 Le matériel informatique : Unité centrale Un réseau en entreprise Un schéma type de l implantation de l'informatique dans une grande entreprise : le serveur centralise les mails, l'agenda, les données.

Plus en détail

Dossier I Découverte de Base d Open Office

Dossier I Découverte de Base d Open Office ETUDE D UN SYSTEME DE GESTION DE BASE DE DONNEES RELATIONNELLES Définition : Un SGBD est un logiciel de gestion des données fournissant des méthodes d accès aux informations. Un SGBDR permet de décrire

Plus en détail

UltraBackup NetStation 4. Guide de démarrage rapide

UltraBackup NetStation 4. Guide de démarrage rapide UltraBackup NetStation 4 Guide de démarrage rapide Table des matières 1 Fonctionnalités... 3 1.1 Ce qu UltraBackup NetStation permet de faire... 3 1.2 Ce qu UltraBackup NetStation ne permet pas de faire...

Plus en détail

But du papier : Paramétrer WSUS pour récupérer les mises à jour et administrer le serveur WSUS

But du papier : Paramétrer WSUS pour récupérer les mises à jour et administrer le serveur WSUS Administrer WSUS Rédacteur : Eric Drezet Administrateur réseau CNRS-CRHEA 07/2005 Groupe Admin06 - Resinfo But du papier : Paramétrer WSUS pour récupérer les mises à jour et administrer le serveur WSUS

Plus en détail