données en connaissance et en actions?
|
|
|
- Gisèle Audy
- il y a 10 ans
- Total affichages :
Transcription
1 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions?
2 SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes) : Propose différentes techniques pour découvrir des relations, structures, associations, etc. pertinentes dans des données complexes. Méthodes de segmentation, classification, associations Différents types de graphiques pour l exploration des données. Des méthodes de déploiement pour utiliser les travaux d analyse pour alerter, anticiper, etc. Modules complémentaires de Text Mining et de Web Mining. Interface, aide en ligne et manuels en Français. 2
3 Programmation visuelle Pasw Modeler Visualisation Accès aux données Transformation Modélisation Flux, sorties, modèles Programmation visuelle Déploiement Projet Clementine Evaluation Nœuds Clementine 3
4 Visualisation Exploration des données. Découverte de structures, de relations : Aide à la compréhension. Guide pour la préparation des données. Arbre de décision Analyse et exploration des résultats des modèles. Les graphiques sont interactifs. Segment ation 4
5 Les nœuds de manipulation Sources de données : Opérations sur les lignes : Opérations sur les champs : Graphiques : 5
6 Les nœuds de modélisation Modélisation : Automatisation Classification Association Segmentation 6
7 Les nœuds de restitution Sortie : Exporter : Text Mining (module complémentaire) : 7
8 Déploiement Application du modèle sur la base de données directement depuis Clementine : Scoring l utilisation d un modèle (le résultat de l analyse) pour prédire est l élément principal à déployer. Clementine propose également d autres méthodes de déploiement : SPSS Predictive Enterprise Services (déploiement via une plate-forme d entreprise). Clementine Solution Publisher (exécution autonome de flux). Cleo (exécution en ligne via un navigateur internet). Mode batch (automatisation par un mode batch). PMML (standard XML d échange de modèles entre produits). Smartscore (bibliothèque Java permettant l appel de PMML). SQL (génération SQL, compris les modèles). 8
9 9 Partie 3 : Ateliers Introduction à Modeler
10 Atelier 1 : Introduction à Modeler Travail pratique 1 : Accès aux Données Travail pratique 2 : Exploration des données Travail pratique 3 : Manipulation des données Travail pratique 4 : Examen des relations entre les champs 10
11 Atelier 2 : Modélisation Travail pratique 5 : Mise en œuvre de Réseaux de Neurones Travail pratique 6 : Induction de Règles avec Clementine Travail pratique 7 : Combiner l Induction de Règles et les Réseaux de Neurones Travail pratique 8 : Algorithmes de Classification 11
12 12 Travail pratique 1 : Accès aux Données Délimité
13 13 Nœud délimité (Noeud source) Importe les fichiers plats Avec délimiteur Formats, champs, nom, etc. Contrôle le stockage Sélection des champs (formatage) type Standard Délimité
14 Nœud fixe (Noeud source) ID 1 6 AGE 7 2 SALAIRE 10 5 SEXE 15 1 MARITAL 16 1 NBENFANT 18 1 NBCARTE 20 1 REMUN 21 7 EMPLOIGT 28 1 CARTEFID 30 1 EMPRUNT 32 1 RISQUE
15 Fichiers Excel ou Classeur Importation par index ou par nom (feuilles du classeur) Possibilité d extraire un intervalle de données : (A1:D150) Contrôler l arrêt de lecture dès détection d une ligne non renseignée 15
16 Sources de données Noeud SGBD SGBD Accès à l ODBC-Connecteur de base de données Toute la table ou SQL seulement Sélection des champs (filtrer tab) Examiner & manipuler la meta-donnée (types tab) 16
17 Sources de données Autres sources Fichier de données SPSS Fichier de données SAS Données définie par l utilisateur Fichiers de Excel 17
18 Champs Typer Typer Le nœud Typer permet de spécifier trois grandes catégories de propriétés : le type, la direction, les valeurs manquantes. Utilisé dans les modèles pour spécifier le rôle des champs Que prédire? Direction : IN, OUT ou Aucun 18
19 Champs Typer 21 Typer L auto-typage dans Modeler
20 22 Champs - Direction In Le champ est un input or variable indépendante pour un modèle Out Le champ est un ouput or variable dépendante pour un modèle Les deux Le champ est à la fois input et output Approprié seulement pour les règles d association Aucun Le champs n est pas à inclure dans le modèle
21 Travail pratique 2 Exploration des données SPSS Maghreb 23
22 Définir des données Manquantes Définir des données Manquantes Vérifier la qualité des données Utiliser un noeud Remplacer pour remplacer des valeurs Même lorsque les données sont complètes, les problèmes peuvent subsister Il existe deux types de valeur manquante dans Modeler Valeurs manquantes système. Également appelées valeurs nulles: ce sont des valeurs «non-chaîne» non renseignées. Les valeurs manquantes système sont affichées sous la forme $null$ dans Modeler. Valeurs manquantes utilisateur. Également appelées blancs, ce sont des valeurs, telles que inconnu, 99 ou 1 Vous pouvez déterminer comme blancs les valeurs système nulles et les blancs (valeurs sans caractère visible). Par défaut, si vous sélectionnez Définir les blancs, vous activez la vérification des valeurs nulles dans les champs, et des blancs dans les champs de type chaîne. SPSS Maghreb 24
23 Définir des données Manquantes Charger le fichier Exemple.sav et connectez-le avec un noeud Typer Editer le noeud Typer Sélectionner spécifier dans la colonne Manquant pour le champ Age SPSS Maghreb 25
24 Définir des données Manquantes Puisque nous utilisons un champ numérique, nous définissons des valeurs Blancs. La valeur Blanc est 99 D autres valeurs Blanc peuvent être ajoutées en dessous de la première ligne. SPSS Maghreb 26
25 Nœud Audit Attacher un noeud Audit au noeud Typer Editer le noeud Audit données SPSS Maghreb 27
26 Sortie du nœud AUDIT SPSS Maghreb 28
27 Vérification des Distributions Champ symbolique Proportion Présenter la proportion des données catégorielles Utilisation des couleurs pour la présentation de plusieurs variables Trier par ordre alphabétique ou par effectif Interactive sélectionner les valeurs & générer un noeud sélection SPSS Maghreb 29
28 30 Vérification des Distributions Champ symbolique Proportion
29 Vérification des Distributions Champ numérique 31
30 Noeud statistique Champ numérique (Noeud sortie) 32
31 33 Comparaison de moyennes de groupes indépendants : Moyennes Entre groupes au sein d un champs Entre paires de champs. Ces champs doivent être liés (ex: revenus avant et après une promotion)
32 34 Comparaison de moyennes de groupes indépendants : Moyennes Pour effectuer un test de comparaison de moyenne, il faudrait activer : Option avancée dans affichage Le test F est basé sur le rapport entre la variation inter groupes et la variation intra groupes. Plus le rapport est élevé et proche de 1 plus la variation entre les groupe est grande et plus la probabilité d une différence significative est forte. L importance = 1- P_value Ex: Puisque l importance de l age est grande, on rejette l égalité des moyenne des âges par tranche de risque. La différence est significative
33 Relation entre les Champs numériques Visualisation Nuage Nuage graphe de dispersion X/Y aussi en 3D Superposions des couleurs et autres options Créer les régions & générer les nœuds de sélection ou de calcul 35
34 Relation entre Champs numériques Visualisation Nuage Supposons vouloir visualiser la relation entre le nombre de cartes et Cartes de fidélité en prenant en considération la variable Risque Attacher un noeud Nuage après le noeud Typer Spécifier: Champ X = NBCARTS Champ Y = CARTFID Couleur = RISQUE 36
35 Relation entre un Champs numérique et symbolique histogramme 37
36 Corrélations Attacher le noeud Statistiques au noeud Typer 38
37 Gestion des données manquantes
38 40 Atelier 3 : Gestion des données manquantes Utilisation du nœud Audit des données pour générer les nœuds Filtrer et Sélectionner afin d inclure ou d exclure les enregistrements ou les champs présentant des informations manquantes ; Estimer les données manquantes avec le noeud Audit des données. Suppression des blancs grâce au nœud Remplacer ; Utilisation du nœud Typer pour rechercher automatiquement les blancs. Fournir une méthode pour la manipulation des données manquantes Data : customer_offers.sav qui contient des informations de clients d une société de télécommunications. Il contient des informations démographiques, les services de télécommunications utilisés, style de vie et des réponses pour trois types d offres de la compagnie.
39 41 Atelier 3 : Gestion des données manquantes : AUDIT 90% des champs sont complets et uniquement 51,78% des observations qui sont complètes pour chaque champ (total de 120).
40 42 Valeurs éloignées et extrêmes dans le nœud Qualité
41 43 Valeurs manquantes pour sexe et âge Sexe + 10% Age + 10% Ceci peut poser problème lors du développement de modèles : exemple régression linéaire ou logistique. Alors que les arbres de décision traitent les données MQ comme catégorie à part.
42 Valeurs manquantes pour sexe et âge 44
43 45 Sélection ou suppression de toutes les données manquantes Supprimer inclure
44 Utilisation de la sortie du nœud n AUDIT pour le remplacement des Manquants 6 champs dont le % invalides est sup. à 5% Copyright SPSS Maghreb 46
45 Utilisation de la sortie du nœud n AUDIT pour le remplacement des Manquants 6 champs dont le % invalides est sup. à 5% Le fichier de données ne contient pas de données manquantes Copyright SPSS Maghreb 47
46 Estimation des données manquantes : cas de variable qualitative Plusieurs méthodes permettent de faire ceci : une substitution par une valeur constante ou la création d un modèle pour prédire les valeurs manquantes. Le noeud Audit des données fournit plusieurs méthodes qu on testera dans cette partie. Q1 : à quel moment les données manquantes pourront être estimées? Réponse 1 : Quand les champs présentent plusieurs valeurs manquantes dans le fichier courant des données. Ex: on considère le champ gender. Q2 : Pouvons nous estimer le sexe d une personne lorsqu il est manquant en remplaçant ce champ par une constante (Male or Female)? Réponse 2 : Cette substitution serait une valeur incorrecte pour un bon nombre de clients. Néanmoins, il est possible de prédire le sexe d une personne en se basant sur le comportement des hommes et des femmes tenant compte d autres variables prédicatrices à l aide d un modèle de prévision ayant un degré de précision élevé. Copyright SPSS Maghreb 48
47 49 Estimation des données manquantes : cas de variable quantitative Q3 : Pouvons nous estimer le champ numérique income? Réponse 3 : la prédiction est possible partir d un ensemble de données démographiques tel que education, age, gender, homeownership, etc. Statistiquement, on arrive à substituer les données manquantes pour les champs numériques par : une moyenne, le mode ou des valeurs obtenues à partir d une distribution normale basée sur la moyenne et standard déviation des données non manquantes. Néanmoins, si une large proportion de données est manquante, l estimation des données manquantes n est pas garantie. Par exemple supposons que income est manquant pour 60% des observations ; plus que la moitié des données sont manquantes donc l estimation ne serait pas la méthode idéale. Il faut être vigilant. Lorsqu on substitue par la moyenne ou la médiane, la variance va être réduite artificiellement pour ce champ, ce qui peut interférer avec la construction du modèle en utilisant ce champ, donc vous devez utiliser une méthode qui aura moins d impact sur la variance.
48 50 Options d imputation d dans le nœud n Qualité Dans la colonne Attribuer une donnée manquante, plusieurs conditions de substitution sont offertes :
49 Options d imputation d dans le nœud n Qualité : Substitution uniforme de l âgel Estimation par une distribution uniforme plutôt que par la moyenne ou la médiane Copyright SPSS Maghreb 51
50 Pour garder les mêmes calculs, il faudrait rajouter un cache au super noeud 52 Estimation de l âge l par une distribution uniforme La distribution de l âge n est plus uniforme comme avant
51 53 Estimation du revenu par l algorithme l CART
52 54 Vérification automatique des valeurs manquantes du nœud n TYPER On remarque que le forçage a remplacé le champ income. Les valeurs qui sont supérieures à 100 sont exactement à 100. Peut être qu on n a pas fait de remplacement pour les observations avec des valeurs income $null$, car L option Définir les blancs est sélectionnée pour le champ income avec la case à cocher Null (par défaut). Ceci signifie que Clementine reconnaît la valeur $null comme une valeur définie et ainsi il ne l aperçoit pas comme valeur illégale non numérique. Pour observer ceci, vous pouvez décocher Définir les Blancs et exécuter la table par la suite.
53 Travail pratique 3 Manipulation des données 55
54 Manipulation des données Génération automatique d une sélection 56
55 Le langage CLEM Clementine Langage for Expression Manipulation Standard d écriture des expressions sous Clementine Générateur de formules Noms de champs, nom de champs composé, chaîne de caractères, nombre, [liste de valeurs] Fonctions: Arithmétique, comparaison, logique, types & conversions, trigonométriques, sur les bits, aléatoire, chaîne & caractère manipulation, nul et non renseigné Dates & heures: expression et valeur de temps Séquence pour manipuler les données ordonnées N est pas supportée par SQL 57
56 Le langage CLEM : les opérateurs 58
57 59 Générateur de Formules CLEM est utilisé dans les noeuds Calculer, Sélectionner, Equilibrer, Filtrer et Rapport Générateur de Formules évite le besoin d écrire les expressions CLEM.
58 Générateur de Formules 60
59 Manipulation des données Nœud Calculer Permet de créer six types différents de nouveaux champs Type 1 : Le nouveau champ est une formule Type 2 : le nouveau champ fait partie d un ensemble précis Type 3 : la valeur d 1 des 2 expressions, dépendante de la valeur de la condition. Type 4 : le champ résultant est Vrai ou Faux : une expression Type 5 : Le passage d 1 état à l autre est déclenché par des conditions spécifiques. Type 6 : Le nombre de fois où une condition spécifiée est vraie. Type 1 Type 2 Type 3 61
60 Manipulation des données Nœud Calculer Permet de créer six types différents de nouveaux champs Type 1 : Le nouveau champ est une formule Type 2 : le nouveau champ fait partie d un ensemble précis Type 3 : la valeur d 1 des 2 expressions, dépendante de la valeur de la condition. Type 4 : le champ résultant est Vrai ou Faux : une expression Type 5 : Le passage d 1 état à l autre est déclenché par des conditions spécifiques. Type 6 : Le nombre de fois où une condition spécifiée est vraie. Type 4 Type 5 Type 6 62
61 63 Manipulation des données Observation Filtrer Renommer des champs Sélectionner des champs pour l analyse
62 64 Manipulation des données Observation Echantillonnage Générer un échantillon de données (ou observations) Premiers N, 1-en-N, % aléatoire, taille maximal, graine aléatoire Echantionner
63 Manipulation des données Observation Agréger ger Agréger Agréger sur une ou plusieurs clés Somme, moyenne, max, min, et/ou écarttype de n importe quel champ numérique Comptage du nombre d observation dans un champs agrégé Cdr.dat : contient des données sur les appels mensuels des abonnés Custinfo.dat : contient des informations basiques sur les abonnés 65
64 Manipulation des données Observation Fusionner Fusionner Fusion des données Jointure dans la terminologie SQL Jointure Interne, complète, externe partielle ou/et anti-jointure 66
65 Manipulation des données Observation Autres nœuds Ajouter Ajouter 2 tables ou plus Traite la consistance du metadata Trier multiple clés Équilibrer copier ou supprimer aléatoirement selon des conditions utiliser pour corriger les déséquilibres dans les données Distinguer sélectionner une combinaison unique de clés 67
66 Manipulation des données Champs Autres nœuds Remplace les valeurs dans le/les champs sélectionner à partir d une condition Reclasser transforme un ensemble de valeurs discrètes en un autre Discrétiser Discrétiser une variable continue en variable catégorielle Binariser transformer des valeurs catégorielles en variable booléen Re-trier changer l ordre des champs 68
67 Travail pratique 4 Examen des relations entre les champs 69
68 Relation entre les Champs Matrice 70 Le test de Khi2 indique la probabilité pour que les modalités des deux variables ne soient pas liés. Puisque probabilité= 0,224 > 0,05 (donc grand écart) alors on ne rejette pas l hypothèse d indépendance au niveau 5%. Attention, le Khi2 n est pas fourni
69 71 Relation entre les Champs symboliques Visualisation Relations Relations Illustre la forces des relations entre les valeurs catégorielles Interactive sélectionner les observations à partir des liens, ou réarranger le graphe Relations orientées Plusieurs autres options i.e. Apparence du réseau : Connexions fortes (plus de 600 occurrences) apparaissent en trait fort.
70 Relation entre les Champs symboliques Visualisation Relations Relations Connexions fortes (plus de 600 occurrences) apparaissent en trait fort. 72
71 73 Relation entre les Champs symboliques Visualisation Relations Relations Le nœud Relations est un excellent outil d exploration des liaisons entre champs symboliques mais il ne peut être utilisé seul. Son utilisation est renforcée avec le nœud proportion. On pouvait croire, à partir du graphique relations qu il existait une forte liaison entre le risque et le sexe, alors que le nœud proportion montre qu il n existe aucune différence de distribution confirmée aussi par le test.
72 Comparaison de moyennes de groupes indépendants : Moyennes Entre groupes au sein d un champs Entre paires de champs. Ces champs doivent être liés (ex: revenus avant et après une promotion) 74
73 75 Comparaison de moyennes de groupes indépendants : Moyennes Pour effectuer un test de comparaison de moyenne, il faudrait activer : Option avancée dans affichage Le test F est basé sur le rapport entre la variation inter groupes et la variation intra groupes. Plus le rapport est élevé et proche de 1 plus la variation entre les groupe est grande et plus la probabilité d une différence significative est forte. L importance = 1- P_value Ex: Puisque l importance de l age est grande, on rejette l égalité des moyenne des âges par tranche de risque. La différence est significative
74 76 Relation entre les Champs numériques Visualisation Nuage graphe de dispersion X/Y aussi en 3D Superposions des couleurs et autres options Créer les régions & générer les nœuds de sélection ou de calcul Nuage
75 77 Relation entre Champs numériques Visualisation Nuage (Suite) Onglet Options Spécifier Agiter Spécifier Utiliser toutes les données Exécuter On sélectionne la région que vous estimez utile
76 78 Relation entre un Champs numérique et symbolique histogramme
77 Corrélations 79 Attacher le noeud Statistiques au noeud Typer
INTRODUCTION AU DATA MINING
INTRODUCTION AU DATA MINING 6 séances de 3 heures mai-juin 2006 EPF - 4 ème année - Option Ingénierie d Affaires et de Projets Bertrand LIAUDET TP DE DATA MINING Le TP et le projet consisteront à mettre
Traitement des données avec Microsoft EXCEL 2010
Traitement des données avec Microsoft EXCEL 2010 Vincent Jalby Septembre 2012 1 Saisie des données Les données collectées sont saisies dans une feuille Excel. Chaque ligne correspond à une observation
Business Intelligence
avec Excel, Power BI et Office 365 Téléchargement www.editions-eni.fr.fr Jean-Pierre GIRARDOT Table des matières 1 Avant-propos A. À qui s adresse ce livre?..................................................
Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS
Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence
Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring
Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems
Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI
1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage
Guide d exploration de base de données de IBM SPSS Modeler 15
Guide d exploration de base de données de IBM SPSS Modeler 15 Remarque : Avant d utiliser ces informations et le produit qu elles concernent, lisez les informations générales sous Remarques sur p.. Cette
Travailler avec les télécommunications
Travailler avec les télécommunications Minimiser l attrition dans le secteur des télécommunications Table des matières : 1 Analyse de l attrition à l aide du data mining 2 Analyse de l attrition de la
Sage 100 CRM Guide de l Import Plus avec Talend Version 8. Mise à jour : 2015 version 8
Sage 100 CRM Guide de l Import Plus avec Talend Version 8 Mise à jour : 2015 version 8 Composition du progiciel Votre progiciel est composé d un boîtier de rangement comprenant : le cédérom sur lequel
IBM SPSS Direct Marketing 21
IBM SPSS Direct Marketing 21 Remarque : Avant d utiliser ces informations et le produit qu elles concernent, lisez les informations générales sous Remarques sur p. 109. Cette version s applique à IBM SPSS
Data Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.
des des Data Mining Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne 2012-2013 1/65 des des 1 2 des des 3 4 Post-traitement 5 représentation : 6 2/65 des des Définition générale Le
La place de SAS dans l'informatique décisionnelle
La place de SAS dans l'informatique décisionnelle Olivier Decourt ABS Technologies - Educasoft Formations La place de SAS dans l'informatique décisionnelle! L'historique de SAS! La mécanique! La carrosserie
Business Intelligence avec Excel, Power BI et Office 365
Avant-propos A. À qui s adresse ce livre? 9 1. Pourquoi à chaque manager? 9 2. Pourquoi à tout informaticien impliqué dans des projets «BI» 9 B. Obtention des données sources 10 C. Objectif du livre 10
SAS ENTERPRISE MINER POUR L'ACTUAIRE
SAS ENTERPRISE MINER POUR L'ACTUAIRE Conférence de l Association des Actuaires I.A.R.D. 07 JUIN 2013 Sylvain Tremblay Spécialiste en formation statistique SAS Canada AGENDA Survol d Enterprise Miner de
Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données
Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données et le Data Mining Nous suivons le plan suivant : Fonctionnement de Spad Catalogue des méthodes (statistiques
Christophe CANDILLIER Cours de DataMining mars 2004 Page 1
Christophe CANDILLIER Cours de DataMining mars 2004 age 1 1. Introduction 2. rocessus du DataMining 3. Analyse des données en DataMining 4. Analyse en Ligne OLA 5. Logiciels 6. Bibliographie Christophe
Pentaho Business Analytics Intégrer > Explorer > Prévoir
Pentaho Business Analytics Intégrer > Explorer > Prévoir Pentaho lie étroitement intégration de données et analytique. En effet, les services informatiques et les utilisateurs métiers peuvent accéder aux
SPHINX Logiciel de dépouillement d enquêtes
SPHINX Logiciel de dépouillement d enquêtes sphinx50frversion4.doc 1 Les trois stades du SPHINX sont ceux que comporte habituellement toute enquête d opinion: Elaboration du questionnaire (fiche outil
SQL Server 2012 Implémentation d'une solution de Business Intelligence (Sql Server, Analysis Services...)
Avant-propos 1. À qui s'adresse ce livre? 15 2. Pré-requis 15 3. Objectifs du livre 16 4. Notations 17 Introduction à la Business Intelligence 1. Du transactionnel au décisionnel 19 2. Business Intelligence
Utiliser un tableau de données
Utiliser un tableau de données OBJECTIFS : - Définir une Base de Données. - Présentation : tableau de données. - Création d un tableau de données - Gestion d un tableau de données. - Trier et Filtrer des
Guide de l utilisateur de IBM SPSS Modeler 15
Guide de l utilisateur de IBM SPSS Modeler 15 Remarque : Avant d utiliser ces informations et le produit qu elles concernent, lisez les informations générales sous Remarques sur p. 272. Cette version s
BIRT (Business Intelligence and Reporting Tools)
BIRT (Business Intelligence and Reporting Tools) Introduction Cette publication a pour objectif de présenter l outil de reporting BIRT, dans le cadre de l unité de valeur «Data Warehouse et Outils Décisionnels»
Introduction aux outils BI de SQL Server 2014. Fouille de données avec SQL Server Analysis Services (SSAS)
MIT820: Entrepôts de données et intelligence artificielle Introduction aux outils BI de SQL Server 2014 Fouille de données avec SQL Server Analysis Services (SSAS) Description générale Ce tutoriel a pour
Introduction à la B.I. Avec SQL Server 2008
Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide
SharePoint (Toute la Gamme)... 1 Office 2010 (Toute la Gamme)... 2 OLAP (Toute la Gamme)... 2 STATISTICA Connecteur PI (Produit Complémentaire)...
SharePoint (Toute la Gamme)... 1 Office 2010 (Toute la Gamme)... 2 OLAP (Toute la Gamme)... 2 STATISTICA Connecteur PI (Produit Complémentaire)... 3 Introduction... 3 Échelle Interactive... 4 Navigation
Sommaire. BilanStat manuel de présentation et d utilisation Page 2
BilanStat-Audit Sommaire Présentation... 3 Chapitre 0 : Gestion des bases de données... 5 Chapitre 0 : Gestion des missions... 12 Chapitre 1 : Eléments généraux... 17 Chapitre 2 : Capitaux propres... 28
1 Modélisation d être mauvais payeur
1 Modélisation d être mauvais payeur 1.1 Description Cet exercice est très largement inspiré d un document que M. Grégoire de Lassence de la société SAS m a transmis. Il est intitulé Guide de démarrage
Accélérer l agilité de votre site de e-commerce. Cas client
Accélérer l agilité de votre site de e-commerce Cas client L agilité «outillée» devient nécessaire au delà d un certain facteur de complexité (clients x produits) Elevé Nombre de produits vendus Faible
SUGARCRM MODULE RAPPORTS
SUGARCRM MODULE RAPPORTS Référence document : SYNOLIA_Support_SugarCRM_Module_Rapports_v1.0.docx Version document : 1.0 Date version : 2 octobre 2012 Etat du document : En cours de rédaction Emetteur/Rédacteur
EXCEL PERFECTIONNEMENT SERVICE INFORMATIQUE. Version 1.0 30/11/05
EXCEL PERFECTIONNEMENT Version 1.0 30/11/05 SERVICE INFORMATIQUE TABLE DES MATIERES 1RAPPELS...3 1.1RACCOURCIS CLAVIER & SOURIS... 3 1.2NAVIGUER DANS UNE FEUILLE ET UN CLASSEUR... 3 1.3PERSONNALISER LA
Manipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner
Le cas Orion Star Manipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner Le cas Orion Star... 1 Manipulation de données avec SAS Enterprise Guide et modélisation
Travaux pratiques avec RapidMiner
Travaux pratiques avec RapidMiner Master Informatique de Paris 6 Spécialité IAD Parcours EDOW Module Algorithmes pour la Fouille de Données Janvier 2012 Prise en main Généralités RapidMiner est un logiciel
MASTER SIS PRO : logique et sécurité DÉTECTION D INTRUSIONS. Odile PAPINI, LSIS. Université de Toulon et du Var. papini@univ-tln.
MASTER SIS PRO : logique et sécurité DÉTECTION D INTRUSIONS Odile PAPINI, LSIS. Université de Toulon et du Var. [email protected] Plan Introduction Généralités sur les systèmes de détection d intrusion
MAÎTRISE DE L ENVIRONNEMENT WINDOWS VISTA
MAÎTRISE DE L ENVIRONNEMENT WINDOWS VISTA OBJECTIFS : manipuler les fenêtres et l environnement Windows, gérer ses fichiers et dossiers, lancer les applications bureautiques présentes sur son poste. PUBLIC
CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE. Edition 2012
CATALOGUE DE FORMATIONS BUSINESS INTELLIGENCE Edition 2012 AGENDA Qui sommes nous? Présentation de Keyrus Keyrus : Expert en formations BI Nos propositions de formation 3 modes de formations Liste des
Peut être utilisée à l intérieur du site où se trouve la liste de référence.
Peut être utilisée dans tous les sites d une collection, si la colonne est créée au niveau du site parent. Peut être utilisée à l intérieur du site où se trouve la liste de référence. Peut être utilisée
Manuel d utilisation de la base de données nationale sur la situation de l enfance en Tunisie CHILDINFO 6.0
2010 Manuel d utilisation de la base de données nationale sur la situation de l enfance en Tunisie CHILDINFO 6.0 Observatoire d Information, de Formation, de Documentation et d Etudes pour la Protection
Extraction d informations stratégiques par Analyse en Composantes Principales
Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 [email protected] 1 Introduction
Créer le schéma relationnel d une base de données ACCESS
Utilisation du SGBD ACCESS Polycopié réalisé par Chihab Hanachi et Jean-Marc Thévenin Créer le schéma relationnel d une base de données ACCESS GENERALITES SUR ACCESS... 1 A PROPOS DE L UTILISATION D ACCESS...
Date M.P Libellé Catégorie S.Catégorie Crédit Débit Solde S.B
Excel : Réalisation d un classeur Compta Saisir les étiquettes Renommer la première feuille Compta Laisser la première ligne vide et sur la deuxième ligne saisir les étiquettes Se placer sur A2 et saisir
Fournir un accès rapide à nos données : agréger au préalable nos données permet de faire nos requêtes beaucoup plus rapidement
Introduction Phases du projet Les principales phases du projet sont les suivantes : La mise à disposition des sources Des fichiers Excel sont utilisés pour récolter nos informations L extraction des données
Introduction au datamining
Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des
Administration du site (Back Office)
Administration du site (Back Office) A quoi sert une interface d'administration? Une interface d'administration est une composante essentielle de l'infrastructure d'un site internet. Il s'agit d'une interface
TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.
STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,
Didacticiel Études de cas. Description succincte de Pentaho Data Integration Community Edition (Kettle).
1 Objectif Description succincte de Pentaho Data Integration Community Edition (Kettle). L informatique décisionnelle («Business Intelligence BI» en anglais, ça fait tout de suite plus glamour) fait référence
http://mondomaine.com/dossier : seul le dossier dossier sera cherché, tous les sousdomaines
Principales fonctionnalités de l outil Le coeur du service suivre les variations de position d un mot-clé associé à une URL sur un moteur de recherche (Google - Bing - Yahoo) dans une locale (association
SUPPORT DE COURS ACCESS 2010
Qu est-ce qu Access? Access 2010 est un outil de déploiement et de conception d application de base de données que vous pouvez utiliser pour effectuer le suivi d informations importantes. Vous pouvez conserver
ERGONOMIE GESTION DES DONNEES CLIENT. Gestion données client Vue 360 (Obligatoire) Données récupérées. Données calculées
ERGONOMIE Fonctionnalités Standard Dev Spécifique Non-couverte la solution propose une aide en ligne (multilingue, contextuelle, Accès par touche/clic, messages d' erreurs explicites, Accès au manuel utilisateur)
Easy to. report. Connexion. Transformation. Stockage. Construction. Exploitation. Diffusion
M y R e p o r t, L A S O L U T I O N R E P O R T I N G D E S U T I L I S AT E U R S E X C E L Connexion Transformation Stockage Construction Exploitation Diffusion OBJECTIF REPORTING : De la manipulation
Février 2007. Novanet-IS. Suite progicielle WEB pour l Assurance. Description fonctionnelle
Novanet Février 2007 Novanet-IS Suite progicielle WEB pour l Assurance Description fonctionnelle Novanet-IS Description fonctionnelle 1 Définition 3 2 La production (module WEBACTION) 6 3 Relation Client
NOTE SUR LA MODELISATION DU RISQUE D INFLATION
NOTE SUR LA MODELISATION DU RISQUE D INFLATION 1/ RESUME DE L ANALYSE Cette étude a pour objectif de modéliser l écart entre deux indices d inflation afin d appréhender le risque à très long terme qui
Annexe commune aux séries ES, L et S : boîtes et quantiles
Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans
Table des matières. I Mise à niveau 11. Préface
Table des matières Préface v I Mise à niveau 11 1 Bases du calcul commercial 13 1.1 Alphabet grec...................................... 13 1.2 Symboles mathématiques............................... 14 1.3
KIELA CONSULTING. Microsoft Office Open Office Windows - Internet. Formation sur mesure
KIELA CONSULTING Microsoft Office Open Office Windows - Internet Formation sur mesure Bureautique L outil informatique et la bureautique sont devenus quasiment incontournables quelque soit votre métier
Localisation des fonctions
MODALISA 7 Localisation des fonctions Vous trouverez dans ce document la position des principales fonctions ventilées selon l organisation de Modalisa en onglets. Sommaire A. Fonctions communes à tous
Installation Client (licence réseau) de IBM SPSS Modeler 14.2
Installation Client (licence réseau) de IBM SPSS Modeler 14.2 Les instructions suivantes permettent d installer IBM SPSS Modeler Client version 14.2 en utilisant un licence réseau. Ce présent document
TD3 - Facturation avec archivage automatisé
TD3 - Facturation avec archivage automatisé Objectifs Insérer les formules nécessaires aux calculs d une facture. Créer une macro- commande avec l enregistreur de macros et l affecter à un bouton. Utiliser
Excel 2007 Niveau 3 Page 1 www.admexcel.com
Excel 2007 Niveau 3 Page 1 TABLE DES MATIERES UTILISATION DE LISTES DE DONNEES... 4 REMARQUES PREALABLES SUR LES LISTES DE DONNEES... 4 METTRE EN FORME LE TABLEAU... 6 METTRE LA LISTE A JOUR... 7 a/ Directement
Tutoriel D utilisation. Du PGI Open line d EBP
Tutoriel D utilisation Du PGI Open line d EBP Tutoriel d utilisation du PGI EBP Open line - [email protected] LP Les charmilles / Mission TICE Page 1/64 Table des matières Première
SOMMAIRE. 1. Préambule...2. 2. Le calendrier...2. 3. Trajectoire d un objet lancé...6. 4. Régression linéaire...9
SOMMAIRE 1. Préambule...2 2. Le calendrier...2 3. Trajectoire d un objet lancé...6 4. Régression linéaire...9 5. Calcul de commissions par tranches...12 6. Base de données...16 7. Valeur cible...19 ATTENTION
Agenda de la présentation
Le Data Mining Techniques pour exploiter l information Dan Noël 1 Agenda de la présentation Concept de Data Mining ou qu est-ce que le Data Mining Déroulement d un projet de Data Mining Place du Data Mining
Bio-Rad Laboratories CONTRÔLE DE QUALITÉ. Le logiciel de Bio-Rad pour une gestion experte du contrôle de qualité
Bio-Rad Laboratories CONTRÔLE DE QUALITÉ Le logiciel de Bio-Rad pour une gestion experte du contrôle de qualité CONTRÔLE DE QUALITÉ 1 Unity Real Time 2.0 Unity Real Time 2.0 est un logiciel pour la gestion
Initiation à LabView : Les exemples d applications :
Initiation à LabView : Les exemples d applications : c) Type de variables : Créer un programme : Exemple 1 : Calcul de c= 2(a+b)(a-3b) ou a, b et c seront des réels. «Exemple1» nom du programme : «Exemple
Évaluation des compétences. Identification du contenu des évaluations. Septembre 2014
Identification du contenu des évaluations Septembre 2014 Tous droits réservés : Université de Montréal Direction des ressources humaines Table des matières Excel Base version 2010... 1 Excel intermédiaire
Utiliser Access ou Excel pour gérer vos données
Page 1 of 5 Microsoft Office Access Utiliser Access ou Excel pour gérer vos données S'applique à : Microsoft Office Access 2007 Masquer tout Les programmes de feuilles de calcul automatisées, tels que
Catalogue Formation «Vanilla»
Catalogue Formation «Vanilla» Date : octobre 2009 Table des matières Liste des Formations...2 Contenu des formations...3 Vanilla FastTrack...3 Vanilla Architecture...5 Enterprise Services...6 BIPortail...7
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
GUIDE Excel (version débutante) Version 2013
Table des matières GUIDE Excel (version débutante) Version 2013 1. Créer un nouveau document Excel... 3 2. Modifier un document Excel... 3 3. La fenêtre Excel... 4 4. Les rubans... 4 5. Saisir du texte
MYXTRACTION. 2009 La Business Intelligence en temps réel
MYXTRACTION 2009 La Business Intelligence en temps réel Administration Qui sommes nous? Administration et management des profils Connecteurs Base des données Gestion des variables et catégories de variables
Installation de CPA STUDIO :
Installation de CPA STUDIO : Système d exploitation requis : Windows 98 2ème édition Windows XP service pack 2 Résolution écran - Nombre de couleurs : CPA STUDIO nécessite une résolution minimum d affichage
GUIDE D UTILISATION DU CENTRE DE DONNÉES DE L ISU
GUIDE D UTILISATION DU CENTRE DE DONNÉES DE L ISU Table des matières Page I. DÉMARRER... 4 1. Comment accéder au Centre de données de l ISU?... 4 2. Quels sont les types de tableaux statistiques disponibles
Guide utilisateur i-milo >> Décisionnel
Guide utilisateur i-milo >> Décisionnel Suivi des changements Version Date Chapitres impactés Opération effectuées sur le document 01 28/02/2014 Tous Initialisation du document pour les utilisateurs Contact
PRODIGE V3. Manuel utilisateurs. Consultation des métadonnées
PRODIGE V3 Manuel utilisateurs Consultation des métadonnées Pour plus d'information sur le dispositif : à remplir par chaque site éventuellement 2 PRODIGE V3 : Consultation des métadonnées SOMMAIRE 1.
Reconstruction de bâtiments en 3D à partir de nuages de points LIDAR
Reconstruction de bâtiments en 3D à partir de nuages de points LIDAR Mickaël Bergem 25 juin 2014 Maillages et applications 1 Table des matières Introduction 3 1 La modélisation numérique de milieux urbains
SharePoint Foundation 2013 Construire un intranet collaboratif en PME (édition enrichie de vidéos)
Présentation des technologies SharePoint 1. Introduction 19 2. Enjeux 20 3. Les pièges à éviter 22 4. Présentation technologique 22 4.1 Historique 23 4.2 Briques fonctionnelles et comparatif des éditions
Excel Avancé. Plan. Outils de résolution. Interactivité dans les feuilles. Outils de simulation. La valeur cible Le solveur
Excel Avancé Plan Outils de résolution La valeur cible Le solveur Interactivité dans les feuilles Fonctions de recherche (ex: RechercheV) Utilisation de la barre d outils «Formulaires» Outils de simulation
Note de cours. Introduction à Excel 2007
Note de cours Introduction à Excel 2007 par Armande Pinette Cégep du Vieux Montréal Excel 2007 Page: 2 de 47 Table des matières Comment aller chercher un document sur CVMVirtuel?... 8 Souris... 8 Clavier
Introduction à Microsoft InfoPath 2010
Introduction à Microsoft InfoPath 2010 Couplé à Microsoft SharePoint Designer 2010, InfoPath 2010 simplifie la création de solutions de bout en bout sur SharePoint Server 2010, qui contiennent des formulaires
Database Manager Guide de l utilisateur DMAN-FR-01/01/12
Database Manager Guide de l utilisateur DMAN-FR-01/01/12 Les informations contenues dans le présent manuel de documentation ne sont pas contractuelles et peuvent faire l objet de modifications sans préavis.
EXCEL TUTORIEL 2012/2013
EXCEL TUTORIEL 2012/2013 Excel est un tableur, c est-à-dire un logiciel de gestion de tableaux. Il permet de réaliser des calculs avec des valeurs numériques, mais aussi avec des dates et des textes. Ainsi
Méthode de préparation du fichier texte d import depuis Excel, via Access jusqu à Drupal.
IMPORT SCROL vous invite fortement à lui confier cette tâche pour vous décharger de toute responsabilité dans le cas d'un import manqué. Si vous confiez à SCROL vos nouvelles données (souches, images,
Guide utilisateur i-milo >> Décisionnel
Guide utilisateur i-milo >> Décisionnel Suivi des changements Version Date Chapitres impactés Opération effectuées sur le document 01 28/02/2014 Tous Initialisation du document pour les utilisateurs avancés
Manuel du gestionnaire
Manuel du gestionnaire ENT MESTEK v.2010 Ce manuel s adresse à l équipe administrative d un établissement scolaire : principal, principal adjoint, secrétaires dans un collège, proviseur, proviseur adjoint,
PRODIGE V3. Manuel utilisateurs. Consultation des métadonnées
PRODIGE V3 Manuel utilisateurs Consultation des métadonnées Pour plus d'information sur le dispositif : à remplir par chaque site éventuellement 2 PRODIGE V3 : Consultation des métadonnées SOMMAIRE 1.
Présentation du module Base de données spatio-temporelles
Présentation du module Base de données spatio-temporelles S. Lèbre [email protected] Université de Strasbourg, département d informatique. Partie 1 : Notion de bases de données (12,5h ) Enjeux et principes
4. Utilisation d un SGBD : le langage SQL. 5. Normalisation
Base de données S. Lèbre [email protected] Université de Strasbourg, département d informatique. Présentation du module Contenu général Notion de bases de données Fondements / Conception Utilisation :
INSERER DES OBJETS - LE RUBAN INSERTION... 3 TABLEAUX
TABLE DES MATIERES Livret Utilisateur Excel 2007 Niveau 2 INSERER DES OBJETS - LE RUBAN INSERTION... 3 TABLEAUX... 4 Les tableaux croisés dynamiques... 4 Création d un tableau croisé... 5 Comparer des
Initiation à Excel. Frédéric Gava (MCF) [email protected]
Initiation à Excel Frédéric Gava (MCF) [email protected] LACL, bâtiment P2 du CMC, bureau 221 Université de Paris XII Val-de-Marne 61 avenue du Général de Gaulle 94010 Créteil cedex Plan de cette année
FEN FICHE EMPLOIS NUISANCES
Version 4.8.2 Date mise à jour : 19 Février 2013 Auteur : LAFUMA Gilles Email : [email protected] Web : www.procarla.fr/soft Présentation : FEN FICHE EMPLOIS NUISANCES Le Logiciel FEN Fiche emploi nuisance
Statistiques Descriptives à une dimension
I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des
Introduction à Business Objects. J. Akoka I. Wattiau
Introduction à Business Objects J. Akoka I. Wattiau Introduction Un outil d'aide à la décision accès aux informations stockées dans les bases de données et les progiciels interrogation génération d'états
Statistiques Appliquées à l Expérimentation en Sciences Humaines. Christophe Lalanne, Sébastien Georges, Christophe Pallier
Statistiques Appliquées à l Expérimentation en Sciences Humaines Christophe Lalanne, Sébastien Georges, Christophe Pallier Table des matières 1 Méthodologie expérimentale et recueil des données 6 1.1 Introduction.......................................
Définir la gestion de projets 11. Exploiter les techniques de gestion de projets 11. Planifier un projet 12. Lister les tâches et les jalons 13
Généralités Définir la gestion de projets 11 Exploiter les techniques de gestion de projets 11 Planifier un projet 12 Lister les tâches et les jalons 13 Réfléchir aux liaisons entre les tâches 14 Estimer
SAP BusinessObjects Web Intelligence (WebI) BI 4
Présentation de la Business Intelligence 1. Outils de Business Intelligence 15 2. Historique des logiciels décisionnels 16 3. La suite de logiciels SAP BusinessObjects Business Intelligence Platform 18
Introduction : présentation de la Business Intelligence
Les exemples cités tout au long de cet ouvrage sont téléchargeables à l'adresse suivante : http://www.editions-eni.fr Saisissez la référence ENI de l'ouvrage RI3WXIBUSO dans la zone de recherche et validez.
TABLE DES MATIERES. C Exercices complémentaires 42
TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence
Parcours FOAD Formation EXCEL 2010
Parcours FOAD Formation EXCEL 2010 PLATE-FORME E-LEARNING DELTA ANNEE SCOLAIRE 2013/2014 Pôle national de compétences FOAD Formation Ouverte et A Distance https://foad.orion.education.fr Livret de formation
Big Data et Graphes : Quelques pistes de recherche
Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université
