Fouille de données: Explora2on des données. Translated from Lecture Notes for Chapter 3 Introduc2on to Data Mining Tan, Steinbach, Kumar
|
|
- Adélaïde Cardinal
- il y a 8 ans
- Total affichages :
Transcription
1 Fouille de données: Explora2on des données Translated from Lecture Notes for Chapter 3 Introduc2on to Data Mining Tan, Steinbach, Kumar
2 Qu est ce que l explora2on des données? Une étude préliminaire des données pour mieux comprendre leurs caractéris2ques Mo2va2on principale Aider à sélec2onner les bons ou2ls pour le prétraitement ou l analyse U2liser les capacités humaines à reconnaître des paoerns Les personnes peuvent reconnaître des paoerns que les ou2ls d analyse de données ne trouvent pas Lié au domaine de l Exploratory Data Analysis (EDA)
3 Techniques u2lisées dans l explora2on des données À l origine, dans l EDA L accent était mis sur la visualisa2on Le clustering et la détec2on d anomalies étaient vues comme des techniques exploratoires En fouille de données, le clustering et l a détec2on d anomalies sont des domaines majeurs, et ne font pas uniquement par2e de la phase d explora2on Dans ce cours, nous allons nous concentrer sur Les sta2s2ques de résumé La visualisa2on Les techniques de traitement analy2que en ligne (Online Analy2cal Processing, OLAP)
4 L exemple du jeu de données Iris De nombreuses techniques d explora2on des données peuvent être illustrées sur ce jeu de données (disponible en ligne) 3 types de fleurs (classes) Setosa Virginica Versicolour 4 aoributs (non classes) Longueur et largeur des sépales Longueur et largeur des pétales Virginica. Robert H. Mohlenbrock. USDA NRCS Northeast wetland flora: Field office guide to plant species. Northeast National Technical Center, Chester, PA. Courtesy of USDA NRCS Wetland Science Institute.
5 Sta2s2ques de résumé Les sta2s2ques de résumé sont des nombres qui résument les propriétés des données Les résumés de propriétés incluent la fréquence, la localisa2on et l étendue Exemples: localisa2on = moyenne étendue = écart type La majorité des résumés peuvent être calculés en une passe sur les données
6 Fréquence et mode La fréquence d une valeur d aoribut est le pourcentage du temps que ceoe valeur est présente dans le jeu de données Ex: pour l aoribut «sexe» et une popula2on représenta2ve, le sexe «féminin» est présent environ 50% du temps Le mode d un aoribut est la valeur la plus fréquente de cet aoribut Les no2ons de fréquence et de modes sont principalement u2liser avec des catégories
7 Cen2le Pour les données con2nues, la no2on de cen2le est plus u2le Étant donné un aoribut x ordinal ou con2nu et un nombre p entre 0 et 100, le p ième cen2le est la valeur x p de x tel que p% des valeurs observées de x sont inférieures à x p. Par exemple le 50 ième cen2le est la valeur x 50% telle que 50% de toutes les valeurs de x sont inférieures à x 50%
8 Mesures de localisa2on: moyenne et médiane La moyenne est la mesure la plus courante pour déterminer la localisa2on d un ensemble de points Cependant, la moyenne est très sensibles aux anomalies (valeurs aberrantes) Par conséquent, la médiane, ou la moyenne ajustées sont aussi souvent u2lisées
9 Mesures d étendue: amplitude et variance L amplitude est la différence entre le minimum et le maximum La variance, ou écart type, est l écart le plus fréquemment mesuré dans un ensemble de points Cependant, ceoe mesure est également sensible aux valeurs aberrantes, donc d autres mesures sont souvent u2lisées
10 Visualisa2on La visualisa2on est la transforma2on des données en un format visuel ou un tableau de façon à ce que les caractéris2ques des données et les rela2ons entre les objets ou aoributs puissent être analysés ou rapportés La visualisa2on des données est une des techniques les plus efficaces et afrantes pour l explora2on des données Les hommes ont la capacité visuelle d analyser de grandes quan2tés de données Il est possible de détecter des paoerns / tendances On peut détecter les anomalies ou paoerns inhabituels
11 Exemple: Température à la surface de la mer Des dizaines de milliers de points de données résumés en une seule figure
12 Représenta2on C est la traduc2on d une informa2on en un format visuel Les objets de données, leurs aoributs et les rela2ons entre les objets sont traduits en éléments graphiques comme des lignes, des formes et des couleurs Exemple: Les objets sont souvent représentés par des points Les valeurs d aoributs peuvent être représentées comme la posi2on des points, ou leurs caractéris2ques (couleur, forme, taille) Si la posi2on est u2lisée, alors les rela2ons entre les points (clusters? Anomalies?) sont faciles à détecter
13 Arrangement C est le placement des éléments dans la visualisa2on Peut avoir un impact important dans la compréhension des données Exemple:
14 Sélec2on C est l élimina2on ou la désaccentua2on de certains objets ou aoributs La sélec2on peut consister à choisir un sous ensemble d aoributs La réduc2on de dimension est souvent u2lisée pour réduire le nombre de dimensions à 2 ou 3 On peut également travailler sur des pairs d aoributs La sélec2on peut également être le choix d un sous ensemble d objets Une zone de l écran ne peut afficher qu un nombre limité de points On peut faire un échan2llonnage, mais on veut souvent préserver les points des zones à faible densité
15 Techniques de visualisa2on: histogrammes Histogramme Souvent u2liser pour voir la distribu2on des valeurs d une variable Divise les valeurs en classes et affiche une barre indiquant le nombre d objets dans chaque classe La hauteur de la barre indique le nombre d objets La forme de l histogramme dépend du nombre de classes Exemple: largeur des pétales (10 et 20 classes)
16 Histogrammes en 2 dimensions Montre la distribu2on jointe de 2 aoributs Exemple: largeur et longueur de pétales Quelle informa2on ob2ent on de ceoe figure?
17 Techniques de visualisa2on boîte à moustaches (box plot) Boîte à moustaches Une autre façon d afficher la distribu2on des données outlier 10 th percen2le 75 th percen2le 50 th percen2le 25 th percen2le 10 th percen2le
18 Exemple de boîte à moustaches U2lisées pour comparer des aoributs
19 Techniques de visualisa2on nuage de points (scaoer plot) Nuage de points Les valeurs des aoributs déterminent la posi2on Les nuages en 2 dimensions sont les plus courants, mais il est possible d u2liser 3 dimensions Souvent, les autres aoributs peuvent être affichés en u2lisant la taille, la forme ou la couleur du marqueur représentant l objet On peut u2liser plusieurs nuages de points pour résumer de façon compacte les rela2ons entre plusieurs paires d aoributs
20 Nuage de points sur les aoributs d Iris
21 Techniques de visualisa2on isoligne (contour plots) Isoligne U2le quand un aoribut con2nu est mesuré dans un espace spa2al Par22onne le plan en régions de valeurs similaires Les isolignes forment des fron2ères entre les régions en connectant les points de valeur égale L exemple le plus courant est celui des cartes de relief Souvent u2lisé en météo (température, précipita2ons, pression )
22 Isoligne Celsius
23 Techniques de visualisa2on Affichage en matrice affichage en matrice U2le pour afficher une matrice de données U2le quand les objets sont triés par classe En général, les aoributs sont normalisés pour éviter qu un aoribut domine la représenta2on Les affichages de matrices de similarité ou de distance peuvent aussi permeore de voir les rela2ons entre objets
24 Visualisa2on en matrice du jeu de données Iris standard devia2on
25 Visualisa2on en matrice de corréla2on du jeu de données Iris
26 Techniques de visualisa2on Coordonnées parallèles Coordonnées parallèles U2lisé pour afficher les valeurs de données ayant beaucoup de dimensions Au lieu d u2liser des axes perpendiculaires, on u2lise des axes parallèles Les valeurs d aoributs de chaque objet sont affichées en tant que point sur chaque axe d aoribut et les points sont connectés par une ligne Donc chaque objet est une ligne Souvent, les lignes représentant une classe d objets dis2ncte sont groupées ensemble L ordre des aoributs est important pour voir ces groupes
27 Coordonnées parallèles
28 Autres techniques de visualisa2on Affichage en étoile Similaire aux coordonnées parallèles, mais les axes partent d un point central La ligne connectant les valeurs d un objet forme un polygone Figures de Chernoff CeOe approche associe chaque aoribut à une caractéris2que de visage La valeur de chaque aoribut détermine l apparence du visage Chaque objet est un visage séparé CeOe méthode s appuie sur la capacité des hommes à dis2nguer les visages
29 Affichage en étoile pour les données Iris Setosa Versicolour Virginica
30 Figures de Chernoff pour les données Iris Setosa Versicolour Virginica
31 OLAP On- line Analy2cal Processing (OLAP), proposé par E. F. Codd, le créateur des bases de données rela2onnelles Les BDD rela2onnelles placent les données dans des tables, OLAP u2lise un tableau mul2dimensionnel De nombreuses opéra2ons d analyse de données et d explora2on de données sont plus faciles à exécuter avec ce type de représenta2on
32 Créa2on d un tableau mul2dimensionnel 2 étapes pour conver2r un tableau de données en tableau mul2dimensionnel 1. Iden2fier quels aoributs deviendront les dimensions et quels aoributs seront les cibles dont la valeur apparaîtra dans le tableau Les aoributs u2lisés comme dimensions doivent avoir des valeurs discrètes Les aoributs cibles sont souvent con2nues, ou un comptage (ex: nombre d occurrences d un mot) On peut aussi ne pas avoir d aoribut cible, et dans ce cas le tableau con2ent le nombre d objets qui ont les mêmes valeurs d aoributs 2. Trouver la valeur de chaque entrée du tableau mul2dimensionnel en addi2onnant les valeurs (de l aoribut cible) ou en comptant le nombre d objets qui ont les aoributs correspondant à ceoe entrée
33 Exemple: donnée Iris Conversion des aoributs longueur/largeur des pétales et espèce peuvent être conver2s en tableau mul2dimensionnel 1. On discré2se la largeur des pétales et la longueur pour avoir des valeurs de catégorie: pe2t, moyen et grand 2. On ob2ent le tableau suivant
34 Exemple: donnée Iris Chaque combinaison de taille de pétale, largeur de pétale et espèce correspond à une entrée dans le tableau CeOe élément correspond a nombre d objets correspondant
35 Exemple: donnée Iris On peut afficher des par2es du tableau mul2dimensionnel à travers un tableau croisé Que ces tableaux nous indiquent- ils?
36 OLAP: cube de données L opéra2on clé de l OLAP est la forma2on d un cube de données Un cube de données est une représenta2on mul2dimensionnelle des données, avec toutes les possibilités d agréga2on Par toutes les possibilités d agréga2on, on entend les agréga2ons formées d une sélec2on d un sous ensemble de dimensions avec une somme sur les dimensions restantes Par exemple, si on choisit les espèces comme dimension dans les données Iris et qu on somme sur les autres dimensions, le résultat est une entrée unidimensionnelle avec 3 entrées, donnant le nombre de fleurs de chaque race
37 Exemple de cube de données Données enregistrant les ventes de produits dans plusieurs magasin sur plusieurs dates Ces données peuvent être représentées par un tableau à 3 dimensions Il y a 3 agrégats en 2 dimensions, 3 en 1dimension et 1 en 0 dimensions (le total)
38 Exemple de cube de données Le tableau suivant montre 1 des 2 agrégats 2 dimensions, ainsi que 2 des agrégats à 1 dimension et le total global
39 OLAP: slicing & dicing Le slicing est la sélec2on d un groupe de cellules depuis le tableau mul2dimensionnel en spécifiant une valeur pour une des dimensions Le dicing est la sélec2on d un groupe de cellules en spécifiant un intervalle de valeurs d aoributs En pra2que, ces 2 opéra2ons peuvent être combinées avec une agréga2on suivant des dimensions
40 OLAP: roll- up & drill- down Les valeurs d aoributs ont souvent une structure hiérarchique Chaque date est associée à une semaine, un mois, une année Chaque localisa2on a une ville, une région, un pays Les produits peuvent être divisés en catégories comme vêtements, électronique, meubles Ces catégories forment souvent un arbre
41 OLAP: roll- up & drill- down CeOe structure hiérarchique permet les opéra2ons de roll- up et de drill- down Pour les ventes, on peut agréger (roll up) les ventes par mois Inversement, on peut augmenter le niveau de précision (drill down) en passant de catégories de produits au détail des produits
Collabora'on IRISA/INRA sur le transfert de nitrates et l améliora'on de la qualité des eaux des bassins versants:
Collabora'on IRISA/INRA sur le transfert de nitrates et l améliora'on de la qualité des eaux des bassins versants: Tassadit BOUADI 22 Juin 2010, Saint Jacut 1 Plan Introduc
Plus en détailEntrepôt de données et l Analyse en ligne. Maguelonne Teisseire Hugo Alatrista Salas hugo.alatrista- salas@teledetec9on.fr Flavien Bouillot
Entrepôt de données et l Analyse en ligne Maguelonne Teisseire Hugo Alatrista Salas hugo.alatrista- salas@teledetec9on.fr Flavien Bouillot Déroulement du cours 17 janvier : cours et TD 20 janvier : cours?
Plus en détailMTI820 Entrepôts de données et intelligence d affaires. Les applica+ons de BI
MTI820 Entrepôts de données et intelligence d affaires Les applica+ons de BI Département de génie logiciel et des TI MTI820 Hiver 2011 S. ChaEi, C. Desrosiers 1 Le cycle de vie d un projet en BI Diagramme
Plus en détailÉvolu>on et maintenance
IFT3912 Développement et maintenance de logiciels Évolu>on et maintenance Bruno Dufour Université de Montréal dufour@iro.umontreal.ca Modifica>on des logiciels Les modifica>ons sont inévitables Des nouveaux
Plus en détailLes 10 étapes clés pour trouver des clients par internet
Les 10 étapes clés pour trouver des clients par internet Guide pour les entreprises de Home Staging 1 L auteur : Adrian Measures Adrian Measures est responsable du marke@ng sur internet et fondateur de
Plus en détailInfolettre #18 : Les graphiques avec Excel 2010
Infolettre #18 : Les graphiques avec Excel 2010 Table des matières Introduction... 1 Hourra! Le retour du double-clic... 1 Modifier le graphique... 4 Onglet Création... 4 L onglet Disposition... 7 Onglet
Plus en détailTraitement des données avec Microsoft EXCEL 2010
Traitement des données avec Microsoft EXCEL 2010 Vincent Jalby Septembre 2012 1 Saisie des données Les données collectées sont saisies dans une feuille Excel. Chaque ligne correspond à une observation
Plus en détailPlan. Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation
Data WareHouse Plan Introduction Eléments de la théorie des systèmes d'informations Les entrepôts de données (Datawarehouse) Les datamart Architecture Modélisation 2 Présentation Besoin: prise de décisions
Plus en détaildonnées en connaissance et en actions?
1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)
Plus en détailSÉLECTIONNER LES MEILLEURS CANDIDATS : L APPORT DES OUTILS D ÉVALUATION AU RECRUTEMENT ET À LA MOBILITÉ INTERNE
PARTENAIRE RESSOURCES HUMAINES SÉLECTIONNER LES MEILLEURS CANDIDATS : L APPORT DES OUTILS D ÉVALUATION AU RECRUTEMENT ET À LA MOBILITÉ INTERNE PROGRAMME Il est primordial pour une organisation de savoir
Plus en détailStatistiques Descriptives à une dimension
I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des
Plus en détailChapitre IX. L intégration de données. Les entrepôts de données (Data Warehouses) Motivation. Le problème
Chapitre IX L intégration de données Le problème De façon très générale, le problème de l intégration de données (data integration) est de permettre un accès cohérent à des données d origine, de structuration
Plus en détailEntrepôt de données 1. Introduction
Entrepôt de données 1 (data warehouse) Introduction 1 Présentation Le concept d entrepôt de données a été formalisé pour la première fois en 1990 par Bill Inmon. Il s agissait de constituer une base de
Plus en détailObjectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique
Objectifs Clustering On ne sait pas ce qu on veut trouver : on laisse l algorithme nous proposer un modèle. On pense qu il existe des similarités entre les exemples. Qui se ressemble s assemble p. /55
Plus en détailMTI820 Entrepôts de données et intelligence d affaires. Gouvernance des données et ges1on des données de référence
MTI820 Entrepôts de données et intelligence d affaires Gouvernance des données et ges1on des données de référence 1 La gouvernance des données Défini1on: «Processus de supervision et de décision qui permet
Plus en détailLA DIGITALISATION DE LA RELATION CLIENT
PARTENAIRES ENTREPRISE ET TRANSFORMATION DIGITALE LA DIGITALISATION DE LA RELATION CLIENT PROGRAMME Face à la mulplicaon des canaux digitaux de communicaon, à l évoluon des comportements des clients et
Plus en détailMe#re le Big Data sur la carte : défis et avenues rela6fs à l exploita6on de la localisa6on
Me#re le Big Data sur la carte : défis et avenues rela6fs à l exploita6on de la localisa6on Thierry Badard, PhD, ing. jr Centre de Recherche en Géoma6que Conférence ITIS - Big Data et Open Data au coeur
Plus en détailLogiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS
Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence
Plus en détailLa problématique. La philosophie ' ) * )
La problématique!" La philosophie #$ % La philosophie &'( ' ) * ) 1 La philosophie +, -) *. Mise en oeuvre Data warehouse ou Datamart /01-2, / 3 13 4,$ / 5 23, 2 * $3 3 63 3 #, 7 Datawarehouse Data warehouse
Plus en détailIntroduction à la B.I. Avec SQL Server 2008
Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide
Plus en détailet les Systèmes Multidimensionnels
Le Data Warehouse et les Systèmes Multidimensionnels 1 1. Définition d un Datawarehouse (DW) Le Datawarehouse est une collection de données orientées sujet, intégrées, non volatiles et historisées, organisées
Plus en détailDevenez un virtuose de Google. Atelier en informa5que présenté par Dominic P. Tremblay h@p://dominictremblay.com
Devenez un virtuose de Google Atelier en informa5que présenté par Dominic P. Tremblay h@p://dominictremblay.com Google Google est une société fondée en 1998 en Californie par Larry Page et Sergey Brin.
Plus en détailDécouvrir Drupal. Les meilleurs thèmes et modules Drupal (présenta5on démo)
Découvrir Drupal Les meilleurs thèmes et modules Drupal (présenta5on démo) Tour d horizon des principales fonc5onnalités de Drupal au travers de la présenta5on de quelques- uns de ses principaux modules
Plus en détail«UN REIN C EST PAS RIEN»
Nom de l en?té déposante : ICOM agence Agence conseil : ICOM Annonceur : La Fédéra7on Na7onale d Aide aux Insuffisants Rénaux Midi- Pyrénées en partenariat avec la Clinique néphrologique Saint- Exupéry
Plus en détailFICHE SYNTHÉTIQUE LES DIGITAL INFLUENCERS ET LE COURRIER PUBLICITAIRE. 1ère par(e : percep(on & usages du courrier
FICHE SYNTHÉTIQUE LES DIGITAL INFLUENCERS ET LE COURRIER PUBLICITAIRE 1ère par(e : percep(on & usages du courrier 1 CATÉGORIE : ETUDE CIBLE FAMILLE : PERCEPTION & USAGES DU COURRIER ETUDE DIGITAL INFLUENCERS
Plus en détailSites Internet : les. tendances. Jeudi 30 janvier 2014 Bordeaux L AGENCE CONNECTÉE À L ENTREPRISE
Sites Internet : les tendances pour 2014 Jeudi 30 janvier 2014 Bordeaux L AGENCE CONNECTÉE À L ENTREPRISE Inaa$v, une agence de communica$on avec des spécificités CONSEiL EN COMMUNICATION FoRmatiOns WEBMARKETING
Plus en détailLes Entrepôts de Données
Les Entrepôts de Données Grégory Bonnet Abdel-Illah Mouaddib GREYC Dépt Dépt informatique :: GREYC Dépt Dépt informatique :: Cours Cours SIR SIR Systèmes d information décisionnels Nouvelles générations
Plus en détailLes Entrepôts de Données. (Data Warehouses)
Les Entrepôts de Données (Data Warehouses) Pr. Omar Boussaid Département d'informatique et de Sta5s5que Université Lyon2 - France Les Entrepôts de Données 1. Généralités, sur le décisionnel 2. L'entreposage
Plus en détailComment référencer votre annonce Sur les moteurs de recherche?
Comment référencer votre annonce Sur les moteurs de recherche? SOMMAIRE 1. Qu est ce que le référencement? 2. Comment fonctionnent les moteurs de recherches? 3. Comment améliorer le référencement de votre
Plus en détailLamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013
Cube de textes et opérateur d'agrégation basé sur un modèle vectoriel adapté Text Cube Model and aggregation operator based on an adapted vector space model Lamia Oukid, Ounas Asfari, Fadila Bentayeb,
Plus en détailConsultants, trouvez de nouveaux marchés grâce aux médias sociaux animé par Valérie March au Salon des micro- entreprises 2012
Consultants, trouvez de nouveaux marchés grâce aux médias sociaux animé par Valérie March au Salon des micro- entreprises 2012 Conseils pra,ques et ou,ls pour Prospecter plus efficacement Faire connaître
Plus en détailLes réseaux sociaux et le mobile au service de l industrie du tourisme digital
Les réseaux sociaux et le mobile au service de l industrie du tourisme digital eafortier@adknowledge.com fr.linkedin.com/in/eafortier @ericalexfortier Eric- Alexis For:er 5 Décembre 2013 Qui sommes- nous?
Plus en détailRapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/2011. 1.1 Présentation. 1.2 Ressources
Master Maths Finances 2010/2011 Data Mining janvier 2011 RapidMiner 1 Introduction 1.1 Présentation RapidMiner est un logiciel open source et gratuit dédié au data mining. Il contient de nombreux outils
Plus en détailPrésenta)on de Mathieu Jaspard Coordinateur de recherches. Gilles Condé A0aché de recherches
Sous la direc4on de Guénaël Devillet Directeur du SEGEFA Université de Liège Réalisation d un Schéma de Développement Commercial sur le territoire communal de Nivelles Séance d information publique - Phase
Plus en détailOLAP : Mondrian + Pentaho. Maguelonne Teisseire Hugo Alatrista Salas hugo.alatrista- salas@teledetec9on.fr Flavien Bouillot
OLAP : Mondrian + Pentaho Maguelonne Teisseire Hugo Alatrista Salas hugo.alatrista- salas@teledetec9on.fr Flavien Bouillot Outils Open Source Mondrian : serveur OLAP JFreeReport : ou9l de «Repor9ng» KeHle
Plus en détailL ou%l téléphone dans votre stratégie de marke%ng direct
L ou%l téléphone dans votre stratégie de marke%ng direct «Allo, vous n avez pas de stratégie téléphone?» Alain Pierre La Chaîne de l Espoir Pascal Fréneaux ADM VALUE Présenta%on de La Chaîne de l Espoir
Plus en détailLa structure de la base de données et l utilisation de PAST. Musée Royal de l Afrique Centrale (MRAC Tervuren)
La structure de la base de données et l utilisation de PAST La structure de la base de données données originales SPÉCIMENS Code des spécimens: Identification des spécimens individuels. Dépend du but de
Plus en détailL essentiel de la communication Web To Store
L essentiel de la communication Web To Store Mul-diffusion Cross- Canal Vos Médias Enseigne CRM- Retail Op-misé Cross- Canal Click & Collect avec paiement intégré Si on vous dit que nous avons la solu-on
Plus en détailSOLIDARITE ESPRIT D EQUIPE ESPRIT D ENTREPRISE AMBITION L AVENTURE CONTINUE!
SOLIDARITE L AVENTURE CONTINUE! ESPRIT D EQUIPE La Fédéraon Terre de Talents (F.T.D.T.) a été créée dans l intenon de permere à chacun de révéler ses talents et de s épanouir dans un projet professionnel
Plus en détailRéseau SCEREN. Ce document a été numérisé par le CRDP de Bordeaux pour la. Base Nationale des Sujets d Examens de l enseignement professionnel.
Ce document a été numérisé par le CRDP de Bordeaux pour la Base Nationale des Sujets d Examens de l enseignement professionnel. Campagne 2013 Ce fichier numérique ne peut être reproduit, représenté, adapté
Plus en détailLa classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
Plus en détailArchitecture matériel et logiciel 2
Architecture matériel et logiciel 2 Architectures Venera Arnaoudova Concep8on architecturale 1. Introduc8on 2. Modéliser l architecture avec UML 3. Éléments architecturaux 4. Styles architecturaux 1. Architecture
Plus en détailLes entrepôts de données
Les entrepôts de données Lydie Soler Janvier 2008 U.F.R. d informatique Document diffusé sous licence Creative Commons by-nc-nd (http://creativecommons.org/licenses/by-nc-nd/2.0/fr/) 1 Plan Introduction
Plus en détailAnalyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57
Analyse de la vidéo Chapitre 4.1 - La modélisation pour le suivi d objet 10 mars 2015 Chapitre 4.1 - La modélisation d objet 1 / 57 La représentation d objets Plan de la présentation 1 La représentation
Plus en détailTravaux pratiques avec RapidMiner
Travaux pratiques avec RapidMiner Master Informatique de Paris 6 Spécialité IAD Parcours EDOW Module Algorithmes pour la Fouille de Données Janvier 2012 Prise en main Généralités RapidMiner est un logiciel
Plus en détailPe#t déjeuner Prévention des risques professionnels dans la Mutualité
Pe#t déjeuner Prévention des risques professionnels dans la Mutualité 15 mai 2014 Intervenantes: Emmanuelle Paradis, Chef de projet Préven#on et santé au travail CHORUM - CIDES Carole Hazé, Responsable
Plus en détailFranck VAUTIER, Jean-Pierre TOUMAZET, Erwan ROUSSEL, Marlène FAURE, Mohamed ABADI, Marta FLOREZ, Bertrand DOUSTEYSSIER
Utilisation d images dérivées d un jeu de données LIDAR pour la détection automatisée de vestiges archéologiques (programme de recherche méthodologique LiDARCHEO) Franck VAUTIER, Jean-Pierre TOUMAZET,
Plus en détailDidier MOUNIEN Samantha MOINEAUX
Didier MOUNIEN Samantha MOINEAUX 08/01/2008 1 Généralisation des ERP ERP génère une importante masse de données Comment mesurer l impact réel d une décision? Comment choisir entre plusieurs décisions?
Plus en détailOFFRE MIX MARKETING : créateur de consommateurs. A l a&en)on de : Date de remise : Version : 3.0
OFFRE MIX MARKETING : créateur de consommateurs A l a&en)on de : Date de remise : Version : 3.0 01 Créateur de consommateurs Générateur de leads Offre & Ou@ls Azimut Inbound & Outbound Marke@ng. Méthodologie.
Plus en détailBaromètre Direct Assurance des cyberconsommateurs
Avril 2013 DIRECT ASSURANCE Baromètre Direct Assurance des cyberconsommateurs 3 ème vague Paris Toronto Shanghaï Buenos Aires Connection creates value Méthodologie Échan0llon Pour ce(e étude, un échan0llon
Plus en détailLettre de prospective n 48 janvier 2015
FriedlandPapers Lettre de prospective n 48 janvier 2015 LA TRANSFORMATION DIGITALE DES ENTREPRISES : DE LA STRATÉGIE À L ORGANISATION Henri Hamon Économiste à la CCI Paris Ile-de-France I l ne fait aucun
Plus en détailCommerce interna,onal Master 1 Weller Interna,onal Business school 2015 24/02/15
Commerce interna,onal Master 1 Weller Interna,onal Business school 2015 24/02/15 1 Méthode pédagogique Session 1 mardi 24 fev 2015 Session 2 - mardi 24 fev 2015 Session 3 Théma&que abordée Analyse des
Plus en détailGUIDE D UTILISATION DU BACKOFFICE
GUIDE D UTILISATION DU BACKOFFICE 1. Modifier les pages du site : - Aller dans l onglet «PAGE HTML», puis «Liste des pages HTML» - Pour visualiser votre page, cliquer sur le nom écrit en vert, dans la
Plus en détailOffre Azimut CONTENT MARKETING. A l a&en)on de : Date de remise : Version : 3.0
Offre Azimut CONTENT MARKETING A l a&en)on de : Date de remise : Version : 3.0 01 Marke3ng de Contenu Ecosytème Editorial Offre & Ou3ls Azimut Content Marke3ng Méthodologie Content management Qui sommes-
Plus en détailIntroduc)on à Ensembl/ Biomart : Par)e pra)que
Introduc)on à Ensembl/ Biomart : Par)e pra)que Stéphanie Le Gras Jean Muller NAVIGUER DANS ENSEMBL : PARTIE PRATIQUE 2 Naviga)on dans Ensembl : Pra)que Exercice 1 1.a. Quelle est la version de l assemblage
Plus en détailLa formation des IOBSP
Quelle formation pour quel IOBSP? Intervenant : Ravi CAUSSY, Président de la Commission Formation AFIB Convention du 31 mai 2012 - Paris Quelle formation pour quel IOBSP? Quelles catégories et activités
Plus en détailCQP 112 Introduc/on à la programma/on. Thème 2 : Architecture d un système informa/que. Département d informa/que
CQP 112 Introduc/on à la programma/on Thème 2 : Architecture d un système informa/que Département d informa/que CQP 112 : Introduc/on à la programma/on Plan 1. Historique des ordinateurs 2. Composants
Plus en détailDidacticiel Études de cas. Description succincte de Pentaho Data Integration Community Edition (Kettle).
1 Objectif Description succincte de Pentaho Data Integration Community Edition (Kettle). L informatique décisionnelle («Business Intelligence BI» en anglais, ça fait tout de suite plus glamour) fait référence
Plus en détailSAUVER LA DISTRIBUTION!
SAUVER LA DISTRIBUTION! Face au Cloud et à l explosion des usages innovants qu il permet dans tous les secteurs, les acteurs «canal historique» de la distribu=on et des services informa=ques se reposi=onnent
Plus en détail1 Création d une pièce. 2 Travail complémentaire. 1-1 Réglage des barres d outils. 1-2 Exemples de réalisation de pièces à l aide d un modeleur 3D
SolidWorks Logiciel de DAO (Dessin Assisté par Ordinateur) Palonnier Servomoteur SOMMAIRE : 1 Création d une pièce 1-1 Réglage des barres d outils 1-2 Exemples de réalisation de pièces à l aide d un modeleur
Plus en détail2 Serveurs OLAP et introduction au Data Mining
2-1 2 Serveurs OLAP et introduction au Data Mining 2-2 Création et consultation des cubes en mode client-serveur Serveur OLAP Clients OLAP Clients OLAP 2-3 Intérêt Systèmes serveurs et clients Fonctionnalité
Plus en détailTRANSFORMATION DIGITALE : COMMENT INDUSTRIALISER ET PÉRENNISER LA MÉTHODE AGILE À PLUS GRANDE ÉCHELLE
PARTENAIRES ENTREPRISE & TRANSFORMATION DIGITALE : TRANSFORMATION DIGITALE : COMMENT INDUSTRIALISER ET PÉRENNISER LA MÉTHODE AGILE À PLUS GRANDE ÉCHELLE PROGRAMME Dans des environnements de plus en plus
Plus en détailINTRODUCTION AU DATA MINING
INTRODUCTION AU DATA MINING 6 séances de 3 heures mai-juin 2006 EPF - 4 ème année - Option Ingénierie d Affaires et de Projets Bertrand LIAUDET TP DE DATA MINING Le TP et le projet consisteront à mettre
Plus en détailAméliorez et industrialisez vos feedback produit
Améliorez et industrialisez vos feedback produit Jean- Philippe Gillibert, architecte logiciel et coach agile chez Introduc)on Retour d expérience sur un projet à la SNCF Méthode originale de traitement
Plus en détailH2PS engage ses compétences auprès des entreprises et des parculiers par la mise en place de soluons d accompagnements et de services.
Notre Société H2PS engage ses compétences auprès des entreprises et des parculiers par la mise en place de soluons d accompagnements et de services. Nos Engagements: Nous uliserons nos connaissances, expériences
Plus en détailBI = Business Intelligence Master Data-Science
BI = Business Intelligence Master Data-Science UPMC 25 janvier 2015 Organisation Horaire Cours : Lundi de 13h30 à 15h30 TP : Vendredi de 13h30 à 17h45 Intervenants : Divers industriels (en cours de construction)
Plus en détailDEVELOPPER SON SOURCING VIA LES RESEAUX SOCIAUX FACEBOOK
DEVELOPPER SON SOURCING VIA LES RESEAUX SOCIAUX FACEBOOK DEVELOPPER SON SOURCING VIA FACEBOOK ATELIER 1 CREATION DE VOTRE PROFIL ATELIER 1 EN GUISE D INTRODUCTION Pourquoi u(liser les réseaux sociaux dans
Plus en détailBENCHMARK CONCURRENTIEL PERMANENT : PRIX, CONDITIONS, PROMOTIONS, INNOVATIONS
PARTENAIRES E-COMMERCE BENCHMARK CONCURRENTIEL PERMANENT : PRIX, CONDITIONS, PROMOTIONS, INNOVATIONS PROGRAMME Alors que le taux d équipement d appareils numériques explose, les consommateurs passent de
Plus en détailNormes techniques d'accessibilité
Normes techniques d'accessibilité Informations tirées du site de la CRIPH (Cellule de Recrutement et d Insertion des Personnes Handicapées) La notion d accessibilité intègre plusieurs composantes : l accès
Plus en détailStatistique Descriptive Élémentaire
Publications de l Institut de Mathématiques de Toulouse Statistique Descriptive Élémentaire (version de mai 2010) Alain Baccini Institut de Mathématiques de Toulouse UMR CNRS 5219 Université Paul Sabatier
Plus en détailMauvaise informa.on agricole = Cycle de pauvreté Producteurs. Commerçants. Gouvernements. Transformateurs
Mauvaise informa.on agricole = Cycle de pauvreté Producteurs Ne savent pas : Que planter? Où bien vendre? Comment vendre? Transformateurs Ne peuvent pas bien : Prévoir leurs appro. (stocks?) Planifier
Plus en détailProxiLens : Exploration interactive de données multidimensionnelles à partir de leur projection
ProxiLens : Exploration interactive de données multidimensionnelles à partir de leur projection Nicolas HEULOT (CEA LIST) Michaël AUPETIT (CEA LIST) Jean-Daniel FEKETE (INRIA Saclay) Journées Big Data
Plus en détailReconstruction de bâtiments en 3D à partir de nuages de points LIDAR
Reconstruction de bâtiments en 3D à partir de nuages de points LIDAR Mickaël Bergem 25 juin 2014 Maillages et applications 1 Table des matières Introduction 3 1 La modélisation numérique de milieux urbains
Plus en détailSécuriser et enrichir les transactions financières. URYX Capital
Sécuriser et enrichir les transactions financières URYX Capital Confiden'aly Agreement This agreement is to acknowledge that the informa4on provided by URYX Capital in this business plan is unique to this
Plus en détailPlan. Ce qu est le datawarehouse? Un modèle multidimensionnel. Architecture d un datawarehouse. Implémentation d un datawarehouse
Datawarehouse 1 Plan Ce qu est le datawarehouse? Un modèle multidimensionnel Architecture d un datawarehouse Implémentation d un datawarehouse Autres développements de la technologie data cube 2 Ce qu
Plus en détailOracle Décisionnel : Modèle OLAP et Vue matérialisée D BILEK
Oracle Décisionnel : Modèle OLAP et Vue matérialisée SOMMAIRE Introduction Le modèle en étoiles Requêtes OLAP Vue matérialisée Fonctions Roll up et Cube Application Introduction Data Warehouse Moteur OLAP
Plus en détailPoli%que ins%tu%onnelle: le numérique au service de la forma%on à l Université Laval CFQCU Paris, 26 mai 2015
Poli%que ins%tu%onnelle: le numérique au service de la forma%on à l Université Laval CFQCU Paris, 26 mai 2015 Nicole.Lacasse@vre.ulaval.ca Vice- rectrice associée aux études et aux ac%vités interna%onales
Plus en détailChristophe CANDILLIER Cours de DataMining mars 2004 Page 1
Christophe CANDILLIER Cours de DataMining mars 2004 age 1 1. Introduction 2. rocessus du DataMining 3. Analyse des données en DataMining 4. Analyse en Ligne OLA 5. Logiciels 6. Bibliographie Christophe
Plus en détailBig Data et Graphes : Quelques pistes de recherche
Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université
Plus en détailthink-cell 6 Guide de l utilisateur
think-cell 6 Guide de l utilisateur Impression think-cell Sales GmbH & Co. KG Chausseestraße 8/E 845 Third Avenue, 6th Floor support@think-cell.com 10115 Berlin New York, NY 10022 http://www.think-cell.com
Plus en détailINTRASTAT 2015. No ce explica ve Merkbla
INTRASTAT 2015 Noce explicave Merkbla Rédacon en chef Alain Hoffmann Rédacon, coordinaon et concepon graphique Luc Kohnen STATEC Instut naonal de la stasque et des études économiques Centre Administraf
Plus en détailDécouverte du logiciel ordinateur TI-n spire / TI-n spire CAS
Découverte du logiciel ordinateur TI-n spire / TI-n spire CAS Mémento Ouvrir TI-Nspire CAS. Voici la barre d outils : L insertion d une page, d une activité, d une page où l application est choisie, pourra
Plus en détailCabinet de Conseil STRATÉGIE MANAGEMENT ORGANISATION JURIDIQUE FORMATION AVEC BW CONSULTANTS CHOISISSEZ DE GARANTIR VOTRE DEVELOPPEMENT
Cabinet de Conseil STRATÉGIE MANAGEMENT ORGANISATION JURIDIQUE FORMATION 1 Pourquoi nous choisir? Le chef d entreprise, surtout s il est propriétaire, déteste l aventure. Notre Objec>f est de vous accompagner
Plus en détailhttp://www.content-square.fr
http://www.content-square.fr Qui sommes-nous? 2 Jonathan CHERKI Président Fondateur Études : + ESSEC + Licence de Mathématiques et de statistiques + Master de Marketing L équipe (composée de 25 experts)
Plus en détailPetit lexique de calcul à l usage des élèves de sixième et de cinquième par M. PARCABE, professeur au collège Alain FOURNIER de BORDEAUX, mars 2007
Petit lexique de calcul à l usage des élèves de sixième et de cinquième par M. PARCABE, professeur au collège Alain FOURNIER de BORDEAUX, mars 2007 page 1 / 10 abscisse addition additionner ajouter appliquer
Plus en détailPRÉSENTATION DES RÉSULTATS DU LIVRE BLANC BIG DATA
PARTENAIRES BIG DATA PRÉSENTATION DES RÉSULTATS DU LIVRE BLANC BIG DATA Le Livre Blanc de l EBG a pour ambion d'entrer dans le concret du Big Data. Finis les concepts flous et les formules vagues : nous
Plus en détailSanté, condi,ons de travail et égalité professionnelle F/H Comment agir?
Santé, condi,ons de travail et égalité professionnelle F/H Comment agir? Rencontres expertes de l Aract Bretagne Lundi 9 mars 2015 Elisabeth Dewanckel e.dewanckel@anact.fr Hélène Plassoux h.plassoux@anact.fr
Plus en détailDémonstra*on du concept de détec*on
Démonstra*on du concept de détec*on Enzyme Peroxydase de raifort (HRP) Chromogène (ABTS) Peroxyde d'hydrogène (H 2 O 2 ) Démonstra*on du concept de détec*on Enzyme Peroxydase de raifort (HRP) Chromogène
Plus en détailSoit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.
ANALYSE 5 points Exercice 1 : Léonie souhaite acheter un lecteur MP3. Le prix affiché (49 ) dépasse largement la somme dont elle dispose. Elle décide donc d économiser régulièrement. Elle a relevé qu elle
Plus en détailSimplifiez la ges-on de votre parc informa-que
Simplifiez la ges-on de votre parc informa-que Qui sommes nous? Société créé en 2000, présente en France depuis 2008 Présence interna6onale sur 23 pays, 450 employés Croissance globale de 20% YTD 6500
Plus en détailRicco Rakotomalala http://eric.univ-lyon2.fr/~ricco/cours/cours_programmation_r.html. R.R. Université Lyon 2
Ricco Rakotomalala http://eric.univ-lyon2.fr/~ricco/cours/cours_programmation_r.html 1 Plan de présentation 1. L écosystème Hadoop 2. Principe de programmation MapReduce 3. Programmation des fonctions
Plus en détailI- USBKey Transfer. Guide d u5lisa5on. Comment u)liser I- USBKey Transfer?
I- USBKey Transfer Guide d u5lisa5on Comment u)liser I- USBKey Transfer? 1 I- USBKey Transfer Guide d u5lisa5on - Supprimer - Copier - Déplacer 1. Comment copier les fichiers (musique, vidéo, photos, etc.)
Plus en détailDéroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI
1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage
Plus en détailComment CEGID et ses solu/ons peuvent elles implémenter les standards TICPME2010?
14 Octobre 2008 TICPME2010 Comment CEGID et ses solu/ons peuvent elles implémenter les standards TICPME2010? Eric VALION Directeur de marché ERP Middle Market Cegid Group Table ronde éditeurs Cegid Group
Plus en détailAnnexe commune aux séries ES, L et S : boîtes et quantiles
Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans
Plus en détailBLANC LIVRE. Data Discovery L alternative à la BI?
ata Discovery L alternative à la BI? Data Discovey L alternative à la BI? Data Discovery L alternative la BI? Data Discovery L alternative à la BI? Data iscovery L alternative à la BI? Data Discovery L
Plus en détailSage Cockpit. Solution de Business Intelligence basée sur le Web et destinée aux évaluations et aux analyses
Sage Cockpit Solution de Business Intelligence basée sur le Web et destinée aux évaluations et aux analyses Connaissez-vous votre entreprise? C est évident, vous connaissez votre entreprise. Mais savez-vous
Plus en détailProjet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies
Projet de traitement d'image - SI 381 reconstitution 3D d'intérieur à partir de photographies Régis Boulet Charlie Demené Alexis Guyot Balthazar Neveu Guillaume Tartavel Sommaire Sommaire... 1 Structure
Plus en détail