Projet Data Mining. Projet SODAS :
|
|
- Ghislaine Boivin
- il y a 8 ans
- Total affichages :
Transcription
1 UNIVERSITE PARIS DAUPHINE DEA 127 : SYSTEME INTELLIGENT Projet Data Mining décembre 2004 Projet SODAS : Etude sur les footballeurs évoluant en Ligue 1 durant la saison Responsable : Edwin DIDAY Etudiant : Vinh TRUONG
2 SOMMAIRE INTRODUCTION... 3 I PRESENTATION GENERALE BREF HISTORIQUE LE LOGICIEL SODAS (SYMBOLIC OFFICIAL DATA ANALYSIS SYSTEM)... 4 II PRESENTATION DE LA BASE DE DONNEES... 5 III CONSTRUCTION DES OBJETS SYMBOLIQUES... 6 IV ANALYSE DE DONNEES LA METHODE SOE LA METHODE PCM LA METHODE TREE LA METHODE DIV LA METHODE PYR LA METHODE STAT CONCLUSION TRUONG Tuong Vinh Page 2
3 Introduction L analyse de données ou Data Mining a pour objectif d extraire des informations contenu dans un tableau de données, de les traiter et de les rendre visible, c'est-à-dire d y expliciter des connaissances. Ainsi en reprenant la métaphore «Data Mining», la problématique de l analyse de données est d extraire des mines de connaissances enfouies sous des amas de données. Cependant elle ne donne pas de réponse à un problème donné mais elle fournit une représentation, une image simplifiée de l ensemble des données permettant une confrontation entre elles. Nous allons dans le cadre du projet de Data Mining appliquer différentes méthodes sur une base de données concernant les équipes de football de la ligue professionnelle de football français. Pour cela, nous avons utilisé le logiciel SODAS, «un logiciel d analyse de données symboliques». L étude se porte en effet sur des concepts, qui sont dans le cadre de ce projet des classes d individus. Nous allons dans un premier temps effectué un rapide historique du domaine ainsi qu une présentation du logiciel. Par la suite, nous vous présenterons la base de données ainsi que les différents résultats obtenus. TRUONG Tuong Vinh Page 3
4 I Présentation générale 1 Bref historique Les bases théoriques de l Analyse de Données ne sont pas récentes. Certaines ont ainsi été établies au début de siècle et dans les années Elles sont nées du domaine des statistiques et de la volonté de se libérer de certaines contraintes des statistiques considérées comme abusives. Cependant le domaine était essentiellement connu et appliqué des chercheurs et les moyens restèrent limités, même si le besoin de classer, de représenter, de reconnaître les données existe depuis longtemps et dans de nombreux domaines. L avènement de l informatique change la donne. Et cela pour deux raisons. D une part, l informatique permet et facilite de nombreux calculs complexes (visualisation des résultats). D autre part, l évolution des systèmes de base de données ainsi de leur gestion permettent un stockage d une quantité de plus en plus grande de données. Rapidement, cette accumulation de données (souvent sous forme de tableaux) rend difficile leur exploitation dans leur ensemble. Cette problématique se retrouve en particuliers au niveau des entrepôts de données dans le cadre du décisionnel. Le data mining dépasse alors le cadre universitaire. L Analyse de Données concernent aujourd hui un grand nombre de domaine. On peut citer comme exemple la médecine, l économie, les sciences de la vie, de l ingénieur, de la terre, les systèmes d expert 2 Le logiciel SODAS (Symbolic Official Data Analysis System) Le logiciel SODAS est un prototype public issu du projet européen éponyme de EUROSTAT. Le projet implique 15 équipes provenant de 9 pays européens (Allemagne, Belgique, Luxembourg, Grèce, Italie, Espagne, Portugal, France, Finlande) et a pour objectif de fournir un cadre aux différentes avancées récentes et futures de l analyse de données symboliques. Ainsi le but du logiciel SODAS est de construire à partir d une base de données des objets symboliques et de les analyser par des méthodes d Analyse de Données Symboliques. Nous pouvons citer par exemple les méthodes suivantes qui ont été généralisées aux données symboliques : - L analyse en composantes principales (PCM). - L analyse de données factorielle discriminante (FDA). - Des méthodes de statistiques descriptives (histogrammes, dispersion ). - Des méthodes de classifications. - Les arbres de décision. -. TRUONG Tuong Vinh Page 4
5 II Présentation de la base de données Pour notre étude, nous allons nous appuyer sur une base de données existante. (Alexandre Beruet Avril 2003). Elle a été créée au cours de l année 2003 et à partir de deux sites internet : - Le site Yahoo Sport: - Le site du journal l Équipe: Elle permet de décrire les footballeurs du championnat français évoluant dans un club professionnel de Ligue 1. Un joueur est alors caractérisé par un nom, une taille en cm, un poids en kg, son pays d origine (pays), le nombre de matchs joués (nbmatchsjoués), le nombre de buts (nbbuts), le nombre de cartons jaunes et rouges reçus lors de la saison (respectivement nbcartonsj et nbcartonsr), l équipe dans lequel il évolue. Un joueur peut être international ou non et peut être aussi figuré parmi les 5 meilleurs joueurs du championnat évoluant à son poste selon le quotidien L Equipe (top5). Un club de football est caractérisé par son ancienneté (age), une affluence moyenne, le nombre de buts marqués et encaissés et de leurs classes respectifs (CLButs et CLContres), son classement lors de la conception de la base de données. Un club peut être joué une coupe européenne (europe). La base contient alors 3 relations: Joueur (nom, pays, age, taille, poids, poste, nbmatchsjoués, nbbuts, nbcartonsj, nbcartonsr, top5, international, equipe). Club (nom,age, affluence, nbbuts, CLButs, nbcontres, CLContres, classement, europe) Pays_Continents (pays, continent). On a rajouté une autre relation pour introduire des classes d âge : ClasseAge (AgeMin, AgeMax, ClasseAge). Le schéma UML ci-dessous modélise la base : Club nom age affluence nbbuts CLButs nbcontres CLContres Classement europe Joueur nom pays age taille poids poste nbmatchsjoués nbbuts nbcartonsj nbcartonsr top5 international equipe Pays pays continent ClasseAge AgeMin AgeMax ClasseAge TRUONG Tuong Vinh Page 5
6 III Construction des objets symboliques On considère les joueurs de football comme individus de notre projet. Le concept qu on va étudier est le celui des joueurs de football appartenant à une tranche d âge (ClasseAge) qui correspond ainsi à une classe d individus. On va construire à partir du logiciel DB2SO les descriptions symboliques de ces concepts par généralisation des propriétés des individus qui leur sont associés. Les données en entrée du logiciel sont issues de requêtes SQL sur cette base et sa structure va permettre d identifier les individus et les concepts. La table de données résultant de la requête doit être organisée de telle façon à avoir en première colonne les individus et en deuxième les concepts : Individu Concept Variables Base de données relationnelle Requête SQL Table de données résultant de la requête On obtient alors le contexte de notre étude c est-à-dire les individus, les variables qui les décrivent et les concepts associés aux classes d individus. Nous avons utilisé la requête ci-dessous pour construire une table appropriée : SELECT Joueur.nom, ClasseAge.Classe, Club.nom, Joueur.pays, Joueur.taille, Joueur.poids, Joueur.poste, Joueur.nbMatchsJoues, Joueur.nbButs, Joueur.nbCartonsJ, Joueur.nbCartonsR, Joueur.top5, Joueur.international FROM ClasseAge, Club INNER JOIN (Pays_Continents INNER JOIN Joueur ON Pays_Continents.pays=Joueur.pays) ON Club.nom=Joueur.equipe WHERE Joueur.age BETWEEN ClasseAge.AgeMin AND ClasseAge.AgeMax; DB2SO associe alors une description à chaque concept en créant des données dites symboliques à partir des données initiales. On a représenté ci-dessous une partie de la table obtenue : TRUONG Tuong Vinh Page 6
7 Table de données symboliques DB2SO a ainsi généré deux types de variables symboliques : - des intervalles pour les variables quantitatives (taille, poids, nbmatchsjoués, nbbuts, nbcartonsr, nbcartonsj). - des variables multivaluées avec des poids pour les variables quantitatives (Club.nom, Joueur.pays, Joueur.poste, top5, international). A partir de la table générée par le logiciel, nous pouvons appliquer différentes méthodes d Analyse de Données Symboliques. TRUONG Tuong Vinh Page 7
8 IV Analyse de données 1 La méthode SOE La méthode SOE (Symbolic Object Editor) permet de représenter les objets symboliques construits en fournissant la table de données symboliques ou des graphes 2D/3D. Les représentations sous forme de graphe permettent de visualiser les intervalles, les variables multivaluées avec ou non un poids, les dépendances logiques et les taxonomies. Chaque axe représente une variable symbolique. Nous allons dans cette partie étudier quelques classes d individus (les tranches d âges ans, ans, ans et 34 ans et plus). Classe d'âge 35+ Nous avons représentés le concept 35 ans et plus. Dans le graphe en 2D, les variables sont reliés et ne montrent pas les détails des fréquences pour les variables qualitatives (par exemple pays). Cependant, nous avons une image générale du concept. Ainsi nous pouvoir voir que les joueurs de plus de 35 ans sont pour la majorité des défenseurs (56%), marquent relativement peu de but (entre 0 et 5), ne sont pas internationaux mais ils sont présents dans 4 clubs Montpellier, Nice, Guingamp et Ajaccio. Cela montre une tendance observée dans le football : les joueurs qui font une plus longue carrière sont en majorité des défenseurs et les gardiens. Nous pouvons le vérifier sur le graphe 3D. Il semble que ce poste soit moins exposé aux blessures et que l expérience permet de compenser les problèmes physiques. Ce sont des joueurs d expériences mais la plupart n ont pas été sélectionné dans leur équipe nationale. Cependant, les internationaux sont peu nombreux (de même que pour le top5). Il n est donc pas étonnant de voir que le profil général des joueurs de toutes classes d âges correspond à un footballeur français non international et ne faisant pas parti du top 5. TRUONG Tuong Vinh Page 8
9 Classe d'âge 35 ans et + Nous voyons la fréquence relativement élevée de gardiens. Ce fait est à noter puisqu il n y a qu un seul gardien sur les onze joueurs d une équipe. Classe d âges ans Pour la tranche d âges ans, nous avons la tendance inverse au niveau du poste. La plupart sont des attaquants. Cependant, ils marquent peu. Ceci s explique par le fait qu ils sont jeunes et qu ils débutent dans le milieu professionnel. De plus nous pouvons remarqués que la plupart de ces joueurs jouent dans le club de Montpellier, club réputé pour son centre de formation. Nous pouvons constater la ressemblance du graphe avec la classe d âge précédente mise à part les clubs et le poste. TRUONG Tuong Vinh Page 9
10 Classe d'âge ans Le graphe 3D montre qu on a bien des fréquences pratiquement opposées à la première classe d âges. Les jeunes qui ont joués sont pour la plupart des attaquants ou des milieux. Or comme pour les gardiens, une équipe possède moins d attaquants que de milieux ou des défenseurs. Le fait qu il y ait 55% de joueurs professionnels qui jouent attaquant est assez remarquable. Ceci montre que le poste de défenseur demande plus d expérience et de maturité que ceux du milieu ou en attaque. En effet, le jeu entre les défenseurs doit être plus coordonné (alignement des défenseurs, couverture, ). Classe d'âges ans Un joueur de la classe âge ans est un défenseur qui joue à Nice. Nous pouvons remarquer une différence notable par rapport aux autres classes et notamment pour le nombre de buts marqués et le nombre de cartons jaunes. Nous pouvons juste supposer qu à cet âge, les joueurs jouent plus souvent que les ans et les plus de 35 ans. On peut remarquer que le graphe en 2D n a pas mis en valeur une tendance moyenne puisque 12% des joueurs de cette tranche d âge jouent à Nice. Mais elle montre la valeur de la variable qui a le plus de poids. TRUONG Tuong Vinh Page 10
11 Classe d'âge ans De nouveau, on peut constater qu un joueur ayant entre ans a plus de probabilité d être un milieu ou un défenseur qui joue à Troyes. 2 La méthode PCM Nous allons utiliser dans cette section la méthode d analyse en composantes principales qui a été généralisée à des données symboliques. La variation interne fait apparaître non plus des points sur le graphe mais des rectangles. Le tableau de corrélation ci-dessous a été obtenu : Axe1 Axe2 Axe3 Axe4 taille poids nbmatchsjoues nbbuts nbcartonsj nbcartonsr L axe 1 semble être corrélé avec le nombre de buts et le nombre de cartons reçus (rouges ou jaunes). L axe 2 semble être corrélé avec la taille et le poids, le troisième avec le nombre de matchs joués et le quatrième avec le poids. Cependant, on obtient aussi ce résultat : %inertie PC1: PC2: PC3: PC4: TRUONG Tuong Vinh Page 11
12 Ceci montre que l information n est pas vraiment résumée par le premier axe et que les 4 premiers axes résument moins de 70% de l information. En choisissant les 2 premiers axes, on obtient le graphe suivant : Méthode PCM: représentation des concepts dans un plan Dans la méthode d Analyse en Composantes Principales, on interprète les proximités entre les variables. Dans le cas des données symboliques, il est plus délicat de le faire pour des rectangles à part la représentation de 2 concepts disjoints et éloignés. Dans le cas des classes d âges, les rectangles sont imbriqués l une dans l autre, ce qui peut nous permettre de faire une interprétation sur les variations, ce que l on peut faire avec la méthode SOE. Nous allons essayer de visualiser les centres des rectangles : Méthode PCM:Représentation des concepts dans un plan Dans ce cas la nous pouvons distinguer 3 classes relativement distinctes : - Les joueurs ayant entre 26 et 29 ans. - Les joueurs ayant entre 24 et 25 ans TRUONG Tuong Vinh Page 12
13 - Les joueurs ayant entre ans et 30 ans et plus Cette discrimination se fait essentiellement sur le premier axe c'est-à-dire par le nombre de buts et de cartons reçus. Cependant, nous avons vu que l information n était pas vraiment résumée sur les axes 1 et 2. Il semble donc difficile d exploiter cette information. Méthode PCM:Représentation des concepts dans un plan Dans ce cas, aucune discrimination n est possible. Tous les concepts se ressemblent Les données symboliques ont introduit une certaine imprécision dans l exploitation des résultats de la méthode et particulièrement dans le cadre de notre étude. Apres examen de la base de données, il s avère qu on ne puisse pas obtenir de résultats pertinents avec la base actuelle en utilisant la méthode PCM. 3 La méthode TREE Nous avons introduit dans cette partie la variable classe MoyenneButsParClasse, qui représente la moyenne des buts marqués par les joueurs français jouant dans le championnat français pour chaque tranche d âges. Cette variable étant construite avec des requêtes SQL est une variable quantitative. Nous avons donc du la transformer en variable quantitative. Les variables explicatives sont les variables quantitatives suivantes: - taille. - poids. - nbmatchjoues. - nbbuts. - nbcartonsj. - nbcartonsr. TRUONG Tuong Vinh Page 13
14 En appliquant, la méthode d arbre de segmentation, nous obtenons l arbre ci-dessous : < 2 >0,8 ( )!!----1[ nbcartonsr <= ]! < 3 >1,7 ( ) Ainsi le nombre de cartons rouges est la variable qui explique le mieux la moyenne de buts. Globalement, plus on prend de cartons rouges moins on marque. On peut supposer que ceux qui prennent le plus de cartons rouges sont les défenseurs, qui logiquement marquent peu. 4 La méthode DIV La méthode DIV (divisive classification) permet de faire une classification des concepts que DB2SO a construit. Nous allons dans un premier temps sélectionner les variables qualitatives puis les variables quantitatives. Dans le premier cas, le logiciel trouve deux classes : Cluster 1 (n=2) : "34+" "30-31" Cluster 2 (n=7) : "24-25" "22-23" "26-27" "18-19" "20-21" "28-29" "32-33" Explicated inertia : THE CLUSTERING TREE : the number noted at each node indicates the order of the divisions - Ng <-> yes and Nd <-> no Classe 1 (Ng=2)!! [poste <= Défenseur]! Classe 2 (Nd=7) Le logiciel a utilisé l ordre suivant : Poste (Initial order) 1- Gardien 2- Défenseur 3- Milieu 4- Attaquant TRUONG Tuong Vinh Page 14
15 Ainsi on retrouve les résultats qu on a pu observer avec SOE : Les défenseurs et les gardiens sont dans des tranches d âges «30-31» et «34 et +», ce qui correspond à des âges relativement avancés dans le milieu du football professionnel. Dans le cas, où on utilise des variables continues, nous obtenons le résultats suivants : Cluster 1 (n=4) : "34+" "18-19" "30-31" "32-33" Cluster 2 (n=5) : "24-25" "22-23" "26-27" "20-21" "28-29" Explicated inertia : THE CLUSTERING TREE : the number noted at each node indicates the order of the divisions - Ng <-> yes and Nd <-> no Classe 1 (Ng=4)!! [nbbuts <= ]! Classe 2 (Nd=5) On remarque dans ce cas, que le nombre de buts permet de discriminer les joueurs. Les plus jeunes et les plus âgés semblent moins marquer. Cela s explique par le fait que d une part les jeunes sont peu expérimentés et que les joueurs de plus de 30 ans sont pratiquement en fin de carrière. De plus, nous avons vu qu il y a une grande proportion de défenseurs avec un âge de plus de 30 ans. 5 La méthode PYR La méthode PYR permet de construire un ensemble de parties appelé «pyramide» à partir des concepts. Nous avons appliqué la méthode sur toutes les variables. On obtient alors la pyramide ci-dessous : Where_the_labels_are_of_the_individuals_are: 1.="34+" 2.="24-25" 3.="22-23" 4.="26-27" 5.="18-19" 6.="20-21" 7.="30-31" 8.="28-29" 9.="32-33" Where_the_labels_are_of_the_variables_are: y1.=nom_1 TRUONG Tuong Vinh Page 15
16 y2.=pays y3.=taille y4.=poids y5.=poste y6.=nbmatchsjoues y7.=nbbuts y8.=nbcartonsj y9.=nbcartonsr y10.=top5 y11.=international On obtient l ordre suivant (en partant du haut): 34+,18-19 ;32-33 ;30-31 ;20-21 ;22-23 ;24-25 ;26-27 ; On remarque que les classes successives d âges sont «proches», ce qui semble relativement normal. Cependant, la classe fait exception car l algorithme l a réunie avec la classe 34+. On peut supposer que c est au niveau des performances que les deux classes sont proches et en particuliers le nombre de buts et le nombre de matchs joués. TRUONG Tuong Vinh Page 16
17 6 La méthode STAT La méthode STAT regroupe en fait plusieurs méthodes provenant de la statistique étendues aux objets symboliques. On a représenté les fréquences des concepts pour des tailles de joueurs. Nous pouvons constater que globalement la taille moyenne des joueurs appartenant aux différentes classes se situent entre 1,70 et 1,90. Nous pouvons aussi utilisé un graphe biplot. Nous avons par exemple sélectionner la taille et le nombre de buts. TRUONG Tuong Vinh Page 17
18 Nous remarquons sur le graphe que les joueurs se trouvant dans la classe marquent le plus de buts. De plus, les personnes relativement de petite taille sont plutôt jeune. Nous remarquons de nouveau la similarité entre les classes d âges 34+ et ans. Exemple de graphe de capacités : On voit que dans les classes d âges, il y a peu de gardiens. Ceci semble logique vu le nombre peu élevé de personnes jouant à ce poste par rapport aux effectifs d une équipe. On remarque que la variation pour le poste de milieu est moins élevée que pour les autres postes. D une part, on avait vu que beaucoup de personnes jouaient milieu de terrain et d autre part, on peut supposer au vu des autres méthodes que la variation pour les postes de défenseurs et d attaquants est due aux classes et 34+. TRUONG Tuong Vinh Page 18
19 Conclusion Le projet SODAS nous a permis d appliquer les méthodes vues en cours sur des cas concrets (classes d âges des footballeurs de Ligue 1 pour cette étude). Nous n avons pu utiliser qu une ancienne version du logiciel. On a en effet rencontré quelques problèmes avec la version On a quand même pu obtenir des résultats sur un bon nombre de méthodes. En particuliers, nous avons pu mettre en évidence la «ressemblance» entre les classes d âges ans et plus de 34 ans. Malheureusement, la méthode PCM n a pas donné des résultats exploitables. Ceci est certainement dû au fait que la base a été construite spécifiquement pour les concepts équipe et non classes d âges. Ceci montre que les outils du datamining ne peuvent se passer de l utilisateur pour la recherche des pépites dans la base de données. De plus, les résultats obtenus n ont que peu de valeur sans interprétations. Le datamining rassemble ainsi des outils qui vont permettre à l utilisateur ou à l aider à trouver des informations à partir d une grande quantité d informations. L analyse de Données Symboliques permet d étendre l analyse de données classiques en étudiant des concepts et non des individus. TRUONG Tuong Vinh Page 19
DATA MINING - Analyses de données symboliques sur les restaurants
Master 2 Professionnel - Informatique Décisionnelle DATA MINING - Analyses de données symboliques sur les restaurants Etudiants : Enseignant : Vincent RICHARD Edwin DIDAY Seghir SADAOUI SOMMAIRE I Introduction...
Plus en détailDatamining. Université Paris Dauphine DESS ID 2004/2005. Séries télévisées nominées aux oscars. Enseignant : Réalisé par : Mars 2005. Mr E.
Université Paris Dauphine DESS ID 2004/2005 Datamining Séries télévisées nominées aux oscars Mars 2005 Enseignant : Mr E. DIDAY Réalisé par : Mounia CHERRAD Anne-Sophie REGOTTAZ Sommaire Introduction...
Plus en détailCritères pour avoir la meilleure équipe!
PROJET DATAMINING Basket-ball professionnel "NBA" : Critères pour avoir la meilleure équipe! Réalisé par : Anasse LAHLOU KASSI Houssam Eddine HOUBAINE DESS TIO DESS ID Année Scolaire : SOMMAIRE INTRODUCTION...
Plus en détailUniversité Paris IX DAUPHINE DATE : 24/04/06
Master Informatique Décisionnelle Application des outils de l'informatique Décisionnelle en entreprise ETUDE SUR LES MARQUES ET LES CONTRUCTEUR DES VÉHICULES APPARTENANT AUX CLIENTS D UNE COMPAGNIE D ASSURANCE
Plus en détailCOACH LIGUE 1 SAISON 2014/2015
COACH LIGUE 1 SAISON 2014/2015 INTRODUCTION LE PRINCIPE Coach Ligue 1 est un jeu de management de football sur Internet basé sur le Championnat de France de Ligue 1. Le site est : www.coachligue1.fr Le
Plus en détailProjet de Datamining Supervisé (SODAS) Analyse des régions françaises
Master 2 ème Année Ingénierie Statistique et financière Projet de Datamining Supervisé (SODAS) Analyse des régions françaises Réalisé par : Nicolas CHAIGNEAUD Nora SLIMANI Année universitaire 2007-2008
Plus en détailWEBSELL. Projet DATAMINING
WEBSELL Projet DATAMINING Analyse des données dans le cadre d une étude de banchmarking DESS ID Session 2005/2006 Mariam GASPARIAN [ Page 1 ] SOMMAIRE 1. INTRODUCTION... 3 2. METHODES ET OUTILS... 4 2.1.
Plus en détailChristophe CANDILLIER Cours de DataMining mars 2004 Page 1
Christophe CANDILLIER Cours de DataMining mars 2004 age 1 1. Introduction 2. rocessus du DataMining 3. Analyse des données en DataMining 4. Analyse en Ligne OLA 5. Logiciels 6. Bibliographie Christophe
Plus en détailRapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/2011. 1.1 Présentation. 1.2 Ressources
Master Maths Finances 2010/2011 Data Mining janvier 2011 RapidMiner 1 Introduction 1.1 Présentation RapidMiner est un logiciel open source et gratuit dédié au data mining. Il contient de nombreux outils
Plus en détailLa segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM
La segmentation à l aide de EG-SAS A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM Définition de la segmentation - Au lieu de considérer une population dans son ensemble,
Plus en détailLa classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
Plus en détailIntroduction au Data-Mining
Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme
Plus en détailESIEA PARIS 2011-2012
ESIEA PARIS 2011-2012 Examen MAT 5201 DATA MINING Mardi 08 Novembre 2011 Première Partie : 15 minutes (7 points) Enseignant responsable : Frédéric Bertrand Remarque importante : les questions de ce questionnaire
Plus en détail2 Serveurs OLAP et introduction au Data Mining
2-1 2 Serveurs OLAP et introduction au Data Mining 2-2 Création et consultation des cubes en mode client-serveur Serveur OLAP Clients OLAP Clients OLAP 2-3 Intérêt Systèmes serveurs et clients Fonctionnalité
Plus en détaildonnées en connaissance et en actions?
1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)
Plus en détailIntroduction au datamining
Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des
Plus en détailProjet SINF2275 «Data mining and decision making» Projet classification et credit scoring
Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems
Plus en détailINTRODUCTION AU DATA MINING
INTRODUCTION AU DATA MINING 6 séances de 3 heures mai-juin 2006 EPF - 4 ème année - Option Ingénierie d Affaires et de Projets Bertrand LIAUDET TP DE DATA MINING Le TP et le projet consisteront à mettre
Plus en détailDéroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI
1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage
Plus en détailAnalyse trimestrielle du marché des jeux en ligne en France. Autorité de régulation des jeux en ligne Données T3 2013
1 Analyse trimestrielle du marché des jeux en ligne en France 3 ème trimestre 2013 2 Synthèse des données d activité Les éléments suivants ont été constitués sur la base des données transmises par les
Plus en détailCréer le schéma relationnel d une base de données ACCESS
Utilisation du SGBD ACCESS Polycopié réalisé par Chihab Hanachi et Jean-Marc Thévenin Créer le schéma relationnel d une base de données ACCESS GENERALITES SUR ACCESS... 1 A PROPOS DE L UTILISATION D ACCESS...
Plus en détailÂge effectif de sortie du marché du travail
Extrait de : Panorama des pensions 2013 Les indicateurs de l'ocde et du G20 Accéder à cette publication : http://dx.doi.org/10.1787/pension_glance-2013-fr Âge effectif de sortie du marché du travail Merci
Plus en détailIntroduction à la B.I. Avec SQL Server 2008
Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide
Plus en détailTravailler avec les télécommunications
Travailler avec les télécommunications Minimiser l attrition dans le secteur des télécommunications Table des matières : 1 Analyse de l attrition à l aide du data mining 2 Analyse de l attrition de la
Plus en détailCOURS DE DATA MINING 4 : MODELISATION NON-SUPERVISEE CLASSIFICATIONS AUTOMATIQUES
COURS DE DATA MINING 4 : MODELISATION NON-SUPERVISEE CLASSIFICATIONS AUTOMATIQUES EPF 4/ 5 ème année - Option Ingénierie d Affaires et de Projets - Finance Bertrand LIAUDET 4 : Modélisation non-supervisée
Plus en détailLIVRE BLANC Décembre 2014
PARSING MATCHING EQUALITY SEARCH LIVRE BLANC Décembre 2014 Introduction L analyse des tendances du marché de l emploi correspond à l évidence à une nécessité, surtout en période de tension comme depuis
Plus en détailTravaux pratiques avec RapidMiner
Travaux pratiques avec RapidMiner Master Informatique de Paris 6 Spécialité IAD Parcours EDOW Module Algorithmes pour la Fouille de Données Janvier 2012 Prise en main Généralités RapidMiner est un logiciel
Plus en détailThibault Denizet. Introduction à SSIS
Thibault Denizet Introduction à SSIS 2 SSIS - Introduction Sommaire 1 Introduction à SQL Server 2008 Integration services... 3 2 Rappel sur la Business Intelligence... 4 2.1 ETL (Extract, Transform, Load)...
Plus en détailManipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner
Le cas Orion Star Manipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner Le cas Orion Star... 1 Manipulation de données avec SAS Enterprise Guide et modélisation
Plus en détailGOL502 Industries de services
GOL502 Industries de services Conception d un service Partie IIb Version 2013 Introduction Conception d un service partie IIb Nous verrons dans ce chapitre Modélisation d un service; Langage de modélisation
Plus en détailIntroduction aux outils BI de SQL Server 2014. Fouille de données avec SQL Server Analysis Services (SSAS)
MIT820: Entrepôts de données et intelligence artificielle Introduction aux outils BI de SQL Server 2014 Fouille de données avec SQL Server Analysis Services (SSAS) Description générale Ce tutoriel a pour
Plus en détailQui sont les enseignants?
Extrait de : Regards sur l'éducation 2008 : Panorama Accéder à cette publication : http://dx.doi.org/10.1787/9789264040649-fr Qui sont les enseignants? Merci de citer ce chapitre comme suit : OCDE (2009),
Plus en détailStatistique : Résumé de cours et méthodes
Statistique : Résumé de cours et méthodes 1 Vocabulaire : Population : c est l ensemble étudié. Individu : c est un élément de la population. Effectif total : c est le nombre total d individus. Caractère
Plus en détailA. Structurer le catalogue. v Dans le menu Catalogue, sélectionnez Catégories. 1. Les catégories. Chapitre 6 : Construire le catalogue ...
Chapitre 6 :. Construire. le catalogue 177 Chapitre 6 : Construire le catalogue PrestaShop 1.5 - Créer un site de e-commerce A. Structurer le catalogue Ne vous précipitez pas pour créer vos produits immédiatement
Plus en détail1 Introduction et installation
TP d introduction aux bases de données 1 TP d introduction aux bases de données Le but de ce TP est d apprendre à manipuler des bases de données. Dans le cadre du programme d informatique pour tous, on
Plus en détailTABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.
STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,
Plus en détailReconstruction de bâtiments en 3D à partir de nuages de points LIDAR
Reconstruction de bâtiments en 3D à partir de nuages de points LIDAR Mickaël Bergem 25 juin 2014 Maillages et applications 1 Table des matières Introduction 3 1 La modélisation numérique de milieux urbains
Plus en détailAnalyse trimestrielle du marché des jeux en ligne en France
Analyse trimestrielle du marché des jeux en ligne en France 1 er trimestre 2013 2 Synthèse des données d activité Les éléments suivants ont été constitués sur la base des données transmises par les opérateurs
Plus en détailEntraînement, consolidation, structuration... Que mettre derrière ces expressions?
Entraînement, consolidation, structuration... Que mettre derrière ces expressions? Il est clair que la finalité principale d une démarche d investigation est de faire acquérir des connaissances aux élèves.
Plus en détailSéries Statistiques Simples
1. Collecte et Représentation de l Information 1.1 Définitions 1.2 Tableaux statistiques 1.3 Graphiques 2. Séries statistiques simples 2.1 Moyenne arithmétique 2.2 Mode & Classe modale 2.3 Effectifs &
Plus en détailL indice de SEN, outil de mesure de l équité des systèmes éducatifs. Une comparaison à l échelle européenne
L indice de SEN, outil de mesure de l équité des systèmes éducatifs. Une comparaison à l échelle européenne Sophie Morlaix To cite this version: Sophie Morlaix. L indice de SEN, outil de mesure de l équité
Plus en détailProblèmes de dénombrement.
Problèmes de dénombrement. 1. On se déplace dans le tableau suivant, pour aller de la case D (départ) à la case (arrivée). Les déplacements utilisés sont exclusivement les suivants : ller d une case vers
Plus en détailExploiter les statistiques d utilisation de SQL Server 2008 R2 Reporting Services
Exploiter les statistiques d utilisation de SQL Server 2008 R2 Reporting Services Nous verrons dans cet article comment exploiter simplement les données de Log de SQL Server 2008 R2 Reporting Services
Plus en détailFAISABILITÉ D UN ORGANISME EUROPÉEN Supporters Direct RÉSUMÉ LONDRES, AOÛT 2008 RÉSUMÉ
FAISABILITÉ D UN ORGANISME EUROPÉEN Supporters Direct LONDRES, AOÛT 2008 RÉALISÉ POUR L UEFA PAR Supporters Direct Reconnaissons les supporters comme un élément essentiel de l identité des clubs. Michel
Plus en détailMaster Exploration Informatique des données Data Mining & Business Intelligence. Evelyne CHARIFOU Priscillia CASSANDRA
Master Exploration Informatique des données Data Mining & Business Intelligence Groupe 5 Piotr BENSALEM Ahmed BENSI Evelyne CHARIFOU Priscillia CASSANDRA Enseignant Françoise FOGELMAN Nicolas DULIAN SOMMAIRE
Plus en détailLa coordination des soins de santé en Europe
La coordination des soins de santé en Europe Droits des personnes assurées et des membres de leur famille selon les règlements (CE) n 883/2004 et (CE) n 987/2009 La coordination des soins de santé en
Plus en détailAnalyse de grandes bases de données en santé
.. Analyse de grandes bases de données en santé Alain Duhamel Michaël Genin Mohamed Lemdani EA 2694 / CERIM Master 2 Recherche Biologie et Santé Journée Thématique Fouille de Données Plan. 1 Problématique.
Plus en détailEncryptions, compression et partitionnement des données
Encryptions, compression et partitionnement des données Version 1.0 Grégory CASANOVA 2 Compression, encryption et partitionnement des données Sommaire 1 Introduction... 3 2 Encryption transparente des
Plus en détailFOOTBALL LES 17 LOIS DU JEU. Juillet 2004 FEDERATION INTERNATIONALE DE ASSOCIATION (FIFA) SUAPS UNIVERSITE DU MAINE FUINEL SAMUEL
FOOTBALL LES 17 LOIS DU JEU Juillet 2004 FEDERATION INTERNATIONALE DE FOOTBALL ASSOCIATION (FIFA) SUAPS UNIVERSITE DU MAINE FUINEL SAMUEL LOI 1 TERRAIN DE JEU Le terrain de jeu doit être rectangulaire
Plus en détailLes Utilisateurs dans SharePoint
Les Utilisateurs dans SharePoint La gestion des utilisateurs dans SharePoint SharePoint dont le cœur est l'outil collaboratif, Windows SharePoint Services. Chaque utilisateur (ou collaborateur) peut créer
Plus en détailCONCEPTION Support de cours n 3 DE BASES DE DONNEES
CONCEPTION Support de cours n 3 DE BASES DE DONNEES Auteur: Raymonde RICHARD PRCE UBO PARTIE III. - LA DESCRIPTION LOGIQUE ET PHYSIQUE DES DONNEES... 2 A. Les concepts du modèle relationnel de données...
Plus en détail1 Modélisation d une base de données pour une société de bourse
IN306 : Corrigé SID Christophe Garion 18 octobre 2010 Ce document est un corrigé succinct de l examen du module IN306. 1 Modélisation d une base de données pour une société de bourse Une
Plus en détailLe langage SQL Rappels
Le langage SQL Rappels Description du thème : Présentation des principales notions nécessaires pour réaliser des requêtes SQL Mots-clés : Niveau : Bases de données relationnelles, Open Office, champs,
Plus en détailEvry - M2 MIAGE Entrepôt de données
Evry - M2 MIAGE Entrepôt de données Introduction D. Ploix - M2 Miage - EDD - Introduction 1 Plan Positionnement du BI dans l entreprise Déclinaison fonctionnelle du décisionnel dans l entreprise Intégration
Plus en détailVision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007
Vision industrielle et télédétection - Détection d ellipses Guillaume Martinez 17 décembre 2007 1 Table des matières 1 Le projet 3 1.1 Objectif................................ 3 1.2 Les choix techniques.........................
Plus en détailA QUOI SERVENT LES BASES DE DONNÉES?
BASE DE DONNÉES OBJET Virginie Sans virginie.sans@irisa.fr A QUOI SERVENT LES BASES DE DONNÉES? Stockage des informations : sur un support informatique pendant une longue période de taille importante accès
Plus en détailJe suis sous procédure Dublin qu est-ce que cela signifie?
FR Je suis sous procédure Dublin qu est-ce que cela signifie? B Informations pour les demandeurs d une protection internationale dans le cadre d une procédure de Dublin en vertu de l article 4 du Règlement
Plus en détailConcevoir une base de données
Concevoir une base de données http://vanconingsloo.be/les-cours/bureautique/access/concevoir-une-base-de-donnees En fonction de vos besoins, il existe deux façons de travailler. Si vous souhaitez créer
Plus en détail#BigData Dossier de presse Mai 2014
#BigData Dossier de presse Mai 2014 La valeur du Big Data pour l entreprise Comment permettre l avènement d une culture de la donnée pour tous? Dans un monde porté par la mobilité et le Cloud, non seulement
Plus en détailLe Data Mining au service du Scoring ou notation statistique des emprunteurs!
France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative
Plus en détailWINDOWS SHAREPOINT SERVICES 2007
WINDOWS SHAREPOINT SERVICES 2007 I. TABLE DES MATIÈRES II. Présentation des «content types» (Type de contenu)... 2 III. La pratique... 4 A. Description du cas... 4 B. Création des colonnes... 6 C. Création
Plus en détailÉtude EcoVadis - Médiation Inter-Entreprises COMPARATIF DE LA PERFORMANCE RSE DES ENTREPRISES FRANCAISES AVEC CELLE DES PAYS DE L OCDE ET DES BRICS
Étude EcoVadis - Médiation Inter-Entreprises COMPARATIF DE LA PERFORMANCE RSE DES ENTREPRISES FRANCAISES AVEC CELLE DES PAYS DE L OCDE ET DES BRICS 23 mars 2015 Synthèse Avec plus de 12.000 évaluations
Plus en détailStatistiques Descriptives à une dimension
I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des
Plus en détailSQL Server 2012 et SQL Server 2014
SQL Server 2012 et SQL Server 2014 Principales fonctions SQL Server 2012 est le système de gestion de base de données de Microsoft. Il intègre un moteur relationnel, un outil d extraction et de transformation
Plus en détailRETRAITES : Y A-T-IL UNE SOLUTION IDÉALE EN EUROPE POUR UN AVENIR?
RETRAITES : Y A-T-IL UNE SOLUTION IDÉALE EN EUROPE POUR UN AVENIR? Une question européenne mais traitée dans chaque Etat membre L avenir des systèmes de retraite et ses conséquences sur la zone euro, internationalise
Plus en détailTSTI 2D CH X : Exemples de lois à densité 1
TSTI 2D CH X : Exemples de lois à densité I Loi uniforme sur ab ; ) Introduction Dans cette activité, on s intéresse à la modélisation du tirage au hasard d un nombre réel de l intervalle [0 ;], chacun
Plus en détailAgenda de la présentation
Le Data Mining Techniques pour exploiter l information Dan Noël 1 Agenda de la présentation Concept de Data Mining ou qu est-ce que le Data Mining Déroulement d un projet de Data Mining Place du Data Mining
Plus en détailREGLEMENT DU JEU «PARIS CHALLENGE LIGUE»
REGLEMENT DU JEU «PARIS CHALLENGE LIGUE» ARTICLE 1 : ORGANISATION DU JEU Le PMU, Groupement d'intérêt Economique immatriculé au Registre du Commerce et des Sociétés de PARIS sous le n SIREN 775 671 258,
Plus en détailREGARDS SUR L ÉDUCATION 2013 : POINTS SAILLANTS POUR LE CANADA
REGARDS SUR L ÉDUCATION 2013 : POINTS SAILLANTS POUR LE CANADA Regards sur l éducation est un rapport annuel publié par l Organisation de coopération et de développement économiques (OCDE) et portant sur
Plus en détailAPPRENDRE, VIVRE & JOUER AVEC LES JEUNES ESPOIRS DE L IHF
APPRENDRE, VIVRE & JOUER AVEC LES JEUNES ESPOIRS DE L IHF Règles de jeu du handball Salut les amis du handball! C est super que vous vouliez en savoir plus sur les Règles de jeu du handball! Dans ce livret,
Plus en détailDossier I Découverte de Base d Open Office
ETUDE D UN SYSTEME DE GESTION DE BASE DE DONNEES RELATIONNELLES Définition : Un SGBD est un logiciel de gestion des données fournissant des méthodes d accès aux informations. Un SGBDR permet de décrire
Plus en détailLe scoring est-il la nouvelle révolution du microcrédit?
Retour au sommaire Le scoring est-il la nouvelle révolution du microcrédit? BIM n 32-01 octobre 2002 Frédéric DE SOUSA-SANTOS Le BIM de cette semaine se propose de vous présenter un ouvrage de Mark Schreiner
Plus en détailAgrégation des portefeuilles de contrats d assurance vie
Agrégation des portefeuilles de contrats d assurance vie Est-il optimal de regrouper les contrats en fonction de l âge, du genre, et de l ancienneté des assurés? Pierre-O. Goffard Université d été de l
Plus en détailChapitre 1 : Évolution COURS
Chapitre 1 : Évolution COURS OBJECTIFS DU CHAPITRE Savoir déterminer le taux d évolution, le coefficient multiplicateur et l indice en base d une évolution. Connaître les liens entre ces notions et savoir
Plus en détailAnnexe commune aux séries ES, L et S : boîtes et quantiles
Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans
Plus en détailTHOT - Extraction de données et de schémas d un SGBD
THOT - Extraction de données et de schémas d un SGBD Pierre-Jean DOUSSET (France), Benoît ALBAREIL (France) pj@miningdb.com, benoit@miningdb.com Mots clefs : Fouille d information, base de données, système
Plus en détailIODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21
IODAA de l 1nf0rmation à la Décision par l Analyse et l Apprentissage IODAA Informations générales 2 Un monde nouveau Des données numériques partout en croissance prodigieuse Comment en extraire des connaissances
Plus en détailNF26 Data warehouse et Outils Décisionnels Printemps 2010
NF26 Data warehouse et Outils Décisionnels Printemps 2010 Rapport Modélisation Datamart VU Xuan Truong LAURENS Francis Analyse des données Avant de proposer un modèle dimensionnel, une analyse exhaustive
Plus en détailUML et les Bases de Données
CNAM UML et les Bases de Données UML et les Bases de Données. Diagramme de classes / diagramme d objets (UML)...2.. Premier niveau de modélisation des données d une application...2.2. Les éléments de modélisation...2.2..
Plus en détailAnnexe n 6 au Règlement du Statut et du Transfert des Joueurs. Règlement du Statut et du Transfert des Joueurs de Futsal
Annexe n 6 au Règlement du Statut et du Transfert des Joueurs Règlement du Statut et du Transfert des Joueurs de Futsal 13 TABLE DES MATIÈRES Chapitre Définitions page 15 ANNEXE 6 14 1 Principe 17 2 Champ
Plus en détailConception des bases de données : Modèle Entité-Association
Conception des bases de données : Modèle Entité-Association La modélisation d un problème, c est-à-dire le passage du monde réel à sa représentation informatique, se définit en plusieurs étapes pour parvenir
Plus en détailRappel sur les bases de données
Rappel sur les bases de données 1) Généralités 1.1 Base de données et système de gestion de base de donnés: définitions Une base de données est un ensemble de données stockées de manière structurée permettant
Plus en détailLES EUROPEENS ET LA QUALITE DE VIE
LES EUROPEENS ET LA QUALITE DE VIE RAPPORT REDIGE PAR INRA (EUROPE) EUROPEAN COORDINATION OFFICE S.A. POUR La Direction Générale Emploi et Affaires sociales Sécurité sociale et intégration sociale Recherche
Plus en détailLes Conditions aux limites
Chapitre 5 Les Conditions aux limites Lorsque nous désirons appliquer les équations de base de l EM à des problèmes d exploration géophysique, il est essentiel, pour pouvoir résoudre les équations différentielles,
Plus en détailPlan d études du CAS SMSI Volée 2014
Plan d études du CAS SMSI Volée 2014 SIE Système d information d entreprise Crédits ECTS : 2 Périodes : 32 «Le module SIE a pour objectif de faire connaître les fondements théoriques du système d information
Plus en détailLa rencontre du Big Data et du Cloud
La rencontre du Big Data et du Cloud Libérez le potentiel de toutes vos données Visualisez et exploitez plus rapidement les données de tous types, quelle que soit leur taille et indépendamment de leur
Plus en détailPrix du gaz et de l électricité dans l Union européenne en 2011
COMMISSARIAT GÉNÉRAL AU DÉVELOPPEMENT DURABLE n 366 Novembre 2012 Prix du gaz et de l électricité dans l Union européenne en 2011 OBRVATION ET STATISTIQU ÉNERG En 2011, le prix du gaz a augmenté dans tous
Plus en détailExtraction d informations stratégiques par Analyse en Composantes Principales
Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 dousset@irit.fr 1 Introduction
Plus en détailIntroduction au Data-Mining
Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane
Plus en détailFinancement du sport, crise économique et politique sportive
Conférence SNEP: «Sport demain, enjeu citoyen», Créteil, 30-31 mars 2012 Financement du sport, crise économique et politique sportive Wladimir ANDREFF * * Professeur émérite à l Université de Paris 1 Panthéon
Plus en détailTitre II Centres de formation des clubs professionnels
Titre II Centres de formation des clubs professionnels CHAPITRE 1 - DISPOSITIONS GÉNÉRALES ARTICLE 100 COMPÉTENCE DE LA COMMISSION NATIONALE PARITAIRE DE LA CCNMF La commission nationale paritaire de la
Plus en détailOBSERVATION ET STATISTIQUES
COMMISSARI GÉNÉRAL AU DÉVELOPPEMENT DURABLE n 461 Novembre 2013 Prix du gaz et de l électricité en France et dans l Union européenne en 2012 OBRVION ET STISTIQU ÉNERG En 2012, le prix du gaz a augmenté
Plus en détailEntrepôt de données 1. Introduction
Entrepôt de données 1 (data warehouse) Introduction 1 Présentation Le concept d entrepôt de données a été formalisé pour la première fois en 1990 par Bill Inmon. Il s agissait de constituer une base de
Plus en détailRelation entre deux variables : estimation de la corrélation linéaire
CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence
Plus en détailUML (Diagramme de classes) Unified Modeling Language
UML (Diagramme de classes) Unified Modeling Language Sommaire Introduction Objectifs Diagramme de classes Classe (Nom, attribut, opération) Visibilité et portée des constituants d une classe Association
Plus en détailLa Business Intelligence en toute simplicité :
MyReportle reporting sous excel La Business Intelligence en toute simplicité : Concevez, partagez, actualisez! En rendant les données accessibles aux personnes habilitées dans l entreprise (comptabilité,
Plus en détailT de Student Khi-deux Corrélation
Les tests d inférence statistiques permettent d estimer le risque d inférer un résultat d un échantillon à une population et de décider si on «prend le risque» (si 0.05 ou 5 %) Une différence de moyennes
Plus en détailStructure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données
Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données et le Data Mining Nous suivons le plan suivant : Fonctionnement de Spad Catalogue des méthodes (statistiques
Plus en détail