Projet Data Mining. Projet SODAS :

Dimension: px
Commencer à balayer dès la page:

Download "Projet Data Mining. Projet SODAS :"

Transcription

1 UNIVERSITE PARIS DAUPHINE DEA 127 : SYSTEME INTELLIGENT Projet Data Mining décembre 2004 Projet SODAS : Etude sur les footballeurs évoluant en Ligue 1 durant la saison Responsable : Edwin DIDAY Etudiant : Vinh TRUONG

2 SOMMAIRE INTRODUCTION... 3 I PRESENTATION GENERALE BREF HISTORIQUE LE LOGICIEL SODAS (SYMBOLIC OFFICIAL DATA ANALYSIS SYSTEM)... 4 II PRESENTATION DE LA BASE DE DONNEES... 5 III CONSTRUCTION DES OBJETS SYMBOLIQUES... 6 IV ANALYSE DE DONNEES LA METHODE SOE LA METHODE PCM LA METHODE TREE LA METHODE DIV LA METHODE PYR LA METHODE STAT CONCLUSION TRUONG Tuong Vinh Page 2

3 Introduction L analyse de données ou Data Mining a pour objectif d extraire des informations contenu dans un tableau de données, de les traiter et de les rendre visible, c'est-à-dire d y expliciter des connaissances. Ainsi en reprenant la métaphore «Data Mining», la problématique de l analyse de données est d extraire des mines de connaissances enfouies sous des amas de données. Cependant elle ne donne pas de réponse à un problème donné mais elle fournit une représentation, une image simplifiée de l ensemble des données permettant une confrontation entre elles. Nous allons dans le cadre du projet de Data Mining appliquer différentes méthodes sur une base de données concernant les équipes de football de la ligue professionnelle de football français. Pour cela, nous avons utilisé le logiciel SODAS, «un logiciel d analyse de données symboliques». L étude se porte en effet sur des concepts, qui sont dans le cadre de ce projet des classes d individus. Nous allons dans un premier temps effectué un rapide historique du domaine ainsi qu une présentation du logiciel. Par la suite, nous vous présenterons la base de données ainsi que les différents résultats obtenus. TRUONG Tuong Vinh Page 3

4 I Présentation générale 1 Bref historique Les bases théoriques de l Analyse de Données ne sont pas récentes. Certaines ont ainsi été établies au début de siècle et dans les années Elles sont nées du domaine des statistiques et de la volonté de se libérer de certaines contraintes des statistiques considérées comme abusives. Cependant le domaine était essentiellement connu et appliqué des chercheurs et les moyens restèrent limités, même si le besoin de classer, de représenter, de reconnaître les données existe depuis longtemps et dans de nombreux domaines. L avènement de l informatique change la donne. Et cela pour deux raisons. D une part, l informatique permet et facilite de nombreux calculs complexes (visualisation des résultats). D autre part, l évolution des systèmes de base de données ainsi de leur gestion permettent un stockage d une quantité de plus en plus grande de données. Rapidement, cette accumulation de données (souvent sous forme de tableaux) rend difficile leur exploitation dans leur ensemble. Cette problématique se retrouve en particuliers au niveau des entrepôts de données dans le cadre du décisionnel. Le data mining dépasse alors le cadre universitaire. L Analyse de Données concernent aujourd hui un grand nombre de domaine. On peut citer comme exemple la médecine, l économie, les sciences de la vie, de l ingénieur, de la terre, les systèmes d expert 2 Le logiciel SODAS (Symbolic Official Data Analysis System) Le logiciel SODAS est un prototype public issu du projet européen éponyme de EUROSTAT. Le projet implique 15 équipes provenant de 9 pays européens (Allemagne, Belgique, Luxembourg, Grèce, Italie, Espagne, Portugal, France, Finlande) et a pour objectif de fournir un cadre aux différentes avancées récentes et futures de l analyse de données symboliques. Ainsi le but du logiciel SODAS est de construire à partir d une base de données des objets symboliques et de les analyser par des méthodes d Analyse de Données Symboliques. Nous pouvons citer par exemple les méthodes suivantes qui ont été généralisées aux données symboliques : - L analyse en composantes principales (PCM). - L analyse de données factorielle discriminante (FDA). - Des méthodes de statistiques descriptives (histogrammes, dispersion ). - Des méthodes de classifications. - Les arbres de décision. -. TRUONG Tuong Vinh Page 4

5 II Présentation de la base de données Pour notre étude, nous allons nous appuyer sur une base de données existante. (Alexandre Beruet Avril 2003). Elle a été créée au cours de l année 2003 et à partir de deux sites internet : - Le site Yahoo Sport: - Le site du journal l Équipe: Elle permet de décrire les footballeurs du championnat français évoluant dans un club professionnel de Ligue 1. Un joueur est alors caractérisé par un nom, une taille en cm, un poids en kg, son pays d origine (pays), le nombre de matchs joués (nbmatchsjoués), le nombre de buts (nbbuts), le nombre de cartons jaunes et rouges reçus lors de la saison (respectivement nbcartonsj et nbcartonsr), l équipe dans lequel il évolue. Un joueur peut être international ou non et peut être aussi figuré parmi les 5 meilleurs joueurs du championnat évoluant à son poste selon le quotidien L Equipe (top5). Un club de football est caractérisé par son ancienneté (age), une affluence moyenne, le nombre de buts marqués et encaissés et de leurs classes respectifs (CLButs et CLContres), son classement lors de la conception de la base de données. Un club peut être joué une coupe européenne (europe). La base contient alors 3 relations: Joueur (nom, pays, age, taille, poids, poste, nbmatchsjoués, nbbuts, nbcartonsj, nbcartonsr, top5, international, equipe). Club (nom,age, affluence, nbbuts, CLButs, nbcontres, CLContres, classement, europe) Pays_Continents (pays, continent). On a rajouté une autre relation pour introduire des classes d âge : ClasseAge (AgeMin, AgeMax, ClasseAge). Le schéma UML ci-dessous modélise la base : Club nom age affluence nbbuts CLButs nbcontres CLContres Classement europe Joueur nom pays age taille poids poste nbmatchsjoués nbbuts nbcartonsj nbcartonsr top5 international equipe Pays pays continent ClasseAge AgeMin AgeMax ClasseAge TRUONG Tuong Vinh Page 5

6 III Construction des objets symboliques On considère les joueurs de football comme individus de notre projet. Le concept qu on va étudier est le celui des joueurs de football appartenant à une tranche d âge (ClasseAge) qui correspond ainsi à une classe d individus. On va construire à partir du logiciel DB2SO les descriptions symboliques de ces concepts par généralisation des propriétés des individus qui leur sont associés. Les données en entrée du logiciel sont issues de requêtes SQL sur cette base et sa structure va permettre d identifier les individus et les concepts. La table de données résultant de la requête doit être organisée de telle façon à avoir en première colonne les individus et en deuxième les concepts : Individu Concept Variables Base de données relationnelle Requête SQL Table de données résultant de la requête On obtient alors le contexte de notre étude c est-à-dire les individus, les variables qui les décrivent et les concepts associés aux classes d individus. Nous avons utilisé la requête ci-dessous pour construire une table appropriée : SELECT Joueur.nom, ClasseAge.Classe, Club.nom, Joueur.pays, Joueur.taille, Joueur.poids, Joueur.poste, Joueur.nbMatchsJoues, Joueur.nbButs, Joueur.nbCartonsJ, Joueur.nbCartonsR, Joueur.top5, Joueur.international FROM ClasseAge, Club INNER JOIN (Pays_Continents INNER JOIN Joueur ON Pays_Continents.pays=Joueur.pays) ON Club.nom=Joueur.equipe WHERE Joueur.age BETWEEN ClasseAge.AgeMin AND ClasseAge.AgeMax; DB2SO associe alors une description à chaque concept en créant des données dites symboliques à partir des données initiales. On a représenté ci-dessous une partie de la table obtenue : TRUONG Tuong Vinh Page 6

7 Table de données symboliques DB2SO a ainsi généré deux types de variables symboliques : - des intervalles pour les variables quantitatives (taille, poids, nbmatchsjoués, nbbuts, nbcartonsr, nbcartonsj). - des variables multivaluées avec des poids pour les variables quantitatives (Club.nom, Joueur.pays, Joueur.poste, top5, international). A partir de la table générée par le logiciel, nous pouvons appliquer différentes méthodes d Analyse de Données Symboliques. TRUONG Tuong Vinh Page 7

8 IV Analyse de données 1 La méthode SOE La méthode SOE (Symbolic Object Editor) permet de représenter les objets symboliques construits en fournissant la table de données symboliques ou des graphes 2D/3D. Les représentations sous forme de graphe permettent de visualiser les intervalles, les variables multivaluées avec ou non un poids, les dépendances logiques et les taxonomies. Chaque axe représente une variable symbolique. Nous allons dans cette partie étudier quelques classes d individus (les tranches d âges ans, ans, ans et 34 ans et plus). Classe d'âge 35+ Nous avons représentés le concept 35 ans et plus. Dans le graphe en 2D, les variables sont reliés et ne montrent pas les détails des fréquences pour les variables qualitatives (par exemple pays). Cependant, nous avons une image générale du concept. Ainsi nous pouvoir voir que les joueurs de plus de 35 ans sont pour la majorité des défenseurs (56%), marquent relativement peu de but (entre 0 et 5), ne sont pas internationaux mais ils sont présents dans 4 clubs Montpellier, Nice, Guingamp et Ajaccio. Cela montre une tendance observée dans le football : les joueurs qui font une plus longue carrière sont en majorité des défenseurs et les gardiens. Nous pouvons le vérifier sur le graphe 3D. Il semble que ce poste soit moins exposé aux blessures et que l expérience permet de compenser les problèmes physiques. Ce sont des joueurs d expériences mais la plupart n ont pas été sélectionné dans leur équipe nationale. Cependant, les internationaux sont peu nombreux (de même que pour le top5). Il n est donc pas étonnant de voir que le profil général des joueurs de toutes classes d âges correspond à un footballeur français non international et ne faisant pas parti du top 5. TRUONG Tuong Vinh Page 8

9 Classe d'âge 35 ans et + Nous voyons la fréquence relativement élevée de gardiens. Ce fait est à noter puisqu il n y a qu un seul gardien sur les onze joueurs d une équipe. Classe d âges ans Pour la tranche d âges ans, nous avons la tendance inverse au niveau du poste. La plupart sont des attaquants. Cependant, ils marquent peu. Ceci s explique par le fait qu ils sont jeunes et qu ils débutent dans le milieu professionnel. De plus nous pouvons remarqués que la plupart de ces joueurs jouent dans le club de Montpellier, club réputé pour son centre de formation. Nous pouvons constater la ressemblance du graphe avec la classe d âge précédente mise à part les clubs et le poste. TRUONG Tuong Vinh Page 9

10 Classe d'âge ans Le graphe 3D montre qu on a bien des fréquences pratiquement opposées à la première classe d âges. Les jeunes qui ont joués sont pour la plupart des attaquants ou des milieux. Or comme pour les gardiens, une équipe possède moins d attaquants que de milieux ou des défenseurs. Le fait qu il y ait 55% de joueurs professionnels qui jouent attaquant est assez remarquable. Ceci montre que le poste de défenseur demande plus d expérience et de maturité que ceux du milieu ou en attaque. En effet, le jeu entre les défenseurs doit être plus coordonné (alignement des défenseurs, couverture, ). Classe d'âges ans Un joueur de la classe âge ans est un défenseur qui joue à Nice. Nous pouvons remarquer une différence notable par rapport aux autres classes et notamment pour le nombre de buts marqués et le nombre de cartons jaunes. Nous pouvons juste supposer qu à cet âge, les joueurs jouent plus souvent que les ans et les plus de 35 ans. On peut remarquer que le graphe en 2D n a pas mis en valeur une tendance moyenne puisque 12% des joueurs de cette tranche d âge jouent à Nice. Mais elle montre la valeur de la variable qui a le plus de poids. TRUONG Tuong Vinh Page 10

11 Classe d'âge ans De nouveau, on peut constater qu un joueur ayant entre ans a plus de probabilité d être un milieu ou un défenseur qui joue à Troyes. 2 La méthode PCM Nous allons utiliser dans cette section la méthode d analyse en composantes principales qui a été généralisée à des données symboliques. La variation interne fait apparaître non plus des points sur le graphe mais des rectangles. Le tableau de corrélation ci-dessous a été obtenu : Axe1 Axe2 Axe3 Axe4 taille poids nbmatchsjoues nbbuts nbcartonsj nbcartonsr L axe 1 semble être corrélé avec le nombre de buts et le nombre de cartons reçus (rouges ou jaunes). L axe 2 semble être corrélé avec la taille et le poids, le troisième avec le nombre de matchs joués et le quatrième avec le poids. Cependant, on obtient aussi ce résultat : %inertie PC1: PC2: PC3: PC4: TRUONG Tuong Vinh Page 11

12 Ceci montre que l information n est pas vraiment résumée par le premier axe et que les 4 premiers axes résument moins de 70% de l information. En choisissant les 2 premiers axes, on obtient le graphe suivant : Méthode PCM: représentation des concepts dans un plan Dans la méthode d Analyse en Composantes Principales, on interprète les proximités entre les variables. Dans le cas des données symboliques, il est plus délicat de le faire pour des rectangles à part la représentation de 2 concepts disjoints et éloignés. Dans le cas des classes d âges, les rectangles sont imbriqués l une dans l autre, ce qui peut nous permettre de faire une interprétation sur les variations, ce que l on peut faire avec la méthode SOE. Nous allons essayer de visualiser les centres des rectangles : Méthode PCM:Représentation des concepts dans un plan Dans ce cas la nous pouvons distinguer 3 classes relativement distinctes : - Les joueurs ayant entre 26 et 29 ans. - Les joueurs ayant entre 24 et 25 ans TRUONG Tuong Vinh Page 12

13 - Les joueurs ayant entre ans et 30 ans et plus Cette discrimination se fait essentiellement sur le premier axe c'est-à-dire par le nombre de buts et de cartons reçus. Cependant, nous avons vu que l information n était pas vraiment résumée sur les axes 1 et 2. Il semble donc difficile d exploiter cette information. Méthode PCM:Représentation des concepts dans un plan Dans ce cas, aucune discrimination n est possible. Tous les concepts se ressemblent Les données symboliques ont introduit une certaine imprécision dans l exploitation des résultats de la méthode et particulièrement dans le cadre de notre étude. Apres examen de la base de données, il s avère qu on ne puisse pas obtenir de résultats pertinents avec la base actuelle en utilisant la méthode PCM. 3 La méthode TREE Nous avons introduit dans cette partie la variable classe MoyenneButsParClasse, qui représente la moyenne des buts marqués par les joueurs français jouant dans le championnat français pour chaque tranche d âges. Cette variable étant construite avec des requêtes SQL est une variable quantitative. Nous avons donc du la transformer en variable quantitative. Les variables explicatives sont les variables quantitatives suivantes: - taille. - poids. - nbmatchjoues. - nbbuts. - nbcartonsj. - nbcartonsr. TRUONG Tuong Vinh Page 13

14 En appliquant, la méthode d arbre de segmentation, nous obtenons l arbre ci-dessous : < 2 >0,8 ( )!!----1[ nbcartonsr <= ]! < 3 >1,7 ( ) Ainsi le nombre de cartons rouges est la variable qui explique le mieux la moyenne de buts. Globalement, plus on prend de cartons rouges moins on marque. On peut supposer que ceux qui prennent le plus de cartons rouges sont les défenseurs, qui logiquement marquent peu. 4 La méthode DIV La méthode DIV (divisive classification) permet de faire une classification des concepts que DB2SO a construit. Nous allons dans un premier temps sélectionner les variables qualitatives puis les variables quantitatives. Dans le premier cas, le logiciel trouve deux classes : Cluster 1 (n=2) : "34+" "30-31" Cluster 2 (n=7) : "24-25" "22-23" "26-27" "18-19" "20-21" "28-29" "32-33" Explicated inertia : THE CLUSTERING TREE : the number noted at each node indicates the order of the divisions - Ng <-> yes and Nd <-> no Classe 1 (Ng=2)!! [poste <= Défenseur]! Classe 2 (Nd=7) Le logiciel a utilisé l ordre suivant : Poste (Initial order) 1- Gardien 2- Défenseur 3- Milieu 4- Attaquant TRUONG Tuong Vinh Page 14

15 Ainsi on retrouve les résultats qu on a pu observer avec SOE : Les défenseurs et les gardiens sont dans des tranches d âges «30-31» et «34 et +», ce qui correspond à des âges relativement avancés dans le milieu du football professionnel. Dans le cas, où on utilise des variables continues, nous obtenons le résultats suivants : Cluster 1 (n=4) : "34+" "18-19" "30-31" "32-33" Cluster 2 (n=5) : "24-25" "22-23" "26-27" "20-21" "28-29" Explicated inertia : THE CLUSTERING TREE : the number noted at each node indicates the order of the divisions - Ng <-> yes and Nd <-> no Classe 1 (Ng=4)!! [nbbuts <= ]! Classe 2 (Nd=5) On remarque dans ce cas, que le nombre de buts permet de discriminer les joueurs. Les plus jeunes et les plus âgés semblent moins marquer. Cela s explique par le fait que d une part les jeunes sont peu expérimentés et que les joueurs de plus de 30 ans sont pratiquement en fin de carrière. De plus, nous avons vu qu il y a une grande proportion de défenseurs avec un âge de plus de 30 ans. 5 La méthode PYR La méthode PYR permet de construire un ensemble de parties appelé «pyramide» à partir des concepts. Nous avons appliqué la méthode sur toutes les variables. On obtient alors la pyramide ci-dessous : Where_the_labels_are_of_the_individuals_are: 1.="34+" 2.="24-25" 3.="22-23" 4.="26-27" 5.="18-19" 6.="20-21" 7.="30-31" 8.="28-29" 9.="32-33" Where_the_labels_are_of_the_variables_are: y1.=nom_1 TRUONG Tuong Vinh Page 15

16 y2.=pays y3.=taille y4.=poids y5.=poste y6.=nbmatchsjoues y7.=nbbuts y8.=nbcartonsj y9.=nbcartonsr y10.=top5 y11.=international On obtient l ordre suivant (en partant du haut): 34+,18-19 ;32-33 ;30-31 ;20-21 ;22-23 ;24-25 ;26-27 ; On remarque que les classes successives d âges sont «proches», ce qui semble relativement normal. Cependant, la classe fait exception car l algorithme l a réunie avec la classe 34+. On peut supposer que c est au niveau des performances que les deux classes sont proches et en particuliers le nombre de buts et le nombre de matchs joués. TRUONG Tuong Vinh Page 16

17 6 La méthode STAT La méthode STAT regroupe en fait plusieurs méthodes provenant de la statistique étendues aux objets symboliques. On a représenté les fréquences des concepts pour des tailles de joueurs. Nous pouvons constater que globalement la taille moyenne des joueurs appartenant aux différentes classes se situent entre 1,70 et 1,90. Nous pouvons aussi utilisé un graphe biplot. Nous avons par exemple sélectionner la taille et le nombre de buts. TRUONG Tuong Vinh Page 17

18 Nous remarquons sur le graphe que les joueurs se trouvant dans la classe marquent le plus de buts. De plus, les personnes relativement de petite taille sont plutôt jeune. Nous remarquons de nouveau la similarité entre les classes d âges 34+ et ans. Exemple de graphe de capacités : On voit que dans les classes d âges, il y a peu de gardiens. Ceci semble logique vu le nombre peu élevé de personnes jouant à ce poste par rapport aux effectifs d une équipe. On remarque que la variation pour le poste de milieu est moins élevée que pour les autres postes. D une part, on avait vu que beaucoup de personnes jouaient milieu de terrain et d autre part, on peut supposer au vu des autres méthodes que la variation pour les postes de défenseurs et d attaquants est due aux classes et 34+. TRUONG Tuong Vinh Page 18

19 Conclusion Le projet SODAS nous a permis d appliquer les méthodes vues en cours sur des cas concrets (classes d âges des footballeurs de Ligue 1 pour cette étude). Nous n avons pu utiliser qu une ancienne version du logiciel. On a en effet rencontré quelques problèmes avec la version On a quand même pu obtenir des résultats sur un bon nombre de méthodes. En particuliers, nous avons pu mettre en évidence la «ressemblance» entre les classes d âges ans et plus de 34 ans. Malheureusement, la méthode PCM n a pas donné des résultats exploitables. Ceci est certainement dû au fait que la base a été construite spécifiquement pour les concepts équipe et non classes d âges. Ceci montre que les outils du datamining ne peuvent se passer de l utilisateur pour la recherche des pépites dans la base de données. De plus, les résultats obtenus n ont que peu de valeur sans interprétations. Le datamining rassemble ainsi des outils qui vont permettre à l utilisateur ou à l aider à trouver des informations à partir d une grande quantité d informations. L analyse de Données Symboliques permet d étendre l analyse de données classiques en étudiant des concepts et non des individus. TRUONG Tuong Vinh Page 19

DATA MINING - Analyses de données symboliques sur les restaurants

DATA MINING - Analyses de données symboliques sur les restaurants Master 2 Professionnel - Informatique Décisionnelle DATA MINING - Analyses de données symboliques sur les restaurants Etudiants : Enseignant : Vincent RICHARD Edwin DIDAY Seghir SADAOUI SOMMAIRE I Introduction...

Plus en détail

Datamining. Université Paris Dauphine DESS ID 2004/2005. Séries télévisées nominées aux oscars. Enseignant : Réalisé par : Mars 2005. Mr E.

Datamining. Université Paris Dauphine DESS ID 2004/2005. Séries télévisées nominées aux oscars. Enseignant : Réalisé par : Mars 2005. Mr E. Université Paris Dauphine DESS ID 2004/2005 Datamining Séries télévisées nominées aux oscars Mars 2005 Enseignant : Mr E. DIDAY Réalisé par : Mounia CHERRAD Anne-Sophie REGOTTAZ Sommaire Introduction...

Plus en détail

Critères pour avoir la meilleure équipe!

Critères pour avoir la meilleure équipe! PROJET DATAMINING Basket-ball professionnel "NBA" : Critères pour avoir la meilleure équipe! Réalisé par : Anasse LAHLOU KASSI Houssam Eddine HOUBAINE DESS TIO DESS ID Année Scolaire : SOMMAIRE INTRODUCTION...

Plus en détail

Université Paris IX DAUPHINE DATE : 24/04/06

Université Paris IX DAUPHINE DATE : 24/04/06 Master Informatique Décisionnelle Application des outils de l'informatique Décisionnelle en entreprise ETUDE SUR LES MARQUES ET LES CONTRUCTEUR DES VÉHICULES APPARTENANT AUX CLIENTS D UNE COMPAGNIE D ASSURANCE

Plus en détail

COACH LIGUE 1 SAISON 2014/2015

COACH LIGUE 1 SAISON 2014/2015 COACH LIGUE 1 SAISON 2014/2015 INTRODUCTION LE PRINCIPE Coach Ligue 1 est un jeu de management de football sur Internet basé sur le Championnat de France de Ligue 1. Le site est : www.coachligue1.fr Le

Plus en détail

Projet de Datamining Supervisé (SODAS) Analyse des régions françaises

Projet de Datamining Supervisé (SODAS) Analyse des régions françaises Master 2 ème Année Ingénierie Statistique et financière Projet de Datamining Supervisé (SODAS) Analyse des régions françaises Réalisé par : Nicolas CHAIGNEAUD Nora SLIMANI Année universitaire 2007-2008

Plus en détail

WEBSELL. Projet DATAMINING

WEBSELL. Projet DATAMINING WEBSELL Projet DATAMINING Analyse des données dans le cadre d une étude de banchmarking DESS ID Session 2005/2006 Mariam GASPARIAN [ Page 1 ] SOMMAIRE 1. INTRODUCTION... 3 2. METHODES ET OUTILS... 4 2.1.

Plus en détail

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1 Christophe CANDILLIER Cours de DataMining mars 2004 age 1 1. Introduction 2. rocessus du DataMining 3. Analyse des données en DataMining 4. Analyse en Ligne OLA 5. Logiciels 6. Bibliographie Christophe

Plus en détail

RapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/2011. 1.1 Présentation. 1.2 Ressources

RapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/2011. 1.1 Présentation. 1.2 Ressources Master Maths Finances 2010/2011 Data Mining janvier 2011 RapidMiner 1 Introduction 1.1 Présentation RapidMiner est un logiciel open source et gratuit dédié au data mining. Il contient de nombreux outils

Plus en détail

La segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM

La segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM La segmentation à l aide de EG-SAS A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM Définition de la segmentation - Au lieu de considérer une population dans son ensemble,

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme

Plus en détail

ESIEA PARIS 2011-2012

ESIEA PARIS 2011-2012 ESIEA PARIS 2011-2012 Examen MAT 5201 DATA MINING Mardi 08 Novembre 2011 Première Partie : 15 minutes (7 points) Enseignant responsable : Frédéric Bertrand Remarque importante : les questions de ce questionnaire

Plus en détail

2 Serveurs OLAP et introduction au Data Mining

2 Serveurs OLAP et introduction au Data Mining 2-1 2 Serveurs OLAP et introduction au Data Mining 2-2 Création et consultation des cubes en mode client-serveur Serveur OLAP Clients OLAP Clients OLAP 2-3 Intérêt Systèmes serveurs et clients Fonctionnalité

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

Introduction au datamining

Introduction au datamining Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des

Plus en détail

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems

Plus en détail

INTRODUCTION AU DATA MINING

INTRODUCTION AU DATA MINING INTRODUCTION AU DATA MINING 6 séances de 3 heures mai-juin 2006 EPF - 4 ème année - Option Ingénierie d Affaires et de Projets Bertrand LIAUDET TP DE DATA MINING Le TP et le projet consisteront à mettre

Plus en détail

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI 1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage

Plus en détail

Analyse trimestrielle du marché des jeux en ligne en France. Autorité de régulation des jeux en ligne Données T3 2013

Analyse trimestrielle du marché des jeux en ligne en France. Autorité de régulation des jeux en ligne Données T3 2013 1 Analyse trimestrielle du marché des jeux en ligne en France 3 ème trimestre 2013 2 Synthèse des données d activité Les éléments suivants ont été constitués sur la base des données transmises par les

Plus en détail

Créer le schéma relationnel d une base de données ACCESS

Créer le schéma relationnel d une base de données ACCESS Utilisation du SGBD ACCESS Polycopié réalisé par Chihab Hanachi et Jean-Marc Thévenin Créer le schéma relationnel d une base de données ACCESS GENERALITES SUR ACCESS... 1 A PROPOS DE L UTILISATION D ACCESS...

Plus en détail

Âge effectif de sortie du marché du travail

Âge effectif de sortie du marché du travail Extrait de : Panorama des pensions 2013 Les indicateurs de l'ocde et du G20 Accéder à cette publication : http://dx.doi.org/10.1787/pension_glance-2013-fr Âge effectif de sortie du marché du travail Merci

Plus en détail

Introduction à la B.I. Avec SQL Server 2008

Introduction à la B.I. Avec SQL Server 2008 Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide

Plus en détail

Travailler avec les télécommunications

Travailler avec les télécommunications Travailler avec les télécommunications Minimiser l attrition dans le secteur des télécommunications Table des matières : 1 Analyse de l attrition à l aide du data mining 2 Analyse de l attrition de la

Plus en détail

COURS DE DATA MINING 4 : MODELISATION NON-SUPERVISEE CLASSIFICATIONS AUTOMATIQUES

COURS DE DATA MINING 4 : MODELISATION NON-SUPERVISEE CLASSIFICATIONS AUTOMATIQUES COURS DE DATA MINING 4 : MODELISATION NON-SUPERVISEE CLASSIFICATIONS AUTOMATIQUES EPF 4/ 5 ème année - Option Ingénierie d Affaires et de Projets - Finance Bertrand LIAUDET 4 : Modélisation non-supervisée

Plus en détail

LIVRE BLANC Décembre 2014

LIVRE BLANC Décembre 2014 PARSING MATCHING EQUALITY SEARCH LIVRE BLANC Décembre 2014 Introduction L analyse des tendances du marché de l emploi correspond à l évidence à une nécessité, surtout en période de tension comme depuis

Plus en détail

Travaux pratiques avec RapidMiner

Travaux pratiques avec RapidMiner Travaux pratiques avec RapidMiner Master Informatique de Paris 6 Spécialité IAD Parcours EDOW Module Algorithmes pour la Fouille de Données Janvier 2012 Prise en main Généralités RapidMiner est un logiciel

Plus en détail

Thibault Denizet. Introduction à SSIS

Thibault Denizet. Introduction à SSIS Thibault Denizet Introduction à SSIS 2 SSIS - Introduction Sommaire 1 Introduction à SQL Server 2008 Integration services... 3 2 Rappel sur la Business Intelligence... 4 2.1 ETL (Extract, Transform, Load)...

Plus en détail

Manipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner

Manipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner Le cas Orion Star Manipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner Le cas Orion Star... 1 Manipulation de données avec SAS Enterprise Guide et modélisation

Plus en détail

GOL502 Industries de services

GOL502 Industries de services GOL502 Industries de services Conception d un service Partie IIb Version 2013 Introduction Conception d un service partie IIb Nous verrons dans ce chapitre Modélisation d un service; Langage de modélisation

Plus en détail

Introduction aux outils BI de SQL Server 2014. Fouille de données avec SQL Server Analysis Services (SSAS)

Introduction aux outils BI de SQL Server 2014. Fouille de données avec SQL Server Analysis Services (SSAS) MIT820: Entrepôts de données et intelligence artificielle Introduction aux outils BI de SQL Server 2014 Fouille de données avec SQL Server Analysis Services (SSAS) Description générale Ce tutoriel a pour

Plus en détail

Qui sont les enseignants?

Qui sont les enseignants? Extrait de : Regards sur l'éducation 2008 : Panorama Accéder à cette publication : http://dx.doi.org/10.1787/9789264040649-fr Qui sont les enseignants? Merci de citer ce chapitre comme suit : OCDE (2009),

Plus en détail

Statistique : Résumé de cours et méthodes

Statistique : Résumé de cours et méthodes Statistique : Résumé de cours et méthodes 1 Vocabulaire : Population : c est l ensemble étudié. Individu : c est un élément de la population. Effectif total : c est le nombre total d individus. Caractère

Plus en détail

A. Structurer le catalogue. v Dans le menu Catalogue, sélectionnez Catégories. 1. Les catégories. Chapitre 6 : Construire le catalogue ...

A. Structurer le catalogue. v Dans le menu Catalogue, sélectionnez Catégories. 1. Les catégories. Chapitre 6 : Construire le catalogue ... Chapitre 6 :. Construire. le catalogue 177 Chapitre 6 : Construire le catalogue PrestaShop 1.5 - Créer un site de e-commerce A. Structurer le catalogue Ne vous précipitez pas pour créer vos produits immédiatement

Plus en détail

1 Introduction et installation

1 Introduction et installation TP d introduction aux bases de données 1 TP d introduction aux bases de données Le but de ce TP est d apprendre à manipuler des bases de données. Dans le cadre du programme d informatique pour tous, on

Plus en détail

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p. STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,

Plus en détail

Reconstruction de bâtiments en 3D à partir de nuages de points LIDAR

Reconstruction de bâtiments en 3D à partir de nuages de points LIDAR Reconstruction de bâtiments en 3D à partir de nuages de points LIDAR Mickaël Bergem 25 juin 2014 Maillages et applications 1 Table des matières Introduction 3 1 La modélisation numérique de milieux urbains

Plus en détail

Analyse trimestrielle du marché des jeux en ligne en France

Analyse trimestrielle du marché des jeux en ligne en France Analyse trimestrielle du marché des jeux en ligne en France 1 er trimestre 2013 2 Synthèse des données d activité Les éléments suivants ont été constitués sur la base des données transmises par les opérateurs

Plus en détail

Entraînement, consolidation, structuration... Que mettre derrière ces expressions?

Entraînement, consolidation, structuration... Que mettre derrière ces expressions? Entraînement, consolidation, structuration... Que mettre derrière ces expressions? Il est clair que la finalité principale d une démarche d investigation est de faire acquérir des connaissances aux élèves.

Plus en détail

Séries Statistiques Simples

Séries Statistiques Simples 1. Collecte et Représentation de l Information 1.1 Définitions 1.2 Tableaux statistiques 1.3 Graphiques 2. Séries statistiques simples 2.1 Moyenne arithmétique 2.2 Mode & Classe modale 2.3 Effectifs &

Plus en détail

L indice de SEN, outil de mesure de l équité des systèmes éducatifs. Une comparaison à l échelle européenne

L indice de SEN, outil de mesure de l équité des systèmes éducatifs. Une comparaison à l échelle européenne L indice de SEN, outil de mesure de l équité des systèmes éducatifs. Une comparaison à l échelle européenne Sophie Morlaix To cite this version: Sophie Morlaix. L indice de SEN, outil de mesure de l équité

Plus en détail

Problèmes de dénombrement.

Problèmes de dénombrement. Problèmes de dénombrement. 1. On se déplace dans le tableau suivant, pour aller de la case D (départ) à la case (arrivée). Les déplacements utilisés sont exclusivement les suivants : ller d une case vers

Plus en détail

Exploiter les statistiques d utilisation de SQL Server 2008 R2 Reporting Services

Exploiter les statistiques d utilisation de SQL Server 2008 R2 Reporting Services Exploiter les statistiques d utilisation de SQL Server 2008 R2 Reporting Services Nous verrons dans cet article comment exploiter simplement les données de Log de SQL Server 2008 R2 Reporting Services

Plus en détail

FAISABILITÉ D UN ORGANISME EUROPÉEN Supporters Direct RÉSUMÉ LONDRES, AOÛT 2008 RÉSUMÉ

FAISABILITÉ D UN ORGANISME EUROPÉEN Supporters Direct RÉSUMÉ LONDRES, AOÛT 2008 RÉSUMÉ FAISABILITÉ D UN ORGANISME EUROPÉEN Supporters Direct LONDRES, AOÛT 2008 RÉALISÉ POUR L UEFA PAR Supporters Direct Reconnaissons les supporters comme un élément essentiel de l identité des clubs. Michel

Plus en détail

Master Exploration Informatique des données Data Mining & Business Intelligence. Evelyne CHARIFOU Priscillia CASSANDRA

Master Exploration Informatique des données Data Mining & Business Intelligence. Evelyne CHARIFOU Priscillia CASSANDRA Master Exploration Informatique des données Data Mining & Business Intelligence Groupe 5 Piotr BENSALEM Ahmed BENSI Evelyne CHARIFOU Priscillia CASSANDRA Enseignant Françoise FOGELMAN Nicolas DULIAN SOMMAIRE

Plus en détail

La coordination des soins de santé en Europe

La coordination des soins de santé en Europe La coordination des soins de santé en Europe Droits des personnes assurées et des membres de leur famille selon les règlements (CE) n 883/2004 et (CE) n 987/2009 La coordination des soins de santé en

Plus en détail

Analyse de grandes bases de données en santé

Analyse de grandes bases de données en santé .. Analyse de grandes bases de données en santé Alain Duhamel Michaël Genin Mohamed Lemdani EA 2694 / CERIM Master 2 Recherche Biologie et Santé Journée Thématique Fouille de Données Plan. 1 Problématique.

Plus en détail

Encryptions, compression et partitionnement des données

Encryptions, compression et partitionnement des données Encryptions, compression et partitionnement des données Version 1.0 Grégory CASANOVA 2 Compression, encryption et partitionnement des données Sommaire 1 Introduction... 3 2 Encryption transparente des

Plus en détail

FOOTBALL LES 17 LOIS DU JEU. Juillet 2004 FEDERATION INTERNATIONALE DE ASSOCIATION (FIFA) SUAPS UNIVERSITE DU MAINE FUINEL SAMUEL

FOOTBALL LES 17 LOIS DU JEU. Juillet 2004 FEDERATION INTERNATIONALE DE ASSOCIATION (FIFA) SUAPS UNIVERSITE DU MAINE FUINEL SAMUEL FOOTBALL LES 17 LOIS DU JEU Juillet 2004 FEDERATION INTERNATIONALE DE FOOTBALL ASSOCIATION (FIFA) SUAPS UNIVERSITE DU MAINE FUINEL SAMUEL LOI 1 TERRAIN DE JEU Le terrain de jeu doit être rectangulaire

Plus en détail

Les Utilisateurs dans SharePoint

Les Utilisateurs dans SharePoint Les Utilisateurs dans SharePoint La gestion des utilisateurs dans SharePoint SharePoint dont le cœur est l'outil collaboratif, Windows SharePoint Services. Chaque utilisateur (ou collaborateur) peut créer

Plus en détail

CONCEPTION Support de cours n 3 DE BASES DE DONNEES

CONCEPTION Support de cours n 3 DE BASES DE DONNEES CONCEPTION Support de cours n 3 DE BASES DE DONNEES Auteur: Raymonde RICHARD PRCE UBO PARTIE III. - LA DESCRIPTION LOGIQUE ET PHYSIQUE DES DONNEES... 2 A. Les concepts du modèle relationnel de données...

Plus en détail

1 Modélisation d une base de données pour une société de bourse

1 Modélisation d une base de données pour une société de bourse IN306 : Corrigé SID Christophe Garion 18 octobre 2010 Ce document est un corrigé succinct de l examen du module IN306. 1 Modélisation d une base de données pour une société de bourse Une

Plus en détail

Le langage SQL Rappels

Le langage SQL Rappels Le langage SQL Rappels Description du thème : Présentation des principales notions nécessaires pour réaliser des requêtes SQL Mots-clés : Niveau : Bases de données relationnelles, Open Office, champs,

Plus en détail

Evry - M2 MIAGE Entrepôt de données

Evry - M2 MIAGE Entrepôt de données Evry - M2 MIAGE Entrepôt de données Introduction D. Ploix - M2 Miage - EDD - Introduction 1 Plan Positionnement du BI dans l entreprise Déclinaison fonctionnelle du décisionnel dans l entreprise Intégration

Plus en détail

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007

Vision industrielle et télédétection - Détection d ellipses. Guillaume Martinez 17 décembre 2007 Vision industrielle et télédétection - Détection d ellipses Guillaume Martinez 17 décembre 2007 1 Table des matières 1 Le projet 3 1.1 Objectif................................ 3 1.2 Les choix techniques.........................

Plus en détail

A QUOI SERVENT LES BASES DE DONNÉES?

A QUOI SERVENT LES BASES DE DONNÉES? BASE DE DONNÉES OBJET Virginie Sans virginie.sans@irisa.fr A QUOI SERVENT LES BASES DE DONNÉES? Stockage des informations : sur un support informatique pendant une longue période de taille importante accès

Plus en détail

Je suis sous procédure Dublin qu est-ce que cela signifie?

Je suis sous procédure Dublin qu est-ce que cela signifie? FR Je suis sous procédure Dublin qu est-ce que cela signifie? B Informations pour les demandeurs d une protection internationale dans le cadre d une procédure de Dublin en vertu de l article 4 du Règlement

Plus en détail

Concevoir une base de données

Concevoir une base de données Concevoir une base de données http://vanconingsloo.be/les-cours/bureautique/access/concevoir-une-base-de-donnees En fonction de vos besoins, il existe deux façons de travailler. Si vous souhaitez créer

Plus en détail

#BigData Dossier de presse Mai 2014

#BigData Dossier de presse Mai 2014 #BigData Dossier de presse Mai 2014 La valeur du Big Data pour l entreprise Comment permettre l avènement d une culture de la donnée pour tous? Dans un monde porté par la mobilité et le Cloud, non seulement

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

WINDOWS SHAREPOINT SERVICES 2007

WINDOWS SHAREPOINT SERVICES 2007 WINDOWS SHAREPOINT SERVICES 2007 I. TABLE DES MATIÈRES II. Présentation des «content types» (Type de contenu)... 2 III. La pratique... 4 A. Description du cas... 4 B. Création des colonnes... 6 C. Création

Plus en détail

Étude EcoVadis - Médiation Inter-Entreprises COMPARATIF DE LA PERFORMANCE RSE DES ENTREPRISES FRANCAISES AVEC CELLE DES PAYS DE L OCDE ET DES BRICS

Étude EcoVadis - Médiation Inter-Entreprises COMPARATIF DE LA PERFORMANCE RSE DES ENTREPRISES FRANCAISES AVEC CELLE DES PAYS DE L OCDE ET DES BRICS Étude EcoVadis - Médiation Inter-Entreprises COMPARATIF DE LA PERFORMANCE RSE DES ENTREPRISES FRANCAISES AVEC CELLE DES PAYS DE L OCDE ET DES BRICS 23 mars 2015 Synthèse Avec plus de 12.000 évaluations

Plus en détail

Statistiques Descriptives à une dimension

Statistiques Descriptives à une dimension I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des

Plus en détail

SQL Server 2012 et SQL Server 2014

SQL Server 2012 et SQL Server 2014 SQL Server 2012 et SQL Server 2014 Principales fonctions SQL Server 2012 est le système de gestion de base de données de Microsoft. Il intègre un moteur relationnel, un outil d extraction et de transformation

Plus en détail

RETRAITES : Y A-T-IL UNE SOLUTION IDÉALE EN EUROPE POUR UN AVENIR?

RETRAITES : Y A-T-IL UNE SOLUTION IDÉALE EN EUROPE POUR UN AVENIR? RETRAITES : Y A-T-IL UNE SOLUTION IDÉALE EN EUROPE POUR UN AVENIR? Une question européenne mais traitée dans chaque Etat membre L avenir des systèmes de retraite et ses conséquences sur la zone euro, internationalise

Plus en détail

TSTI 2D CH X : Exemples de lois à densité 1

TSTI 2D CH X : Exemples de lois à densité 1 TSTI 2D CH X : Exemples de lois à densité I Loi uniforme sur ab ; ) Introduction Dans cette activité, on s intéresse à la modélisation du tirage au hasard d un nombre réel de l intervalle [0 ;], chacun

Plus en détail

Agenda de la présentation

Agenda de la présentation Le Data Mining Techniques pour exploiter l information Dan Noël 1 Agenda de la présentation Concept de Data Mining ou qu est-ce que le Data Mining Déroulement d un projet de Data Mining Place du Data Mining

Plus en détail

REGLEMENT DU JEU «PARIS CHALLENGE LIGUE»

REGLEMENT DU JEU «PARIS CHALLENGE LIGUE» REGLEMENT DU JEU «PARIS CHALLENGE LIGUE» ARTICLE 1 : ORGANISATION DU JEU Le PMU, Groupement d'intérêt Economique immatriculé au Registre du Commerce et des Sociétés de PARIS sous le n SIREN 775 671 258,

Plus en détail

REGARDS SUR L ÉDUCATION 2013 : POINTS SAILLANTS POUR LE CANADA

REGARDS SUR L ÉDUCATION 2013 : POINTS SAILLANTS POUR LE CANADA REGARDS SUR L ÉDUCATION 2013 : POINTS SAILLANTS POUR LE CANADA Regards sur l éducation est un rapport annuel publié par l Organisation de coopération et de développement économiques (OCDE) et portant sur

Plus en détail

APPRENDRE, VIVRE & JOUER AVEC LES JEUNES ESPOIRS DE L IHF

APPRENDRE, VIVRE & JOUER AVEC LES JEUNES ESPOIRS DE L IHF APPRENDRE, VIVRE & JOUER AVEC LES JEUNES ESPOIRS DE L IHF Règles de jeu du handball Salut les amis du handball! C est super que vous vouliez en savoir plus sur les Règles de jeu du handball! Dans ce livret,

Plus en détail

Dossier I Découverte de Base d Open Office

Dossier I Découverte de Base d Open Office ETUDE D UN SYSTEME DE GESTION DE BASE DE DONNEES RELATIONNELLES Définition : Un SGBD est un logiciel de gestion des données fournissant des méthodes d accès aux informations. Un SGBDR permet de décrire

Plus en détail

Le scoring est-il la nouvelle révolution du microcrédit?

Le scoring est-il la nouvelle révolution du microcrédit? Retour au sommaire Le scoring est-il la nouvelle révolution du microcrédit? BIM n 32-01 octobre 2002 Frédéric DE SOUSA-SANTOS Le BIM de cette semaine se propose de vous présenter un ouvrage de Mark Schreiner

Plus en détail

Agrégation des portefeuilles de contrats d assurance vie

Agrégation des portefeuilles de contrats d assurance vie Agrégation des portefeuilles de contrats d assurance vie Est-il optimal de regrouper les contrats en fonction de l âge, du genre, et de l ancienneté des assurés? Pierre-O. Goffard Université d été de l

Plus en détail

Chapitre 1 : Évolution COURS

Chapitre 1 : Évolution COURS Chapitre 1 : Évolution COURS OBJECTIFS DU CHAPITRE Savoir déterminer le taux d évolution, le coefficient multiplicateur et l indice en base d une évolution. Connaître les liens entre ces notions et savoir

Plus en détail

Annexe commune aux séries ES, L et S : boîtes et quantiles

Annexe commune aux séries ES, L et S : boîtes et quantiles Annexe commune aux séries ES, L et S : boîtes et quantiles Quantiles En statistique, pour toute série numérique de données à valeurs dans un intervalle I, on définit la fonction quantile Q, de [,1] dans

Plus en détail

THOT - Extraction de données et de schémas d un SGBD

THOT - Extraction de données et de schémas d un SGBD THOT - Extraction de données et de schémas d un SGBD Pierre-Jean DOUSSET (France), Benoît ALBAREIL (France) pj@miningdb.com, benoit@miningdb.com Mots clefs : Fouille d information, base de données, système

Plus en détail

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21 IODAA de l 1nf0rmation à la Décision par l Analyse et l Apprentissage IODAA Informations générales 2 Un monde nouveau Des données numériques partout en croissance prodigieuse Comment en extraire des connaissances

Plus en détail

NF26 Data warehouse et Outils Décisionnels Printemps 2010

NF26 Data warehouse et Outils Décisionnels Printemps 2010 NF26 Data warehouse et Outils Décisionnels Printemps 2010 Rapport Modélisation Datamart VU Xuan Truong LAURENS Francis Analyse des données Avant de proposer un modèle dimensionnel, une analyse exhaustive

Plus en détail

UML et les Bases de Données

UML et les Bases de Données CNAM UML et les Bases de Données UML et les Bases de Données. Diagramme de classes / diagramme d objets (UML)...2.. Premier niveau de modélisation des données d une application...2.2. Les éléments de modélisation...2.2..

Plus en détail

Annexe n 6 au Règlement du Statut et du Transfert des Joueurs. Règlement du Statut et du Transfert des Joueurs de Futsal

Annexe n 6 au Règlement du Statut et du Transfert des Joueurs. Règlement du Statut et du Transfert des Joueurs de Futsal Annexe n 6 au Règlement du Statut et du Transfert des Joueurs Règlement du Statut et du Transfert des Joueurs de Futsal 13 TABLE DES MATIÈRES Chapitre Définitions page 15 ANNEXE 6 14 1 Principe 17 2 Champ

Plus en détail

Conception des bases de données : Modèle Entité-Association

Conception des bases de données : Modèle Entité-Association Conception des bases de données : Modèle Entité-Association La modélisation d un problème, c est-à-dire le passage du monde réel à sa représentation informatique, se définit en plusieurs étapes pour parvenir

Plus en détail

Rappel sur les bases de données

Rappel sur les bases de données Rappel sur les bases de données 1) Généralités 1.1 Base de données et système de gestion de base de donnés: définitions Une base de données est un ensemble de données stockées de manière structurée permettant

Plus en détail

LES EUROPEENS ET LA QUALITE DE VIE

LES EUROPEENS ET LA QUALITE DE VIE LES EUROPEENS ET LA QUALITE DE VIE RAPPORT REDIGE PAR INRA (EUROPE) EUROPEAN COORDINATION OFFICE S.A. POUR La Direction Générale Emploi et Affaires sociales Sécurité sociale et intégration sociale Recherche

Plus en détail

Les Conditions aux limites

Les Conditions aux limites Chapitre 5 Les Conditions aux limites Lorsque nous désirons appliquer les équations de base de l EM à des problèmes d exploration géophysique, il est essentiel, pour pouvoir résoudre les équations différentielles,

Plus en détail

Plan d études du CAS SMSI Volée 2014

Plan d études du CAS SMSI Volée 2014 Plan d études du CAS SMSI Volée 2014 SIE Système d information d entreprise Crédits ECTS : 2 Périodes : 32 «Le module SIE a pour objectif de faire connaître les fondements théoriques du système d information

Plus en détail

La rencontre du Big Data et du Cloud

La rencontre du Big Data et du Cloud La rencontre du Big Data et du Cloud Libérez le potentiel de toutes vos données Visualisez et exploitez plus rapidement les données de tous types, quelle que soit leur taille et indépendamment de leur

Plus en détail

Prix du gaz et de l électricité dans l Union européenne en 2011

Prix du gaz et de l électricité dans l Union européenne en 2011 COMMISSARIAT GÉNÉRAL AU DÉVELOPPEMENT DURABLE n 366 Novembre 2012 Prix du gaz et de l électricité dans l Union européenne en 2011 OBRVATION ET STATISTIQU ÉNERG En 2011, le prix du gaz a augmenté dans tous

Plus en détail

Extraction d informations stratégiques par Analyse en Composantes Principales

Extraction d informations stratégiques par Analyse en Composantes Principales Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 dousset@irit.fr 1 Introduction

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane

Plus en détail

Financement du sport, crise économique et politique sportive

Financement du sport, crise économique et politique sportive Conférence SNEP: «Sport demain, enjeu citoyen», Créteil, 30-31 mars 2012 Financement du sport, crise économique et politique sportive Wladimir ANDREFF * * Professeur émérite à l Université de Paris 1 Panthéon

Plus en détail

Titre II Centres de formation des clubs professionnels

Titre II Centres de formation des clubs professionnels Titre II Centres de formation des clubs professionnels CHAPITRE 1 - DISPOSITIONS GÉNÉRALES ARTICLE 100 COMPÉTENCE DE LA COMMISSION NATIONALE PARITAIRE DE LA CCNMF La commission nationale paritaire de la

Plus en détail

OBSERVATION ET STATISTIQUES

OBSERVATION ET STATISTIQUES COMMISSARI GÉNÉRAL AU DÉVELOPPEMENT DURABLE n 461 Novembre 2013 Prix du gaz et de l électricité en France et dans l Union européenne en 2012 OBRVION ET STISTIQU ÉNERG En 2012, le prix du gaz a augmenté

Plus en détail

Entrepôt de données 1. Introduction

Entrepôt de données 1. Introduction Entrepôt de données 1 (data warehouse) Introduction 1 Présentation Le concept d entrepôt de données a été formalisé pour la première fois en 1990 par Bill Inmon. Il s agissait de constituer une base de

Plus en détail

Relation entre deux variables : estimation de la corrélation linéaire

Relation entre deux variables : estimation de la corrélation linéaire CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence

Plus en détail

UML (Diagramme de classes) Unified Modeling Language

UML (Diagramme de classes) Unified Modeling Language UML (Diagramme de classes) Unified Modeling Language Sommaire Introduction Objectifs Diagramme de classes Classe (Nom, attribut, opération) Visibilité et portée des constituants d une classe Association

Plus en détail

La Business Intelligence en toute simplicité :

La Business Intelligence en toute simplicité : MyReportle reporting sous excel La Business Intelligence en toute simplicité : Concevez, partagez, actualisez! En rendant les données accessibles aux personnes habilitées dans l entreprise (comptabilité,

Plus en détail

T de Student Khi-deux Corrélation

T de Student Khi-deux Corrélation Les tests d inférence statistiques permettent d estimer le risque d inférer un résultat d un échantillon à une population et de décider si on «prend le risque» (si 0.05 ou 5 %) Une différence de moyennes

Plus en détail

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données et le Data Mining Nous suivons le plan suivant : Fonctionnement de Spad Catalogue des méthodes (statistiques

Plus en détail