PROJET DE DATA MINING SUR DES DONNEES CINEMATOGRAPHIQUES AVEC LE LOGICIEL SODAS

Dimension: px
Commencer à balayer dès la page:

Download "PROJET DE DATA MINING SUR DES DONNEES CINEMATOGRAPHIQUES AVEC LE LOGICIEL SODAS"

Transcription

1 UNIVERSITE PARIS-IX - Novembre DAUPHINE PROJET DE DATA MINING SUR DES DONNEES CINEMATOGRAPHIQUES AVEC LE LOGICIEL SODAS Réalisé par : Sonia GUEHIS -DEA 127- Encadré par: Mr Edwin DIDAY

2 TABLE DES MATIERES I- Présentation du projet :... 4 II- Description des données :... 4 III- Choix des individus, variables et concept :... 6 IV- Les étapes de réalisation : DB2SO : La méthode SOE (Symbolic Object Editor) : La méthode PCM : Le module TREE (Decision Tree on Symbolic objects): La méthode DIV : Le module STAT: La méthode PYR: La méthode SCLUST:

3 INTRODUCTION Le Data Mining est un processus analytique destiné à explorer de larges quantités de données afin de dégager une certaine structure et/ou des relations systématiques entre variables, puis en validant les conclusions en appliquant les structures trouvées à de nouveaux groupes de données. Il permet ainsi de découvrir des informations jusque la inconnues, mais qui peuvent se révéler utiles et lucratives, et d'utiliser ces informations pour soutenir des décisions commerciales tactiques et stratégiques. Le logiciel sodas est un logiciel prototype public capable d'analyser des données symboliques. il est issu du projet de EUROSTAT appelé SODAS comme le logiciel qui en est issu pour fournir un cadre aux différentes avancées récentes et futures du domaine. Il est téléchargeable à l'adresse suivante: Son idée générale est de construire un tableau de données symboliques, parfois muni de règles et de taxonomies, dans le but de décrire des concepts résumant un vaste ensemble de données, d'analyser ensuite ce tableau pour en extraire des connaissances par des méthodes d'analyse de données symboliques. On commencera par expliciter le but de ce projet et de définir les données qui ont fait sujet de notre étude. On présentera ensuite l'architecture et les outils de l'analyse des données symboliques développés dans SODAS. Ces outils généralisent les méthodes de l'analyse des données classiques et ceux de la statistique usuelle, aussi bien en entrée, en autorisant des données plus complexes car plus proches de la réalité, qu'en sortie, en fournissant des objets symboliques plus aptes à exprimer des connaissances que les résultats numériques habituels. 3

4 L application du Data Mining aux données Cinématographiques I- Présentation du projet : Le but de ce projet de Data Mining appliquée au données cinématographiques est en premier lieu d appliquer les notions vues en théorie, de s apprivoiser avec l environnement du logiciel Sodas et d analyser des données cinématographiques et ce à travers l utilisation des différentes méthodes qu offre le logiciel. II- Description des données : Les données qui nous serviront d input pour notre analyse ont été téléchargés depuis le site : La base de données BDCinéma.mdb est une base de données relationnelle sous format Access. Cette base de données regroupe 100 films qui ont tous été nominés pour les oscars. Les informations concernant les films sont notamment le réalisateur, l acteur principal, le budget consacré, le lieu de tournage ainsi que le revenu retiré Voici la liste des tables regroupant toutes ces informations ainsi que les relations entre elles: 4

5 La table film est la table principale de cette base, en effet elle regroupe les informations suivantes : Le titre du film Le genre de film Le pays du film Le numéro du réalisateur L acteur principal La durée L année du film Le nombre d oscars Le lieu de tournage Le budget Le revenu Le bénéfice La table réalisateur est aussi importante dans la mesure ou elle regroupe les données associées au réalisateur, son nom prénom, le nombre de films qu il a réalisé, son âge, sa nationalité, le nombre d oscars qu il détient à son actif. D autres tables sont aussi indispensables pour la complétude des données. 5

6 III- Choix des individus, variables et concept : -Les individus choisis pour ce projet sont les films nominés aux oscars ayant reporté au moins un oscar. -Les concepts choisis pour faire l analyse sont les réalisateurs. -Les variables de description choisis sont : Le genre de film Le nombre d oscar La nationalité du film L âge du réalisateur Le nombre d oscars du réalisateur L acteur principal Le bénéfice L année du film Le continent de tournage Le pays du réalisateur Les requêtes permettant de traduire ces choix sont les suivantes : 1- la requête film_réalisateur nous renvoie les concepts et les variables de description : SELECT DISTINCT Film.Titre, Realisateur.Nom, Film.Année, Film.Genre, Film.Nombre_Oscars, Realisateur.Nationalité, Realisateur.Age, Realisateur.Nombre_Oscars, Film.Acteur_Principal, Film.[Bénéfice(K)], Continent_Tournage.Continent_Tournage, Pays_Realisateur.Pays FROM Age_Realisateur, Oscars, Age_Realisateur AS Age_Realisateur_1, Revenu_Ecart, Age_Realisateur AS Age_Realisateur_2, Budget_ecart, ((Continent_Realisateur INNER JOIN Pays_Realisateur ON Continent_Realisateur.Continent_id=Pays_Realisateur.Continent_id) INNER JOIN Region_Realisateur ON Pays_Realisateur.Pays_id=Region_Realisateur.Pays_id) INNER JOIN (Realisateur INNER JOIN ((Continent_Tournage INNER JOIN Lieu_Tournage ON Continent_Tournage.Cotinent_Tournage_id=Lieu_Tournage.Continent_Tournage_id) INNER JOIN Film ON Lieu_Tournage.Lieu_Tournage_id=Film.Lieu_Tournage_id) ON Realisateur.N _Réalisateur=Film.N _Réalisateur) ON Region_Realisateur.Région_id=Realisateur.Région_id WHERE Film.Nombre_Oscars<>0; 6

7 2- Deux autres requêtes ont été introduites pour définir deux taxonomies : La taxonomie lieu tournage : SELECT Lieu_Tournage.Lieu_Tournage, Continent_Tournage.Continent_Tournage FROM Continent_Tournage INNER JOIN Lieu_Tournage ON Continent_Tournage.Cotinent_Tournage_id = Lieu_Tournage.Continent_Tournage_id; La taxonomie pays réalisateur : SELECT DISTINCT Region_Realisateur.Région, Pays_Realisateur.Pays FROM Pays_Realisateur INNER JOIN Region_Realisateur ON Pays_Realisateur.Pays_id = Region_Realisateur.Pays_id; IV- Les étapes de réalisation : 1-DB2SO : Ce module permet l extraction des données symboliques depuis la base de données relationnelles donnant comme output des objets symboliques (Symbolics Objects) appelées modal ou booléen SO. Chaque SO présente une description de groupe d individus par quelques variables. Ces variables décrivent les variations selon le groupe d individus. Une présentation de ce module du logiciel Sodas se trouve sur le site : Paris2000-ang_fichiers/frame.htm Pour ce faire, il s agit de configurer le système de liaison ODBC de Sodas pour donner le chemin de la base relationnelle cinématographique : 7

8 Il s agit par la suite, une fois que la base de données cinématographique est connue par DB2SO, de formuler la requête objet de l analyse, afin de mettre en évidence les concepts choisis, et les variables de description : 8

9 On introduite par la suite les taxonomies précédemment définies : Le résultat ainsi obtenu est le suivant : Il s agit par la suite de sauvegarder le fichier généré par les requêtes sous forme cinéma.gaj et l exporter par la suite afin de générer le fichier sodas d extension sds qui nous permettra par la suite d appliquer les différentes méthodes de SOADS. 2-La méthode SOE (Symbolic Object Editor) : ( Ce module permet d afficher sous formes de tableaux les objets symboliques présent dans le fichier SODAS, et d améliorer notamment par des modifications sur les données au sein des tableaux en question. Cet éditeur offre des fonctionnalités d affichages des graphiques en 2D ou 3D ainsi que la représentation SOL de chaque objet symbolique présent dans le tableau. 9

10 Il s agit en premier lieu de donner le chemin du fichier sodas crée lors de la phase précédente, il suffit par la suite d insérer une méthode au chaînage et de la paramétrer pour lancer l exécution de la méthode qui donnera lieu à un fichier de listing et le tableau d objets symboliques. Le tableau présente les concepts choisis (les réalisateurs) ainsi que les variables de description, sur lesquels va porter l interprétation et qui seront sujet à des sélection selon les cas de figures des interprétions requises: 10

11 Le concept CAMERON : ->Représentation 2D : ->Représentation 3D : ->Interprétation : James CAMERON est un réalisateur dont les films sont récents (les années 80/90) il a réalisé des films du genre fantaisie pour la moitié de ses films, en science fiction pour le quart et en drame pour le quart restant. Il a eu 3 oscars mais ses fils ont reporté 11 oscars. C est le réalisateur dont les films ont eu le plus de bénéfice ayant un maximum de même si n ayant réalisé que 12 films sur un seuil atteint par d autres réalisateurs de 136 films. 11

12 Le concept SPIELBERG : ->Représentation 2D : ->Représentation 3D : ->Interprétation : SPIELBERG est un réalisateur dont les films sont récents aussi (77-98), il a principalement réalisé les films de fantaisie à 75% des cas. Il a eu 3 oscars et ses films en ont eu 5. Les bénéfices sont tout de même importants atteignant les

13 Le concept DISNEY : ->Représentation 2D : ->Représentation 3D : ->Interprétation : Walt DISNEY est un réalisateur des années 60, il a réalisé des films comiques dans tous ses films dont le nombre s élevant à 28 films tournés tous en Amérique. Il est le réalisateur qui a eu le plus d oscars atteignant le seuil maximum de 22 oscars. Ses films ont été récompensés à 5 reprises. Les bénéfices ont atteint les

14 Le concept ALLEN : ->Représentation 2D : ->Représentation 3D : ->Interprétation : Woody ALLEN a réalisé 37 films dans les années 80, il a été récompensé à 3 reprises par des oscars, le même nombre de fois ses films ont en remporté des oscars aussi. Ayant travaillé sur des films portant sur la comédie intégralement, il a réussi à atteindre des bénéfices s élevant à

15 Le concept GIBSON: ->Représentation 2D : ->Représentation 3D : ->Interprétation : Mel GIBSON connu en tant qu acteur mais aussi réalisateur des années 1990, a réalisé des films du genre Drame dans les deux films qu il a fait, il a eu deux oscars et ses films ont en eu 5 pour des bénéfices atteignant les

16 Le concept H ITCHCOCK : ->Représentation 2D : ->Représentation 3D : ->Interprétation : HITCHCOK est un réalisateur dont les films sont des années 1937/1940, il a réalisé les films de drame uniquement. Il n a pas eu d oscars et ses films en ont eu 2 sur 55 réalisés. Les bénéfices sont assez faibles (par comparaison au seuil maximum) s élevant à

17 CONCLUSION GENERALE : De part l interprétation individuel faite sur deux réalisateurs de film de drame (HITCHCOK et Gibson), deux des films de comédie (ALLEN et DISNEY) et deux de films de fantaisie et de science fiction (CAMERON et SPEILBERG) on peut tirer des conclusion d ordre générale suivantes : Il y a une corrélation entre le nombre d oscars des films et le nombre d oscars qu a eu le réalisateur. Il n y a pas de corrélation entre les bénéfices apportés par les films et le nombre de films réalisés ni le nombre d oscars à l actif du réalisateur. Les films de drame et de comédie, bien qu ils aient été récompensés par des oscars, que les réalisateurs aient produit un bon nombre de film, ils n ont pas atteint des bénéfices colossaux. Les films de fantaisie et de science fiction eux, ayant émergé principalement dans les années 80/90/2000, et grâce à l évolution des moyens technologiques en terme d outils cinématographique, de numérisation ainsi que la prolifération des moyens informatiques ont atteint des seuils de bénéfices très importants. D autre part cette catégorie de films vise un public de jeune âge, qui représente la tranche d âge principalement cinéphile durant ces années. 3-La méthode PCM : La méthode PCM est une extension de la méthode standard d'analyse des composantes principales qui prend comme entrée, une matrice de termes généraux les (aij) de type d'intervalle. Chaque aij de valeur est un intervalle contenant toutes les valeurs possibles du dispositif j pour un objet i. Au lieu de représenter chaque point sur un plan factoriel par un point, comme dans la méthode standard d'analyse des composantes principales, dans cette méthode proposée chaque objet est visualisée par un rectangle. 17

18 La méthode après paramétrage, son exécution donnera lieu à un fichier texte (listing) et un graphe portant les corrélations entre les variables continues et les concepts objets de l étude. Le listing contient : La matrice des données d entrée. La matrice de variance covariance : Année Nombre_Oscars Bénéfice (K) Nombre_Films Nombre_Oscars_realisateur La matrice de corrélation : Année Nombre_Oscars Bénéfice(K) Nombre_Films Nombre_Oscars_realisateur Les valeurs propres et les pourcentages d inertie : Propers Values and inerty percentage: Année= (6.72%) Nombre_Oscars= (24.09%) Bénéfice (K)= (16.54%) Nombre_Films= (38.32%) Nombre_Oscars_realisateur= (14.34%) Les descriptions factorielles des intervalles sur les axes PC1, PC2, PC3, PC4 La matrice de corrélation: les variables initiales/les composantes principales. Année Nombre_Oscars Bénéfice (K) Nombre_Films Nombre_Oscars_realisateur Le graphe généré représentant les axes PC1(38.32) le nombre de films et l axe PC3(16.54) le bénéfice st le suivant: 18

19 ->Interprétation : Ce graphe PCM confirme bien les interprétations faites précédemment dans la mesure où l on voit que il n y a pas de corrélation entre le nombre de films réalisés et les bénéfices atteints. Le graphe généré représentant les axes PC2(24.09) le nombre d oscars des films et l axe PC4(14.34) le nombre d oscars des réalisateurs est le suivant: 19

20 ->Interprétation : Ce graphe PCM confirme aussi les interprétations faites précédemment dans la méthode SOE dans la mesure où l on voit que il y a une corrélation entre le nombre d oscars des films et le nombre d oscars des réalisateurs. 4-Le module TREE (Decision Tree on Symbolic objects): L arbre de décision permet de créer des partitions structurées sous forme d arbre et ce selon une variable classe choisie dans notre cas nationalité des réalisateurs (les concepts). La requête pour ce faire a été introduite au niveau du module DB2So en sélectionnant du menu le bouton : Add one or more single-valued varaibles On obtient alors le résultat suivant : Au niveau du chaînage on choisit le module TREE : 20

21 L arbre de décision se lit de la manière suivante : IF ASSERTION IS TRUE (up)! --- x [ ASSERTION ]! IF ASSERTION IS FALSE (down) Cas des variables quantitatives: Variable Class Identifier: nationalité. GROUP OF PREDICATE VARIABLES : ( 1 ) Année ( 3 ) Nombre_Oscars ( 5 ) Bénéfice(K) ( 8 ) Nombre_Films ( 9 ) Nombre_Oscars_realisateur. NUMBER OF A PRIORI CLASSES : 5 ID_CLASS NAME_CLASS 1 Américaine 2 Canadienne 3 Allemande 4 Anglaise 5 Australienne LIST OF SYMBOLIC OBJECTS IN THE LEARNING SET : "Kubrick" "Mctiernan" "Cameron" "Coppola" "Howard" "Fleming" "Burton" "Gibson" "Welles" "Spielberg" "Zemeckis" "Scott" "Allen" "Ford" "Emmerich" "Stone" "Lucas" "Minghella" "Demme" "Disney" "Luhrmann" "Pollack" "Bay" "Hitchcock" "Donner" 21

22 ================================== EDITION OF DECISION TREE PARAMETERS : Learning Set : 25 Number of variables : 5 Max. number of nodes: 7 Soft Assign : ( 1 ) FUZZY Criterion coding : ( 3 ) LOG-LIKELIHOOD Min. number of object by node : 5 Min. size of no-majority classes : 2 Min. size of descendant nodes : 1.00 Frequency of test set : [ 4 ]Américaine ( )!!----2[ Année <= ]!!!! [ 10 ]Américaine ( )!!!!!----5[ Nombre_Oscars <= ]!!! [ 11 ]Anglaise ( )!!----1[ Bénéfice(K) <= ]! [ 3 ]Allemande ( ) ->Interprétation du résultat: On peut remarquer selon l arbre de décision que les Américains qui sont les réalisateurs en plus grand nombre font la différence sur les allemands en terme de bénéfice étant donnée que l Amérique est un pays plus producteur en terme de cinéma que l Allemagne. Les américains gagnent plus d oscars que leurs confrères Anglais. 5-La méthode DIV : DIV (Divisive Clustering) est une méthode de classification hiérarchique qui commence avec tous les objets d une classe et procède par divisions successives de chaque classe. A chaque étape, une classe est divisée en deux classes selon une question binaire. Cette question binaire induit le meilleur partage en deux classes selon une extension du critère de l inertie. L algorithme se termine après k-1 divisions, où k représente le nombre de classes données comme inputs par l utilisateur. 22

23 THE SELECTED SPLIT-VARIABLES ARE : ( 1) :Année ( 3) :Nombre_Oscars ( 6) :Bénéfice(K) ( 9) :Nombre_Films ( 10) :Nombre_Oscars_realisateur VARIANCE OF THE CRITERTION-VARIABLES : Année : Nombre_Oscars : Bénéfice(K) : Nombre_Films : Nombre_Oscars_realisateur : PARTITION IN 2 CLUSTERS : : Cluster 1 (n=22) : Kubrick Mctiernan Coppola Howard Fleming Burton Gibson Welles Zemeckis Scott Allen Ford Stone Lucas Minghella Demme Disney Luhrmann Pollack Bay Hitchcock Donner Cluster 2 (n=3) : Cameron Spielberg Emmerich Explicated inertia :

24 DESCRIPTION OF THE CLUSTERS : Cluster 1 : IF 1- [Bénéfice(K) <= ] IS TRUE Cluster 2 : IF 1- [Bénéfice(K) <= ] IS FALSE THE CLUSTERING TREE : the number noted at each node indicates the order of the division - Ng <-> yes and Nd <-> no Classe 1 (Ng=22)!! [Bénéfice(K) <= ]! Classe 2 (Nd=3) NAME OF INTERNAL VT0 FILE : D:\sodas\version0812\CTVPFC01.vt END OF PROGRAM DIV >Interprétation du résultat: En choisissant la variable de bénéfice, on a deux classes qui se forment et l une d entre elle est particulièrement intéressante dans la mesure ou les résultats confirment les interprétations faite auparavant : En effet, les réalisateurs «Cameron Spielberg Emmerich» sont des réalisateurs de films de science fiction et ce sont eux qui se démarquent des autres et ce, non pas de part le nombre d oscars mais en terme de bénéfice. THE SELECTED SPLIT-VARIABLES ARE : 24

25 ( 2) :Genre NOT SELECTED : more than 12 categories ( 3) :Nombre_Oscars VARIANCE OF THE CRITERTION-VARIABLES : Genre : Nombre_Oscars : PARTITION IN 2 CLUSTERS : : Cluster 1 (n=17) : Kubrick Mctiernan Coppola Howard Burton Welles Spielberg Zemeckis Scott Allen Ford Emmerich Stone Luhrmann Bay Hitchcock Donner Cluster 2 (n=8) : Cameron Fleming Gibson Lucas Minghella Demme Disney Pollack Explicated inertia : DESCRIPTION OF THE CLUSTERS : Cluster 1 : IF 1- [Nombre_Oscars <= ] IS TRUE Cluster 2 : IF 1- [Nombre_Oscars <= ] IS FALSE THE CLUSTERING TREE : the number noted at each node indicates the order of the division - Ng <-> yes and Nd <-> no Classe 1 (Ng=17)!! [Nombre_Oscars <= ]! Classe 2 (Nd=8) NAME OF INTERNAL VT0 FILE : D:\sodas\version0812\cinéma\projet\CTVRZW01.vt END OF PROGRAM DIV >Interprétation du résultat: 25

26 En changeant le choix de variables et en choisissant la variable de nombre d oscars on retrouve une autres classification des concepts réalisateurs à savoir le concept «Spielberg» ne fait pas partie de la classe qui se démarque des autres composés par les concepts qui ont fait l objet de notre étude au sein de la méthode SOE : «Cameron Fleming Gibson Lucas Minghella Demme Disney Pollack» et qui ne sont pas forcément des réalisateurs de films de science fiction. 5-Le module STAT: STAT ( Elementary Statistics On Symbolic Objects) étend aux objets symboliques, représentés par leur description, plusieurs méthodes de statistique élémentaire limitées aux données. Les méthodes dépendent du type des variables de la base et sont filtrées en fonction de la méthode de travail : - fréquences relatives pour variables multimodales (a) - fréquences relatives pour variables intervalles (b) - capacités et min/max/mean pour variables multimodales probabilistes - biplot pour variables intervalles (d) - objet central. Les données des méthodes sélectionnées peuvent être regardées de deux façons : listing ou graphe. Le graphe peut être changé et personnalisé (texte, couleurs ). Dans la méthode a, on calcule la fréquence relative de chaque modalité de la variable multinominale en prenant en compte les règles données par la base. Le graphique associé à la distribution de la variable peut être soit un histogramme soit un diagramme circularisé. Dans la méthode b, soit X une variable intervalle observée dans un ensemble d objets symboliques. On peut construire un histogramme pour la variable X sur l intervalle [a,b] où a est la plus petite limite et b la plus grande. Le calcul des fréquences relatives associées à une classe Ck prend en compte le recouvrement de Ck par les valeurs intervalle de X sur chaque objet symbolique. 23 Dans la méthode d, le graphique présente un objet symbolique comme un rectangle sur le plan à deux variables choisies par l utilisateur. Chaque côté du rectangle représente la distance de l axe pour l objet symbolique. 26

27 ->Interprétation du résultat: On constate que la plupart des réalisateurs étudiés ont réalisé des fils après les années 80 pour des nombres de films inférieurs à 25 films en moyenne. Les grands bénéfices n ont pas été colossaux pour la majorité de la population étudiée. Bien encore cette méthode approuve les conclusions des autres, dans la mesure ou l on constate que les variables nombre oscars et bénéfice ne sont pas corrélés, tandis que les variables nombre de films réalisés et le nombre d oscars qu a eu le réalisateurs sont corrélés. 6-La méthode PYR: Ce modèle pyramidal généralise les hiérarchies en laissant non disjoint des classes à un niveau donné au lieu d une partition. D'ailleurs, les classes de la pyramide sont des intervalles d'un ordre total sur l'ensemble étant groupé, par conséquent les pyramides constituent un modèle intermédiaire entre l'arbre et les structures de treillis. La méthode proposée laisse grouper des données plus complexes que le modèle tabulaire, en considérant la variation sur les valeurs prises par les variables. La pyramide est construite par un algorithme ascendant. Dans la classification pyramidal symbolique chaque partition formée est définie non seulement par l'ensemble de ses éléments sa prolongation - mais également par un objet symbolique, qui décrit leurs propriétés - l'intension du concept. 27

28 7-La méthode SCLUST: C est la méthode des nuées dynamiques appliqué au fichier Sodas de notre base avec choix des variables composant les axes du plan. ->Interprétation du résultat: On constate que les concepts réalisateurs qui ont le nombre le plus élevé d oscars sont inversement les moins bons en terme de bénéfice. 28

29 CONCLUSION GENERALE A l issue de cette étude menée sur des données cinématographiques par appel aux différentes méthodes de Sodas, nous avons pu faire différentes interprétations ayant dans la majorité des cas les mêmes résultats et conclusion. En effet, ce projet nous a permis de mettre en application les notions vues en cours concernant les objets symboliques, les concepts et les méthodes de classification tel que SOE, PCM, la méthode des pyramides PYR, STAT, SCLUST des nuées dynamiques, la méthode DIV. Sur cette base de données concernant le cinéma, et ayant opté pour le choix des réalisateurs comme concept étudié, nous avons pu tiré les conclusions suivantes : Les réalisateurs de science fiction sont ceux qui ont le plus de bénéfice et ne récoltaient pas forcément un grand nombre d oscars. Les réalisateurs des films de genre comédie étaient plus fréquents dans les années 60 /70 plutôt que les années 90/2000 et ont récolté un plus grand nombre d oscars et ont réalisé le plus grand nombre de films. 29

Datamining. Université Paris Dauphine DESS ID 2004/2005. Séries télévisées nominées aux oscars. Enseignant : Réalisé par : Mars 2005. Mr E.

Datamining. Université Paris Dauphine DESS ID 2004/2005. Séries télévisées nominées aux oscars. Enseignant : Réalisé par : Mars 2005. Mr E. Université Paris Dauphine DESS ID 2004/2005 Datamining Séries télévisées nominées aux oscars Mars 2005 Enseignant : Mr E. DIDAY Réalisé par : Mounia CHERRAD Anne-Sophie REGOTTAZ Sommaire Introduction...

Plus en détail

DATA MINING - Analyses de données symboliques sur les restaurants

DATA MINING - Analyses de données symboliques sur les restaurants Master 2 Professionnel - Informatique Décisionnelle DATA MINING - Analyses de données symboliques sur les restaurants Etudiants : Enseignant : Vincent RICHARD Edwin DIDAY Seghir SADAOUI SOMMAIRE I Introduction...

Plus en détail

Projet de Datamining Supervisé (SODAS) Analyse des régions françaises

Projet de Datamining Supervisé (SODAS) Analyse des régions françaises Master 2 ème Année Ingénierie Statistique et financière Projet de Datamining Supervisé (SODAS) Analyse des régions françaises Réalisé par : Nicolas CHAIGNEAUD Nora SLIMANI Année universitaire 2007-2008

Plus en détail

Critères pour avoir la meilleure équipe!

Critères pour avoir la meilleure équipe! PROJET DATAMINING Basket-ball professionnel "NBA" : Critères pour avoir la meilleure équipe! Réalisé par : Anasse LAHLOU KASSI Houssam Eddine HOUBAINE DESS TIO DESS ID Année Scolaire : SOMMAIRE INTRODUCTION...

Plus en détail

Université Paris IX DAUPHINE DATE : 24/04/06

Université Paris IX DAUPHINE DATE : 24/04/06 Master Informatique Décisionnelle Application des outils de l'informatique Décisionnelle en entreprise ETUDE SUR LES MARQUES ET LES CONTRUCTEUR DES VÉHICULES APPARTENANT AUX CLIENTS D UNE COMPAGNIE D ASSURANCE

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

1 Modélisation d être mauvais payeur

1 Modélisation d être mauvais payeur 1 Modélisation d être mauvais payeur 1.1 Description Cet exercice est très largement inspiré d un document que M. Grégoire de Lassence de la société SAS m a transmis. Il est intitulé Guide de démarrage

Plus en détail

WEBSELL. Projet DATAMINING

WEBSELL. Projet DATAMINING WEBSELL Projet DATAMINING Analyse des données dans le cadre d une étude de banchmarking DESS ID Session 2005/2006 Mariam GASPARIAN [ Page 1 ] SOMMAIRE 1. INTRODUCTION... 3 2. METHODES ET OUTILS... 4 2.1.

Plus en détail

La segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM

La segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM La segmentation à l aide de EG-SAS A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM Définition de la segmentation - Au lieu de considérer une population dans son ensemble,

Plus en détail

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems

Plus en détail

Initiation à la Programmation en Logique avec SISCtus Prolog

Initiation à la Programmation en Logique avec SISCtus Prolog Initiation à la Programmation en Logique avec SISCtus Prolog Identificateurs Ils sont représentés par une suite de caractères alphanumériques commençant par une lettre minuscule (les lettres accentuées

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

2 Serveurs OLAP et introduction au Data Mining

2 Serveurs OLAP et introduction au Data Mining 2-1 2 Serveurs OLAP et introduction au Data Mining 2-2 Création et consultation des cubes en mode client-serveur Serveur OLAP Clients OLAP Clients OLAP 2-3 Intérêt Systèmes serveurs et clients Fonctionnalité

Plus en détail

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1 Christophe CANDILLIER Cours de DataMining mars 2004 age 1 1. Introduction 2. rocessus du DataMining 3. Analyse des données en DataMining 4. Analyse en Ligne OLA 5. Logiciels 6. Bibliographie Christophe

Plus en détail

Exploiter les statistiques d utilisation de SQL Server 2008 R2 Reporting Services

Exploiter les statistiques d utilisation de SQL Server 2008 R2 Reporting Services Exploiter les statistiques d utilisation de SQL Server 2008 R2 Reporting Services Nous verrons dans cet article comment exploiter simplement les données de Log de SQL Server 2008 R2 Reporting Services

Plus en détail

Introduction à MATLAB R

Introduction à MATLAB R Introduction à MATLAB R Romain Tavenard 10 septembre 2009 MATLAB R est un environnement de calcul numérique propriétaire orienté vers le calcul matriciel. Il se compose d un langage de programmation, d

Plus en détail

Module d échange de données INTERLIS v1.0 GeoConcept Manuel d'utilisation

Module d échange de données INTERLIS v1.0 GeoConcept Manuel d'utilisation Module d échange de données INTERLIS v1.0 GeoConcept Manuel d'utilisation Interlis V1.0 - GC version 5.0 Table des matières TABLE DES MATIERES...1 1. INTRODUCTION...2 1.1 OBJECTIF...2 1.2 PRINCIPE...2

Plus en détail

Whitepaper. Méthodologie de création de rapports personnalisés SQL Server Reporting Services

Whitepaper. Méthodologie de création de rapports personnalisés SQL Server Reporting Services Ce Whitepaper décrit la méthodologie de développement d un rapport personnalisé au format SQL Server Reporting Service (SSRS) appliqué à System Center Operations Manager (SCOM) Whitepaper Méthodologie

Plus en détail

PRODIGE V3. Manuel utilisateurs. Consultation des métadonnées

PRODIGE V3. Manuel utilisateurs. Consultation des métadonnées PRODIGE V3 Manuel utilisateurs Consultation des métadonnées Pour plus d'information sur le dispositif : à remplir par chaque site éventuellement 2 PRODIGE V3 : Consultation des métadonnées SOMMAIRE 1.

Plus en détail

Introduction au datamining

Introduction au datamining Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des

Plus en détail

Data Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.

Data Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto. des des Data Mining Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne 2012-2013 1/65 des des 1 2 des des 3 4 Post-traitement 5 représentation : 6 2/65 des des Définition générale Le

Plus en détail

BASE. Vous avez alors accès à un ensemble de fonctionnalités explicitées ci-dessous :

BASE. Vous avez alors accès à un ensemble de fonctionnalités explicitées ci-dessous : BASE BioArray Software Environment (BASE) est une base de données permettant de gérer l importante quantité de données générées par des analyses de bio-puces. BASE gère les informations biologiques, les

Plus en détail

La base de données dans ArtemiS SUITE

La base de données dans ArtemiS SUITE 08/14 Vous préférez passer votre temps à analyser vos données plutôt qu à chercher un fichier? La base de données d ArtemiS SUITE vous permet d administrer et d organiser confortablement vos données et

Plus en détail

ESIEA PARIS 2011-2012

ESIEA PARIS 2011-2012 ESIEA PARIS 2011-2012 Examen MAT 5201 DATA MINING Mardi 08 Novembre 2011 Première Partie : 15 minutes (7 points) Enseignant responsable : Frédéric Bertrand Remarque importante : les questions de ce questionnaire

Plus en détail

COMMANDES SQL... 2 COMMANDES DE DEFINITION DE DONNEES... 2

COMMANDES SQL... 2 COMMANDES DE DEFINITION DE DONNEES... 2 SQL Sommaire : COMMANDES SQL... 2 COMMANDES DE DEFINITION DE DONNEES... 2 COMMANDES DE MANIPULATION DE DONNEES... 2 COMMANDES DE CONTROLE TRANSACTIONNEL... 2 COMMANDES DE REQUETE DE DONNEES... 2 COMMANDES

Plus en détail

Saisissez le login et le mot de passe (attention aux minuscules et majuscules) qui vous ont

Saisissez le login et le mot de passe (attention aux minuscules et majuscules) qui vous ont I Open Boutique Sommaire : I Open Boutique... 1 Onglet «Saisie des Produits»... 3 Création d'une nouvelle fiche boutique :... 3 Création d'une nouvelle fiche lieux de retraits :... 10 Création d'une nouvelle

Plus en détail

Introduction aux outils BI de SQL Server 2014. Fouille de données avec SQL Server Analysis Services (SSAS)

Introduction aux outils BI de SQL Server 2014. Fouille de données avec SQL Server Analysis Services (SSAS) MIT820: Entrepôts de données et intelligence artificielle Introduction aux outils BI de SQL Server 2014 Fouille de données avec SQL Server Analysis Services (SSAS) Description générale Ce tutoriel a pour

Plus en détail

Langage SQL : créer et interroger une base

Langage SQL : créer et interroger une base Langage SQL : créer et interroger une base Dans ce chapitre, nous revenons sur les principales requêtes de création de table et d accès aux données. Nous verrons aussi quelques fonctions d agrégation (MAX,

Plus en détail

Micro-ordinateurs, informations, idées, trucs et astuces utiliser le Bureau à distance

Micro-ordinateurs, informations, idées, trucs et astuces utiliser le Bureau à distance Micro-ordinateurs, informations, idées, trucs et astuces utiliser le Bureau à distance Auteur : François CHAUSSON Date : 8 février 2008 Référence : utiliser le Bureau a distance.doc Préambule Voici quelques

Plus en détail

Afin de valider votre inscription merci de bien veiller à :

Afin de valider votre inscription merci de bien veiller à : b Afin de valider votre inscription merci de bien veiller à : 1. Prendre connaissance du règlement, des critères de sélection et des dates limites d inscription de la manifestation. 2. Dater et signer

Plus en détail

Cours Bases de données 2ème année IUT

Cours Bases de données 2ème année IUT Cours Bases de données 2ème année IUT Cours Bilan : Des vues à PL/SQL corrigé Anne Vilnat http://www.limsi.fr/individu/anne/cours Plan 1 Cas exemple 2 Les tables... 3 Vues et index 4 Privilèges 5 Fonctions

Plus en détail

Introduction à Business Objects. J. Akoka I. Wattiau

Introduction à Business Objects. J. Akoka I. Wattiau Introduction à Business Objects J. Akoka I. Wattiau Introduction Un outil d'aide à la décision accès aux informations stockées dans les bases de données et les progiciels interrogation génération d'états

Plus en détail

Séries Statistiques Simples

Séries Statistiques Simples 1. Collecte et Représentation de l Information 1.1 Définitions 1.2 Tableaux statistiques 1.3 Graphiques 2. Séries statistiques simples 2.1 Moyenne arithmétique 2.2 Mode & Classe modale 2.3 Effectifs &

Plus en détail

Historique. Architecture. Contribution. Conclusion. Définitions et buts La veille stratégique Le multidimensionnel Les classifications

Historique. Architecture. Contribution. Conclusion. Définitions et buts La veille stratégique Le multidimensionnel Les classifications L intelligence économique outil stratégique pour l entreprise Professeur Bernard DOUSSET dousset@irit.fr http://atlas.irit.fr Institut de Recherche en Informatique de Toulouse (IRIT) Equipe Systèmes d

Plus en détail

Langage SQL (1) 4 septembre 2007. IUT Orléans. Introduction Le langage SQL : données Le langage SQL : requêtes

Langage SQL (1) 4 septembre 2007. IUT Orléans. Introduction Le langage SQL : données Le langage SQL : requêtes Langage SQL (1) Sébastien Limet Denys Duchier IUT Orléans 4 septembre 2007 Notions de base qu est-ce qu une base de données? SGBD différents type de bases de données quelques systèmes existants Définition

Plus en détail

Traitement des données avec Microsoft EXCEL 2010

Traitement des données avec Microsoft EXCEL 2010 Traitement des données avec Microsoft EXCEL 2010 Vincent Jalby Septembre 2012 1 Saisie des données Les données collectées sont saisies dans une feuille Excel. Chaque ligne correspond à une observation

Plus en détail

Groupe 11 TABLE DES MATIERES

Groupe 11 TABLE DES MATIERES Groupe 11 TABLE DES MATIERES I. CHAMP D APPLICATION a) Domaine b) Objectif c) Constituants II. II. II. II. II. II. II. IX. IX. REMARQUES CONCERNANT LES IDENTIFICATEURS DOMAINE «SQL» DES CONSTITUANTS PREDICAT

Plus en détail

Le Langage SQL version Oracle

Le Langage SQL version Oracle Université de Manouba École Supérieure d Économie Numérique Département des Technologies des Systèmes d Information Le Langage SQL version Oracle Document version 1.1 Mohamed Anis BACH TOBJI anis.bach@isg.rnu.tn

Plus en détail

INTRODUCTION AU DATA MINING

INTRODUCTION AU DATA MINING INTRODUCTION AU DATA MINING 6 séances de 3 heures mai-juin 2006 EPF - 4 ème année - Option Ingénierie d Affaires et de Projets Bertrand LIAUDET TP DE DATA MINING Le TP et le projet consisteront à mettre

Plus en détail

Sybase PowerAMC 16. Guide des nouvelles fonctionnalités générales. www.sybase.fr/poweramc DOCUMENTATION

Sybase PowerAMC 16. Guide des nouvelles fonctionnalités générales. www.sybase.fr/poweramc DOCUMENTATION Sybase PowerAMC 16 Guide des nouvelles fonctionnalités générales DOCUMENTATION 2 2 www.sybase.fr/poweramc A propos de PowerAMC 16 PowerAMC est une solution de modélisation d'entreprise graphique qui prend

Plus en détail

BIRT (Business Intelligence and Reporting Tools)

BIRT (Business Intelligence and Reporting Tools) BIRT (Business Intelligence and Reporting Tools) Introduction Cette publication a pour objectif de présenter l outil de reporting BIRT, dans le cadre de l unité de valeur «Data Warehouse et Outils Décisionnels»

Plus en détail

Introduction à la B.I. Avec SQL Server 2008

Introduction à la B.I. Avec SQL Server 2008 Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide

Plus en détail

Manuel d utilisation du module Liste de cadeaux PRO par Alize Web

Manuel d utilisation du module Liste de cadeaux PRO par Alize Web Manuel d utilisation du module Liste de cadeaux PRO par Alize Web INSTALLER ET CONFIGURER LE MODULE (BACK OFFICE) 2 Réglages des performances 2 Télécharger le module 3 Installer le module 4 Configurer

Plus en détail

La place de SAS dans l'informatique décisionnelle

La place de SAS dans l'informatique décisionnelle La place de SAS dans l'informatique décisionnelle Olivier Decourt ABS Technologies - Educasoft Formations La place de SAS dans l'informatique décisionnelle! L'historique de SAS! La mécanique! La carrosserie

Plus en détail

Créer un rapport pour Reporting Services

Créer un rapport pour Reporting Services Créer un rapport pour Reporting Services Comment créer des rapports pour SSRS Maintenant que nous avons vu que la version de SQL Server 2005 Express Edition with Advanced Services intègre SQL Server Reporting

Plus en détail

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données et le Data Mining Nous suivons le plan suivant : Fonctionnement de Spad Catalogue des méthodes (statistiques

Plus en détail

Deuxième Licence en Informatique Data Warehousing et Data Mining La Classification - 1

Deuxième Licence en Informatique Data Warehousing et Data Mining La Classification - 1 Deuxième Licence en Informatique Data Warehousing et Data Mining La Classification - 1 V. Fiolet Université de Mons-Hainaut 2006-2007 Nous allons aujourd hui nous intéresser à la tâche de classification

Plus en détail

FEN FICHE EMPLOIS NUISANCES

FEN FICHE EMPLOIS NUISANCES Version 4.8.2 Date mise à jour : 19 Février 2013 Auteur : LAFUMA Gilles Email : glfm02@orange.fr Web : www.procarla.fr/soft Présentation : FEN FICHE EMPLOIS NUISANCES Le Logiciel FEN Fiche emploi nuisance

Plus en détail

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence

Plus en détail

RapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/2011. 1.1 Présentation. 1.2 Ressources

RapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/2011. 1.1 Présentation. 1.2 Ressources Master Maths Finances 2010/2011 Data Mining janvier 2011 RapidMiner 1 Introduction 1.1 Présentation RapidMiner est un logiciel open source et gratuit dédié au data mining. Il contient de nombreux outils

Plus en détail

IBM SPSS Direct Marketing

IBM SPSS Direct Marketing IBM SPSS Statistics 19 IBM SPSS Direct Marketing Comprenez vos clients et renforcez vos campagnes marketing Points clés Avec IBM SPSS Direct Marketing, vous pouvez : Comprendre vos clients de manière plus

Plus en détail

ECR_DESCRIPTION CHAR(80), ECR_MONTANT NUMBER(10,2) NOT NULL, ECR_SENS CHAR(1) NOT NULL) ;

ECR_DESCRIPTION CHAR(80), ECR_MONTANT NUMBER(10,2) NOT NULL, ECR_SENS CHAR(1) NOT NULL) ; RÈGLES A SUIVRE POUR OPTIMISER LES REQUÊTES SQL Le but de ce rapport est d énumérer quelques règles pratiques à appliquer dans l élaboration des requêtes. Il permettra de comprendre pourquoi certaines

Plus en détail

Extraction d informations stratégiques par Analyse en Composantes Principales

Extraction d informations stratégiques par Analyse en Composantes Principales Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 dousset@irit.fr 1 Introduction

Plus en détail

La nouvelle planification de l échantillonnage

La nouvelle planification de l échantillonnage La nouvelle planification de l échantillonnage Pierre-Arnaud Pendoli Division Sondages Plan de la présentation Rappel sur le Recensement de la population (RP) en continu Description de la base de sondage

Plus en détail

AGROBASE : un système de gestion de données expérimentales

AGROBASE : un système de gestion de données expérimentales AGROBASE : un système de gestion de données expérimentales Daniel Wallach, Jean-Pierre RELLIER To cite this version: Daniel Wallach, Jean-Pierre RELLIER. AGROBASE : un système de gestion de données expérimentales.

Plus en détail

http://mondomaine.com/dossier : seul le dossier dossier sera cherché, tous les sousdomaines

http://mondomaine.com/dossier : seul le dossier dossier sera cherché, tous les sousdomaines Principales fonctionnalités de l outil Le coeur du service suivre les variations de position d un mot-clé associé à une URL sur un moteur de recherche (Google - Bing - Yahoo) dans une locale (association

Plus en détail

Le langage SQL Rappels

Le langage SQL Rappels Le langage SQL Rappels Description du thème : Présentation des principales notions nécessaires pour réaliser des requêtes SQL Mots-clés : Niveau : Bases de données relationnelles, Open Office, champs,

Plus en détail

Exemple PLS avec SAS

Exemple PLS avec SAS Exemple PLS avec SAS This example, from Umetrics (1995), demonstrates different ways to examine a PLS model. The data come from the field of drug discovery. New drugs are developed from chemicals that

Plus en détail

WHATSUP GOLD GESTION DE LA BASE DE

WHATSUP GOLD GESTION DE LA BASE DE WHATSUP GOLD GESTION DE LA BASE DE DONNEES VOTRE CONTACT TECHNIQUE JEAN-PHILIPPE SENCKEISEN LIGNE DIRECTE : 01 34 93 35 33 EMAIL : JPSENCKEISEN@ORSENNA.FR VOTRE CONTACT TECHNIQUE FABIEN TURQUOIS LIGNE

Plus en détail

UltraBackup NetStation 4. Guide de démarrage rapide

UltraBackup NetStation 4. Guide de démarrage rapide UltraBackup NetStation 4 Guide de démarrage rapide Table des matières 1 Fonctionnalités... 3 1.1 Ce qu UltraBackup NetStation permet de faire... 3 1.2 Ce qu UltraBackup NetStation ne permet pas de faire...

Plus en détail

Spécificités, Applications et Outils

Spécificités, Applications et Outils Spécificités, Applications et Outils Ricco Rakotomalala Université Lumière Lyon 2 Laboratoire ERIC Laboratoire ERIC 1 Ricco Rakotomalala ricco.rakotomalala@univ-lyon2.fr http://chirouble.univ-lyon2.fr/~ricco/data-mining

Plus en détail

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP)

Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP) Magasins et entrepôts de données (Datamart, data warehouse) Approche relationnelle pour l'analyse des données en ligne (ROLAP) Définition (G. Gardarin) Entrepôt : ensemble de données historisées variant

Plus en détail

«Manuel Pratique» Gestion budgétaire

«Manuel Pratique» Gestion budgétaire 11/06/01 B50/v2.31/F/MP005.01 «Manuel Pratique» Gestion budgétaire Finance A l usage des utilisateurs de Sage BOB 50 Solution Sage BOB 50 2 L éditeur veille à la fiabilité des informations publiées, lesquelles

Plus en détail

Performances. Gestion des serveurs (2/2) Clustering. Grid Computing

Performances. Gestion des serveurs (2/2) Clustering. Grid Computing Présentation d Oracle 10g Chapitre VII Présentation d ORACLE 10g 7.1 Nouvelles fonctionnalités 7.2 Architecture d Oracle 10g 7.3 Outils annexes 7.4 Conclusions 7.1 Nouvelles fonctionnalités Gestion des

Plus en détail

PRODIGE V3. Manuel utilisateurs. Consultation des métadonnées

PRODIGE V3. Manuel utilisateurs. Consultation des métadonnées PRODIGE V3 Manuel utilisateurs Consultation des métadonnées Pour plus d'information sur le dispositif : à remplir par chaque site éventuellement 2 PRODIGE V3 : Consultation des métadonnées SOMMAIRE 1.

Plus en détail

Guide de recherche documentaire à l usage des doctorants. Partie 1 : Exploiter les bases de données académiques

Guide de recherche documentaire à l usage des doctorants. Partie 1 : Exploiter les bases de données académiques Guide de recherche documentaire à l usage des doctorants Partie : Exploiter les bases de données académiques Sylvia Cheminel Dernière mise à jour : décembre 04 PANORAMA DES SOURCES DOCUMENTAIRES ACADEMIQUES...

Plus en détail

SERIE 1 Statistique descriptive - Graphiques

SERIE 1 Statistique descriptive - Graphiques Exercices de math ECG J.P. 2 ème A & B SERIE Statistique descriptive - Graphiques Collecte de l'information, dépouillement de l'information et vocabulaire La collecte de l information peut être : directe:

Plus en détail

TP 1. Prise en main du langage Python

TP 1. Prise en main du langage Python TP. Prise en main du langage Python Cette année nous travaillerons avec le langage Python version 3. ; nous utiliserons l environnement de développement IDLE. Étape 0. Dans votre espace personnel, créer

Plus en détail

Pourquoi un GMAO? Pourquoi GMAO-Machine Bateau? Démarrage Dossier Menu Principal Structure, classification des équipements Fiche d intervention

Pourquoi un GMAO? Pourquoi GMAO-Machine Bateau? Démarrage Dossier Menu Principal Structure, classification des équipements Fiche d intervention Pourquoi un GMAO? Pourquoi GMAO-Machine Bateau? Démarrage Dossier Menu Principal Structure, classification des équipements Fiche d intervention Journal des interventions Planning Gestion des tâches planifiées

Plus en détail

Utiliser Access ou Excel pour gérer vos données

Utiliser Access ou Excel pour gérer vos données Page 1 of 5 Microsoft Office Access Utiliser Access ou Excel pour gérer vos données S'applique à : Microsoft Office Access 2007 Masquer tout Les programmes de feuilles de calcul automatisées, tels que

Plus en détail

Easy to. report. Connexion. Transformation. Stockage. Construction. Exploitation. Diffusion

Easy to. report. Connexion. Transformation. Stockage. Construction. Exploitation. Diffusion M y R e p o r t, L A S O L U T I O N R E P O R T I N G D E S U T I L I S AT E U R S E X C E L Connexion Transformation Stockage Construction Exploitation Diffusion OBJECTIF REPORTING : De la manipulation

Plus en détail

Introduction : présentation de la Business Intelligence

Introduction : présentation de la Business Intelligence Les exemples cités tout au long de cet ouvrage sont téléchargeables à l'adresse suivante : http://www.editions-eni.fr Saisissez la référence ENI de l'ouvrage RI3WXIBUSO dans la zone de recherche et validez.

Plus en détail

clef primaire ; clef étrangère ; projection ; restriction ; jointure ; SQL ; SELECT ; FROM ; WHERE

clef primaire ; clef étrangère ; projection ; restriction ; jointure ; SQL ; SELECT ; FROM ; WHERE Cas Neptune hôtel Base de données et langage SQL Propriété Intitulé long Formation concernée Matière Notions Transversalité Présentation Description Neptune Hôtel. L interrogation d une base de données

Plus en détail

Exercices sur SQL server 2000

Exercices sur SQL server 2000 Exercices sur SQL server 2000 La diagramme de classe : Exercices sur SQL server 2000 Le modèle relationnel correspondant : 1 Créer les tables Clic-droit on Tables et choisir «New Table» Créer la table

Plus en détail

GUIDE D UTILISATION DU CENTRE DE DONNÉES DE L ISU

GUIDE D UTILISATION DU CENTRE DE DONNÉES DE L ISU GUIDE D UTILISATION DU CENTRE DE DONNÉES DE L ISU Table des matières Page I. DÉMARRER... 4 1. Comment accéder au Centre de données de l ISU?... 4 2. Quels sont les types de tableaux statistiques disponibles

Plus en détail

ERETES-SERIES. Support de formation. Formation ERETES ERETES-SERIE 1/58

ERETES-SERIES. Support de formation. Formation ERETES ERETES-SERIE 1/58 ERETES-SERIES Support de formation 2013 Formation ERETES ERETES-SERIE 1/58 1. Introduction... 4 2. La base de données «Serie»... 5 3. Les Interfaces... 11 4. Le Bloc-Notes... 14 5. La gestion des nomenclatures...

Plus en détail

Bases de données relationnelles

Bases de données relationnelles Bases de données relationnelles Système de Gestion de Bases de Données Une base de données est un ensemble de données mémorisé par un ordinateur, organisé selon un modèle et accessible à de nombreuses

Plus en détail

SUGARCRM MODULE RAPPORTS

SUGARCRM MODULE RAPPORTS SUGARCRM MODULE RAPPORTS Référence document : SYNOLIA_Support_SugarCRM_Module_Rapports_v1.0.docx Version document : 1.0 Date version : 2 octobre 2012 Etat du document : En cours de rédaction Emetteur/Rédacteur

Plus en détail

TP3 : Creation de tables 1 seance

TP3 : Creation de tables 1 seance Universite de Versailles IUT de Velizy - Algorithmique 2005/2006 TP3 : Creation de tables 1 seance Objectif : Creation et modication de tables dans une base de donnees. Avant de commencer ce TP, terminer

Plus en détail

Rapport de Mini-Projet en ArcGIS Engine

Rapport de Mini-Projet en ArcGIS Engine Rapport de Mini-Projet en ArcGIS Engine Réalisée par : Asmae BENMESSAOUD 3ème Année Cycle d Ingénieur Géoinformation Année Universitaire 2010- Sommaire 1 Introduction L analyse géographique et la visualisation

Plus en détail

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1

Tableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1 UN GROUPE D INDIVIDUS Un groupe d individus décrit par une variable qualitative binaire DÉCRIT PAR UNE VARIABLE QUALITATIVE BINAIRE ANALYSER UN SOUS-GROUPE COMPARER UN SOUS-GROUPE À UNE RÉFÉRENCE Mots-clés

Plus en détail

Grégoire de Lassence. Copyright 2006, SAS Institute Inc. All rights reserved.

Grégoire de Lassence. Copyright 2006, SAS Institute Inc. All rights reserved. Grégoire de Lassence 1 Grégoire de Lassence Responsable Pédagogie et Recherche Département Académique Tel : +33 1 60 62 12 19 gregoire.delassence@fra.sas.com http://www.sas.com/france/academic SAS dans

Plus en détail

INF6304 Interfaces Intelligentes

INF6304 Interfaces Intelligentes INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie

Plus en détail

Travaux pratiques avec RapidMiner

Travaux pratiques avec RapidMiner Travaux pratiques avec RapidMiner Master Informatique de Paris 6 Spécialité IAD Parcours EDOW Module Algorithmes pour la Fouille de Données Janvier 2012 Prise en main Généralités RapidMiner est un logiciel

Plus en détail

Surveillance de Scripts LUA et de réception d EVENT. avec LoriotPro Extended & Broadcast Edition

Surveillance de Scripts LUA et de réception d EVENT. avec LoriotPro Extended & Broadcast Edition Surveillance de Scripts LUA et de réception d EVENT avec LoriotPro Extended & Broadcast Edition L objectif de ce document est de présenter une solution de surveillance de processus LUA au sein de la solution

Plus en détail

La place de la Géomatique Décisionnelle dans le processus de décision

La place de la Géomatique Décisionnelle dans le processus de décision Géomatique décisionnelle La place de la Géomatique Décisionnelle dans le processus de décision - Arnaud Van De Casteele Mines ParisTech - CRC Arnaud {dot} van_de_casteele {at} mines-paristech.fr Les rencontres

Plus en détail

ht t p: // w w w.m e di al o gis.c om E - Ma i l : m ed i a l og i s @ m e di a l o g i s. c om Envoi des SMS

ht t p: // w w w.m e di al o gis.c om E - Ma i l : m ed i a l og i s @ m e di a l o g i s. c om Envoi des SMS Page 1/8 Envoi des SMS La nouvelle fonctionnalité d envoi de SMS va vous permettre d envoyer des SMS directement à partir de Médialogis SQL. Ces SMS peuvent être générés automatiquement lors de la saisie

Plus en détail

REQUEA. v 1.0.0 PD 20 mars 2008. Mouvements d arrivée / départ de personnels Description produit

REQUEA. v 1.0.0 PD 20 mars 2008. Mouvements d arrivée / départ de personnels Description produit v 1.0.0 PD 20 mars 2008 Mouvements d arrivée / départ de personnels Description produit Fonctionnalités L application Gestion des mouvements d arrivée / départ de Requea permet la gestion collaborative

Plus en détail

Logiciel de sauvegarde Echo

Logiciel de sauvegarde Echo Logiciel de sauvegarde Echo Guide de démarrage rapide Logiciel de sauvegarde Lexar Echo Guide de démarrage rapide INTRODUCTION Que vous soyez un professionnel en déplacement, un étudiant faisant ses devoirs

Plus en détail

Utilisation du Logiciel de statistique SPSS 8.0

Utilisation du Logiciel de statistique SPSS 8.0 Utilisation du Logiciel de statistique SPSS 8.0 1 Introduction Etude épidémiologique transversale en population générale dans 4 pays d Afrique pour comprendre les différences de prévalence du VIH. 2000

Plus en détail

Gestion de stock pour un magasin

Gestion de stock pour un magasin Département d Informatique Université de Fribourg, Suisse http://diuf.unifr.ch Gestion de stock pour un magasin Stock online utilise ASP/MS-Access DO Thi Tra My No étudiant : 05-333-750 Travail de séminaire

Plus en détail

Les tablettes et l'extranet Intermixt Mode d'emploi

Les tablettes et l'extranet Intermixt Mode d'emploi Les tablettes et l'extranet Mode d'emploi Ce document vous présente les étapes vous permettant d avoir accès aux documents disponibles sur l'extranet d'. Vous pouvez éventuellement les télécharger pour

Plus en détail

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013

Lamia Oukid, Ounas Asfari, Fadila Bentayeb, Nadjia Benblidia, Omar Boussaid. 14 Juin 2013 Cube de textes et opérateur d'agrégation basé sur un modèle vectoriel adapté Text Cube Model and aggregation operator based on an adapted vector space model Lamia Oukid, Ounas Asfari, Fadila Bentayeb,

Plus en détail

Your Detecting Connection. Manuel de l utilisateur. support@xchange2.net

Your Detecting Connection. Manuel de l utilisateur. support@xchange2.net Your Detecting Connection Manuel de l utilisateur support@xchange2.net 4901-0128-5 ii Table des matières Table des matières Installation... 4 Conditions d utilisation de XChange 2...4 Définir vos Préférences

Plus en détail

Mesurer les performances (CPU) sous Linux

Mesurer les performances (CPU) sous Linux Titre : Mesurer les performances (CPU) sous Linux Date : 22/07/2015 Page : 1/7 Mesurer les performances (CPU) sous Linux Résumé : Il existe des outils permettant de tracer les temps CPU utilisés (profiling).

Plus en détail

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI 1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage

Plus en détail

CREATION D UNE EVALUATION AVEC JADE par Patrick RUER (www.mathenvideo.comuv.com)

CREATION D UNE EVALUATION AVEC JADE par Patrick RUER (www.mathenvideo.comuv.com) TABLE DES MATIERES I) Le logiciel JADE 2 II) Etablissements 3 1) Configuation de l établissement 3 2) Importation des classes avec SCONET 4 3) Les groupes d élèves 6 4) Les variables supplémentaires 6

Plus en détail

PROBABILITES ET STATISTIQUE I&II

PROBABILITES ET STATISTIQUE I&II PROBABILITES ET STATISTIQUE I&II TABLE DES MATIERES CHAPITRE I - COMBINATOIRE ELEMENTAIRE I.1. Rappel des notations de la théorie des ensemble I.1.a. Ensembles et sous-ensembles I.1.b. Diagrammes (dits

Plus en détail