GUIDE DU DATA MINER. Classification - Typologies. Data Management, Data Mining, Text Mining

Dimension: px
Commencer à balayer dès la page:

Download "GUIDE DU DATA MINER. Classification - Typologies. Data Management, Data Mining, Text Mining"

Transcription

1 GUIDE DU DATA MINER Classification - Typologies Data Management, Data Mining, Text Mining 1

2 Guide du Data Miner Classification - Typologies Le logiciel décrit dans le manuel est diffusé dans le cadre d un accord de licence d utilisation et de non divulgation, et ne peut être utilisé ou copié qu en conformité avec les stipulations de l accord. Toute copie du programme sur CD-Rom, disque ou autre support à des fins autres que l usage personnel du programme par le licencié est interdite par la loi. Les informations figurant dans ce manuel sont sujettes à révision sans préavis et ne présentent aucun engagement de la part de COHERIS. Copyright 1996, 2013 COHERIS-SPAD. Tous droits réservés Pour tous renseignements complémentaires sur le logiciel SPAD, les formations et Etudes/Conseils, consultez le site ou écrivez-nous : support-spad@coheris.com info-spad@coheris.com COHERIS - 22 quai Gallieni Suresnes - France Tél : Fax :

3 Avant-propos Dans ce guide, le lecteur découvrira comment mettre en œuvre les méthodes de «Classification - Typologies», lire et interpréter les résultats. L équipe SPAD qui a participé collectivement à ce travail, remercie celles et ceux qui ont apporté le plus grand soin à la relecture de ce document. Mais naturellement, nous assumons la responsabilité des erreurs et imperfections que le lecteur attentif ne manquera pas de découvrir. Data Management, Data Mining, Text Mining 3

4 Table des matières CLASSIFICATION SUR FACTEURS (CAH / MIXTE)... 5 DESCRIPTION... 5 MISE EN ŒUVRE... 5 PARAMETRAGE DE LA METHODE... 6 RESULTATS... 8 COUPURE DE L ARBRE ET CARACTERISATION DES CLASSES DE LA TYPOLOGIE...22 DESCRIPTION MISE EN ŒUVRE PARAMETRAGE DE LA METHODE RESULTATS - GENERALITES RESULTATS DE LA CONSTRUCTION DES PARTITIONS RESULTATS DE LA CARACTERISATION AUTOMATIQUE DES PARTITIONS CARACTERISATION DES CLASSES DE TYPOLOGIES (CLASS-MINER)...43 DESCRIPTION MISE EN ŒUVRE PARAMETRAGE DE LA METHODE RESULTATS MARQUAGE SEMANTIQUE DES CLASSES DE LA TYPOLOGIE...46 DESCRIPTION MISE EN ŒUVRE PARAMETRAGE DE LA METHODE RESULTATS

5 Classification sur facteurs (CAH / MIXTE) Description Cette procédure effectue la classification des individus à partir de leurs premières coordonnées factorielles issues de l analyse factorielle préalable. Deux méthodes sont proposées : La Classification Ascendante Hiérarchique (CAH) dont le critère d agrégation est le critère de Ward (RECIP). La Classification Mixte (SEMIS), particulièrement adaptée aux fichiers volumineux. Une première classification est obtenue par le croisement de plusieurs partitions de base, ou par une seule partition construite par l algorithme des centres mobiles autour de centres choisis par l utilisateur ou tirés au hasard. Les classes stables ainsi formées sont ensuite agrégées par une CAH classique. Cette procédure ne peut être connectée qu à une méthode d analyse factorielle ou à une description des axes factoriels. Pour construire ensuite une ou plusieurs partitions (i.e. typologies) à partir de l arbre d agrégation construit par cette procédure, il suffit de connecter la méthode «Coupure de l arbre et caractérisation des classes». Mise en œuvre Importer la base «Aspi1000.sda» fournie avec les bases d exemples de SPAD (dans le sous-répertoire Data du répertoire d installation de SPAD) Reproduisez le paramétrage décrit dans le chapitre sur l Analyse des Correspondances Multiples Glissez-déposez la méthode «CAH-MIXTE» sur l ACM pour obtenir le diagramme suivant :. Le fichier contient des caractéristiques socio-économiques des personnes enquêtées ainsi que leurs réponses à diverses questions concernant leurs attitudes et leurs opinions vis-àvis de faits de la vie courante. Remarque : ce fichier est issu d une enquête réalisée il y a plus de 30 ans. Les résultats sont donc très souvent caricaturaux par rapport à la situation actuelle. 5

6 Paramétrage de la méthode Double-cliquez sur l icône de la méthode. La méthode «Hiérarchique» (RECIP) Tous les paramètres de l analyse ont une valeur par défaut correspondant aux choix les plus classiques. Vous pouvez modifier ces choix selon vos besoins. Reportez-vous à l aide en ligne pour le détail des paramètres. Le choix de la méthode (SEMIS ou RECIP) par défaut est automatique en fonction du nombre d individus de base analysée. Si le nombre d individus est inférieur à 10000, par défaut on fait une CAH, s il est supérieur on fait une classification mixte. Cette limite est modifiable dans le menu «Outils Préférences Analyse de données». Coordonnées utilisées pour l agrégation Ce paramètre indique le nombre de facteurs pris en compte pour calculer les distances entre individus et pour effectuer la partition en classes. C est au moment du choix de ce paramètre que l utilisateur devra se référer aux résultats de l analyse factorielle. Le nombre de coordonnées utilisées pour l agrégation sera au plus égal au nombre de coordonnées conservées dans l analyse factorielle précédente. Dans notre exemple, les paramètres «Sauvegarde partielle de l arbre : Nombre d éléments terminaux» et «Histogramme des indices» ont été modifiés de 50 (valeur par défaut) à 30. 6

7 La méthode «Mixte» (SEMIS) Tous les paramètres de l analyse ont une valeur par défaut correspondant aux choix les plus classiques. Vous pouvez modifier ces choix selon vos besoins. Reportez-vous à l aide en ligne pour le détail des paramètres. Partitions de base Trois méthodes sont disponibles. La première consiste à chercher les classes stables par croisement de plusieurs partitions de base construites autour d individus tirés au hasard. Le paramètre «Nombre» définit le nombre de partitions construites (2 par défaut) et l item «Taille» détermine le nombre d individus paramètre au hasard pour chaque partition. Ce sont les centres initiaux de chacune des partitions. Les deux autres consistent à construire une seule partition par l algorithme des centres mobiles autour de N centres choisis par l utilisateur ou tirés au hasard dans l ensemble de la population. 7

8 Résultats Les résultats sont accessibles par le menu contextuel de la méthode (Clic droit Résultats - Rapport). Ils sont ici édités dans Excel, dans différentes feuilles. Dans les préférences de SPAD (Outils Préférences Résultats Sorties graphiques), vous avez la possibilité de choisir un autre tableur comme «Open Office», ou une sortie de type HTML éditable avec votre navigateur internet. Les méthodes de classification (Mixte ou CAH) ont des résultats spécifiques et des résultats communs. Pour chaque feuille on précise s il s agit d un résultat spécifique ou commun. CLASSIF-1 : Classification mixte sur les premiers axes factoriels Cette édition est spécifique à la classification mixte Les résultats dépendent du choix fait pour les partitions de base. Résultats obtenus à partir de 2 partitions croisées de taille 10 chacune Les deux tableaux suivants comportent 4 colonnes : Numéro de la classe : Rang de chaque classe. Numéro d individu : Indice dans la base de l individu défini comme centre de la classe. Poids : Indique le poids des individus de la classe. Effectif : Effectif de la classe. Partition 1 Numéro de la Numéro classe d'individu Poids Effectif , , , , , , , , , , Partition 2 Numéro de la Numéro classe d'individu Poids Effectif , , , , , , , , , ,

9 Résultats obtenus à partir d une partition sur N centres tirés au hasard Le nombre de classes dépend de la taille (ou du nombre de centres mobiles) choisis pour la partition (10 dans l exemple). On obtient le rang de classe, l indice dans la base de l individu choisi au hasard comme centre de la classe, le poids et l effectif de la classe Numéro de la Numéro classe d'individu Poids Effectif , , , , , , , , , , CLASSIF-2 : Résultats du croisement Cette édition est spécifique à classification mixte Cette édition fournit la liste des groupements stables finaux qui seront soumis à la CAH. Le nombre de groupements finaux peut être inférieur ou égal au nombre de classes issues de la classification initiale (N partitions croisées, une partition de base sur N centres tirés au hasard ou une partition de base sur N centres choisis) selon l option que vous avez prise sur le nombre de groupements stables à conserver. Si vous avez choisi de conserver tous les regroupements issus de la classification initiale, vous disposez de la liste des groupements non vides. On note dans ce cas que les poids des classes (avant/après) sont identiques. Si vous avez choisi de conserver les N groupements les plus stables par «Sélection par seuil de poids en %» ou en conservant «les N plus lourds», que vous n avez pas demandé de «classe résiduelle» et que ce nombre est inférieur au nombre P de classes initiales, les individus appartenant aux P-N classes initiales non retenues sont réaffectés à ces N groupes finaux par un processus itératif à centres mobiles cherchant à améliorer l homogénéité interne des groupements en réaffectant les éléments d une classe à une autre classe dont ils sont plus proches. On note dans ce cas que les poids des classes (avant/ après) peuvent être différents. Si vous avez choisi la création d une classe résiduelle, les individus appartenant aux P-N classes initiales non retenues sont affectés à la classe résiduelle. Les autres classes ne sont pas affectées. 9

10 Résultats obtenus avec 2 partitions croisées de taille 10 et conservation de tous les groupements stables. Le tableau ci-dessous présente le croisement entre les partitions de base obtenues précédemment (2 dans l exemple). On retient comme classes finales les classes stables constituées par les individus classés ensemble dans les partitions de base. Le tableau est composé des 4 colonnes suivantes : Poids avant : Indique le poids de la classe avant les réaffectations éventuelles. Pourcentage cumulé : Donne le pourcentage cumulé des poids des individus des classes avant les réaffectations. Numéro de la classe : Rang de la classe. Chaque classe est considérée comme un nœud ou un élément terminal soumis à la CAH. Poids après : Représente le poids des individus de la classe après les réaffectations éventuelles. Une partie du tableau a été tronquée. Poids avant Pourcentage Numéro de la cumulé classe Poids après 85,000 8,500 &01& 85,000 82,000 16,700 &02& 82,000 72,000 23,900 &03& 72,000 65,000 30,400 &04& 65,000 58,000 36,200 &05& 58,000 49,000 41,100 &06& 49,000 49,000 46,000 &07& 49,000 43,000 50,300 &08& 43,000 43,000 54,600 &09& 43,000 1,000 99,800 &57& 1,000 1,000 99,900 &58& 1,000 1, ,000 &59& 1,000 0, ,000 Classe résiduelle Lecture / interprétation Dans l exemple, on remarque qu à partir des 2 partitions croisées de 10 classes (Soit 100 classes potentielles), on obtient 59 classes stables non vides. Ces classes seront ensuite agrégées par l algorithme d agrégation hiérarchique dont les résultats sont rassemblés dans le tableau de la description des nœuds d indices les plus élevés. On note que les poids (avant/ après) sont identiques dans la mesure où il n y a pas eu de processus itératif de réaffectation. 10

11 Résultats obtenus avec 2 partitions croisées de taille 10 et conservation de 20 groupements stables. Poids avant Pourcentage Numéro de la cumulé classe Poids après 85,000 8,500 &01& 93,000 82,000 16,700 &02& 87,000 72,000 23,900 &03& 78,000 65,000 30,400 &04& 73,000 58,000 36,200 &05& 72,000 49,000 41,100 &06& 54,000 49,000 46,000 &07& 50,000 43,000 50,300 &08& 49,000 43,000 54,600 &09& 54,000 39,000 58,500 &10& 45,000 39,000 62,400 &11& 43,000 33,000 65,700 &12& 37,000 33,000 69,000 &13& 44,000 32,000 72,200 &14& 43,000 27,000 74,900 &15& 34,000 22,000 77,100 &16& 26,000 21,000 79,200 &17& 41,000 18,000 81,000 &18& 24,000 18,000 82,800 &19& 21,000 18,000 84,600 &20& 32, , ,000 Classe résiduelle Lecture / interprétation A partir des 2 partitions croisées de 10 classes (Soit 100 classes potentielles), on conserve les 20 classes avec les effectifs les plus importants, les individus restants sont regroupés dans une classe résiduelle (154 personnes) dont les individus sont ensuite réaffectés aux 20 classes par l algorithme des centres mobiles. Dans notre exemple, on observe que la classe 1 qui était initialement composée de 85 individus en contient 93 après réaffectation des individus de la classe résiduelle. La procédure SEMIS fournit ensuite respectivement dans les sorties «CLASSIF-3» et «CLASSIF-6» la description des nœuds d indices les plus élevés puis la description des nœuds de la hiérarchie. Ces résultats sont également fournis par la classification hiérarchique (RECIP). 11

12 CLASSIF-3 : Description des nœuds d indices les plus élevés Cette édition est disponible pour la classification mixte (SEMIS) et la CAH (RECIP). Les résultats présentés ici sont issus de la CAH (RECIP). La description des nœuds est constituée de 6 composantes : Numéro : Donne les numéros des nœuds. Ces numéros sont attribués séquentiellement.. Aîné : Un des deux nœuds terminaux agrégé (avec le benjamin) à une étape donnée pour former le nœud de numéro «Numéro». Benjamin : Nœud terminal agrégé avec l aîné pour former le nouveau nœud identifié par son numéro. L aîné et le benjamin sont les deux éléments dont le regroupement entraîne une perte d inertie inter-classes minimale. Nb d éléments terminaux du nœud : Donne le nombre d éléments terminaux dans le nœud créé. Equivaut à la somme des éléments terminaux contenus dans l aîné et le benjamin. Poids du nœud : Poids du nœud, qui dépend de celui de chaque élément terminal. Dans le cas d une pondération uniforme, le poids et le nombre d éléments terminaux sont identiques. Indice de niveau : Donne la valeur de l indice d agrégation (ou indice de niveau) de chaque nœud. Cet indice d agrégation (au sens du critère de Ward) mesure la dissimilarité entre les classes. L indice de niveau d un nœud est en fait la perte d inertie inter-classes occasionnée par la formation du nœud. Ce nœud est formé par le regroupement des deux nœuds dont les numéros sont donnés par les colonnes Aîné et Benjamin. Par défaut, les 50 premiers nœuds sont édités. On peut également demander l édition complète. Ici, le listage des 30 premiers est suffisante. 12

13 Cette édition est tronquée. Numéro Ainé Benjamin Nb d'éléments terminaux du noeud Poids du noeud Indice de niveau ,000 0, ,000 0, ,000 0, ,000 0, ,000 0, ,000 0, ,000 0, ,000 0, ,000 0, ,000 0, ,000 0, ,000 0, ,000 0, ,000 0, ,000 0, ,000 0, ,000 0, ,000 0, ,000 0, ,000 0, ,000 0, ,000 0, ,000 0, ,000 0, ,000 0, ,000 0, ,000 0, ,000 0, ,000 0, ,000 0,128 Somme des indices de niveau 1,837 Lecture / interprétation Le nœud 1970, par exemple, est formé des nœuds 1936 et Il est constitué de 78 éléments. La valeur de l indice d agrégation est de 0,011. La somme des indices de niveau est la somme totale des indices pour tous les individus participant à la classification. Les indices présents dans cette feuille sont présentés dans l éditeur graphique de hiérarchies sous la forme d un histogramme pour une meilleure lisibilité. 13

14 CLASSIF-4 : Description des nouveaux éléments terminaux Cette édition n est disponible que pour la CAH (RECIP). Elle est optionnelle et correspond au paramètre «Composition des éléments terminaux». Le tableau ci-après édite la composition des 30 éléments terminaux (50 par défaut). Cela permet de connaître la répartition des individus dans les éléments terminaux, qui se définissent comme les classes d individus obtenues lorsque l on coupe l arbre d agrégation hiérarchique en un certain niveau. Ce tableau est constitué de 14 colonnes : Numéro : Rang de l élément terminal. Celui-ci est attribué séquentiellement. Nœud : Numéro du nœud terminal. Indice : Valeur de l indice de niveau du nœud terminal. Aîné : Premier nœud qui compose le nœud terminal. Benjamin : Second nœud qui compose le nœud terminal. Effectif : Effectif du nœud terminal. Colonnes Identificateur : Donne l identificateur de l ensemble des individus qui sont agrégés dans le nœud terminal. Dans le cas de cette enquête, les individus sont anonymes et l édition de la composition des éléments terminaux a peu d intérêt. On se limite à l édition de 5 nœuds parmi les nouveaux éléments terminaux formés par l agrégation. Cette édition est tronquée. Numéro Noeud Indice Ainé Benjamin Effectif Identificateur Identificateur Identificateur Identificateur Identificateur Identificateur Identificateur Identificateur , , , , ,

15 CLASSIF-5 : Coordonnées et valeurs-tests des nœuds terminaux Cette édition n est disponible que pour la méthode RECIP. Elle est optionnelle et correspond au paramètre «Coordonnées des éléments terminaux». Dans cette feuille on disposera de 2 tableaux donnant successivement les coordonnées, puis les valeurs-test des éléments terminaux conservés fixé ici à 30 (paramètre «Sauvegarde partielle de l arbre : Nombre d éléments terminaux») sur les axes factoriels. Par défaut, le nombre d axes factoriels est fixé à 5, ce paramètre est modifiable dans l interface de commande de la méthode. Le tableau des coordonnées est composé par défaut de 9 colonnes : Numéro : Donne le rang du nœud. Identificateur : Numéro du nœud terminal. Poids : Poids du nœud terminal. Effectif : Effectif du nœud terminal. Dans l exemple, le poids des individus est uniforme, donc le poids et l effectif des nœuds sont identiques. Axe1 Axe5 : Coordonnées des nœuds terminaux sur les axes factoriels. Numéro Identificateur Poids Effectif Axe 1 Axe 2 Axe 3 Axe 4 Axe , ,407-0,951 0,204 0,395 1, , ,506-1,067-0,881-0,169-0, , ,513-0,946 0,154-0,978-0, , ,576 0,396-1,423-0,279-1, , ,441-1,077-1,484-0,791-1, , ,371-0,577-0,174 1,051 0, , ,352 0,068-0,798 0,665-1, , ,211 0,001 0,850 0,188-0, , ,595 0,120 1,312 0,696-1, , ,400-0,252 0,641 1,519-1, , ,642-1,049 0,084-1,644-0, , ,649-0,570 1,182-0,628-0, , ,334-0,784-0,016 0,251 0, , ,643-0,138-0,330 0,057 0, , ,846 0,645-1,040-0,689 0, , ,242 1,699-0,905-0,462 0, , ,937 0,115 0,073-1,766 0, , ,244 0,233-0,194-0,931 1, , ,126 0,511 0,753 0,932-0, , ,032 0,104 0,147 0,852-0, , ,156-0,988-1,597-0,510-1, , ,661-0,558-0,063-1,159-0, , ,501 0,107-0,241 0,228 0, , ,599-0,014-0,636 2,096 0, , ,367 0,953-1,159 0,525-0, , ,069-0,384 0,322 0,371 0, , ,689 0,150-0,349-0,711-0, , ,395 0,802 1,477 0,019 0, , ,669 1,345 0,235 0,131-0, , ,997 2,044 0,661-0,746 0,413 15

16 Le tableau des valeurs-tests est composé par défaut de 9 colonnes: Numéro : Donne le rang du nœud. Identificateur : Numéro du nœud terminal. Poids : Poids du nœud terminal. Effectif : Effectif du nœud terminal. Dans l exemple, le poids des individus est uniforme, donc le poids et l effectif des nœuds sont identiques. Axe1 Axe5 : Valeurs-test des nœuds terminaux sur les axes factoriels. Numéro Identificateur Poids Effectif Axe 1 Axe 2 Axe 3 Axe 4 Axe , ,279-7,660 1,639 3,181 9, , ,666-5,616-4,641-0,887-0, , ,434-4,485 0,731-4,635-1, , ,666 1,831-6,587-1,290-4, , ,730-5,775-7,959-4,245-9, , ,201-3,421-1,033 6,229 4, , ,507 0,292-3,416 2,847-5, , ,001 0,003 4,213 0,933-4, , ,250 0,658 7,169 3,804-6, , ,938-1,222 3,107 7,364-5, , ,183-5,200 0,416-8,148-0, , ,180-4,550 9,437-5,012-1, , ,236-5,256-0,107 1,681 2, , ,045-1,084-2,585 0,450 4, , ,620 3,521-5,680-3,766 2, , ,223 8,598-4,581-2,339 2, , ,027 0,616 0,393-9,475 2, , ,399 1,337-1,114-5,352 7, , ,713 2,889 4,256 5,267-2, , ,328 0,739 1,042 6,045-3, , ,194-3,582-5,792-1,850-4, , ,828-2,389-0,268-4,958-0, , ,881 0,615-1,382 1,308 0, , ,087-0,050-2,215 7,301 2, , ,525 7,335-8,922 4,043-0, , ,826-3,535 2,958 3,414 3, , ,431 0,661-1,535-3,128-0, , ,272 4,756 8,760 0,112 3, , ,024 8,095 1,417 0,791-4, , ,264 12,840 4,151-4,689 2,594 Lecture / interprétation Ces tableaux permettent de juger, au travers des coordonnées, de «l originalité» des éléments terminaux sur les premiers axes factoriels, et au travers des valeurs-tests de la significativité de ces éléments terminaux sur ces axes. Dans la méthode «Coupure de l arbre et caractérisation des classes de la typologie» qui permet d obtenir les partitions finales, on obtient les mêmes tableaux qui permettent de juger de la pertinence de ces partitions. Les tableaux présentés ici correspondent à une coupure finale de l arbre en 30 classes, ce qui est intéressant à titre indicatif mais qui n est pas opérationnel pour une typologie (trop de classes). 16

17 CLASSIF-6 : Description des nœuds de la hiérarchie (au-dessus des nœuds terminaux) Cette édition est disponible pour les deux méthodes de classification. Ce tableau donne les caractéristiques des nœuds situés au-dessus des nœuds terminaux. Il décrit de quelle façon s agrègent ces nœuds. Le tableau est composé de 8 colonnes : Rang du nœud : Rang du nœud étudié (au-dessus des nœuds terminaux). Dans l exemple, on a sauvegardé les 30 derniers nœuds terminaux. Le premier nœud formé par l agrégation de deux nœuds terminaux est donc de rang 31. Le second est de rang 32, etc. Indice du nœud : Indice en pourcentage de la somme des indices pour les N-1 nœuds terminaux. Dans l exemple, on a choisi 30 nœuds terminaux, la somme des 29 derniers nœuds est de 1,12563 (information fournie dans le titre du tableau). Aîné : Rang du premier nœud qui compose le nœud étudié. Benjamin : Rang du second nœud qui compose le nœud étudié. Le nœud de rang 42 est formé des nœuds de rangs 13 et 14, qui sont donc deux des 30 nœuds terminaux. Effectif : Effectif du nœud terminal. Poids : Poids du nœud terminal. Dans l exemple, le poids des individus est uniforme, donc le poids et l effectif des nœuds sont identiques. Rang du premier nœud terminal : Donne le rang du premier nœud terminal compris dans le nœud étudié. Rang du dernier nœud terminal : Donne le rang du dernier nœud terminal compris dans le nœud étudié. 17

18 Indices en pourcentage de la somme des indices ( ) Rang du noeud Indice du noeud Ainé Benjamin Effectif Poids Rang du premier Rang du dernier noeud terminal noeud terminal 31 0, , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , , Lecture / interprétation Ainsi, le nœud de rang 57 est le regroupement de tous les nœuds terminaux de rang 1 à 20. Son indice représente 9,527% de la somme des indices des 29 derniers regroupements. 18

19 L éditeur graphique de hiérarchies Après l exécution de la méthode de classification, vous pouvez consulter et mettre en valeur les résultats grâce à l éditeur graphique de hiérarchies. Cet éditeur est accessible par le menu contextuel de la méthode (Clic droit Résultats Editeur graphique de hiérarchies). LE «DENDROGRAMME» Le dendrogramme est la représentation graphique de la hiérarchie des partitions. Un intérêt du dendrogramme est de suggérer le nombre de classes qui existent dans l échantillon. On peut couper l arbre là où le palier est le plus grand. Le nombre de classes sera égal au nombre de branches coupées. Classification hiérarchique directe (sur facteurs) 4 59% 8% 13% 20% 7 16% 31% 11% 8% 6% 7% 20% 9 11% 5% 13% 19% 11% 8% 6% 7% 20% Attention : les pourcentages affichés ici sont indicatifs. La méthode «Coupure de l arbre et caractérisation des classes de la typologie» qui créé les partitions finales utilise un algorithme de consolidation des classes qui conduira à des % légèrement différents. LA BARRE D OUTILS DE L EDITEUR HIERARCHIQUE Affichage / Suppression Suppression Affichage coupures libellés individus n nœud de l arbre Affichage Affichage valeur Retournement n du nœud indice de niveau vertical ou horizontal 19

20 L HISTOGRAMME DES INDICES DE NIVEAU «Edition» - «Courbe des indices de niveau» : L indice de niveau est la perte d inertie inter-classes occasionnée par la formation du nœud. La barre la plus longue, en bas de l histogramme, correspond à une coupure de l arbre en deux classes. En coupant par exemple au niveau de la seconde barre la plus longue de l histogramme, on génère une partition en trois classes. Comme le graphique du dendrogramme, cet histogramme permet donc de détecter graphiquement les coupures les plus intéressantes «statistiquement». Dans notre exemple, ce sont les coupures en 4 (3 barres) ou 9 classes (8 barres). 20

21 Conseils La classification mixte est relativement instable sur des échantillons de petite taille. Nous vous conseillons d utiliser la procédure RECIP (CAH) sur des échantillons de moins de individus. Au-delà, la méthode SEMIS permet de réduire les temps d exécution et fournit des partitions stables. Il est équivalent d effectuer une classification des individus à partir des données brutes ou à partir de l ensemble des facteurs issus de l analyse factorielle. En effet, en passant des variables initiales aux facteurs, sans en réduire leur nombre et ce, malgré leur obtention dans l ordre décroissant de la variance expliquée, on ne perd aucune information. Il s agit mathématiquement d un changement de repère des individus (changement de base). Notre conseil reste cependant de ne retenir que les axes porteurs d informations pour la classification. En effet, en utilisant tous les axes, on introduit souvent des différences qui rendent la construction de l arbre classification et sa coupure en différentes partitions plus instables. Pour le choix des axes, on utilisera soit la règle de «Cattel» soit l algorithme du coude décrits dans les guides sur les différentes analyses factorielles (ACM, ACP, AFC). 21

22 Coupure de l arbre et caractérisation des classes de la typologie Description Cette méthode ne peut être connectée qu à la méthode «CAH Mixte - Classification Ascendante Hiérarchique, Classification mixte». Cette méthode construit des partitions par coupure d un arbre de classification. La procédure crée soit les partitions demandées explicitement par l utilisateur, soit les partitions résultant d un algorithme de recherche automatique des meilleures partitions. La qualité des partitions peut être améliorée par un processus itératif de consolidation, utilisant le principe des «centres mobiles». Les partitions créées sont ensuite automatiquement caractérisées par tous les éléments ayant participé à l analyse factorielle préalable. On peut caractériser soit chaque classe d une partition, soit la partition elle-même. Tous les éléments disponibles (actifs et illustratifs) peuvent intervenir dans la caractérisation : les modalités des variables nominales, les variables nominales elles-mêmes, les variables continues, les fréquences, ou les axes factoriels. Les éléments caractéristiques sont classés par ordre d importance à l aide d un critère statistique la «valeur-test» auquel est associé une probabilité : plus la valeur-test est grande et plus la probabilité est faible, plus l élément est caractéristique. Cette caractérisation automatique permet d interpréter très rapidement les partitions construites, et de n archiver dans les données que les typologies opérationnelles. Après exécution de la méthode, on dispose des résultats numériques et de la possibilité d explorer interactivement ces résultats à travers l éditeur graphique de plans factoriels. Cet éditeur particulièrement puissant permet de mettre en valeur les résultats de l analyse. Les partitions (typologies) créées par la méthode peuvent être ajoutées comme nouvelles variables dans les données à l aide de la méthode «Archivage axes factoriels et typologies» disponible dans le dossier «Industrialisation - Archivage». 22

23 Mise en œuvre Importer la base «Aspi1000.sda» fournie avec les bases d exemples de SPAD (dans le sous-répertoire Data du répertoire d installation de SPAD). Reproduisez les paramétrages décrits dans les chapitres sur «L analyse des Correspondances Multiples», la «Description des facteurs» et la «Classification sur facteurs (CAH/MIXTE)». Glissez-déposez ensuite la méthode «Coupure de l arbre et caractérisation des classes de la typologie» sur la méthode classification pour obtenir le diagramme suivant : Le descriptif des données est détaillé dans le chapitre sur l Analyse des Correspondances Multiples. Ce chaînage peut être construit méthode par méthode dans le diagramme, mais dans la mesure où il s agit d un enchainement typique pour construire des typologies avec SPAD, celui-ci est disponible sous forme d un «Favori». Les favoris sont disponibles dans le deuxième onglet de la vue «Méthodes» Sélectionnez le favori, puis faites un glisser-déposer dans le diagramme, les 4 méthodes apparaîtront. Reliez ensuite des données (méthode d importation) à la première méthode du chaînage (l analyse factorielle) et procédez aux paramétrages et aux exécutions des méthodes. 23

24 Paramétrage de la méthode Double-cliquez sur l icône de la méthode. L onglet Choix des partitions Cet onglet vous permet de choisir le nombre de partitions ainsi que le nombre de classes souhaitées. Pour la création des partitions, vous avez le choix entre le mode manuel ou un mode automatique basé sur l algorithme du coude. Dans notre exemple nous optons pour la recherche automatique des meilleures partitions. Le choix «Définies par l utilisateur» offre surtout un intérêt après examen des partitions préconisées par défaut. Note : Compte tenu des résultats observés pour la classification et en particulier la courbe des indices de niveaux, nous pouvons supposer que la recherche automatique basée sur l algorithme du coude trouvera comme meilleures partitions celle en 4 classes et celle en 9 classes. 24

25 L onglet Paramètres de partitionnement Itérations de consolidation L objectif de la consolidation est de réaffecter les éléments d une classe à une autre classe dont ils sont plus proches de façon à améliorer l homogénéité à l intérieur des classes. Ce processus s effectue par des itérations successives en utilisant la technique des «centres mobiles». Les centres mobiles sont initialement les centres de gravité des classes obtenues par coupure de l arbre. Les calculs sont arrêtés dès que l accroissement de l inertie interclasses devient trop faible d une itération à l autre ou dès que le nombre fixé ici est atteint. La valeur par défaut (10) convient à la grande majorité des cas. Si le nombre d itérations est fixé à 0, il n y aura pas de consolidation : les résultats de la coupure de l arbre sont conservés tels quels. Affectation des individus illustratifs aux classes les plus proches Ce paramètre commande l affectation des individus illustratifs à la classe dont le centre de gravité est le plus proche au sens de la distance euclidienne. Par défaut, le logiciel ne réalise pas cette affectation et considère les individus illustratifs comme des données manquantes. Dans notre exemple, nous ne disposons pas d individus illustratifs. 25

26 L onglet Caractérisation des partitions Cet onglet est identique à l onglet «Paramètres» de la méthode «Caractérisation d une variable qualitative». En effet, caractériser une variable qualitative existant dans les données ou une partition que l on vient de calculer repose sur les mêmes principes. Dans notre exemple, nous gardons les paramètres par défaut qui ne proposent que les éditions les plus couramment utilisées. 26

27 Résultats - généralités Les résultats sont accessibles par le menu contextuel de la méthode (Clic droit Résultats - Rapport). Ils sont ici édités dans Excel, dans différentes feuilles. Dans les préférences de SPAD (Outils Préférences Résultats Sorties graphiques), vous avez la possibilité de choisir un autre tableur comme «Open Office», ou une sortie de type HTML éditable avec votre navigateur internet. Note : Par défaut, on dispose en sortie de plusieurs classeurs. Un classeur unique regroupant les éditions associées à la construction des N partitions, et N classeurs pour la caractérisation de chaque partition. Il également possible de regrouper les caractérisations des partitions en demandant l édition des résultats en mode fusionné dans les préférences de SPAD (Outils Préférences Résultats Sorties graphiques). Comme attendu, la recherche automatique de partitions a détecté comme meilleures partitions la partition en 4 classes et la partition en 9 classes. Dans le classeur Excel correspondant, on a d abord les feuilles concernant la partition en 4 classes, puis les feuilles correspondant à celle en 9 classes avec un système incrémental pour les distinguer. Les feuilles correspondant à la première partition (en 4 classes) n ont pas de suffixe, Les feuilles correspondant à la seconde (en 9 classes) ont le suffixe «_1», pour une troisième se serait «_2». Dans la suite du document, les éditions sont identifiées sans référence au numéro de partition. La partition analysée est celle en 9 clases. 27

28 Résultats de la construction des partitions PARTI-1 : Coupure b de l arbre en 9 classes Ce tableau décrit sommairement les classes avant la consolidation. Le tableau comporte 4 colonnes : Classe : Identificateur générique de la classe. Effectif : Nombre d individus de la classe. Poids : Poids des individus de la classe. Contenu : Rangs des nœuds terminaux de la classe. Un nœud terminal est un ensemble d individus réunis au cours du processus d agrégation. Dans l exemple, on avait choisi 30 nœuds terminaux. Formation des classes (sur les individus actifs) Description sommaire Classe Effectif Poids Contenu Classe ,000 1 à 3 Classe ,000 4 à 5 Classe ,000 6 à 10 Classe , à 14 Classe , à 18 Classe , à 20 Classe , à 23 Classe , à 25 Classe , à 30 Lecture / interprétation La partition en 9 classes, obtenue sur les 1000 individus, donne deux grandes classes de 204 et 185 éléments, trois classes plus petites de 110 à 128 éléments et quatre petites classes (49 à 79 éléments). Les poids des classes sont identiques aux effectifs puisque la pondération est uniforme. 28

29 PARTI-2 : Coordonnées et valeurs-test des centres des classes avant consolidation Dans cette feuille on dispose de 2 tableaux donnant successivement les coordonnées, puis les valeurs-test des centres des classes avant consolidation sur les axes factoriels. Par défaut, le nombre d axes factoriels est fixé à 5. Ce paramètre est modifiable dans l interface de commande de la méthode. Coordonnées des centres des classes avant consolidation Ce tableau se compose par défaut de 9 colonnes : Libellé : Identificateur générique de la classe. Effectif : Nombre d individus de la classe. Poids absolu : Poids des individus de la classe. Distance à l origine : Carré de la distance du Khi-2 entre l origine et le centre de gravité de la classe mesuré dans le sous-espace factoriel choisi (10 axes ici). Axe 1 Axe 5 : Coordonnées des centres de gravité sur les premiers axes. Libellé Effectif Poids absolu Distance à l'origine Axe 1 Axe 2 Axe 3 Axe 4 Axe 5 Classe 1 / 9 110, ,000 0,635 0,129-0,476-0,033-0,008 0,238 Classe 2 / 9 49,000 49,000 1,383 0,556-0,217-0,665-0,251-0,644 Classe 3 / 9 128, ,000 0,461-0,111-0,079 0,189 0,368-0,276 Classe 4 / 9 185, ,000 0,344-0,298-0,266 0,131-0,149 0,075 Classe 5 / 9 114, ,000 0,667-0,240 0,307-0,228-0,426 0,300 Classe 6 / 9 79,000 79,000 1,329-0,352 0,128 0,176 0,387-0,225 Classe 7 / 9 63,000 63,000 1,366 0,158-0,150-0,214-0,141-0,096 Classe 8 / 9 68,000 68,000 1,523-0,640 0,381-0,487 0,352 0,035 Classe 9 / 9 204, ,000 0,501 0,571 0,298 0,228-0,016 0,069 Lecture / interprétation D après les carrés des distances à l origine, la classe 8 est la plus «atypique». Elle contient des individus dont les caractéristiques sont très différentes de «l individu moyen» de l échantillon. La classe 4 est la plus proche de cet «individu moyen». 29

30 Valeurs-tests des centres des classes avant consolidation Ce tableau se compose par défaut de 9 colonnes : Libellé : Identificateur générique de la classe. Effectif : Nombre d individus de la classe. Poids absolu : Poids des individus de la classe. Distance à l origine : Carré de la distance du Khi-2 entre l origine et le centre de gravité de la classe mesuré dans le sous-espace factoriel choisi (10 axes ici). Axe 1 Axe 5 : Valeurs-test des centres de gravité sur les premiers axes. Une classe est d autant plus intéressante sur un axe que sa valeur-test est plus grande en valeur absolue. Libellé Effectif Poids absolu Distance à l'origine Axe 1 Axe 2 Axe 3 Axe 4 Axe 5 Classe 1 / 9 110, ,000 0,635 2,748-10,872-0,807-0,200 6,167 Classe 2 / 9 49,000 49,000 1,383 7,678-3,198-10,457-4,101-10,749 Classe 3 / 9 128, ,000 0,461-2,580-1,956 5,005 10,155-7,789 Classe 4 / 9 185, ,000 0,344-8,627-8,231 4,324-5,128 2,612 Classe 5 / 9 114, ,000 0,667-5,223 7,143-5,662-11,020 7,920 Classe 6 / 9 79,000 79,000 1,329-6,265 2,442 3,561 8,175-4,859 Classe 7 / 9 63,000 63,000 1,366 2,495-2,532-3,849-2,628-1,823 Classe 8 / 9 68,000 68,000 1,523-10,516 6,678-9,106 6,850 0,702 Classe 9 / 9 204, ,000 0,501 17,584 9,795 8,004-0,602 2,576 Lecture / interprétation Ce tableau permet de juger à travers la statistique des valeurs-test de l intérêt des classes dans les différentes directions factorielles. On voit par exemple que toutes les classes sont bien différenciées sur le premier plan factoriel, que les classes 8 et 9 s opposent fortement sur le premier axe, mais sont assez proches sur le second. 30

31 PARTI-3 / PARTI-4 : Liste des individus actifs dans les classes de la partition avant consolidation La procédure permet d éditer la correspondance «classes-individus», avant et après le processus d itérations de consolidation des partitions. La correspondance «classes-individus» avant itérations est restituée dans les feuilles Parti-3 et Parti-4, celle après itérations de consolidation dans les feuilles Parti-9 et Parti- 10. Ces éditions sont optionnelles car où la correspondance «classes-individus» n est pertinente que si l on s intéresse de près aux individus. Dans cette enquête, comme dans la majorité des cas, les individus sont anonymes et la correspondance «classes-individus» présente peu d intérêt sous cette forme (listage) sachant que toute partition construite peut être archivée dans les données. Si les individus sont peu nombreux et représentent des «entités» non anonymes, l étude des transferts d une classe à une autre en fonction des itérations de consolidation peut présenter un intérêt. Pour obtenir ces éditions, vous devez les demander et préciser le type d édition souhaitée (Composition de chaque classe et/ou Classe d appartenance des individus). Pour obtenir les éditions avant consolidation, vous devez préciser un nombre d itérations de consolidation négatif. Par exemple si le nombre d itérations est 10, vous obtenez les éditions uniquement après consolidation, si ce nombre vaut -10, on effectue les mêmes 10 itérations de consolidation et on dispose des éditions avant et après. Si le nombre d itérations est nul, la correspondance «classes-individus» est faite dans Parti-9 et Parti-10. Les tableaux ne sont pas présentés ici, car leur lecture dans notre exemple n a pas d intérêt. 31

32 PARTI-5 : Consolidation de la partition Dans ce tableau, on suit le processus de consolidation de la partition autour des centres de classes. Ce tableau sert à analyser l évolution de l inertie inter-classes au fur et à mesure des itérations. L intérêt de la consolidation est de réaffecter les éléments d une classe dans une autre classe dont ils sont plus proches, de façon à améliorer l homogénéité interne des classes. Ce processus s effectue par des itérations successives utilisant l algorithme des centres mobiles. Les centres sont initialement les centres de gravité des classes obtenues par coupure de l arbre. Ces centres évoluent lorsque les individus passent d une classe à l autre. Le tableau se compose de 4 colonnes : Itération : Numéro de l itération. Inertie totale : L inertie totale du nuage des individus est recalculée à chaque itération et doit rester constante. Inertie inter-classes : L inertie inter-classes mesure l hétérogénéité entre les classes de la partition. C est la quantité que l on cherche à maximiser dans le processus itératif de consolidation par la méthode des centres mobiles. Quotient : Part de l inertie inter-classes dans l inertie totale. (Soit : Inertie interclasses/inertie totale). Itération Inertie totale Inertie interclasses Quotient 0 1,837 0,733 0, ,837 0,821 0, ,837 0,826 0, ,837 0,827 0, ,837 0,829 0, ,837 0,831 0, ,837 0,833 0, ,837 0,836 0, ,837 0,836 0, ,837 0,837 0,455 Lecture / interprétation La consolidation de la partition a permis de faire passer l inertie inter-classes de 0,733 à 0,833, ce qui en pourcentage de l inertie totale, correspond respectivement à 39,9% et à 45,5%. Les classes sont globalement devenues plus homogènes. L accroissement de l inertie inter-classes est pratiquement nul après la neuvième itération. Les calculs sont alors arrêtés. En principe, un nombre important d itérations (au-delà de 10) témoigne d une classification peu stable. 32

33 PARTI-6 : Décomposition de l inertie calculée sur XX axes Le tableau se compose de 9 colonnes : Inerties : Il s agit des intitulés des différentes inerties éditées dans le tableau : inertie inter-classes, inerties intra-classe et inertie totale. Inerties avant/après : Donne l inertie inter-classes, les inerties intra-classe ainsi que l inertie totale (somme de l inertie inter-classes et des inerties intra-classe), avant et après la consolidation. Effectifs avant/après : Effectifs des classes avant et après la consolidation. Poids avant/après : Poids des classes avant et après la consolidation. Distances avant/après : Carré de la distance du Khi-2 entre l origine et le centre de gravité de la classe, avant et après la consolidation. Cette distance est mesurée dans le sous-espace vectoriel choisi précédemment (10 axes factoriels dans l exemple). Inerties Inerties avant Inerties après Effectifs avant Effectifs après Poids avant Poids après Distances avant Distances après Inter-classes 0,733 0,837 Intra-classe Classe 1 / 9 0,111 0, , ,000 0,635 0,545 Classe 2 / 9 0,046 0, ,000 97,000 1,383 1,184 Classe 3 / 9 0,162 0, , ,000 0,461 0,631 Classe 4 / 9 0,169 0, , ,000 0,344 0,450 Classe 5 / 9 0,129 0, , ,000 0,667 0,703 Classe 6 / 9 0,094 0, ,000 74,000 1,329 1,378 Classe 7 / 9 0,091 0, ,000 56,000 1,366 1,372 Classe 8 / 9 0,066 0, ,000 78,000 1,523 1,451 Classe 9 / 9 0,234 0, , ,000 0,501 0,789 Totale 1,837 1,837 Quotient (I. inter / I. totale) 0,399 0,455 Ce tableau permet de mesurer la qualité au sens de la stabilité de la partition. Si une majorité des classes de la partition ont un effectif (poids) avant et après la consolidation très différent, cela indique un manque de stabilité de la partition (les individus passent d une classe à l autre). Si c est le cas, vous devez examiner tout d abord la liste des variables actives et vérifier que vous avez suivi les conseils essentiels : homogénéité du thème analysé, homogénéité du codage. Vérifiez également le nombre d axes factoriels utilisés pour l agrégation, un trop grand nombre d axes peut induire une instabilité des classes des partitions en introduisant ce que l on appelle communément du «bruit». Il n est pas rare dans la construction de partitions (typologies) qu une majorité des classes soient stables et quelques unes instables. Ceci indique que des individus sont difficilement classables dans les classes retenues. Ceci est parfaitement acceptable et ne dépend que de l utilisation «métier» que vous souhaitez faire de la typologie. 33

34 Les partitions construites sont dites «emboîtées», c est-à-dire que lorsque l on passe d une partition de 9 à 8 classes, 2 classes de la partition en 9 classes se regroupent et les autres ne sont pas modifiées. Le principe est identique dans l autre sens (une classe se dédouble et les autres ne sont pas modifiées). Quelquefois, si les classes obtenues ne sont pas satisfaisantes d un point de vue «métier», on peut être amené à retenir un plus grand nombre de classes (Option : choix des partitions définies par l utilisateur), à les interpréter de façon précise, puis à les archiver pour ensuite procéder à des regroupements avec la procédure de Data Management «Mise en classes, Regroupements de modalités» et non pas par l algorithme de construction des partitions. Lecture / interprétation On constate que la consolidation améliore globalement la partition. Cependant, l inertie intra-classe ne diminue pas dans toutes les classes. Si les classes 3 et 9 voient leur inertie intra-classe fortement diminuée, la classe 2 voit quant à elle son inertie augmenter (en même temps que son poids). Concernant les effectifs, 6 classes sur 9 restent stables. Seules les classes 1, 2 et 9 subissent de fortes variations. Cela n invalide pas la classification obtenue, mais il sera intéressant de porter une attention particulière à ces classes. 34

35 PARTI-8 : Coordonnées et valeurs-test des centres de classes après consolidation Ces tableaux s interprètent de la même manière que ceux obtenus avant consolidation dans la sortie PARTI-2. Il est intéressant de comparer ce tableau à celui avant consolidation pour en tirer des conclusions. Nous remettons, ici, le tableau des valeurs-tests obtenus dans PARTI-2 pour simplifier la comparaison. Avant consolidation Libellé Effectif Poids absolu Distance à l'origine Axe 1 Axe 2 Axe 3 Axe 4 Axe 5 Classe 1 / 9 110, ,000 0,635 2,748-10,872-0,807-0,200 6,167 Classe 2 / 9 49,000 49,000 1,383 7,678-3,198-10,457-4,101-10,749 Classe 3 / 9 128, ,000 0,461-2,580-1,956 5,005 10,155-7,789 Classe 4 / 9 185, ,000 0,344-8,627-8,231 4,324-5,128 2,612 Classe 5 / 9 114, ,000 0,667-5,223 7,143-5,662-11,020 7,920 Classe 6 / 9 79,000 79,000 1,329-6,265 2,442 3,561 8,175-4,859 Classe 7 / 9 63,000 63,000 1,366 2,495-2,532-3,849-2,628-1,823 Classe 8 / 9 68,000 68,000 1,523-10,516 6,678-9,106 6,850 0,702 Classe 9 / 9 204, ,000 0,501 17,584 9,795 8,004-0,602 2,576 Après consolidation Libellé Effectif Poids absolu Distance à l'origine Axe 1 Axe 2 Axe 3 Axe 4 Axe 5 Classe 1 / 9 147, ,000 0,545 3,994-11,463 0,048 7,921 11,561 Classe 2 / 9 97,000 97,000 1,184 12,648-5,867-13,550-5,173-12,138 Classe 3 / 9 105, ,000 0,631-4,322 0,153 6,256 9,867-10,573 Classe 4 / 9 164, ,000 0,450-8,948-10,327 5,756-8,629 1,396 Classe 5 / 9 124, ,000 0,703-6,441 8,072-5,494-11,222 7,312 Classe 6 / 9 74,000 74,000 1,378-6,632 1,600 3,327 8,450-5,192 Classe 7 / 9 56,000 56,000 1,372 1,922-2,124-2,947-2,379-0,810 Classe 8 / 9 78,000 78,000 1,451-11,019 9,049-10,196 6,025 0,635 Classe 9 / 9 155, ,000 0,789 16,172 12,586 11,870-1,895 3,282 Lecture / interprétation Sur les 2 premiers axes, on remarque que la majorité des valeurs-test ont augmenté, ce qui veut dire que globalement, la consolidation a permis d avoir une meilleure représentation de l ensemble des classes dans les 2 directions principales de l analyse. PARTI-9 / PARTI-10 : Liste des individus actifs dans les classes de la partition après consolidation Reportez-vous à l interprétation des feuilles PARTI-3 et PART-4. 35

36 PARTI-11 / PARTI-12 : Edition des parangons et des individus à contributions maximales Si les individus sont peu nombreux et représentent des «entités» non anonymes, les éditions des parangons et/ou des individus à contributions maximales pour chaque classe présente un intérêt. On appelle «parangons» les individus les plus «caractéristiques» de chaque classe au sens suivant : ce sont les individus les plus proches du centre de gravité (du point moyen) de la classe. Le logiciel édite les N individus (10 par défaut) situés le plus près du centre de gravité de chaque classe. Il est possible de demander l édition des N individus dont la contribution à l inertie de la classe est la plus grande. Ce sont les individus les plus éloignés du centre de gravité de chaque classe. Les parangons des classes sont édités dans la feuille PARTI-11, les individus à contributions maximales dans la feuille PARTI-12. Le tableau des parangons de chaque classe comprend 3 colonnes : Rang : Rang de l individu. Plus le rang de l individu est grand, plus celui-ci se trouve éloigné du centre de gravité de sa classe. Distance au centre de la classe : Carré de la distance entre l individu et le centre de gravité de sa classe. Cette distance du Khi-2 est mesurée dans le sous-espace vectoriel choisi (10 axes dans l exemple). Libellé : Identificateur de l individu. Classe 1 / 9 Effectif: 147 Rang Distance au centre de la Libellé classe 1 0, , , , , , , , , , Lecture / interprétation On note que dans la classe 1, l élément le plus proche du centre de gravité est l individu 237, dont la distance au centre de gravité de la classe est de 0,

37 Le tableau des individus à contributions maximales de chaque classe comprend 3 colonnes : Rang : Rang de l individu. Plus le rang de l individu est grand, plus sa contribution à l inertie de la classe est faible. Inertie : Contribution à l inertie de la classe de chacun des individus. Libellé : Identificateur de l individu. Edition des individus à contribution maximale Classe 1 / 9 Effectif: 147 Rang Inertie Libellé 1 2, , , , , , , , , , Lecture / interprétation Les individus dont la contribution à l inertie de la classe est la plus grande sont donc les individus les plus éloignés du centre de gravité de la classe. On note que dans la classe 1, l élément qui a la contribution à l inertie la plus forte est l individu

38 Dist-cl : Matrice des distances entre classes Le tableau suivant présente la matrice des distances entre les classes de la partition. Il se présente donc sous la forme d une matrice carrée symétrique. Il permet de voir la proximité entre les classes et d imaginer le rapprochement de certaines d entre elles, ou au contraire de distinguer des classes plus spécifiques. Classe 1 / 9 Classe 2 / 9 Classe 3 / 9 Classe 4 / 9 Classe 5 / 9 Classe 6 / 9 Classe 7 / 9 Classe 8 / 9 Classe 9 / 9 Classe 1 / 9 0,000 1,334 1,171 1,002 1,256 1,478 1,420 1,575 1,236 Classe 2 / 9 1,334 0,000 1,476 1,378 1,538 1,800 1,555 1,786 1,394 Classe 3 / 9 1,171 1,476 0,000 1,068 1,269 1,273 1,573 1,441 1,264 Classe 4 / 9 1,002 1,378 1,068 0,000 1,089 1,381 1,497 1,421 1,304 Classe 5 / 9 1,256 1,538 1,269 1,089 0,000 1,539 1,460 1,416 1,305 Classe 6 / 9 1,478 1,800 1,273 1,381 1,539 0,000 1,687 1,730 1,626 Classe 7 / 9 1,420 1,555 1,573 1,497 1,460 1,687 0,000 1,616 1,549 Classe 8 / 9 1,575 1,786 1,441 1,421 1,416 1,730 1,616 0,000 1,699 Classe 9 / 9 1,236 1,394 1,264 1,304 1,305 1,626 1,549 1,699 0,000 Lecture / interprétation La classe 1 a une distance plus faible avec la classe 4 et la classe 3 En regardant leur description on pourrait peut-être les regrouper si elles n ont pas de particularités propres intéressantes pour répondre à une problématique «métier». A l inverse, les classes 7 et 8 ont des distance plus élevées (>1,4) avec les autres classes ce qui en fait des classes particulières et difficilement associables avec d autres. 38

39 Résultats de la caractérisation automatique des partitions Cette procédure (DECLA) permet de décrire les partitions déterminées par la procédure de construction des partitions (PARTI). On peut caractériser soit chaque classe d une partition, soit globalement la partition elle-même. Cette procédure est identique à la procédure de «Caractérisation d une variable qualitative (DEMOD)» décrite dans le document «Statistiques descriptives». En effet, exécuter cette méthode, ou archiver une partition en tant que variable nominale dans les données, puis exécuter la méthode DEMOD sur cette variable, est strictement équivalent. Le tableau suivant résume les possibilités de caractérisation statistique proposées par la procédure DECLA : Eléments à caractériser Des groupes d individus (définis par les classes de la partition) En d autres termes, on décrit chaque classe de la partition à caractériser par l ensemble des éléments caractérisants. La partition à caractériser On recherche parmi tous les éléments caractérisants ceux dont la liaison avec la partition à caractériser est la plus significative. Eléments caractérisants Les modalités Les variables nominales Les variables continues Les modalités Les variables nominales Les variables continues Résultats Les résultats sont accessibles par le menu contextuel de la méthode (Clic droit Résultats - Rapport). Ils sont ici édités dans Excel, dans différentes feuilles. Dans les préférences de SPAD (Outils Préférences Résultats Sorties graphiques), vous avez la possibilité de choisir un autre tableur comme «Open Office», ou une sortie de type HTML éditable avec votre navigateur internet. Note : Par défaut, pour la caractérisation des partitions, il y aura autant de classeurs Excel que de partitions construites. Dans les préférences de SPAD (Outils Préférences Résultats Sorties graphiques), vous pouvez demander l édition des résultats en mode fusionné pour les méthodes créant plusieurs classeurs. Dans ce cas, tous les résultats seront dans un classeur unique. Reportez-vous à la procédure «Caractérisation d une variable qualitative (DEMOD)» décrite dans le document «Statistiques descriptives» pour l interprétation des résultats. Ici les feuilles sont libellées DECLA-1, DECLA-2, DECLA-X au lieu de DEMOD_X. 39

40 L éditeur de graphiques factoriels Après l exécution de la procédure de création de partitions, vous pouvez consulter et mettre en valeur les résultats grâce à l éditeur graphique de plans factoriels. Cet éditeur est accessible par le menu contextuel de la méthode (Clic droit Résultats Editeur graphique de plans factoriels). Cet éditeur vous permet de réaliser l ensemble des graphiques correspondant à l analyse factorielle préalable (ici une ACM) : représentation des variables nominale et continues (actives et/ou illustratives), représentation des individus, représentation simultanée des individus et des variables, et cela sur les différents plans de l analyse. Après cette méthode, on dispose en plus des informations (coordonnées, valeurs-test) des centres de classes des partitions, ce qui permet de faire d autres graphiques, par exemple colorier les individus en fonction de leurs classes d appartenance. De nombreux habillages sont possibles, on se reportera à l aide en ligne de cet éditeur pour une utilisation plus avancée. Représentation des individus mis en valeur (couleur) selon leur classe d appartenance pour la partition en 4 classes sur le 1 er plan factoriel 40

41 Représentation des centres de gravité des classes de la partition en 9 classes sur le 1 er plan factoriel La taille des points est proportionnelle au poids (effectif) des classes. 41

42 Sorties graphiques des caractérisations La méthode vous permet d éditer les résultats des caractérisations des classes sous la forme de graphiques. Les graphiques sont accessibles par le menu contextuel de la méthode (Clic droit Résultats - Sorties graphiques) On se reportera à l aide en ligne pour l utilisation détaillée de cet éditeur graphique. Ci dessous, on a une représentation graphique des sorties DEMOD-5 (tableau tronqué) et DEMOD

43 Caractérisation des classes de typologies (class-miner) Description La procédure CLASS-MINER permet de caractériser les classes des partitions issues de la méthode «Coupure de l arbre et caractérisation des classes de la typologie», et cela sans besoin d archiver les partitions dans les données. Cette méthode ne peut être connectée qu à la méthode «Coupure de l arbre et caractérisation des classes de la typologie». Dans la chaîne typologie, les classes des partitions construites sont automatiquement caractérisées par les variables sélectionnées dans l analyse préalable en tant que variables actives ou illustratives. L intérêt de la méthode CLASS-MINER est de sélectionner des variables n ayant pas participé à l analyse et d évaluer leur pouvoir caractérisant des partitions (typologies) construites. On utilise souvent cette approche lorsque le nombre de variables est important et qu il existe des thèmes différents dans les données. Dans l analyse on ne sélectionne que des variables actives et après construction des partitions, on sélectionne les variables par thème pour évaluer leur impact sur les partitions. Cette procédure est identique à la procédure de «Caractérisation d une variable qualitative (DEMOD)» décrite dans le document «Statistiques descriptives». En effet, exécuter cette méthode ou archiver une partition en tant que variable nominale dans les données, puis exécuter la méthode DEMOD sur cette variable, est strictement équivalent. Le tableau suivant résume les possibilités de caractérisation statistique proposées par la procédure CLASS-MINER : Eléments à caractériser Des groupes d individus (définis par les classes de la partition) En d autres termes, on décrit chaque classe de la partition à caractériser par l ensemble des éléments caractérisants. La partition à caractériser On recherche parmi tous les éléments caractérisants ceux dont la liaison avec la partition à caractériser est la plus significative. Eléments caractérisants Les modalités Les variables nominales Les variables continues Les modalités Les variables nominales Les variables continues 43

44 Mise en œuvre Importer la base «Aspi1000.sda» fournie avec les bases d exemples de SPAD (dans le sous-répertoire Data du répertoire d installation de SPAD) Reproduisez les paramétrages décrits dans les chapitres sur «L analyse des Correspondances Multiples», la «Classification sur facteurs (CAH/MIXTE)», et la «Coupure de l arbre et caractérisation des classes de la typologie». Glissez-déposez ensuite la méthode «Caractérisation des classes de la typologie» sur la méthode de coupure de l arbre pour obtenir le diagramme suivant : Paramétrage de la méthode Double-cliquez sur l icône de la méthode. Le paramétrage est quasi identique à celui de la procédure «Caractérisation d une variable qualitative (DEMOD)», décrite dans le document «Statistiques descriptives». La seule différence vient du fait que vous n avez pas à choisir la ou les variables à caractériser dans la mesure où ce seront de façon automatique les partitions construites. Dans l onglet «Variables», on ne sélectionne donc que les variables caractérisantes. Résultats Les résultats sont accessibles par le menu contextuel de la méthode (Clic droit Résultats - Rapport). Ils sont ici édités dans Excel, dans différentes feuilles. Dans les préférences de SPAD (Outils Préférences Résultats Sorties graphiques), vous avez la possibilité de choisir un autre tableur comme «Open Office», ou une sortie de type HTML éditable avec votre navigateur internet. Note : Par défaut, il y aura autant de classeurs Excel que de partitions construites. Dans les préférences de SPAD (Outils Préférences Résultats Sorties graphiques), vous pouvez demander l édition des résultats en mode fusionné pour les méthodes créant plusieurs classeurs. Dans ce cas tous les résultats seront dans un classeur unique. 44

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS

Logiciel XLSTAT version 7.0. 40 rue Damrémont 75018 PARIS Logiciel XLSTAT version 7.0 Contact : Addinsoft 40 rue Damrémont 75018 PARIS 2005-2006 Plan Présentation générale du logiciel Statistiques descriptives Histogramme Discrétisation Tableau de contingence

Plus en détail

RÉALISATION DE GRAPHIQUES AVEC OPENOFFICE.ORG 2.3

RÉALISATION DE GRAPHIQUES AVEC OPENOFFICE.ORG 2.3 RÉALISATION DE GRAPHIQUES AVEC OPENOFFICE.ORG 2.3 Pour construire un graphique : On lance l assistant graphique à l aide du menu Insérer è Diagramme en ayant sélectionné au préalable une cellule vide dans

Plus en détail

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI 1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage

Plus en détail

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et

Plus en détail

SPHINX Logiciel de dépouillement d enquêtes

SPHINX Logiciel de dépouillement d enquêtes SPHINX Logiciel de dépouillement d enquêtes sphinx50frversion4.doc 1 Les trois stades du SPHINX sont ceux que comporte habituellement toute enquête d opinion: Elaboration du questionnaire (fiche outil

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

COURS DE DATA MINING 4 : MODELISATION NON-SUPERVISEE CLASSIFICATIONS AUTOMATIQUES

COURS DE DATA MINING 4 : MODELISATION NON-SUPERVISEE CLASSIFICATIONS AUTOMATIQUES COURS DE DATA MINING 4 : MODELISATION NON-SUPERVISEE CLASSIFICATIONS AUTOMATIQUES EPF 4/ 5 ème année - Option Ingénierie d Affaires et de Projets - Finance Bertrand LIAUDET 4 : Modélisation non-supervisée

Plus en détail

Classification non supervisée

Classification non supervisée AgroParisTech Classification non supervisée E. Lebarbier, T. Mary-Huard Table des matières 1 Introduction 4 2 Méthodes de partitionnement 5 2.1 Mesures de similarité et de dissimilarité, distances.................

Plus en détail

Traitement des données avec Microsoft EXCEL 2010

Traitement des données avec Microsoft EXCEL 2010 Traitement des données avec Microsoft EXCEL 2010 Vincent Jalby Septembre 2012 1 Saisie des données Les données collectées sont saisies dans une feuille Excel. Chaque ligne correspond à une observation

Plus en détail

ACP Voitures 1- Méthode

ACP Voitures 1- Méthode acp=princomp(voit,cor=t) ACP Voitures 1- Méthode Call: princomp(x = voit, cor = T) Standard deviations: Comp.1 Comp.2 Comp.3 Comp.4 Comp.5 Comp.6 2.1577815 0.9566721 0.4903373 0.3204833 0.2542759 0.1447788

Plus en détail

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données et le Data Mining Nous suivons le plan suivant : Fonctionnement de Spad Catalogue des méthodes (statistiques

Plus en détail

Premiers pas avec SES-Pegase (version 7.0) SES : Un Système Expert pour l analyse Statistique des données. Premiers pas avec SES-Pegase 1

Premiers pas avec SES-Pegase (version 7.0) SES : Un Système Expert pour l analyse Statistique des données. Premiers pas avec SES-Pegase 1 Premiers pas avec SES-Pegase 1 Premiers pas avec SES-Pegase (version 7.0) SES : Un Système Expert pour l analyse Statistique des données www.delta-expert.com Mise à jour : Premiers pas avec SES-Pegase

Plus en détail

COURS DE MS EXCEL 2010

COURS DE MS EXCEL 2010 COURS DE MS EXCEL 2010 Auteur: Jean Monseu Ce cours est publié par Mechelsesteenweg 102 2018 Anvers Copyright Jean Monseu CFD, Mechelsesteenweg 102, 2018 Anvers Tous droits réservés. Aucune partie de cette

Plus en détail

GUIDE DE L UTILISATEUR. Interface Projets Diagrammes Imports / Exports Data Management Industrialisation

GUIDE DE L UTILISATEUR. Interface Projets Diagrammes Imports / Exports Data Management Industrialisation GUIDE DE L UTILISATEUR Interface Projets Diagrammes Imports / Exports Data Management Industrialisation La défense - 13 bis, rue de l'abreuvoir - 92400 Courbevoie - France Tél : +33 1 41 88 02 02 - Fax

Plus en détail

Calc 2 Avancé. OpenOffice.org. Guide de formation avec exercices et cas pratiques. Philippe Moreau

Calc 2 Avancé. OpenOffice.org. Guide de formation avec exercices et cas pratiques. Philippe Moreau OpenOffice.org Calc 2 Avancé Guide de formation avec exercices et cas pratiques Philippe Moreau Tsoft et Groupe Eyrolles, 2007, ISBN : 2-212-12036-2, ISBN 13 : 978-2-212-12036-3 4 - Plages de données 4

Plus en détail

EXCEL PERFECTIONNEMENT SERVICE INFORMATIQUE. Version 1.0 30/11/05

EXCEL PERFECTIONNEMENT SERVICE INFORMATIQUE. Version 1.0 30/11/05 EXCEL PERFECTIONNEMENT Version 1.0 30/11/05 SERVICE INFORMATIQUE TABLE DES MATIERES 1RAPPELS...3 1.1RACCOURCIS CLAVIER & SOURIS... 3 1.2NAVIGUER DANS UNE FEUILLE ET UN CLASSEUR... 3 1.3PERSONNALISER LA

Plus en détail

Université de Picardie - Jules Verne UFR d'economie et de Gestion

Université de Picardie - Jules Verne UFR d'economie et de Gestion Université de Picardie - Jules Verne UFR d'economie et de Gestion 23/09/2014 Excel 2003 - Tableau Croisé Dynamique L information mise à disposition de l utilisateur est fréquemment une information de détail

Plus en détail

Formation. Module WEB 4.1. Support de cours

Formation. Module WEB 4.1. Support de cours Formation Module WEB 4.1 Support de cours Rédacteur Date de rédaction F.CHEA 08/02/2012 Les informations contenues dans ce document pourront faire l'objet de modifications sans préavis Sauf mention contraire,

Plus en détail

Évaluation des compétences. Identification du contenu des évaluations. Septembre 2014

Évaluation des compétences. Identification du contenu des évaluations. Septembre 2014 Identification du contenu des évaluations Septembre 2014 Tous droits réservés : Université de Montréal Direction des ressources humaines Table des matières Excel Base version 2010... 1 Excel intermédiaire

Plus en détail

Avant-propos FICHES PRATIQUES EXERCICES DE PRISE EN MAIN CAS PRATIQUES

Avant-propos FICHES PRATIQUES EXERCICES DE PRISE EN MAIN CAS PRATIQUES Avant-propos Conçu par des pédagogues expérimentés, son originalité est d être à la fois un manuel de formation et un manuel de référence complet présentant les bonnes pratiques d utilisation. FICHES PRATIQUES

Plus en détail

Organiser les informations ( approche technique )

Organiser les informations ( approche technique ) Organiser les informations ( approche technique ) Introduction : Le stockage des informations est une fonctionnalité essentielle de l outil informatique, qui permet de garantir la pérennité des informations,

Plus en détail

Note de cours. Introduction à Excel 2007

Note de cours. Introduction à Excel 2007 Note de cours Introduction à Excel 2007 par Armande Pinette Cégep du Vieux Montréal Excel 2007 Page: 2 de 47 Table des matières Comment aller chercher un document sur CVMVirtuel?... 8 Souris... 8 Clavier

Plus en détail

Localisation des fonctions

Localisation des fonctions MODALISA 7 Localisation des fonctions Vous trouverez dans ce document la position des principales fonctions ventilées selon l organisation de Modalisa en onglets. Sommaire A. Fonctions communes à tous

Plus en détail

INSERER DES OBJETS - LE RUBAN INSERTION... 3 TABLEAUX

INSERER DES OBJETS - LE RUBAN INSERTION... 3 TABLEAUX TABLE DES MATIERES Livret Utilisateur Excel 2007 Niveau 2 INSERER DES OBJETS - LE RUBAN INSERTION... 3 TABLEAUX... 4 Les tableaux croisés dynamiques... 4 Création d un tableau croisé... 5 Comparer des

Plus en détail

Syfadis. > Configuration du poste client. Nous vous aidons à réussir. REFERENCE : Syfadis LMS - 20/06/2007. AUTEUR : Equipe technique Syfadis

Syfadis. > Configuration du poste client. Nous vous aidons à réussir. REFERENCE : Syfadis LMS - 20/06/2007. AUTEUR : Equipe technique Syfadis Syfadis Nous vous aidons à réussir > Configuration du poste client REFERENCE : Syfadis LMS - 20/06/2007 AUTEUR : Equipe technique Syfadis Ce document est la propriété de Syfadis. Il ne peut être communiqué

Plus en détail

Guide d installation UNIVERSALIS 2016

Guide d installation UNIVERSALIS 2016 Guide d installation UNIVERSALIS 2016 (Windows) Nous vous recommandons de lire ce document avant de commencer l installation d UNIVERSALIS 2016 sur Windows. Vous y trouverez la description de la procédure

Plus en détail

TD3 - Facturation avec archivage automatisé

TD3 - Facturation avec archivage automatisé TD3 - Facturation avec archivage automatisé Objectifs Insérer les formules nécessaires aux calculs d une facture. Créer une macro- commande avec l enregistreur de macros et l affecter à un bouton. Utiliser

Plus en détail

Les cartes de fidélités... 2 Natures de pièces... 5 Impression des chèques cadeaux... 6 Statistiques fidélités... 8 Fiche client...

Les cartes de fidélités... 2 Natures de pièces... 5 Impression des chèques cadeaux... 6 Statistiques fidélités... 8 Fiche client... Sommaire Les cartes de fidélités... 2 Natures de pièces... 5 Impression des chèques cadeaux... 6 Statistiques fidélités... 8 Fiche client... 9 Copyright WaveSoft 1/9 La gestion des cartes de fidélités

Plus en détail

Manuel d utilisation du site web de l ONRN

Manuel d utilisation du site web de l ONRN Manuel d utilisation du site web de l ONRN Introduction Le but premier de ce document est d expliquer comment contribuer sur le site ONRN. Le site ONRN est un site dont le contenu est géré par un outil

Plus en détail

Parcours FOAD Formation EXCEL 2010

Parcours FOAD Formation EXCEL 2010 Parcours FOAD Formation EXCEL 2010 PLATE-FORME E-LEARNING DELTA ANNEE SCOLAIRE 2013/2014 Pôle national de compétences FOAD Formation Ouverte et A Distance https://foad.orion.education.fr Livret de formation

Plus en détail

1 Modélisation d être mauvais payeur

1 Modélisation d être mauvais payeur 1 Modélisation d être mauvais payeur 1.1 Description Cet exercice est très largement inspiré d un document que M. Grégoire de Lassence de la société SAS m a transmis. Il est intitulé Guide de démarrage

Plus en détail

La place de SAS dans l'informatique décisionnelle

La place de SAS dans l'informatique décisionnelle La place de SAS dans l'informatique décisionnelle Olivier Decourt ABS Technologies - Educasoft Formations La place de SAS dans l'informatique décisionnelle! L'historique de SAS! La mécanique! La carrosserie

Plus en détail

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 04/04/2008 Stéphane Tufféry - Data Mining - http://data.mining.free.fr

Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 04/04/2008 Stéphane Tufféry - Data Mining - http://data.mining.free.fr Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE 1 Plan du cours Qu est-ce que le data mining? A quoi sert le data mining? Les 2 grandes familles de techniques Le déroulement d un projet de data

Plus en détail

Correction du baccalauréat STMG Polynésie 17 juin 2014

Correction du baccalauréat STMG Polynésie 17 juin 2014 Correction du baccalauréat STMG Polynésie 17 juin 2014 EXERCICE 1 Cet exercice est un Q.C.M. 4 points 1. La valeur d une action cotée en Bourse a baissé de 37,5 %. Le coefficient multiplicateur associé

Plus en détail

Introduction : présentation de la Business Intelligence

Introduction : présentation de la Business Intelligence Les exemples cités tout au long de cet ouvrage sont téléchargeables à l'adresse suivante : http://www.editions-eni.fr Saisissez la référence ENI de l'ouvrage RI3WXIBUSO dans la zone de recherche et validez.

Plus en détail

SAP BusinessObjects Web Intelligence (WebI) BI 4

SAP BusinessObjects Web Intelligence (WebI) BI 4 Présentation de la Business Intelligence 1. Outils de Business Intelligence 15 2. Historique des logiciels décisionnels 16 3. La suite de logiciels SAP BusinessObjects Business Intelligence Platform 18

Plus en détail

Guide d installation UNIVERSALIS 2014

Guide d installation UNIVERSALIS 2014 Guide d installation UNIVERSALIS 2014 (Windows) Nous vous recommandons de lire ce document avant de commencer l installation d UNIVERSALIS 2014 sur Windows. Vous y trouverez la description de la procédure

Plus en détail

Module 1 : Tableau de bord Excel * 2010 incl.*

Module 1 : Tableau de bord Excel * 2010 incl.* Module 1 : Tableau de bord Excel * 2010 incl.* 1.0 Introduction Excel nous aide à mieux comprendre les données en les plaçant dans des cellules (réparties en lignes et en colonnes) et au moyen de formules

Plus en détail

Comment créer un diagramme de Gantt avec OpenOffice.org

Comment créer un diagramme de Gantt avec OpenOffice.org Comment créer un diagramme de Gantt avec OpenOffice.org Version 1.9 du 05.05.2005 Réalisé avec : OOo 2.0 Plate-forme / Os : Toutes Distribué par le projet Sommaire 1 Une rapide introduction : Diagramme

Plus en détail

Solutions Décisionnelles SPAD. La maîtrise des données, l'art de la décision

Solutions Décisionnelles SPAD. La maîtrise des données, l'art de la décision Solutions Décisionnelles SPAD La maîtrise des données, l'art de la décision SPAD, la référence en Analyse de Données et Data Mining La solution logicielle SPAD permet de tirer le meilleur parti de tous

Plus en détail

«Manuel Pratique» Gestion budgétaire

«Manuel Pratique» Gestion budgétaire 11/06/01 B50/v2.31/F/MP005.01 «Manuel Pratique» Gestion budgétaire Finance A l usage des utilisateurs de Sage BOB 50 Solution Sage BOB 50 2 L éditeur veille à la fiabilité des informations publiées, lesquelles

Plus en détail

WinTask x64 Le Planificateur de tâches sous Windows 7 64 bits, Windows 8/8.1 64 bits, Windows 2008 R2 et Windows 2012 64 bits

WinTask x64 Le Planificateur de tâches sous Windows 7 64 bits, Windows 8/8.1 64 bits, Windows 2008 R2 et Windows 2012 64 bits WinTask x64 Le Planificateur de tâches sous Windows 7 64 bits, Windows 8/8.1 64 bits, Windows 2008 R2 et Windows 2012 64 bits Manuel d initiation du Planificateur 2 INTRODUCTION 5 CHAPITRE I : INSTALLATION

Plus en détail

Séries Statistiques Simples

Séries Statistiques Simples 1. Collecte et Représentation de l Information 1.1 Définitions 1.2 Tableaux statistiques 1.3 Graphiques 2. Séries statistiques simples 2.1 Moyenne arithmétique 2.2 Mode & Classe modale 2.3 Effectifs &

Plus en détail

Syfadis. > Configuration du poste client. Nous vous aidons à réussir. REFERENCE : Syfadis LMS - 12/09/2008. AUTEUR : Equipe technique Syfadis

Syfadis. > Configuration du poste client. Nous vous aidons à réussir. REFERENCE : Syfadis LMS - 12/09/2008. AUTEUR : Equipe technique Syfadis Syfadis Nous vous aidons à réussir > Configuration du poste client REFERENCE : Syfadis LMS - 12/09/2008 AUTEUR : Equipe technique Syfadis Ce document est la propriété de Syfadis. Il ne peut être communiqué

Plus en détail

Introduction à la statistique descriptive

Introduction à la statistique descriptive Chapitre chapitre 1 Introduction à la statistique descriptive Les méthodes de la statistique descriptive (statistique déductive) permettent de mener des études à partir de données exhaustives, c est-à-dire

Plus en détail

Utilisation avancée de SugarCRM Version Professional 6.5

Utilisation avancée de SugarCRM Version Professional 6.5 Utilisation avancée de SugarCRM Version Professional 6.5 Document : Utilisation_avancee_SugarCRM_6-5.docx Page : 1 / 32 Sommaire Préambule... 3 I. Les rapports... 4 1. Les principes du générateur de rapports...

Plus en détail

Universalis 2013. Guide d installation. Sommaire

Universalis 2013. Guide d installation. Sommaire Guide d installation Universalis 2013 Nous vous recommandons de lire ce document avant de commencer l installation d UNIVERSALIS 2013 sur Windows. Vous y trouverez la description de la procédure d installation,

Plus en détail

REQUEA. v 1.0.0 PD 20 mars 2008. Mouvements d arrivée / départ de personnels Description produit

REQUEA. v 1.0.0 PD 20 mars 2008. Mouvements d arrivée / départ de personnels Description produit v 1.0.0 PD 20 mars 2008 Mouvements d arrivée / départ de personnels Description produit Fonctionnalités L application Gestion des mouvements d arrivée / départ de Requea permet la gestion collaborative

Plus en détail

Complet Intuitif Efficace. Références

Complet Intuitif Efficace. Références Logiciel de référence en Analyse de Données, Data Mining et Text Mining pour transformer vos données en connaissance Complet Intuitif Efficace Dans un environnement convivial et intuitif, disposez de toute

Plus en détail

Correction des Travaux Pratiques Organiser son espace de travail

Correction des Travaux Pratiques Organiser son espace de travail Module 01 Correction des Travaux Pratiques Organiser son espace de travail Correction de l exercice N 1 Organiser son espace de travail Objectif de l exercice : 1. Comprendre le dock 2. Afficher les règles

Plus en détail

COURS HOMOLOGUE ECDL/PCIE EXCEL 2013

COURS HOMOLOGUE ECDL/PCIE EXCEL 2013 COURS HOMOLOGUE ECDL/PCIE MODULE 4 : Tableur EXCEL 2013 Ce matériel didactique peut être utilisé pour aider les candidats à préparer l examen en vue de l obtention du International Computer Driving Licence

Plus en détail

Business Intelligence

Business Intelligence avec Excel, Power BI et Office 365 Téléchargement www.editions-eni.fr.fr Jean-Pierre GIRARDOT Table des matières 1 Avant-propos A. À qui s adresse ce livre?..................................................

Plus en détail

Affectation standard Affectation modifiée (exemple)

Affectation standard Affectation modifiée (exemple) 1 sur 5 13/02/2005 11:44 Les fonctions qui vont être abordées vont vous apprendre à : comprendre l'arborescence Poste de travail, disque Répertoire ou dossier Chemin absolu, relatif utiliser l'explorateur

Plus en détail

SYSTRAN 7 Guide de démarrage

SYSTRAN 7 Guide de démarrage 1 SYSTRAN 7 Guide de démarrage Réf : DSK-7-QSG-HO-FR Bienvenue SYSTRAN 7 Guide de démarrage Félicitations! Nous vous remercions d avoir choisi SYSTRAN V7 la version la plus récente et la plus puissante

Plus en détail

Activité 11 : Nuage de points ou diagramme de dispersion

Activité 11 : Nuage de points ou diagramme de dispersion Activité 11 : Nuage de points ou diagramme de dispersion Un nuage de points, ou diagramme de dispersion, représente des coordonnées dans un plan cartésien. Chaque point dans le plan représente deux quantités.

Plus en détail

Maîtriser l'utilisation des outils bureautiques. Maîtriser le logiciel de traitement de texte - Word. Maitriser le logiciel tableur - Excel

Maîtriser l'utilisation des outils bureautiques. Maîtriser le logiciel de traitement de texte - Word. Maitriser le logiciel tableur - Excel Itinéraire de formation LES OUTILS BUREAUTIQUES Domaine ITINERAIRE THEMATIQUE But Maîtriser l'utilisation des outils bureautiques Maîtriser le logiciel de traitement de texte - Word Word 2003 niveau I

Plus en détail

Baccalauréat L spécialité, Métropole et Réunion, 19 juin 2009 Corrigé.

Baccalauréat L spécialité, Métropole et Réunion, 19 juin 2009 Corrigé. Baccalauréat L spécialité, Métropole et Réunion, 19 juin 2009 Corrigé. L usage d une calculatrice est autorisé Durée : 3heures Deux annexes sont à rendre avec la copie. Exercice 1 5 points 1_ Soit f la

Plus en détail

Concept-Informatique 2007

Concept-Informatique 2007 Page 1 sur 8 Le logiciel XTC (extension Comptabilité) est un utilitaire permettant récupérer sur votre poste de travail les éditions du logiciel de comptabilité CI-Compta. Les éditions sont transférées

Plus en détail

Table des matières A. Introduction... 4 B. Principes généraux... 5 C. Exemple de formule (à réaliser) :... 7 D. Exercice pour réaliser une facture

Table des matières A. Introduction... 4 B. Principes généraux... 5 C. Exemple de formule (à réaliser) :... 7 D. Exercice pour réaliser une facture Excel 2007 -2- Avertissement Ce document accompagne le cours qui a été conçu spécialement pour les stagiaires des cours de Denis Belot. Le cours a été réalisé en réponse aux diverses questions posées par

Plus en détail

Avertissement. La Gestion Electronique de Documents

Avertissement. La Gestion Electronique de Documents Sommaire Les plus de GEDExpert... p 1.3 Mise en place Fichiers de bases... p 1.4 Mise en place Plan de classement... p 1.8 La fiche dossier... p 1.13 L acquisition de documents... p 1.19 Les liens avec

Plus en détail

aalto Collaborative Pour le gestionnaire,

aalto Collaborative Pour le gestionnaire, www.ged-web.com aalto Collaborative aalto est une solution collaborative full web, regroupant tous les aspects de la gestion de documents et des process dans l'entreprise, développée avec la technologie

Plus en détail

Infolettre #18 : Les graphiques avec Excel 2010

Infolettre #18 : Les graphiques avec Excel 2010 Infolettre #18 : Les graphiques avec Excel 2010 Table des matières Introduction... 1 Hourra! Le retour du double-clic... 1 Modifier le graphique... 4 Onglet Création... 4 L onglet Disposition... 7 Onglet

Plus en détail

INCORPORER EXCEL EN LIGNE DANS UN FICHIER CRÉÉ AVEC L ÉDITEUR DE TEXTE 15 avril 2015

INCORPORER EXCEL EN LIGNE DANS UN FICHIER CRÉÉ AVEC L ÉDITEUR DE TEXTE 15 avril 2015 TABLE DES MATIERES Incorporer une feuille de calcul dans un fichier créé avec l Éditeur de texte de PLACE... 1 Avantages :... 1 Contraintes :... 2 Accéder à Microsoft OneDrive :... 2 Créer un classeur

Plus en détail

Qu est ce que et à quoi sert le cookie orangeads?

Qu est ce que et à quoi sert le cookie orangeads? Mentions légales relatives à la publicité Reverso vous propose de bénéficier de contenus publicitaires ciblés en fonction de vos comportements de navigation sur le site www.reverso.net. Afin que vous puissiez

Plus en détail

Aide Webmail. L environnement de RoundCube est très intuitif et fonctionne comme la plupart des logiciels de messagerie traditionnels.

Aide Webmail. L environnement de RoundCube est très intuitif et fonctionne comme la plupart des logiciels de messagerie traditionnels. Aide Webmail 1. Découverte de l environnement : L environnement de RoundCube est très intuitif et fonctionne comme la plupart des logiciels de messagerie traditionnels. 1. La barre d application (1) Les

Plus en détail

CARPE. Documentation Informatique S E T R A. Version 2.00. Août 2013. CARPE (Documentation Informatique) 1

CARPE. Documentation Informatique S E T R A. Version 2.00. Août 2013. CARPE (Documentation Informatique) 1 CARPE (Documentation Informatique) 1 CARPE Version 2.00 Août 2013 Documentation Informatique S E T R A Programme CARPE - Manuel informatique de l'utilisateur CARPE (Documentation Informatique) 2 Table

Plus en détail

La Clé informatique. Formation Internet Explorer Aide-mémoire

La Clé informatique. Formation Internet Explorer Aide-mémoire La Clé informatique Formation Internet Explorer Aide-mémoire Novembre 2003 Table des matières Novembre 2003...i Configuration d Internet Explorer... 1 Internet Explorer 6... 5 Gestion des Raccourcies...

Plus en détail

!" #$%&'(&)'*'+,--./&0'1&23,+2.)$4$%52'&%'6.%&2'

! #$%&'(&)'*'+,--./&0'1&23,+2.)$4$%52'&%'6.%&2' Évaluer un site web, cours de descriptions de controverses i Dans le cadre du cours Description des controverses, le repérage des acteurs et la connaissance de leurs positions passent largement par l identification

Plus en détail

Utiliser SQL Server 2008 R2 Reporting Services comme source de donne es pour Microsoft Excel

Utiliser SQL Server 2008 R2 Reporting Services comme source de donne es pour Microsoft Excel Utiliser SQL Server 2008 R2 Reporting Services comme source de donne es pour Microsoft Excel Excel est un des meilleurs outils de manipulation de données et parfois il est nécessaire d exploiter des données

Plus en détail

4. Personnalisation du site web de la conférence

4. Personnalisation du site web de la conférence RTUTORIEL Prise en main de la plateforme 1. Création de l espace conférence Connectez- vous sur le portail http://test- www.sciencesconf.org avec le compte : - Identifiant : «admin1» - Mot de passe «1234»

Plus en détail

Antidote et vos logiciels

Antidote et vos logiciels Antidote et vos logiciels Antidote RX v8 Windows Antidote, c est un correcteur avancé, dix dictionnaires et dix guides linguistiques qui s ajoutent à vos logiciels pour vous aider à écrire en français.

Plus en détail

Aide à l utilisation de

Aide à l utilisation de Aide à l utilisation de Afficher le guide utilisateur Cliquez ici Visionner l animation pédagogique Cliquez ici Télécharger les prérequis techniques Cliquez ici FAQ (Foire aux questions) Afin d optimiser

Plus en détail

1 Complément sur la projection du nuage des individus

1 Complément sur la projection du nuage des individus TP 0 : Analyse en composantes principales (II) Le but de ce TP est d approfondir nos connaissances concernant l analyse en composantes principales (ACP). Pour cela, on reprend les notations du précédent

Plus en détail

http://mondomaine.com/dossier : seul le dossier dossier sera cherché, tous les sousdomaines

http://mondomaine.com/dossier : seul le dossier dossier sera cherché, tous les sousdomaines Principales fonctionnalités de l outil Le coeur du service suivre les variations de position d un mot-clé associé à une URL sur un moteur de recherche (Google - Bing - Yahoo) dans une locale (association

Plus en détail

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES

INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES INTRODUCTION À L ANALYSE FACTORIELLE DES CORRESPONDANCES Dominique LAFFLY Maître de Conférences, Université de Pau Laboratoire Société Environnement Territoire UMR 5603 du CNRS et Université de Pau Domaine

Plus en détail

Smart Pix SOFTWARE. Manuel d utilisation

Smart Pix SOFTWARE. Manuel d utilisation Smart Pix SOFTWARE Manuel d utilisation Manuel d utilisation du logiciel Accu-Chek Smart Pix Édition de juillet 2012 Roche Diagnostics GmbH 2012 Tous droits réservés ACCU-CHEK, ACCU-CHEK AVIVA, ACCU-CHEK

Plus en détail

Utilisation de l éditeur.

Utilisation de l éditeur. Utilisation de l éditeur. Préambule...2 Configuration du navigateur...3 Débloquez les pop-up...5 Mise en évidence du texte...6 Mise en évidence du texte...6 Mise en page du texte...7 Utilisation de tableaux....7

Plus en détail

MEGA ITSM Accelerator. Guide de Démarrage

MEGA ITSM Accelerator. Guide de Démarrage MEGA ITSM Accelerator Guide de Démarrage MEGA 2009 SP4 1ère édition (juin 2010) Les informations contenues dans ce document pourront faire l objet de modifications sans préavis et ne sauraient en aucune

Plus en détail

EXCEL TUTORIEL 2012/2013

EXCEL TUTORIEL 2012/2013 EXCEL TUTORIEL 2012/2013 Excel est un tableur, c est-à-dire un logiciel de gestion de tableaux. Il permet de réaliser des calculs avec des valeurs numériques, mais aussi avec des dates et des textes. Ainsi

Plus en détail

Procédure d installation des logiciels EBP sous environnement ESU4. Serveur SCRIBE ou Windows

Procédure d installation des logiciels EBP sous environnement ESU4. Serveur SCRIBE ou Windows Procédure d installation des logiciels EBP sous environnement ESU 4 Serveur SCRIBE ou Windows EBP Informatique SA Rue de Cutesson ZA Bel Air BP 95 F-78513 Rambouillet Cedex Equipe Education Tél : 01 34

Plus en détail

L ARBORESCENCE. Qu est-ce qu un dossier? L arborescence?

L ARBORESCENCE. Qu est-ce qu un dossier? L arborescence? L ARBORESCENCE Qu est-ce qu un dossier? Un dossier est une pochette vide dans laquelle on peut disposer des documents créés à l aide de l outil informatique. Comme les systèmes utilisés dans la vie courante

Plus en détail

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre :

t 100. = 8 ; le pourcentage de réduction est : 8 % 1 t Le pourcentage d'évolution (appelé aussi taux d'évolution) est le nombre : Terminale STSS 2 012 2 013 Pourcentages Synthèse 1) Définition : Calculer t % d'un nombre, c'est multiplier ce nombre par t 100. 2) Exemples de calcul : a) Calcul d un pourcentage : Un article coûtant

Plus en détail

Installation de CPA STUDIO :

Installation de CPA STUDIO : Installation de CPA STUDIO : Système d exploitation requis : Windows 98 2ème édition Windows XP service pack 2 Résolution écran - Nombre de couleurs : CPA STUDIO nécessite une résolution minimum d affichage

Plus en détail

ESPACE COLLABORATIF SHAREPOINT

ESPACE COLLABORATIF SHAREPOINT Conseil de l Europe Service des Technologies de l Information ESPACE COLLABORATIF SHAREPOINT DOSSIER D UTILISATEUR 1/33 Sommaire 1. Présentation de SharePoint... 3 1.1. Connexion... 4 2. Les listes...

Plus en détail

Publication dans le Back Office

Publication dans le Back Office Site Web de l association des ingénieurs INSA de Lyon Publication dans le Back Office Note : dans ce guide, l'appellation GI signifie Groupe d'intérêt, et GR Groupe Régional laure Buisset Page 1 17/09/2008

Plus en détail

Extraction d informations stratégiques par Analyse en Composantes Principales

Extraction d informations stratégiques par Analyse en Composantes Principales Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 dousset@irit.fr 1 Introduction

Plus en détail

GESTION DE L'ORDINATEUR

GESTION DE L'ORDINATEUR FORMATION DES NOUVEAUX DIRECTEURS GESTION DE L'ORDINATEUR L'EXPLORATEUR WINDOWS Février 2012 B. Lorne Atice CHY1 Gestion de l'ordinateur Le système d'exploitation Il ne faut pas confondre : -Système d'exploitation

Plus en détail

Didacticiel Études de cas. Description succincte de Pentaho Data Integration Community Edition (Kettle).

Didacticiel Études de cas. Description succincte de Pentaho Data Integration Community Edition (Kettle). 1 Objectif Description succincte de Pentaho Data Integration Community Edition (Kettle). L informatique décisionnelle («Business Intelligence BI» en anglais, ça fait tout de suite plus glamour) fait référence

Plus en détail

Notes pour l utilisation d Expression Web

Notes pour l utilisation d Expression Web EICW Formation Webmaster Notes pour l utilisation d Expression Web G. Barmarin 2008-2009 1 /21 Table des matières 1 Introduction... 3 2 Installer Expression Web... 4 3 Explorer et personnaliser l interface

Plus en détail

Chapitre 2 Créer son site et ses pages avec Google Site

Chapitre 2 Créer son site et ses pages avec Google Site Réaliser un site internet à l aide de Google Site 10 Chapitre 2 Créer son site et ses pages avec Google Site 1. Créer un Google site 1. Rendez-vous sur www.google.be et connectez-vous à votre compte Gmail

Plus en détail

Manuel Utilisateur. Boticely

Manuel Utilisateur. Boticely Manuel Utilisateur Boticely Auteur : Logica Version : 1.4 Droit d auteur Ce texte est disponible sous contrat Creative Commons Paternité - Pas d'utilisation Commerciale - Partage des Conditions Initiales

Plus en détail

TABLE DES MATIERES MENTIONS LEGALES INTRODUCTION CHAPITRE 1 : INSTALLATION DE L ALGORITHME CHAPITRE 2 : EXECUTION & OPTIMISATION DU BACKTEST

TABLE DES MATIERES MENTIONS LEGALES INTRODUCTION CHAPITRE 1 : INSTALLATION DE L ALGORITHME CHAPITRE 2 : EXECUTION & OPTIMISATION DU BACKTEST TABLE DES MATIERES MENTIONS LEGALES INTRODUCTION CHAPITRE 1 : INSTALLATION DE L ALGORITHME CHAPITRE 2 : EXECUTION & OPTIMISATION DU BACKTEST CHAPITRE 3 : UTILISATION DE L ALGORITHME CONCLUSION MENTIONS

Plus en détail

Création, analyse de questionnaires et d'entretiens pour Windows 2008, 7, 8 et MacOs 10

Création, analyse de questionnaires et d'entretiens pour Windows 2008, 7, 8 et MacOs 10 modalisa Création, analyse de questionnaires et d'entretiens pour Windows 2008, 7, 8 et MacOs 10 8 Fonctionnalités de mise en ligne de questionnaires Vous trouverez dans cet opuscule les informations nécessaires

Plus en détail

FICHIERS ET DOSSIERS

FICHIERS ET DOSSIERS La différence entre fichier et dossier FICHIERS ET DOSSIERS La première notion à acquérir est la différence entre un dossier et un fichier Un dossier est une sorte de classeur dans lequel on range divers

Plus en détail

AOLbox. Partage de disque dur Guide d utilisation. Partage de disque dur Guide d utilisation 1

AOLbox. Partage de disque dur Guide d utilisation. Partage de disque dur Guide d utilisation 1 AOLbox Partage de disque dur Guide d utilisation Partage de disque dur Guide d utilisation 1 Sommaire 1. L AOLbox et le partage de disque dur... 3 1.1 Le partage de disque dur sans l AOLbox... 3 1.1.1

Plus en détail

Planification et suivi de projet avec MSProject

Planification et suivi de projet avec MSProject Planification et suivi de projet avec MSProject Manuel d utilisation Version 1.4 - Mars 2009 Réalisé par la Direction des Systèmes d'information du CNRS (DSI) Table des matières Table des matières TABLE

Plus en détail

UTILISER LE CLOUD COMPUTING : EDITION EN LIGNE ET TRAVAIL COLLABORATIF AVEC GOOGLE DRIVE

UTILISER LE CLOUD COMPUTING : EDITION EN LIGNE ET TRAVAIL COLLABORATIF AVEC GOOGLE DRIVE UTILISER LE CLOUD COMPUTING : EDITION EN LIGNE ET TRAVAIL COLLABORATIF AVEC GOOGLE DRIVE Atelier TICE du 12 juin 2013 Daniel CLERO CDDP du Gers SOMMAIRE GÉNÉRALITÉS STOCKAGE EN LIGNE PARTAGE EN LIGNE EDITION

Plus en détail