IBM SPSS Modeler Social Network Analysis 15 Guide de l utilisateur



Documents pareils
Les 10 grands principes de l utilisation du data mining pour une gestion de la relation client réussie

IBM SPSS Direct Marketing 21

Travailler avec les télécommunications

Guide d exploration de base de données de IBM SPSS Modeler 15

IBM SPSS Direct Marketing

Guide CRISP-DM de IBM SPSS Modeler

Guide de l utilisateur de IBM SPSS Modeler 15

GUIDE D UTILISATION DU CENTRE DE DONNÉES DE L ISU

Utiliser Access ou Excel pour gérer vos données

données en connaissance et en actions?

Database Manager Guide de l utilisateur DMAN-FR-01/01/12

Alcatel OmniPCX Office

Guide de l utilisateur du Centre de gestion des licences en volume LICENCES EN VOLUME MICROSOFT

Utiliser un tableau de données

Installation Client (licence réseau) de IBM SPSS Modeler 14.2

Guide de l utilisateur de Cisco Unified Communications Manager Assistant pour Cisco Unified Communications Manager 6.0

Trucs et Astuces Outlook 2010 SIFA Faculté d Administration

Guide de l utilisateur Mikogo Version Windows

IBM Social Media Analytics

PromoPost Manuel d utilisation

Guide de l utilisateur de IBM SPSS Modeler Administration Console 15

Cinq impératifs prédictifs pour maximiser la valeur client Utilisation des analyses prédictives pour améliorer la gestion de la relation client

CAPTURE DES PROFESSIONNELS

MIGRATION DE THUNDERBIRD VERS OUTLOOK mardi 16 octobre 2012

Trois méthodes éprouvées pour obtenir un meilleur retour sur investissement avec le data mining

Windows Internet Name Service (WINS)

MS PROJECT Prise en main. Date: Mars Anère MSI. 12, rue Chabanais PARIS E mail : jcrussier@anere.com Site :

GUIDE DE DEMARRAGE RAPIDE:

Plug-in Verizon Collaboration pour Microsoft Outlook Guide de l utilisateur

MEGA ITSM Accelerator. Guide de Démarrage

Prise en main rapide

ing Pro : Analyse & Understand your results PAGE 0

Révision salariale - Manager

Comment optimiser dans ImageReady?

Prestation électronique de service pour la transmission d un bilan de phosphore

«Manuel Pratique» Gestion budgétaire

Manuel d utilisation

Créer et partager des fichiers

S e r v i r l e s clients actuels de maniè r e e f f ic a ce grâce a u «Co n s u m er Insight»

Informations Scanner. Manuel utilisateur

:...2 I.6. :... 2 I.7. :... 2 I.8. :...3 I.9. :... 3 I.10. :... 3 II. 4 II.1.

Service On Line : Gestion des Incidents

IBM SPSS Forecasting. Créez des prévisions d'expert en un clin d'œil. Points clés. IBM Software Business Analytics

SUPPORT DE COURS ACCESS 2010

IBM* DB2 Universal Database* Tutoriel Business Intelligence : Introduction à Data Warehouse Center

PRODIGE V3. Manuel utilisateurs. Consultation des métadonnées

Module 1 : Tableau de bord Excel * 2010 incl.*

SOMMAIRE. 1. Connexion à la messagerie Zimbra Pré-requis Ecran de connexion à la messagerie 4

Groupe Eyrolles, 2003, ISBN : X

Service des ressources informatiques - Conseil Scolaire de District Catholique Centre-Sud Page 1

Formation. Module WEB 4.1. Support de cours

Une ergonomie intuitive

Aide Webmail. L environnement de RoundCube est très intuitif et fonctionne comme la plupart des logiciels de messagerie traditionnels.

Europresse.com. Pour les bibliothèques publiques et de l enseignement. Votre meilleur outil de recherche en ligne. Guide version 1.

EXCEL PERFECTIONNEMENT SERVICE INFORMATIQUE. Version /11/05

v7.1 SP2 Guide des Nouveautés

Guide d utilisation IPAB-ASSOCIATION v5.0 GUIDE D UTILISATION. à destination des associations et organismes sans but lucratif.

Manuel d utilisation de la plate-forme de gestion de parc UCOPIA. La mobilité à la hauteur des exigences professionnelles

QLIKVIEW POUR SALESFORCE

Guide d administration de Java Desktop System Configuration Manager Release 1.1

INTRODUCTION AUX TESTS DE PERFORMANCE ET DE CHARGE

Manuel d utilisation NETexcom

Proposition de facture

MEGA ITSM Accelerator. Guide de démarrage

Utilisation du client de messagerie Thunderbird

Services bancaires par Internet aux entreprises. Guide pratique pour : Rapports de solde Version

AssetCenter Notes de version

Points forts : Amélioration de la génération et de la qualification des listes de clients potentiels

Manuel du Desktop Sharing

Guide d utilisation OGGI. Gestionnaire d incidents à l usage des clients. Date de rédaction : 04/02/2013. Version : 1.0.

Création et utilisation de formulaire pdf

Groupe Eyrolles, 2006, pour la présente édition, ISBN :

Call Center View Alarm Reporter

Guide de l utilisateur du Système central IBM SPSS Statistics 20

HP StorageWorks All-in-One Storage Manager Manuel de l utilisateur

Guide utilisateur i-milo >> Décisionnel

Le SIG pour les Télécommunications. Solutions Esri pour l entreprise

Manuel de l utilisateur. Soft-phone - Client VoIP 3CX Version 6.0

Ministère de l Éducation Guide de l utilisateur de l Initiative pilote des écoles vertes

Freeway 7. Nouvelles fonctionnalités

IBM Unica emessage Version Date de publication : 7 juin Guide utilisateur

Tutoriaux : Faites vos premiers pas avec Microsoft Visio 2010

Manuel du gestionnaire

Guide d utilisation. Version 1.1

Documentation Honolulu 14 (1)

Access. Apprenez exactement ce dont vous avez besoin Progressez à votre rythme Téléchargez les exercices. Joyce Cox et Joan Lambert

Intelligence d affaires nouvelle génération

!!! Archipad version 1.4. Manuel de Référence

ENVOI EN NOMBRE DE MESSAGES AUDIO

NOTICE D UTILISATION

Comment utiliser RoundCube?

Business Intelligence

Sommaire Présentation... 5 Sommaire Gérer le publipostage... 8 Gérer les modèles Gérer les groupes de contacts Mémoire d émission...

MANUEL L I A I S O N B A N C A I R E C O D A D O M I C I L I A T I O N S I S A B E L 6

Module Communication - Messagerie V6. Infostance. Messagerie

UltraBackup NetStation 4. Guide de démarrage rapide

Contenu Microsoft Windows 8.1

Guide abrégé d IBM SPSS Statistics 21

Transcription:

IBM SPSS Modeler Social Network Analysis 15 Guide de l utilisateur

Remarque : Avant d utiliser ces informations et le produit qu elles concernent, lisez les informations générales sous Avis sur p. 24. Cette version s applique à IBM SPSS Modeler Social Network Analysis 15 et à toutes les publications et modifications ultérieures jusqu à mention contraire dans les nouvelles versions. Les captures d écran des produits Adobe sont reproduites avec l autorisation de Adobe Systems Incorporated. Les captures d écran des produits Microsoft sont reproduites avec l autorisation de Microsoft Corporation. Matériel sous licence - Propriété d IBM Copyright IBM Corporation 2012. Droits limités pour les utilisateurs au sein d administrations américaines : utilisation, copie ou divulgation soumise au GSA ADP Schedule Contract avec IBM Corp.

Préface IBM SPSS Modeler Social Network Analysis traite des informations sur les relations entre les individus dans des champs décrivant le rôle d un individu dans un réseau social, permettant ainsi d intégrer les informations sociales aux modèles prédictifs. Ce manuel décrit l utilisation des noeuds IBM SPSS Modeler Social Network Analysis dans l environnement IBM SPSS Modeler vous permettant ainsi d intégrer les noeuds dans vos flux. La combinaison du résultat des noeuds et des champs qui représentent les mesures sur les individus permet d obtenir un profil plus complet des individus. A propos d IBM Business Analytics Le logiciel IBM Business Analytics propose des informations complètes, cohérentes et précises auxquelles les preneurs de décisions peuvent se fier pour améliorer les performances de leur entreprise. Un porte-feuilles étendu de veille économique, d analyses prédictives, degestion des performances et de stratégie financières et d applications analytiques vous offre des informations claires, immédiates et décisionnelles sur les performances actuelles et vous permet de prévoir les résultats futurs. Ce logiciel intègre des solutions dédiées à l industrie, des pratiques éprouvées et des services professionnels qui permettent aux organisations de toute taille de maximiser leur productivité, d automatiser leurs décisions sans risque et de proposer de meilleurs résultats. Ce porte-feuilles intègre le logiciel IBM SPSS Predictive Analytics qui aide les organisations à prévoir les événements à venir et à réagir en fonction des informations afin d améliorer leurs résultats. Les clients de l industrie du commerce, de l éducation et des administrations du monde entier font confiance à la technologie IBM SPSS qui offre un avantage concurrentiel en attirant et fidélisant les clients et en améliorant la base de données de la clientèle tout en diminuant la fraude et en réduisant les risques. En utilisant le logiciel IBM SPSS dans leurs opérations quotidiennes, les organisations deviennent des entreprises prédictives, capables de diriger et d automatiser les décisions pour répondre aux objectifs commerciaux et obtenir un avantage concurrentiel mesurable. Pour des informations supplémentaires ou pour joindre un représentant, consultez http://www.ibm.com/spss. Assistance technique L assistance technique est disponible pour les clients du service de maintenance. Les clients peuvent contacter l assistance technique pour obtenir de l aide concernant l utilisation des produits IBM Corp. ou l installation dans l un des environnements matériels pris en charge. Pour contacter l assistance technique, rendez-vous sur le site Web IBM Corp. à l adresse http://www.ibm.com/support. Lorsque vous contactez l assistance technique, soyez prêt à indiquer votre identité, le nom de votre société et votre contrat d assistance. Copyright IBM Corporation 2012. iii

Contenu 1 IBM SPSS Modeler Social Network Analysis 1 ÀproposdeIBMSPSSModelerSocialNetworkAnalysis... 1 Aproposdel analysederéseauxsociaux... 2 Affichagedesréseaux... 3 Descriptiondesréseaux... 3 noeudsibmspssmodelersocialnetworkanalysis... 6 OngletsNoeud... 6 Prévisualisationdesrésultats... 7 Analysedesdonnées... 7 Applications... 8 Structuredesdonnées... 8 Propriétésdegénérationdescripts... 9 2 Analyse de groupe 11 Présentationdel analysedegroupe...11 Déterminerlasimilaritésociale...11 Scissionengroupes...12 Descriptiondesgroupesetdesmembresdegroupe...13 NoeudAnalysedegroupe...14 Spécificationdesdonnéespourl analysedegroupe...14 Configurationdesoptionsdecréationpourl analysedegroupe...15 Affichagedesstatistiquesd analysedegroupe...15 Résultatsdel analysedegroupe...16 3 Analyse de diffusion 19 Présentationdel analysedediffusion...19 Exempled analysedediffusion...20 NoeudAnalysedediffusion...20 Spécificationdedonnéespourl analysedediffusion...21 Configurationdesoptionsdecréationpourl analysedediffusion...22 Affichagedesstatistiquesd analysesdediffusion...22 Résultatsdel analysedediffusion...23 Copyright IBM Corporation 2012. iv

Annexe A Avis 24 Glossaire 26 Bibliographie 27 Index 28 v

Chapitre 1 IBM SPSS Modeler Social Network Analysis À propos de IBM SPSS Modeler Social Network Analysis De nombreuses approches de modélisation du comportement sont centrées sur l individu. Elles utilisent de nombreuses données différentes sur les individus pour générer un modèle qui utilise les indicateurs clés du comportement pour le prévoir. Si un individu a des valeurs pour les indicateurs clés qui sont associées à l occurrence du comportement, cet individu peut être la cible d une attention particulière permettant d éviter ce comportement. Considérer les approches de modélisation de l attrition dans lesquelles un client met fin à sa relation avec une entreprise. Le coût de rétention des clients est beaucoup plus bas que le coût associé à leur remplacement. Par conséquent, la capacité à identifier les clients susceptibles d attrition est essentielle. Un analyste utilise souvent un certain nombre d indicateurs clés de performances pour décrire les clients, notamment des informations démographiques et des schémas d appel récents pour chaque client individuel. Les modèles prédicitifs basés sur ces champs utilisent les modifications des schémas d appel des clients qui correspondent aux schémas d appel des clients qui ont arrêté leur relation avec l entreprise afin d identifier les personnes ayant un risque d attrition plus élevé. Les clients identifiés comme susceptibles d attrition reçoivent un service client ou des options de service supplémentaires afin de les retenir. Ces méthodes ne tiennent pas compte des informations sociales qui peuvent avoir une influence significative sur le comportement d un client. Les informations sur uneentrepriseet sur ce que font les autres personnes imprègnent les relations et ont une influence sur les individus. Par conséquent, les relations avec d autres personnes permettent à ces personnes d avoir une influence sur les décisions et les actes d un individu. Les analyses qui tiennent uniquement compte des mesures individuelles passent à côté de facteurs importants qui permettent d effectuer des prévisions. IBM SPSS Modeler Social Network Analysis traite ce problème en ajoutant des informations relationnelles dans des champs supplémentaires qui peuvent être intégrés aux modèles. Ces indicateurs clés de performance dérivés mesurent les caractéristiques sociales des individus. La combinaison de ces propriétés sociales et des mesures individuelles permet d obtenir un panorama plus précis des individus et peut, par conséquent, améliorer la précision prédictive de vos modèles. IBM SPSS Modeler Social Network Analysis est composé de deux composants principaux : les noeuds IBM SPSS Modeler Social Network Analysis ajoutés à l environnement IBM SPSS Modeler qui permettent d inclure les techniques d analyses sociales dans les flux. IBM SPSS Modeler Server Social Network Analysis qui ajoute le traitement des spécifications de noeud à IBM SPSS Modeler Server. IBM SPSS Modeler Server Social Network Analysis traite efficacement d énormes quantités de données réseau qui peuvent Copyright IBM Corporation 2012. 1

2 Chapitre 1 contenir des millions d individus et de relations en un nombre relativement petit de champs pour des analyses ultérieures. Par exemple, IBM SPSS Modeler Social Network Analysis identifie les individus d un réseau qui sont le plus influencés par l attrition de personnes spécifiques. De plus, il est possible de découvrir des groupes d individus dans un réseau qui ont un risque d attrition accru. En intégrant à vos modèles les indicateurs clés de performance correspondant à ces effets, il est possible d améliorer les performances générales de ces modèles. Remarque : le traitement des noeuds IBM SPSS Modeler Social Network Analysis doit être effectué par IBM SPSS Modeler Server Social Network Analysis. Lors de l exécution d un flux contenant des noeuds IBM SPSS Modeler Social Network Analysis dans SPSS Modeler, vous devez vous connecter à une instance SPSS Modeler Server qui contient également IBM SPSS Modeler Server Social Network Analysis. A propos de l analyse de réseaux sociaux Un réseau social est composé d un ensemble d individus et des relations qui les lient. L analyse de réseaux sociaux examine ces relations pour décrire les individus et les groupes comme faisant partie d une structure sociale. Les individus interagissent les uns avec les autres et ces schémas d interactions offrent des informations sur les individus concernés. Les relations permettent aux informations de se propager dans un réseau ce qui permet à un individu d en influencer un autre. L importance des informations relationnelles différencie l analyse des réseaux sociaux des autres approches. Au lieu de se focaliser sur chaque individu de manière séparée, l unité d étude est une dyade composée de deux individus et des relations qui les unissent. Les relations à l intérieur d un réseau peuvent être classées comme dirigées ou non dirigées. Dans une relation dirigée, un individu est identifié comme l initiateur, ou la source, de la relation et l autre individu est identifié comme le récepteur, ou la destination. Par exemple, passer un appel téléphonique est une relation dirigée dans laquelle une personne en appelle une autre. En revanche, les rôles de la source et de la destination ne peuvent pas être définis dans des relations non dirigées. Dans ce cas, les deux parties participent à la relation de la même manière. Parler ensemble est un exemple d une relation non dirigée. Une autre propriété qui différencie les relations est de savoir si celles-ci sont dichotomiques ou de valeur. Les seules informations disponibles dans une relation dichotomique sont celles qui permettent de savoir si une relation existe ou non entre deux individus. Pour chaque dyade du réseau, la relation est soit présente, soit absente. De l autre côté, une relation de valeur intègre une pondération indiquant la pondération de la relation. Les pondérations permettent de comparer les relations. Le tableau «Types de relation» montre un exemple de classification croisée des relations par direction et par échelle. Dans les relations dirigées, Joe estlasourcedelarelationetmarie est la destination. Dans les relations non dirigées, il n existe pas d indication quant à l initiateur de la relation. Les relations de valeur utilisent la durée de la conversation comme pondération de relation alors que les relations dichotomiques ont simplement eu lieu ou non.

IBM SPSS Modeler Social Network Analysis 3 Table 1-1 Types de relation Direction Echelle Exemple Non dirigée Dichotomique Joe et Marie parlent ensemble Non dirigée De valeur Joe et Marie ont parlé ensemble pendant 20 minutes Dirigée Dichotomique Joe a appelé Marie Dirigée De valeur Joe a appelé Marie pendant 20 minutes Pour plus d informations sur le champ d analyse de réseaux sociaux, consultez un des livres sur ce sujet (Wasserman et Faust, 1994). Affichage des réseaux Un réseau social est généralement représenté par un sociogramme(moreno, 1934). Dans ce genre de représentation visuelle, les individus correspondent à des points, ou à des noeuds, dans un espace. Les lignes, ou arêtes, reliant les points représentent les relations entre les individus. Si les relations sont dirigées, les arêtes contiennent une flèche qui indique la direction. Si les relations ont des pondérations, les étiquettes des arêtes indiquent les valeurs. Le graphique suivant affiche un réseau de sept individus. Figure 1-1 Exemplederéseausocial Imaginons que le réseau représente les appels téléphoniques effectués par des individus avec les pondérations relationnelles indiquant la durée des appels. Dans ce cas, la personne A a appelé troispersonnesetapassélamajeurepartiedesontempsàparleràlapersonned. Ce réseau est bien plus petit que ceux rencontrés en réalité. Cependant, les concepts présentés dans des sociogrammes simples peuvent être appliqués à des réseaux de toute taille et de différente complexité. Description des réseaux Les informations sur les réseaux, les groupes et les individus doivent être extraites sous la forme de caractéristiques descriptives qui permettent des comparaisons croisées et leur intégration dans des modèles prédictifs. Les réseaux doivent être décomposés en un ensemble fini d indicateurs clés de performance pouvant être analysé. Par exemple, imaginons que vous souhaitiez comparer

4 Chapitre 1 des réseaux ou des groupes de noeuds à l intérieur d un réseau. Vous pourriez également vouloir comparer des individus dans le réseau ou identifier les individus les plus importants. Les deux mesures les plus fréquemment utilisées pour décrire les réseaux sociaux sont la densité et le degré. Ces deux statistiques reflètent la connectivité mais la première cible le réseau en son entier ou des sous-groupes du réseau alors que la seconde définit les individus du réseau. Densité du réseau Pour tout ensemble de noeuds d un réseau, il existe un nombre fini de relations possibles. Chaque noeud peut être la source ou la cible d une relation avec tous les autres noeuds. Imaginons un réseau composé de trois noeuds A,B et C.Le tableau suivant répertorie toutes les relations dirigées possibles entre les noeuds. Table 1-2 Relations dirigées possibles pour trois noeuds Source Cible A B A C B A B C C A C B Chaque noeud est la source d un relation avec les deux autres noeuds. Cependant, dans la pratique, toutes les relations possibles peuvent ne pas être présentes. Il est possible que certains noeuds n aient pas de relations directes avec d autres noeuds. De plus, certaines relations dirigées peuvent ne pas être réciproques. La statistique de densité représente la proportion de relations possibles dans le réseau qui sont réellement présentes. La valeur s étend de 0 à 1, avec la limite inférieure correspondant aux réseaux sans relations et la limite supérieure représentant les réseaux avec toutes les relations possibles. Plus la valeur est proche de 1, plus le réseau est dense et plus la cohésion des noeuds est importante dans le réseau. Les informations des réseaux denses sont transmises plus facilement que les informations des réseaux clairsemés. Le tableau «Réseaux clairsemés et denses» affiche deux réseaux constitués de sept noeuds. Le réseau clairsemé contient uniquement sept des 42 relations possibles entre les noeuds et génère une densité de 0,17. Le réseau dense, en revanche, contient toutes les relations possibles et affiche une densité de 1,0.

IBM SPSS Modeler Social Network Analysis 5 Table 1-3 Réseaux clairsemés et denses Réseau clairsemé Réseau dense Dans le réseau clairsemé, pour que les informations soient transmises du noeud A au noeud G, elles doivent traverser cinq autres noeuds. Au contraire, dans le réseau dense, les informations peuvent passer directement du noeud A au noeud G. Degré des noeuds Les individus importants dans le réseau sont souvent ceux qui sont impliqués dans le plus grand nombre de relations. Ces individus reçoivent des informations d un grand nombre de sources et diffusent ces informations vers un grand nombre d individus. Au contraire, les individus qui participent à un petit nombre de relations ne peuvent pas influencer directement un grand nombre d individus du réseau. Le degré d un noeud, défini comme le nombre total de relations impliquant ce noeud, permet de comparer les participants du réseau. Les individus avec des valeurs de degré élevées sont plus actifs que ceux avec des valeurs moins élevées. Le degré ignore la direction des relations et propose une mesure générale de l activité du noeud. Pour les relations dirigées, vous pouvez vous concentrer sur le fait qu un noeud est une source ou une cible pour compter le nombre de relations. Le degré intérieur d un noeud est le nombre de relations dans lesquelles un noeud spécifique est la cible. Le degré extérieur estlenombrede relations dans lesquelles un noeud est la source. Le tableau suivant répertorie les valeurs de degré, degré intérieur et degré extérieur de chaque noeud dans le schéma «Exemple de réseau social». Table 1-4 Exemples de valeurs de degré, degré intérieur et degré extérieur Nœud Degré Degré intérieur Degré extérieur A 3 0 3 B 1 1 0 C 2 1 1 D 3 1 2 E 1 1 0 F 2 1 1 G 2 2 0

6 Chapitre 1 Le degré intérieur est souvent traité comme une mesure de prestige. Des valeurs de degré intérieur élevées correspondent à un grand nombre de relations se terminant au niveau de ce noeud. Pour le dire autrement, ces individus sont contactés par un grand nombre d autres individus. De nombreux autres noeuds sont à l origine des relations avec ce noeud. A l inverse, le degré extérieur est traité comme une mesure de centralité. Des valeurs élevées correspondent à un grand nombre de relations provenant de ce noeud. Ces individus contactent un grand nombre d autres individus. Pour les noeuds de l exemple de réseau, les valeurs de degré indiquent que les noeuds A et D sont les plus actifs alors que les noeuds B et E sont les moins actifs. Les valeurs de degré intérieur révèlent que le noeud G a le prestige le plus important. En fonction des valeurs de degré extérieur, le noeud A est le plus central. noeuds IBM SPSS Modeler Social Network Analysis En plus des nombreux noeuds standard fournis avec IBM SPSS Modeler, vous pouvez également utiliser les noeuds IBM SPSS Modeler Social Network Analysis pour qu ils intègrent les résultats de l analyse des réseaux sociaux dans vos flux. Le tableau «noeuds IBM SPSS Modeler Social Network Analysis» décrit ces noeuds qui sont stockés dans la palette Sources. Table 1-5 noeuds IBM SPSS Modeler Social Network Analysis Nœud Icône Description Analyse de groupe Le noeud Analyse de groupe importe les données d enregistrement des informations sur les appels depuis un fichier texte à champ fixe, identifie les groupes de noeuds dans le réseau défini par ces enregistrements et génère des indicateurs clés de performance pour les groupes et les individus du réseau. Pour plus d'informations, reportez-vous à la section Présentation de l analyse de groupe dans le chapitre 2 sur p. 11. Analyse de diffusion Le noeud Analyse de diffusion importe les données d enregistrement des informations sur les appels depuis un fichier texte à champ fixe, propage un effet dans le réseau défini par ces enregistrements et génère des indicateurs clés de performance qui résument les résultats de cet effet sur les noeuds individuels. Pour plus d'informations, reportez-vous à la section Présentation de l analyse de diffusion. dans le chapitre 3 sur p. 19. Le traitement des noeuds IBM SPSS Modeler Social Network Analysis doit être effectué par IBM SPSS Modeler Server Social Network Analysis. Lors de l exécution d un flux contenant ces noeuds dans SPSS Modeler, vous devez vous connecter à une instance IBM SPSS Modeler Server qui contient également IBM SPSS Modeler Server Social Network Analysis. Onglets Noeud Les noeuds IBM SPSS Modeler Social Network Analysis proposent les onglets suivants permettant de définir et d obtenir un aperçu de l analyse : Onglet Données. Permet d identifier le fichier contenant les informations sur le réseau social.

IBM SPSS Modeler Social Network Analysis 7 Onglet Options de création. Utilisé pour définir les paramètres des analyses. Onglet Analyse. Permet de consulter le récapitulatif des résultats préliminaires qui fournit une aide à la modification des paramètres d entrée sur l onglet Données afin de générer les meilleurs résultats possibles. De plus, les noeuds proposent les onglets suivants dans tous les noeuds sources de IBM SPSS Modeler : Onglet Filtrer. Permet d éliminer ou de renommer les champs de résultats produits par les noeuds. Cet onglet offre les mêmes fonctions que le nœud Filtrer. Onglet Types. Permet de définir les niveaux de mesure des champs de résultats produits par les noeuds. Cet onglet offre les mêmes fonctions que le nœud Typer. Onglet Annotations. Permet de renommer les noeuds, fournit des info-bulles personnalisées et stocke une annotation plus importante. Pour des informations supplémentaires sur les onglets communs, consultez la documentation de SPSS Modeler. Prévisualisation des résultats Généralement, les résultats des noeuds sont utilisés comme entrée d un modèle prédictif. Si vous souhaitez consulter les résultats, vous pouvez ajouter un noeud Tableau au flux. Cependant, la quantité de données est souvent extrêmement élevée et la génération de tableaux demande alors beaucoup de temps. De plus, le nombre de lignes du tableau limite son utilité. Il est possible de générer un tableau de prévisualisation qui affiche un échantillon des résultats qui seront créés. La prévisualisation affiche les champs générés pour un nombre limité de lignes. Le nombre de lignes est défini dans les propriétés du flux. Pour prévisualiser les résultats d un noeud, effectuez les opérations suivantes : 1. Ouvrez le noeud. 2. Spécifiez les paramètres de données dans l onglet Données. 3. Définissez les paramètres analytiques dans l onglet Options de création. 4. Cliquez sur Prévisualiser Une fenêtre de prévisualisation s ouvre et affiche les résultats. De plus, prévisualiser les résultats remplit l onglet Analyse du noeud avec un récapitulatif des résultats. Analyse des données Déterminer les paramètres analytiques qui génèrent les meilleurs résultats est généralement un processus répétitif. Vous définissez les paramètres, effectuez l analyse et observez les résultats. Si les résultats ne sont pas aussi utiles qu ils pourraient l être, vous modifiez les paramètres et réexécutez l analyse.

8 Chapitre 1 Pour analyser les données d entrée du noeud, effectuez les opérations suivantes : 1. Ouvrez le noeud. 2. Spécifiez les paramètres de données dans l onglet Données. 3. Définissez les paramètres analytiques dans l onglet Options de création. 4. Cliquez sur Analyser les données. Applications Si les options de création indiquent que les statistiques récapitulatives doivent être affichées, l onglet Analyse affiche les résultats. Si vous avez besoin d effectuer à nouveau une analyse, cliquez sur Supprimer l analyse pour nettoyer les résultats actuels avant de cliquer sur Analyser les données. Les applications spécifiques dans lesquelles IBM SPSS Modeler Social Network Analysis peut être particulièrement utile sont notamment : la prévision de l attrition. Les caractéristiques des groupes peuvent avoir une influence sur les taux d attrition. En s intéressant aux individus des groupes qui ont un risque d attrition plus élevé, il peut être possible de l éviter. De plus, vous pouvez identifier les individus susceptibles d attrition en raison des informations qu ils reçoivent de ceux qui ont déjà quitté l entreprise. Utilisation optimale des chefs de groupe. Les chefs de groupe ont une forte influence sur les autres membres du groupe. S il est possible d éviter l attrition d un chef de groupe, le taux d attrition des membres du groupe peut être réduit. Essayer de provoquer l attrition d un chef de groupe chez un concurrent peut également augmenter le taux d attrition des membres du groupe associés à ce concurrent tout en réduisant le taux d attrition des membres du groupe associés à votre entreprise. Marketing. Les chefs de groupe peuvent permettre de lancer de nouveaux produits ou offres de service. L influence du chef peut pousser les autres membres du groupes à acheter cette offre. Vous pouvez utiliser l analyse de diffusion pour identifier les individus les plus influencés par les chefs de groupe et cibler votre campagne marketing. Structure des données Les informations intéressantes sur les individus du réseau peuvent être propagées au sein d un grand nombre de fichiers, bases de données et systèmes de votre entreprise. Pour analyser le réseau utilisant IBM SPSS Modeler Social NetworkAnalysis, vous devez extraire les enregistrements et les champs appropriés de vos sources de données et les formater comme entrées des noeuds. Les noeuds analytiques nécessitent que les enregistrements des informations sur les appels soient stockés dans un fichier texte à largeur fixe. Chaque ligne du fichier correspond à une relation, avec les données organisées dans les colonnes suivantes : l identifiant de l individu qui a initié la relation.

IBM SPSS Modeler Social Network Analysis 9 l identifiant de l individu qui est la cible de la relation. une pondération facultative pour la relation. Toutes les données doivent être numériques et les identifiants des individus doivent être des entiers. L ajout des noms des champs comme première ligne des données du fichier est facultatif. Le tableau «Exemple d enregistrements des informations sur les appels» illustre cette structure de données. Table 1-6 Exemple d enregistrements des informations sur les appels Source Destination Pondération 1000 5642 243 2190 8444 831 0299 9419 559 Les valeurs de pondération peuvent correspondre àtouteslesmesuresutiliséespourreprésenter l importance de la relation par rapport aux autres relations du réseau. Pour les données d appel, les pondérations habituelles incluent la durée ou la fréquence des appels. Si vous souhaitez que l analyse se concentre sur un sous-ensemble de l historique des appels, vous devez utiliser ce sous-ensemble lors de la création du fichier d entrée. Par exemple, vous pouvez limiter l analyse aux mois passés ou aux appels plus récents d un individu en incluant uniquement ces données dans le fichier texte d entrée. Propriétés de génération de scripts La génération de scripts IBM SPSS Modeler Social Network Analysis est un outil performant pour automatiser les processus dans l interface utilisateur. Les scripts permettent d effectuer les mêmes opérations qu avec la souris ou le clavier. Vous pouvez les utiliser pour automatiser les tâches dont l exécution manuelle s avère très répétitive et très longue. Pour une explication sur l utilisation des scripts, consultez le guide ScriptingAutomation.pdf disponible avec IBM SPSS Modeler. Propriétés du noeud Diffusion Le tableau suivant répertorie les propriétés des scripts pour le noeud Diffusion. Nom de la propriété Le type de données Description de la propriété input_data_file_name chaîne calling_field champ called_field champ frequency_weight_field champ read_field_names booléen diffusion_list_file_name chaîne spreading_factor double Valeur par défaut = 50. Min = 1 Max = 99.

10 Chapitre 1 Nom de la propriété Le type de données Description de la propriété max_number_iterations entier Valeur par défaut = 100. Min = 1. accuracy_threshold double Valeur par défaut = 0.01. Min = 0.001. calculate_statistics booléen Propriétés du noeud Analyse de groupe Le tableau suivant répertorie les propriétés de script du noeud Analyse de groupe. Nom de la propriété Le type de données Description de la propriété input_data_file_name chaîne calling_field champ called_field champ frequency_weight_field champ read_field_names booléen coverage_threshold double Valeur par défaut = 10. Min = 1 Max = 99. min_group_size entier Valeur par défaut = 2. Min = 2. max_group_size entier Valeur par défaut = 100. Min = 2. calculate_statistics booléen

Analyse de groupe Chapitre 2 Présentation de l analyse de groupe L analysedegroupeutiliselesmodèlesd interaction des individus dans un réseau pour identifier les groupes d individus communs. Les caractéristiques de ces groupes influencent le comportement des membres de groupe individuels. Par exemple, de petits groupes avec de nombreuses relations entre les membres et des chefs puissants, ont des risques accrus d attrition même si aucun membre du groupe n est encore parti.(richter, Yom-Tov, et Slonim, 2010) Les modèles prédictifs qui intègrent à la fois les mesures sur les groupes et sur les individus seront plus efficaces que les modèles qui contiennent uniquement des mesures sur les individus. L analyse de groupe est composée des étapes de base suivantes : 1. déterminer les forces relationnelles qui reflètent la proximité sociale. Pour plus d'informations, reportez-vous à la section Déterminer la similarité sociale sur p. 11. 2. Scinder le réseau en groupes en fonction de la pondération relationnelle tout en obéissant aux restrictions sur la taille. Pour plus d'informations, reportez-vous à la section Scission en groupes sur p. 12. 3. Effectuer un profil des groupes et des individus, en identifiant notamment les chefs des groupes. Pour plus d'informations, reportez-vous à la section Description des groupes et des membres de groupe sur p. 13. Déterminer la similarité sociale Les membres d un groupe devraient plus ressembler aux autres membres du groupe qu à des individus qui n appartiennent pas à ce groupe. Dans l analyse de réseau, la similarité de deux noeuds dépend de leur relation. Pour tout noeud d un réseau, il existe un ensemble de noeuds qui sont les cibles des relations dirigées avec ce noeud. Pour les données de télécommunications, cet ensemble correspond à toutes les personnes contactées par un individu spécifique. Si deux individus contactent le même ensemble de personnes, ces individus sont considérés comme semblables. Plus les ensembles de cibles relationnelles de deux individus se recoupent, plus ces individus sont semblables. Examinez le réseau présenté dans le schéma «Exemple de réseau à dix noeuds». Copyright IBM Corporation 2012. 11

12 Chapitre 2 Figure 2-1 Exemple de réseau à dix noeuds Le tableau «Noeuds cibles» montre les noeuds cibles des relations commençant aux noeuds A, B et C. Table 2-1 Noeuds cibles Noeud source A B C Noeuds cibles B,C,D,E,F,G A, C, D, E, F, G A,D,H,I,J Les noeuds A et B ont cinq noeuds cibles en commun. Les noeuds A et C, en revanche, n en ont qu un. Par conséquent, les noeuds A et B sont socialement plus semblables que les noeuds A et C. Les pondérations relationnelles, telles que la durée ou la fréquence des appels, ne capturent pas la similarité des noeuds dans un réseau. Pour inclure la notion de similarité, l analyse de groupe utilise des informations mutuelles (Couverture et Thomas, 2006) telles que la pondération relationnelle. Cette statistique reflète la probabilité que deux noeuds soient connectés au même noeud. Si la relation dans le réseau contient des pondérations prédéfinies, telles que la fréquence des appels pour les données de télécommunications, les informations mutuelles intègrent ces pondérations. Scission en groupes Les groupes doivent être composés d individus qui ont des pondérations relationnelles élevées avec d autres membres du groupe, où les pondérations mesurent la similarité des noeuds dans la relation. Ainsi, l identification de groupe commence par ignorer les relations les plus faibles dans un réseau. Le seuil de couverture contrôle ce processus en définissant la fraction de la relation la plus forte à conserver. Par exemple, une valeur de seuil de couverture de 0,4 utilise les 40 % de relations les plus fortes pour l identification du groupe alors que les 60% restants des relations sont ignorés.

13 Analysedegroupe Les relations restantes peuvent produire de très petits groupes ou des groupes très importants qui ont une utilité de prédiction limitée. Pour éviter que ce genre de groupes soient inclus dans l analyse, vous pouvez spécifier des tailles de groupe minimales et maximales. Les groupes avec des tailles inférieures au minimum seront entièrement ignorés. Les groupes avec des tailles supérieures au maximum, en revanche, seront divisés en groupes plus petits dans la plage de tailles autorisées. Les groupes restants, après avoir ignoré les relations faibles et avoir mis en place des limites de taille, sont appelés des groupes principaux. La suppression des relations du réseau d origine peut avoir pour conséquence que certains individus n appartiennent à aucun groupe principal. Cependant, ces individus peuvent avoir des connexions avec des membres d un groupe ce qui leur garantit d être intégrés à ce groupe. Un individu est ajouté à un groupe s il existe de nombreuses relations relativement fortes avec les membres principaux de ce groupe, tant que les limites de taille des groupes sont respectées. Par conséquent, les groupes finaux sont composés d un ensemble de membres principaux en plus des membres ajoutés en raison de leur connexion aux membres principaux. Description des groupes et des membres de groupe En plus de la densité, le degré intérieur et extérieur et d autres statistiques décrivent les dynamiques de groupe. En particulier, les scores d autorité et de diffusion proposent des mesures du statut social des individus au sein des groupes. Le rôle de chaque individu dans un groupe est extrêmement important pour essayer de prévoir le comportement du groupe et de ses membres. Le score d autorité d un noeud mesure la tendance des autres noeuds du groupe à s y connecter. Si de nombreux individus contactent un individu spécifique, pour lui demander des informations ou son opinion par exemple, cet individu a le rôle d une autorité. Les scores d autorité des noeuds dans le groupe, qui correspondent aux probabilités stationnaires d un trajet aléatoire avec redémarrages dans le réseau du groupe, vont de 0 à 1. Plus le score d autorité est proche de 1, plus ce noeud a d autorité au sein du groupe. Le noeud dans le groupe ayant le score d autorité le plus élevé s appelle le chef d autorité du groupe. Diviser le score le plus élevé d un groupe par le plus petit génère une mesure de la puissance générale du chef d autorité. Le scoredediffusiond un noeud mesure la tendance du noeud à se connecter aux autres noeuds du groupe. Si un individu spécifique contacte de nombreuses personnes du groupe, cet individu peut avoir un impact important sur les opinions du groupe entier. Les scores de diffusion des noeuds du groupe, qui correspondent aux probabilités stationnaires d un trajet aléatoire avec redémarrages dans le réseau du groupe dans l ordre inverse, vont de 0 à 1. Plus le score de diffusion est proche de 1, plus ce noeud se connecte aux autres membres du groupe. Le noeud dans le groupe ayant le score de diffusion le plus élevé s appelle le chef de diffusion du groupe. Diviser le score le plus élevé d un groupe par le plus petit génère une mesure de la pondération globale du chef de diffusion.

14 Chapitre 2 Noeud Analyse de groupe Le noeud Analyse de groupe, qui est disponible dans la palette Sources, identifie les ensembles d individus dans un réseau qui sont socialement semblables et détermine le statut social relatif des individus dans les groupes. Les groupes relativement petits qui ont de nombreuses connexions entre leurs membres et un chef important, ont un risque d attrition plus élevé en raison de leur dynamique de groupe. Vous pouvez utiliser les résultats pour déterminer les scores d attrition du groupe qui, lorsqu ils sont combinés aux scores d attrition individuels, améliorent la capacité de prévision de l attrition en fonction de modèles basés sur les scores individuels seuls. En raison de la quantité de données qui comprend généralement le réseau et la nature des interactions sociales qui sous-tendent les définitions des groupes, l analyse de groupe est un processus très long. Généralement, vous enregistrez les résultats de l analyse de groupe sur une base de données ou un fichier afin de les utiliser comme entrées d un modèle prédictif. Les résultats du groupe sont actualisés peu fréquemment, une fois par mois par exemple, alors que le modèle peut être actualisé plus souvent. Conditions requises. Le noeud nécessite un fichier texte à largeur fixe qui définit le réseau social à l aide de trois champs. Un champ identifie la source de chaque relation dirigée, un champ définit la destination de chaque relation dirigée et le troisième champ spécifie une pondération facultative pour chaque relation. Toutes les relations du réseau doivent être dirigées. Spécification des données pour l analyse de groupe L onglet Données de la fenêtre du noeud source Analyse de groupe vous permet de spécifier le fichier d entrée contenant les relations des noeuds du réseau. Fichier. Spécifiez le nom d un fichier ou d un dossier contenant les enregistrements des informations sur les appels. Vous pouvez saisir un nom ou cliquer sur le bouton des points de suspension (...) pour sélectionner un nom dans le système de fichiers. Le chemin d accès apparaît lorsque le nom est sélectionné et son contenu est affiché avec des séparateurs. Si vous spécifiez un dossier, les enregistrements des informations sur les appels contenus dans ce dossier sont enchaînés pour l analyse ; tous les fichiers du dossier doivent avoir la même structure. Lire les noms des champs à partir du fichier. Sélectionnée par défaut, cette option traite la première ligne du fichier de données en tant que noms pour les colonnes. Si votre première ligne n est pas un en-tête, désélectionnez cette option pour fournir automatiquement un nom générique à chaque champ, tel que Champ1 et Champ2 Paramètres de définition de réseau Les paramètres de définition de réseau définissent les rôles des champs. Champs. Utilisez les boutons fléchés pour attribuer manuellement les éléments de cette liste aux différents champs de rôle. Les icônes indiquent les niveaux de mesure valides pour chaque champ de rôle. Cliquez sur le bouton Tous pour sélectionner tous les champs de la liste ou cliquez sur