Analyse Métier IBM SPSS Modeler Professional Prendre de meilleures décisions grâce à l intelligence prédictive Points clés Consultez, préparez et modélisez facilement des données structurées avec cet utilitaire de data mining visuel intuitif Créez et validez rapidement des modèles en utilisant les techniques statistiques et d apprentissage automatique les plus avancées Prenez en charge tout le processus de data mining grâce à une large gamme d outils basés sur la méthodologie CRISP-DM Déployez efficacement des informations et des modèles prédictifs à date fixe ou en temps réel Le data mining donne aux organisations un aperçu plus clair des conditions actuelles et des informations plus détaillées sur les événements à venir. Avec, votre organisation peut effectuer un data mining qui exploite de nombreux types de données, ce qui permet une analyse qui offre plus de résultats significatifs et une compréhension approfondie de vos clients ou employés. Cet utilitaire complet de data mining a de puissantes fonctions de préparation des données, de visualisation et de modélisation prédictive pour vous aider à résoudre tout problème commercial plus rapidement, avec des résultats plus précis. Modeler est utilisé par des analystes et des utilisateurs professionnels du monde entier. Grâce à ses fonctionnalités uniques, les non-analystes peuvent produire des modèles précis rapidement et facilement sans compétences d analyse sophistiquées, tandis que les analystes professionnels peuvent profiter des fonctions avancées de modélisation prédictive du logiciel. Rationaliser le processus de préparation des données L interface graphique intuitive de Modeler permet aux utilisateurs de visualiser facilement chaque étape du processus de data mining dans le cadre d un «flux». En interagissant avec les flux, les analystes et les utilisateurs professionnels peuvent collaborer en ajoutant des connaissances de leur domaine d activité au processus de data mining. Comme les data miners peuvent se concentrer sur la découverte de connaissances plutôt que sur des tâches techniques telles que l écriture de code, ils peuvent effectuer une analyse «du fil des pensées», explorer les données plus profondément et découvrir des relations cachées supplémentaires.
Analyse Métier À partir ce cette interface visuelle, vous pouvez facilement consulter et intégrer des données issues de nombreuses sources, notamment des produits IBM SPSS Data Collection, ainsi que des données de pratiquement n importe quel type de base de données, tableur ou fichier plat, y compris de fichiers IBM SPSS Statistics, SAS et Microsoft Excel. Aucune autre solution de data mining n offre une telle polyvalence. Grâce aux puissants outils d automatisation de Modeler, comme la préparation automatisée des données et la modélisation automatique, il est facile de préparer les données pour l analyse, de trouver le meilleur modèle d après des patrons cachés dans les données et de produire rapidement des résultats cohérents et exacts. Exploiter davantage de types de données pour de meilleurs résultats Nos clients ont découvert qu intégrer tous les types de données disponibles augmente le «lift» ou la précision des modèles prédictifs, ce qui permet des recommandations plus utiles et de meilleurs résultats. Si votre organisation collecte de grandes quantités de données textuelles, l utilitaire interactif de text mining disponible dans IBM SPSS Modeler Premium vous permettra d extraire des concepts et des opinions à partir de n importe quel type de texte, notamment de texte capturé dans des sources opérationnelles, des notes de centre d appels, des e-mails de clients, des articles de médias ou des revues, des blogs, des flux RSS et plus encore. L accès direct aux données d enquête dans les produits Data Collection facilite l inclusion d informations démographiques, d attitudes et comportementales dans vos modèles, ce qui étoffe votre compréhension des personnes ou des organisations que vous servez. Choisir parmi un éventail inégalé de techniques Modeler offre une série de techniques de data mining avancées conçues pour répondre aux besoins de chaque application de data mining, y compris les algorithmes suivants. Algorithmes de classification : faites des prédictions ou des prévisions basées sur des données historiques en utilisant des techniques comme l arbre de décision, les réseaux de neurones, la régression logistique, les séries temporelles, les machines à vecteurs de support, la régression de Cox et plus encore. Exploitez la modélisation de classification automatique pour les résultats aussi bien binaires que numériques afin de rationaliser la création de modèles. Algorithmes de segmentation : groupez des personnes ou détectez des patrons inhabituels avec les techniques de classification automatique, de détection des anomalies et de réseau de neurones. Utilisez la classification automatique pour appliquer plusieurs algorithmes en une seule étape et évitez les conjectures pour choisir la bonne technique. Algorithmes d association : découvrez des associations, des liens ou des séquences en utilisant Apriori, CARMA et l association séquentielle. 2
Optimiser vos technologies informatiques actuelles L architecture ouverte et évolutive de Modeler tire le meilleur parti de votre infrastructure informatique existante. Elle s intègre à vos systèmes existants, à la fois lors de l accès aux données et du déploiement des résultats, vous évitant d avoir à convertir les données dans un format propriétaire. Et des techniques comme l exploration de bases de données, le multi-thread, les groupes de serveurs et la conversion SQL vous aident à conserver vos ressources, à fournir des résultats plus rapidement et à réduire vos coûts informatiques généraux. Business Understanding Data Understanding Data Preparation Deployment Data Modeling Evaluation Figure 1: Le processus CRISP-DM, comme indiqué sur ce diagramme, permet aux data miners de mettre en œuvre des projets de data mining efficaces qui fournissent des résultats commerciaux mesurables. Suivre un processus reproductible éprouvé Durant chaque phase du processus de data mining, Modeler prend en charge la norme de facto de l industrie, CRoss-Industry Standard Process for Data Mining (CRISP-DM). Cela signifie que votre entreprise peut s employer à résoudre les problèmes commerciaux lors du data mining, au lieu de réinventer un nouveau processus pour chaque projet. Les projets individuels Modeler peuvent être efficacement organisés à l aide du gestionnaire de projet CRISP-DM. 3
Déployer la modélisation prédictive dans toute l entreprise Modeler peut analyser efficacement les quantités de données habituellement générées par les petites et moyennes entreprises. Les organisations ayant des besoins de data mining à gros volume ou complexes utilisent IBM SPSS Modeler Server. Grâce à l architecture client/serveur, Modeler Server permet à de nombreux analystes de travailler simultanément sans mettre à rude épreuve les ressources informatiques. Vous pouvez utiliser l exploration de bases de données sur les plateformes informatiques leaders du marché et traiter efficacement de grandes quantités de données. Modeler Server offre aussi des options de déploiement supplémentaires pour vous aider à étendre les bénéfices du data mining à tous les axes géographiques ou fonctionnels et à fournir rapidement les résultats aux décideurs. Nouveautés de Modeler Professional 14 Cette version inclut de nouvelles fonctions et des améliorations qui vous permettront de créer et d interpréter des modèles facilement à l aide de techniques de pointe ; ces fonctionnalités s intègreront en toute transparence à d autres logiciels IBM SPSS et à des technologies tierces, et incorporeront la modélisation prédictive dans les processus commerciaux de votre organisation. Améliorations des performances Améliorez la stabilité et la précision de vos modèles en utilisant les techniques d optimisation des grands ensembles de données, notamment le boosting and bagging, pour les algorithmes Réseau neuronal, Linéaire et Arbre de décision. Exécutez de nombreux modèles à la fois et interagissez avec eux en utilisant un nouvel outil de visualisation qui vous permet de mieux comprendre les résultats des modèles d ensemble et de les partager avec d autres membres de votre organisation. Améliorez l évolutivité et la performance lorsque vous utilisez Modeler Professional Server en exploitant la nouvelle fonction d optimisation du traitement des grands ensembles de données pour les algorithmes clés. Créez et actualisez des modèles sur des bases de données de taille illimitée pour les processus à l échelle de l entreprise. 4
Algorithmes actualisés Le nouvel algorithme Réseau neuronal prend en charge de nouvelles méthodes d analyse et inclut les fonctions de perceptron multicouche et de base radiale. Il inclut une visualisation interactive novatrice qui facilite la compréhension et la communication des résultats. Créez de meilleurs modèles linéaires à l aide d une nouvelle méthode de régression linéaire qui utilise le traitement de grands ensembles de données, possède des options intégrées de préparation automatique des données et produit de riches visualisations grâce auxquelles il est facile d interpréter les résultats des modèles interactivement. Améliorations des données Étendez la prise en charge des sources de données d entreprise avec la possibilité de lire et d écrire des données en XML. Faites un meilleur usage de la force de vos bases de données opérationnelles grâce à des options supplémentaires d exploration de bases de données et renvoyez les résultats de Modeler vers des tables de bases de données opérationnelles depuis l interface. Simplifiez la réutilisation des flux de modélisation parmi les utilisateurs et assurez des paramétrages corrects grâce aux invites de paramétrage d exécution. Augmentez votre capacité de contrôle lorsque vous exportez des résultats vers Excel en les ajoutant à un classeur existant ou en précisant où placer les résultats à l intérieur d un tableur. Prise en charge et déploiement améliorés des plateformes Améliorez le déploiement et l évaluation à l aide d une définition de déploiement visuel qui inclut des fonctions automatiques de re-création de modèle, de ramification et d actualisation de modèle. Gérez les normes de connexion de l entreprise grâce à la nouvelle prise en charge de la technologie standard de l authentification unique (SSO). 5
Fonctions Compréhension des données Créez une large gamme de graphiques interactifs avec une assistance automatique Utilisez l analyse visuelle des liens pour révéler les associations dans vos données Interagissez avec les données en sélectionnant des régions ou des éléments d un graphique et en visualisant les informations sélectionnées ; ou sélectionnez des données clés à utiliser dans l analyse Accédez aux graphiques et outils de rapport Statistics directement depuis Modeler Préparation des données Accédez aux données opérationnelles issues de sources telles qu IBM DB2, Oracle, Microsoft SQL Server, Informix, Neoview, Netezza, mysql (Sun) et Teradata. Importez fichiers texte délimités et à largeur fixe, fichiers Statistics, SAS, sources de données Data Collection ou XML Utilisez diverses options de nettoyage de données pour éliminer ou remplacer les données non valides, imputer automatiquement les valeurs manquantes et limiter les aberrations et les extrêmes Appliquez la préparation automatique des données pour interroger et conditionner les données pour l analyse en une seule étape Exportez les données vers des fichiers texte délimités, Excel, Statistics, SAS et des bases de données opérationnelles Filtrage des champs, nommage, dérivation, regroupement, recatégorisation, remplacement des valeurs et réorganisation des champs Sélection, échantillonnage, fusion et concaténation des enregistrements ; tri, agrégation et équilibrage Restructuration, partitionnement et transposition de données Fonctions de chaîne étendue : création de chaîne, substitution, recherche et mise en correspondance de chaîne, suppression des blancs et troncature Accédez à la gestion et aux transformations des données effectuées dans Statistics directement depuis Modeler Évaluation RFM : agrégez les transactions des clients pour obtenir des scores de Récence, Fréquence et Monétaire et combinez-les pour produire une analyse RFM complète Modélisation et évaluation Employez des algorithmes de data mining avancés pour obtenir les meilleurs résultats de vos données Utilisez des navigateurs de modèle et d équation interactifs et visualisez des résultats statistiques avancées Montrez l impact relatif des attributs des données sur les résultats prédits avec des graphiques d importance des variables Combinez plusieurs modèles (modèles d ensemble) ou utilisez un premier modèle pour en analyser un second Utilisez la classification automatique (binaire et numérique) plutôt que des algorithmes individuels 6
Utilisez Component-Level Extension Framework (CLEF) de Modeler pour intégrer des algorithmes personnalisés À travers l intégration de Statistics, utilisez R pour étendre les options d analyse Algorithmes de modélisation inclus C&RT, C5.0, CHAID & QUEST : algorithmes d arbre de décision incluant la construction d arbres interactifs Liste de décision : algorithme interactif basé sur des règles K-Means, Kohonen, Two Step, Discriminant, Machines à vecteurs de support (SVM) : algorithmes de classification et de segmentation Factor/PCA, Sélection de fonction : algorithmes de réduction de données Régression, Linéaire, GenLin (GLM) : modélisation d équation linéaire Modèle de réponse en autoapprentissage (SLRM) : modèle bayésien avec apprentissage incrémental Séries temporelles : génération et sélection automatique de modèles de prévision de séries temporelles Réseau neuronaux : perceptrons multicouche avec apprentissage par rétropropagation, et réseaux avec fonction à base radiale Machines à vecteurs de support : algorithme avancé pour les grands ensembles de données Réseaux bayésiens : modèles probabilistes graphiques Régression de Cox : calcul du délai probable d un événement Détection des anomalies : algorithme basé sur la classification pour la détection des enregistrements inhabituels KNN : algorithme de modélisation et d évaluation du plus proche voisin Apriori : algorithme populaire de découverte d associations avec fonctions d évaluation avancées CARMA : algorithme d association prenant en charge de multiples conséquences Séquence : algorithme d association séquentielle pour les analyses sensibles à l ordre Deployment Exportez des modèles en utilisant SQL ou PMML (le format standard basé sur le XML pour les modèles prédictifs) Exploitez les fonctions novatrices de gestion d analyse, d automatisation des processus et de déploiement d IBM SPSS Collaboration and Deployment Services Modeler server (optionnel*) Utilisez L exploration de bases de données pour créer des modèles dans la base de données à l aide de technologies de base de données leaders du marché et exploitez les implémentations de base de données haute performance Exploitez le matériel haute performance, trouvez des solutions plus rapidement et obtenez un meilleur RSI grâce à l exécution parallèle de flux et modèles multiples Transmettez des données sensibles en toute sécurité entre Modeler Client et Modeler Server grâce au codage SSL 7
À propos de SPSS, an IBM Company SPSS, an IBM Company, est un leader mondial de logiciels et solutions d analyse prédictive. Le portefeuille complet de produits de l entreprise (collecte de données, statistiques, modélisation et déploiement) capture les attitudes et opinions des gens, prédit les résultats des futures interactions clients puis exploite ces informations en intégrant l analyse aux processus métier. Les solutions IBM SPSS répondent aux objectifs commerciaux interconnectés de l ensemble d une organisation en se concentrant sur la convergence de l analyse, de l architecture informatique et du processus commercial. Des clients des secteurs commerciaux, gouvernementaux et universitaires du monde entier utilisent la technologie IBM SPSS comme un avantage concurrentiel pour attirer, fidéliser et développer la clientèle, tout en réduisant la fraude et en limitant les risques. SPSS a été rachetée par IBM en octobre 2009. Pour plus d informations, ou pour contacter un représentant, visitez www.spss.com. Copyright IBM Corporation 2010 SPSS Inc., an IBM Company Headquarters, 233 S. Wacker Drive, 11th floor Chicago, Illinois 60606 SPSS est une marque déposée et les noms des autres produits SPSS sont des marques commerciales de SPSS Inc., an IBM company. 2010 SPSS Inc., an IBM Company. Tous droits réservés. IBM et le logo IBM sont des marques commerciales d'international Business Machines Corporation aux États-Unis, dans d'autres pays ou les deux. Pour une liste complète des marques commerciales d'ibm, voir www.ibm.com/legal/copytrade. shtml. Les autres noms d'entreprises, de produits et de services peuvent être des marques commerciales ou des marques de service d'autres organisations. Les références aux produits ou services IBM dans cette publication n'impliquent pas qu'ibm a l'intention de les rendre disponibles dans tous les pays où IBM a des activités. Toute référence à des sites Web non-ibm dans ces informations est fournie à titre indicatif seulement et ne constitue en aucune manière une approbation desdits sites Web Les documents présentés sur ces sites Web ne font pas partie des documents concernant ce produit IBM et l'utilisation de ces sites Web est à vos risques et périls. Veuillez recycler IMD14303FRFR-00