Master Informatique Décisionnelle Application des outils de l'informatique Décisionnelle en entreprise ETUDE SUR LES MARQUES ET LES CONTRUCTEUR DES VÉHICULES APPARTENANT AUX CLIENTS D UNE COMPAGNIE D ASSURANCE AUTOMOBILE Mots clés : Base de données, Access, Sodas Datamining, Analyse des Données Symboliques, Individus, Objets symboliques - Concepts, Classification automatique, Segmentation Réalisé par : M. Chtouki Badr M. Ousmane Ouologuem Page 1 sur 12
SOMMAIRE INTRODUCTION...3 1. PRESENTATION DU CONTEXTE DE L ETUDE DE CAS...4 1.1. INFORMATIONS DE BASES : BASE DE DONNEES (DESCRIPTION GLOBALE DES TABLES)...4 2. DE LA BASE DE DONNEES AUX CONCEPTS...5 2.1. REQUETE D ACQUISITION DES DONNEES...5 2.2. NOS INDIVIDUS...5 2.3. NOS CONCEPTS, OBJET SYMBOLIQUE...5 3. LES METHODES DE SODAS UTILISEES...6 3.1. SOE...6 3.2. DIV...8 3.3. SAT...9 PAR OPPOSITION AU YUGO, CHEVROLET ENGENDRE DES INDEMNITES MINIMALES DANS NOTRE COMPAGNIE D ASSURANCE.CONCLUSION...9 CONCLUSION...10 ANNEXE 1 : VARIABLES ET CONCEPTS...11 ANNEXE 2 : LISTES DES FICHIERS UTILISES...12 Page 2 sur 12
Introduction Les systèmes décisionnels doivent permettre l'analyse par métiers ou par sujet et le suivi dans le temps d'indicateurs calculés ou agrégés pertinents. Grâce à ces indicateurs, le décideur peut avoir une idée des tendances actuelles et dégager l orientation des actions futures. Ces indicateurs sont issus de calculs et d'analyses sur des données bien ciblées. Le datamining contribue à l analyse qui a pour but de dégager des lois et des tendances pour aider le décideur à améliorer les performances de son entreprise. Nos travaux visent à nous familiariser à cette phase. Notre étude est un cas d'école ayant pour principale objectif de nous s'initier aux techniques et moyens d'analyse et d'acquisition des connaissances fournies par Sodas. Dans la suite, nous vous détaillerons d abord le contexte de notre étude, Ensuite nous vous présenterons nos sources de données (Tables, structure, etc.), et enfin nous terminerons par une vue sur les méthodes que nous avons utilisées pour obtenir des résultats interprétables. Page 3 sur 12
1. Présentation du contexte de l étude de cas Nous sommes dans le cadre d'une étude sur les constructeurs des véhicules appartenant aux clients d une compagnie d'assurances. Il s'agit d'un assureur d'accidents sur les biens, couvrant les risques automobiles, incendie des habitations et responsabilité civile. Nous pour réduire le périmètre d'étude nous nous intéresserons surtout aux couvertures risque automobiles. 1.1. Informations de bases : Base de données (description globale des tables) Nous disposons de 9 tables dans notre base de données initiales. Il s agit en fait d une partie des tables d un entrepôt de données. Chaque table contient les références et les descriptions des données : La table «Automobile» contient les références et caractéristiques du véhicule de l assuré. La table «Mois» contient le mois de la demande et caractéristiques du véhicule de l assuré. La table «Assuré» contient les références, coordonnées et les informations personnelles sur l assuré. La table «Employé» contient les références et caractéristiques de l employé qui traite ou à traité les demande de l assuré. La table «Couverture» contient les références et caractéristiques des couverture associer au contrat souscrit par l assuré. La table «Statut» contient les références et caractéristiques de l état d avancement des demandes de l assuré. Fig1 : Schéma relationnel des tables de notre base de données. Page 4 sur 12
2. De la base de données aux concepts Nous nous intéresser aux constructeurs d automobiles et aux marques des voitures appartenant aux clients de cette compagnie d assurance. 2.1. Requête d acquisition des données Pour faciliter l acquisition de nos donner nous réalisons un travail préliminaire sur Acces. Nous créons une table structurer par tous les attributs (16 variables) susceptibles de contribuer à notre étude. Voici un aperçu de sa structure : Fig2 : Description des attributs (variables) de la table INDIVIDUS_CONCEPTEURS. En sélectionnant tous les enregistrements de la table INDIVIDUS_CONSTRUCTEUR, nous obtenons les données nécessaires à nos études ; Voici le type de requête utilisée : «SELECT* FROM INDIVIDUS_CONSTRUCTEUR» 2.2. Nos individus Nos individus sont les réclamations des assurés. Un individu correspond a un enregistrement de la table INDIVIDUS_CONSTRUCTEUR.Un enregistrement (réclamation ou enregistrement) permet de définir et suivre complètement une réclamation (après un accident le plus souvent). Il contient les informations relatives au véhicule (marques, constructeur, etc.) concerné, à l assuré, à l employé (adresse, région, revenu, etc.) chargé de la réclamation, et les indemnisations mis en jeu. Nous disposons de 422 réclamations soit : 422 individus 2.3. Nos concepts, Objet symbolique Nous nous intéressons aux constructeurs d automobiles, en regroupant les 422 individus par constructeurs nous obtenons 10 concepts (selon le constructeur concerné) de 15 variables. Page 5 sur 12
3. Les méthodes de Sodas utilisées Afin de restituer et d analyser les données contenues dans l entrepôt de données, nous utiliserons plusieurs méthode fournit par Sodas. Ces méthodes sont spécifiques au contexte d utilisation et à la finalité : interprétation et exploitation des résultats. 3.1. SOE Dans un premier temps nous utilisons la méthode SOE pour répertorier nos concepts dans un tableau. Fig3 : «Chaining» utilisant SOE. Fig4 : Tableau de description de nos concepts. Page 6 sur 12
Dans un second temps nous utilisons la méthode SOE pour visualiser les valeurs prisent par nos variables symboliques (variables des concepts). Par exemple sur le concept Pick-up et sur les trois variables symboliques «DateRecamation, SituationFamili et Sexe» nous obtenons le graphique 2D suivant : Fig5 : Schéma.. On constate que sur les Pick-up, les réclamations des assurés sont plutôt concentrées au mois de décembre et la grande partie de ces assurés sont des femmes mariées. On observe sur les BMW le même phénomène que l on vient de constater sur les Pick-up. Mais sur les hommes mariés cette fois ci. Fig6 : Schéma. Page 7 sur 12
3.2. DIV Nous voulons dans cette partie regrouper nos constructeurs d automobiles selon des critères portant sur les propriétaires des véhicules. Nous nous intéressons principalement à la situation de famille, au sexe et à la couverture / assurance risque contractée par l assuré. Les résultats suivants présentent les modalités de ces variables ainsi que les résultats obtenus après la classification. THE SELECTED VARIABLES ARE: (Verify the order of the modality) -------------------------- ( 6) :SituationFamiliale (Initial order) 1- Married 2- Single 3- Coresident ( 7) :sexe (Initial order) 1- F 2- M ( 8) :CouvertureAssurance (Initial order) 1- Foreign Coverage 2- Bodily Injury 250K 3- Collision 250 Deductible 4- Bodily Injury 100K 5- Teenage Driver 6- Uninsured Motorist 7- Bodily Injury 500K 8- Collision 1000 Deductible 9- Collision 100 Deductible +---- Classe 1 (Ng=5) "Pickup" "Ford" "Lexus" "Fiat" "Studebaker"!!----2- [sexe = F]!!! +---- Classe 3 (Nd=2) "BMW" "Bentley"!!----1- [SituationFamiliale <= Married]!! +---- Classe 2 (Ng=1) "Yugo"!!!----3- [CouvertureAssurance <= Bodily Injury 250K]! +---- Classe 4 (Nd=2) "Toyota" "Chevrolet" Fig7 : Schéma. Il semble que le premier critère qui sépare le mieux les constructeurs d automobiles est la situation familiale des propriétaires des véhicules. En effet plus de la moitié des dix (10) constructeurs d automobiles sur lesquels nous faisons notre étude ont fournis, à des personnes mariées, les véhicules qui font l objet de réclamation dans la compagnie d assurance. Ce constat n est pas nécessairement synonyme de défaillance ou manque de compétence chez ces fabricants Page 8 sur 12
3.3. SAT Nous souhaitons dans cette section comparer les cotisations mensuelles des assurés en fonction du constructeur du véhicule appartenant aux assurés. Nous utilisons la méthode STAT pour visualiser l histogramme des valeurs prises par la variable MontantMensuelRecu qui correspond à la cotisation mensuelle de l assuré par unité de devise. Fig8 : Schéma. Les réclamations des assurées qui possèdent une automobile de marque Yugo, sont ceux qui sont les mieux satisfaits en terme d indemnisation mensuelle maximale. Certains d entre eux reçoivent une indemnisation mensuelle maximale de 0,1637 en unité de devise. Par opposition au Yugo, Chevrolet engendre des indemnités minimales dans notre compagnie d assurance. Page 9 sur 12
Conclusion Ces études nous ont permis d appréhender l utilité des méthodes fournies par le logiciel SODAS : SOE Dans un premier temps nous avons utilisé la méthode SOE pour répertorier nos concepts dans un tableau. Dans un second temps nous avons utilisé la méthode SOE pour visualiser les valeurs prisent par nos variables symboliques (variables des concepts) DIV Nous nous avons utilisé la méthode DIV pour regrouper nos constructeurs d automobiles selon des critères portant sur les propriétaires des véhicules. STAT Nous avons utilisé la méthode STAT pour visualiser l histogramme des valeurs prises par des variables particulières telle que MontantMensuelRecu qui correspond à la cotisation mensuelle de l assuré par unité de devise Dans l ensemble ces méthodes nous ont permis de mieux nous situer sur les informations contenues dans notre base de données étudiée. Il serait intéressant de compléter les résultats présentés dans ce rapport par des études plus détaillés sur d autres compagnies d assurance automobiles afin de les généraliser «et pourquoi pas en faire des concepts eux même?». Page 10 sur 12
Annexe Annexe 1 : Variables et Concepts Page 11 sur 12
Annexe 2 : Listes des fichiers utilisés Dans notre Cd livrable nous avons fournies plusieurs fichiers.ces fichiers correspondent au différentes orientations que nous avons prises avant de nous focaliser sur le concept des «Constructeurs d automobile».il ne sont pas tous nécessaires et seuls certains sont les supports contribuant a notre étude. Le fichier gaj à considérer est le fichier : Fichier Sodas\gaj\ Constructeur.gaj Le fichier sds à considérer est le fichier : Fichier Sodas\sds\ Constructeur.sds Le fichier filière à considérer est le fichier : Fichier Sodas\fil\CONSTRUC.FIL La base de données à considérer est la base : Base de donnée\dbassurance.mdb Page 12 sur 12