Comment ne pas construire un score-titanic
|
|
- Robin Langevin
- il y a 8 ans
- Total affichages :
Transcription
1 Comment ne pas construire un score-titanic Mon mailing Olivier Decourt ABS Technologies / Educasoft Formations
2 1- Les principes 2- Un premier exemple : les vins de France 3- Mise en œuvre sous SAS 4- Un exemple "DataMining" : "qualité" des assurés automobiles
3 La robustesse, un premier exemple : Quelle confiance avoir dans cette droite si je rajoute de nouveaux individus?
4 La robustesse, un deuxième exemple : 2 groupes d'individus distincts! toute modélisation de l'ensemble sera médiocre. 2 modèles séparés! meilleure précision.
5 La robustesse, une définition : Qualité des modèles qui ne perdent pas en performance si on les applique à de nouveaux individus. Un modèle robuste est donc loisible de bien prédire le comportement de nouveaux clients.
6 Les modèles stratifiés On isole des sous-populations ayant de fortes ressemblances ; on modélise séparément dans chacune de ces sous-populations. Le modèle global fait la synthèse (la somme) des différents "sous-modèles" obtenus.
7 Les modèles stratifiés Avantages : Simplicité de l'idée Lisibilité du modèle Convient bien à tous les cas étudiés Inconvénients : # Représentativité de l'échantillon de travail? Difficulté de séparer les individus en classes homogènes et stables
8 Les modèles itératifs "Cent fois sur le métier remettra ton ouvrage "
9 Les modèles itératifs On fait la modélisation un grand nombre de fois sur des populations légèrement différentes. Toutes ces sous-populations sont issues de la population d'origine (pas de nouveaux individus). Le modèle final est une synthèse (une moyenne) des différents modèles obtenus.
10 Les modèles itératifs Plusieurs variantes : le Jackknife (population à modéliser moins 1 individu) le Bootstrap simple (échantillonnage à probabilités égales dans la population à modéliser) le Bootstrap à probabilités inégales (variante du précédent : l'échantillon n'est pas représentatif de la population de départ)
11 Les modèles itératifs : principe sous-modèle population étudiée échantillon modèle final (moyenne des sous-modèles)
12 Les modèles itératifs Avantages : Grande robustesse du modèle final Possibilité de connaître «l'imprévisibilité» du modèle Inconvénients : Temps d'exécution! Programmation parfois plus ardue Comment faire la synthèse de certains modèles? #
13 Le Jackknife sous-modèle population étudiée échantillon : toute la population sauf 1 individu modèle final (moyenne des sous-modèles) Autant de boucles qu'il y a d'individus dans la population étudiée
14 Le Bootstrap sous-modèle population étudiée échantillon : représentatif ou non de la population modèle final (moyenne des sous-modèles) Nombre de boucles décidé à l'avance
15 Le Bootstrap : échantillonnage Sondage à probabilités égales Respecter la population Chaque individu de la population a la même probabilité d'appartenir à l'échantillon Sondage à probabilités inégales On impose a priori des probabilités d'inclusion! sur-représentation de certains individus Importance de cette étape : gain de temps
16 Un premier exemple : Les vins de France de 1969 à 1985
17 Un 1er modèle pour le Bourgogne rouge : 6 5 Valeurs prédites par le modèle Notes réelles pour le Bourgogne rouge
18 Un modèle stratifié pour le Bourgogne rouge 1. Classification des années (PROC FASTCLUS) sur la base des données météos 2. Stratification selon cette variable de classe (2 classes créées)
19 Modèle stratifié pour le Bourgogne rouge : 6 5 Valeurs prédites par le modèle Notes réelles pour le Bourgogne rouge
20 Comparaison des deux modèles Modèle simple : SCE = 14,81 Modèle stratifié : SCE = 8,79 On a donc presque diminué de 40 % (!) la distance moyenne entre les valeurs réelles et les valeurs prévues. Note : SCE = Somme des Carrés des Ecarts
21 Jackknife et bootstrap à probabilités égales sur le modèle non stratifié On procède, selon les cas, à 17 boucles (jackknife) ou à seulement 10 boucles (bootstrap à probabilités égales).
22 Performance des modèles itérés : SCE du jackknife : 14,05 SCE du bootstrap (en moyenne) : 7,70 (La SCE du bootstrap est comprise entre 8,89 et 6,14 sur 30 essais.) Pour mémoire : SCE du modèle normal : 14,81 SCE du modèle stratifié : 8,79
23 Que constate-t-on? Modèle robuste "meilleur" modèle Jackknife! une seule observation peut tout changer Bootstrap! meilleur moyen de niveler les effets des observations atypiques si on prend les "bons" échantillons!
24 Autre avantage des modèles itérés : les intervalles de confiance Bootstrap sur le modèle simple : le coefficient de la température minimale est compris entre -0,38 et 0,44 (avec 95% de chances de tomber juste dans cet intervalle). La valeur moyenne s'établit à -0,41. Le modèle sans itération propose une valeur de -0,37.
25 Mise en œuvre sous SAS Avec des macro-programmes Les modèles stratifiés, le jackknife et le bootstrap à probabilités égales sont assez faciles à développer. Avec SAS Enterprise Miner Possibilité de modèles stratifiés et de bootstrap, sauf la partie "intervalle de confiance" du modèle Nœuds GROUP PROCESSING et ENSEMBLE
26 Un exemple "DataMining" : "Qualité" des clients d'une assurance automobile
27 Les données clients d'une assurance automobile décrits par 21 variables âge de l'assuré marque de la voiture bonus / malus âge du véhicule année du permis situation familiale connus comme "bons" ou "mauvais" clients.
28 La problématique Construire un score à partir des renseignements existants pour repérer les bons et les mauvais clients parmi de nouveaux candidats à l'assurance. Le modus operandi On testera la qualité et la robustesse de nos modèles en les construisant sur clients, et en "scorant" les restants, inconnus jusqu'alors.
29 Premier modèle Une régression logistique (puisque la variable à modéliser est binaire) avec 11 variables explicatives : usage du véhicule, est-il dans un garage fermé? âge, puissance et valeur du véhicule année du permis, situation familiale, âge, ancienneté du contrat et CRM de l'assuré nombre de sinistres de l'année écoulée Prédit bon Prédit mauvais Taux de confusion : 19,36 % Réellement bon Réellement mauvais 21,40 % 15,72 % 3,64 % 59,24 %
30 Le bootstrap avec SAS Enterprise Miner Les ingrédients Un trait de, 2 traits de et, et un zest de. La recette
31 Mise en oeuvre
32 Comparaison des performances (matrices de confusion) 19,36 % Prédit bon Prédit mauvais Modèle simple 18,84 % Prédit bon Prédit mauvais Réellement bon 21,40 % 3,64 % Réellement bon 21,00 % 4,04 % Réellement mauvais 19,01 % 15,72 % Prédit bon 59,24 % Prédit mauvais Bootstrap Probas égales Réellement mauvais 18,28 % 14,80 % 60,16 % Modèle stratifié Prédit bon Prédit mauvais Réellement bon 21,32 % 3,72 % Réellement bon 20,60 % 4,44 % Réellement mauvais 15,29 % 59,67 % Bootstrap Probas inégales Réellement mauvais 13,84 % 61,12 %
33 Conclusion (1/2) La robustesse est un des atouts indispensables d'un score : c'est sa capacité de généralisation. On la teste validation croisée. avec la partition des données et la
34 Conclusion (2/2) On peut accroître la robustesse avec des modèles complexes. La mise au point de ces modèles demande plus de temps, mais leur durée de vie s'accroît également. Un modèle robuste n'est pas forcément meilleur de prime abord!
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»
LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers
Plus en détailESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring
ESSEC Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring Les méthodes d évaluation du risque de crédit pour les PME et les ménages Caractéristiques Comme les montants des crédits et des
Plus en détailArbres binaires de décision
1 Arbres binaires de décision Résumé Arbres binaires de décision Méthodes de construction d arbres binaires de décision, modélisant une discrimination (classification trees) ou une régression (regression
Plus en détailProjet SINF2275 «Data mining and decision making» Projet classification et credit scoring
Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems
Plus en détailTABLE DES MATIERES. C Exercices complémentaires 42
TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence
Plus en détailTABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.
STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,
Plus en détailThéorie des sondages : cours 5
Théorie des sondages : cours 5 Camelia Goga IMB, Université de Bourgogne e-mail : camelia.goga@u-bourgogne.fr Master Besançon-2010 Chapitre 5 : Techniques de redressement 1. poststratification 2. l estimateur
Plus en détailCNAM 2002-2003 2léments de cours Bonus-malus et Crédibilité
1 CNAM 2002-2003 2léments de cours Bonus-malus et Crédibilité Une situation fréquente en pratique est de disposer non pas d un résultat mais de plusieurs. Le cas se présente en assurance, par exemple :
Plus en détailLes conducteurs automobiles évaluent-ils correctement leur risque de commettre un accident?
Les conducteurs automobiles évaluent-ils correctement leur risque de commettre un accident? Nathalie LEPINE GREMAQ, Université de Toulouse1, 31042 Toulouse, France GRAPE, Université Montesquieu-Bordeaux
Plus en détailAnalyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés
Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent
Plus en détailEVALUATION DE LA QUALITE DES SONDAGES EN LIGNE : CAS D UN SONDAGE D OPINION AU BURKINA FASO
EVALUATION DE LA QUALITE DES SONDAGES EN LIGNE : CAS D UN SONDAGE D OPINION AU BURKINA FASO Auteur Baguinébié Bazongo 1 Ingénieur Statisticien Economiste Chef de l Unité de recherche à l Institut national
Plus en détailCoup de Projecteur sur les Réseaux de Neurones
Coup de Projecteur sur les Réseaux de Neurones Les réseaux de neurones peuvent être utilisés pour des problèmes de prévision ou de classification. La représentation la plus populaire est le réseau multicouche
Plus en détailEvolution de la fréquence des sinistres 2002-2011 en assurance RC automobile
Evolution de la fréquence des sinistres 2002-2011 en assurance RC automobile Contenu 1. Nombre de sinistres en RC tourisme et affaires... 2 Fréquence des sinistres en RC tourisme et affaires... 2 Fréquence
Plus en détailIntroduction à l approche bootstrap
Introduction à l approche bootstrap Irène Buvat U494 INSERM buvat@imedjussieufr 25 septembre 2000 Introduction à l approche bootstrap - Irène Buvat - 21/9/00-1 Plan du cours Qu est-ce que le bootstrap?
Plus en détailLa segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM
La segmentation à l aide de EG-SAS A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM Définition de la segmentation - Au lieu de considérer une population dans son ensemble,
Plus en détailChristophe CANDILLIER Cours de DataMining mars 2004 Page 1
Christophe CANDILLIER Cours de DataMining mars 2004 age 1 1. Introduction 2. rocessus du DataMining 3. Analyse des données en DataMining 4. Analyse en Ligne OLA 5. Logiciels 6. Bibliographie Christophe
Plus en détailExercices supplémentaires sur l introduction générale à la notion de probabilité 2009-2010
Exercices supplémentaires sur l introduction générale à la notion de probabilité 2009-2010 Exercices fortement conseillés : 6, 10 et 14 1) Un groupe d étudiants est formé de 20 étudiants de première année
Plus en détailLe Data Mining au service du Scoring ou notation statistique des emprunteurs!
France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative
Plus en détailÉvaluations aléatoires : Comment tirer au sort?
Évaluations aléatoires : Comment tirer au sort? William Parienté Université Catholique de Louvain J-PAL Europe povertyactionlab.org Plan de la semaine 1. Pourquoi évaluer? 2. Comment mesurer l impact?
Plus en détailSTA108 Enquêtes et sondages. Sondages àplusieurs degrés et par grappes
STA108 Enquêtes et sondages Sondages àplusieurs degrés et par grappes Philippe Périé, novembre 2011 Sondages àplusieurs degrés et par grappes Introduction Sondages à plusieurs degrés Tirage des unités
Plus en détailIntroduction au datamining
Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des
Plus en détailSAS ENTERPRISE MINER POUR L'ACTUAIRE
SAS ENTERPRISE MINER POUR L'ACTUAIRE Conférence de l Association des Actuaires I.A.R.D. 07 JUIN 2013 Sylvain Tremblay Spécialiste en formation statistique SAS Canada AGENDA Survol d Enterprise Miner de
Plus en détailExploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction.
Exploitation et analyse des données appliquées aux techniques d enquête par sondage. Introduction. Etudes et traitements statistiques des données : le cas illustratif de la démarche par sondage INTRODUCTION
Plus en détaila) La technique de l analyse discriminante linéaire : une brève présentation. 3 étapes de la méthode doivent être distinguées :
a) La technique de l analyse discriminante linéaire : une brève présentation. Nous nous limiterons ici à l'analyse discriminante linéaire et à deux groupes : - linéaire, la variante utilisée par ALTMAN
Plus en détailCALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING
CALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING SÉLECTION DES RISQUES PRÉVISION DES DÉFAUTS SUIVI ET CONTRÔLE Pierre-Louis GONZALEZ Différents types de
Plus en détailEvolution de la fréquence des sinistres 2003-2012 en assurance RC automobile
Evolution de la fréquence des sinistres 2003-2012 en assurance RC automobile Contenu 1. Nombre de sinistres en RC tourisme et affaires... 2 Fréquence des sinistres en RC tourisme et affaires... 2 Fréquence
Plus en détailLa survie nette actuelle à long terme Qualités de sept méthodes d estimation
La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg
Plus en détailMémo technique MODELES GENERIQUES DE SCORE DE CREDIT ou Le scoring de crédit «prêt à l emploi»
Mémo technique MODELES GENERIQUES DE SCORE DE CREDIT ou Le scoring de crédit «prêt à l emploi» 46, rue de la Tour 75116 Paris tél. (33) 01 73 00 55 00 fax (33) 01 73 00 55 01 www.softcomputing.com Sommaire
Plus en détailL ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ
L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et
Plus en détailIncertitude et variabilité : la nécessité de les intégrer dans les modèles
Incertitude et variabilité : la nécessité de les intégrer dans les modèles M. L. Delignette-Muller Laboratoire de Biométrie et Biologie Evolutive VetAgro Sup - Université de Lyon - CNRS UMR 5558 24 novembre
Plus en détailValeur verte des logements d après les bases Notariales BIEN et PERVAL Synthèse
Valeur verte des logements d après les bases Notariales BIEN et PERVAL Synthèse La valeur verte correspond à l augmentation de valeur 1 engendrée par la meilleure performance énergétique et environnementale
Plus en détailSTATISTIQUES. UE Modélisation pour la biologie
STATISTIQUES UE Modélisation pour la biologie 2011 Cadre Général n individus: 1, 2,..., n Y variable à expliquer : Y = (y 1, y 2,..., y n ), y i R Modèle: Y = Xθ + ε X matrice du plan d expériences θ paramètres
Plus en détailINF6304 Interfaces Intelligentes
INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie
Plus en détailDéroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI
1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage
Plus en détailÉTUDE SUR L EFFICACITÉ DES PNEUS D HIVER EN ÉTÉ RÉALISÉE PAR CAA-QUÉBEC
ÉTUDE SUR L EFFICACITÉ DES PNEUS D HIVER EN ÉTÉ RÉALISÉE PAR CAA-QUÉBEC SEPTEMBRE 2008 1. Introduction L étude avait pour but de comparer avec le plus de précision possible l efficacité des pneus d hiver
Plus en détailENSEIGNEMENT ET MONDE PROFESSIONNEL. Illustration d un lien fort au travers d un cours de scoring. Jean-Philippe KIENNER 7 novembre 2013
ENSEIGNEMENT ET MONDE PROFESSIONNEL Illustration d un lien fort au travers d un cours de scoring Jean-Philippe KIENNER 7 novembre 2013 CONTEXTE Une bonne insertion professionnelle des étudiants passe par
Plus en détailOptimisation des ressources des produits automobile première
EURIA EURo Optimisation produits automobile première Pauline PERROT promotion 2011 EURIA EURo 1 ère partie : contexte MMA (FFSA) MAAF (GEMA) SGAM : COVEA (AFA) GMF (GEMA) MMA : Plus 3 millions clients
Plus en détailWhy Software Projects Escalate: The Importance of Project Management Constructs
Why Software Projects Escalate: The Importance of Project Management Constructs Why Software Projects Escalate: The Importance of Project Management Constructs 1. Introduction 2. Concepts de la gestion
Plus en détail3 ème 2 DÉVELOPPEMENT FACTORISATIONS ET IDENTITÉS REMARQUABLES 1/5 1 - Développements
3 ème 2 DÉVELOPPEMENT FACTORISATIONS ET IDENTITÉS REMARQUABLES 1/5 1 - Développements Développer une expression consiste à transformer un produit en une somme Qu est-ce qu une somme? Qu est-ce qu un produit?
Plus en détailStéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE. 24/12/2006 Stéphane Tufféry - Data Mining - http://data.mining.free.fr
1 Stéphane Tufféry DATA MINING & STATISTIQUE DÉCISIONNELLE 2 Plan du cours Qu est-ce que le data mining? A quoi sert le data mining? Les 2 grandes familles de techniques Le déroulement d un projet de data
Plus en détailL'intelligence d'affaires: la statistique dans nos vies de consommateurs
L'intelligence d'affaires: la statistique dans nos vies de consommateurs Jean-François Plante, HEC Montréal Marc Fredette, HEC Montréal Congrès de l ACFAS, Université Laval, 6 mai 2013 Intelligence d affaires
Plus en détailExamen 2015. Etude de marché
Berufsprüfung für Marketingfachleute mit eidg. Fachausweis Examen prof. pour spécialistes en marketing avec brevet fédéral Esame per Specialisti in marketing con attestato professionale federale Examen
Plus en détailSDLS08 - Modes propres d'une plaque carrée calculés sur base réduite
Titre : SDLS08 - Modes propres d'une plaque carrée calculé[...] Date : 03/08/2011 Page : 1/6 SDLS08 - Modes propres d'une plaque carrée calculés sur base réduite Résumé : Ce cas test a pour objectif de
Plus en détailFORMULAIRE DE STATISTIQUES
FORMULAIRE DE STATISTIQUES I. STATISTIQUES DESCRIPTIVES Moyenne arithmétique Remarque: population: m xμ; échantillon: Mx 1 Somme des carrés des écarts "# FR MOYENNE(série) MOYENNE(série) NL GEMIDDELDE(série)
Plus en détailLes simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R
Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Yves Aragon, David Haziza & Anne Ruiz-Gazen GREMAQ, UMR CNRS 5604, Université des Sciences
Plus en détailBiostatistiques Biologie- Vétérinaire FUNDP Eric Depiereux, Benoît DeHertogh, Grégoire Vincke
www.fundp.ac.be/biostats Module 140 140 ANOVA A UN CRITERE DE CLASSIFICATION FIXE...2 140.1 UTILITE...2 140.2 COMPARAISON DE VARIANCES...2 140.2.1 Calcul de la variance...2 140.2.2 Distributions de référence...3
Plus en détailLE ROLE DES INCITATIONS MONETAIRES DANS LA DEMANDE DE SOINS : UNE EVALUATION EMPIRIQUE.
LE ROLE DES INCITATIONS MONETAIRES DANS LA DEMANDE DE SOINS : UNE EVALUATION EMPIRIQUE. Synthèse des travaux réalisés 1. Problématique La question D7 du plan d exécution du Programme National de Recherches
Plus en détailTD 3 : suites réelles : application économique et nancière
Mathématiques Appliquées Cours-TD : K. Abdi, M. Huaulmé, B. de Loynes et S. Pommier Université de Rennes 1 - L1 AES - 009-010 TD 3 : suites réelles : application économique et nancière Exercice 1 Calculer
Plus en détailLa classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
Plus en détailDocument d orientation sur les allégations issues d essais de non-infériorité
Document d orientation sur les allégations issues d essais de non-infériorité Février 2013 1 Liste de contrôle des essais de non-infériorité N o Liste de contrôle (les clients peuvent se servir de cette
Plus en détailBaromètre Image des Assureurs
Contacts : Alain RENAUDIN / Frédéric ALBERT Shanghai Paris Toronto Buenos Aires 2005-5 édition www.ifop.com Baromètre Image des Assureurs Introduction 1 Les objectifs et la méthodologie Cette 5ème édition
Plus en détailSuivi statistique des scores - Document descriptif des solutions retenues
Rapport de mission Suivi statistique des scores - Document descriptif des solutions retenues Mathurin Aché Statisticien cellule Scores TGPF/OPF/DPF/DBIGP/SCORES Suivi statistique des scores Titre Résumé
Plus en détailObservation statistique
2. APERÇU DES RÉSULTATS DU RENDEMENT Observation statistique s. Les résultats présentés dans ce rapport sont fondés sur des échantillons. Des échantillons distincts ont été sélectionnés pour chaque instance
Plus en détailLE RÔLE DE LA STATISTIQUE DANS UN PROCESSUS DE PRISE DE DÉCISION
LE RÔLE DE LA STATISTIQUE DANS UN PROCESSUS DE PRISE DE DÉCISION Sylvie Gervais Service des enseignements généraux École de technologie supérieure (sylvie.gervais@etsmtl.ca) Le laboratoire des condensateurs
Plus en détailMortalité observée et mortalité attendue au cours de la vague de chaleur de juillet 2006 en France métropolitaine
Mortalité observée et mortalité attendue au cours de la vague de chaleur de uillet en France métropolitaine FOUILLET A 1, REY G 1, JOUGLA E, HÉMON D 1 1 Inserm, U75, Villeuif, France. Inserm CépiDc, IFR9,
Plus en détailLe risque Idiosyncrasique
Le risque Idiosyncrasique -Pierre CADESTIN -Magali DRIGHES -Raphael MINATO -Mathieu SELLES 1 Introduction Risque idiosyncrasique : risque non pris en compte dans le risque de marché (indépendant des phénomènes
Plus en détailLes algorithmes de fouille de données
Février 2005 Les algorithmes de fouille de données DATAMINING Techniques appliquées à la vente, aux services client, interdictions. Cycle C Informatique Remerciements Je remercie les personnes, les universités
Plus en détailStatistiques Descriptives à une dimension
I. Introduction et Définitions 1. Introduction La statistique est une science qui a pour objectif de recueillir et de traiter les informations, souvent en très grand nombre. Elle regroupe l ensemble des
Plus en détailBaromètre: les Français et la confiance numérique Vague 2
Baromètre: les Français et la confiance numérique Vague 2 Juin 2014 Contact - BVA Opinion Erwan LESTROHAN, directeur d études erwan.lestrohan@bva.fr - 01 71 16 90 9 Victor CHAPUIS, chargé d études Victor.chapuis@bva.fr
Plus en détailEn 2014, comment mener à bien une enquête aléatoire en population générale par téléphone?
En 2014, comment mener à bien une enquête aléatoire en population générale par téléphone? Prémila Choolun 1, François Beck 2, Christophe David 1, Valérie Blineau 1, Romain Guignard 3, Arnaud Gautier 3,
Plus en détailMémoire d Actuariat Tarification de la branche d assurance des accidents du travail Aymeric Souleau aymeric.souleau@axa.com 3 Septembre 2010 Plan 1 Introduction Les accidents du travail L assurance des
Plus en détailTableau 1 : Structure du tableau des données individuelles. INDIV B i1 1 i2 2 i3 2 i4 1 i5 2 i6 2 i7 1 i8 1
UN GROUPE D INDIVIDUS Un groupe d individus décrit par une variable qualitative binaire DÉCRIT PAR UNE VARIABLE QUALITATIVE BINAIRE ANALYSER UN SOUS-GROUPE COMPARER UN SOUS-GROUPE À UNE RÉFÉRENCE Mots-clés
Plus en détailINITIATION AUX METHODES DE SONDAGE
Annie FOURRIER-REGLAT Marthe-Aline JUTAND avec la participation d Anne-Marie DUSSAIX INITIATION AUX METHODES DE SONDAGE APPLICATION A LA PHARMACO-EPIDEMIOLOGIE ARME-Pharmacovigilance Editions - Bordeaux
Plus en détailÉtude de cas Assurance (d après une étude de Philippe Périé, CISIA)
Étude de cas Assurance (d après une étude de Philippe Périé, CISIA) I.1.Les données L échantillon est constitué de 1106 assurés Belges observés en 1992 et répartis en 2 groupes. - les assurés qui n ont
Plus en détailReprésentation des Nombres
Chapitre 5 Représentation des Nombres 5. Representation des entiers 5.. Principe des représentations en base b Base L entier écrit 344 correspond a 3 mille + 4 cent + dix + 4. Plus généralement a n a n...
Plus en détailLa place de SAS dans l'informatique décisionnelle
La place de SAS dans l'informatique décisionnelle Olivier Decourt ABS Technologies - Educasoft Formations La place de SAS dans l'informatique décisionnelle! L'historique de SAS! La mécanique! La carrosserie
Plus en détailManipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner
Le cas Orion Star Manipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner Le cas Orion Star... 1 Manipulation de données avec SAS Enterprise Guide et modélisation
Plus en détailData Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.
des des Data Mining Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne 2012-2013 1/65 des des 1 2 des des 3 4 Post-traitement 5 représentation : 6 2/65 des des Définition générale Le
Plus en détailCCAS DE PLEURTUIT LOT N 3
CCAS DE PLEURTUIT LOT N 3 ASSURANCE "AUTOMOBILE ET RISQUES ANNEXES" DOSSIER DE PROCEDURE ADAPTEE Le présent dossier comporte : 1/ Fiche de demande de renseignements... 1 page 2/ Acte d'engagement... 10
Plus en détailDirection des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels
Etab=MK3, Timbre=G430, TimbreDansAdresse=Vrai, Version=W2000/Charte7, VersionTravail=W2000/Charte7 Direction des Études et Synthèses Économiques Département des Comptes Nationaux Division des Comptes Trimestriels
Plus en détailBaccalauréat ES Pondichéry 7 avril 2014 Corrigé
Baccalauréat ES Pondichéry 7 avril 204 Corrigé EXERCICE 4 points Commun à tous les candidats. Proposition fausse. La tangente T, passant par les points A et B d abscisses distinctes, a pour coefficient
Plus en détailFiche qualité relative à l enquête Santé et Itinéraire Professionnel 2010 (SIP) Carte d identité de l enquête
Fiche qualité relative à Santé et Itinéraire Professionnel 2010 (SIP) Nom Années de Périodicité Panel (suivi d échantillon) Services concepteurs Service réalisant Sujets principaux traités dans Carte d
Plus en détailAnalyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57
Analyse de la vidéo Chapitre 4.1 - La modélisation pour le suivi d objet 10 mars 2015 Chapitre 4.1 - La modélisation d objet 1 / 57 La représentation d objets Plan de la présentation 1 La représentation
Plus en détail$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU
$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU Fabien FIGUERES fabien.figueres@mpsa.com 0RWVFOpV : Krigeage, plans d expériences space-filling, points de validations, calibration moteur. 5pVXPp Dans le
Plus en détailLa nouvelle planification de l échantillonnage
La nouvelle planification de l échantillonnage Pierre-Arnaud Pendoli Division Sondages Plan de la présentation Rappel sur le Recensement de la population (RP) en continu Description de la base de sondage
Plus en détailMéthodes d apprentissage statistique «Machine Learning»
Méthodes d apprentissage statistique «Machine Learning» Fabrice TAILLIEU, Sébastien DELUCINGE, Rémi BELLINA Le marché de l assurance a rarement été marqué par un environnement aussi difficile qu au cours
Plus en détailLe data mining et l assurance Mai 2004. Charles Dugas Président Marianne Lalonde Directrice, développement des affaires
Le data mining et l assurance Mai 2004 Charles Dugas Président Marianne Lalonde Directrice, développement des affaires AGENDA Qu est-ce que le data mining? Le projet et les facteurs de réussite Les technologies
Plus en détail«BONUS MALUS» (exercice exploitant les changements de registre) (D après Académie de Strasbourg)
«BONUS MALUS» (exercice exploitant les changements de registre) (D après Académie de Strasbourg) Le propriétaire d un véhicule automobile est tenu d assurer sa voiture auprès d une compagnie d assurances.
Plus en détailFÉDÉRATION MAROCAINE DES SOCIÉTÉS D'ASSURANCES ET DE RÉASSURANCE FICHIER CENTRAL CRM. MANUEL D UTILISATION Version 1.0
FÉDÉRATION MAROCAINE DES SOCIÉTÉS D'ASSURANCES ET DE RÉASSURANCE FICHIER CENTRAL CRM MANUEL D UTILISATION Version 1.0 Juin 2006 Avant propos Ce manuel décrit les fonctionnalités de la consultation du fichier
Plus en détailBONUS MALUS. Voici, la façon de calculer la prime : Le montant de la prime à acquitter est égale à : P = PB. C où : P
BONUS MALUS Le propriétaire d un véhicule automobile est tenu d assurer sa voiture auprès d une compagnie d assurances. Pour un véhicule donné, le propriétaire versera annuellement une «prime» à sa compagnie.
Plus en détailAméliorer les performances du site par l'utilisation de techniques de Web Mining
Améliorer les performances du site par l'utilisation de techniques de Web Mining CLUB SAS 2001 17/18 octobre 2001 Stéfan Galissie LINCOLN stefan.galissie@lincoln.fr contact@web-datamining.net 2001 Sommaire
Plus en détailASR1 TD7 : Un microprocesseur RISC 16 bits
{Â Ö Ñ º ØÖ Ý,È ØÖ ºÄÓ Ù,Æ ÓÐ ºÎ ÝÖ Ø¹ ÖÚ ÐÐÓÒ} Ò ¹ÐÝÓÒº Ö ØØÔ»»Ô Ö Óº Ò ¹ÐÝÓÒº Ö» Ö Ñ º ØÖ Ý»¼ Ö½» ASR1 TD7 : Un microprocesseur RISC 16 bits 13, 20 et 27 novembre 2006 Présentation générale On choisit
Plus en détailSoit la fonction affine qui, pour représentant le nombre de mois écoulés, renvoie la somme économisée.
ANALYSE 5 points Exercice 1 : Léonie souhaite acheter un lecteur MP3. Le prix affiché (49 ) dépasse largement la somme dont elle dispose. Elle décide donc d économiser régulièrement. Elle a relevé qu elle
Plus en détailItem 169 : Évaluation thérapeutique et niveau de preuve
Item 169 : Évaluation thérapeutique et niveau de preuve COFER, Collège Français des Enseignants en Rhumatologie Date de création du document 2010-2011 Table des matières ENC :...3 SPECIFIQUE :...3 I Différentes
Plus en détailContents. 1 Introduction Objectifs des systèmes bonus-malus Système bonus-malus à classes Système bonus-malus : Principes
Université Claude Bernard Lyon 1 Institut de Science Financière et d Assurances Système Bonus-Malus Introduction & Applications SCILAB Julien Tomas Institut de Science Financière et d Assurances Laboratoire
Plus en détailCOMMUNAUTE DE COMMUNES DE LA REGION DE DOUE-LA-FONTAINE LOT N 3
COMMUNAUTE DE COMMUNES DE LA REGION DE DOUE-LA-FONTAINE LOT N 3 ASSURANCE "AUTOMOBILE ET RISQUES ANNEXES" DOSSIER DE PROCEDURE ADAPTEE Le présent dossier comporte : 1/ Fiche de demande de renseignements...
Plus en détaildonnées en connaissance et en actions?
1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)
Plus en détailMémoire d actuariat - promotion 2010. complexité et limites du modèle actuariel, le rôle majeur des comportements humains.
Mémoire d actuariat - promotion 2010 La modélisation des avantages au personnel: complexité et limites du modèle actuariel, le rôle majeur des comportements humains. 14 décembre 2010 Stéphane MARQUETTY
Plus en détailPrincipe d un test statistique
Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre
Plus en détailASSURANCES DES VEHICULES PERSONNELS DES AGENTS
ASSURANCES DES VEHICULES PERSONNELS DES AGENTS LE PROGRAMME GROUPE AUTOMOBILE FORMULE TOUS RISQUES FORMULE AU TIERS 1-2012 / Pôle Automobile / - LES VEHICULES D AGENTS ET LEUR INCORPORATION Il existe deux
Plus en détailLes probabilités. Chapitre 18. Tester ses connaissances
Chapitre 18 Les probabilités OBJECTIFS DU CHAPITRE Calculer la probabilité d événements Tester ses connaissances 1. Expériences aléatoires Voici trois expériences : - Expérience (1) : on lance une pièce
Plus en détailBaccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé
Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé A. P. M. E. P. Exercice 1 5 points 1. Réponse d. : 1 e Le coefficient directeur de la tangente est négatif et n est manifestement pas 2e
Plus en détailCONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)
CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un
Plus en détailOFFRE DE SERVICE. Référence : GA/NT/P.180613593
Etudes & Contrôles thermiques 38, avenue du Midi - 91760 ITTEVILLE Tél. : 01 69 90 86 10 - Fax : 01 69 90 91 59 Adresse postale: BP 70017-91610- BALLANCOURT E-mail : bet.ecic@wanadoo.fr - Site : www.bet-ecic.fr
Plus en détailChapitre 18 : Transmettre et stocker de l information
Chapitre 18 : Transmettre et stocker de l information Connaissances et compétences : - Identifier les éléments d une chaîne de transmission d informations. - Recueillir et exploiter des informations concernant
Plus en détailDIOGENE. Un logiciel de Génétique & Amélioration des Plantes
DIOGENE Un logiciel de Génétique & Amélioration des Plantes Utilisateurs Etudiants (DEA, thèse) Chercheurs confirmés (INRA, CIRAD, Universités Laval et Lyon 1) Gestionnaires de programmes d Amélioration,
Plus en détailCar Insurance Survey. L assurance automobile RC chez les jeunes. Statistics Belgium. Rapport final
L assurance automobile RC chez les jeunes Car Insurance Survey Rapport final Statistics Belgium Direction générale Statistique et Information économique 2 0 1 3 Table des matières 1 But et objet de l'étude...
Plus en détailTests statistiques et régressions logistiques sous R, avec prise en compte des plans d échantillonnage complexes
, avec prise en compte des plans d échantillonnage complexes par Joseph LARMARANGE version du 29 mars 2007 Ce cours a été développé pour une formation niveau M2 et Doctorat des étudiants du laboratoire
Plus en détail4. Résultats et discussion
17 4. Résultats et discussion La signification statistique des gains et des pertes bruts annualisés pondérés de superficie forestière et du changement net de superficie forestière a été testée pour les
Plus en détail