SAS ENTERPRISE MINER POUR L'ACTUAIRE

Dimension: px
Commencer à balayer dès la page:

Download "SAS ENTERPRISE MINER POUR L'ACTUAIRE"

Transcription

1 SAS ENTERPRISE MINER POUR L'ACTUAIRE Conférence de l Association des Actuaires I.A.R.D. 07 JUIN 2013 Sylvain Tremblay Spécialiste en formation statistique SAS Canada

2 AGENDA Survol d Enterprise Miner de SAS Enterprise Miner pour les Assurances Modèles linéaires généralisés Modèles à deux étapes Tarification Formation SAS Questions

3 SURVOL D ENTERPRISE MINER

4 SURVOL D ENTERPRISE MINER

5 SURVOL D ENTERPRISE MINER Contient des fonctionnalités qui permettent d'améliorer la performance et de construire des modèles plus simplement et efficacement Échantillon et partition Sélection des variables Imputation et transformation

6 SURVOL D ENTERPRISE MINER Enterprise Miner offre une grande variété d'algorithmes de modélisation prédictive et facilite la comparaison des modèles et le scoring de nouvelles données.

7 SURVOL D ENTERPRISE MINER Données de Training Données de Validation inputs target inputs target Complexité Création d une séquence de modèles avec une complexité croissante....

8 SURVOL D ENTERPRISE MINER Données de Training Données de validation inputs target inputs target Complexité Évaluation de la performance sur les données de Validation...

9 SURVOL D ENTERPRISE MINER Données de Training Données de validation inputs target inputs target Complexité Choisir le modèle le plus simple avec la meilleure performance sur les données de validation Évaluation de la performance...

10 SURVOL D ENTERPRISE MINER Données de Training Données de validation inputs target inputs target Complexité Choisir le modèle le plus simple avec la meilleure performance sur les données de validation Évaluation de la performance...

11 SURVOL D ENTERPRISE MINER Fonctionnalités de Text Mining: Traitement du langage naturel Désambiguïsation lexicale Reconnaissance d'entités nommées Classification et la catégorisation de documents

12 ENTERPRISE MINER POUR LES ASSURANCES : MODÈLES LINÉAIRES GÉNÉRALISÉS

13 MODÈLES LINÉAIRES GÉNÉRALISÉS g ( E ( y )) = β + β x + + β x = X β i 0 1 1i k k i Composante aléatoire: la variable de réponse Y, à laquelle est associée une loi de probabilité La loi de probabilité de la composante aléatoire appartient à la famille exponentielle Composante déterministe: combinaison linéaire Xβ des variables explicatives X1. XK utilisées comme prédicteurs dans le modèle La fonction de lien g() décrit la relation entre la combinaison linéaire des variables X1.XK et l espérance mathématique de la variable de réponse Y 13 Copyright , SAS Institute Inc. All rights reserved.

14 MODÈLES LINÉAIRES GÉNÉRALISÉS Modèle Régression linéaire Régression Logistique Régression Poisson Régression Gamma Variable Dépendante Distribution Moyenne Variance Fonction de lien Continue (gravité des identité réclamations) Normale µ σ 2 µ Dichotomique (propension à la réclamation) Binomiale π π(1- π)/n Comptage (fréquence de réclamation) Poisson λ λ Continuel (sévérité de réclamation ) Gamma µ µ 2 /ν logit log[π/(1-π)] log log(λ) Inverse 1/µ (mais le log est souvent utilisé)

15 MODÈLES LINÉAIRES GÉNÉRALISÉS Le noeud de régression s adapte à la régression logistique ou linéaire dépendant du niveau de la variable cible.

16 MODÈLES LINÉAIRES GÉNÉRALISÉS Le nœud de réseau neuronal s adapte aux modèles linéaires généralisés et peut donner des estimations qui sont identiques à PROC GENMOD en SAS / STAT. L'inverse de la fonction de lien est appliquée à la partie droite de l'équation du modèle et est appelée une fonction d'activation (par exemple lien: log = activation: Exponentielle).

17 MODÈLES LINÉAIRES GÉNÉRALISÉS Le noeud de code SAS avec ses fonctionnalités de macro permet un codage plus simple des procédures SAS/STAT telle que PROC GENMOD.

18 ENTERPRISE MINER POUR LES ASSURANCES : MODÈLES À DEUX ÉTAPES

19 MODÈLES A DEUX ÉTAPES Le noeud TwoStage permet l'estimation de la perte prévue par l adéquation et la combinaison d'un modèle binaire (probabilité de réclamation) et un modèle continu (montant de la réclamation). P é =

20 MODÈLES A DEUX ÉTAPES Les résultats incluent des rapports et des statistiques d adéquation pour chaque modèle

21 ENTERPRISE MINER POUR LES ASSURANCES : TARIFICATION

22 TARIFICATION Différents types de modèles: Fréquence, sévérité, pure premium La distribution Tweedie est utilisée pour modéliser le pure premium

23 TARIFICATION Toutes les variables continues sont regroupées, par le nœud de transformation ou dans le noeud de tarification lui-même Les modèles peuvent être Pure Premium (Tweedie) ou Défini par l utilisateur.

24 TARIFICATION Les modèles définis par l utilisateur peuvent être de la famille exponentielle ou de distribution mixte comme le ZIP et le Tweedie, avec des fonctions de liens.

25 TARIFICATION Les résultats incluent les estimations des paramètres, les statistiques d adéquation et le Relativity Plot. Le Relativity Plot exponentie les estimateurs des paramètres

26 FORMATION SAS

27 FORMATION SAS Advanced Predictive Modeling Using SAS Enterprise Miner Cours publics Formation intra-entreprise Mentorat Cours LiveWeb Cours elearning

28 QUESTIONS? SYLVAIN TREMBLAY SPÉCIALISTE EN FORMATION STATISTIQUE MERCI!

GROUP PROCESSING AVEC ENTERPRISE MINER

GROUP PROCESSING AVEC ENTERPRISE MINER GROUP PROCESSING AVEC ENTERPRISE MINER SENG TANG CONSULTANT ANALYTIQUE SAS CANADA APRIL 2014 CE QUE VOUS ALLEZ APPRENDRE - Fonctionnalité d Enterprise Miner qui permet d itérer sur un processus donné.

Plus en détail

données en connaissance et en actions?

données en connaissance et en actions? 1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)

Plus en détail

Méthodes d apprentissage statistique («Machine Learning»)

Méthodes d apprentissage statistique («Machine Learning») Méthodes d apprentissage statistique («Machine Learning») Journées d Etudes IARD Niort, 21 Mars 2014 Fabrice TAILLIEU Sébastien DELUCINGE Rémi BELLINA 2014 Milliman. All rights reserved Sommaire Introduction

Plus en détail

Marketing quantitatif M2-MASS

Marketing quantitatif M2-MASS Marketing quantitatif M2-MASS Francois.Kauffmann@unicaen.fr UCBN 2 décembre 2012 Francois.Kauffmann@unicaen.fr UCBN Marketing quantitatif M2-MASS 2 décembre 2012 1 / 61 Première partie I Analyse Analyse

Plus en détail

assurance Février 2012

assurance Février 2012 Modèles fréquence coût : Construire un générateur de scénarios Quelles perspectives économiques d évolution en? assurance Version 0.7 Version 1.2 Mars 2014 Février 2012 Frédéric PLANCHET frederic@planchet.net

Plus en détail

TABLE DES MATIERES. C Exercices complémentaires 42

TABLE DES MATIERES. C Exercices complémentaires 42 TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence

Plus en détail

Introduction au modèle linéaire général

Introduction au modèle linéaire général Résumé Introductions au modèle linéaire général Retour au plan du cours Travaux pratiques 1 Introduction L objet de ce chapitre est d introduire le cadre théorique global permettant de regrouper tous les

Plus en détail

Plan. Entreprise Guide ou comment rendre presque séduisantes les procédures statistiques de SAS. Tirer un échantillon d'une table existante (1)

Plan. Entreprise Guide ou comment rendre presque séduisantes les procédures statistiques de SAS. Tirer un échantillon d'une table existante (1) Entreprise Guide ou comment rendre presque séduisantes les procédures statistiques de SAS Présentation au Club des Utilisateurs SAS de Québec 30 octobre 2006 Jean Hardy Services Conseils Hardy Plan Tirer

Plus en détail

Statistique et analyse de données pour l assureur : des outils pour la gestion des risques et le marketing

Statistique et analyse de données pour l assureur : des outils pour la gestion des risques et le marketing Statistique et analyse de données pour l assureur : des outils pour la gestion des risques et le marketing Gilbert Saporta Chaire de Statistique Appliquée, CNAM ActuariaCnam, 31 mai 2012 1 L approche statistique

Plus en détail

Cours IFT6266, Exemple d application: Data-Mining

Cours IFT6266, Exemple d application: Data-Mining Cours IFT6266, Exemple d application: Data-Mining Voici un exemple du processus d application des algorithmes d apprentissage statistique dans un contexte d affaire, qu on appelle aussi data-mining. 1.

Plus en détail

Outils Statistiques du Data Mining

Outils Statistiques du Data Mining Outils Statistiques du Data Mining Pr Roch Giorgi roch.giorgi@univ-amu.fr SESSTIM, Faculté de Médecine, Aix-Marseille Université, Marseille, France http://sesstim-orspaca.org http://optim-sesstim.univ-amu.fr

Plus en détail

Calcul élémentaire des probabilités

Calcul élémentaire des probabilités Myriam Maumy-Bertrand 1 et Thomas Delzant 1 1 IRMA, Université Louis Pasteur Strasbourg, France Licence 1ère Année 16-02-2006 Sommaire La loi de Poisson. Définition. Exemple. 1 La loi de Poisson. 2 3 4

Plus en détail

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #16

ACTUARIAT 1, ACT 2121, AUTOMNE 2013 #16 ACTUARIAT 1, ACT 2121, AUTOMNE 201 #16 ARTHUR CHARPENTIER 1 Dans une petite compagnie d assurance le nombre N de réclamations durant une année suit une loi de Poisson de moyenne λ = 100. On estime que

Plus en détail

Programme détaillé des enseignements

Programme détaillé des enseignements Programme détaillé des enseignements SEMESTRE S1 STATISTIQUES Méthodes d'estimation ponctuelle (méthodes des moments, du maximum de vraisemblances, bayésienne) et par intervalles de confiance. Statistiques

Plus en détail

Séance 8 : Régression Logistique

Séance 8 : Régression Logistique Séance 8 : Régression Logistique Sommaire Proc LOGISTIC : Régression logistique... 2 Exemple commenté : Achat en (t+1) à partir du sexe et du chiffre d affaires de la période précédente. 4 La régression

Plus en détail

Le modèle linéaire généralisé avec R : fonction glm()

Le modèle linéaire généralisé avec R : fonction glm() SEMIN- Le modèle linéaire généralisé avec R : fonction glm() Sébastien BALLESTEROS UMR 7625 Ecologie Evolution Ecole Normale Supérieure 46 rue d'ulm F-75230 Paris Cedex 05 sebastien.ballesteros@biologie.ens.fr

Plus en détail

Grégoire de Lassence. Copyright 2006, SAS Institute Inc. All rights reserved.

Grégoire de Lassence. Copyright 2006, SAS Institute Inc. All rights reserved. Grégoire de Lassence 1 Grégoire de Lassence Responsable Pédagogie et Recherche Département Académique Tel : +33 1 60 62 12 19 gregoire.delassence@fra.sas.com http://www.sas.com/france/academic SAS dans

Plus en détail

Les techniques d exploitation de données (Data Mining)

Les techniques d exploitation de données (Data Mining) Les techniques d exploitation de données (Data Mining) 1 Présenté par : Emer Mestiri, M.sc Finance, Data Scientist Conseiller Gestion de risque de crédit, Mouvement Desjardins Sommaire 2 I. Logiciel SAS

Plus en détail

Régression de Poisson

Régression de Poisson ZHANG Mudong & LI Siheng & HU Chenyang 21 Mars, 2013 Plan Composantes des modèles Estimation Qualité d ajustement et Tests Exemples Conclusion 2/25 Introduction de modèle linéaire généralisé La relation

Plus en détail

Données qualitatives, modèles probit et logit

Données qualitatives, modèles probit et logit Données qualitatives, modèles probit et logit I Un modèle pour données qualitatives Cette section est fortement inspirée du cours de Christophe Hurlin. On est confronté à des données qualitatives en micro-économie

Plus en détail

La régression logistique. Par Sonia NEJI et Anne-Hélène JIGOREL

La régression logistique. Par Sonia NEJI et Anne-Hélène JIGOREL La régression logistique Par Sonia NEJI et Anne-Hélène JIGOREL Introduction La régression logistique s applique au cas où: Y est qualitative à 2 modalités Xk qualitatives ou quantitatives Le plus souvent

Plus en détail

Apprentissage statistique:

Apprentissage statistique: Apprentissage statistique: Arbre de décision binaire et Random Forest 1 Plan 1. Introduction 2. 3. Application à l apprentissage supervisé 4. Forêt Aléatoire (Random Forest) 2 1 Plan 1. Introduction 2.

Plus en détail

Coup de Projecteur sur les Réseaux de Neurones

Coup de Projecteur sur les Réseaux de Neurones Coup de Projecteur sur les Réseaux de Neurones Les réseaux de neurones peuvent être utilisés pour des problèmes de prévision ou de classification. La représentation la plus populaire est le réseau multicouche

Plus en détail

La place de SAS dans l'informatique décisionnelle

La place de SAS dans l'informatique décisionnelle La place de SAS dans l'informatique décisionnelle Olivier Decourt ABS Technologies - Educasoft Formations La place de SAS dans l'informatique décisionnelle! L'historique de SAS! La mécanique! La carrosserie

Plus en détail

La régression sur données de panel

La régression sur données de panel La régression sur données de panel 1 I. Définition Les données utilisées en économétrie sont le plus souvent des séries chronologiques, tel le nombre de naissances enregistrées par an dans le département

Plus en détail

Techniques du Data Mining pour la prédiction de faillite des entreprises et la gestion du risque de crédit

Techniques du Data Mining pour la prédiction de faillite des entreprises et la gestion du risque de crédit Techniques du Data Mining pour la prédiction de faillite des entreprises et la gestion du risque de crédit Adil Belhouari HEC - Montréal - Journées de l Optimisation 2005-09 Mai 2005 PLAN DE LA PRÉSENTATION

Plus en détail

Modélisation aléatoire en fiabilité des logiciels

Modélisation aléatoire en fiabilité des logiciels collection Méthodes stochastiques appliquées dirigée par Nikolaos Limnios et Jacques Janssen La sûreté de fonctionnement des systèmes informatiques est aujourd hui un enjeu économique et sociétal majeur.

Plus en détail

Modélisation aléatoire en fiabilité des logiciels

Modélisation aléatoire en fiabilité des logiciels collection Méthodes stochastiques appliquées dirigée par Nikolaos Limnios et Jacques Janssen La sûreté de fonctionnement des systèmes informatiques est aujourd hui un enjeu économique et sociétal majeur.

Plus en détail

Simulation d un système d assurance automobile

Simulation d un système d assurance automobile Simulation d un système d assurance automobile DESSOUT / PLESEL / DACHI Plan 1 Introduction... 2 Méthodes et outils utilisés... 2.1 Chaines de Markov... 2.2 Méthode de Monte Carlo... 2.3 Méthode de rejet...

Plus en détail

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p. STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,

Plus en détail

Programme des épreuves des concours externes de recrutement des personnels techniques et administratifs de recherche et de formation

Programme des épreuves des concours externes de recrutement des personnels techniques et administratifs de recherche et de formation Programme des épreuves des concours externes de recrutement des personnels E1 RECRUTEMENT DES ASSISTANTS INGENIEURS DE RECHERCHE ET DE FORMATION...2 E1.1 Gestionnaire de base de données...2 E1.2 Développeur

Plus en détail

La régression logistique PLS

La régression logistique PLS La régression logistique PLS Michel Tenenhaus Groupe HEC, 78351 Jouy-en-Josas 1 Introduction La régression PLS permet de relier une ou plusieurs variables de réponse y àun ensemble de variables prédictives

Plus en détail

Mémoire d Actuariat Tarification de la branche d assurance des accidents du travail Aymeric Souleau aymeric.souleau@axa.com 3 Septembre 2010 Plan 1 Introduction Les accidents du travail L assurance des

Plus en détail

1 Modélisation d être mauvais payeur

1 Modélisation d être mauvais payeur 1 Modélisation d être mauvais payeur 1.1 Description Cet exercice est très largement inspiré d un document que M. Grégoire de Lassence de la société SAS m a transmis. Il est intitulé Guide de démarrage

Plus en détail

Table des matières. PREMIÈRE PARTIE Étapes initiales des études marketing 7

Table des matières. PREMIÈRE PARTIE Étapes initiales des études marketing 7 Table des matières Préface Public 1 Structure de l ouvrage 1 Caractéristiques de l ouvrage 3 Contenu 3 Pédagogie 4 Remarques sur l adaptation française 4 Ressources numériques 5 Biographie 6 PREMIÈRE PARTIE

Plus en détail

Master ISI 2010-2011. Data Mining Recherche des sous-ensembles fréquents

Master ISI 2010-2011. Data Mining Recherche des sous-ensembles fréquents Master ISI 2010-2011 Data Mining Recherche des sous-ensembles fréquents Yves Lechevallier INRIA-Rocquencourt E_mail : Yves.Lechevallier@inria.fr 1 Processus Data Mining Phase A : Entrepôt de données Entrepôt

Plus en détail

Comment ne pas construire un score-titanic

Comment ne pas construire un score-titanic Comment ne pas construire un score-titanic Mon mailing Olivier Decourt ABS Technologies / Educasoft Formations 1- Les principes 2- Un premier exemple : les vins de France 3- Mise en œuvre sous SAS 4- Un

Plus en détail

Terminale S - ACP Ex1 : Partie A - Restitution organisée des connaissances Partie B : 1. a. 1. b. 1. c. 2. a. 2. b. Ex2 :

Terminale S - ACP Ex1 : Partie A - Restitution organisée des connaissances Partie B : 1. a. 1. b. 1. c. 2. a. 2. b. Ex2 : Terminale S - ACP Ex1 : Antilles Septembre 2006 Partie A - Restitution organisée des connaissances On suppose connu le résultat suivant : Si est une variable aléatoire qui suit une loi exponentielle de

Plus en détail

Licence Pro Amélioration Végétale

Licence Pro Amélioration Végétale Analyse de données Licence Pro Amélioration Végétale Marc Bailly-Bechet Université Claude Bernard Lyon I France marc.bailly-bechet@univ-lyon1.fr 1 marc.bailly-bechet@univ-lyon1.fr Analyse de données Des

Plus en détail

Le documentd accompagnement des programmes de Mathématiques en classe de première et de terminale,

Le documentd accompagnement des programmes de Mathématiques en classe de première et de terminale, PROGRESSION SPIRALÉE Page 1/10 Le documentd accompagnement des programmes de Mathématiques en classe de première et de terminale, série scientifique et série économique et sociale, précise que : " Les

Plus en détail

Classification par des méthodes de data mining. Yawo Eli Amesefe Guillaume Cernier Christophe Labrousse

Classification par des méthodes de data mining. Yawo Eli Amesefe Guillaume Cernier Christophe Labrousse Classification par des méthodes de data mining Yawo Eli Amesefe Guillaume Cernier Christophe Labrousse Plan: Le processus métier Présentation des 3 méthodes étudiées: Arbres de décision Machines à vecteurs

Plus en détail

Arbres binaires. Hélène Milhem. Institut de Mathématiques de Toulouse, INSA Toulouse, France IUP SID, 2011-2012

Arbres binaires. Hélène Milhem. Institut de Mathématiques de Toulouse, INSA Toulouse, France IUP SID, 2011-2012 Arbres binaires Hélène Milhem Institut de Mathématiques de Toulouse, INSA Toulouse, France IUP SID, 2011-2012 H. Milhem (IMT, INSA Toulouse) Arbres binaires IUP SID 2011-2012 1 / 35 PLAN Introduction Construction

Plus en détail

La régression logistique

La régression logistique La régression logistique Présentation pour le cours SOL6210, Analyse quantitative avancée Claire Durand, 2015 1 Utilisation PQuand la variable dépendante est nominale ou ordinale < Deux types selon la

Plus en détail

Modélisation du risque opérationnel dans le secteur de l assurance

Modélisation du risque opérationnel dans le secteur de l assurance Avril 2011 N 14 Modélisation du risque opérationnel dans le secteur de l assurance Par Julie Gamonet Centre d études actuarielles Lauréate du prix du jeune actuaire 2010 Un texte paraissant dans SCOR Papers

Plus en détail

Choisissez la formation. Qui vous intéresse! SPSS Maghreb 72,Av.des Nations Unies Rabat-Agdal-Maroc. Tél : 037-67.08.66/67 Fax : 037-67.08.

Choisissez la formation. Qui vous intéresse! SPSS Maghreb 72,Av.des Nations Unies Rabat-Agdal-Maroc. Tél : 037-67.08.66/67 Fax : 037-67.08. SPSS Maghreb 72,Av.des Nations Unies Rabat-Agdal-Maroc Tél : 037-67.08.66/67 Fax : 037-67.08.69 Choisissez la formation spssmaroc@maghrebnet.net.ma Qui vous intéresse! Site web : www.spss.com/localoffices/morocco

Plus en détail

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés

Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Analyses de Variance à un ou plusieurs facteurs Régressions Analyse de Covariance Modèles Linéaires Généralisés Professeur Patrice Francour francour@unice.fr Une grande partie des illustrations viennent

Plus en détail

FORMATION SAS. Canada. Utilisez vos données pour de meilleures décisions. Janvier Juin

FORMATION SAS. Canada. Utilisez vos données pour de meilleures décisions. Janvier Juin FORMATION SAS Utilisez vos données pour de meilleures décisions Canada Janvier Juin 2007 Ce Que Nous Offrons FORMATIONS OFFERTES PARTOUT AU CANADA support.sas.com/formation Nos cours de haute qualité comprennent

Plus en détail

Techniques de DM pour la GRC dans les banques Page 11

Techniques de DM pour la GRC dans les banques Page 11 Techniques de DM pour la GRC dans les banques Page 11 II.1 Introduction Les techniques de data mining sont utilisé de façon augmentaté dans le domaine économique. Tels que la prédiction de certains indicateurs

Plus en détail

Analyse de données catégorielles

Analyse de données catégorielles 1 Analyse de données catégorielles Ce cours est librement inspiré du livre de Agresti ([1]), ainsi que du livre [2]. Il reprend par ailleurs des parties et des graphiques issues du cours de Patrick Taffé

Plus en détail

Cahier de textes Page 1 sur 9. Cahier de textes

Cahier de textes Page 1 sur 9. Cahier de textes Cahier de textes Page 1 sur 9 Cahier de textes Jeudi 04/09/2014 9h-12h et 13h30-16h30 : Cours sur la logique : - Conjonction, disjonction, implication, équivalence - Quelques formules. - Quantificateurs

Plus en détail

UN CHANGEMENT DE PARADIGME DANS LA PRÉPARATION DES DONNÉES

UN CHANGEMENT DE PARADIGME DANS LA PRÉPARATION DES DONNÉES UN CHANGEMENT DE PARADIGME DANS LA PRÉPARATION DES DONNÉES L ANALYSE VISUELLE ET LE BIG DATA Bernard Blais Directeur Principal Analytique Haute Performance CONTENU L ANALYSE VISUELLE ET LE BIG DATA Big

Plus en détail

Outils mathématiques pour le datamining. http://www.elseware.fr/univevry

Outils mathématiques pour le datamining. http://www.elseware.fr/univevry Outils mathématiques pour le datamining http://wwwelsewarefr/univevry Géométrie Distance Distance entre parties Matrice de variance/covariance Inertie Minimisation Probabilités Définition Théorème de Bayes

Plus en détail

Probabilités. I- Expérience aléatoire, espace probabilisé : ShotGun. 1- Définitions :

Probabilités. I- Expérience aléatoire, espace probabilisé : ShotGun. 1- Définitions : Probabilités I- Expérience aléatoire, espace probabilisé : 1- Définitions : Ω : Ensemble dont les points w sont les résultats possibles de l expérience Des évènements A parties de Ω appartiennent à A une

Plus en détail

1 comptables Principes de base du modèle Ressource «mécanismes comptables fondamentaux» 2

1 comptables Principes de base du modèle Ressource «mécanismes comptables fondamentaux» 2 Semestre Niveau de connaissance : : connaître, culture générale : savoir appliquer 3 : maîtriser ressources IUT en ligne : se connecter à http://www.iutenligne.net/etudiants_log.php identifiant : qlio0

Plus en détail

UNIVERSITÉ DE MONTRÉAL DÉPARTEMENT DE SOCIOLOGIE ************* Cours de niveau gradué en méthodes quantitatives *************

UNIVERSITÉ DE MONTRÉAL DÉPARTEMENT DE SOCIOLOGIE ************* Cours de niveau gradué en méthodes quantitatives ************* ************* Cours de niveau gradué en méthodes quantitatives ************* SOL 6210 - Analyse quantitative avancée Le séminaire d analyse quantitative avancée se donne en classe une fois par année. Chaque

Plus en détail

Cours 1: lois discrétes classiques en probabilités

Cours 1: lois discrétes classiques en probabilités Cours 1: lois discrétes classiques en probabilités Laboratoire de Mathématiques de Toulouse Université Paul Sabatier-IUT GEA Ponsan Module: Stat inférentielles Définition Quelques exemples loi d une v.a

Plus en détail

Analyse de données longitudinales continues avec applications

Analyse de données longitudinales continues avec applications Université de Liège Département de Mathématique 29 Octobre 2002 Analyse de données longitudinales continues avec applications David MAGIS 1 Programme 1. Introduction 2. Exemples 3. Méthodes simples 4.

Plus en détail

PLAN DE COURS MAT-350 Probabilités et statistiques

PLAN DE COURS MAT-350 Probabilités et statistiques École de technologie supérieure Service des enseignements généraux Local B-2500 (514) 396-8938 Site internet : http://www.etsmtl.ca/departements/enseignements-generaux/accueil PLAN DE COURS MAT-350 Probabilités

Plus en détail

Analyse statistique de données qualitatives et quantitatives en sciences sociales : TP RÉGRESSION LOGISTIQUE (MODÈLES CHAPITRE 1)

Analyse statistique de données qualitatives et quantitatives en sciences sociales : TP RÉGRESSION LOGISTIQUE (MODÈLES CHAPITRE 1) Analyse statistique de données qualitatives et quantitatives en sciences sociales : TP RÉGRESSION LOGISTIQUE (MODÈLES CHAPITRE 1) Modèles de régression logistique à réaliser Une explicative catégorielle

Plus en détail

5255 Av. Decelles, suite 2030 Montréal (Québec) H3T 2B1 T: 514.592.9301 F: 514.340.6850 info@apstat.com www.apstat.com

5255 Av. Decelles, suite 2030 Montréal (Québec) H3T 2B1 T: 514.592.9301 F: 514.340.6850 info@apstat.com www.apstat.com Application des réseaux de neurones au plan de répartition des risques 5255 Av. Decelles, suite 2030 Montréal (Québec) H3T 2B1 T: 514.592.9301 F: 514.340.6850 info@apstat.com www.apstat.com Copyright c

Plus en détail

Génération aléatoire de structures ordonnées

Génération aléatoire de structures ordonnées Génération aléatoire de structures ordonnées Olivier Roussel Équipe APR Laboratoire d Informatique de Paris 6 Université Pierre et Marie Curie ALÉA 2011 7 mars 2011 Olivier Roussel (LIP6) Génération de

Plus en détail

Arbres binaires de décision

Arbres binaires de décision 1 Arbres binaires de décision Résumé Arbres binaires de décision Méthodes de construction d arbres binaires de décision, modélisant une discrimination (classification trees) ou une régression (regression

Plus en détail

MASTER «Sciences de la Vie et de la Santé» Mention «Santé Publique»

MASTER «Sciences de la Vie et de la Santé» Mention «Santé Publique» M1_presentation_generale_4juil05.doc 1/11 MASTER «Sciences de la Vie et de la Santé» Mention «Santé Publique» La mention s articule autour de 6 spécialités : Recherche en éthique : Pr Christian HERVE (herve@necker.fr)

Plus en détail

Économétrie 2 : données qualitatives, probit et logit

Économétrie 2 : données qualitatives, probit et logit URCA Hugo Harari-Kermadec 2008-2009 harari@ecogest.ens-cachan.fr Économétrie 2 : données qualitatives, probit et logit I Un modèle pour données qualitatives Cette section est fortement inspirée du cours

Plus en détail

Lois de probabilité. Anita Burgun

Lois de probabilité. Anita Burgun Lois de probabilité Anita Burgun Problème posé Le problème posé en statistique: On s intéresse à une population On extrait un échantillon On se demande quelle sera la composition de l échantillon (pourcentage

Plus en détail

L ANALYSE DES DONNÉES CLIENTS AU SERVICE DE LA PRÉVISION D ACHAT DE VOYAGES

L ANALYSE DES DONNÉES CLIENTS AU SERVICE DE LA PRÉVISION D ACHAT DE VOYAGES L ANALYSE DES DONNÉES CLIENTS AU SERVICE DE LA PRÉVISION D ACHAT DE VOYAGES SAS 3 DEC 2015 1 sur 9 TRANSAT Un voyagiste international solidement installé au Canada, en France et au Royaume-Uni, qui offre

Plus en détail

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems

Plus en détail

Utilisation des procédures SAS dans l enseignement des sondages

Utilisation des procédures SAS dans l enseignement des sondages Utilisation des procédures SAS dans l enseignement des sondages Yves Aragon Anne Ruiz-Gazen e-mail: aragon@cict.fr, ruiz@cict.fr 1. Introduction Depuis la version 8, SAS [6] propose trois procédures pour

Plus en détail

Processus de comptage, Poisson mélange, fonction de perte exponentielle, système bonus-malus.

Processus de comptage, Poisson mélange, fonction de perte exponentielle, système bonus-malus. JF WALHIN* J PARIS* * Université Catholique de Louvain, Belgique Le Mans Assurances, Belgique RÉSUMÉ Nous proposons une méthodologie générale pour construire un système bonus-malus équilibré basé sur une

Plus en détail

L3 Gestion 2015-2016 LSO

L3 Gestion 2015-2016 LSO L3 Gestion 2015-2016 LSO La L3 gestion Formation généraliste autour des fondamentaux de la gestion Format pédagogique : cours magistraux en amphi + travaux dirigés Poursuite d études : notamment les différents

Plus en détail

1 Imputation par la moyenne

1 Imputation par la moyenne Introduction au data mining L3 MIS - STA 1616-2010 V. Monbet Données manquantes L'objectif de ce TD est de manipuler et de comparer plusieurs méthodes d'imputation de données manquantes. La première partie

Plus en détail

La régression logistique généralisée avec la procédure LOGISTIC

La régression logistique généralisée avec la procédure LOGISTIC La régression logistique généralisée avec la procédure LOGISTIC 1 Sommaire I / Régression logistique généralisée 3 a. Introduction 3 b. Présentation de l exemple à étudier 3 II / Modélisation avec la proc

Plus en détail

TP DE DATA MINING 2 : MODELISATION AVEC SPSS CLEMENTINE

TP DE DATA MINING 2 : MODELISATION AVEC SPSS CLEMENTINE TP DE DATA MINING 2 : MODELISATION AVEC SPSS CLEMENTINE EPF 4/ 5 ème année - Option Ingénierie d Affaires et de Projets - Finance Bertrand LIAUDET TP n 2 de DATA MINING : Modélisation 1 Jeu de données

Plus en détail

L'intelligence d'affaires: la statistique dans nos vies de consommateurs

L'intelligence d'affaires: la statistique dans nos vies de consommateurs L'intelligence d'affaires: la statistique dans nos vies de consommateurs Jean-François Plante, HEC Montréal Marc Fredette, HEC Montréal Congrès de l ACFAS, Université Laval, 6 mai 2013 Intelligence d affaires

Plus en détail

Examen d accès - 1 Octobre 2009

Examen d accès - 1 Octobre 2009 Examen d accès - 1 Octobre 2009 Aucun document autorisé - Calculatrice fournie par le centre d examen Ce examen est un questionnaire à choix multiples constitué de 50 questions. Plusieurs réponses sont

Plus en détail

ECOLE SUPERIEURE DE COMMERCE D ALGER

ECOLE SUPERIEURE DE COMMERCE D ALGER MINISTERE DE L ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE ECOLE SUPERIEURE DE COMMERCE D ALGER PROGRAMME DE LICENCE EN SCIENCES COMMERCIALES ET FINANCIERES OPTION : FINANCE ( applicable à partir

Plus en détail

PROGRAMME DE FORMATION A L UTILISATION DU LOGICIEL R

PROGRAMME DE FORMATION A L UTILISATION DU LOGICIEL R PROGRAMME DE FORMATION A L UTILISATION DU LOGICIEL R Analyses multivariées avec R Vincent RICHARD Unité d épidémiologie Institut Pasteur de DakarRindra Randremanana Unité d'épidémiologie Institut Pasteur

Plus en détail

CHAMPION Matthieu Modèles de Marché en Visual Basic ESILV S04 S6. Sommaire... 1. Introduction... 2

CHAMPION Matthieu Modèles de Marché en Visual Basic ESILV S04 S6. Sommaire... 1. Introduction... 2 Sommaire Sommaire... 1 Introduction... 2 1 Trois différentes techniques de pricing... 3 1.1 Le modèle de Cox Ross Rubinstein... 3 1.2 Le modèle de Black & Scholes... 8 1.3 Méthode de Monte Carlo.... 1

Plus en détail

MATHÉMATIQUES ET SCIENCES HUMAINES

MATHÉMATIQUES ET SCIENCES HUMAINES MATHÉMATIQUES ET SCIENCES HUMAINES B. MARCHADIER Dépendance et indépendance de deux aléas numériques images Mathématiques et sciences humaines, tome 25 (1969), p. 2534.

Plus en détail

Travaux pratiques 7.3.3b Création de zones de recherche directe principales et secondaires

Travaux pratiques 7.3.3b Création de zones de recherche directe principales et secondaires Travaux pratiques 7.3.3b Création de zones de recherche directe principales et secondaires Objectifs Créer des zones de recherche directe principales et secondaires sur les serveurs DNS Windows Contexte

Plus en détail

Loi normale ou loi de Laplace-Gauss

Loi normale ou loi de Laplace-Gauss LivreSansTitre1.book Page 44 Mardi, 22. juin 2010 10:40 10 Loi normale ou loi de Laplace-Gauss I. Définition de la loi normale II. Tables de la loi normale centrée réduite S il y avait une seule loi de

Plus en détail

L essentiel sur les tests statistiques

L essentiel sur les tests statistiques L essentiel sur les tests statistiques 21 septembre 2014 2 Chapitre 1 Tests statistiques Nous considérerons deux exemples au long de ce chapitre. Abondance en C, G : On considère une séquence d ADN et

Plus en détail

CNAM 2002-2003 2léments de cours Bonus-malus et Crédibilité

CNAM 2002-2003 2léments de cours Bonus-malus et Crédibilité 1 CNAM 2002-2003 2léments de cours Bonus-malus et Crédibilité Une situation fréquente en pratique est de disposer non pas d un résultat mais de plusieurs. Le cas se présente en assurance, par exemple :

Plus en détail

MATHÉMATIQUES CYCLE TERMINAL DE LA SÉRIE ÉCONOMIQUE ET SOCIALE ET DE LA SÉRIE LITTERAIRE CLASSE DE PREMIÈRE

MATHÉMATIQUES CYCLE TERMINAL DE LA SÉRIE ÉCONOMIQUE ET SOCIALE ET DE LA SÉRIE LITTERAIRE CLASSE DE PREMIÈRE Annexe MATHÉMATIQUES CYCLE TERMINAL DE LA SÉRIE ÉCONOMIQUE ET SOCIALE ET DE LA SÉRIE LITTERAIRE CLASSE DE PREMIÈRE L enseignement des mathématiques au collège et au lycée a pour but de donner à chaque

Plus en détail

Analyse d un système de freinage récupératif d un véhicule électrique

Analyse d un système de freinage récupératif d un véhicule électrique Analyse d un système de freinage récupératif d un véhicule électrique Par Mohamed Amine Bey, Gabriel Georges, Pascal Jacq, Doha Hadouni, Roxane Duroux, Erwan Scornet, Encadré par Alexis Simonnet 1 Compréhension

Plus en détail

Cours de mathématiques Terminale STMG

Cours de mathématiques Terminale STMG Cours de mathématiques Terminale STMG Chapitre 1 Information chiffrée...3 I Proportions...3 II Taux d'évolution...3 a) Détermination d'un taux d'évolution...3 b) Appliquer un taux d'évolution...4 III Taux

Plus en détail

PROBABILITES ET STATISTIQUE I&II

PROBABILITES ET STATISTIQUE I&II PROBABILITES ET STATISTIQUE I&II TABLE DES MATIERES CHAPITRE I - COMBINATOIRE ELEMENTAIRE I.1. Rappel des notations de la théorie des ensemble I.1.a. Ensembles et sous-ensembles I.1.b. Diagrammes (dits

Plus en détail

Présentation de l épreuve

Présentation de l épreuve MÉTHODO Présentation de l épreuve 1. Programme de l arrêté du 22 décembre 2006 DURÉE DE L ENSEIGNEMENT ÉPREUVE N 11 CONTRÔLE DE GESTION (à titre indicatif) : 210 heures 18 crédits européens 1. Positionnement

Plus en détail

IBM SPSS Direct Marketing

IBM SPSS Direct Marketing IBM SPSS Statistics 19 IBM SPSS Direct Marketing Comprenez vos clients et renforcez vos campagnes marketing Points clés Avec IBM SPSS Direct Marketing, vous pouvez : Comprendre vos clients de manière plus

Plus en détail

ANALYSE BAYESIENNE : QU EST-IL POSSIBLE DE FAIRE AVEC SAS?

ANALYSE BAYESIENNE : QU EST-IL POSSIBLE DE FAIRE AVEC SAS? ANALYSE BAYESIENNE : QU EST-IL POSSIBLE DE FAIRE AVEC SAS? L analyse bayésienne est une partie de la statistique moderne non paramétrique permettant d utiliser les probabilités conditionnelles et ainsi

Plus en détail

Modèles références de régression multinomiale.

Modèles références de régression multinomiale. Modèles références de régression multinomiale. Propriétés et applications en classification supervisée. Jean Peyhardi 1,3, Catherine Trottier 1,2 & Yann Guédon 3 1 UM2, Institut de Mathématiques et Modélisation

Plus en détail

Modélisation des coûts d assurance résultant de catastrophes naturelles

Modélisation des coûts d assurance résultant de catastrophes naturelles Modélisation des coûts d assurance résultant de catastrophes naturelles par Mathieu Boudreault Étudiant à la maîtrise en mathématiques (concentration actuariat) Université Laval (Québec) Canada Association

Plus en détail

Chapitre IV : Couples de variables aléatoires discrètes

Chapitre IV : Couples de variables aléatoires discrètes UNIVERSITÉ DE CERG Année 0-03 UFR Économie & Gestion Licence d Économie et Gestion MATH0 : Probabilités Chapitre IV : Couples de variables aléatoires discrètes Généralités Définition Soit (Ω, P(Ω), P)

Plus en détail

Reconnaissance des formes : Classement d ensembles d objets

Reconnaissance des formes : Classement d ensembles d objets Reconnaissance des formes : Classement d ensembles d objets Données Méthodes Extraction de connaissances Applications Expertise Apprentissage Bernard FERTIL Directeur de Recherche CNRS Équipe LXAO, UMR

Plus en détail

Le regroupement de valeurs continues, ARRONDIR... Notion de discrétisation : groupes ou intervalles de valeurs. Exemple : Glycémie normale :

Le regroupement de valeurs continues, ARRONDIR... Notion de discrétisation : groupes ou intervalles de valeurs. Exemple : Glycémie normale : Variables : samedi 14 novembre 2009 12:54 1. Quelques Exemples : C'est une caractéristique ou un facteur susceptible de prendre des valeurs différentes selon les individus. Exemples : o Couleur des cheveux

Plus en détail

Utilisations des mathématiques à des fins opérationnelles

Utilisations des mathématiques à des fins opérationnelles Utilisations des mathématiques à des fins opérationnelles Michael Vandenbossche mvn@softcomputing.com Soft Computing 165 avenue de Bretagne 59000 Lille 1. Présentation 2. Indicateurs statistiques de base

Plus en détail

Pour rajouter, par exemple, un intervalle de confiance à la régression sur le graphe :

Pour rajouter, par exemple, un intervalle de confiance à la régression sur le graphe : Introduction au Modèle Linéaire Généralisé (Generalized Linear Model ; GLM) Eric Wajnberg (wajnberg@sophia.inra.fr) UE7 Université de Nice-Sophia-Antipolis Octobre 2011 Rappel 1 la régression linéaire

Plus en détail

Guide d exploration de base de données de IBM SPSS Modeler 15

Guide d exploration de base de données de IBM SPSS Modeler 15 Guide d exploration de base de données de IBM SPSS Modeler 15 Remarque : Avant d utiliser ces informations et le produit qu elles concernent, lisez les informations générales sous Remarques sur p.. Cette

Plus en détail

Manipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner

Manipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner Le cas Orion Star Manipulation de données avec SAS Enterprise Guide et modélisation prédictive avec SAS Enterprise Miner Le cas Orion Star... 1 Manipulation de données avec SAS Enterprise Guide et modélisation

Plus en détail

GUIDE DU DATA MINER. Scoring - Modélisation. Data Management, Data Mining, Text Mining

GUIDE DU DATA MINER. Scoring - Modélisation. Data Management, Data Mining, Text Mining GUIDE DU DATA MINER Scoring - Modélisation Data Management, Data Mining, Text Mining 1 Guide du Data Miner Scoring - Modélisation Le logiciel décrit dans le manuel est diffusé dans le cadre d un accord

Plus en détail