LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

Dimension: px
Commencer à balayer dès la page:

Download "LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»"

Transcription

1 LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers utilisent l analyse statistique pour prédire si un emprunteur sera un bon ou un mauvais payeur et prendre ensuite la décision appropriée : acceptation sans condition, prise de garantie, refus. La modélisation et la décision se fondent sur l observation du passé : on connaît pour un certain nombre de prêts attribués la qualité payeur qui est donc une variable qualitative Y à deux modalités («bon» ou «mauvais») ainsi que les données recueillies lors du dépôt du dossier de prêt : ce sont les variables X (X,, X p ). Typiquement pour des particuliers on trouvera l age, la profession, le statut matrimonial, le fait d'être ou non propriétaire, donc majoritairement des variables qualitatives, alors que pour des entreprises on aura plutôt des variables numériques comme des ratios issus de la comptabilité. Formellement il s agit de trouver une fonction f(x,, X p ) permettant de prédire Y. Dans ce qui suit nous décrirons les diverses étapes et les problèmes qui se posent depuis la collecte des données jusqu à la mise en œuvre en donnant à chaque fois des indications sur les méthodologies à utiliser. I. La collecte de l information Le premier travail consiste à constituer un fichier qui contient des informations complètes sur des dossiers de prêts. Il se présentera sous la forme d un tableau rectangulaire individusvariables où les n individus sont partagés en deux groupes d effectifs n et n 2 : les bons et les mauvais. Ce travail essentiel est maintenant facilité par le stockage informatique, mais cela n a pas toujours été le cas : les variables du dossier de demande n étaient pas forcément saisies car elles n étaient pas toutes jugées utiles pour la gestion du prêt. Il fallait alors retrouver les dossiers papiers. Les n individus constituent en fait un échantillon de l ensemble des N données disponibles : nous verrons plus loin qu il est indispensable de garder de côté un certain nombre de dossiers afin de valider les résultats obtenus. Il faut donc prélever aléatoirement n individus parmi les N : comme il faut s assurer d avoir un nombre suffisant et non aléatoire (ce qui introduirait une source de variabilité supplémentaire, donc une moindre précision) d observations dans chacun des deux groupes, on procède à un sondage stratifié avec tirage séparé des n et n 2 individus. Deux questions se posent alors : quel effectif global et quelle répartition de n et n 2. Une idée naturelle consisterait à prélever n et n 2 en respectant les proportions de bons et mauvais dossiers, d autant plus que l on sait que le sondage stratifié à répartition proportionnelle est toujours meilleur que l échantillonnage simple sans stratification. Cette méthode est cependant à déconseiller ici car les deux groupes ont des proportions très différentes : le groupe à risque (les mauvais payeurs) qu il faut détecter est très minoritaire (mettons 0%) et serait mal représenté. On a pu démontrer qu une répartition équilibrée n = n 2 est bien meilleure, sinon optimale sous des hypothèses assez générales. Les vraies proportions p et p 2 servent ultérieurement pour les calculs de probabilités a posteriori. Quant au nombre total n, il est typiquement de quelques milliers.

2 Un problème plus complexe est celui du biais de sélection : en fait les dossiers dont on connaît l issue (bons ou mauvais) résultent d un choix effectué en général par des analystes de crédit ; tous les dossiers de prêt n étaient évidemment pas acceptés et ceux qui l ont été ne constituent pas un échantillon représentatif de toutes les demandes. Même si la méthode antérieure de sélection n était pas scientifique, il est clair que les dossiers acceptés n ont pas les mêmes caractéristiques que les dossiers refusés. Or pour construire une règle de décision valable pour tous les nouveaux dossiers, il aurait fallu savoir ce que seraient devenus les dossiers refusés si on les avait acceptés Il faut alors recourir à des techniques assez élaborées (estimation en deux phases, modèle Tobit). Sans entrer dans les détails, disons seulement que l on modélise également le processus de sélection. Le problème du biais de sélection n intervient pas dans d autres domaines où des techniques similaires de scoring sont utilisées comme l assurance automobile (pour la détection des conducteurs à risque) ou la sélection d adresses pour optimiser l envoi de propositions commerciales (dans ce dernier cas on effectue un scoring à partir des résultats d un premier courrier ; les «bons «étant les répondants, les «mauvais» les non-répondants). II Les analyses préliminaires Le fichier brut une fois constitué doit d abord être «nettoyé» pour éliminer erreurs et incohérences. Il comporte alors en général un trop grand nombre de variables. Une exploration des liaisons entre chaque variable X et le critère à prédire Y permet en général d éliminer les variables non pertinentes. On utilise alors des outils classiques : test du khideux de liaison entre variables qualitatives, comparaison des % de bons et de mauvais par catégorie de chaque variable X. Dans le même temps on procède à des recodages des variables : regroupement de valeurs en classes pour les variables continues (on s aide d histogrammes), regroupement de classes pour obtenir la meilleure séparation sur Y. On crée également de nouvelles variables par combinaison de 2 ou plusieurs variables. Par exemple si on s aperçoit que l ancienneté dans l emploi joue différemment selon la profession, sur la probabilité de bon remboursement, on créera une variable croisant les modalités de ces deux variables (cf. exemple plus loin). Il est couramment admis que toutes ces analyses représentent près de 80% du temps de ce genre d études. III La modélisation Les techniques de «scoring» qui sont les plus utilisées dans le secteur bancaire utilisent des méthodes linéaires pour leur simplicité et leur grande robustesse. Il existe bien d autres méthodes non-linéaires ou non-parametriques comme les arbres de décision, les réseaux neuronaux etc. dont l usage se répand (cf. références) mais elles sortent de ce bref exposé. Un score est une note de risque que l on calcule comme combinaison linéaire des variables explicatives p S = a X. Les coefficients a i étant optimisés pour la prédiction de Y. i= i i Pour obtenir le vecteur a des coefficients des a i, il existe diverses techniques d estimation dont les deux principales sont la fonction linéaire discriminante de Fisher et le modèle logit (encore appelé régression logistique). 2

3 III. La fonction linéaire discriminante de Fisher. C est la plus ancienne (elle remonte à 936) : c est la combinaison optimale qui sépare le mieux les moyennes du score dans les deux groupes. Plus précisément si s et s 2 sont les 2 ( s s2) scores moyens sur les deux groupes de n et n 2 individus, on maximise où V() s V(s) est la moyenne pondérée des variances du score dans chacun des 2 groupes. On montre que a est proportionnel à W - (g -g 2 ) où W est la moyenne pondérée des matrices de variance-covariance des variables explicatives dans chaque groupe et les g les vecteurs des moyennes des variables de chaque groupe. C est une méthode de moindres carrés. III.2 La régression logistique ou modèle logit. On exprime la probabilité a posteriori d appartenance à un des groupes selon : exp( ax i i) exp( S) i= PG ( / X) = = p + exp( S) + exp( ax) et on estime alors les a i par la méthode du maximum de vraisemblance. X désigne ici le vecteur dont les composantes sont les X i pour i= à p. Nous avons employé le terme de probabilité a posteriori qui renvoie à l usage de la formule de Bayes. En effet si on connaît les probabilités a priori d appartenance aux deux groupes p et p 2 =- p, qui sont en fait les proportions réelles des deux groupes, la probabilité d appartenir au groupe connaissant les informations fournies par le dossier, c est à dire les X, est donnée par : pf ( x) PG ( / X= x) = où f k est la densité de probabilité des X dans le groupe k. pf( x) + pf( x) 2 2 Pour de nombreux modèles probabilistes (gaussiens, multinomial etc.) cette exp( S) probabilité a posteriori se met sous la forme logistique précédente : PG ( / X) = + exp( S) En particulier si le vecteur aléatoire des X suit une loi normale de même matrice de variancecovariance dans les deux groupes, la règle qui consiste à classer une observation x dans le groupe qui a la plus forte probabilité a posteriori est équivalente à la règle qui consiste à classer une observation dans un groupe selon que son score est inférieur ou supérieur à un certain seuil. Les deux méthodes.(fisher et logit) ne conduisent pas aux mêmes estimations des coefficients, mais celles-ci sont en général assez proches. Le choix entre les deux ne doit pas être une question d école : moindres carrés contre maximum de vraisemblance, mais plutôt se faire sur leur capacité prédictive, c est à dire sur de nouvelles observations. La règle «naïve» de Bayes qui consiste à prédire le groupe le plus probable, donc ici à choisir le groupe qui a une probabilité a posteriori supérieure à 0.5, n est en général pas adaptée à la prédiction d un groupe rare. On cherche plutôt à détecter un maximum d individus à risque, et on choisira le seuil de décision en conséquence (voir plus loin). p i= i i 3

4 III.3 Cas de prédicteurs qualitatifs. Le cas où les variables explicatives X i sont qualitatives nécessite un traitement particulier. En effet comment faire une combinaison linéaire de variables qualitatives? Cela n a évidemment pas de sens. La solution retenue est basée sur ce que l on appelle la forme disjonctive d une variable qualitative X à m modalités (comme une profession). On définit les m variables indicatrices des modalités (, 2,., m ) telles que j vaut si on appartient à la modalité j, 0 sinon. Seule une des indicatrices vaut, celle qui correspond à la modalité prise. Les m indicatrices sont donc équivalentes à la variable qualitative. Le score est alors une combinaison linéaire des indicatrices, ce qui revient à donner une note partielle à chaque modalité de chaque variable. Le score final étant la somme des notes partielles (à telle profession correspond telle note ). Les variables explicatives qui interviennent dans les formules sont donc les indicatrices de toutes les variables. Une difficulté intervient cependant : la matrice W n est pas de plein rang et n est donc pas inversible car la somme des indicatrices des modalités de chaque variable vaut. Cela signifie qu il existe une infinité de solutions équivalentes pour estimer les coefficients :une des solutions couramment utilisée consiste alors à ne prendre que m- indicatrices pour chaque variable qualitative puisque la dernière est redondante. III.4 Un exemple Les valeurs suivantes sont fictives (mais réalistes) et ne servent qu à illustrer la méthode. Considérons le cas d un établissement financier qui veut prédire la solvabilité d entreprises pour savoir s il doit ou non accorder un prêt. On connaît pour chaque entreprise les deux variables suivantes : X part des frais financiers dans le résultat en %, et X 2 délai de crédit fournisseurs (nombre de jours avant de payer les fournisseurs). Sur l échantillon des entreprises solvables la moyenne de X vaut 40, celle de X Sur l échantillon des entreprises non solvables ces moyennes sont respectivement 90 et 00. On admet que les écart-types sont les mêmes d un groupe à l autre et sont respectivement s =40, s 2 =20, et que X et X 2 présentent la même corrélation r=0.8 dans chaque groupe. La covariance entre X et X 2 vaut rs s 2 = La matrice de variance commune (dite également intra-classe) est alors W = et le vecteur de différence des moyennes g g2 = 0 Il est facile d en déduire la fonction de Fisher par la formule a= W - (g -g 2 ). Les coefficients étant définis à une constante multiplicative près, on peut prendre pour a le vecteur de composantes et.2. La fonction de score est alors S= -X +.2 X 2 On en déduit facilement par transformation linéaire que le score moyen des entreprises solvables vaut 68 tandis que le score moyen des entreprises non solvables vaut 30. Les écarttypes des variables étant supposés identiques dans les deux groupes on trouve que 2 2 V( S) = V( X) +.2 V( X2) 2(.2)cov( X; X2) = (25.3) On supposera pour la simplicité de l exposé que la distribution du score suit dans chaque groupe une loi normale. Quand il n en est pas ainsi, les densités de probabilité, les fonctions de répartition, etc. doivent être estimées d une autre manière. 4

5 Un usage classique dans les études de ce type est de recaler le score S pour qu il prenne la quasi totalité de ses valeurs dans l intervalle [0 ; 000]. Cela se fait simplement par transformation affine. Ceci peut être réalisé approximativement dans notre exemple en multipliant le score par 5 et en ajoutant 300. La fonction de score vaut donc S= -5X + 6 X V. Qualité et utilisation d un score On estime tout d abord les distributions conditionnelles du score dans chacun des deux groupes. Un score efficace doit conduire à des distributions bien séparées. Dans l exemple précédent le score suit une loi normale N(640 ;26.5) pour le groupe des entreprises solvables ou une loi N(450 ;26.5) pour les entreprises non-solvables. On vérifiera que le score S donne une meilleure séparation que chaque variable prise séparément en calculant l écart réduit entre moyennes, c est à dire la différence en valeur absolue entre moyennes divisée par l écart-type commun. On considérera également les fonctions de répartition : L utilisation est la suivante : si on refusait de prêter de l argent aux entreprises ayant une note de score inférieure à 556, on éliminerait 80% des entreprises insolvables (les «mauvaises») mais on refuserait à tort 25% des entreprises solvables (les «bonnes»). Le choix du seuil dépend des risques financiers et est fixé par un raisonnement économique prenant en compte les coûts d erreur de mauvaise classification : en effet accorder un prêt à une entreprise qui se révélera insolvable a un coût différent de celui de perdre un bon client. 5

6 D une manière similaire à la présentation classique d un test statistique, la situation peut se décrire à l aide des deux densités : En faisant varier le seuil, on voit qu en augmentant le pourcentage α de faux mauvais, on augmente aussi le pourcentage -β de vrais mauvais. La courbe suivante (appelée courbe Roc pour «receiver operating curve») est souvent utilisée pour mesurer le pouvoir séparateur d un score. Elle donne -β(s) en fonction de α(s) lorsque l on fait varier le seuil s du score. Plus elle est proche de la partie supérieure du carré, meilleure est la séparation. Lorsque les deux densités sont identiques, la courbe ROC se confond avec la diagonale du carré. La surface entre la courbe et l axe des abscisses, comprise entre 0 et, est également parfois utilisée. On peut montrer qu elle est théoriquement égale à la probabilité que P(X >X 2 ) si X et X 2 sont deux variables tirées indépendamment, l une dans la distribution des «bons», l autre dans la distribution des «mauvais». 6

7 Les courbes précédentes ne font pas intervenir les proportions réelles de «bons» et de «mauvais». Les praticiens utilisent alors la courbe de «lift» ou d efficacité de la sélection : en abscisse le % de tous les individus bons et mauvais ayant un score inférieur à s, en ordonnée le % de mauvais ayant un score inférieur à s. La courbe idéale est le segment brisé qui correspond au cas où la distribution des «mauvais» est entièrement inférieure à la distribution des «bons». VI Validité prédictive Mesurer l efficacité d un score, comme d ailleurs de toute règle de sélection, sur l échantillon dit «d apprentissage», c est à dire celui qui a servi à estimer les coefficients de la fonction de score, conduit à des résultats trop optimistes : en effet les coefficients ayant été optimisés sur cet échantillon, les taux d erreur sont des estimations biaisées du vrai taux d erreur, que l on aura sur de nouvelles données issues de la même population. On peut en effet obtenir de très bons taux de reconnaissance sur l'échantillon d'apprentissage si le nombre de variables explicatives est très élevé : à la limite avec autant de variables que d observations on pourrait classer sans erreur toute observation, mais ce résultat est purement artificiel. La validation du score se fait donc à l aide d observations supplémentaires, mises de côté, pour lesquelles on connaît Y, et qui servent à simuler le comportement futur du score. 7

8 Conclusion Les méthodes de score, largement utilisées se perfectionnent sans cesse. Elles sont également appliquées dans d autres domaines : en assurance automobile pour détecter les conducteurs à risque, en prospection publicitaire pour sélectionner des adresses sur un fichier en vue d un courrier commercial, pour analyser le risque de perte d un client etc. Leur usage basé sur une approche statistique permet de mieux quantifier les risques. Bien sur, comme toute méthode statistique, le scoring commet des erreurs et un individu qui a la malchance d avoir un profil proche de celui de mauvais payeurs sera considéré comme tel ; mais ce type de méthodes commet moins d erreur et est plus objectif que les jugements d expert. Par ailleurs le score de risque bancaire pour un prêt n est qu un élément dans le processus de décision et comme le rappelle la CNIL dans sa Délibération n du 5 juillet 988 portant adoption d'une recommandation relative à la gestion des crédits ou des prêts consentis à des personnes physiques par les établissements de crédit : «conformément à l'article 2 de la loi du 6 janvier 978, aucune décision accordant ou refusant un crédit ne peut avoir pour seul fondement un traitement automatisé d'informations donnant une définition du profil ou de la personnalité de l'intéressé». Pour en savoir plus : M Bardos, «Analyse discriminante, application au risque et scoring financier», Dunod, 200 Ouvrage de niveau 2 ème cycle universitaire, écrit par la responsable de l Observatoire des Entreprises de la Banque de France. Unique en son genre, en français. T.Hastie, R.Tibshirani, J.Friedman, «The Elements of Statistical Learning Theory», Springer-Verlag, 200 Le livre de référence pour les années à venir, balayant toutes les techniques de modélisation prédictive. Niveau mathématique : 3 ème cycle. 8

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

CALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING

CALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING CALCUL D UN SCORE ( SCORING) Application de techniques de discrimination LES OBJECTIFS DU SCORING SÉLECTION DES RISQUES PRÉVISION DES DÉFAUTS SUIVI ET CONTRÔLE Pierre-Louis GONZALEZ Différents types de

Plus en détail

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems

Plus en détail

Sondage stratifié. Myriam Maumy-Bertrand. Master 2ème Année 12-10-2011. Strasbourg, France

Sondage stratifié. Myriam Maumy-Bertrand. Master 2ème Année 12-10-2011. Strasbourg, France 1 1 IRMA, Université de Strasbourg Strasbourg, France Master 2ème Année 12-10-2011 Ce chapitre s appuie essentiellement sur deux ouvrages : «Les sondages : Principes et méthodes» de Anne-Marie Dussaix

Plus en détail

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring ESSEC Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring Les méthodes d évaluation du risque de crédit pour les PME et les ménages Caractéristiques Comme les montants des crédits et des

Plus en détail

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé Baccalauréat ES Pondichéry 7 avril 204 Corrigé EXERCICE 4 points Commun à tous les candidats. Proposition fausse. La tangente T, passant par les points A et B d abscisses distinctes, a pour coefficient

Plus en détail

GUIDE DU DATA MINER. Scoring - Modélisation. Data Management, Data Mining, Text Mining

GUIDE DU DATA MINER. Scoring - Modélisation. Data Management, Data Mining, Text Mining GUIDE DU DATA MINER Scoring - Modélisation Data Management, Data Mining, Text Mining 1 Guide du Data Miner Scoring - Modélisation Le logiciel décrit dans le manuel est diffusé dans le cadre d un accord

Plus en détail

Cours de méthodes de scoring

Cours de méthodes de scoring UNIVERSITE DE CARTHAGE ECOLE SUPERIEURE DE STATISTIQUE ET D ANALYSE DE L INFORMATION Cours de méthodes de scoring Préparé par Hassen MATHLOUTHI Année universitaire 2013-2014 Cours de méthodes de scoring-

Plus en détail

Arbres binaires. Hélène Milhem. Institut de Mathématiques de Toulouse, INSA Toulouse, France IUP SID, 2011-2012

Arbres binaires. Hélène Milhem. Institut de Mathématiques de Toulouse, INSA Toulouse, France IUP SID, 2011-2012 Arbres binaires Hélène Milhem Institut de Mathématiques de Toulouse, INSA Toulouse, France IUP SID, 2011-2012 H. Milhem (IMT, INSA Toulouse) Arbres binaires IUP SID 2011-2012 1 / 35 PLAN Introduction Construction

Plus en détail

Introduction au modèle linéaire général

Introduction au modèle linéaire général Résumé Introductions au modèle linéaire général Retour au plan du cours Travaux pratiques 1 Introduction L objet de ce chapitre est d introduire le cadre théorique global permettant de regrouper tous les

Plus en détail

Examen d accès - 28 Septembre 2012

Examen d accès - 28 Septembre 2012 Examen d accès - 28 Septembre 2012 Aucun document autorisé - Calculatrice fournie par le centre d examen Cet examen est un questionnaire à choix multiples constitué de 50 questions. Plusieurs réponses

Plus en détail

La méthode des scores, particulièrement de la Banque de France

La méthode des scores, particulièrement de la Banque de France La méthode des scores, particulièrement de la Banque de France Devant la multiplication des défaillances d entreprises au cours des années 80 et début des années 90, la Banque de France a produit des travaux

Plus en détail

Chapitre 3 RÉGRESSION ET CORRÉLATION

Chapitre 3 RÉGRESSION ET CORRÉLATION Statistique appliquée à la gestion et au marketing http://foucart.thierry.free.fr/statpc Chapitre 3 RÉGRESSION ET CORRÉLATION La corrélation est une notion couramment utilisée dans toutes les applications

Plus en détail

MATHÉMATIQUES CYCLE TERMINAL DE LA SÉRIE ÉCONOMIQUE ET SOCIALE ET DE LA SÉRIE LITTERAIRE CLASSE DE PREMIÈRE

MATHÉMATIQUES CYCLE TERMINAL DE LA SÉRIE ÉCONOMIQUE ET SOCIALE ET DE LA SÉRIE LITTERAIRE CLASSE DE PREMIÈRE Annexe MATHÉMATIQUES CYCLE TERMINAL DE LA SÉRIE ÉCONOMIQUE ET SOCIALE ET DE LA SÉRIE LITTERAIRE CLASSE DE PREMIÈRE L enseignement des mathématiques au collège et au lycée a pour but de donner à chaque

Plus en détail

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI 1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage

Plus en détail

INF6304 Interfaces Intelligentes

INF6304 Interfaces Intelligentes INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie

Plus en détail

Outils mathématiques pour le datamining. http://www.elseware.fr/univevry

Outils mathématiques pour le datamining. http://www.elseware.fr/univevry Outils mathématiques pour le datamining http://wwwelsewarefr/univevry Géométrie Distance Distance entre parties Matrice de variance/covariance Inertie Minimisation Probabilités Définition Théorème de Bayes

Plus en détail

PJE : Analyse de comportements avec Twitter Classification supervisée

PJE : Analyse de comportements avec Twitter Classification supervisée PJE : Analyse de comportements avec Twitter Classification supervisée Arnaud Liefooghe arnaud.liefooghe@univ-lille1.fr Master 1 Informatique PJE2 2015-16 B. Derbel L. Jourdan A. Liefooghe 1 2 Agenda Partie

Plus en détail

Statistique et analyse de données pour l assureur : des outils pour la gestion des risques et le marketing

Statistique et analyse de données pour l assureur : des outils pour la gestion des risques et le marketing Statistique et analyse de données pour l assureur : des outils pour la gestion des risques et le marketing Gilbert Saporta Chaire de Statistique Appliquée, CNAM ActuariaCnam, 31 mai 2012 1 L approche statistique

Plus en détail

CNAM 2002-2003 2léments de cours Bonus-malus et Crédibilité

CNAM 2002-2003 2léments de cours Bonus-malus et Crédibilité 1 CNAM 2002-2003 2léments de cours Bonus-malus et Crédibilité Une situation fréquente en pratique est de disposer non pas d un résultat mais de plusieurs. Le cas se présente en assurance, par exemple :

Plus en détail

Simulation d un système d assurance automobile

Simulation d un système d assurance automobile Simulation d un système d assurance automobile DESSOUT / PLESEL / DACHI Plan 1 Introduction... 2 Méthodes et outils utilisés... 2.1 Chaines de Markov... 2.2 Méthode de Monte Carlo... 2.3 Méthode de rejet...

Plus en détail

Sommaire. Chapitre 1 Variables et vecteurs aléatoires... 5. Chapitre 2 Variables aléatoires à densité... 65

Sommaire. Chapitre 1 Variables et vecteurs aléatoires... 5. Chapitre 2 Variables aléatoires à densité... 65 Sommaire Chapitre 1 Variables et vecteurs aléatoires............... 5 A. Généralités sur les variables aléatoires réelles.................... 6 B. Séries doubles..................................... 9

Plus en détail

Baccalauréat ES/L Amérique du Sud 21 novembre 2013

Baccalauréat ES/L Amérique du Sud 21 novembre 2013 Baccalauréat ES/L Amérique du Sud 21 novembre 2013 A. P. M. E. P. EXERCICE 1 Commun à tous les candidats 5 points Une entreprise informatique produit et vend des clés USB. La vente de ces clés est réalisée

Plus en détail

Études. Un score sur variables qualitatives pour la détection précoce des défaillances d entreprises

Études. Un score sur variables qualitatives pour la détection précoce des défaillances d entreprises Un score sur variables qualitatives pour la détection précoce des défaillances d entreprises L intérêt de recourir à des éléments qualitatifs pour compléter une analyse financière et porter une appréciation

Plus en détail

Les données manquantes en statistique

Les données manquantes en statistique Les données manquantes en statistique N. MEYER Laboratoire de Biostatistique -Faculté de Médecine Dép. Santé Publique CHU - STRASBOURG Séminaire de Statistique - 7 novembre 2006 Les données manquantes

Plus en détail

La survie nette actuelle à long terme Qualités de sept méthodes d estimation

La survie nette actuelle à long terme Qualités de sept méthodes d estimation La survie nette actuelle à long terme Qualités de sept méthodes d estimation PAR Alireza MOGHADDAM TUTEUR : Guy HÉDELIN Laboratoire d Épidémiologie et de Santé publique, EA 80 Faculté de Médecine de Strasbourg

Plus en détail

Le bootstrap expliqué par l exemple

Le bootstrap expliqué par l exemple Le bootstrap expliqué par l exemple 1 Le bootstrap expliqué par l exemple 1. Les concepts du bootstrap 2. Des variantes adaptées au contexte 3. Comparaison des différentes méthodes 4. Les cas sensibles

Plus en détail

Modélisation prédictive et incertitudes. P. Pernot. Laboratoire de Chimie Physique, CNRS/U-PSUD, Orsay

Modélisation prédictive et incertitudes. P. Pernot. Laboratoire de Chimie Physique, CNRS/U-PSUD, Orsay Modélisation prédictive et incertitudes P. Pernot Laboratoire de Chimie Physique, CNRS/U-PSUD, Orsay Plan 1 Incertitudes des modèles empiriques 2 Identification et caractérisation des paramètres incertains

Plus en détail

Programme des épreuves des concours externes de recrutement des personnels techniques et administratifs de recherche et de formation

Programme des épreuves des concours externes de recrutement des personnels techniques et administratifs de recherche et de formation Programme des épreuves des concours externes de recrutement des personnels E1 RECRUTEMENT DES ASSISTANTS INGENIEURS DE RECHERCHE ET DE FORMATION...2 E1.1 Gestionnaire de base de données...2 E1.2 Développeur

Plus en détail

Analyse de données et méthodes numériques

Analyse de données et méthodes numériques Analyse de données et méthodes numériques Analyse de données: Que faire avec un résultat? Comment le décrire? Comment l analyser? Quels sont les «modèles» mathématiques associés? Analyse de données et

Plus en détail

Échantillonnage. Pierre Neuvial, http://stat.genopole.cnrs.fr/~pneuvial Evry, M1 SGO, automne 2014

Échantillonnage. Pierre Neuvial, http://stat.genopole.cnrs.fr/~pneuvial Evry, M1 SGO, automne 2014 Démarche Statistique 1 Échantillonnage Pierre Neuvial, http://stat.genopole.cnrs.fr/~pneuvial Evry, M1 SGO, automne 2014 Introduction Objectif statistique descriptive: sur l'échantillon statistique inférentielle:

Plus en détail

UNIVERSITE PARIS 1 PANTHEON SORBONNE LICENCE DE SCIENCES ECONOMIQUES. STATISTIQUE APPLIQUEE F. Gardes / P. Sevestre. Fiche N 7.

UNIVERSITE PARIS 1 PANTHEON SORBONNE LICENCE DE SCIENCES ECONOMIQUES. STATISTIQUE APPLIQUEE F. Gardes / P. Sevestre. Fiche N 7. UNIVERSITE PARIS 1 PANTHEON SORBONNE LICENCE DE SCIENCES ECONOMIQUES STATISTIQUE APPLIQUEE F. Gardes / P. Sevestre Fiche N 7 (avec corrigé) L objet de ce TD est de vous initier à la démarche et à quelques

Plus en détail

Coup de Projecteur sur les Réseaux de Neurones

Coup de Projecteur sur les Réseaux de Neurones Coup de Projecteur sur les Réseaux de Neurones Les réseaux de neurones peuvent être utilisés pour des problèmes de prévision ou de classification. La représentation la plus populaire est le réseau multicouche

Plus en détail

Introduction au cours STA 102 Analyse des données : Méthodes explicatives

Introduction au cours STA 102 Analyse des données : Méthodes explicatives Analyse des données - Méthodes explicatives (STA102) Introduction au cours STA 102 Analyse des données : Méthodes explicatives Giorgio Russolillo giorgio.russolillo@cnam.fr Infos et support du cours Slide

Plus en détail

Cours IFT6266, Exemple d application: Data-Mining

Cours IFT6266, Exemple d application: Data-Mining Cours IFT6266, Exemple d application: Data-Mining Voici un exemple du processus d application des algorithmes d apprentissage statistique dans un contexte d affaire, qu on appelle aussi data-mining. 1.

Plus en détail

Comment ne pas construire un score-titanic

Comment ne pas construire un score-titanic Comment ne pas construire un score-titanic Mon mailing Olivier Decourt ABS Technologies / Educasoft Formations 1- Les principes 2- Un premier exemple : les vins de France 3- Mise en œuvre sous SAS 4- Un

Plus en détail

Principales caractéristiques de Mixmod

Principales caractéristiques de Mixmod Modèle de mélanges Principales caractéristiques de Mixmod Gérard Govaert et Gilles Celeux 24 octobre 2006 1 Plan Le modèledemélange Utilisations du modèle de mélange Les algorithmes de Mixmod Modèle de

Plus en détail

Analyse de l évolution de la structure des ménages dans l enquête sur le budget des ménages

Analyse de l évolution de la structure des ménages dans l enquête sur le budget des ménages Analyse de l évolution de la structure des ménages dans l enquête sur le budget des ménages S. Winandy, R. Palm OCA GxABT/ULg oca.gembloux@ulg.ac.be décembre 2011 1 Introduction La Direction Générale Statistique

Plus en détail

Théorie des sondages : cours 5

Théorie des sondages : cours 5 Théorie des sondages : cours 5 Camelia Goga IMB, Université de Bourgogne e-mail : camelia.goga@u-bourgogne.fr Master Besançon-2010 Chapitre 5 : Techniques de redressement 1. poststratification 2. l estimateur

Plus en détail

Marketing quantitatif M2-MASS

Marketing quantitatif M2-MASS Marketing quantitatif M2-MASS Francois.Kauffmann@unicaen.fr UCBN 2 décembre 2012 Francois.Kauffmann@unicaen.fr UCBN Marketing quantitatif M2-MASS 2 décembre 2012 1 / 61 Première partie I Analyse Analyse

Plus en détail

Séance 8 : Régression Logistique

Séance 8 : Régression Logistique Séance 8 : Régression Logistique Sommaire Proc LOGISTIC : Régression logistique... 2 Exemple commenté : Achat en (t+1) à partir du sexe et du chiffre d affaires de la période précédente. 4 La régression

Plus en détail

DEFINITION et PROPRIETES des PRINCIPALES LOIS de PROBABILITES

DEFINITION et PROPRIETES des PRINCIPALES LOIS de PROBABILITES Université Paris1, Licence 00-003, Mme Pradel : Principales lois de Probabilité 1 DEFINITION et PROPRIETES des PRINCIPALES LOIS de PROBABILITES Notations Si la variable aléatoire X suit la loi L, onnoterax

Plus en détail

Conditions d application des méthodes statistiques paramétriques :

Conditions d application des méthodes statistiques paramétriques : Conditions d application des méthodes statistiques paramétriques : applications sur ordinateur GLELE KAKAÏ R., SODJINOU E., FONTON N. Cotonou, Décembre 006 Conditions d application des méthodes statistiques

Plus en détail

La régression logistique. Par Sonia NEJI et Anne-Hélène JIGOREL

La régression logistique. Par Sonia NEJI et Anne-Hélène JIGOREL La régression logistique Par Sonia NEJI et Anne-Hélène JIGOREL Introduction La régression logistique s applique au cas où: Y est qualitative à 2 modalités Xk qualitatives ou quantitatives Le plus souvent

Plus en détail

Fouille de Données et Media Sociaux Cours 2 Master DAC Data Science UPMC - LIP6

Fouille de Données et Media Sociaux Cours 2 Master DAC Data Science UPMC - LIP6 Fouille de Données et Media Sociaux Cours 2 Master DAC Data Science UPMC - LIP6 Ludovic Denoyer 21 septembre 2015 Ludovic Denoyer () FDMS 21 septembre 2015 1 / 1 Contexte Observation La plupart des bonnes

Plus en détail

Analyse de données. [Tapez le sous-titre du document] ANALYSE DE DONNEES 2011 2012. ANALYSE DE DONNEES Page 1 LICENCE 3 SCIENCES ECONOMIQUES

Analyse de données. [Tapez le sous-titre du document] ANALYSE DE DONNEES 2011 2012. ANALYSE DE DONNEES Page 1 LICENCE 3 SCIENCES ECONOMIQUES 2011 2012 ANALYSE DE DONNEES 2011 2012 LICENCE 3 SCIENCES ECONOMIQUES COURS DE M. THIERRY BLAYAC Analyse de données [Tapez le sous-titre du document] ANALYSE DE DONNEES Page 1 H34VEN Cours pour Licence

Plus en détail

L essentiel sur les tests statistiques

L essentiel sur les tests statistiques L essentiel sur les tests statistiques 21 septembre 2014 2 Chapitre 1 Tests statistiques Nous considérerons deux exemples au long de ce chapitre. Abondance en C, G : On considère une séquence d ADN et

Plus en détail

Probabilités et Statistiques. Chapitre 1 : Statistique descriptive

Probabilités et Statistiques. Chapitre 1 : Statistique descriptive U.P.S. I.U.T. A, Département d Informatique Année 2008-2009 Probabilités et Statistiques Emmanuel PAUL Chapitre 1 : Statistique descriptive 1 Objectifs des statistiques. Il s agit d étudier un ou plusieurs

Plus en détail

Initiation à la théorie de l échantillonnage

Initiation à la théorie de l échantillonnage Initiation à la théorie de l échantillonnage Jean VAILLANT Octobre 2005 1 Notions de base en échantillonnage L étude de propriétés caractéristiques d un ensemble, quand on ne dispose pas encore de données,

Plus en détail

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p.

TABLE DES MATIÈRES. Bruxelles, De Boeck, 2011, 736 p. STATISTIQUE THÉORIQUE ET APPLIQUÉE Tome 2 Inférence statistique à une et à deux dimensions Pierre Dagnelie TABLE DES MATIÈRES Bruxelles, De Boeck, 2011, 736 p. ISBN 978-2-8041-6336-5 De Boeck Services,

Plus en détail

SY09 Rapport TP4 : Analyse discriminante, régression logistique

SY09 Rapport TP4 : Analyse discriminante, régression logistique UNIVERSITÉ DE TECHNOLOGIE DE COMPIÈGNE SY09 Rapport TP4 : Analyse discriminante, régression logistique CUNI Frédéric 15 juin 2015 Objectifs du TP : Le but de ce TP est l application de l analyse discriminante

Plus en détail

UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2013 2014 MATHS/STATS. 1 Généralités sur les tests statistiques 2

UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2013 2014 MATHS/STATS. 1 Généralités sur les tests statistiques 2 UNIVERSITÉ PARIS OUEST NANTERRE LA DÉFENSE U.F.R. SEGMI Année universitaire 2013 2014 Master d économie Cours de M. Desgraupes MATHS/STATS Document 4 : Les tests statistiques 1 Généralités sur les tests

Plus en détail

Outils Statistiques du Data Mining

Outils Statistiques du Data Mining Outils Statistiques du Data Mining Pr Roch Giorgi roch.giorgi@univ-amu.fr SESSTIM, Faculté de Médecine, Aix-Marseille Université, Marseille, France http://sesstim-orspaca.org http://optim-sesstim.univ-amu.fr

Plus en détail

Cours 1: lois discrétes classiques en probabilités

Cours 1: lois discrétes classiques en probabilités Cours 1: lois discrétes classiques en probabilités Laboratoire de Mathématiques de Toulouse Université Paul Sabatier-IUT GEA Ponsan Module: Stat inférentielles Définition Quelques exemples loi d une v.a

Plus en détail

La méthode des quotas

La méthode des quotas La méthode des quotas Oliviero Marchese, décembre 2006 1 La méthode des quotas Principe de la méthode Point de départ et but recherché Caractère «intuitif» de la méthode A quoi ressemble une feuille de

Plus en détail

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ

L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ L ANALYSE EN COMPOSANTES PRINCIPALES (A.C.P.) Pierre-Louis GONZALEZ INTRODUCTION Données : n individus observés sur p variables quantitatives. L A.C.P. permet d eplorer les liaisons entre variables et

Plus en détail

Chacune des valeurs d une variable en est une modalité particulière.

Chacune des valeurs d une variable en est une modalité particulière. Psychologie générale Jean Paschoud STATISTIQUE Sommaire Rôle de la statistique Variables Échelles de mesure Résumer, décrire Comparer Rôle de la statistique La statistique est avant tout un outil permettant

Plus en détail

Module 2 29 Décembre 2009 Intervenant: Dhuin STATISTIQUES

Module 2 29 Décembre 2009 Intervenant: Dhuin STATISTIQUES STATISTIQUES I. Séries statistiques simples... 1 A. Définitions... 1 1. Population... 1 2. Caractère statistique... 1 B. Séries classées / représentations graphiques.... 2 1. Séries classées... 2 2. Représentations

Plus en détail

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

Introduction à l analyse des données. Analyse des Données (1) Exemple, ville et (in)sécurité. Exemple, ville et (in)sécurité

Introduction à l analyse des données. Analyse des Données (1) Exemple, ville et (in)sécurité. Exemple, ville et (in)sécurité Introduction à l analyse des données Analyse des Données () Le but de l analyse de données est de synthétiser, structurer l information contenue dans des données multidimensionnelles Deux groupes de méthodes

Plus en détail

Pierre-Louis GONZALEZ

Pierre-Louis GONZALEZ SEGMENTATION Pierre-Louis GONZALEZ 1 I. Les méthodes de segmentation. Introduction Les méthodes de segmentation cherchent à résoudre les problèmes de discrimination et de régression en divisant de façon

Plus en détail

Correction du baccalauréat STMG Polynésie 17 juin 2014

Correction du baccalauréat STMG Polynésie 17 juin 2014 Correction du baccalauréat STMG Polynésie 17 juin 2014 EXERCICE 1 Cet exercice est un Q.C.M. 4 points 1. La valeur d une action cotée en Bourse a baissé de 37,5 %. Le coefficient multiplicateur associé

Plus en détail

Le risque Idiosyncrasique

Le risque Idiosyncrasique Le risque Idiosyncrasique -Pierre CADESTIN -Magali DRIGHES -Raphael MINATO -Mathieu SELLES 1 Introduction Risque idiosyncrasique : risque non pris en compte dans le risque de marché (indépendant des phénomènes

Plus en détail

Evaluation d un test diagnostique - Concordance

Evaluation d un test diagnostique - Concordance Evaluation d un test diagnostique - Concordance Michaël Genin Université de Lille 2 EA 2694 - Santé Publique : Epidémiologie et Qualité des soins michaelgenin@univ-lille2fr Plan 1 Introduction 2 Evaluation

Plus en détail

Sélection- validation de modèles

Sélection- validation de modèles Sélection- validation de modèles L. Rouvière laurent.rouviere@univ-rennes2.fr JANVIER 2015 L. Rouvière (Rennes 2) 1 / 77 1 Quelques jeux de données 2 Sélection-choix de modèles Critères de choix de modèles

Plus en détail

Terminale S - ACP Ex1 : Partie A - Restitution organisée des connaissances Partie B : 1. a. 1. b. 1. c. 2. a. 2. b. Ex2 :

Terminale S - ACP Ex1 : Partie A - Restitution organisée des connaissances Partie B : 1. a. 1. b. 1. c. 2. a. 2. b. Ex2 : Terminale S - ACP Ex1 : Antilles Septembre 2006 Partie A - Restitution organisée des connaissances On suppose connu le résultat suivant : Si est une variable aléatoire qui suit une loi exponentielle de

Plus en détail

Soutien illimité 7j/7 en maths: Coach, profs, exercices & annales, cours. Sujet de Bac 2013 Maths S Obligatoire & Spécialité - Liban

Soutien illimité 7j/7 en maths: Coach, profs, exercices & annales, cours. Sujet de Bac 2013 Maths S Obligatoire & Spécialité - Liban Sujet de Bac 2013 Maths S Obligatoire & Spécialité - Liban EXERCICE 1 : 4 Points Cet exercice est un questionnaire à choix multiples. Aucune justification n est demandée. Pour chacune des questions, une

Plus en détail

Classe : TES1 Le 12/05/2003. MATHEMATIQUES Devoir N 7 (rattrapage) Calculatrice et formulaire autorisés

Classe : TES1 Le 12/05/2003. MATHEMATIQUES Devoir N 7 (rattrapage) Calculatrice et formulaire autorisés Classe : TES1 Le 12/05/2003 MATHEMATIQUES Devoir N 7 (rattrapage) Calculatrice et formulaire autorisés Durée : 3h Exercice 1: (5 points) Le tableau suivant donne l évolution du prix d un paquet de café

Plus en détail

Programme de l enseignement obligatoire commun de mathématiques Cycle terminal de la série sciences et technologies du management et de la gestion

Programme de l enseignement obligatoire commun de mathématiques Cycle terminal de la série sciences et technologies du management et de la gestion Programme de l enseignement obligatoire commun de mathématiques Cycle terminal de la série sciences et technologies du management et de la gestion L enseignement des mathématiques au collège et au lycée

Plus en détail

Introduction à l'analyse statistique des données

Introduction à l'analyse statistique des données INTRODUCTION À L'ANALYSE STATISTIQUE DES DONNÉES CONCEPTS DE BASE Un certain nombre de concepts, préalables indispensables à la compréhension des analyses présentées, sont définis ici. De même pour quelques

Plus en détail

STATISTIQUES. Cours I : Test d hypothèses. Télécom Physique Strasbourg Module 2101. Fabrice Heitz. Octobre 2014

STATISTIQUES. Cours I : Test d hypothèses. Télécom Physique Strasbourg Module 2101. Fabrice Heitz. Octobre 2014 Télécom Physique Strasbourg Module 2101 STATISTIQUES Cours I : Test d hypothèses Fabrice Heitz Octobre 2014 Fabrice Heitz (Télécom PS) Statistiques 2014 1 / 75 Cours I TESTS D HYPOTHÈSES Fabrice Heitz

Plus en détail

TABLE DES MATIERES. C Exercices complémentaires 42

TABLE DES MATIERES. C Exercices complémentaires 42 TABLE DES MATIERES Chapitre I : Echantillonnage A - Rappels de cours 1. Lois de probabilités de base rencontrées en statistique 1 1.1 Définitions et caractérisations 1 1.2 Les propriétés de convergence

Plus en détail

Table des matières. PREMIÈRE PARTIE Étapes initiales des études marketing 7

Table des matières. PREMIÈRE PARTIE Étapes initiales des études marketing 7 Table des matières Préface Public 1 Structure de l ouvrage 1 Caractéristiques de l ouvrage 3 Contenu 3 Pédagogie 4 Remarques sur l adaptation française 4 Ressources numériques 5 Biographie 6 PREMIÈRE PARTIE

Plus en détail

DÉTECTION PRÉCOCE DES DÉFAILLANCES D ENTREPRISES À PARTIR DES DOCUMENTS COMPTABLES

DÉTECTION PRÉCOCE DES DÉFAILLANCES D ENTREPRISES À PARTIR DES DOCUMENTS COMPTABLES DÉTECTION PRÉCOCE DES DÉFAILLANCES D ENTREPRISES À PARTIR DES DOCUMENTS COMPTABLES 1 Dans le but d affiner l analyse du risque, la direction des Entreprises mettra prochainement à la disposition des établissements

Plus en détail

Loi binomiale Lois normales

Loi binomiale Lois normales Loi binomiale Lois normales Christophe ROSSIGNOL Année scolaire 204/205 Table des matières Rappels sur la loi binomiale 2. Loi de Bernoulli............................................ 2.2 Schéma de Bernoulli

Plus en détail

Discrétisation et génération de hiérarchies de concepts

Discrétisation et génération de hiérarchies de concepts Prétraitement des données 1 Pourquoi prétraiter les données? Nettoyage des données Intégration et transformation Réduction des données Discrétisation et génération de hiérarchies de g concepts Pourquoi

Plus en détail

Le traitement des engagements sur les PME dans Bâle II (CP3)

Le traitement des engagements sur les PME dans Bâle II (CP3) ÉTUDE Le traitement des engagements sur les PME dans Bâle II (CP3) Le contenu du nouvel accord de Bâle sur le ratio international de solvabilité bancaire, dont l entrée en vigueur est prévue pour la fin

Plus en détail

Programme de Première

Programme de Première BAC TECHNO STAV 66 I. Algèbre Programme de Première Objectif 1 - Effectuer de manière autonome des calculs numériques ou algébriques, résoudre des équations ou inéquations en vue de résoudre des problèmes

Plus en détail

UNE COMPARAISON DE QUATRE TECHNIQUES D INFÉRENCE DES REFUSÉS DANS LE PROCESSUS D OCTROI DE CRÉDIT

UNE COMPARAISON DE QUATRE TECHNIQUES D INFÉRENCE DES REFUSÉS DANS LE PROCESSUS D OCTROI DE CRÉDIT UNE COMPARAISON DE QUATRE TECHNIQUES D INFÉRENCE DES REFUSÉS DANS LE PROCESSUS D OCTROI DE CRÉDIT Asma Guizani 1 & Besma Souissi 2 & Salwa Ben Ammou 3,4 & Gilbert Saporta 4 1 Institut Supérieur de Gestion

Plus en détail

- Mobiliser les résultats sur le second degré dans le cadre de la résolution d un problème.

- Mobiliser les résultats sur le second degré dans le cadre de la résolution d un problème. Mathématiques - classe de 1ère des séries STI2D et STL. 1. Analyse On dote les élèves d outils mathématiques permettant de traiter des problèmes relevant de la modélisation de phénomènes continus ou discrets.

Plus en détail

Lycée Cassini BTS CGO 2014-2015. Test de début d année

Lycée Cassini BTS CGO 2014-2015. Test de début d année Lycée assini BTS GO 4-5 Exercice Test de début d année Pour chaque question, plusieurs réponses sont proposées. Déterminer celles qui sont correctes. On a mesuré, en continu pendant quatre heures, la concentration

Plus en détail

BACCALAURÉAT BLANC DE MATHÉMATIQUES. Terminales ES (Spécialité)

BACCALAURÉAT BLANC DE MATHÉMATIQUES. Terminales ES (Spécialité) BACCALAURÉAT BLANC DE MATHÉMATIQUES Terminales ES (Spécialité) Vendredi 7 février 0 8h - h coefficient : 7 Les calculatrices sont autorisées Le sujet est composé de exercices indépendants. Le candidat

Plus en détail

Session 2011. Enseignement de Spécialité. Durée de l épreuve : 3 heures. Coefficient : 7. Ce sujet comporte 7 pages numérotées de 1 à 7.

Session 2011. Enseignement de Spécialité. Durée de l épreuve : 3 heures. Coefficient : 7. Ce sujet comporte 7 pages numérotées de 1 à 7. BACCALAURÉAT GENÉRAL Session 2011 MATHÉMATIQUES Série ES Enseignement de Spécialité Durée de l épreuve : 3 heures Coefficient : 7 Ce sujet comporte 7 pages numérotées de 1 à 7. L utilisation d une calculatrice

Plus en détail

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens

Chapitre 7. Statistique des échantillons gaussiens. 7.1 Projection de vecteurs gaussiens Chapitre 7 Statistique des échantillons gaussiens Le théorème central limite met en évidence le rôle majeur tenu par la loi gaussienne en modélisation stochastique. De ce fait, les modèles statistiques

Plus en détail

Regime Switching Model : une approche «pseudo» multivarie e

Regime Switching Model : une approche «pseudo» multivarie e Regime Switching Model : une approche «pseudo» multivarie e A. Zerrad 1, R&D, Nexialog Consulting, Juin 2015 azerrad@nexialog.com Les crises financières survenues dans les trente dernières années et les

Plus en détail

Support du cours de Probabilités IUT d Orléans, Département d informatique

Support du cours de Probabilités IUT d Orléans, Département d informatique Support du cours de Probabilités IUT d Orléans, Département d informatique Pierre Andreoletti IUT d Orléans Laboratoire MAPMO (Bât. de Mathématiques UFR Sciences) - Bureau 126 email: pierre.andreoletti@univ-orleans.fr

Plus en détail

De la donnée à la décision. Sofian MAABOUT LaBRI. Université Bordeaux 1

De la donnée à la décision. Sofian MAABOUT LaBRI. Université Bordeaux 1 De la donnée à la décision Sofian MAABOUT LaBRI. Université Bordeaux 1 1 Décider c est choisir, parmi plusieurs actes possibles, celui qui apparaît comme le plus pertinent pour atteindre un résultat envisagé,

Plus en détail

Probabilités. I- Expérience aléatoire, espace probabilisé : ShotGun. 1- Définitions :

Probabilités. I- Expérience aléatoire, espace probabilisé : ShotGun. 1- Définitions : Probabilités I- Expérience aléatoire, espace probabilisé : 1- Définitions : Ω : Ensemble dont les points w sont les résultats possibles de l expérience Des évènements A parties de Ω appartiennent à A une

Plus en détail

Baccalauréat S Asie 18 juin 2013

Baccalauréat S Asie 18 juin 2013 Baccalauréat S Asie 18 juin 2013 Dans l ensemble du sujet, et pour chaque question, toute trace de recherche même incomplète, ou d initiative même non fructueuse, sera prise en compte dans l évaluation

Plus en détail

Mercredi 24 Juin 2015

Mercredi 24 Juin 2015 BACCALAURÉAT GÉNÉRAL Session 2015 MATHÉMATIQUES Série ES ENSEIGNEMENT OBLIGATOIRE Durée de l épreuve : 3 heures coefficient : 5 MATHÉMATIQUES Série L ENSEIGNEMENT DE SPÉCIALITÉ Durée de l épreuve : 3 heures

Plus en détail

Corrigé du baccalauréat STMG Métropole 18 juin 2015

Corrigé du baccalauréat STMG Métropole 18 juin 2015 orrigé du baccalauréat STMG Métropole 18 juin 215 Durée : 3 heures EXERIE 1 4 points Tous les ans, en août, Maïlys reçoit l échéancier (document indiquant le montant de sa cotisation annuelle) de sa mutuelle

Plus en détail

Activité 1 : échantillonnage

Activité 1 : échantillonnage Activité échantillonnage, intervalle de fluctuation, prise de décision (à partir d un même thème) Les trois activités qui suivent s inspirent du document «ressources pour la classe de première générale

Plus en détail

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé A. P. M. E. P. Exercice 1 5 points 1. Réponse d. : 1 e Le coefficient directeur de la tangente est négatif et n est manifestement pas 2e

Plus en détail

Analyse de données longitudinales continues avec applications

Analyse de données longitudinales continues avec applications Université de Liège Département de Mathématique 29 Octobre 2002 Analyse de données longitudinales continues avec applications David MAGIS 1 Programme 1. Introduction 2. Exemples 3. Méthodes simples 4.

Plus en détail

9. Distributions d échantillonnage

9. Distributions d échantillonnage 9. Distributions d échantillonnage MTH2302D S. Le Digabel, École Polytechnique de Montréal H2015 (v3) MTH2302D: distributions d échantillonnage 1/46 Plan 1. Échantillons aléatoires 2. Statistiques et distributions

Plus en détail

TSTI 2D CH X : Exemples de lois à densité 1

TSTI 2D CH X : Exemples de lois à densité 1 TSTI 2D CH X : Exemples de lois à densité I Loi uniforme sur ab ; ) Introduction Dans cette activité, on s intéresse à la modélisation du tirage au hasard d un nombre réel de l intervalle [0 ;], chacun

Plus en détail

Épreuve de mathématiques Terminale ES 200 minutes

Épreuve de mathématiques Terminale ES 200 minutes Examen 2 Épreuve de mathématiques Terminale ES 200 minutes L usage de la calculatrice programmable est autorisé. La bonne présentation de la copie est de rigueur. Cet examen comporte 7 pages et 5 exercices.

Plus en détail

Université d Orléans - Maitrise Econométrie Econométrie des Variables Qualitatives

Université d Orléans - Maitrise Econométrie Econométrie des Variables Qualitatives Université d Orléans - Maitrise Econométrie Econométrie des Variables Qualitatives Examen Décembre 00. C. Hurlin Exercice 1 (15 points) : Politique de Dividendes On considère un problème de politique de

Plus en détail

UNE ESTIMATION DU PARC AUTOMOBILE À L AIDE DES DURÉES DE VIE DES VÉHICULES

UNE ESTIMATION DU PARC AUTOMOBILE À L AIDE DES DURÉES DE VIE DES VÉHICULES UNE ESTIMATION DU PARC AUTOMOBILE À L AIDE DES DURÉES DE VIE DES VÉHICULES François JEGER Le parc de véhicules automobiles en service vieillit de trois mois par an depuis 1993 : la durée de vie médiane

Plus en détail

Première STMG1 2014-2015 progression. - 1. Séquence : Proportion d une sous population dans une population.

Première STMG1 2014-2015 progression. - 1. Séquence : Proportion d une sous population dans une population. Première STMG1 2014-2015 progression. - 1 Table des matières Fil rouge. 3 Axes du programme. 3 Séquence : Proportion d une sous population dans une population. 3 Information chiffrée : connaître et exploiter

Plus en détail