Des PROBABILITES à la STATISTIQUE - APPLICATIONS - Jea-Marie MARION 1
STATISTIQUE DESCRIPTIVE (décrire ue populatio à l aide de caractéristiques et graphiques) STATISTIQUE INFERENTIELLE (étedre des résultats obteus sur échatillo à la populatio) 2
DEUX RESULTATS FONDAMENTAUX EN PROBABILITES 1- LA LOI DES GRANDS NOMBRES Exemple: Lacer d ue pièce équilibrée 10 lacers idépedats fréquece de Pile = 3 10 Nombre de lacers deviet de plus e plus grad fréquece de Pile «coverge» vers 1 2 F p 3
DEUX RESULTATS FONDAMENTAUX EN PROBABILITES 1- LA LOI DES GRANDS NOMBRES F statistique p probabiliste La loi des grads ombres relie la Statistique aux Probabilités 4
DEUX RESULTATS FONDAMENTAUX EN PROBABILITES 1- LA LOI DES GRANDS NOMBRES Loi des grads ombres: si des v.a. X 1,,X, suivet des lois de Beroulli idépedates et de même paramètre p alors F X1... X p F sera cosidérée comme u estimateur de p 5
DEUX RESULTATS FONDAMENTAUX EN PROBABILITES 1- LA LOI DES GRANDS NOMBRES Loi des grads ombres (gééralisatio): si des v.a. X 1,,X, sot idépedates et de même loi et si E(X 1 ) existe alors: X X 1... X E( X ) 1 Coséquece: X est u estimateur de EX1 ( ) 6
DEUX RESULTATS FONDAMENTAUX EN PROBABILITES 2- LE THEOREME CENTRAL LIMITE Si les v.a. X 1,,X sot idépedates de lois de Beroulli B(p) alors S = X 1 + +X suit ue loi B(, p). Doc: E( S ) p et V( S ) p(1 p) De plus, S p p(1 p) N(0,1) si 0,03 (Théorème de Moivre-Laplace) 0,025 0,02 0,015 0,01 0,005 0-5 -4-3 -2-1 0 1 2 3 4 5 7
DEUX RESULTATS FONDAMENTAUX EN PROBABILITES 2- LE THEOREME CENTRAL LIMITE Coditios de l approximatio E pratique o cosidère que l approximatio d ue loi Biomiale par ue loi Normale est satisfaisate si les coditios suivates sot réuies: 30, p 5, (1-p) 5 8
DEUX RESULTATS FONDAMENTAUX EN PROBABILITES 2- LE THEOREME CENTRAL LIMITE S p p(1 p) N(0,1) si F p p(1 p) N(0,1) si Gééralisatio: Si les v.a. X 1,,X sot idépedates et de même loi et si V(X 1 ) existe alors: S E( X1) N(0,1) si (T.C.L) V( X ) 1 9
STATISTIQUE INFERENTIELLE Populatio Proportio p Echatilloage (paramètre p cou) Echatillo Fréquece f Estimatio (paramètre p icou) Ex: p proportio d idividus possédat u smartphoe 10
STATISTIQUE INFERENTIELLE ECHANTILLONNAGE / ESTIMATION Théorie de l échatilloage : coaissat les propriétés d ue populatio, détermier les propriétés d échatillos prélevés das la populatio. Itervalle de fluctuatio Théorie de l estimatio : o dispose de reseigemets sur u échatillo et o cherche à e déduire des iformatios sur la populatio totale. Estimatio poctuelle Estimatio par itervalle de cofiace 11
STATISTIQUE INFERENTIELLE ECHANTILLONNAGE Théorie de l échatilloage : coaissat les propriétés d ue populatio, détermier les propriétés d échatillos prélevés das la populatio. Itervalle de fluctuatio Populatio de taille N: idividus possédat u téléphoe portable Das cette populatio o sait que l o a ue proportio p d idividus qui possèdet u smartphoe Populatio Proportio p p cou N idividus 12
STATISTIQUE INFERENTIELLE ECHANTILLONNAGE Si l o prélève u échatillo, de taille, das cette populatio S ombre d idividus das l échatillo possédat u smartphoe S suit la loi B (, p) Si 30, p 5, (1-p) 5 alors (TCL) S p p(1 p) S suit approximativemet la loi N (0,1) suit approximativemet ue loi N (p, p(1-p)) Exemple: échatillo de taille =600, p=0,4 alors S600 suit approximativemet ue loi N(240,144) 13
Soit F STATISTIQUE S INFERENTIELLE ECHANTILLONNAGE la fréquece des idividus possédat u smarphoe das u échatillo Sur u échatillo particulier F va predre ue valeur f Echatillo1 Populatio Proportio p Fréquece f 1 Echatillo 2 Fréquece f 2... Echatillos O chage d échatillo, f chage : c est la fluctuatio d échatilloage 14
STATISTIQUE INFERENTIELLE ECHANTILLONNAGE F Variable aléatoire Echatillo f ombre réel apparteat à [0,1] 15
STATISTIQUE INFERENTIELLE ECHANTILLONNAGE Si 30, p 5, (1-p) 5 alors F suit approximativemet la loi N p(1- p) ( p, ) F p p(1 p) suit approximativemet la loi N (0,1) Exemple: F100 0,40 F100 0,40 0, 40(1 0, 40) 0,02 suit approximativemet la loi N (0,1) 600 16
STATISTIQUE INFERENTIELLE ECHANTILLONNAGE Si o se doe u seuil 1-a (par exemple 0,95 ou 0,90 ) O cherche das la table de la loi N (0,1) le ombre u a tel que O e déduit P( u F p u p(1 p) ) 1 a a a p(1 p) p(1 p) P( p u F p u ) 1 a a a L itervalle de fluctuatio (d échatilloage) est doc au seuil 1-a : p(1 p) p(1 p) p ua, p ua 17
STATISTIQUE INFERENTIELLE ECHANTILLONNAGE rappel Exemple p(1 p) p(1 p) p ua, p ua 0,400,60 0,400,60 0, 40 1,96, 0, 40 1,96 600 600 0,3608 ; 0,4392 Ce qui sigifie: Si das ue populatio possédat u téléphoe portable o sait qu il y a 40% d idividus qui possèdet u smartphoe: e preat u échatillo (quelcoque) de 600 idividus, o a 95 chaces sur 100 que la fréquece de ceux qui possèdet u smartphoe soit comprise etre 36% et 44% 95% des échatillos serot tels qu il y ait etre 36% et 44% d idividus qui possèderot u smartphoe 18
STATISTIQUE INFERENTIELLE ESTIMATION Théorie de l estimatio : o dispose de reseigemets sur u échatillo et o cherche à e déduire des iformatios sur la populatio totale. Estimatio poctuelle Estimatio par itervalle de cofiace Populatio de taille N idividus possédat u téléphoe portable Populatio Proportio p p icou Das cette populatio o e coait pas la proportio p d idividus possédat u smartphoe 19
STATISTIQUE INFERENTIELLE ESTIMATION Soit F S la fréquece des idividus possédat u smartphoe das u échatillo Nous sommes ecore das les coditios 30, p 5, (1-p) 5 P( u F p u p(1 p) ) 1 a a a p(1 p) p(1 p) P( F u p F u ) 1 a a a Problème!!! 20
STATISTIQUE INFERENTIELLE ESTIMATION p(1 p) 1 Comme 0 4 1 1 O e déduit P( F u p F u ) 1 2 2 a a a Disposat d u échatillo observé, o dira qu u itervalle de cofiace, au iveau de cofiace 1-a, pour p est doé par : 1 1 11 ff uau p; f u a f ua a 2 2 22 Remarque: u itervalle de cofiace est pas aléatoire, il est «certai» 21
STATISTIQUE INFERENTIELLE ESTIMATION Ne jamais écrire: 1 1 P( f u p f u ) 1 2 2 a a a Ceci a aucu ses!!! 22
STATISTIQUE INFERENTIELLE ESTIMATION Itervalle de cofiace pour p au iveau de cofiace de 1- a 1 1 11 ff uau p; f u a f ua a 2 2 22 Par exemple au iveau de cofiace de 0,95, l itervalle de cofiace pour p sera approximativemet: 1 1 f 1 p f 1 f ; f (1,96 2) 23
STATISTIQUE INFERENTIELLE ESTIMATION Exemple : échatillo de taille =600 sur lequel f = 0,3 f 1 1 ; f C est à dire: [0,26 ; 0,34], avec u iveau de cofiace de plus de 95% p est-il das l itervalle de cofiace??? 24
STATISTIQUE INFERENTIELLE ESTIMATION Itervalles de cofiace (à 95%) Proportio p Fréquece f 1 a b 1, 1 p icou... Fréquece f 2 Fréquece f k a2, b2... a, b k k Au mois 95% des itervalles vot coteir p 25
STATISTIQUE INFERENTIELLE ESTIMATION Commet détermier la taille d u échatillo? L itervalle de cofiace (au iveau de cofiace 1- a ) 11 1 1 f f u au ; p f u a f ua a 22 2 2 ous idique que 2u a 1 2 u est l amplitude de l itervalle a 1 est la précisio pour p 2 Coclusio : Si l o se doe ue précisio d sur p alors u 2 a /2 2 4d 26
STATISTIQUE INFERENTIELLE ESTIMATION Exemple : o devra iterroger 2 2 ua /2 1,96 1067 2 2 4d 4 (0,03) persoes possédat téléphoe portable pour estimer le pourcetage p de ceux qui possèdet u smartphoe avec ue précisio de 3% au iveau de cofiace de 95% 27
Comme est grad, STATISTIQUE INFERENTIELLE ESTIMATION u et 2 u a a sot très petits, l itervalle de cofiace se réduit alors à: f (1 f ) f (1 f ) f ua ; f ua Exemple: échatillo de taille =600 sur lequel f = 0,3 alors 0,263<p<0,337 au iveau de cofiace 95%. Itervalle plus étroit que précédemmet! 28
APPLICATIONS 29
1- ETUDE DE LA CONSOMMATION D UN VEHICULE Objectif: Détermier la cosommatio d u véhicule à partir de certaies caractéristiques (puissace, poids, logueur ) 30
1- ETUDE DE LA CONSOMMATION D UN VEHICULE Le modèle: Y a0 a1 X1 a2 X2 a3 X3 a4 X4 a5 X5 a6 X6 a7 X7 Y est la cosommatio du véhicule (e l/100km) X puissace X vitesse max X poids 1 2 3 X logueur X largeur X volume du coffre X 4 5 6 7 prix résidu aléatoire 31
1- ETUDE DE LA CONSOMMATION D UN VEHICULE Le but est d estimer poctuellemet et par itervalle de cofiace les paramètres du modèle sous l hypothèse de Normalité et d idépedace des résidus. 32
1- ETUDE DE LA CONSOMMATION D UN VEHICULE Nous disposos d u échatillo de 28 véhicules (u extrait des doées figure das le tableau suivat) Modèle Puissace Vitesse max Poids Logueur Largeur Coffre Prix Cosom Citroe C1.1 68 157 800 3,44 1,63 139 12,2 4,5 Smart Fortwo 71 145 780 2,7 1,56 220 12,7 4,2 Nisa Micra 1.2 80 170 915 3,78 1,67 226 14 5 Reault Clio 2.0 90 168 1071 4,06 1,73 300 17,8 3,6 Peugeot 308 150 205 1525 4,5 1,82 520 27,35 5,3 Peugeot 407 110 192 1775 4,69 2,11 407 26,45 4,9 Mercedes C100 204 240 1660 4,59 1,77 450 47,7 5,3 BMW 525 143 195 1650 4,7 1,88 550 42,75 5,1 Jaguar XF 2.2 200 214 1735 4,9 1,88 510 58,5 5,4 BMW AH5 306 250 1850 4,89 1,86 375 75,5 6,4 33
1- ETUDE DE LA CONSOMMATION D UN VEHICULE Matrice des corrélatios Puissace Vitesse max Poids Logueur Largeu r Coffre Pri x Cosom Puissace 1,00 Vitesse max 0,89 1,00 Poids 0,79 0,78 1,00 Logueur 0,60 0,72 0,89 1,00 Largeur 0,41 0,52 0,74 0,80 1,00 Coffre 0,32 0,39 0,71 0,77 0,62 1,00 Prix 0,96 0,84 0,86 0,66 0,44 0,40 Cosom 0,72 0,63 0,57 0,41 0,34 0,27 1,0 0 0,6 3 1,00 34
1- ETUDE DE LA CONSOMMATION D UN VEHICULE puiss moy puiss vit max moy vit max Cosom 5,65 0,34 0, 287 puiss vit max poids moy poids log moy log larg moy l arg 0,152 0,047 0,042 poids log l arg coffre moy coffre puiss moy prix 0,09 0,316 prix coffre prix 35
1- ETUDE DE LA CONSOMMATION D UN VEHICULE Prévisio de la cosommatio d u véhicule à partir du modèle: Cosom 2,81 0, 00385 puiss 0, 00967 vit max 0, 000418 poids 0, 09 log 0, 42 larg 0, 000679coffre 0, 013 prix Le modèle cotiet les estimatios poctuelles des paramètres 36
1- ETUDE DE LA CONSOMMATION D UN VEHICULE Les itervalles de cofiace pour les paramètres du modèle sot : (au iveau de cofiace de 0,95) Pour a1 Pour a2 Pour a [0,0002-0,0006] Pour a4 [0,08-0,10] 3 [0,0028-0,0048] [0,0091-0,0154] Pour a [-0,44; -0,40] Pour a6 [-0,00012;-0,023] 5 Pour a 7 [0,012-0,014] 37
2- PREVISION D UNE SERIE TEMPORELLE Objectif: Détermier la prévisio de la puissace électrique (e millios de Kwh) cosommée mesuellemet pour l éclairage des rues et des routes pour l aée 2013 38
2- PREVISION D UNE SERIE TEMPORELLE Observatio mesuelle de la cosommatio de 2005 à 2012 39
2- PREVISION D UNE SERIE TEMPORELLE 40
2- PREVISION D UNE SERIE TEMPORELLE ) Le modèle utilisé est u SARIMA 12 0, 0,5) 0,1,1 ) 12 2 3 4 5 1 B ) X t 2,2519 1 0,0880B 1,1012 B 1,0204 B 0,8088B 0,5005B ) 12 10,23B ) t où suit ue loi Normale N (0 ; 10,51) t 41
2- PREVISION D UNE SERIE TEMPORELLE 42
2- PREVISION D UNE SERIE TEMPORELLE 43
3- ETUDE D UN CREDIT SCORING Objectif: Etablir le profil de risque d u demadeur de crédit 44
3- ETUDE D UN CREDIT SCORING Critères (variables exogèes) - âge - catégorie socio-professioelle - statut familial - ombre d efats - reveu - capacité de remboursemet - défauts de remboursemet sur des prêts atérieurs ou e cours - ombres de prêts atérieurs -.. (o cosidère k critères) 45
3- ETUDE D UN CREDIT SCORING Y est ue variable biaire 1 si défaut de paiemet 0 sio Pour ue certaie valeur des variables exogèes o ote par p(x) la probabilité que Y =1 p( x1, x2,..., xk ) PX 1x1,..., X ( 1) kx Y k x 46
3- ETUDE D UN CREDIT SCORING Le modèle utilisé est u modèle de régressio logistique p( x, x,..., x ) 1 2 x k a0 a1x 1 akxk) a a x a x ) exp... 1 exp... 0 1 1 k k ) p x l a0 a1x 1... akx 1 px ( ) k But: estimer les paramètres a0, a1,..., ak du modèle 47
3- ETUDE D UN CREDIT SCORING Nous disposos d u échatillo de 2300 empruteurs Echatillo d appretissage 1150 empruteurs 2/3 de bos empruteurs 1/3 de mauvais empruteurs Echatillo test 1150 empruteurs (sert à tester le modèle) (sert à établir le modèle) 48
3- ETUDE D UN CREDIT SCORING Les variables exogèes sigificatives sot les suivates - Temps d attete (TIME) - Nombre de prêts atérieurs (NBPANT) - Degré de ratioemet (DEGRAT) - Coditios fiacières (RATIO) - Taux d itérêt aualisé ( TXINT) p l 0.232 23,1TXINT 19,8RATIO 1,08 DEGRAT 0,7NBPANT 0,04TIME 1 p 49
3- ETUDE D UN CREDIT SCORING p l 0.232 23,1TXINT 19,8RATIO 1,08 DEGRAT 0,7NBPANT 0,04TIME 1 p Exemple: TIME= 10 NBPANT= 2 DEGRAT=0 RATIO= 32% TXINT= 10% Probabilité de défaut est estimée à 0,48 50
3- ETUDE D UN CREDIT SCORING E preat u «poit de coupure» à 0,5 sur l échatillo test o prédit correctemet 74,7% des cas (doc 25,3% de mauvaises prédictios) 51
Statistique -Probabilités : gestio des risques Assurace-actuariat (tarifs - clietèles- risques) Fiace (baques, assuraces, sociétés fiacières, cabiet de coseil) Files d attetes Gestio de stock Sodages - marketig Cotrôle de fabricatio-cotrôle qualité Fiabilité Prévisios 52
Actuariat Coceptio de produits. Défiitio de produits : aalyser les risques défiir les garaties élaborer les lois probabilité (mortalité siistre) cocevoir les tarifs et les ormes défiir les méthodes de calcul et les procédures - prévoir les résultats. Adaptatio de produits : cocevoir les outils d aalyse réaliser les études techiques sur le portefeuille - évaluer l évolutio des risques proposer des adaptatios e termes de tarificatio et/ ou de garaties évaluer l évolutio des résultats. Marketig : cibler les produits segmeter la clietèle. 53
Actuariat Gestio de bila/fiace. Comptes : défiir les méthodes d élaboratio des comptes mettre aux ormes les comptes réaliser et suivre les comptes mesuels provisioer les egagemets. Cotrôle de gestio : élaborer des modèles de retabilité faire des études de retabilité aalyser la retabilité cotrôler les prévisios de résultats. Actif / passif : suivre l évolutio des provisios mathématiques évaluer les fods propres suivre les placemets réaliser des scéarios de résultats proposer des stratégies de gestio, aalyser les risques. Etudes: aalyser les tedaces des différets marchés évaluer les portefeuilles cocevoir des systèmes de pilotage cocevoir des modèles de prévisio 54