RTS 53 octobre-décembre 996 Gestio du trafic Applicatio des mélages de lois de probabilité à la recoaissace de régimes de trafic routier Fraçois Couto Medhi Daech-Pajouh INRETS-DART 2 aveue du Gééral Malleret-Joiville 944 Arcueil cedex e collaboratio avec Michel Broiatowsi Uiversité de Reims Nous teos à remercier deux spécialistes de l'aalyse des doées, Messieurs Edwi Diday et Yves Lechevallier, chercheurs à l'inria et eseigats à l'uiversité Paris-Dauphie, pour les précieux coseils qu'ils ot bie voulu ous prodiguer lors de la réalisatio de cette étude. La compréhesio d'u phéomèe et de so évolutio, à partir de séries temporelles, est u domaie de recherche actif. Des spécialistes de disciplies scietifiques très variées s'itéresset à ce sujet, e particulier les probabilistes (calcul stochastique) et les statisticies (estimatio, test, prévisio). De même, des igéieurs ot travaillé à la mise au poit de méthodes diverses das leurs domaies, souvet sas fodemets théoriques, i lie les ues avec les autres. Das cet article, ous ous itéressos à la otio de régime de trafic. Ce cocept est souvet utilisé par les opérateurs de réseaux routiers pour distiguer les coditios de circulatio. U régime correspod à u iveau d'écoulemet ou de fluidité du trafic. Par exemple, e Frace, le dispositif Biso futé utilise trois régimes idetifiés par des couleurs pour le public et par des vitesses pour les gestioaires de trafic : régime fluide ou vert, si la vitesse est supérieure à 50 m/h, régime difficile ou orage, si la vitesse se situe etre 20 et 50 m/h, régime ecombré ou rouge, si la vitesse est iférieure à 20 m/h. Par ailleurs, la Metropolita Expressway Public Corporatio de Toyo a défii des régimes de trafic similaires (plus de 40 m/h, etre 20 et 40 m/h, mois de 20 m/h) [Kaeo et al., 995]. Notre objectif est de détermier les coditios de l'applicatio du modèle de mélage de lois de probabilité à la recoaissace de régimes de trafic routier. Nous idetifios chaque composate du mélage à u régime de trafic. L'applicatio du modèle des mélages de lois de probabilité aux mesures de trafic est ue démarche complètemet ouvelle. Elle cosiste à recoaître les différets régimes de trafic sur ue sectio de route et à étudier leur évolutio au cours du temps. Nous ous sommes e particulier itéressés au problème de la trasitio d'u régime de trafic à u autre. Das ue première partie de l'article, les aspects mathématiques et théoriques du problème sot abordés. Nous présetos tout d'abord le modèle statistique des mélages et quelques exemples, puis u algorithme stochastique permettat d'estimer les valeurs des paramètres d'u mélage, l'algorithme SEM.
Esuite, ous proposos ue méthodologie d'aalyse du trafic routier, fodée sur ce modèle statistique, et reposat sur u découpage de la jourée e périodes à horaire fixe. Cette méthode permet d'ue part de recoaître les régimes de trafic routier et d'autre part de décrire leur évolutio au cours du temps e estimat sur chaque période les paramètres du mélage. Pour fiir, ous exposos les résultats de l'applicatio de cette méthode à u idicateur d'écoulemet mesuré sur le boulevard périphérique parisie, au iveau des portes d'italie et de Getilly. Approche théorique Itroductio U des plus vieux problèmes de la statistique iféretielle est d'estimer ue distributio de probabilité à partir d'u échatillo observé. Bie que de ombreux phéomèes soiet modélisés par des lois de probabilité classiques, il existe des cas où ce cadre théorique 'est pas applicable. Deux approches sot alors possibles, l'approche o-paramétrique ou l'approche paramétrique améliorée. Das cette étude, ous privilégios la secode, avec l'étude des mélages de distributios appliqués au trafic routier. Nous faisos l'hypothèse que la loi d'ue variable aléatoire de doées issues de mesures du trafic routier peut s'iterpréter comme ue combiaiso covexe de plusieurs lois de probabilité. Pour recoaître ces mélages de lois, ous allos utiliser l'algorithme SEM, décrit das la suite de l'article. E pratique, o pred cosciece de ce phéomèe e cosidérat u histogramme de débits à plusieurs modes. L'avatage de cette approche est de doer ue descriptio plus fidèle de la réalité d'u phéomèe, sas empêcher cepedat sa modélisatio mathématique et sa résolutio iformatique. Gééralités sur les mélages de lois Soit u échatillo E ( x x ) = d'ue variable aléatoire X à valeurs das, N d R dot la loi est : K F = p F = où les F sot des mesures de probabilité sur qu'u poit de l'échatillo suive la loi d R de paramètres F, avec 0< < et p θ, les K p =. = P sot les probabilités Le problème cosiste à estimer le ombre K de composates, les paramètres icous P, aisi que les lois icoues F. O peut iterpréter les F comme ue base de l'iformatio. Ue hypothèse de travail est que le mélage de lois appartiee à ue famille de mélages idetifiables (si deux mélages doet exactemet la même loi pour l'échatillo, alors les paramètres de ces mélages sot égaux). 2
Das cette étude, o e s'itéresse qu'au cas où les F appartieet à la même famille paramétrique de lois de probabilité, admettat des desités : ( ) = ( ) f x f x θ Par exemple, das le cas des lois ormales, θ ( µ, σ ) = représete les paramètres moyeevariace ; ous e faisos doc aucue hypothèse d'égalité des variaces das les diverses composates. Si Θ= { θ, θ }, alors p { p, p} comme ue loi de probabilité a priori sur Θ, p Pr{ θ } l'espérace de f ( x θ ) par rapport à la loi p : ( ) ( ) f x = E f x θ p Ue gééralisatio immédiate est le mélage cotiu de lois. Si = peut être cosidéré, das ue optique bayesiee, d'ue loi p, o appelle mélage de la loi F θ, de desité ( ) ( ) = ( θ ) ( θ ) f x f x dp Θ Questios posées par l'idetificatio d'u mélage Ces questios sot multiples : choix de la famille de loi des composates, =, et la desité f ( x ) est alors p θ R est probabilisable, mui f x θ, par p, la loi de desité : détermiatio du ombre de composates du mélage il est impossible de coaître simplemet le ombre de composates du mélage ; par exemple, la -modalité du oyau d'u histogramme e permet pas d'affirmer que le mélage est à composates, estimatio des paramètres d'u mélage il faut d'ue part estimer les probabilités mélageates p p θ θ des K lois mélagées. ( ), d'autre part les paramètres ( ),, L'algorithme SEM Présetatio du problème Pour estimer les paramètres du mélage, ous allos utiliser la méthode du maximum de vraisemblace. Nous ous trouvos das le cas où l'iformatio est miimale, seul l'échatillo x x de la variable aléatoire X est dispoible. Nous imposos d'abord le choix d'ue ( ), N 3
famille de lois (gaussiees). La vraisemblace V et la log-vraisemblace L sot, das le cas d'observatios idépedates : N V x x p p p f x (,, θ, θ,, ) = (, θ ) N N K i i= =, K N K L x x p p p f x (,, θ, θ,, ) = l (, θ ) N N K i i= = Cette méthode cosiste à predre comme estimatio des paramètres, les valeurs de Θ= { θ θ } et de p { p p }, = qui maximiset la vraisemblace. Ituitivemet,, puisque V représete ue desité de probabilité, cela reviet à supposer que l'évéemet qui s'est produit était le plus probable. Le problème de la vraisemblace o borée U des défauts de la méthode du maximum de vraisemblace das le modèle des mélages de lois de probabilité est que la foctio de vraisemblace associée 'est pas toujours borée. Si o cosidère u échatillo ( x, x ) proveat d'u mélage de plusieurs lois ormales uidimesioelles et si l'ue des composates e cotiet qu'u seul poit, alors la vraisemblace est o borée. De cette faço, tout poit de l'échatillo peut provoquer u maximum ifii. Ue hypothèse aturelle est d'imposer à toutes les composates la même variace (homoscédasticité), mais c'est ue cotraite forte qui 'est pas vérifiable das le cadre de otre étude. Cepedat, e pratique, ces poits siguliers de l'espace des paramètres 'apparaisset presque jamais. O peut alors passer outre les hypothèses précédetes [Celeux et al., 995]. Les algorithmes de type EM L'algorithme EM, pour estimatio-maximisatio, de Dempster, Laird et Rubi [977] est souvet utilisé pour estimer les paramètres d'u mélage de lois de probabilité par la méthode du maximum de vraisemblace. Cepedat, das certaies situatios, cette approche 'est pas applicable, du fait de la difficulté de l'étape d'estimatio du maximum de la foctio de vraisemblace. Pour remédier à ce problème, des versios stochastiques de EM ot été proposées. E particulier, SEM de Broiatowsi, Celeux et Diebolt [983], où l'étape d'estimatio est précédée par le tirage d'ue variable aléatoire multiomiale ou bie MCEM fodée sur le pricipe d'itégratio par les méthodes de Mote-Carlo. Ue approche alterative a été élaborée récemmet. Cet algorithme, ommé SAEM, est ue adaptatio de SEM à la méthode du recuit-simulé [Press et Teuolsy, 992]. Des résultats théoriques ot été démotrés pour certaies familles expoetielles. O cosultera à ce propos l'article de Wu [983]. Celeux, Chauveau et Diebolt coseillet das ue publicatio récete [Celeux et al., 995] d'utiliser l'algorithme SEM car il se révèle le meilleur outil d'exploratio des doées et de recoaissace Das cette étude ous travaillos uiquemet sur des mélages de lois de Laplace-Gauss, car les calculs e sot simplifiés et les résultats obteus sot satisfaisats. 4
des mélages que les composates soiet itriquées ou séparées. De plus, les régios itéressates de l'espace des paramètres peuvet être détermiées, e se reposat sur les résultats de SEM, ou e se fodat sur des cosidératios issues de l'expériece. C'est pourquoi ous avos travaillé avec l'algorithme SEM pour aalyser les doées réelles de trafic routier. Déroulemet de l'algorithme SEM Iitialisatio : au départ, o fixe K majorat supposé du ombre de composates du mélage ; puis, e chaque poit x i de l'échatillo, o géère aléatoiremet les K probabilités iitiales t x, avec 0 d'apparteace, ou affectatio, à l'ue des composates ; elles sot otées ( ) 0 0 < t ( x ) < et t ( x ) 0 i K i =. = t x. 0 Ces probabilités formet u vecteur de dimesio K, oté ( ) Étape stochastique : à l'itératio, pour chaque poit la variable aléatoire multiomiale ( i ) t ( x i ). Les coordoées de ( i ) z ( x ) =. i i x i de l'échatillo, o simule u tirage de z x 2 de dimesio K, ayat pour paramètre le vecteur z x sot toutes ulles, sauf pour ue valeur de où { } { i i } O ote z ( xi) = z ( xi) ; =, K. Les réalisatios ( i ) de l'échatillo avec C = x, si z ( x ) =. { C, C K } Si pour u certai, ( ) 0 z x défiisset ue partitio Card C =, l'algorithme est réiitialisé avec K composates. Étape de maximisatio : o calcule les estimatios du maximum de vraisemblace ( p, θ ) Φ = des paramètres du mélage sur la base des sous-échatillos, +, +, + N + = ( i) N. i= p z x θ i C ; o a L'estimatio des, + déped de la famille paramétrée, posée a priori, des composates du mélage. Das le cas où l'espérace m et l'écart type s s sot les costituats des paramètres (mélage de gaussiees, de lois de Poisso, d'expoetielles ), les estimatios à l'itératio sot : z x est appelée variable cachée du modèle par certais auteurs. 2 ( ) i 5
m = N + i= N i= ( ) z x x i i z ( x ) i et σ = N 2 i=, + + ( ) ( ) z x x m i i Étape d'estimatio : à partir des, + ( p, +, θ, + ) N i= z ( x ) Φ =, o calcule le vecteur des probabilités a posteriori d'apparteace à ue composate, dot les K coordoées sot détermiées aalytiquemet par la formule : t ( x ) = + i K p f x j= (, θ ) (, θ ) + + i p f x + + j i j Mise e œuvre de SEM Comme o e sait pas quels sot les critères de statioarité de la suite des paramètres, o fait tourer l'algorithme suffisammet logtemps pour être assuré d'avoir atteit cet état statioaire (phase d'appretissage). O exécute esuite r itératios, ce qui permet de calculer la moyee et la variace empirique de chaque paramètre (phase d'exploitatio). Si la taille de l'échatillo est trop faible (empiriquemet N K 20 ), et que les composates du mélage sot peu séparées, l'algorithme SEM peut sous-estimer K. Or le choix de K lors de la phase d'iitialisatio est ue étape essetielle de la méthode ; il coviet doc de surestimer K, plutôt que le sous-estimer, puisque seule ue surestimatio peut être décelée par SEM (voir ifra). Si N est très grad plusieurs milliers d'observatios la perturbatio stochastique perd de so ifluece. Si le bo ombre de composates K est cou, et si celles-ci sot bie séparées, l'algorithme EM est préférable à SEM, e raiso de sa simplicité. Das tous les autres cas, SEM doe de meilleurs résultats. Das le cas d'ue surestimatio de la valeur de K fourie lors de l'iitialisatio de l'algorithme, SEM restitue certaies classes vides ; il faut alors relacer l'algorithme avec u ombre de classes plus faible. Caractéristiques de SEM Les tirages aléatoires empêchet la suite des paramètres estimés { θ }, géérée par SEM, de coverger vers le premier poit statioaire recotré de la vraisemblace. À chaque itératio, il y a ue probabilité o ulle que la ouvelle estimatio des paramètres 'augmete pas la vraisemblace. C'est pourquoi SEM peut éviter les maxima locaux ou les cols. La suite des paramètres estimés { θ } géérée par SEM e peut alors coverger poctuellemet. Cepedat, sous certaies hypothèses, il est possible de motrer que l'algorithme coverge e loi. i 2 6
Applicatio aux doées de trafic routier Nous allos préseter tout d'abord ue méthodologie d'aalyse de trafic routier fodée sur le modèle des mélages de lois de probabilité. Puis ous détailleros la démarche exploratoire, les résultats empiriques obteus et les difficultés recotrées. Das de ombreuses études sur les mélages de lois, l'objectif est la validatio d'u algorithme de recoaissace de mélages de lois de probabilité à partir de doées issues de mélages simulés. Notre démarche est différete, puisque ous cherchos à modéliser le comportemet du trafic routier e ous appuyat sur le modèle des mélages. Pour meer à bie cette étude ous faisos plusieurs hypothèses, qui sot toutes compatibles avec les coaissaces actuelles sur le trafic routier sas cepedat e redre e compte das tous leurs aspects. O suppose par exemple que : l'état du trafic à l'istat t déped de l'état du trafic das le passé, sur la période d'observatio, la desité de la loi de probabilité du trafic e se modifie pas. La première hypothèse soulève le problème de la dépedace par rapport au temps des doées utilisées. E théorie, o peut estimer des statistiques sur ue populatio, seulemet si l'échatillo a été tiré selo des règles rigoureuses, qui e assuret la représetativité. Le mode de tirage le plus simple, pour parveir à ce résultat, est l'échatilloage aléatoire simple correspodat à des tirages équiprobables et idépedats les us des autres. Sous cette coditio, les observatios devieet des réalisatios d'ue variable aléatoire abstraite du phéomèe cosidéré. Les doées brutes que ous traitos e vérifiet pas cette exigece. Par ailleurs, o e sait démotrer la covergece de SEM que das quelques cas où les observatios sot idépedates, ce qui 'est pas forcémet le cas des doées de trafic. Cepedat les résultats de l'aalyse que ous avos effectuée e passat outre à cette restrictio sot satisfaisats. Aalyse du trafic routier à partir de mélages de lois de probabilité Nous supposos d'ue part que le trafic est composé de régimes stables, c'est-à-dire tels que les paramètres des composates du mélage variet faiblemet au cours du temps. Comme ous travaillos sur des mélages de gaussiees, il e découle que la moyee et la variace des composates sot stables. Il apparaît d'autre part évidet que les coditios de circulatio évoluet au cours de la jourée ; ces modificatios se reflètet essetiellemet sur les variatios des poids associés aux composates stables idiquat les qualités de trafic. Pour que ces modificatios de poids apparaisset, ous découpos la jourée étudiée e périodes (ou traches) à horaire fixe. Sur chacue d'etre elles, ous évaluos les paramètres du mélage. Il est coseillé d'avoir au mois ciq cets mesures de trafic par période. Hypothèses du modèle L'état du trafic à l'istat t déped de l'état du trafic das le passé. Ue variable aléatoire issue de mesures de trafic routier est de loi mélagée de lois ormales. L'impact des variables exogèes (météo, grads départs, accidets ) est reflété par les variables edogèes (débit, taux d'occupatio, ombre de poids lourds ). 7
Cette derière hypothèse e sigifie pas que le modèle soit etièremet autoprojectif ; e effet, so évolutio future est détermiée au mois partiellemet par les variables exogèes futures. Nombre de composates du modèle O applique l'algorithme SEM aux doées historiques e faisat varier le ombre de composates e etrée. Le ombre recommadé pour celles-ci est compris etre trois et ciq. À l'aide des tests de Kolmogorov-Smirov et de Ma-Whitey, o détermie le ombre K de composates doat les meilleurs résultats. Il est égalemet evisageable de predre comme référece le ombre de régimes de trafic que le gestioaire cosidère, par expériece, comme adapté à la sectio de route e questio, et utilise comme tel. Recoaissace des mélages par période Pour chaque période, o lace l'algorithme SEM avec K composates e etrée. Le ombre d'itératios peut aller jusqu'à mille et l'o sauvegarde la solutio toutes les ciquate itératios. O coserve le mélage qui doe les meilleurs résultats aux tests précités. Pour la cohérece de l'aalyse, il faut sélectioer u mélage ayat des composates proches, e moyee et variace, de celles des périodes précédetes et ultérieures. Toutefois, si l'o part das SEM d'ue solutio au hasard, les solutios touvées peuvet e pas respecter cette hypothèse de stabilité. Il est doc recommadé d'imposer comme coditios iitiales u mélage équiprobable, avec des paramètres proches de ceux des traches adjacetes. Classificatio de l'historique Nous affectos u poit de l'échatillo à la composate du mélage qui maximise sa probabilité a posteriori d'apparteace. La fiabilité de cette étape déped de l'algorithme de recoaissace de mélage utilisé. Par exemple, SEM produisat des classes empiétates, o recotre des problèmes d'affectatio d'ue mesure à ue uique composate. Calcul des matrices de trasitios et de sauts Les matrices de trasitios sot ue des représetatios possibles de l'évolutio des régimes de trafic au cours du temps. L'élémet ij de la matrice est la proportio des idividus apparteat à la classe i à l'istat t qui appartieet à la classe j à l'istat t + h, h état la durée de la période. { () ( ( ) = ( + ) = )} Card x () t composate x () t = i Card x t composate x t i composate x t h j Trasitio ij = { } Pour expliquer les chagemets de régime, ous utilisos u idicateur quatitatif appelé saut. U saut ij est l'écart, e valeur absolue, etre ue mesure de trafic apparteat au régime j à l'istat t + h, et au régime i e t. D'ue maière idetique à celle des matrices de trasitio, o peut calculer les matrices des moyees, des écarts types, des médiaes, des miima et des maxima des sauts. Les matrices de sauts permettet de coaître la variatio écessaire de trafic imposat le passage d'u régime à u autre. 8
Estimatio e temps réel du régime de trafic à l'horizo h E calculat le produit du vecteur des probabilités a posteriori d'apparteace d'u poit à ue composate et de la matrice des trasitios, o obtiet le vecteur des probabilités d'apparteace à chacu des régimes à l'horizo h. Pour avoir ue estimatio du régime le plus probable à l'horizo h, il suffit de faire le produit des matrices des trasitios cosécutives. Cepedat, état doé les problèmes de fiabilité de la classificatio de l'échatillo, plus l'horizo est loitai, plus la qualité de l'estimatio est médiocre. Figure : Procédure de recoaissace de régimes de trafic routier Doées de l'historique du poit de prévisio Nombre de composates du mélage EN Recoaissace des mélages par trache de durée h TEMPS Classificatio de l'historique DIFFERE Calcul des matrices de trasitios et de sauts Doées récetes du poit de prévisio EN Calcul des probabilités d'apparteace Produit des probabilités d'apparteace avec les matrices de trasitios TEMPS Estimatio du régime de trafic REEL Applicatio au boulevard périphérique parisie Nous allos à préset appliquer la méthode des mélages de lois de probabilité au boulevard périphérique parisie, e vue de retrouver les différets régimes de trafic. Pour étudier l'écoulemet du trafic, ous avos besoi d'ue mesure quatifiat la qualité de cet écoulemet. Les doées de trafic du périphérique parisie sot caractérisées par u taux d'occupatio très istable. À u même débit sot associées deux cocetratios (ou deux taux d'occupatio), correspodat l'ue à u trafic fluide, l'autre à ue circulatio saturée. Avec l'augmetatio de la 9
cocetratio, les iteractios etre les véhicules devieet plus importates et la vitesse dimiue 3. O passe alors à u autre régime de trafic. Le rapport etre débit et cocetratio permet de distiguer ces deux types de situatios. Mais, e pratique, o e peut utiliser que le taux d'occupatio (to) 4, car les boucles magétiques pour le recueil des doées e doet pas directemet la cocetratio. Plutôt que d'utiliser la relatio fodametale etre le débit q(x,t), la vitesse u(x,t) et la cocetratio (x,t) d'u flot de véhicules e u poit x à l'istat t : (, ) u x t (, ) (, ) q x t x t =, ous avos doc utilisé u autre idicateur de fluidité, que ous ommos dst. C'est ue sorte de vitesse brute, que ous défiissos par la relatio suivate : () dst t () () qt = to t À l'iverse des mesures de débit, la fluidité de la circulatio croît avec le dst. U dst faible caractérise u écoulemet difficile, tadis qu'u dst élevé est sige d'u écoulemet facile. L'objectif est maiteat d'aalyser les mécaismes de variatio de cet idicateur. Nous avos pris comme doées réelles celles relatives à la porte d'italie sur le boulevard périphérique itérieur (voir figure 2). Le débit utilisé est celui des capteurs des trois files du périphérique. Le taux d'occupatio est ue moyee etre les mesures effectuées au même istat à la porte d'italie et sur des capteurs situés à eviro ciq cets mètres e aval, au iveau de la porte de Getilly. Nous teos compte du taux d'occupatio des capteurs placés e aval, car la cocetratio (directemet liée au to) agit das le ses iverse de la circulatio, et a u effet sesible à cette distace. Les doées historiques eregistrées sot réparties sur vigt et ue jourées du mois de juillet 994 5. Nous avos étudié e particulier la matiée, que ous avos découpée e périodes ou traches à horaire fixe. Pour celles-ci ous avos adopté ue durée de seize miutes, choix qui s'explique à la fois par ue grade variabilité du trafic, et par la fréquece d'acquisitio des doées, toutes les quarate secodes. Les périodes observées vot de [7 h 52mi 40s-8 h 8mi 0s] à [9 h 28mi 40s-9 h 44 mi 0 s]. Pour chaque jourée d'eregistremet, chaque trache cotiet vigt-quatre mesures. Nous disposos doc e théorie de 2 24 = 504 doées par trache. 3 La vitesse est ue foctio mootoe décroissate de la cocetratio. 4 O peut déduire la cocetratio directemet du taux d'occupatio. 5 Le 30 jui 994; les, 4, 6 et 8 juillet 994, aisi que du 3 au 27 juillet 994 ; au total vigt et ue jourées, soit trois ludis, deux mardis, quatre mercredis, jeudi et vedredi, deux samedis et dimaches. 0
Figure 2 : Emplacemet des capteurs sur le périphérique etre la porte d'italie et la porte de Getilly Ses du trafic 3 2 2 0 5 4 3 Porte d'italie Porte de Getilly Résultats fouris par l'algorithme SEM Après exploratio des doées, ous avos choisi u modèle de mélages à quatre composates. Le ombre de composates est issu de l'adéquatio fourie directemet par l'algorithme SEM (après stabilisatio), et par les tests d'ajustemet de Ma-Whitey et de Kolmogorov-Smirov etre les simulatios réalisées sur la base du modèle à quatre composates estimé et les doées réelles. Les régimes de trafic choisis sot proches de ceux défiis par les opérateurs, e termes de fluidité. L'existece d'u régime supplémetaire (très facile) par rapport à ceux qu'utiliset les opérateurs s'explique par le fait que les opérateurs s'itéresset surtout aux situatios de trafic dese et e fot pas la différece etre vitesse élevée et très élevée. Nous adopteros pour otre part les covetios suivates : composate TD pour u écoulemet très difficile, à vitesse d'eviro 6 m/h, composate D pour u écoulemet difficile, à vitesse d'eviro 7 m/h, composate F pour u écoulemet facile, à vitesse d'eviro 60 m/h, composate TF pour u écoulemet très facile, à vitesse d'eviro 70 m/h. Évolutio temporelle des paramètres du mélage Les figures 3 à 5 représetet l'évolutio des valeurs des paramètres des mélages pour la variable dst, telles qu'elles ressortet de l'applicatio de l'algorithme SEM aux doées de la porte d'italie. La figure 3 représete l'évolutio horaire des moyees de chaque composate. O ote la stabilité des moyees des quatre régimes. Les composates à dst faible sot bie idetifiables, tadis que les composates fortes sot plus istables. À maites reprises SEM e doe que trois composates ; cette istabilité du ombre de composates est ihérete aux doées et à l'adéquatio fourie par l'algorithme stochastique SEM.
Figure 3 : Variatio de la moyee des composates d'ue trache à l'autre TD - très difficile D - difficile F - facile TF - très facile 450 400 350 300 250 200 50 00 50 0 07:52 08:08 08:24 08:40 08:56 09:2 09:28 09:44 La figure 4 représete l'évolutio horaire des poids de chaque composate. Comme les régimes F et TF, correspodat aux coditios favorables de trafic, sot proches, ous allos plutôt observer, par souci de clarté, les différeces etre la somme des poids des régimes faciles et celle des régimes difficiles. C'est ce qu'illustre la figure 5. Le fait marquat est ue amélioratio progressive de la situatio au cours de la matiée. Cette tedace, qui sera cofirmée par l'étude des matrices de trasitio, est sas doute due au début de résorptio de la poite du mati (vers 8h40). Figure 4 : Variatio du poids des composates d'ue trache à l'autre TD - très difficile D - difficile F - facile TF - très facile 0,5 0,45 0,4 0,35 0,3 0,25 0,2 0,5 0, 0,05 0 07:52 08:08 08:24 08:40 08:56 09:2 09:28 09:44 2
Figure 5 : Variatio des poids du trafic facile et difficile d'ue trache à l'autre trafic difficile trafic facile 0,7 0,6 0,5 0,4 0,3 0,2 0, 0 07:52 08:08 08:24 08:40 08:56 09:2 09:28 09:44 Classificatio iduite par les probabilités a posteriori d'apparteace d'u poit à u régime Pour classer les doées historiques, ous avos utilisé les probabilités a posteriori d'apparteace d'u idividu à ue composate. Chaque idividu est affecté à la composate qui miimise le risque bayesie, ce qui est équivalet à predre la probabilité a posteriori d'apparteace la plus grade. Mais il faut oter que des mélages ayat des moyees très proches doerot des classes empiétat les ues sur les autres. Les tableaux doet, pour illustrer ce problème, le résultat de deux classificatios. Tableaux : Classificatio des doées selo les composates pour deux traches horaires Trache [7 h 4 mi 40 s à 7 h 20 mi 0 s] Régime Poids de la composate (e %) Pourcetage d'affectatio TD 45,4 46,5 D 3,8 4,2 F,6 5,9 TF,2 6,5 Trache [7 h 20 mi 40 s à 7 h 36 mi 0 s] Régime Poids de la composate (e %) Pourcetage d'affectatio TD 53,7 55, D 24,6 29,3 F 0,4 0,9 TF,2 4,7 Comme o le costate, il 'y a pas ue boe adéquatio etre les poids des composates estimés par l'algorithme SEM à partir de l'échatillo et les résultats de la classificatio iduite par les probabilités a posteriori d'apparteace d'u idividu à ue composate. 3
Ce phéomèe est ormal, il résulte du fait que l'algorithme SEM produit implicitemet des classes qui se recoupet, alors que ous voulos ue partitio de l'échatillo des mesures pour calculer les matrices des trasitios. Cepedat, cette distorsio de la classificatio de l'échatillo pourrait être attéuée e preat les tirages de la loi multiomiale (la variable cachée du modèle) lors de l'étape stochastique de SEM, à l'itératio qui maximise le critère de vraisemblace. O peut égalemet evisager d'étudier d'autres méthodes de recoaissaces de mélages de lois de probabilité, e privilégiat cette fois l'approche classificatio plutôt que l'aspect estimatio (voir [Schroeder, 976]). III.5 Aalyse À ce degré d'avacemet de l'étude, les résultats obteus permettet d'avoir ue aalyse sythétique de l'état du trafic et de so évolutio d'u quart d'heure à l'autre. De plus, à partir des probabilités a posteriori, ous pouvos détermier e temps réel à quel régime de trafic appartiet la mesure à l'istat t et quelle est so évolutio probable. E résumé, les quatre régimes de trafic se caractériset de la faço suivate : u régime au dst faible, correspodat à ue vitesse de 6 m/h, à u taux d'occupatio très élevé et à u débit faible ; ous l'assimilos à u régime de cogestio, appelé très difficile ou TD, u régime au dst u peu plus élevé, correspodat cette fois à u to plus faible et à u débit très supérieur, équivalet à ue vitesse de 7 m/h ; ous l'idetifios comme u trafic très chargé, qui s'écoule difficilemet mais sas blocage complet, et l'appelos difficile ou D, deux régimes au dst élevé, reflétat ue circulatio relativemet facile, peu chargée, avec des vitesse de véhicules comprises etre 60 et 90 m/h ; ces deux régimes, qui se caractériset par u débit différet mais des taux d'occupatio du même ordre, sot appelés facile ou F, et très facile ou TF. Bie que les élémets de la populatio bouget beaucoup etre les régimes difficiles (TD et D) et faciles (F et TF), il y a très peu de trasitios etre les deux groupes (voir tableau 2). De ce fait, ces régimes e semblet pas être artificiels. D'ailleurs, les gestioaires utiliset de faço empirique la otio de régime pour caractériser les différets types de circulatio. Tableau 2 : Trasitios de la trache [8 h 56 mi à 9 h 2 mi], e lige, vers la trache [9 h 2 mi à 9 h 28], e coloes TD D F TF TD 72 % 28 % 0 % 0 % D 63 % 37 % 0 % 0 % F 0 % 0 % 8 % 9 % TF 0 % 0 % 60 % 40 % Les problèmes de classificatio se fot setir surtout pour les régimes faciles. Nous expliquos cette istabilité par leur proximité, e moyee. C'est ue des difficultés classiques de la recoaissace de mélages. Ce problème e uit cepedat pas à l'objectif pricipal, qui reste de détecter les régimes de cogestio, les seuls qui importet pour les gestioaires de trafic. 4
Les valeurs des sauts de la composate i vers la composate j sot proches de la différece etre les moyees des composates. Das le cas où l'idividu reste das le même régime, le saut moye est proche de l'écart type de la classe (voir tableaux 3 et 4). Grâce à ces matrices de trasitios, ous pouvos avoir ue estimatio qualitative de l'évolutio du trafic à trete-deux, voire quarate-huit miutes, la qualité du résultat dimiuat avec l'horizo de la prévisio. Il suffit de multiplier les matrices de trasitios cosécutives. Nous auros aisi la probabilité e partat d'u régime i d'aller vers le régime j, e cosidérat tous les chemis possibles. Tableau 3 : Sauts moyes e dst de la trache [8 h 56 mi à 9 h 2 mi], e liges, vers la trache [9 h 2 mi à 9 h 28 mi], e coloe TD D F TF TD 3 55 0 0 D 44 27 0 0 F 0 0 32 7 TF 0 0 87 88 Tableaux 4 : Poids, moyees et écarts types e dst des composates pour deux traches horaires Trache [8 h 56 mi à 9 h 2 mi] Régime Poids Moyee Écart type TD 6, % 36 2 D 3,7 % 95 30 F 0 % 382 2 TF 42,2 % 429 87 Trache [9 h 2 mi à 9 h 28 mi] Régime Poids Moyee Écart type TD 29,8 % 42 5 D 7,9 % 94 28 F 26,6 % 372 49 TF 25,8 % 438 82 Coclusio Nous avos cosacré cette étude à la discrimiatio de régimes de trafic sur ue sectio de route. L'idée pricipale est d'assimiler ces régimes aux composates d'u mélage de lois de probabilité, estimées à l'aide de l'algorithme SEM. Nous avos obteu des résultats itéressats sur : la ature des doées à traiter et la structure du trafic ; ous avos retrouvé les régimes effectivemet utilisés par les opérateurs des réseaux routiers, l'évolutio temporelle des composates des mélages, 5
les chagemets de structure des régimes de trafic routier, l'importace des perturbatios qui modifiet la structure du trafic. Il reste cepedat de ombreuses voies de recherche et d'applicatios à explorer. Ue aalyse qualitative à court terme de trafic routier 'est pas suffisate, il est écessaire de la compléter par ue prévisio quatitative. Cet objectif peut être atteit e couplat ue aalyse par les mélages, à ue méthode de prévisio quatitative, comme ATHENA [Daech-Pajouh et Aro, 994], ce qui permettrait de juger de la ature du trafic prévu, de comparer so évolutio avec les matrices de trasitio et de détecter des modificatios de l'écoulemet. Cette méthode d'aalyse de trafic pourrait être utilisée pour ue prévisio à u horizo de moye terme et o de court terme, comme celle utilisée pour l'opératio Biso futé. O pourrait aisi faire iterveir la otio de scéarios, e associat à chaque situatio courate idetifiée par les gestioaires u régime et ue probabilité de réalisatio. Des mélages obteus à partir des doées de débit doet ue estimatio de la capacité de la sectio de route relative au poit de relevé des mesures, la composate la plus forte e moyee reflétat les fluctuatios des débits aux coditios de capacité. Ue telle utilisatio des mélages a été evisagée par S. Cohe [987]. L'utilisatio des techiques de Bootstrap [ Efro et Tibshira, 993] pourrait être evisagée pour l'estimatio des mélages, aisi que das le calcul des matrices de trasitios das le but de les redre plus robustes. Bibliographie Broiatowsi M., Celeux G., Diebolt J. Recoaissace de mélages de desités par u algorithme d'appretissage probabiliste, I Diday E. et al. (sous la directio de) : Data Aalysis ad Iformatics, North Hollad, p. 359-374, 983. Celeux G., Diebolt J. A stochastic approximatio type EM algorithm for the mixture problem, Stochastics Reports, 4, p. 9-34, 992. Celeux G., Chauveau D., Diebolt J. O stochastic versios of the EM algorithm, Rapport de recherche INRIA, 254, 995. Cohe S. A patter recogitio techique applied to the estimatio of motorway capacity, Review Modellig, Simulatio ad Cotrol, part C, Vol. 9, 4, p. 35-42, 987. Couto F. Applicatio des mélages de lois de probabilité à la recoaissace de régimes de trafic routier, Rapport de stage INRETS, 995. Daech-Pajouh M., Aro M. ATHENA, Prévisio à court terme du trafic sur ue sectio de route, Rapport INRETS, 77, 994. Dempster A. P., Laird N. M. et Rubi D. B. Maximum lielihood from icomplete data via the EM algorithm, Joural of the Royal Statistical Society, B 39, p. -38, 977. Efro B. R., Tibshira I. A itroductio to the Bootstrap, Chapma ad Hill ed., 993. Kaeo Y. et al. The judgemet of the trafic coditio by usig the cluster aalysis, VNIS ad Pacific Rim TrasTech Coferece, 995. 6
Lecoutre J.-P., Tassi P. Statistique o-paramétrique et robustesse, éditios Ecoomica, 987. Press W. H., Teuolsy S. A. Numerical recipes, Cambridge Uiversity Press, 992. Schroeder A. Aalyse d'u mélage de distributios de probabilité de même type, Revue de Statistique appliquée, Vol. XXIV,, p. 39-62, 976. Wu C. F. O the covergece properties of the EM algorithm, Aals of Statistics,, p. 95-03, 983. Résumé Das cet article, ous cosidéros que les mesures de trafic (débit et taux d'occupatio) sot issues d'ue variable aléatoire. Les études empiriques motret qu'il est assez rare que la loi d'ue telle variable aléatoire soit simple,c'est-à-dire correspode à u mode uique de comportemet, comme pourrait l'idiquer ue variable de loi ormale. Nous supposos que la loi complète de cette variable aléatoire abstraite de trafic est u mélage de plusieurs lois, où chaque composate idetifie u comportemet particulier du trafic, appelé régime. Nous retrouvos aisi ue otio fréquemmet utilisée par les opérateurs des réseaux routiers pour distiguer les différetes coditios de circulatio d'u réseau. Das ue première partie, ous présetos le modèle statistique des mélages et u algorithme (SEM) estimat les valeurs des paramètres d'u mélage, puis ous proposos ue méthodologie d'aalyse de trafic routier, fodée sur ce modèle. Elle permet d'ue part de recoaître les régimes de trafic routier et d'autre part de décrire leur évolutio au cours du temps. Efi ous exposos les résultats de l'applicatio de cette méthode à des mesures de trafic du boulevard périphérique parisie, au iveau des portes d'italie et de Getilly. Abstract I this paper we cosider that traffic measuremets (flow ad occupacy) are produced by a abstract radom variable. Empirical studies have show that it is fairly rare for the distributio of such a variable to be simple, i.e correspodig to a sigle behaviour mode, for example, a ormal distributio. We assume that the complete distributio of this abstract radom traffic variable is a combiatio of several distributios each compoet of which idetifies a specific behaviour of traffic, ow as a regime. This is a cocept which is frequetly used by the operators of road etwors i order to idetify differet traffic coditios withi a etwor. I the first sectio we will preset the statistical mixtures model ad a algorithm (SEM) which estimates the values of the parameters i a mixture. We ext put forward a methodology for the aalysis of road traffic which is based o this model. This methodology provides a meas of idetifyig road traffic regimes ad describig their chage over time. Fially, we give a accout of the results of a applicatio of this techique to traffic measuremets made o the Paris boulevard périphérique at the Porte d'italie ad the Porte de Getilly. 7