Trafic aérien de passagers au Canada : une analyse exploratoire du modèle origine-destination de Transports Canada pour le marché intérieur Ismaëlh Cissé Directeur : Carlos Ordás Criado
Problématique Transports Canada (TrC) utilise une équation simple pour effectuer des prévisions annuelles du trafic de passagers au Canada : T odt = f (Fare odt, GDP ot, GDP dt, TC odt, QS odt, LG odt ) + ε odt Ce modèle a le mérite et le défaut de sa simplicité : 1 facile à estimer et à utiliser pour la prévision ; 2 la théorie économique établit un potentiel problème du biais d endogénéité ; 3 quelle forme fonctionnelle choisir?
Problématique Forme fonctionnelle flexible proposée par Transports Canada : modèle Box-Cox généralisé. modèle log-linéaire : ln T odt = α od + α t + β ln x odt + ε odt modèle Box-Cox : T λ T odt 1 λ T Méthode d estimation : panel à effets fixes = α od + α t + β x λx odt 1 λ x + ε odt
Objectif du travail 1 Tester l adéquation du modèle Box-Cox postulé par TrC (erreurs) 2 Perf. prédictive intra-échantillon : REQM = #obs.. Test de l hypothèse d empilement : test de Fisher Test de spécification : test de Ramsey 2 Proposer des alternatives : Capturer l hétérogénéité entre OD modèle à coeff. variables : T odt = α od + β od x odt + ε odt Ne pas imposer une forme fonctionnelle particulière : régression non paramétrique : T odt = g(x odt ) + ε odt
Revue de littérature Pesaran, Pearce et Kumar (1989, Econometrica) Est-il pertinent d agréger des données régionales pour améliorer le pouvoir prédictif d un modèle? comparer l erreur de prévision basée sur les régressions régionales (modèle SUR) et a celle de la régression avec données agrégées! Ils proposent un test d agrégation parfaite. Attention, la mauvaise spécification joue un rôle confondant. Prévision de l emploi dans différents secteurs aux É-U : rejet des modèles avec données agrégées ; modèles agrégés semblent biaisés (mal spécifiés).
Revue de littérature Carson, Cenesizoglu et Parker (2011, International Journal of Forecasting) Prévision macroéconomique du trafic de passagers aux É-U avec des données régionales et mensuelles entre 1990 et 2002. Prévision hors échantillon de 2003 à 2004. Modèles utilisés : une équation dynamique estimée avec des données agrégées, désagrégées et semi-agrégées. Mesures de performance prédictive : EAM et REQM. Modèle désagrégé performe mieux que le modèle agrégé. Modèle semi-désagrégé donne de meilleures prévisions que les deux autres modèles. pas d investigation sur la forme fonctionnelle.
Les données 1 Les données sont fournies par Transports Canada. 2 Nous nous concentrons sur le marché intérieur. 3 Panel de 392 couples origine-destination de l intérieur du Canada, couvrant la période 1995-2010. Matrice des corrélations entre les variables Tod TC Fare LG GDPo GDPd Tod 1.00 TC -0.03 1.00 Fare -0.33 0.03 1.00 LG 0.15-0.04-0.12 1.00 GDPo 0.41-0.06-0.12-0.04 1.00 GDPd 0.40 0.01-0.14-0.03-0.04 1.00
Modèles utilisés par Transports Canada Modèles paramétriques à effets fixes (ind. et temp.) Log-linéaire Box-Cox λ = 0.09 TC 0.009 0.008 FARE -0.36*** -0.42*** LG -0.2-0.29 GDPo 0.44* 0.65*** GDPd 0.47* 0.85*** QS5 0.14** 0.32** REQM 19 406 17 417 H0 : empile. correct 0.000 0.000 H0 : spécif. correcte 0.000 0.000 Nous estimons une version simplifiée du modèle Box-Cox. REQM Prévisions intra-échantillon : moyenne = 17417 46593 37%. Problème : modèles mal spécifiés et rejet de l empilement.
Modèles à coefficients variables Log-linéaire Box-Cox Coef. déterm. Coef. déterm. Constante -0.26 1.67 TC 0.0002-0.003 FARE -0.19-0.24 LG 0.14 0.23 GDPo 0.43 0.36 GDPd 0.68 0.61 QS5 0.02 0.06 REQM 10 596 10 500 le modèle log-lin. au Box-Cox. 10500 46593 23% réduction substantielle de la REQM lorsque l on prend en compte l hétérogénéité entre les OD.
Modèle non paramétrique (localement linéaire) Graphique d effets partiels de l estimation non paramétrique : REQM = 2900 2900 46593 6.2%. Modèle très performant intra-échantillon, simple à estimer et sans contrainte de forme fonctionnelle. D importantes non linéarités apparaissent.
Conclusions Les modèles Box-Cox de TrC ne sont pas les plus adéquats. ils violent l hypothèse de spécification correcte de la forme fonctionnelle ; ils violent l hypothèse d empilement (ils capturent mal l hétérogénéité entre OD) ; ils ne fournissent pas la meilleure performance prédictive intra-échantillon. La régression non paramétrique semble être une bonne alternative. Limites de l étude : 1 besoin de vérifier la performance hors échantillon ; 2 il faudrait explorer/traiter le biais potentiel d endogénéité, 3 les marchés transfrontaliers et internationaux restent à explorer.
Merci de votre attention