Fermetures d usines, plans d embauches, commandes géantes, publications

Documents pareils
MATHEMATIQUES FINANCIERES

La rentabilité des investissements

Le mode de fonctionnement des régimes en annuités. Secrétariat général du Conseil d orientation des retraites

Rappels théoriques. -TP- Modulations digitales ASK - FSK. Première partie 1 INTRODUCTION

COURS GESTION FINANCIERE A COURT TERME SEANCE 3 PLANS DE TRESORERIE. François LONGIN

Impact du vieillissement démographique sur l impôt prélevé sur les retraits des régimes privés de retraite

2. Quelle est la valeur de la prime de l option américaine correspondante? Utilisez pour cela la technique dite de remontée de l arbre.

Ned s Expat L assurance des Néerlandais en France

GUIDE DES INDICES BOURSIERS

Caractéristiques des signaux électriques

VA(1+r) = C 1. VA = C 1 v 1

L impact de l activisme des fonds de pension américains : l exemple du Conseil des Investisseurs Institutionnels.

Les circuits électriques en régime transitoire

F 2 = - T p K F T = - T p K 0 - K 0

Texte Ruine d une compagnie d assurance

Les Comptes Nationaux Trimestriels

Pour 2014, le rythme de la reprise économique qui semble s annoncer,

Annuités. I Définition : II Capitalisation : ( Valeur acquise par une suite d annuités constantes ) V n = a t

Estimation des matrices de trafics

Copules et dépendances : application pratique à la détermination du besoin en fonds propres d un assureur non vie

Chapitre 2 L investissement. . Les principales caractéristiques de l investissement

CHAPITRE 4 RÉPONSES AUX CHOCS D INFLATION : LES PAYS DU G7 DIFFÈRENT-ILS LES UNS DES AUTRES?

EFFICIENCE INFORMATIONNELLE DES UNE VERIFICATION ECONOMETRIQUE MARCHES DE L OR A PARIS ET A LONDRES, DE LA FORME FAIBLE

Sélection de portefeuilles et prédictibilité des rendements via la durée de l avantage concurrentiel 1

CHAPITRE I : Cinématique du point matériel

THÈSE. Pour l obtention du grade de Docteur de l Université de Paris I Panthéon-Sorbonne Discipline : Sciences Économiques

Coaching - accompagnement personnalisé (Ref : MEF29) Accompagner les agents et les cadres dans le développement de leur potentiel OBJECTIFS

Risque associé au contrat d assurance-vie pour la compagnie d assurance. par Christophe BERTHELOT, Mireille BOSSY et Nathalie PISTRE

Un modèle de projection pour des contrats de retraite dans le cadre de l ORSA

TB 352 TB 352. Entrée 1. Entrée 2

Documentation Technique de Référence Chapitre 8 Trames types Article

Sommaire de la séquence 12

Mémoire présenté et soutenu en vue de l obtention

Finance 1 Université d Evry Val d Essonne. Séance 2. Philippe PRIAULET

Intégration de Net2 avec un système d alarme intrusion

GESTION DU RÉSULTAT : MESURE ET DÉMESURE 1 2 ème version révisée, août 2003

NOTE SUR LES METHODES UNIVARIEES

Relation entre la Volatilité Implicite et la Volatilité Réalisée.

Filtrage optimal. par Mohamed NAJIM Professeur à l École nationale supérieure d électronique et de radioélectricité de Bordeaux (ENSERB)

OBJECTIFS LES PLUS DE LA FORMATION

Oscillations forcées en régime sinusoïdal.

MODÈLE BAYÉSIEN DE TARIFICATION DE L ASSURANCE DES FLOTTES DE VÉHICULES

Ecole des HEC Université de Lausanne FINANCE EMPIRIQUE. Eric Jondeau

Les solutions solides et les diagrammes d équilibre binaires. sssp1. sssp1 ssss1 ssss2 ssss3 sssp2

Recueil d'exercices de logique séquentielle

CARACTERISTIQUES STATIQUES D'UN SYSTEME

MIDI F-35. Canal MIDI 1 Mélodie Canal MIDI 2 Basse Canal MIDI 10 Batterie MIDI IN. Réception du canal MIDI = 1 Reproduit la mélodie.

Pouvoir de marché et transmission asymétrique des prix sur les marchés de produits vivriers au Bénin

CHELEM Commerce International

Le mécanisme du multiplicateur (dit "multiplicateur keynésien") revisité

Chapitre 9. Contrôle des risques immobiliers et marchés financiers

Les deux déficits, budgétaire et du compte courant, sont-ils jumeaux? Une étude empirique dans le cas d une petite économie en développement

EVALUATION DE LA FPL PAR LES APPRENANTS: CAS DU MASTER IDS

Programmation, organisation et optimisation de son processus Achat (Ref : M64) Découvrez le programme

TD/TP : Taux d un emprunt (méthode de Newton)

Université Technique de Sofia, Filière Francophone d Informatique Notes de cours de Réseaux Informatiques, G. Naydenov Maitre de conférence, PhD

SURVOL DE LA LITTÉRATURE SUR LES MODÈLES DE TAUX DE CHANGE D ÉQUILIBRE: ASPECTS THÉORIQUES ET DISCUSSIONS COMPARATIVES

Document de travail FRANCE ET ALLEMAGNE : UNE HISTOIRE DU DÉSAJUSTEMENT EUROPEEN. Mathilde Le Moigne OFCE et ENS ULM

Cours d électrocinétique :

Exemples de résolutions d équations différentielles

Séquence 2. Pourcentages. Sommaire

N Juin. Base de données CHELEM commerce international du CEPII. Alix de SAINT VAULRY

Article. «Les effets à long terme des fonds de pension» Pascal Belan, Philippe Michel et Bertrand Wigniolle

Vous vous installez en france? Société Générale vous accompagne (1)

Cahier technique n 114

No Décembre. La coordination interne et externe des politiques économiques : une analyse dynamique. Fabrice Capoën Pierre Villa

Evaluation des Options avec Prime de Risque Variable

CHAPITRE 13. EXERCICES a) 20,32 ± 0,055 b) 97,75 ± 0,4535 c) 1953,125 ± 23, ±0,36π cm 3

EPARGNE RETRAITE ET REDISTRIBUTION *

Une assurance chômage pour la zone euro

DE L'ÉVALUATION DU RISQUE DE CRÉDIT

TRAVAUX PRATIQUES N 5 INSTALLATION ELECTRIQUE DE LA CAGE D'ESCALIER DU BATIMENT A

Séminaire d Économie Publique

Froid industriel : production et application (Ref : 3494) Procédés thermodynamiques, systèmes et applications OBJECTIFS LES PLUS DE LA FORMATION

CONTRIBUTION A L ANALYSE DE LA GESTION DU RESULTAT DES SOCIETES COTEES

Essai surlefficience informationnelle du march boursier marocain

N d ordre Année 2008 THESE. présentée. devant l UNIVERSITE CLAUDE BERNARD - LYON 1. pour l obtention. du DIPLOME DE DOCTORAT. (arrêté du 7 août 2006)

Le développement de l assurance des catastrophes naturelles: facteur de développement économique

LE PARADOXE DES DEUX TRAINS

Mathématiques financières. Peter Tankov

SYSTÈME HYBRIDE SOLAIRE THERMODYNAMIQUE POUR L EAU CHAUDE SANITAIRE

Institut Supérieur de Gestion

CAHIER ANALYSE DES CHOCS D'OFFRE ET DE DEMANDE DANS LA ZONE CFA : UNE MÉTHODE STRUCTURELLE D'AUTORÉGRESSION VECTORIELLE

Formation Administrateur Server 2008 (Ref : IN4) Tout ce qu'il faut savoir sur Server 2008 OBJECTIFS LES PLUS DE LA FORMATION

Files d attente (1) F. Sur - ENSMN. Introduction. 1 Introduction. Vocabulaire Caractéristiques Notations de Kendall Loi de Little.

NUMERISATION ET TRANSMISSION DE L INFORMATION

Exercices de révision

CANAUX DE TRANSMISSION BRUITES

MINISTERE DE L ECONOMIE ET DES FINANCES

Thème : Essai de Modélisation du comportement du taux de change du dinar algérien par la méthode ARFIMA

Groupe International Fiduciaire. pour l Expertise comptable et le Commissariat aux comptes

Cahier technique n 141

Estimation d une fonction de demande de monnaie pour la zone euro : une synthèse des résultats

PREMIÈRE PARTIE LIQUIDITÉ ET MICROSTRUCTURE. La Liquidité - De la Microstructure à la Gestion du Risque de Liquidité

L inflation française de , hasards et coïncidences d un policy-mix : les enseignements de la FTPL

DOCUMENT TECHNIQUE N O 2 GUIDE DE MESURE POUR L INTÉGRATION DES TECHNOLOGIES DE L INFORMATION ET DE LA COMMUNICATION (TIC) EN ÉDUCATION

«La croissance rend-elle heureux? Andrew Clark* et Claudia Senik Ecole d Economie de Paris et Cepremap

Le passage des retraites de la répartition à la capitalisation obligatoire : des simulations à l'aide d'une maquette

Sciences Industrielles pour l Ingénieur

Une union pour les employeurs de l' conomie sociale. - grande Conférence sociale - les positionnements et propositions de l usgeres

Transcription:

Commen prévoir l en lisan le journal Clémen Boroli Déparemen de la conjoncure Séphanie Combes Déparemen des méhodes saisiques Thomas Renaul Universié Paris 1 Panhéon-Sorbonne IÉSEG School of Managemen Fermeures d usines, plans d embauches, commandes géanes, publicaions de résulas d enreprises : les aricles de presse comporen beaucoup d informaions macroéconomiques ou microéconomiques sur la vie des affaires. Cela es pariculièremen vrai pour l : les médias annoncen régulièremen des décisions d enreprises qui affecen direcemen le marché du ravail. Le développemen des echniques, noammen d analyse exuelle, liées aux données massives (big daa) e la mise en ligne par cerains quoidiens de leurs aricles de presse sur longue période, permeen désormais d exploier ces données e de les résumer en indicaeurs de senimen médiaique sur l économie. Parmi les différens médias français, le journal Le Monde a éé reenu dans cee éude car le conenu médiaique mis en ligne sur son sie présene une profondeur emporelle rare pour la France, incluan en pariculier de nombreux aricles publiés dans l édiion papier avan l avènemen d Inerne. Il en résule une base de données de plus d un million d aricles publiés dans ce journal de 1990 à nos jours. En combinan des modèles saisiques e d analyse exuelle, seuls les aricles raian de la siuaion économique française peuven êre reenus, ce qui représene un échanillon de 200 000 exes environ. En classan ces aricles selon leur onalié, posiive ou négaive, à parir d une lise de mos, il es possible de calculer un indicaeur mensuel de senimen médiaique relaif à l ou à la siuaion économique de manière plus générale. Un el indicaeur apparaî apporer un signal rapide, perinen e lisible sur les flucuaions de cour erme de l économie, présenan des caracérisiques similaires à l indicaeur de clima des affaires en France consrui à parir des enquêes de conjoncure, que l Insee publie régulièremen. D une par, l un e l aure son disponibles rapidemen, presque en emps réel. D aure par, l indicaeur de senimen médiaique relaif à la siuaion économique es lui aussi bien corrélé à l salarié, mieux encore que l indicaeur de senimen médiaique ciblé sur l. Les propriéés prédicives d un el indicaeur peuven alors êre évaluées e comparées à celles du clima des affaires. Lorsqu il es inrodui dans un modèle de prévision à rès cour erme d salarié, l indicaeur de senimen médiaique appore en général une réelle informaion : à parir du deuxième mois du rimesre, il améliore significaivemen la prévision par rappor à un modèle simple incluan uniquemen les variaions passées de l e de l acivié. En revanche, lorsqu il es uilisé seul en prévision, ce indicaeur demeure moins performan que le clima des affaires. Enfin, un modèle uilisan simulanémen clima des affaires e senimen médiaique es légèremen meilleur en prévision qu un modèle incluan uniquemen le clima des affaires de l Insee, même si le gain de performance es faible e n es du rese pas significaif. Ainsi, il semble que, dans une ceraine mesure, le senimen médiaique présene une peie informaion résiduelle qui n es pas capée par les enquêes de conjoncure. Auremen di, pour le ravail du conjoncurise, noammen dans le cadre des exercices de Noe de conjoncure, l informaion médiaique peu êre un complémen aux enquêes de conjoncure de l Insee mais ne saurai s y subsiuer. Mars 2017 35

Commen prévoir l en lisan le journal Une base de données de plus d un million d aricles publiés depuis 1990 sur lemonde.fr, don 200 000 raien de l économie française L informaion médiaique peu héoriquemen êre uile pour prévoir l marchand L analyse sysémaique de la onalié des exes produis par la sphère médiaique es suscepible d apporer en emps réel une indicaion qualiaive sur les flucuaions de l acivié économique. L informaion médiaique possède en effe des caracérisiques proches de l informaion issue des enquêes de conjoncure : elle es disponible rapidemen, plusieurs semaines avan les indicaeurs conjoncurels quaniaifs ; elle peu êre résumée par un indicaeur unique, di de «senimen médiaique», a priori uile au conjoncurise. Par exemple, Thorsrud (2016) uilise le conenu publié par cerains médias norvégiens pour obenir un indicaeur avancé de l acivié dans ce pays. L essor des sies Inerne des grands médias e les echniques liées aux données massives (big daa) facilien l exploiaion du conenu de cee informaion. Celle-ci fai donc parie des indicaeurs don l uilisaion es encouragée par l avènemen des données ouveres (open daa), à l insar d ouils comme Google Trends (Boroli e Combes, 2015). En pariculier, un indicaeur de senimen médiaique pourrai se monrer uile pour prévoir à rès cour erme l. En effe, de nombreux aricles paraissen régulièremen sur des sujes ayan un impac direc sur le marché de ravail, comme l annonce de plans d embauches, d ouverures de sies ou à l inverse de plans sociaux. Un indicaeur de senimen médiaique consrui avec ces aricles peu informer sur les évoluions présenes ou fuures de l, bien avan la publicaion des premières données quaniaives. D une par car un el indicaeur pourrai résumer un cerain nombre de signaux qui ne remoneron qu avec délais dans le sysème saisique (les premières esimaions «flash» de l salarié marchand son publiées 45 jours après la fin du rimesre considéré). D aure par car le clima médiaique pourrai lui-même influer les décisions d embauches ou de suppressions de poses des chefs d enreprise. Des indicaeurs de senimen médiaique son consruis à parir d une base de données de plus d un million d aricles publiés depuis 1990 par Le Monde Parmi les différens médias français don le conenu pourrai servir à consruire un indicaeur de senimen médiaique, Le Monde présene des caracérisiques inéressanes. Il s agi d un des principaux ires de presse français : en version papier, il es aujourd hui le deuxième quoidien naional le plus diffusé derrière Le Figaro (environ 260 000 numéros par jour) e son sie lemonde.fr es le sie d informaion le plus visié de France, juse devan celui du Figaro (graphique 1). De plus, le conenu médiaique mis en ligne présene une profondeur emporelle remarquable pour la France, incluan en pariculier de nombreux aricles publiés dans l édiion papier avan l avènemen d Inerne. Il perme ainsi de consiuer une base de données de 1,4 million d aricles publiés de 1990 à nos jours. 1 - Fréquenaion mensuelle des cinq premiers sies inerne d informaion Source : ACPM 36 Noe de conjoncure

Commen prévoir l en lisan le journal Les aricles son noés selon la onalié, posiive ou négaive, qui s en dégage Pour consruire un indicaeur de senimen médiaique sur la siuaion économique française, la base iniiale a éé resreine afin de ne conserver que les aricles raian d économie e don le conenu se rappore à la siuaion française. Différens filres e algorihmes son uilisés pour les sélecionner : la base de données se rédui finalemen à 200 000 aricles (encadré 1). La onalié posiive ou négaive des aricles reenus es mesurée à l aide d un «dicionnaire de senimen». Celui-ci regroupe une lise de ermes qui seron repérés dans les aricles, en les disinguan selon leur connoaion, posiive ou négaive. En anglais, de nombreux dicionnaires exisen déjà pour analyser des exes : le Harvard IV-4 Psychological Dicionary es le principal d enre eux, mais d aures dicionnaires son uilisés pour des champs de recherche précis, comme le Loughran-McDonald dans le domaine de la finance. Encadré 1 - Commen conserver les aricles raian de la siuaion économique en France dans une base brue de 1,3 million d aricles publiés La base de données iniiale es composée de 1 405 038 aricles publiés depuis 1990 e mis en ligne sur le sie Inerne du Monde. Cerains aricles son réservés aux abonnés : dans ce cas, seul le ire, les premières lignes e ceraines informaions relaives à l aricle (en pariculier la dae de publicaion, le nom de l aueur e la caégorie) son disponibles en accès libre. Les aricles les plus récens (depuis 2005) son pré-classés en caégorie par les journalises du Monde : économie, inernaional, poliique, spors, ec. La première éape consise à repérer les aricles raian d économie parmi les exes les plus anciens, qui n on pas éé pré-classés par les journalises. Un algorihme d apprenissage es calibré à parir d un échanillon consiué de 10 000 aricles de la caégorie «économie» e de 10 000 aricles d aures caégories : l algorihme calcule la probabilié d un aricle d apparenir ou non à la caégorie «économie» en foncion de la fréquence d appariion des mos qui le composen dans les deux ensembles de l échanillon d apprenissage. Ainsi, la présence du mo dans un aricle fera augmener sa probabilié d apparenir à la caégorie «économie» car dans l échanillon d apprenissage, ce mo es plus fréquen dans les aricles raian d économie que dans les aures. Un el algorihme, qui peu êre qualifié de «bayésien naïf» (Kosianis e al., 2006), perme de classer l ensemble des exes les plus anciens de la base. En parallèle, les aricles don la France es l obje principal son repérés par une aure procédure. Deux lises recensan les noms d eniés géographiques son uilisées : l une es composée de ermes français (noms de villes, de déparemens, de régions) e l aure de ermes inernaionaux (noms de pays e de capiales). La procédure de sélecion des aricles ne conserve que les aricles qui compabilisen au moins auan d eniés françaises que de d eniés érangères. Les aricles comprenan le nom de ceraines insiuions producrices de saisiques («Insee», «Dares», «Pôle», ec.) peuven évenuellemen êre éliminés pour évier que le senimen médiaique ainsi consrui dépende des publicaions de ces organismes : en praique, ce raffinemen appore peu éan donné la faible proporion d aricles concernés chaque mois (au maximum 5 % des aricles économiques). Finalemen, son ainsi conservés les aricles ayan pour suje la siuaion économique en France. L échanillon reenu compe 226 493 aricles soi environ 700 par mois : la proporion d aricles reenus chaque mois oscille de manière générale enre 10%e20%(graphique). Nombre d aricles parus e reenus chaque mois dans l échanillon final Noe : les aricles mis en ligne sur lemonde.fr en 2006 son significaivemen moins nombreux qu en 2005 ou 2007. Sources : lemonde.fr, calculs Insee Mars 2017 37

Commen prévoir l en lisan le journal Deux indicaeurs de senimen médiaique peuven êre calculés, l un relaif à l e l aure à la siuaion économique de manière plus générale En langue française, en revanche, ce ype de lise prééablie es beaucoup plus rare. Aussi, pour les besoins de cee éude, deux dicionnaires de senimen on éé élaborés, à parir d une première lise consruie à dire d expers, puis augmenée iéraivemen des expressions les plus fréquemmen associées aux mos composan cee lise iniiale : Le premier dicionnaire regroupe des expressions spécifiques au marché du ravail. Il es consiué de 53 ermes posiifs («créaion d», «plan d embauche», «hausse de l acivié», ec.) e de 121 ermes négaifs («desrucion d s», «plan social», «liquidaion judiciaire», ec.). Le deuxième dicionnaire regroupe des qualificaifs plus généraux. Il es consiué de 485 mos à connoaion posiive («amélioraion», «favorable», ec.) e de 1 507 mos à connoaion négaive («insabilié», «affaiblissemen», ec.). Les ermes négaifs apparaissen beaucoup plus nombreux. Cee prédominance n es pas inhabiuelle (voir en pariculier Schrauf e Sanchez, 2004). On la rerouve par exemple en anglais dans le dicionnaire Loughran-McDonald (le Harvard IV-4 Psychological Dicionary es ouefois beaucoup plus équilibré). Chacun de ces deux dicionnaires es uilisé pour aribuer «un score de senimen» à chaque aricle, en foncion du nombre de ermes posiifs e de ermes négaifs qu il conien. Deux convenions de noaion son possibles, un «codage coninu» ou un «codage discre». Les indicaeurs obenus on des propriéés saisiques qui s avèren proches, mais le codage coninu possède des meilleures performances prédicives, raison pour laquelle il a éé privilégié (encadré 2). Le senimen médiaique d un mois donné es calculé en effecuan une moyenne des scores obenus pour chaque aricle paru au cours du mois d inérê. En suivan ce proocole, deux indicaeurs son déduis des deux dicionnaires uilisés : un indicaeur de senimen médiaique, à parir du dicionnaire des expressions spécifiques au marché du ravail, e un indicaeur de senimen médiaique «global» sur la siuaion économique en France, à parir du dicionnaire plus générique. Ces indicaeurs apparaissen bien corrélés à l évoluion de l En prévision, le senimen médiaique global es moins performan que les enquêes de conjoncure mais il peu les compléer Les indicaeurs de senimen médiaique ainsi obenus apparaissen bien corrélés aux variaions rimesrielles de l depuis 1990, avec un coefficien de 0,70 pour le senimen e de 0,80 pour le senimen «global» (graphique 2). 2 - Variaions rimesrielles de l salarié e indicaeurs mensuels de senimen médiaique Noe : une moyenne mobile d ordre 5 a éé appliquée aux indicaeurs de senimen médiaique pour plus de lisibilié. Source : Insee 38 Noe de conjoncure

Commen prévoir l en lisan le journal La modélisaion confirme que le senimen global a un pouvoir prédicif Le senimen global apparaî de surcroî un peu plus avancé : en effe, les reournemens conjoncurels semblen affecer l indicaeur global avan l salarié, alors qu à l inverse le senimen paraî réagir avec reard aux flucuaions conjoncurelles sur le marché du ravail. Apriori, les performances prédicives du clima global seron donc meilleures que celles du clima. Ces indicaeurs de senimen médiaique peuven êre uilisés pour réaliser des prévisions. La prévision de l salarié (variable rimesrielle) à l aide d indicaeurs mensuels es réalisée avec une approche blocking, courammen uilisée par les conjoncurises. Il s agi de proposer un modèle de prévision (ou «éalonnage») différen pour chaque mois du rimesre afin d exploier l inégralié de l informaion disponible à la dae considérée (voir par exemple Bec e Mogliani, 2013). La prévision de la variaion de l salarié marchand pour le rimesre en cours s améliore ainsi au fur e à mesure que le emps s écoule (annexe). Encadré 2 Noaion des aricles e calcul des indicaeurs de senimen médiaique En premier lieu, à parir du dicionnaire éabli, un «score de senimen» es aribué à chaque aricle en foncion du nombre de ermes posiifs e négaifs qu il conien. Deux convenions de calculs son esées. Dans un premier cas («codage coninu»), le score de senimen aribué à l aricle i paru le mois se calcule à parir du nombre de mos posiifs (p i ), du nombre de mos négaifs (n i ) e du nombre oal de mos (m i ) de l aricle considéré, comme déaillé dans Baker e al. (2016) : pi ni senimen i = mi Cee formule peu présener des inconvéniens, compe enu de la base de données uilisée ici. En effe, cee dernière es consiuée d un cerain nombre de exes rès cours, noammen ceux correspondan aux aricles don l inégralié es réservée pour leur plus grande parie aux abonnés. Si les ermes non neures se concenren en débu d aricle, ce mode de calcul condui à suresimer leur proporion dans l ensemble de l aricle. Pour pallier ce défau évenuel, un «codage discre», a égalemen éé esé. Il s agi simplemen ici de comparer le nombre de ermes posiifs e le nombre de ermes négaifs, sans enir compe de la longueur du exe don on dispose. Le score aribué à l aricle es défini de la manière suivane : 1 1sip i > n i senimen i = 0 0sip i = n i 1 1 si p i < n i Une fois un score de senimen aribué à chaque aricle, un senimen médiaique mensuel es calculé par moyenne arihméique simple. La série es ensuie normalisée afin que sa moyenne soi 100 e son écar-ype 10 ; cee normalisaion es convenionnelle, similaire à celle appliquée aux indicaeurs synhéiques de clima des affaires dans les enquêes de conjoncure. En praique, les indicaeurs obenus par codage coninu on éé privilégiés car leurs performances prédicives dans les modèles d éalonnages présenés dans ce dossier, son légèremen meilleures que celles des indicaeurs obenus par codage discre. Néanmoins, les indicaeurs issus des deux modes de codage présenen une corrélaion supérieure à 0,90 (graphique), ce qui assure que l approche adopée pour synhéiser le senimen médiaique es robuse au choix de la méhode de calcul du score aribué à chaque aricle. Deux ypes de codages différens pour l indicaeur de senimen médiaique global Source : Insee Mars 2017 39

Commen prévoir l en lisan le journal Le clima des affaires issu des enquêes de conjoncure possède un pouvoir prédicif supérieur L indicaeur de senimen médiaique global conien de l informaion uile à la prévision à parir du deuxième mois du rimesre. En effe, lorsque le modèle qui uilise ce indicaeur comme seule informaion exogène es esimé sur la oalié de la période d éude (1990-2016), l indicaeur es significaif quelquesoilemoisdurimesreconsidéré.deplus,ler²ajuséesplusélevé que celui d un modèle uilisan uniquemen les reards de l acivié e de l, ce qui es le signe d un meilleur ajusemen aux données. Enfin, la simulaion d une prévision en «emps réel» indique qu à parir du deuxième mois du rimesre, l erreur quadraique moyenne de prévision («RMSE hors échanillon» ou RMSFE) diminue de manière significaive lorsqu on ajoue l indicaeur de senimen médiaique au modèle uilisan uniquemen les reards de l e de l acivié (ableau). En revanche, l indicaeur de senimen médiaique sur l es moins performan que l indicaeur global malgré son caracère a priori plus recenré sur le domaine éudié. Il n appore même pas d informaion supplémenaire à la seule dynamique passée de l e de l acivié. Malgré son conenu informaionnel, le senimen médiaique global ne peu pas êre considéré comme un subsiu aux indicaeurs synhéiques aujourd hui consruis à parir des enquêes de conjoncure. Ces dernières, menées chaque mois par l Insee auprès de 15 000 à 20 000 enreprises des seceurs marchands, permeen d élaborer des climas des affaires. Elles serven aussi à éablir le scénario de prévision présené dans la Noe de Conjoncure (voir dossier «Commen prévoir l à parir des réponses aux enquêes de conjoncure», p. 19). Les indicaeurs de senimen médiaique ne sauraien les remplacer car l Insee doi disposer d une source indépendane e mairisée de la mesure du clima des affaires : la sabilié dans le emps de l indicaeur de senimen médiaique peu en effe êre affecée par des événemens exogènes (changemen de poliique de diffusion, changemen de ligne édioriale, ec.). Mais surou, les indicaeurs issus des enquêes de conjoncure resen supérieurs en ermes de qualié prédicive. Un modèle incluan le seul clima des affaires de l économie française es plus performan pour prévoir l que celui comporan le seul indicaeur de senimen médiaique, quel que soi le mois du rimesre où la prévision es réalisée : il s ajuse mieux aux données lorsqu il es esimé sur l inégralié de la période d éude (R² ajusé plus grand) e ses erreurs de prévision son significaivemen moins élevées lorsqu une simulaion en «emps réel» es réalisée (RMSFE plus faible). Erreurs de prévision sur la période 2000-2016 selon le modèle reenu e le mois du rimesre considéré En % - Variable expliquée : variaions rimesrielles de l SMNA (écar-ype : 0,40 %) Modèle (1) : reard de l e de l acivié uniquemen Modèle (2) : senimen médiaique seul Modèle (3) : clima des affaires France seul Modèle (4) : senimen médiaique e clima France Mois 1 du rimesre 0,213 0,211 0,194* 0,193 Mois 2 du rimesre 0,216 0,194* 0,170* 0,168 Mois 3 du rimesre 0,216 0,194* 0,164* 0,161 Noe de lecure : ous les modèles coniennen des reards de l e de l acivié. Pour chaque mois du rimesre, les éoiles indiquen que, d après le es de Harvey, Leybourne e Newbold (1997), l erreur quadraique moyenne de prévision (RMSFE) du modèle es significaivemen plus faible au seuil de 10 % que celle du modèle «précéden». Ainsi, au premier mois du rimesre, le RMSFE du modèle 2 (senimen médiaique seul) n es pas significaivemen plus faible que celui du modèle 1 (reards de l e de l acivié uniquemen), mais celui du modèle 3 (clima des affaires seul) es significaivemen plus faible que celui du modèle 2. Source : Insee 40 Noe de conjoncure

Commen prévoir l en lisan le journal L uilisaion simulanée des deux indicaeurs améliore légèremen la prévision, mais le gain de performance n es pas significaif Néanmoins, senimen médiaique e clima des affaires apparaissen, dans une ceraine mesure, complémenaires. En effe, quel que soi le mois du rimesre considéré, le modèle uilisan à la fois senimen médiaique e clima des affaires es plus performan que le modèle uilisan le clima des affaires comme seule informaion exogène : l indicaeur de senimen médiaique es significaif, les performances «en échanillon» son meilleures (R² ajusé plus élevé) e l erreur de prévision «en emps réel» es légèremen moins élevée. Cependan, la différence de RMSFE es rop faible pour conclure que le gain de pouvoir prédicif es significaif. Ainsi, le senimen médiaique semble comporer une informaion qui n es pas enièremen capée dans les enquêes de conjoncure menées par l Insee. Cee informaion résiduelle pourrai, dans une ceraine mesure, êre uile pour mieux prévoir l évoluion de l salarié marchand. Ce nouvel indicaeur s ajoue donc à l ensemble d ouils don dispose le conjoncurise pour formuler un diagnosic conjoncurel. Sa légère remonée depuis mi-2016 complèe ainsi la récene hausse du clima des affaires depuis fin 2016, ce qui es de bon augure pour des créaions d s qui reseraien encore solides débu 2017. Bibliographie Baker S. R., Bloom N. e Davis S. J. (2016), «Measuring economic policy uncerainy», The Quarerly Journal of Economics, vol. 131 issue 4, p. 1593-1636. Bec F. e Mogliani M. (2013), «Nowcasing French GDP in Real-Time from Survey Opinions : Informaion or Forecas Combinaions?», Banque de France, Documen de ravail n 436. Boroli C. e Combes S. (2015), «Appors de Google Trends pour prévoir la conjoncure française : des pises limiées», Noe de conjoncure, Insee, mars, p. 43-56. Harvey D., Leybourne S. e Newbold P. (1997), «Tesing he equaliy of predicion mean squared errors», Inernaional Journal of forecasing, vol. 13 issue 2, p. 281-291. Kosianis S. B., Zaharakis I. D. e Pinelas P. E. (2006), «Machine learning: a review of classificaion and combining echniques», Arificial Inelligence Review, vol. 26 issue 3, p.159-190. Schrauf R. W. e Sanchez J. (2004), «The preponderance of negaive emoion words in he emoion lexicon : a cross-generaional and cross-linguisic sudy», Journal of mulilingual and muliculural developmen, vol.25 issue 2-3, p.266-284. Thorsrud L. A. (2016), «Nowcasing using news opics, Big Daa versus big bank», Norges Bank, Working Paper, n 2016-20. Annexe Modèles de prévision à cour erme pour eser les performances des différens indicaeurs synhéiques avancés de l marchand Différens modèles peuven êre esés pour prévoir la variaion de l salarié marchand pour le rimesre en cours, en uilisan d une par les variaions passées de la variable d inérê e du PIB, e d aure par des indicaeurs conjoncurels els que le clima des affaires en France publié par l Insee e l indicaeur de senimen médiaique global présené dans ce dossier. Plusieurs echniques son héoriquemen envisageables pour gérer la différence de fréquence enre la variable à prévoir (rimesrielle) e les variables explicaives (mensuelles) : l approche adopée ici es celle du blocking, courammen uilisée par les conjoncurises e qui consise à proposer un éalonnage différen pour chaque mois du rimesre, exploian à chaque fois l inégralié de l informaion disponible à la dae considérée. Ainsi, les éalonnages «mois 1», «mois 2» e «mois 3» uilisen respecivemen l ensemble de l informaion disponible à la fin du premier, du deuxième e du roisième mois du rimesre. Quare modèles son esimés sur l ensemble de la période : le modèle 1 uilise uniquemen les variaions passées de l salarié e de l acivié ; le modèle 2 comprend en oure l indicaeur de senimen médiaique global uniquemen ; le modèle 3 comprend, oure les variaions passées de l e de l acivié, le clima des affaires en France uniquemen ; enfin le modèle 4 inègre ces deux indicaeurs simulanémen. Par souci de parcimonie, seules les variables significaives son conservées dans chaque modèle. Tous les modèles son esimés de 1990 à 2016. Mars 2017 41

Commen prévoir l en lisan le journal Éalonnages «mois 1» À la fin du premier mois du rimesre, l du rimesre précéden n es pas encore connu (la première publicaion a lieu au milieu du deuxième mois) e ne peu donc pas êre uilisé dans l éalonnage. En revanche, le PIB du rimesre précéden es connu depuis l enrée en vigueur en 2016 du nouveau calendrier de publicaion des compes rimesriels, qui inclu une première esimaion «à 30 jours». Modèle 1 (reards de l e de l acivié uniquemen) Modèle 2 (senimen médiaique seul) = 008, + 045,. + 039,. pib ( 25, ) ( 65, ) 2 R² ajusé = 0,64 DW = 1,50 ( 66, ) + 1 u =, 108+ 0, 32. + 0, 34. pib + 001,. senimen _ mediaique + u ( 34, ) ( 4, 1) 2 ( 58, ) 1, m1 ( 32, ) R² ajusé = 0,67 DW = 1,42 Modèle 3 (clima France seul) = 003, + 059,. + 023,. pib + 003,.( ciima_ france ciima_ france, ) + u ( 12, ) ( 8, 5) 2 ( 38, ) 1, m1 1m 1 ( 47, ) R² ajusé = 0,70 DW = 1,87 Modèle 4 (senimen médiaique e clima France) = 071, + 049,. + 022,. pib 002,.( ciima_ france ciima_ france ( 23, ) ( 58, ) 2 ( 36, ) 1 + ),. _, m1 1, m1 + 001senimen mediaique, m1 + u ( 40, ) ( 22, ) R² ajusé = 0,71 DW = 1,82 Éalonnages «mois 2» À la fin du deuxième mois du rimesre, il es possible d uiliser le premier reard de l salarié car celui-ci es désormais connu. Modèle 1 (reards de l e de l acivié uniquemen) = 006, + 040,. + 021,. + 028,. pib + u ( 20, ) ( 4, 1) 1 ( 24, ) 2 1 ( 46, ) Modèle 2 (senimen médiaique seul) R² ajusé = 0,69 DW = 1,96 = 172, + 0, 38. + 017,. pib + 001,. senimen _ mediaique + 001,. senimen_ mediaique u ( 52, ) ( 50, ) 1 ( 29, ) 1 ( 33, ), m2 ( 32, ) +, m1 R² ajusé = 0,73 DW = 1,98 Modèle 3 (clima France seul) = 090, + 030,. + 037,. + 001,. ciima_ france + 006,.( ciima_ france ciima_ france ) ( 24, ) ( 31, ) 1 ( 39, ) 2 ( 24, ) + 001,.( ciima_ france m ciima_ france m) +, 1 1, 1 u ( 23, ) R² ajusé = 0,78 DW = 2,15 Modèle 4 (senimen médiaique e clima France), m2 ( 52, ), m2, m1 =, 135+ 0, 30. + 0, 29. + 001,. ciima_ france + 005,.( ciima_ france ciima_ france ) ( 31, ) ( 32, ) 1 ( 28, ) 2 ( 22, ), m2 + 001,.( ciima_ france ciima_ france ) + 001,. senimen_ mediaique +, 1 u ( 19, ), m1 1, m1 ( 19, ) R² ajusé = 0,79 DW = 2,19 ( 51, ) m, m2, m1 42 Noe de conjoncure

Commen prévoir l en lisan le journal Éalonnages «mois 3» À la fin du roisième mois du rimesre, les indicaeurs quaniaifs (PIB e ) disponibles son les mêmes qu un mois plus ô. De plus, le senimen médiaique du dernier mois du rimesre ne semble pas conenir d informaion uile à la prévision. Aussi, les modèles 1 e 2 du roisième mois son ideniques à ceux du deuxième mois. Modèle 3 (clima France seul) = 130, + 0, 26. + 0, 30. + 001,. ciima_ france + 004,.( ciima_ france ciima_ france ) u ( 39, ) ( 30, ) 1 ( 38, ) 2 ( 39, ), m3 ( 59, ) +, m3, m1 R² ajusé = 0,80 DW = 2,19 Modèle 4 (senimen médiaique e clima France) = 177, + 0, 26. + 0, 23. + 001,. ciima_ france + 004,.( ciima_ france ciima_ france ) ( 48, ) ( 31, ) 1 ( 28, ) 2 ( 35, ) _ + 1 + 001,. senimen ( 26, ) mediaique, m u R² ajusé = 0,81 DW = 2,23, m3 ( 58, ), m3, m1 Ainsi, quel que soi le mois auquel la prévision es réalisée, le senimen médiaique es significaif dans le modèle 2. De plus, le R² ajusé de ce modèle es plus élevé que celui du modèle 1, ce qui es le signe d un meilleur ajusemen aux données. Le modèle 3, qui mobilise le clima des affaires en France, présene un meilleur ajusemen que le modèle 2. Enfin, lorsque les deux indicaeurs son inroduis simulanémen dans le modèle 4, l indicaeur de senimen médiaique es oujours significaif e le R² ajusé es un peu meilleur que dans le modèle 3. Ces premières conclusions son formulées à parir des esimaions uilisan l ensemble de l échanillon disponible. Cependan, de bonnes performances «en échanillon» son parfois dues à un phénomène de surapprenissage (voir Boroli e Combes, 2015). L indicaeur de senimen médiaique pourrai alors se révéler inopéran en prévision. Pour vérifier cee hypohèse, peu probable éan donnée la parcimonie des modèles considérés ici, on ese les performances «hors échanillon». On mène donc une simulaion de prévision «en emps réel» 1. Pour chaque modèle, le choix des variables explicaives es arrêé une fois pour oues. Ensuie, une première version des modèles es esimée du premier rimesre 1990 au quarième rimesre 1999, puis uilisée pour prévoir la variaion de l au premier rimesre 2000 : le résula obenu es alors comparé à la variaion effecivemen consaée. Une nouvelle version du modèle es ensuie esimée jusqu au premier rimesre 2000 puis uilisée pour prévoir la variaion de l au deuxième rimesre. Ainsi, de proche en proche, une prévision es obenue pour ous les rimesres compris enre 2000 e 2016. La performance «hors échanillon» peu alors êre évaluée en calculan l erreur quadraique moyenne en prévision, qualifiée de RMSFE (Roo Mean Square Forecas Error). Les résulas obenus pour chaque modèle aux différens mois du rimesre son résumés dans le ableau page 40. Pour le modèle 1, les erreurs de prévisions réalisées à la fin du rimesre ne son pas plus faibles que celles réalisées à la fin du premier mois : cela signifie que la prévision de l marchand n es pas améliorée par l informaion apporée par le premier reard de ce dernier, compe enu de l informaion déjà conenue dans son deuxième reard e dans le premier reard du PIB. En revanche, pour les aures modèles, la prévision s améliore ou au long du rimesre : les indicaeurs de senimen e de clima des affaires disponibles au fur e à mesure que le rimesre progresse permeen d augmener le pouvoir prédicif des modèles (excepion faie de l indicaeur médiaique au roisième mois du rimesre, qui ne semble pas apporer d informaion supplémenaire significaive). Quel que soi le mois considéré, l erreur moyenne de prévision hors échanillon du modèle 4 (senimen médiaique e clima des affaires) es inférieure à celle du modèle 3 (clima des affaires seul), elle-même inférieure à celle du modèle 2 (senimen médiaique seul), elle-même inférieure à celle du modèle 1 (reards de l e de l acivié uniquemen) : cela semble confirmer les conclusions formulées à parir de l analyse en échanillon comple sur les performances relaives des deux indicaeurs. Néanmoins, les différences de RMSFE son parfois rès faibles : un es de Harvey, Leybourne e Newbold (1997) doi êre uilisé pour éablir si ces différences son significaives. Ainsi, au premier mois du rimesre, le modèle 2 (senimen médiaique seul) n es pas significaivemen meilleur en prévision que le modèle 1 (reards de l e de l acivié uniquemen). Il le devien en revanche au seuil de 10 % dès le deuxième mois du rimesre. Le modèle 3 (clima des affaires seul) es quan à lui oujours meilleur que le modèle 2 au seuil de 10 %. Enfin, bien que les erreurs de prévision du modèle 4 (senimen médiaique e clima des affaires) soien sysémaiquemen plus faibles que celles du modèle 3, la différence des RMSFE n es jamais significaive. 1. La simulaion es réalisée en uilisan la série hisorique d salarié elle que publiée aujourd hui e pas celle des variaions d mesurées lors de la première publicaion : il s agi donc en oue rigueur de " pseudo emps réel " pluô que de " emps réel ". Mars 2017 43