R, VISUALISATION ET APPRENTISSAGE



Documents pareils
Anthropologue, ethnologue, géographe, historien de l'art, ingénieur, informaticiens, mathématicien, pédagogue, sociologue, Étudiants en tourisme

«Innovation Intelligence» La valorisation des données massives au service des partenariats R&D. Expernova Université d été GFII

Défi n 3 : Développer l attractivité de la destination

Indexmed : Le big data en écologie? Pas encore disent certains. Pas si sûr! Avec IndexMed. Relevons ce challenge!

DIAPASON : DIAgnostic PArtagé Sur lés Outils Numé riqués

M-Tourisme et réseaux sociaux : les pratiques des clientèles européennes

Big- Data: Les défis éthiques et juridiques. Copyright 2015 Digital&Ethics

Présentation de la majeure ISN. ESILV - 18 avril 2013

LA E-REPUTATION LES SITES D AVIS CLIENTS. Mardi 25 mars 2014

Comment ça se passe? Déroulé détaillé. INTRODUCTION / 10 minutes

EN MAÎTRISANT INTERNET, APPORTEZ UN NOUVEL ÉLAN À VOTRE ACTIVITÉ

Benchmark nouveaux réseaux & medias sociaux. : Carole Gölitz ICI-Marketing

Le programme d'accompagnement E-tourisme des CCI de Provence Alpes Côte d'azur Parcours : «Approfondissement»

Agenda de la présentation

LES RENCONTRES NUMÉRIQUES LAVAL TOURISME

De l intérêt des Réseaux Sociaux pour i2n

PRESTATIONS 2015 DEVELOPPEZ-VOUS! Anne LEROND Conseil

Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining.

Protection des données personnelles : Vers un Web personnel sécurisé

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

OFFICE DE TOURISME DE LOURDES CAHIER DES CHARGES POUR LA CREATION D UNE APPLICATION MOBILE

Session Usager, Infrastructures, Réseaux sociaux et Transports intelligents

Construire son e-réputation. Les médias sociaux au service de l e-réputation

Comportement Web des touristes québécois

Le Etourismeen Jean-Luc BOULIN - MOPA. 1 ère Journée e-tourisme Pays de Bergerac

Présente. Un «réseau social cartographique» (Ouest France)

LE WEB-WEB 2 POUR L ADT DE LA DRÔME

Optimiser le référencement naturel de son site web

LES RESEAUX SOCIAUX MARDI 25 FEVRIER 2014

Bilan intermédiaire de la visibilité web de l événement :

Analyse de grandes bases de données en santé

Le programme d'accompagnement E-tourisme des CCI de Provence Alpes Côte d'azur Parcours : «Approfondissement»

Open Data. Enjeux et perspectives dans les télécommunications

Résultats du sondage en ligne

Intégration de données complexes pour une vision 360 du client. Chloé Clavel EDF R&D Département ICAME

Les entreprises et le big data

Indexmed : Le big data en écologie? Pas encore disent certains. Pas si sûr! Avec IndexMed. Relevons ce challenge!

I) Le contexte HIGH HOSPITALITY ACADEMY. II) Le programme HIGH HOSPITALITY ACADEMY

Introduction au datamining

Lettre de tendance : Le Big Data, un levier de croissance pour le tourisme? (octobre 2014)

Rencontre E-tourisme 25 Novembre Réseaux sociaux et avis de consommateurs Comment valoriser votre présence?

L Art d être Numérique. Thierry Pierre Directeur Business Development SAP France

Big data : vers une nouvelle science des risques?

Acteurs du tourisme : Optimisez votre présence et votre visibilité sur le web. Le 7 novembre 2011 Centre de Formation Pierre Cointreau

LES RENDEZ-VOUS E-TOURISME 2014

Je travaille mon image! Diffuser ses photos sur le web Mardi 14 avril 2015

Analyses croisées de sites Web pour détecter les sites de contrefaçon. Prof. Dr. Olivier Biberstein

SOMMAIRE. 1/ L e-tourisme Définition Les prestataires touristiques sur internet Les différents supports numériques utilisés

Brive 100 % Gaillard

Big Data et Graphes : Quelques pistes de recherche

Customer Intelligence

Une équipe à votre disposition

Les Ateliers Numériques avril Alboussière

FORUM CETO 2012 SOCIAL MEDIA & TOUR-OPERATING. Anne-Servane LASSERRE Marketing Director contact@milky.fr

M-Tourisme et réseaux sociaux : les pratiques des clientèles européennes. CRT Bretagne FNCRT 2013

Campagne de Communication Prévisionnelle. Web Intelligence & Réputation Internet

Pour un citoyen mieux informé en transports

Journée SITG, Genève 15 octobre Nicolas Lachance-Bernard M.ATDR Doctorant, Laboratoire de systèmes d information géographique

À noter que Flickr dispose aujourd hui d une interface en français, ce qui simplifie grandement son utilisation.

TELA BOTANICA Le réseau des botanistes francophones. Daniel MATHIEU, président Montpellier, FRANCE

Comprendre les outils mobiles

Panorama des problématiques de traitement de l information. Larbi Aït Hennani, Fatma Bouali, Vincent Vandewalle

Introduction au Data-Mining

Diagnostic numérique du Loir-et-Cher

Atelier numérique E-tourisme

PRÉSENTATION EXPRESS - TFE - VERCAMMEN AUGUSTIN - 3TID1 - DWM

Lundi de l Economie l Mardi 19 novembre. Foix. CCI Ariège

INTRODUCTION AU DATA MINING

Créer son site internet avec Jimdo. Web business

Big Data et Graphes : Quelques pistes de recherche

OKKI LETTRE DE MISSION DIAG- NUM-TER MANCHE TOURISME 29/07/2013

Formations Web. Catalogue 2014 Internet Référencement Newsletter Réseaux sociaux Smartphone

Data 2 Business : La démarche de valorisation de la Data pour améliorer la performance de ses clients

Content & Document Management IDC Conference 2007

Introduction Big Data

E - R E P U TAT I O N D E S I N D I V I D U S ( P E R S O N A L B R A N D I N G )

Séquence 4. Comment expliquer la localisation des séismes et des volcans à la surface du globe?

Formation continue. Ensae-Ensai Formation Continue (Cepe)

Il y a tellement de hype autour du big data que Gartner étudie un nouveau modèle ;-) Talend

Illustrations concrètes : cross selling et up-selling. Illustrations concrètes : la relation client - le social et l ing

La géomatique en Nouvelle-Calédonie usages professionnels et potentiels économiques

Spécificités, Applications et Outils

Cette solution s adresse aussi bien aux PME/PMI qu aux grands groupes, qu ils disposent ou non d une structure de veille dédiée.

Pentaho Business Analytics Intégrer > Explorer > Prévoir

Optimiser ma relation client par l

Forum Agropur Coopératives agricoles : Renforcer la compétitivité et saisir les nouvelles opportunités

FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis

Introduction. Informatique décisionnelle et data mining. Data mining (fouille de données) Cours/TP partagés. Information du cours

La Performance Digitale en Business to Business

Réalité augmentée smartphone et données géolocalisées

Introduction au Data-Mining

Diagnostic numérique de territoire Pays Mer Estérel. Roquebrune-sur-Argens Puget sur Argens. Claire Botella 2013 Chargée de mission e-tourisme

BIG DATA en Sciences et Industries de l Environnement

FORMATION TIC. Animer une communauté sur les réseaux sociaux

Les ateliers Numériques 2013

Quelle mise en œuvre opérationnelle?

NUMÉRIQUE > DIAGNOSTIC NUMÉRIQUE DU TERRITOIRE OFFICE DE TOURISME DINAN VALLÉE DE LA RANCE. Les pratiques numériques des acteurs touristiques

Le Baromètre e-commerce des petites entreprises

Ministère de la Culture et de la Communication

Transcription:

R, VISUALISATION ET APPRENTISSAGE ANALYSE DE COMPORTEMENTS TOURISTIQUES À PARTIR DE DONNÉES PHOTOGRAPHIQUES GÉOTAGGÉES B.Branchet G.Chareyron J.Da-Rugna

2 PRÉSENTATION Bérengère Branchet Gaël Chareyron Enseignants-Chercheurs en informatique Big Data, Open Data, Data Mining, Traitement d images, Visualisation Le monde

3 PLAN Problématique Sources de données Visualisation des données Analyse des données Conclusion

4 PROBLÉMATIQUE Utiliser les données issues d internet pour : Déterminer des comportement touristiques Déterminer des parcours touristiques Caractériser des populations touristiques Mesurer la e-réputation d un site touristique

LES TRACES NUMÉRIQUES COMME SOURCES D ENQUÊTES Des informations en quantité importante voire illimitée Quel que soit le lieu Quelle que soit l échelle 5 Des informations temps réel Mise à jour des sources constantes Toujours plus d utilisateurs, toujours plus diversifiées Des informations complexes, variées, hétérogènes Réseaux sociaux Blogs, forums Sites internet

6 DES TRACES AUX CONNAISSANCES L enjeu final : croiser l analyse automatique des traces avec l interprétation des contenus. Présenter quelques éléments sur la production des données, de leur sélection à leur interprétation. Modifier les approches et les méthodologies : méthode inductive sans connaissance ni préjugé sur les pratiques des visiteurs, ou la valeur des sites.

EXEMPLE : LE TOURISME EN SUISSE 7 R + ggplot

L EUROPE VUE PAR LES PHOTOGRAPHES DE PANORAMIO 8

9 SOURCE DE DONNÉES Données Images Flickr Panoramio Instagram Données commentaires Hotel.com TripAdvisor Blogs, forums

SOURCES DE DONNÉES IMAGES 10

SOURCES DE DONNÉES «COMMENTAIRES» 11

User 12 LES SOURCES PHOTOS GPS data by lat/lng Photographies GPS data by place Date and hours Groups Profil Comments Country of residence

User LES SOURCES «AVIS ET COMMENTAIRES» 13 Lat/lng Sites (H,A,R) Catégories Avis Age, Genre Profil Ville/Pays Liste Avis Liste lien forum

QUEL VOLUME POUR LE MONDE? 14 68 M photos 2 M users 196 M photos 1,9 M users 495 M photos 34 M users Panoramio Flickr Instagram 175 000 hôtels 10 M reviews Hotel.com 2,5 M sites 45 M d avis 10 M users Tripadvisor

PROBLÉMATIQUES SOCIAL DATA & BIG DATA? 15 Technique Données aberrantes Récolte et stockage des données Traitement de données massives Ethique Respect vie privée Représentativité Progression intrinsèque des réseaux sociaux Biais sociétaux Interprétation et intelligibilité des résultats

VISUALISATION DES DONNÉES 16

VISUALISATION (HOTEL.COM) 17

VISUALISATION (TRIPADVISOR) 18

VISUALISATION (TRIPADVISOR) 19

VISUALISATION DES DONNÉES GÉOLOCALISÉES 20 Tous les points Photo Densité Densité et diffusion

VISUALISATION PAR ZONE 21

22 INSTAGRAM ET TEMPORALITÉ

23 INSTAGRAM ET TEMPORALITÉ

24 UN PEU D INTELLIGENCE? Un potentiel immense, largement inexploité Détection automatique de comportements typiques / atypiques Détection des évolutions, des transformations Mesurer autrement Besoin de modélisation, d outils de fouilles de données, de méthodologies et de pluridisciplinarité

25 ANALYSES DES DONNÉES

26 ENRICHISSEMENT DES PROFILS 30% des utilisateurs sont «localisés» Peut-on élargir cette localisation pour mieux connaitre notre échantillon? Variables Traces des utilisateurs Apprentissage Algorithme C4.5 Règles expertes Identification Locaux vs étrangers Pays de résidence

DESCRIPTION DES PHOTOGRAPHES Construction d une «timeline» pour chaque utilisateur 27

Nombre total de photographies Nombre total de pays visités Pour chaque pays visité : Nombre de photographies Nombre de sites visités Nombre de visites dans le pays Nombre de jours dans le pays Nombre de jours entre 2 visites DESCRIPTION DES PHOTOGRAPHES 28

29 CLASSIFICATION Algorithme d apprentissage C4.5 avec cross validation Logiciels : Tanagra http://eric.univ-lyon2.fr/~ricco/tanagra/fr/tanagra.html Weka http://www.cs.waikato.ac.nz/ml/weka/ R http://www.r-project.org/

CLASSIFICATION PAR CONTINENTS Rappel Précision Afrique 0,73902 0,79281 Asie 0,87808 0,8926 Europe 0,94399 0,94705 Amérique du Nord 0,94999 0,94357 Océanie 0,87607 0,86719 Amérique du Sud 0,93994 0,93031 30

CLASSIFICATION PAR CONTINENTS 31

Quantile d ordre 80% : Q80 18 pays CLASSIFICATION PAR PAYS 32 Quantile d ordre 90% : Q90 32 pays Quantile d ordre 99% : Q99 79 pays

CLASSIFICATION PAR PAYS Q80 33

CLASSIFICATION PAR PAYS Q90 34

CLASSIFICATION PAR PAYS Q99 35

CLASSIFICATION «LOCAUX» / «NON-LOCAUX» 36

CLASSIFICATION «LOCAUX» / «NON-LOCAUX» 37 Q80 Précision-Rappel Pour les «Locaux»

CLASSIFICATION «LOCAUX» / «NON-LOCAUX» 38 Q80 Précision-Rappel Pour les «Non-Locaux»

CLASSIFICATION «LOCAUX» / «NON-LOCAUX» 39 Q80 Précision-Rappel Pour les «Locaux» Restriction aux users ayant pris des photos dans le pays considéré

CLASSIFICATION «LOCAUX» / «NON-LOCAUX» 40 Q80 Précision-Rappel Pour les «Non- Locaux» Restriction aux users ayant pris des photos dans le pays considéré

41 CONCLUSION Big Data Interprétation Innovation Récolte Performance Modélisation Data mining Représentativité Confrontation Biais sociétaux Nouveaux services Nouvelles analyses

42 CONCLUSION Sagesse Connaissance Information Données

43 MERCI DE VOTRE ATTENTION http://earthmapper.org http://world.earthmapper.org