Me#re le Big Data sur la carte : défis et avenues rela6fs à l exploita6on de la localisa6on



Documents pareils
Big data et données géospatiales : Enjeux et défis pour la géomatique. Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique

Tables Rondes Le «Big Data»

Cartographie des solutions BigData

20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars ans du SIAD -"Big Data par l'exemple" -Julien DULOUT

Introduction Big Data

BIG DATA et DONNéES SEO

HADOOP ET SON ÉCOSYSTÈME

Les participants repartiront de cette formation en ayant une vision claire de la stratégie et de l éventuelle mise en œuvre d un Big Data.

À PROPOS DE TALEND...

Les enjeux du Big Data Innovation et opportunités de l'internet industriel. Datasio 2013

Comment valoriser votre patrimoine de données?

Monétisation des données : comment identifier de nouvelles sources de revenus au sein des Big data?

La rencontre du Big Data et du Cloud

Le BigData, aussi par et pour les PMEs

FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis

Les défis statistiques du Big Data

TRAVAUX DE RECHERCHE DANS LE

Speed up your business

Formation Cloudera Data Analyst Utiliser Pig, Hive et Impala avec Hadoop

Le traitement du Big Data inclue la collecte, la curation, le stockage, l enrichissement, le croisement, la partage, l analyse et la visualisation.

Ne cherchez plus, soyez informés! Robert van Kommer

Systèmes Répartis. Pr. Slimane Bah, ing. PhD. Ecole Mohammadia d Ingénieurs. G. Informatique. Semaine Slimane.bah@emi.ac.ma

Le nouveau visage de la Dataviz dans MicroStrategy 10

Fouillez facilement dans votre système Big Data. Olivier TAVARD

L écosystème Hadoop Nicolas Thiébaud Tuesday, July 2, 13

Anticiper et prédire les sinistres avec une approche Big Data

BIG DATA en Sciences et Industries de l Environnement

Labs Hadoop Février 2013

Big Data On Line Analytics

FINI LA RÉCRÉ PASSONS AUX MÉGADONNÉES

Poli%que ins%tu%onnelle: le numérique au service de la forma%on à l Université Laval CFQCU Paris, 26 mai 2015

Big Data. Concept et perspectives : la réalité derrière le "buzz"

accompagner la transformation digitale grâce au Big & Fast Data Orange Business Services Confidentiel 02/10/2014

Pentaho Business Analytics Intégrer > Explorer > Prévoir

Le cycle de vie d'un projet en intelligence d'affaires

Les technologies du Big Data

Titre : La BI vue par l intégrateur Orange

Emergence du Big Data Exemple : Linked Open Data

Tout ce que vous avez toujours voulu savoir sur SAP HANA. Sans avoir jamais osé le demander

Les bases de données relationnelles

Catalogue de FORMATIONS 2015

SÉRIE NOUVELLES ARCHITECTURES

Big Data : utilisation d un cluster Hadoop HDFS Map/Reduce HBase

Technologies du Web. Ludovic DENOYER - ludovic.denoyer@lip6.fr. Février 2014 UPMC

QlikView et Google Big Query : Une réponse simple, rapide et peu coûteuse aux analyses Big Data

Quels choix de base de données pour vos projets Big Data?

NewPoint IT Consulting BIG DATA WHITE PAPER. NewPoint Information Technology Consulting

Perspectives en matière de portails géographiques et de 3D

T o u s d r o i t s r é s e r v é s O S I s o f t, L L C. SÉMINAIRES RÉGIONAUX

Les bases du SEO (référencement naturel)

BI dans les nuages. Olivier Bendavid, UM2 Prof. A. April, ÉTS

Catherine Chochoy. Alain Maneville. I/T Specialist, IBM Information Management on System z, Software Group

BIG DATA. Veille technologique. Malek Hamouda Nina Lachia Léo Valette. Commanditaire : Thomas Milon. Encadré: Philippe Vismara

DÉPLOIEMENT DE QLIKVIEW POUR DES ANALYSES BIG DATA CHEZ KING.COM

BIG Data et R: opportunités et perspectives

Introduction au Massive Data

Mégadonnées (Big data) et Complexité Session introductive

Présentation Level5. Editeur de Logiciels. «If it s not monitored, it s not in production» Theo Schlossnagle #velocityconf

Big Data et l avenir du décisionnel

DEMARRER UN PROJET BIGDATA EN QUELQUES MINUTES GRACE AU CLOUD

Big Data. Cyril Amsellem Consultant avant-vente. 16 juin Talend

Optimisation de la supervision by Somone. - Présentation Générale -!

Emergence du Big Data Exemple : Linked Open Data

Sites Internet : les. tendances. Jeudi 30 janvier 2014 Bordeaux L AGENCE CONNECTÉE À L ENTREPRISE

L Infonuagique, c est quoi? «Cloud Compu2ng» Survol à TRÈS haut niveau

Réunion de rentrée Licence PER Programma3on en environnement répar3. Année universitaire

AVRIL Au delà de Hadoop. Panorama des solutions NoSQL

Séminaire Partenaires Esri France 6 et 7 juin 2012 Paris. ArcGIS et le Cloud. Gaëtan LAVENU

Entreprise et Big Data

Groupe de Discussion Big Data Aperçu des technologies et applications. Stéphane MOUTON

R+Hadoop = Rhadoop* Des logiciels libres complémentaires, une implémentation, une réponse au nouveau paradigme du bigdata!

Hadoop, les clés du succès

Vos experts Big Data. Le Big Data dans la pratique

Panorama des solutions analytiques existantes

IBM Software Big Data. Plateforme IBM Big Data

Big Data et Statistique Publique

Bases de données documentaires et distribuées Cours NFE04

Pourquoi intégrer le Big Data à son organisa3on?

Innovative BI with SAP Jean-Michel JURBERT D. de Marché BI, HANA, BIG DATA _ SAP France

L offre décisionnel IBM. Patrick COOLS Spécialiste Business Intelligence

Document réalisé par Khadidjatou BAMBA

Introduction à MapReduce/Hadoop et Spark

Système d Information Géographique (SIG) : quels apports dans les métiers de l assurance?

Big Data Concepts et mise en oeuvre de Hadoop

Cassandra et Spark pour gérer la musique On-line

L offre Stockage et serveurs System x / BladeCenter F.Libier, Business Partner Technical Manager

Présenta6on Isatech. ERP, Décisionnel, Architecture Systèmes & Réseaux. Isatech Tous droits réservés Page 1

L Internet des objets

L Art d être Numérique. Thierry Pierre Directeur Business Development SAP France

Location Analytics. Astrid GLADYS Thierry BABELAERE Pierre TEYSSENDIER. SIG 2013 Conférence Francophone 2 & 3 Octobre Versailles Atelier Technique

Business Intelligence, Etat de l art et perspectives. ICAM JP Gouigoux 10/2012

Hadoop dans l entreprise: du concept à la réalité. Pourquoi et comment?

Big Data? Big responsabilités! Paul-Olivier Gibert Digital Ethics

Hervé Couturier EVP, SAP Technology Development

Comprendre le Big data grâce à la visualisation

Big Data -Comment exploiter les données et les transformer en prise de décisions?

Nom du client. Date. Client Logo or project name

Les 10 étapes clés pour trouver des clients par internet


Transcription:

Me#re le Big Data sur la carte : défis et avenues rela6fs à l exploita6on de la localisa6on Thierry Badard, PhD, ing. jr Centre de Recherche en Géoma6que Conférence ITIS - Big Data et Open Data au coeur de la ville intelligente 29 avril 2014

Plan de la présenta-on Déluge de données Qu est ce que le Big data Écosystème technologique Big data Use cases et défis rela-fs au Big data Et le géospa-al dans tout cela? Défis et enjeux

Variété de sources d informa-on Explosion de la téléphonie mobile Quan-té colossale de documents/informa-ons Sur le Net mais aussi dans vos propres systèmes d informa-on! Wiki, blogs, documents Word, PDF, emails, logs/transac-ons, stats Apogée des réseaux sociaux Non seulement textuels, mais aussi image, vidéo, Avec documents, données hautement non structurées Développement de l open data Accessibilité de plus en plus grande à de la donnée $ Développement d API d accès Les capteurs sont partout et fournissent des quan-tés immenses : Imagerie, vidéo, nuages de points, mesures diverses, En con-nu dans le temps è Historique, accès à différents états

Variété de sources d informa-on

Variété de sources d informa-on

Variété de sources d informa-on

Variété de sources d informa-on Explosion de la téléphonie mobile Quan-té colossale de documents/informa-ons Sur le Net mais aussi dans vos propres systèmes d informa-on! Wiki, blogs, documents Word, PDF, emails, logs/transac-ons, stats Apogée des réseaux sociaux Non seulement textuels, mais aussi image, vidéo, Avec documents, données hautement non structurées Développement de l open data Accessibilité de plus en plus grande à de la donnée $ Développement d API d accès Les capteurs sont partout et fournissent des quan-tés immenses : Imagerie, vidéo, nuages de points, mesures diverses, En con-nu dans le temps è Historique, accès à différents états Explosion à venir des objets connectés (Internet of Things), drones (diminu-on des coûts),

Informa-on overload Souce : IDC

Informa-on overload Souce : IDC

Qu est ce que le Big data? Dan Ariely

Qu est ce que le Big data? Selon un étude intéressante de Celent auprès de 33 ins-tu-ons financières (banques et assurances) : Les répondants devaient choisir 3 phrases parmi 4 pour définir le terme Big data : "data that is semi- structured or unstructured" (74%) "predic-ve analy-cs or modeling" (68%) "large volumes of data that can not be accommodated with tradi-onal rela-onal DBMS" (59%) social media data (27%)

Qu est ce que le Big data? Selon un étude intéressante de Celent auprès de 33 ins-tu-ons financières (banques et assurances) : Les répondants devaient choisir 3 phrases parmi 4 pour définir le terme Big data : "data that is semi- structured or unstructured" (74%) "predic-ve analy-cs or modeling" (68%) "large volumes of data that can not be accommodated with tradi6onal rela6onal DBMS" (59%) social media data (27%)

Les 3 V de Gartner Introduit en 2001 par Doug Laney de Gartner : Volume Variété Côté structuré/non structuré des données n est qu un aspect Vélocité Fait référence à la fréquence de changement des données Et donc à la durée pendant laquelle ces données restent per-nentes Nécessite donc des technologies qui peuvent agréger très rapidement ces données pour en permenre l analyse dans un délais court On peut ajouter : Valeur ou la Véracité Qualité de ces données : Garbage in / garbage out! Défis important du Big data! Mais aussi importance existence d un business case!

Écosystème technologies Big data Pas de solu-on unique / diversité des analyses Stockage et traitement distribué de l informa-on Cloud, cluster de nœuds, Pas seulement Hadoop! GoogleFS, BigTables, MapReduce, Lot de technologies Big data NoSQL MongoDB, Cassandra, Entrepôts de données MPP (Massively Parallel Processing) Ex. : IBM Netezza, GreenPlum, Ver-ca, Solu-ons dites de «In memory compu-ng» Ex. : SAP HANA, Aussi de plus en plus présent dans couche analy-que de l écosystème Hadoop

Écosystème Hadoop Écosystème riche à plusieurs couches : Du stockage, traitement/intégra-on à l interroga-on et l analyse Traitement batch vs. temps réel

Big data use cases Source : Gartner, 2013

Big data use cases Source : Gartner, 2013

Big data use cases Pourquoi u-liser des technos big data? Diminu-on des coûts : Hadoop as a staging area 1TB de données : Hadoop ($500 à $2,000) vs. high end EDW ($20,000 à $200,000) Ne remplace pas les solu-ons BI/analyse en place mais les complémentent! Maintenant moyen d entreposer l EDW dans Hadoop Structura-on plus «agile» è Tester plusieurs modèles? Permenent de répondre à des besoins d analyse dans des temps plus courts ou qui ne pouvaient être adressés par les technologies actuelles 2x moins de temps = 2 fois plus de nœuds! Mais nécessité de bien définir un business case réaliste! Sinon risque important d errance et d avoir du mal à jus-fier in fine un projet Big data

Défis Big data Si les aspects stockage, intégra-on et interroga-on peuvent toujours progresser, déjà des solu-ons intéressantes qui existent et peuvent être u-lisées D autant plus qu elles se couplent aux engins BI déjà en place! Néanmoins, ces technos ne sont pas la solu6on miracle à tous les maux! Les données non structurées pour être analysées doivent être structurées même si cela ne se fait un peu qu au dernier moment et de façon moins figée! Image, vidéo, textes bruts,... imposent que ces technos doivent disposer de capacités d intégra-on, d interroga-on et d analyse appropriées/spécifiques/spécialisées Elles sont pour l heure non adressées par ces technologies!

Retour sur l étude de Gartner Source : Gartner, 2013

Défis Big data Si les aspects stockage, intégra-on et interroga-on peuvent toujours progresser, déjà des solu-ons intéressantes qui existent et peuvent être u-lisées D autant plus qu elles se couplent aux engins BI déjà en place! Néanmoins, ces technos ne sont pas la solu6on miracle à tous les maux! Les données non structurées pour être analysées doivent être structurées même si cela ne se fait un peu qu au dernier moment et de façon moins figée! Image, vidéo, textes bruts,... imposent que ces technos doivent disposer de capacités d intégra-on, d interroga-on et d analyse appropriées/spécifiques/spécialisées Elles sont pour l heure non adressées par ces technologies! De plus, l analyse passant par la visualisa-on des informa-ons, comment visualiser/interagir avec ces grandes masses d informa-on?

Défis de visualisa-on du Big data Source : hnps://www.flickr.com/photos/jurvetson/916142/

Défis de visualisa-on du Big data Source : hnp://www.flickr.com/photos/marc_smith/6879238126/

Défis de visualisa-on du Big data Source : hnp://www.keywebmetrics.com/2013/07/big- data- visualiza-ons/

Défis de visualisa-on du Big data Source : hnp://www.nsf.gov/news/news_images.jsp?cntn_id=125855&org=nsf/

Défis de visualisa-on du Big data Source : hnp://www.keywebmetrics.com/2013/07/big- data- visualiza-ons/

Défis de visualisa-on du Big data Source : hnp://www.psmag.com/naviga-on/nature- and- technology/geography- beer- 78105/

Défis de visualisa-on du Big data Source : hnp://m.theatlan-cci-es.com/neighborhoods /2014/04/map- all- places- us- where- nobody- lives/ 8910/

Défis de visualisa-on du Big data Source : Spa-aly-cs

La carte Un médium de communica-on intui-f Tout le monde la comprend, se situe et en appréhende les rela-ons entre en-tés (proximité, densité, forme, intensité, ) Permet de croiser/superposer différentes informa-ons et de faire les liens entre les couches de données Naviga-on intui-ve au sein de l informa-on (cf. Google Maps/Earth) Un médium assez universel 80 % of all data stored in corporate databases has a spa-al component [Franklin 1992]

Prochaine étape : la donnée géo? Source : Gartner, 2013

Composante géospa-ale Composante riche : S exprime à l aide de primi-ves simples : Vecteur : points, lignes, polygones (et volumes en 3D) Raster : données d imagerie (pixel) mais aussi grid, point clouds Complexe et poten-ellement volumineuse Lignes ou polygones avec dizaines de milliers de points Dé-ent une séman-que implicite Forme, orienta-on, rela-ons spa-ales, Nécessite des fonc-ons/opérateurs spéciaux pour l analyser mais largement sous- es-mée vs. le temps Alors que fondamentale à la prise de décision pleinement éclairée! Encore plus riche si on croise temps et espace (suivi spa-o- temporel de phénomènes, mise en exergue de patrons qui se répètent dans le temps et l espace, )

Vers des solu-ons Geo Big Data Ins-ller/intégrer de façon cohérente la composante spa-ale et ses opérateurs d interroga-on/analyse dans le «mille- feuille Big data» Stockage Intégra-on Traitement Interroga-on Analyse Fouille/explora-on Rendre la composante spa-ale aussi simple à manipuler, traiter et interroger que n importe quel type abstrait de données usuel (nombre, date, )

Vers des solu-ons Geo Big Data Certaines solu-ons commencent à apparaître au niveau stockage et accès/interroga-on en mode batch Spa-al Hadoop HadoopGIS GIS Tools for Hadoop (ESRI) Spa-al Hive Hive SP Pigeon (basé sur Pig) GeoMesa (basé sur Accumulo) Un commencement seulement Très embryonnaire pour bon nombre, prototypes de R&D Bien loin encore de l analyse en temps quasi- réel

Vers des solu-ons Geo Big Data De nouvelles méthodes et techniques de visualisa-on cartographique restent à inventer Capables d afficher et de naviguer dans ces grands volumes de données, de façon fluide et en temps réel Pour ne pas entraver le processus de pensée d un analyste Capables de supporter la Vélocité qu impose le Big data rapidité des changements et impacts qu ils peuvent avoir sur les données (rela-ons) Avec comme support un simple navigateur web

Autres défis Géo & Big data Nouvelles méthodes d analyse de données Qualité des données Sécurité des données Aspect confiden-alité, respect de la vie privée et responsabilité vis- à- vis de la donnée Disposer d exper-se Forma-on de la relève

MERCI Pour me contacter : Thierry.Badard @scg.ulaval.ca Tél. : 418 656-7116 Skype : tbadard Twi#er : @tbadard LinkedIn : h#p://ca.linkedin.com/in/thierrybadard