4. Gestion des données urbaines dans les nuages informatiques

Documents pareils
Big Data et Graphes : Quelques pistes de recherche

Panorama des solutions analytiques existantes

Les technologies du Big Data

Big Data et Graphes : Quelques pistes de recherche

L écosystème Hadoop Nicolas Thiébaud Tuesday, July 2, 13

20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars ans du SIAD -"Big Data par l'exemple" -Julien DULOUT

Cloud Computing. Introduction. ! Explosion du nombre et du volume de données

Programmation parallèle et distribuée

Cloud Computing Maîtrisez la plate-forme AWS - Amazon Web Services

Déploiement d une architecture Hadoop pour analyse de flux. françois-xavier.andreu@renater.fr

Perspectives pour l entreprise. Desktop Cloud. JC Devos IBM IT Architect jdevos@fr.ibm.com IBM Corporation

Technologie SDS (Software-Defined Storage) de DataCore

SAP Business Suite Powered by SAP HANA Transactionnel et Analytique réunis

Mathieu Rivoalen. Etude d'approfondissement des réseaux RICM 5 Option Réseaux

Fouillez facilement dans votre système Big Data. Olivier TAVARD

ETUDE ET IMPLÉMENTATION D UNE CACHE L2 POUR MOBICENTS JSLEE

Enseignant: Lamouchi Bassem Cours : Système à large échelle et Cloud Computing

DEMARRER UN PROJET BIGDATA EN QUELQUES MINUTES GRACE AU CLOUD

FAMILLE EMC VPLEX. Disponibilité continue et mobilité des données dans et entre les datacenters AVANTAGES

Informatisation du Système d Information

HADOOP ET SON ÉCOSYSTÈME

Les environnements de calcul distribué

CNAM Déploiement d une application avec EC2 ( Cloud Amazon ) Auteur : Thierry Kauffmann Paris, Décembre 2010

Cloud Computing : Utiliser Stratos comme PaaS privé sur un cloud Eucalyptus

Entreprise et Big Data

SQL Server 2008 et YourSqlDba

L'agilité appliquée à nous-mêmes. Philippe Krief, PhD Development Manager IBM France Lab

Travaillez en toute liberté grâce à Internet

Stephan Hadinger, Sr. Mgr Solutions Architecture, AWS. Salon du Big Data 11 mars 2015


Cassandra et Spark pour gérer la musique On-line

FAMILLE EMC VPLEX. Disponibilité continue et mobilité des données dans et entre les datacenters

PARTAGE DE DOCUMENTS EN LIGNE AVEC ONEDRIVE

CA Automation Suite for Data Centers

Bases de données documentaires et distribuées Cours NFE04

UNIFIED. Nouvelle génération d'architecture unifiée pour la protection des données D TA. dans des environnements virtuels et physiques PROTECTION

Conception des systèmes répartis

Big Data. Concept et perspectives : la réalité derrière le "buzz"

Informatique en nuage Cloud Computing. G. Urvoy-Keller

La rencontre du Big Data et du Cloud

Fiche Produit MediaSense Extensions

Business Intelligence

Architectures informatiques dans les nuages

Hadoop, les clés du succès

Les solutions centre de données virtuel et Infrastructure-service de Bell

Oracle Maximum Availability Architecture

Anatomie d'un cloud IaaS Représentation simplifiée

Défi Cloud Computing

DESCRIPTIONS DES PRODUITS ET MÉTRIQUES

Groupe de Discussion Big Data Aperçu des technologies et applications. Stéphane MOUTON

Plan 1/9/2013. Génération et exploitation de données. CEP et applications. Flux de données et notifications. Traitement des flux Implémentation

Sécurité des entrepôts de données dans le Cloud Un SaaS pour le cryptage des données issues d un ETL

BIG Data et R: opportunités et perspectives

Labs Hadoop Février 2013

IBM SPSS Modeler Text Analytics Server for Windows. Instructions d installation

Planifier la migration des applications d entreprise dans le nuage

ArcGIS 10.1 for Server

PLATE-FORME DE CLOUD COMPUTING SLAPOS. Intégration d applications

Introduction au Cloud Computing

Vers une IT as a service

Big data et données géospatiales : Enjeux et défis pour la géomatique. Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique

Optimisation des niveaux de service dans le cadre de déploiements de Clouds publics

Cassandra chez Chronopost pour traiter en temps réel 1,5 milliard d événements par an

Exigez davantage de vos solutions de stockage. Système de stockage IBM Storwize V3700

Évaluation d une architecture de stockage RDF distribuée

LES NOUVEAUX FACTEURS DE COMPÉTITIVITÉ BASÉS SUR LA 3 ÈME PLATEFORME INFORMATIQUE. Sébastien LAMOUR IDC Research & Consulting Manager

Ecole Mohammadia d Ingénieurs Systèmes Répartis Pr. Slimane Bah, ing. PhD G. Informatique Semaine 24

Business Intelligence simple et efficace avec Excel et PowerPivot

6 - Le système de gestion de fichiers F. Boyer, UJF-Laboratoire Lig, Fabienne.Boyer@imag.fr

Big Data. Cyril Amsellem Consultant avant-vente. 16 juin Talend

La surveillance réseau des Clouds privés

FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis

Chapitre 1. Infrastructures distribuées : cluster, grilles et cloud. Grid and Cloud Computing

ESPACE MULTIMEDIA DU CANTON DE ROCHESERVIERE

Pair-à-Pair: Architectures et Services

EMC DATA DOMAIN OPERATING SYSTEM

X2BIRT : Mettez de l interactivité dans vos archives

COLLECTION N.T.I.C. Livre Blanc. Les promesses du Cloud Computing : réalité ou fiction? Chris Czarnecki En-lighten Technology Ltd.

M2 GL UE DOC «In memory analytics»

DESCRIPTION DU CONCOURS QUÉBÉCOIS INFORMATIQUE (GESTION DE RÉSEAUX)

Ne laissez pas le stockage cloud pénaliser votre retour sur investissement

Formation owncloud Thierry DOSTES - Octobre

Les ressources numériques

Veille Technologique. Cloud-Computing. Jérémy chevalier

Business & High Technology

Anticiper et prédire les sinistres avec une approche Big Data

BIG DATA : une vraie révolution industrielle (1) Les fortes évolutions liées à la digitalisation

BOUYGUES TELECOM ENTREPRISES - CLOUD

La tête dans les nuages

sécurisation des systèmes d information BE READY FOR WHAT S NEXT. Kaspersky Open Space Security

Big Data On Line Analytics

UNIFIED D TA. architecture nouvelle génération pour une restauration garantie (assured recovery ) que les données soient sur site ou dans le cloud

BIG DATA. Veille technologique. Malek Hamouda Nina Lachia Léo Valette. Commanditaire : Thomas Milon. Encadré: Philippe Vismara

UC4 effectue tout l ordonnancement batch pour Allianz en Allemagne

Remarque : notre dernière étude sur Memopal datant de l an dernier est disponible ici

Notice de fonctionnement DVR H Méthode de Visionnage ESEENET

Les participants repartiront de cette formation en ayant une vision claire de la stratégie et de l éventuelle mise en œuvre d un Big Data.

1 Introduction et installation

Fiche Produit Global Directory pour Jabber

Transcription:

4. Gestion des données urbaines dans les nuages informatiques Brève histoire des nuages informatiques Modèles de service et de déploiement Technologie clé : la virtualisation IaaS : les points de vue utilisateur et fournisseur PaaS : programmation et déploiement des applications Stockage de données Traitement de données Traitement de flux de données Christine Morin VILLES INTELLIGENTES : DÉFIS TECHNOLOGIQUES ET SOCIÉTAUX

Deux types de traitement de données Traitement de données en mode batch Gros volumes de données stockées sur disque Fouille de données, analyse statistique Traitement de flux de données en (presque) temps réel Données des smartphones et des capteurs Analyse de comportement, de tendances, surveillance, notifications, guidage 2

Défis du traitement de flux de données Caractéristiques des flux de données Volume Variabilité Vélocité Obtenir de l information utile en (presque) temps-réel à partir de flux de données continus 3

Définition d un flux de données Un flux de données est une séquence (potentiellement) infinie de tuples. <t1, t2, t3, > Un tuple décrit un événement et est émis par une source. (type, date, données spécifiques) 4

Description et structure d une application de traitement de flux de données Source Un traitement de flux de données est défini comme un graphe acyclique d éléments de calcul. Eléments de calcul Requêtes continues Client 5

Eléments de calcul et fenêtres Exemples Filtre, map, agrégation Elément de calcul Applique un traitement sur un tuple ou une fenêtre de tuples Est avec ou sans état Fenêtre Portion finie d un flux infini Plage de temps Nombre de tuples 6

Architecture d un environnement de traitement de flux de données Sources Nœud 1 Eléments de calcul Nœud 2 Nœud 3 Clients 7

Qualité de service Traitement des situations de surcharge Une partie des données n est pas traitée ü Aléatoirement ü Selon une politique de priorité ü Selon l impact sur la qualité de service Elimination ou stockage en vue d un traitement différé Traitement des défaillances Défaillance d éléments de traitement Perte de données 8

Traitement de flux de données dans les clouds Personnalisation de la configuration pour les opérateurs Possibilités d adaptation étendues Adaptation de l application Nombre d instances de machine virtuelle Quantité de ressources de la machine virtuelle Adaptation automatique (auto-scaling) Gestion dynamique des ressources par le fournisseur de cloud 9 Migration de machine virtuelle

Logiciels de traitement de flux de données Grands fournisseurs de clouds Kinesis, MillWheel, Azure stream, IBM streams Grands acteurs du traitement de données Storm Mantis Communautés open source S4, Samza (Apache) Spark streaming (UC Berkeley) Heka (Mozilla) 10

Tendances récentes du traitement de flux de données dans le cloud Stream (Data) processing as a Service (DaaS) Contrat de service Optimisation de l utilisation des ressources dans les clouds IaaS Grand nombre de requêtes et de flux au comportement imprévisible Optimisation du coût économique des traitements de flux de données Traitement combiné de données stockées sur disque et de flux de données 11

Un exemple de pile logicielle de traitement de données : Berkeley Data Analytics Stack (BDAS) Projet américain mené par UC Berkeley 12

Un exemple de pile logicielle de traitement de données : Stratosphere Projet européen mené par TU Berlin, Humboldt University et Hasso Plattner Institute 13

Un grand défi du cloud pour la ville intelligente Traitement de données massives en temps-réel dans le contexte de l Internet des objets pour fournir efficacement des informations pertinentes à de très nombreux utilisateurs mobiles en fonction de leur localisation et du contexte 14

Illustrations & photos : crédits p. 2 : Julien Eichinger, Fotolia ;; By Camelia.boban CC BY-SA 3.0, via Wikimedia Commons ;; Domaine public, Pixabay. p. 3 : Domaine public, Pixabay. p. 13 : droits réservés, projet Berkeley Data Analytics Stack, https://amplab.cs.berkeley.edu/software/ p. 14 : droits réservés, projet européen Stratosphere piloté par TU Berlin, Humboldt University et Hasso Plattner Institute p.15 : weedezign, Shutterstock 15