Traitement de données massives dans les réseaux de capteurs sans fil



Documents pareils
Introduction à MapReduce/Hadoop et Spark

BIG DATA en Sciences et Industries de l Environnement

Tables Rondes Le «Big Data»

Groupe de Discussion Big Data Aperçu des technologies et applications. Stéphane MOUTON

Big Data? Big responsabilités! Paul-Olivier Gibert Digital Ethics

Pentaho Business Analytics Intégrer > Explorer > Prévoir

Les technologies du Big Data

Panorama des solutions analytiques existantes

20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars ans du SIAD -"Big Data par l'exemple" -Julien DULOUT

Big Data, gros trafic et consommation

Programmation parallèle et distribuée

Big Data. Concept et perspectives : la réalité derrière le "buzz"

Le BigData, aussi par et pour les PMEs

BIG DATA et données externes dans les modèles de tarification

Fouillez facilement dans votre système Big Data. Olivier TAVARD

Programmation parallèle et distribuée

Business Intelligence, Etat de l art et perspectives. ICAM JP Gouigoux 10/2012

Livret de Stages 2014 / 2015

L écosystème Hadoop Nicolas Thiébaud Tuesday, July 2, 13

Surmonter les 5 défis opérationnels du Big Data

Programmation parallèle et distribuée (Master 1 Info )

Big data et données géospatiales : Enjeux et défis pour la géomatique. Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique

Kick Off SCC 2015 Comment faire de votre infrastructure de stockage une source d économie? Vers de nouveaux horizons

DÉPLOIEMENT DE QLIKVIEW POUR DES ANALYSES BIG DATA CHEZ KING.COM

Introduction Big Data

MapReduce. Nicolas Dugué M2 MIAGE Systèmes d information répartis

Déterminer les enjeux du Datacenter

Acquisition des données - Big Data. Dario VEGA Senior Sales Consultant

BI SWISS FORUM (ecom / SITB)

Cloud Computing Enjeux stratégiques & transformationnels. Franck Besnard, Principal / Strategist, VMware

Prototypage et évaluation de performances d un service de traçabilité avec une architecture distribuée basée sur Hadoop

Transformez vos données en opportunités. avec Microsoft Big Data

Les journées SQL Server 2013

HADOOP ET SON ÉCOSYSTÈME

Introduction aux algorithmes MapReduce. Mathieu Dumoulin (GRAAL), 14 Février 2014

Masses de données. 1. Introduction 2. Problématiques 3. Socle de formation (non présenté) 4. Liens avec Formation INSA

Transformation IT de l entreprise FLUIDIFIER LES ÉCHANGES CLIENTS : QUEL AVENIR POUR L INTÉGRATION BTOB?

Centre de données de TELUS, le futur est simple. Gilles Rouleau Membre de l équipe TELUS Montréal, 46 e édition - Club Télécom Le 16 novembre 2011

Entreprise et Big Data

Entreprise. Gestion énergétique de votre parc informatique

Big Data On Line Analytics

Plans d'action pour une mise en œuvre réussie des Big Data

Gouvernance & Influence des Systèmes d Information. 2 Décembre 2014

DOCUMENT D INFORMATION D IDC

Le traitement du Big Data inclue la collecte, la curation, le stockage, l enrichissement, le croisement, la partage, l analyse et la visualisation.

Master Data Management en Open Source C est le Bon Moment

Monitoring THPE. Soutien au projet. Présentation du projet

Me#re le Big Data sur la carte : défis et avenues rela6fs à l exploita6on de la localisa6on

Fouille de données massives avec Hadoop

RETOUR D EXPÉRIENCE SUR L INTERNET DES OBJETS

SpagoBI: la seule suite décisionnelle 100% open source, complète et flexible

Thomas Loubrieu (Ifremer) Small to Big Data Novembre 2013, Ifremer, Brest

Quel hébergement choisir?

BIG Data et R: opportunités et perspectives

Transformation IT de l entreprise BPM ET APPROCHE MÉTIER

Catherine Chochoy. Alain Maneville. I/T Specialist, IBM Information Management on System z, Software Group

Teste et mesure vos réseaux et vos applicatifs en toute indépendance

API04 Contribution. Apache Hadoop: Présentation et application dans le domaine des Data Warehouses. Introduction. Architecture

Jean-François Boulicaut & Mohand-Saïd Hacid

Postes à pourvoir 2015

Contrôlez et Maîtrisez votre environnement de messagerie Lotus Notes Domino

WHITEPAPER. Quatre indices pour identifier une intégration ERP inefficace

Conserver les Big Data, source de valeur pour demain

Big Data et Graphes : Quelques pistes de recherche

NEC Virtual PC Center

Les ressources numériques

Vers une IT as a service

Sujet Solution de sauvegarde de serveurs et postes de travail avec BackupPC et Bacula. par ALIXEN

BI = Business Intelligence Master Data-ScienceCours 2 - ETL

CARTOGRAPHIE EN LIGNE ET GÉNÉRALISATION

BI = Business Intelligence Master Data-Science

La Conversion Numérique de l Économie

SQL Server 2012 et SQL Server 2014

«Converged Infrastructure» des «buzzword» du marketing ou une approche du système garantissant le succès?

Comment la gestion de l identité numérique peutelle résoudre les cinq failles de sécurité d Hadoop?

Big Data et la santé


SÉRIE NOUVELLES ARCHITECTURES

DOSSIER SOLUTION CA ERwin Modeling. Comment gérer la complexité des données et améliorer l agilité métier?

PCI DSS un retour d experience

Cloud Computing. 19 Octobre 2010 JC TAGGER

Repoussez vos frontières

Big Data et Graphes : Quelques pistes de recherche

ITIL Gestion de la capacité

IBM Software Big Data. Plateforme IBM Big Data

E-Guide COMMENT PRENDRE LA MAIN SUR LES PROJETS BIG DATA

Hands on Openstack : Introduction

LES ENTREPRISES PROSPÈRES SE TRANSFORMENT GRÂCE À DES SOLUTIONS SAP FLEXIBLES

Dossier Special LE SOFTWARE DEFINED STORAGE

Data 2 Business : La démarche de valorisation de la Data pour améliorer la performance de ses clients

Big Data -Comment exploiter les données et les transformer en prise de décisions?

Rôles serveur Notion de Groupe de Travail Active Directory Utilisation des outils d administration Microsoft Windows Server 2008

Principaux utilisateurs du Réseau

Résumé : «Diagnostic sectoriel de la main-d œuvre du secteur des technologies de l information et des communications 2011»

Cloud Computing & PHP

Cartographie des solutions BigData

25 % EXPERTS PAR AN. + de de 35. près de 50 DE CROISSANCE DE L OPEN SOURCE ANNÉES D EXPERIENCE AU SERVICE DE L OPEN SOURCE

Pérennisation des Informations Numériques

Certificat Big Data - Master MAthématiques

Transcription:

Traitement de données massives dans les réseaux de capteurs sans fil Elmahdi Driouch sous la supervision de: Prof. Wessam Ajib 24 février 2015 1

Plan Motivations Données massives IoT et réseaux de capteurs Réseaux de capteurs et traitement de données MapReduce Formulation du problème Analogie avec «Facility location» Travaux futurs Conclusion 2

Big Data: défini en 4V et traité en 4C «Ensembles de données qui ne peuvent être saisies, gérées et traitées par les systèmes traditionnels» 4 V s (Gartner 2001 puis 2011) Volume Vélocité Variété Véracité (IBM) or Valeur (IDC) 4 C s (Jim Gray) Capturer «Curate» (ETL) Calculer Communiquer 3

IoT: sources de données massives Selon Vint Cerf: Internet des objets (IoT) = Internet des capteurs Caractéristiques des données du IoT Des données à très grand échelle (dimension temporelle) Hétérogénéité Corrélation dans le temps et l espace Une petite portion des données est importante 4

Big Data dans Hype cycle de Gartner (2014) 5

IoT dans le Hype cycle de Gartner (2015) 6

2022: Un billion de capteurs? 7 source: http://tsensorssummit.org/resources/tsensors%20roadmap%20v1.pdf

Big Data en 4 phases 1. Génération des données depuis plusieurs sources: Internet, données d entreprise, IoT, médical, 2. Acquisition des données inclut la collecte, le transport et le pré-traitement 3. Stockage des données 4. Analyse des données 8

Réseau de capteurs (simplifié) Capteurs Sink (ex. centre de données) Liens sans fil 9

Réseaux de capteurs sans fil Les capteurs peuvent disposer d une source d énergie renouvelable Les contraintes d énergie sont de plus en plus surmontables Les capteurs possèdent des processeurs plus performants et des mémoires plus grandes ils sont près à faire des calculs plus complexes Augmenter le traitement effectué dans le réseau (in-network processing) 10

MapReduce par l exemple (1/4) «Je vis à Montréal Je vis à Montréal à Montréal je vis Mais que pensez-vous de la vie à Laval?» je: 3 vis: 3 à: 4 Montréal: 3 Mais: 1 que: 1 11

MapReduce par l exemple (2/4) «Je vis à Montréal Je vis à Montréal à Montréal je vis Mais que pensez-vous de la vie à Laval?» {Je: 2, vis: 2, à: 2, Montréal:2} {à: 1, Montréal: 1, } {à: 1, la: 1, } {je: 3 vis: 3 à: 4 Montréal: 3 Mais: 1 que: 1 } 12

MapReduce par l exemple (3/4) «Je vis à Montréal Je vis à Montréal à Montréal je vis Mais que pensez-vous de la vie à Laval?» {Je: 2, vis: 2, à: 2, Montréal:2} {à: 1, Montréal: 1, } {à: 1, la: 1, } {Je: 3, à: 4, la: 1} {vis: 3, Mais: 1, } {Montréal: 3, Laval: 1, } 13

MapReduce par l exemple (4/4) «Je vis à Montréal Je vis à Montréal à Montréal je vis Mais que pensez-vous de la vie à Laval?» {Je: 2, vis: 2, à: 2, Montréal:2} {à: 1, Montréal: MAP1, } {à: 1, la: 1, } {Je: 3, à: 4, la: 1} {vis: 3, Mais: 1, } REDUCE {Montréal: 3, Laval: 1, } 14

Réseau étudié Capteurs Sink (ex. centre de données) Liens sans fil 15

Traitement dans le réseau reducer of k2 reducer of k1 mapper of k1 mapper of k2 mapper of k1 16

Traitement dans le réseau reducer of k2 reducer of k1 mapper of k1 mapper of k2 mapper of k1 Capteur récolteur d énergie 17

Formulation du problème Minimisation du temps total requis pour le traitement des données Le temps est en relation direct avec les niveaux d énergie disponibles Décider des capteurs mappers et ceux reducers (et leurs clés) Sous plusieurs contraintes niveaux d énergie qualité des canaux sans fil architecture physique du réseau et des capteurs quantités de données capturées reducer of k2 mapper of k2 reducer of k1 mapper of k1 mapper of k1 18

Problème de localisation des installations Ensemble de clients Chaque client possède une demande Ensemble d endroits pour ouvrir des installations Matrice des distances (clients, installations) Coûts d ouverture des installations D1 D2 D3 DN Clients Installations O1 O2 O3 OM 19

Problème de localisation des installations Minimiser (coûts d ouverture + coûts de transport) Sous contrainte Capacité de chaque installation Chaque client est associé à une installation Chaque client est servi en totalité D1 D2 Clients Installations O1 O2 D3 O3 DN 20 OM

Analogie avec «Facility location» Ensemble de clients Chaque client possède une demande Ensemble d endroits pour ouvrir des installations Matrice des distances (clients, installations) Coûts d ouverture des installations Ensemble des mappers (tous les capteurs) Chaque mapper peut traiter un ensemble paires (clé, valeur) Ensemble des reducers potentiels (les capteurs récolteurs d énergie) Matrice des distances (nombre de sauts ou qualité des canaux) Coûts d activations des reducers 21

Différences avec «Facility location» Différences avec le problème original les mappers peuvent traiter plusieurs clés (les demandes des clients sont plutôt hétérogènes) Un reducer peut traiter plusieurs types de clé (un reducer, un fois activé, est associé à un ou plusieurs clés) Un capteur peut être reducer et/ou mapper Nature stochastique du problème (la variation des énergies récoltées selon le temps, la variation des qualités des canaux selon le temps) Le problème est au moins aussi difficile que «Facility location» 22

Travaux futurs Une modélisation plus précise du problème Proposition d algorithmes distribués pour la résolution du problème (ex. s inspirer des «facility location games») Proposition d algorithmes centralisés basé sur une approche «software defined networking» 23

Conclusion Les données massives présentent plusieurs défis pour les réseaux sans fil en général pour les réseaux de capteurs en particulier Les capteurs et le IoT constitueront la source majeure de données massives dans un futur proche Un traitement de données dans le réseau (In-network) est essentiel pour des solutions IoT viables 24