OPTIONS SSSR. Réplication et cohérence de données 1

Documents pareils
Panorama des solutions analytiques existantes

Les technologies du Big Data

Systèmes Répartis. Pr. Slimane Bah, ing. PhD. Ecole Mohammadia d Ingénieurs. G. Informatique. Semaine Slimane.bah@emi.ac.ma

La rencontre du Big Data et du Cloud

Big Data. Cyril Amsellem Consultant avant-vente. 16 juin Talend

Les enjeux du Big Data Innovation et opportunités de l'internet industriel. Datasio 2013

Les participants repartiront de cette formation en ayant une vision claire de la stratégie et de l éventuelle mise en œuvre d un Big Data.

#IOT. Internet #IGE36 #INTTIC.

Master (filière Réseau) Parcours Recherche: Systèmes Informatiques et Réseaux (RTS)

Big Graph Data Forum Teratec 2013

Protection des données personnelles : Vers un Web personnel sécurisé

HADOOP ET SON ÉCOSYSTÈME

Groupe de Discussion Big Data Aperçu des technologies et applications. Stéphane MOUTON

Offre formation Big Data Analytics

AVRIL Au delà de Hadoop. Panorama des solutions NoSQL

Monétisation des données : comment identifier de nouvelles sources de revenus au sein des Big data?

Architecture distribuée

Organisation du parcours M2 IR Les unités d enseignements (UE) affichées dans la partie tronc commun sont toutes obligatoires, ainsi que le stage et

Formation Cloudera Data Analyst Utiliser Pig, Hive et Impala avec Hadoop

ARCHITECTURE ET SYSTÈMES D'EXPLOITATIONS

L écosystème Hadoop Nicolas Thiébaud Tuesday, July 2, 13

NewPoint IT Consulting BIG DATA WHITE PAPER. NewPoint Information Technology Consulting

Catalogue des stages Ercom 2013

Licence Pro ASUR Supervision Mai 2013

Bases de données documentaires et distribuées Cours NFE04

Introduction à MapReduce/Hadoop et Spark

Big data et données géospatiales : Enjeux et défis pour la géomatique. Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique

Big Data Concepts et mise en oeuvre de Hadoop

BIG DATA et DONNéES SEO

Internet des objets 1

BIG DATA en Sciences et Industries de l Environnement

TAI049 Utiliser la virtualisation en assistance et en dépannage informatique TABLE DES MATIERES

Enjeux mathématiques et Statistiques du Big Data

Fouillez facilement dans votre système Big Data. Olivier TAVARD

20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars ans du SIAD -"Big Data par l'exemple" -Julien DULOUT

Les formations. Administrateur Systèmes et Réseaux. ENI Ecole Informatique

BIG Data et R: opportunités et perspectives

Métrologie des réseaux IP

TRAVAUX DE RECHERCHE DANS LE

FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis

Plateforme IoT flexible et configurable:

Du Datacenter au Cloud Quels challenges? Quelles solutions? Christophe Dubos Architecte Microsoft

Le Tunneling DNS. P.Bienaimé X.Delot P.Mazon K.Tagourti A.Yahi A.Zerrouki. Université de Rouen - M2SSI. 24 février 2011

Le BigData, aussi par et pour les PMEs

DESCRIPTIF DES PROJETS 3EME ANNEE QUI SERONT PRESENTES LORS DE LA JOURNEE DE PROJET DE FIN D ETUDE LE 26/01/2012

Systèmes de fichiers répartis

Hypervision et pilotage temps réel des réseaux IP/MPLS

Organiser vos données - Big Data. Patrick Millart Senior Sales Consultant

Référentiel ASUR Prévisionnel

Conception des systèmes répartis

Dr.Web Les Fonctionnalités

Pour un Bâtiment Ready2Services, le protocole est-il clé?

25/08/2013. Vue Nagios. Vue Nagios. Le réseau du lycée

BIG DATA. Veille technologique. Malek Hamouda Nina Lachia Léo Valette. Commanditaire : Thomas Milon. Encadré: Philippe Vismara

Ricco Rakotomalala R.R. Université Lyon 2

PRESENTATION RESSOURCES. Christian Dupaty BTS Systèmes Numériques Lycée Fourcade Gardanne Académie d Aix Marseille

Culture numérique Cloud computing

ECTS CM TD TP. 1er semestre (S3)

Hadoop, les clés du succès

NetCrunch 6. Superviser

Dispositif sur budget fédéral

Les Content Delivery Network (CDN)

Tungsten: une implémentation du futur clustering de PostgreSQL

GPC Computer Science

Informatisation du Système d Information

SÉRIE NOUVELLES ARCHITECTURES

Déploiement d une architecture Hadoop pour analyse de flux. françois-xavier.andreu@renater.fr

Fonctions. Solution professionnelle pour le stockage de données, la synchronisation multi- plateformes et la collaboration

Acquisition des données - Big Data. Dario VEGA Senior Sales Consultant

Virtualisation du poste de travail. Denis CASANOVA UFR Sciences & Technologies CUME - 29 Mars 2012

Anticiper et prédire les sinistres avec une approche Big Data

DOCKER MEETUP. Christophe Labouisse

LES ENJEUX DU BIG DATA

Les datas = le fuel du 21ième sicècle

Chapitre 4: Introduction au Cloud computing

Programme ASI Développeur

Technologies Web. Ludovic Denoyer Sylvain Lamprier Mohamed Amine Baazizi Gabriella Contardo Narcisse Nya. Université Pierre et Marie Curie

Travail d équipe et gestion des données L informatique en nuage

L Art d être Numérique. Thierry Pierre Directeur Business Development SAP France

Programmation parallèle et distribuée (Master 1 Info )

Virtual Private Network WAFA GHARBI (RT4) CYRINE MAATOUG (RT4) BOCHRA DARGHOUTH (RT4) SALAH KHEMIRI (RT4) MARWA CHAIEB (RT3) WIEM BADREDDINE (RT3)

CLOUD CP3S SOLUTION D INFRASTRUCTURE SOUMIS À LA LÉGISLATION FRANÇAISE. La virtualisation au service de l entreprise. Évolutivité. Puissance.

Présentation du Programme Régional de Formations Qualifiantes

Sommaire. 3. Les grands principes de GFS L architecture L accès de fichier en lecture L accès de fichier en écriture Bilan

Big Data? Big responsabilités! Paul-Olivier Gibert Digital Ethics

Big Data et Graphes : Quelques pistes de recherche

MapReduce. Malo Jaffré, Pablo Rauzy. 16 avril 2010 ENS. Malo Jaffré, Pablo Rauzy (ENS) MapReduce 16 avril / 15

BIG DATA APPLIQUÉES À LA SÉCURITÉ. Emmanuel MACÉ Akamai Technologies

De l Etudiant à SBA à l Enseignant Chercheur à l ENSMA

Cours 13. RAID et SAN. 2004, Marc-André Léger

Un concept multi-centre de données traditionnel basé sur le DNS

Drupal : Optimisation des performances

RETOUR D EXPÉRIENCE SUR L INTERNET DES OBJETS

BIG DATA : comment étendre et gérer la connaissance client? François Nguyen SFR Directeur SI décisionnel & Mkt relationnel GP

PostgreSQL. Formations. Calendrier... 14

Communications performantes par passage de message entre machines virtuelles co-hébergées

Utilisation de matériels industriels avec des outils de virtualisation open source. Open Source dans le monde industriel

Cartographie des solutions BigData

Transcription:

OPTIONS SSSR Réplication et cohérence de données 1

Options SSSR Mixtes "Recherche" et "Professionnel" Big Data Réplication de données Malware Systèmes dynamiques Systèmes communicant contraints Plutôt "Professionnel" Supervision Administration Système Avancée Bases de données répliquées (cf. LMFI) Réplication et cohérence de données 2

BIG DATA Jérôme François (jerome.francois@inria.fr) Radu State (radu.state@uni.lu) Réplication et cohérence de données 3

Big Data Big Data Volume + Variété + vélocité Exemple : 100 heures de vidéo mis en ligne sur youtube à chaque minute Comment traiter et analyser ces données? Besoin de nouvelles technologies Hardware Software ce que vous allez apprendre dans ce cours Un marché d'avenir +25% d'investissement par an 4.4 millions de nouveaux emplois créés en 2015 Priorité des gouvernements Réplication et cohérence de données 4

Contenu du cours (24h) Apprentissage des approches type «Big Data» Stockage Design Pattern / Map-Reduce Data analytics NoSQL Streaming / passage par message Expérience pratique avec du développement Hadoop, Pig, RHadoop Storm Spark Réplication et cohérence de données 5

RÉPLICATION ET COHÉRENCE DE DONNÉES (DATA REPLICATION AND CONSISTENCY) Claudia-Lavinia Ignat CR1 Inria ignatcla@loria.fr B-022 LORIA Réplication et cohérence de données 6

Pourquoi répliquer les données? Réplication de données: technique très utilisée dans les systèmes distribués Fiabilité Si une réplique n est pas disponible ou elle tombe en panne, il est possible d utiliser une autre Protection contre les données corrompus Performance Pas de surcharge pour un serveur (serveurs web répliqués) Latence de communication diminuée (web cache) Défi: comment maintenir la cohérence entre les données répliquées Si une copie est modifiée, les autres copies deviennent incohérentes Réplication et cohérence de données 7

La réplication est omniprésente Facebook >1.23 billions utilisateurs actifs Twitter ~300 million utilisateurs actifs 500 million tweets / jour 1.6 billion requêtes de recherche /jour Google Plus d 1 million serveurs (depuis janvier 2010) >3.5 billion requêtes de recherche / jour Réplication synchrone (Google Drive, Gmail, Google Sites, Calendar) Amazon >230 million comptes client Revenu de ~120,000$/minute Réplication et cohérence de données 8

Contenu du cours Réplication notions basiques Modèles de cohérence Protocoles de cohérence Réplication pessimiste vs. réplication optimiste Quelques approches réplication optimiste Transformées opérationnelles CRDT Type de données répliqué commutatif Réplication et cohérence de données 9

Organisation + Evaluation Cours (12h) en anglais (ou en français) en fonction de demandes dernières 3h pour des présentations de papiers de recherche (groupes de 2 étudiants) TD (12h) Exercices + 1 projet (groupes de 2 étudiants) Site web: http://www.loria.fr/~ignatcla/ Evaluation Présentation des papiers (20min présentation + 5min questions) Projet (Ex. synchronisation GoogleDrive + Dropbox) Examen - les documents ne sont pas permis Réplication et cohérence de données 10

MALWARE Guillaume Bonfante (guillaume.bonfante@loria.fr) Réplication et cohérence de données 11

Les malwares existent Réplication et cohérence de données 12

Un domaine émergeant Les coûts des attaques s élèvent à plusieurs milliards d euros, Peu de personnels formés à la défense Un métier d artisanat Réplication et cohérence de données 13

Contenu du cours A quoi ressemble un malware mécanismes de défense de code auto-modification et obfuscation Retro-ingénierie statique de code logiciel IDA-Pro scripts python pour IDA Retro-ingénierie dynamique de code logiciel PIN Extraction de charge 2 minutes de théorie des virus Réplication et cohérence de données 14

SYSTEMES DYNAMIQUES Sylvain Contassot-Vivier ( sylvain.contassot-vivier@univ-lorraine.fr) et Nazim Fatès Réplication et cohérence de données 15

Contenu du module Définitions Cadre discret et cadre continu Modes opératoires Parallèle, série, chaotique, à retards, asynchrone Voisinages et attraction locale Spécificités du cadre continu Applications en calcul scientifique Automates cellulaires (~3H CM et 3H TD) Classification, propriétés topologiques et dynamiques, analyse, modélisation,... Réplication et cohérence de données 16

SYSTEMES COMMUNICANTS CONTRAINTS Ye-Qiong Song (ye-qiong.song@loria.fr) Abdelkader Lahmadi (abdelkader.lahmadi@loria.fr) Réplication et cohérence de données 17

Internet of Things (IoT) The next big thing is small Low-power Motes (TI MSP430, STM32xx, ARM- based,...), BLE Arduino, Raspberry PI, Intel Quark SoC Motes with energy harvesting IoT is one of the hot research topics, IETF is working on IoT protocols IoE (Internet of Everything) is coming soon for connecting People, Process, Data, and Things Réplication et cohérence de données 18

Organisation du module Objectifs Introduire les protocoles de l IoT (MAC et routage) et focaliser sur l aspect «low power» et QoS des réseaux de capteurs sans fil Maitriser les techniques d analyse de performances des réseaux (ici essentiellement celle de la simulation) Contenu Protocoles MAC et routage «low power» pour les réseaux de capteurs (Application 6lowPAN RPL IEEE8015.4 MAC à cycle actif réduit, routage Zigbee, routage géographique et centré données) OS pour les réseaux de capteurs (e.g. ContikiOS) Méthodes de simulation pour évaluation de performances (java et JMT) Implémentation et mesure de performances sur plateformes Savoir-faire Concevoir des systèmes communicants sous contraintes d énergie et de performances Réplication et cohérence de données 19

SUPERVISION DE RESEAUX Emmanuel Nataf (emmanuel.nataf@loria.fr) Réplication et cohérence de données 20

Supervision de réseau Surveiller l'état d'un réseau & services QUOI? Accessibilité, traffic, QoS, erreurs, COMMENT? Protocoles des services / protocole de supervision Appli, scripts, SGDB, IHM... POURQUOI? Connaissance du profil de fonctionnement Définir les bons états et les états dangereux Réplication et cohérence de données 21

Outils Cacti Nagios RRDTools Ping Tcpdump notp,... Agents, MIB, Objets Réplication et cohérence de données 22

Organisation du module Cours TD et TP en salle machine Approche technique Concept projet Programmation (light) Installation configuration (open source) Evaluation Examen écrit Projet Réplication et cohérence de données 23

ADMINISTRATION SYSTÈME AVANCÉE Emile Morel (emile@bleuchtang.fr)! Susceptible de pouvoir ouvrir! Réplication et cohérence de données 24

Contenu du module Administration systèmes Linux Windows Techniques de virtualisation Isolation Hyperviseur Container (Docker) Réplication et cohérence de données 25