OPTIONS SSSR Réplication et cohérence de données 1
Options SSSR Mixtes "Recherche" et "Professionnel" Big Data Réplication de données Malware Systèmes dynamiques Systèmes communicant contraints Plutôt "Professionnel" Supervision Administration Système Avancée Bases de données répliquées (cf. LMFI) Réplication et cohérence de données 2
BIG DATA Jérôme François (jerome.francois@inria.fr) Radu State (radu.state@uni.lu) Réplication et cohérence de données 3
Big Data Big Data Volume + Variété + vélocité Exemple : 100 heures de vidéo mis en ligne sur youtube à chaque minute Comment traiter et analyser ces données? Besoin de nouvelles technologies Hardware Software ce que vous allez apprendre dans ce cours Un marché d'avenir +25% d'investissement par an 4.4 millions de nouveaux emplois créés en 2015 Priorité des gouvernements Réplication et cohérence de données 4
Contenu du cours (24h) Apprentissage des approches type «Big Data» Stockage Design Pattern / Map-Reduce Data analytics NoSQL Streaming / passage par message Expérience pratique avec du développement Hadoop, Pig, RHadoop Storm Spark Réplication et cohérence de données 5
RÉPLICATION ET COHÉRENCE DE DONNÉES (DATA REPLICATION AND CONSISTENCY) Claudia-Lavinia Ignat CR1 Inria ignatcla@loria.fr B-022 LORIA Réplication et cohérence de données 6
Pourquoi répliquer les données? Réplication de données: technique très utilisée dans les systèmes distribués Fiabilité Si une réplique n est pas disponible ou elle tombe en panne, il est possible d utiliser une autre Protection contre les données corrompus Performance Pas de surcharge pour un serveur (serveurs web répliqués) Latence de communication diminuée (web cache) Défi: comment maintenir la cohérence entre les données répliquées Si une copie est modifiée, les autres copies deviennent incohérentes Réplication et cohérence de données 7
La réplication est omniprésente Facebook >1.23 billions utilisateurs actifs Twitter ~300 million utilisateurs actifs 500 million tweets / jour 1.6 billion requêtes de recherche /jour Google Plus d 1 million serveurs (depuis janvier 2010) >3.5 billion requêtes de recherche / jour Réplication synchrone (Google Drive, Gmail, Google Sites, Calendar) Amazon >230 million comptes client Revenu de ~120,000$/minute Réplication et cohérence de données 8
Contenu du cours Réplication notions basiques Modèles de cohérence Protocoles de cohérence Réplication pessimiste vs. réplication optimiste Quelques approches réplication optimiste Transformées opérationnelles CRDT Type de données répliqué commutatif Réplication et cohérence de données 9
Organisation + Evaluation Cours (12h) en anglais (ou en français) en fonction de demandes dernières 3h pour des présentations de papiers de recherche (groupes de 2 étudiants) TD (12h) Exercices + 1 projet (groupes de 2 étudiants) Site web: http://www.loria.fr/~ignatcla/ Evaluation Présentation des papiers (20min présentation + 5min questions) Projet (Ex. synchronisation GoogleDrive + Dropbox) Examen - les documents ne sont pas permis Réplication et cohérence de données 10
MALWARE Guillaume Bonfante (guillaume.bonfante@loria.fr) Réplication et cohérence de données 11
Les malwares existent Réplication et cohérence de données 12
Un domaine émergeant Les coûts des attaques s élèvent à plusieurs milliards d euros, Peu de personnels formés à la défense Un métier d artisanat Réplication et cohérence de données 13
Contenu du cours A quoi ressemble un malware mécanismes de défense de code auto-modification et obfuscation Retro-ingénierie statique de code logiciel IDA-Pro scripts python pour IDA Retro-ingénierie dynamique de code logiciel PIN Extraction de charge 2 minutes de théorie des virus Réplication et cohérence de données 14
SYSTEMES DYNAMIQUES Sylvain Contassot-Vivier ( sylvain.contassot-vivier@univ-lorraine.fr) et Nazim Fatès Réplication et cohérence de données 15
Contenu du module Définitions Cadre discret et cadre continu Modes opératoires Parallèle, série, chaotique, à retards, asynchrone Voisinages et attraction locale Spécificités du cadre continu Applications en calcul scientifique Automates cellulaires (~3H CM et 3H TD) Classification, propriétés topologiques et dynamiques, analyse, modélisation,... Réplication et cohérence de données 16
SYSTEMES COMMUNICANTS CONTRAINTS Ye-Qiong Song (ye-qiong.song@loria.fr) Abdelkader Lahmadi (abdelkader.lahmadi@loria.fr) Réplication et cohérence de données 17
Internet of Things (IoT) The next big thing is small Low-power Motes (TI MSP430, STM32xx, ARM- based,...), BLE Arduino, Raspberry PI, Intel Quark SoC Motes with energy harvesting IoT is one of the hot research topics, IETF is working on IoT protocols IoE (Internet of Everything) is coming soon for connecting People, Process, Data, and Things Réplication et cohérence de données 18
Organisation du module Objectifs Introduire les protocoles de l IoT (MAC et routage) et focaliser sur l aspect «low power» et QoS des réseaux de capteurs sans fil Maitriser les techniques d analyse de performances des réseaux (ici essentiellement celle de la simulation) Contenu Protocoles MAC et routage «low power» pour les réseaux de capteurs (Application 6lowPAN RPL IEEE8015.4 MAC à cycle actif réduit, routage Zigbee, routage géographique et centré données) OS pour les réseaux de capteurs (e.g. ContikiOS) Méthodes de simulation pour évaluation de performances (java et JMT) Implémentation et mesure de performances sur plateformes Savoir-faire Concevoir des systèmes communicants sous contraintes d énergie et de performances Réplication et cohérence de données 19
SUPERVISION DE RESEAUX Emmanuel Nataf (emmanuel.nataf@loria.fr) Réplication et cohérence de données 20
Supervision de réseau Surveiller l'état d'un réseau & services QUOI? Accessibilité, traffic, QoS, erreurs, COMMENT? Protocoles des services / protocole de supervision Appli, scripts, SGDB, IHM... POURQUOI? Connaissance du profil de fonctionnement Définir les bons états et les états dangereux Réplication et cohérence de données 21
Outils Cacti Nagios RRDTools Ping Tcpdump notp,... Agents, MIB, Objets Réplication et cohérence de données 22
Organisation du module Cours TD et TP en salle machine Approche technique Concept projet Programmation (light) Installation configuration (open source) Evaluation Examen écrit Projet Réplication et cohérence de données 23
ADMINISTRATION SYSTÈME AVANCÉE Emile Morel (emile@bleuchtang.fr)! Susceptible de pouvoir ouvrir! Réplication et cohérence de données 24
Contenu du module Administration systèmes Linux Windows Techniques de virtualisation Isolation Hyperviseur Container (Docker) Réplication et cohérence de données 25