Oct. 2015 Julien MALAURENT malaurent@essec.edu
2
X 11! 3
4
5
Volume Vitesse Variété 6
Difficile de s accorder sur une définition unique : on parle tantôt de technologies de traitement, tantôtde modèle économique, oude mode d organisationspécifique de l entreprise D un point de vue technologique le Big Data : c est l apparition de technologies innovantes capables de traiter en un temps limité de grands volumes de données afin de valoriser l information non exploitée de l entreprise. On parle de «démarche Big Data» pour signifier l importance prise par les données dans l univers de l entreprise. Celles-ci deviennent un mode de décision, un actif stratégique pour se différencier de la concurrence. 7
Multiplication exponentiellede données issues d objets interconnectés, de type capteurs, puces mobiles via RFID, et Internet des Objets. Apparition de données non-structurées oubien multistructurées (Vidéos, textes, etc.) L émergence du Cloud Apparition de nouvelles bases de données, adaptées aux données non structurées (Hadoop), ainsi qu à la miseau point de modes de calcul à haute performance (MapReduce) 8
le Big Data sous-entend un renversement total de paradigme dans le mode d organisationde l entreprise, celle- ci devenant «data-centric», c est-àdire guidée par les données. La donnée joue le rôle de matière première, les technologies jouent celles d outils de production, et le résultat est un changement de paradigme dans la manière d organiser les entreprises et de générer de la valeur dans tous les domaines de l économie. La démarche Big Data est forcément transverse donc elle implique de casser les cloisons entre services, ce qui n est pas toujours évident. En terme SI, cela signifie qu il faut aller récupérer les données dans tous les recoins, ce qui a de grandes implications au niveau de l urbanisationdu système d information. 9
10
La révolution ne vient de la collecte des données, mais de leur utilisation en vue d algorithme de prédiction. Domaines d applications concernés (liste non exhaustive): Risques sanitaires/alimentaires Sécurité Santé Météorologie Finance de marché/economie Gestiondes axes routiers/aériens Etc. 11
L Open Data est un mouvement amorcé au milieu des années 2000 visant à transmettre au grand public les données numériques détenues par les administrations publiques, dans un but de transparence et d efficacité de l action publique. Démo: DataParis 12
Projet Magnolia visant à optimiser les mouvements de voyageurs en gares. Le défi : mieux comprendre les flux des deux milliards de passagers transitant chaque année en gare et établissant des connexions avec d'autres moyens de transports (bus, autocars, taxis, vélos en libreservice...). Ce projet permet de tabler sur une réduction notable des niveaux d'incertitude dans les choix opérés en matière de développement, d'aménagement oude tarification, tant au niveaumarketing et commercial qu'au niveaudes opérations en gares Georges Colin, architecte au sein de la direction déléguée SI Gares de la DSI Voyageurs. Objectif : mise en place d un environnement qui puisse accueillir des données de tout type : log Wi-fi, d'apps mobiles, contenus des tableaux de départs et d'arrivées, flux vidéo, mais aussi informations commerciales, financières du groupe, données externes, météo, etc. 13
1. Tout savoir sur notre voiture (machine-machine) Tableau de bord ultra- connecté Ex1 : vous avertir qu il faut prendre la prochaine sortie pour faire le plein, parce qu il n y aura plus de stations avantde nombreux kilomètres. Ex2: applications prédictives en matière d entretien du véhicule pour remplacer les pièces par anticipation, plutôt que de devoir être mis devantle fait accompli. 2. Bénéficier d une assistance permanente lors de notre conduite (humainmachine) Une réalité augmentée basé sur des capteurs installés sur le véhicule, et à une connexion permanente à Internet ou aux systèmes de type GPS. Ex1. Pare-brise qui nous indique la route (à la manière d un casque de réalité virtuelle) Ex2: interfaces haptiques (le volantvibrant à gauche ou à droite selon que notre attention doive y être portée). Road Frustration Index: http://senseable.mit.edu/rfi/ 14
3. Pour rester en contact avec nos proches (humain-humain) Utilisationdes capteurs, couplés à uneconnexion permanente, permet l accès à des applications directes et évidentes de type réseaux sociaux, et géolocalisation en temps réel pour communiquer et avertir ses proches. 4. Pour améliorernotreconduite (plan intermédiaire) Mieux comprendre nos habitudes de conduite : Est-ceque certainstrajets, à certaines heures, nous font consommer plus que d autres? Prenons-nous certains risques de conduite que nous pourrions éviter? 5. Pour améliorer nos véhicules (arrière-plan) Mieux comprendre la manière dont les conducteurs utilisent leurs véhicules permettrait aux constructeurs de les perfectionner, de concevoir de nouveaux services ou fonctionnalités, et donc d améliorer les voitures existantes. 15
Les 3V Un changement de paradigme dans le processus de prise de décision: DataCentric Des opportunités analytiques sans précédents, permettant de comprendre et prévoir les comportements organisationnels et individuels Risques liés à l hyper-connectivité, à l hyper-dépendance technologique, et à l utilisation des données Un secteur des transports en pleine mutation, oule service à la personne est profondément enrichi. 16