Big Data Analytics for connected home



Documents pareils
BIG DATA : une vraie révolution industrielle (1) Les fortes évolutions liées à la digitalisation

Impacts de la numérisation. 20 ans INRIA Grenoble 20 Novembre 2012

Stratégie DataCenters Société Générale Enjeux, objectifs et rôle d un partenaire comme Data4

INSTRUMENTS DE MESURE SOFTWARE. Management software for remote and/or local monitoring networks

Singapore Schools Green Mark Scheme on Indoor Air Quality

Editing and managing Systems engineering processes at Snecma

Renewable Energy For a Better World. Transforming Haïti s energy challenges into wealth and job creating opportunities ENERSA

Language requirement: Bilingual non-mandatory - Level 222/222. Chosen candidate will be required to undertake second language training.

TRAVAUX DE RECHERCHE DANS LE

Institut français des sciences et technologies des transports, de l aménagement

INSTITUT MARITIME DE PREVENTION. For improvement in health and security at work. Created in 1992 Under the aegis of State and the ENIM

Empowering small farmers and their organizations through economic intelligence

Big Data en (Ré)Assurance

ERA-Net Call Smart Cities. CREM, Martigny, 4 décembre 2014 Andreas Eckmanns, Responsable de la recherche, Office Fédéral de l énergie OFEN

Fonctions intégrées. Nouvelles solutions universelles & système de communication

NIMBUS TRAINING. Administration de Citrix NetScaler 10. Déscription : Objectifs. Publics. Durée. Pré-requis. Programme de cette formation

Eléments de statistique

Nouveautés printemps 2013

Revision of hen1317-5: Technical improvements

SERVEUR DÉDIÉ DOCUMENTATION

hurence Big Data get its magical power CEO & CTO

We Generate. You Lead.

Projet Lyon Smart Community Community Management System

Lean approach on production lines Oct 9, 2014

Les Grandes Tendances d Investissement Informatique en 2011/ Rachel Hunt

AVOB sélectionné par Ovum

Partner Business School

Master4Light. Caractérisation Optique et Electrique des Sources Lumineuses. Equipement 2-en-1 : source de courant et spectrophotomètre

Table ronde gestion de l énergie : réseaux, stockages, consommations

Big Data: comment passer de la stratégie à la mise en œuvre? Big Data Paris Mars 2015

Face Recognition Performance: Man vs. Machine

DocForum 18 Juin Réussites d un projet Big Data Les incontournables

Smart Energy ELVIRE LEBLANC. SMART ENERGY Key drivers & LIST Strategy. Elvire.Leblanc@cea.fr

THÈSE. présentée à TÉLÉCOM PARISTECH. pour obtenir le grade de. DOCTEUR de TÉLÉCOM PARISTECH. Mention Informatique et Réseaux. par.

Le projet WIKIWATER The WIKIWATER project

Product Overview Présentation produits

Fabricant. 2 terminals

Networking Solutions. Worldwide VSAT Maintenance VSAT dans le Monde Entretien. Satellite Communications Les Communications par Satellite

Gouvernance européenne sur les technologies énergétiques

Post-processing of multimodel hydrological forecasts for the Baskatong catchment


Monitoring elderly People by Means of Cameras

PIB : Définition : mesure de l activité économique réalisée à l échelle d une nation sur une période donnée.

Présentation par François Keller Fondateur et président de l Institut suisse de brainworking et M. Enga Luye, CEO Belair Biotech

Big Data -Comment exploiter les données et les transformer en prise de décisions?

IBM Software «CAMS² & Business Partners»

Distributed Energy Systems Approaches for systems optimisation and Tools Pierre PICARD EFFICACITY Project Manager ENGIE R&D

REVITALIZING THE RAILWAYS IN AFRICA

Bigdata et Web sémantique. les données + l intelligence= la solution

Retour d expérience. Le rôle du Business Analyst chez Orange. Nadia Magarino & Christophe Dufour 29 avril 2015

Package Contents. System Requirements. Before You Begin

ANGULAR JS AVEC GDE GOOGLE

Visualisation et Analyse de Risque Dynamique pour la Cyber-Défense

GIGABIT PCI DESKTOP ADAPTER DGE-530T. Quick Installation Guide+ Guide d installation+

Le traitement du Big Data inclue la collecte, la curation, le stockage, l enrichissement, le croisement, la partage, l analyse et la visualisation.

Secure Power ds la Santé. Samia HABEL ITB Country Leader

Quatre axes au service de la performance et des mutations Four lines serve the performance and changes

Forthcoming Database

NOM ENTREPRISE. Document : Plan Qualité Spécifique du Projet / Project Specific Quality Plan

IODE Consulting I Intelligence on Demand Slide 1

Deadline(s): Assignment: in week 8 of block C Exam: in week 7 (oral exam) and in the exam week (written exam) of block D

APX et VCE, Modèle d industrialisation de l intégration et du déploiement. Olivier BERNARD, VCE

BREEAM. Building Research Establishment s Environmental Assessment Method

Sustainability Monitoring and Reporting: Tracking Your Community s Sustainability Performance

QlikView et Google Big Query : Une réponse simple, rapide et peu coûteuse aux analyses Big Data

Bitdefender GravityZone

Catherine Chochoy. Alain Maneville. I/T Specialist, IBM Information Management on System z, Software Group

3 minutes. relation client. avec Orange Consulting. pour tout savoir sur la. construisez et pilotez votre relation client

L impact des délais de paiement et des solutions appropriées. Dominique Geenens Intrum Justitia

Optimiser votre reporting sans déployer BW

Gouvernance et nouvelles règles d organisation

Comprendre l impact de l utilisation des réseaux sociaux en entreprise SYNTHESE DES RESULTATS : EUROPE ET FRANCE

Monitor LRD. Table des matières

La Performance Digitale en Business to Business

Les marchés Security La méthode The markets The approach

Le décisionnel plus que jamais au sommet de l agenda des DSI

Archived Content. Contenu archivé

SCC / QUANTUM Kickoff 2015 Data Protection Best Practices

L ESPACE À TRAVERS LE REGARD DES FEMMES. European Economic and Social Committee Comité économique et social européen

First Preheat Workshop Premier Atelier Preheat. 4 Juillet 2006 LYON. 10 h 17 h. Date SERVICE OU DEPARTEMENT PAGE 1

Accélérer l agilité de votre site de e-commerce. Cas client

Toni Lazazzera Tmanco is expert partner from Anatole ( and distributes the solution AnatoleTEM

WEB page builder and server for SCADA applications usable from a WEB navigator

SAN07 IBM Social Media Analytics:

Notice Technique / Technical Manual

Monitoring des classes de neige des calottes polaires par Envisat

La gestion des risques IT et l audit

SAP Runs SAP Reporting Opérationnel & BI avec HANA et SAP Analytics. Pierre Combe, Enterprise Analytics Juin, 2015

Monitoring continu et gestion optimale des performances énergétiques des bâtiments

Comment valoriser votre patrimoine de données?

POSITION DESCRIPTION DESCRIPTION DE TRAVAIL

SparkInData. Place de Marché des applications Spatiales

D Expert en Finance et Investissements

sur le réseau de distribution

SMALL CITY COMMERCE (EL PEQUEÑO COMERCIO DE LAS PEQUEÑAS CIUDADES)

Mon Service Public - Case study and Mapping to SAML/Liberty specifications. Gaël Gourmelen - France Telecom 23/04/2007

Offre formation Big Data Analytics

LADIES IN MOBILITY. LIVE TWEET Innovative City

EU- Luxemburg- WHO Universal Health Coverage Partnership:

Transcription:

Data Science Consulting Héloïse Nonne Senior Data Scientist - Manager May 22, 2015 Big Data Analytics for connected home

Data analytics for disconnected homes Very low frequency resolution for local (household) measurements (< trimestrial) Only aggregated data (sum of individual loads) for higher frequency measurements (region, neighborhood) Data storage issues Computation power Limited knowledge at local level Limited predictive power Complex sophisticated models exist but are difficult to tune ARIMA models (AutoRegressive Integrated Moving Average) 2

Reducing electricity costs: a complete data ecosystem Regional / national scale Sun Wind Cloud cover Humidity Temperature Local / neighborhood scale Electricity demand???? Anthropologic data comfort temperature children at school activity of occupants Weekday /holiday Hour of day Anthropologic data Energy production Energy price Weather Appliances and use Heating Electricity storage Renewable energy Shutter orientation Elevators Doors / lights Network activity -> current occupation Anthropologic data Building structure (thermal mass) Historical data Actual measurement (real-time) Forecast Energy consumption patterns 3

Multiple sources of data for multiple models Volume vast amounts of data too large to store and analyse using traditional technology Velocity speed at which new data is generated speed at which data change Variety types of data (number, text, images, video) types of sources (real-time, static) Veracity accuracy of data (frequency, errors) quality of data (sampling errors, typos) 4

Data analytics on energy load + + Moving average and thresholds Outlier detection Anomaly detection Load prediction ARIMA Neural networks Recurrent neural networks Clustering: K-means, DBScan Self-organizing maps Identification of consumption patterns Statistics for reporting on dashboards Recommendations to reschedule appliances Storage of energy (photovoltaic, geothermic, etc.) 6

Many usecases Business Society Scoring and customer segmentation Predict the demand in energy Predictive maintenance (elevators, HVAC, photovoltaic,..) Cost reduction Detect precarity (underheating) Detect people in distress (illnesses, elderly, heat wave, ) Improved safety (fire detection, security, ) Research / knowledge Sustainability Building optimization (thermal mass, isolation, configuration, windows orientation) Consumption patterns Social behaviors Optimize use and storage of energy (light management, applicances use, demand reduction, ) Improve comfort in neighborhood Reduce waste (energy, water, appliances) But remain pragmatic and think about the whole picture -> predictive maintenance on light bulbs??! 7

Predictive maintenance Cost reduction and improvement of reliability through predictive maintenance Elevator maintenance predict failure before breakage Data Shaft speed Vibrations (X, Y, Z) Sound measurements Rail vibrations Motor temperature Oil buffer Wear, failure Bearing fault Door: Shoe deformation Unbalance Misalignment Resonance 8

A predictive maintenance management system Requirements Continuous adaptation of diagnostic Build, increase and maintain knowledge Handle large quantity of data Handle uncertainty in diagnostic Assess fault severity Challenges Symptoms are a mix of different causes Information is unclear Limited frequency resolution Missing data Noise Data center Remote management system Richer knowledge multiple sources 9

Bayesian networks Compact representation of entities states or events as random variables Contains knowledge about how states /events are BF DF related Bearing fault Door deformation WU Weight unbalance RN Resonance MA Misalignment AYX Vibration freq peak on axis A at Y X TP Temperature > x C SP Shaft speed freq peaks SdB Sound > x db Bayesian network Qualitative = dependence relations Quantitative = the strengths of the relations DF SP TP BF Y1X SdB WU Y2X Mix a priori knowledge with experimental (real-time) data Explanatory (human understanding of phenomena vs black-box MA Z1X models) Uncertainty management (assessment of probability of failure) Possibility to learn Parameters Structures (events, entities, causes and effects) Z2X X1X RN X2X Advantages Decision rules for action Absolute need of prior knowledge from professionals 10

The big (data) picture Many sources of data: weather, energy production, economic, social, behavioral data, appliances characteristics, current building occupation, activity, etc. Different scales: worldwide, regional, local, individual Different times: historical data, year, month, day, hour, real-time The system is not going to be perfect at once -> design it constant improvement A single model is useless: each model has its use and models feed each other with their knowledge and prediction Choose the right model and the right technology: according to usecase, time cost, energy cost, pragmatism, realism Build models with the professionals who know the problem -> build on existing knowledge An efficient system implies close collaboration business, researchers, manufacturers, maintainers, owners, users, developpers, data scientists, data managers, optimization specialists, and end-users 12

Quantmetry Spécialiste de la Data science un cabinet de conseil «pure player» du Big Data et de la Data science dont le développement commercial a démarré en 2013 des méthodes statistiques avancées, le machine learning et les technologies Big data 2014: 1,5 millions d euros de chiffres d affaire avec une forte ambition de croissance, en France et à l étranger Une vingtaine de data scientists / consultants Quantmetry accompagne ses clients sur l ensemble des strates de la pyramide des données et participe ainsi à leur transformation digitale par le quantitatif pour des résultats concrets sur leur performance business. Agir Prédire Analyser Stocker Collecter Automatiser la décision et l action Prévoir ce qui peut advenir grâce aux tendances du passé Analyser pour mieux comprendre signaux forts et faibles Tout stocker! De plus en plus de data disponibles 13

Activités de Quantmetry Conseil Accompagnement Réalisation Optimisation Business par la Data Conduite de projet Projets pilotes Détection et priorisation d opportunités par la data Construction de schéma d architecture IT Cadrage, projet d industrialisation Méthodologie (modèles statistiques et algorithmes) Technologies Big Data Proof of concept de Data science Pilotes technologiques Structuration d un Data Lab Conduite du changement Industrialisation Retours d expérience et bonnes pratiques Schéma d organisation et de gouvernance Choix d une architecture technologique Montée en compétences Recrutement Gouvernance Industrialisation de pilotes (API, ) Création d une architecture Big Data et mise en place de flux de données 14

Veillle technologique et expérimentations Création et développement de produits spécifiques autour des technologies Big Data Recherche et développement en Data science Des thèmes d investigation : Online learning Deep learning et réseaux de neurones Industrialisation Analyse sémantique Energie (analyse de séries temporelles) Smart cities Amélioration de l expérience utilisateur Acteur de l écosystème Big Data : participation à des séminaires, conférences internationales, hackathons, compétitions Kaggle, partenariats éditeurs Collaborations avec des laboratoires de recherche et des écoles. 15

Quelques Références en Data science Lift = 6 Lift = 2 Feature engineeri Données ng non structurée s Gradient Boosting Baseline (régression logistique) Amélioration du lift pour la conquête en banque des clients assurés Détection de churn pour un opérateur télécom Optimisation d un outil de pricing pour un acteur de la distribution B2B Modèles prédictifs de consommation d énergie Durée session Nb pages vues Groupe Age URL page résilitation 0 20 40 Mise en place d un Data Lab pour un assureur Analyse de comportements pour une mutuelle 16

Excellence Altruisme Résultats et Big Data www.quantmetry.com Visitez notre blog quantmetry-blog.com