Les données de l'administration traitées par les outils Big Data (dans le cadre de la recherche) 20 mars 2012

Documents pareils
Recommandations sur le Cloud computing

DU RÉSEAU AU BIG DATA UNE OFFRE GLOBALE DE GESTION DE LA DONNÉE. Bruno Fleisch - Responsable Produits Tarik Hakkou Responsable du pôle «Data»

#BigData Dossier de presse Mai 2014

Big Data? Big responsabilités! Paul-Olivier Gibert Digital Ethics

Big Graph Data Forum Teratec 2013

SÉRIE NOUVELLES ARCHITECTURES

Les datas = le fuel du 21ième sicècle

LA DIVULGATION INTELLIGENTE DES DONNEES A L'HEURE DES BIG DATA

Introduction Que s est-il passé en 2014? Qu attendre de 2015?

Big Data. Concept et perspectives : la réalité derrière le "buzz"

Masses de données. 1. Introduction 2. Problématiques 3. Socle de formation (non présenté) 4. Liens avec Formation INSA

BI SWISS FORUM (ecom / SITB)

Mégadonnées (Big data) et Complexité Session introductive

Comment valoriser votre patrimoine de données?

Entreprise et Big Data

Que faire des data? 04/06/2015

Introduction Big Data

Entrez dans l ère du Numérique Très Haut Débit

Webinar EBG Nouvelles perspectives d'exploitation des données clients avec le big data

Big Data -Comment exploiter les données et les transformer en prise de décisions?

Big Data : Quel usage au sein des projetsinternet?

Big data et données géospatiales : Enjeux et défis pour la géomatique. Thierry Badard, PhD, ing. jr Centre de Recherche en Géomatique

Les nouveaux défis pour les régulateurs et les opérateurs télécoms. M. Ahmed Khaouja, Ing.

Big Data et le droit :

Les participants repartiront de cette formation en ayant une vision claire de la stratégie et de l éventuelle mise en œuvre d un Big Data.

Les ressources numériques

BIG DATA et DONNéES SEO

e need L un des premiers intégrateurs opérateurs Cloud Computing indépendants en France

PROFILAGE : UN DEFI POUR LA PROTECTION DES DONNEES PERSONNELLES Me Alain GROSJEAN Bonn & Schmitt

Mesures DNS à l ère du Big Data : outils et défis. JCSA, 9 juillet 2015 Vincent Levigneron, Afnic

Les Rencontres TIC de La Mêlée Numérique. Big Data & Cloud Computing : les nouveaux enjeux

5 novembre Cloud, Big Data et sécurité Conseils et solutions

Big Data: développement, rôle des ARS?? Laurent Tréluyer, ARS Ile de France Alain Livartowski Institut Curie Paris 01/12/2014

Hébergement MMI SEMESTRE 4

Le nuage va-t-il s'arrêter à la frontière? Pierre Beyssac Twitter: pbeyssac

Le BigData, aussi par et pour les PMEs

FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis

Les ressources humaines

Edmond Cissé. URÆUS Consult Ingénierie & Sécurité des Données edcisse@uraeus-consult.com

CLOUD CP3S SOLUTION D INFRASTRUCTURE SOUMIS À LA LÉGISLATION FRANÇAISE. La virtualisation au service de l entreprise. Évolutivité. Puissance.

Big Data & objets connectés

MEYER & Partenaires Conseils en Propriété Industrielle

accompagner la transformation digitale grâce au Big & Fast Data Orange Business Services Confidentiel 02/10/2014

I N S T I T U T QUELLES CONTRIBUTIONS AU SMART METERING? AFTERWORK ENERGY

Le contrat Cloud : plus simple et plus dangereux

Constituer des profils d'experts scientifiques, de centres de recherche et d entreprises innovantes

Virtualisation et mutualisation Le cloud computing, un enjeu structurant et stratégique pour le secteur public. Paris, 4 mai 2011

DocForum 18 Juin Réussites d un projet Big Data Les incontournables

Big Data. Les problématiques liées au stockage des données et aux capacités de calcul

En partenariat avec N AVRIL 2014

Mesurer, collecter et monitorer pour agir

Traitement des Données Personnelles 2012

Wi-Fi Guest dans le Cloud

Big- Data: Les défis éthiques et juridiques. Copyright 2015 Digital&Ethics

HADOOP ET SON ÉCOSYSTÈME

Objets connectés, avez-vous donc une âme?

20 ans du Master SIAD de Toulouse - BigData par l exemple - Julien DULOUT - 22 mars ans du SIAD -"Big Data par l'exemple" -Julien DULOUT

ANALYSE SPÉCIFIQUE LES CASINOS

LES DONNÉES : VOTRE AVANTAGE CONCURRENTIEL

LES NOUVEAUX FACTEURS DE COMPÉTITIVITÉ BASÉS SUR LA 3 ÈME PLATEFORME INFORMATIQUE. Sébastien LAMOUR IDC Research & Consulting Manager

Optimiser la maintenance des applications informatiques nouvelles technologies. Les 11 facteurs clés de succès qui génèrent des économies

Territoires géographiques/numériques

bservatoire bservatoire Méthodologie du Baromètre prospectif Les nouvelles technologies au service de l'assurance

Surmonter les 5 défis opérationnels du Big Data

Sécurité du cloud computing

e-biogenouest CNRS UMR 6074 IRISA-INRIA / Plateforme de Bioinformatique GenOuest yvan.le_bras@irisa.fr Programme fédérateur Biogenouest co-financé

Épargne et investissement. L épargne...

Jean-François Boulicaut & Mohand-Saïd Hacid

MODULE 2 : VEILLE & ANALYSE DE DONNÉES

Anticiper et prédire les sinistres avec une approche Big Data

L humain et ses données, le «quantified self»

La sécurité des données hébergées dans le Cloud

BIGDATA AN 3 : UNE NOUVELLE ERE DE B.I.

Conception des systèmes répartis

Marketing orienté Web

Mes logiciels d'entreprise dans le Cloud. Didier Gabioud

Big Data : se préparer au Big Bang

Surabondance d information

Stratégie et Vision de SAP pour le secteur Banque- Assurance: Data-Management, BI, Mobilité

À PROPOS DE TALEND...

Acquisition des données - Big Data. Dario VEGA Senior Sales Consultant

AoIP - DES SOLUTIONS MODERNES

Table des matières. Préface Mathieu JEANDRON

Les Ressources Humaines à l heure du Big Data : progrès, perspectives et limites CORNERSTONE WHITEPAPER

de la DSI aujourd hui

Face aux nouvelles menaces liées aux cyber attaques et l évolution des technologies, comment adapter son SMSI? CLUB27001 PARIS 22 novembre 2012

IBM Tivoli Compliance Insight Manager

Archivage électronique et valeur probatoire

Document d Interconnexion - Raccordement via IP Version applicable à compter du 1 er janvier 2015

Cloud computing Votre informatique à la demande

La renaissance de l industrie

TELUS Solutions d affaires

Règles du concours de startups PulseContest

La géomatique en Nouvelle-Calédonie usages professionnels et potentiels économiques

Labs Hadoop Février 2013

Architecte de Services Informatiques

La plateforme Cloud Supply Chain. Présentation de GT Nexus

Transcription:

Les données de l'administration traitées par les outils Big Data (dans le cadre de la recherche) 20 mars 2012

Enjeux du bigdata Le Bigdata fait référence aux très gros volumes de données non structurées ou semi-structurées produites par le secteur privé ou le secteur public. Ces très gros volumes de données sont aujourd hui peu exploitées ou au moins sous-exploités Les technologies informatiques et de communication capables de les traiter/analyser en quasi-temps réel émergent aujourd hui Les enjeux financiers sont immenses (plusieurs centaines de milliards d euros) : C est le cas dans le secteur privé (marketing, commerce ) Mais pas uniquement : le secteur public est aussi très largement concerné

Secteurs publics prometteurs Dans le secteur de la sécurité : faire un suivi de la criminalité (alertes, vagues..) Dans le secteur de l alimentation : améliorer le suivi et la traçabilité des aliments Dans le secteur de la santé : suivi des données épidémiologiques Dans le secteur des transports : les données de circulation pour une meilleure régulation du trafic Dans le secteur de l énergie : la récupération et l analyse des données de compteurs électriques en temps réel (meilleure anticipation)

Secteurs prometteurs Un meilleur suivi des prix : exploitation des données de caisses et des données des ventes en ligne : Analyse des marchés et la consommation production d'indices des prix Suivi des imports/exports Données non structurées/ textuelle issues des réseaux sociaux : Etude de marché (tendances, opinions sur les produits ) / Marketing Mais limite de l analyse textuelle / émergence du web sémantique

D autres sources de données : Les données administratives et statistiques Ce sont d importants volumes de données semistructurées, fiables, vérifiées (qualité). Les données sont relatives à toutes les catégories d agents du monde économique et social : individus, des ménages, ou des entreprises et couvrent des informations aussi diverses que les revenus, emplois le patrimoine, la santé, les données à caractère social et démographiques, la localisation géographique

La sécurité de l exploitation des données Les gros volumes de données concernent souvent des informations à caractère personnel enjeu : Disposer d un dispositif hautement sécurisé pour Faire des analyses pointues sans lever l'anonymat Offrir toutes les garantie en matière de confidentialité Offrir toutes les garanties de sécurité : Non dissémination des données Authentification des personnes analysant ces données Avoir une traçabilité des données la loi de 1978 instaurant la CNIL encadre les traitements sur les données à caractère personnelles : «on ne peut pas faire n importe quoi avec ces données»

L outil développé par le GENES pour la recherche Le CASD : un équipement hautement sécurisé pour l'exploitation de données individuelles très détaillées garantissant : La non dissémination des données Une authentification forte Le CASD a été labélisé «équipement d excellence» par un jury international Le CASD permet aujourd hui : D analyser des volumes importants de données administratives et statistiques (fichiers plats) De fournir aux chercheurs des outils d analyse pour ces données : Le langage R pour faire des modèles prédictifs à partir de ces données Les logiciels d analyse statistiques (SAS, Stata) De fournir aux chercheurs des capacités importantes de stockage, de RAM, de processeurs

Les grands enjeux du CASD pour la recherche Offrir la possibilité de confronter les données non structurées (web, capteurs..) aux données structurées de l administration : Permettre des appariements sécurisé (dans le respect des lois) entre toutes ces sources de données créer des connecteurs d'acquisition sécurisée de données (ETL) en temps réel Exemple : Confronter les données socio-économiques aux données économiques (caisses, ventes en ligne) pour permettre une évaluation des politiques publiques au plan local Le secure cloud computing l'adaptation du CASD aux très grands volumes et au temps réel : un véritable challenge

Merci de votre attention