Big data : vers une nouvelle science des risques?

Dimension: px
Commencer à balayer dès la page:

Download "Big data : vers une nouvelle science des risques?"

Transcription

1 Big data : vers une nouvelle science des risques? Serge Abiteboul INRIA et ENS Cachan Conseil national du numérique et Académie des sciences Big data et science des risques 1

2 Organisation Big data en bref Big data : mythe et réalité Exemple : la santé (une vision d ignorant) Big data et science des risques 2

3 Big data en bref Big data et science des risques 3

4 Le Big Data Le big data ou La data Data ce n est pas pluriel? En français : Grosses données Moins glamour? Big data et science des risques 4

5 Crash course en Big Data La société moderne génère des volumes de données infernaux Double tous les 18 mois Ces données ont une valeur considérable Santé, science, environnement, sécurité, transport... Le «Big data»: croiser les données Très structurées et propres d une entreprise/organisation Avec la masse de données moins structurées/plus sales du Web Des données personnelles (comme des s) Des données de réseaux sociaux Et des flux de données (générées par ex. par des senseurs) Valoriser ces données Découvrir de nouvelles connaissances Offrir de nouveaux services Big data et science des risques 5

6 Crash course: tâches principales L analyse de données Un vieux problème Tâches principales Acquisition : aller chercher les données, e.g., outils ETL Intégration : e.g., transformer dans un schéma unique, aligner les données Nettoyage : e.g., éliminer les réplicas, résoudre les contradictions, gérer les données manquantes Crowd sourcing: interagir avec des humains pour obtenir des données, résoudre les contradictions Interrogation : requête, souscription, visualisation Analyse statistique : frequent item set L analyse de données ne répond pas à des problèmes souvent complexes Fouille : quelles sont les questions intéressantes? Utilisation : comment utiliser ces données? Etc. Big data et science des risques 6

7 Difficultés Taille des données : c est Big! Téraoctets, plus Hétérogénéité: structures, ontologies, multilinguisme Vélocité: importance du temps, taux de changement/d'arrivée Espace : localisation Protection des données : données privées, réglementation Qualité: erreurs, incomplétude, confiance, Et encore de la qualité: provenance, fraicheur... Et la complexité : un algorithme en n 3 sur un milliard d enregistrements reste hors de portée même avec mille machines Big data et science des risques 7

8 Pour tuer quelques idées reçues La grande mode est au parallélisme massif style Hadoop Super techno venue des moteurs de recherche Ne marche que sur les problèmes très parallèles Technologie encore assez bas niveau (ça s améliore) Évidemment, Ça impressionne (de moins en moins) C est fun Mais si «votre data est Big» et si vous recherchez l efficacité, interrogez vous : Vos données sont-elles vraiment Big? Ne suffirait-il pas de gonfler votre machine en RAM/en SSD? Peut-on réduire la dimension en échantillonnant? Big data et science des risques 8

9 Big data : mythe et réalité Big data et science des risques 9

10 Big data Le mythe On va résoudre les problèmes de l humanité On a plus en plus de données bientôt toutes les données Un coup d algo et on va résoudre le cancer, la pauvreté, etc. En analysant ces données, nous pouvons faire des prédications de plus en plus fines mais Cela reste des statistiques Limites dues à la complexité en la taille des données Et évidemment une énorme place au hasard On va sûrement résoudre des problèmes Mais Big data et science des risques 10

11 Big data La réalité Ce qu on observe surtout pour l instants 1. Les sociétés utilisent des données privées Pour des buts commerciaux principalement pub ciblées Plus il y a de données, plus ils gagnent d argent 2. Les états utilisent des données privées Pour se protéger du terrorisme Pour surveiller leurs citoyens (surtout dans certains pays) Plus il y a de données, plus l état est puissant Big data et science des risques 11

12 Et si on utilisait cette techno pour résoudre de vrais problèmes Prévoir et mieux y répondre À des crises sanitaires À des problèmes d'environnement À des catastrophes naturelles Aider à résoudre les problèmes de Santé, transport, pauvreté, Organiser un suivi personnalisé Des personnes en difficultés Des personnes âgées Des élèves en difficulté Big data et science des risques 12

13 Exemple : la santé (une vision d ignorant) Big data et science des risques 13

14 Exemple : La santé Les soins personnalisés Toutes les données médicales de la personne Son génome Toutes ses données sociales Soins personnalisés Mesures prédictives Les polices personnalisées Plus chères pour les personnes à risque Personnes «trop» à risque non assurées Mutualisation des risques de plus en plus limitée C est la même science qui rend ça possible Quel monde souhaitons-nous? Big data et science des risques 14

15 Problème : les données personnelles Mes achats, ma géolocalisation, mes courriels Mes données médicales, fiscales, assurances Mes données dans les réseaux sociaux Peut-être celles de mes amis Mes données génomiques 23andMe: pour 99$ séquencement de votre génome et publication sur le Web Et ma vie privée? 2 exemples de problèmes récents : Instagram et revente Facebook et embauche Big data et science des risques 15

16 Une religion personnelle À qui appartiennent mes données? Les données personnelles appartiennent à la personne Les entreprises/états n en sont que les dépositaires temporaires Big data et science des risques 16

17 Comment pouvoir faire quand même des statistiques? L anonymisation des données En garantissant l anonymat de chacun - compliqué Par exemple, «differential privacy» Le propriétaire des données a le droit de choisir ce qu on fait de ses données Condition d utilisation Durée Responsabilité légales de ceux qui détiennent ces données Big data et science des risques 17

18 Big data et science des risques 18

Serge Abiteboul et Pierre Senellart

Serge Abiteboul et Pierre Senellart Informatique Un déluge de données Serge Abiteboul et Pierre Senellart Dans de nombreux domaines, scientifiques ou non, les données s accumulent en masse. Les gérer et les exploiter est le défi posé à l

Plus en détail

Atelier Donnees de sante et esante: quelles opportunites de creation de valeur?

Atelier Donnees de sante et esante: quelles opportunites de creation de valeur? Atelier Donnees de sante et esante: quelles opportunites de creation de valeur? Les opportunités pour les entreprises? Christophe RICHARD Pour mémoire Open Data Big Data «Open» signifie «ouvert» «Data»

Plus en détail

Internet et moi! ou comment Internet joue avec la data

Internet et moi! ou comment Internet joue avec la data cking, a r t e l, s e é n n Mes do Internet et moi! ou comment Internet joue avec la data Une édition Avec le soutien de Mes données, le tracking, Internet et moi Ça pose question! L objectif de ce petit

Plus en détail

Pentaho Business Analytics Intégrer > Explorer > Prévoir

Pentaho Business Analytics Intégrer > Explorer > Prévoir Pentaho Business Analytics Intégrer > Explorer > Prévoir Pentaho lie étroitement intégration de données et analytique. En effet, les services informatiques et les utilisateurs métiers peuvent accéder aux

Plus en détail

Big- Data: Les défis éthiques et juridiques. Copyright 2015 Digital&Ethics

Big- Data: Les défis éthiques et juridiques. Copyright 2015 Digital&Ethics Big- Data: Les défis éthiques et juridiques. 1 Big- Data: Les défis éthiques et juridiques. Digital & Ethics Ce que change le Big Data Les questions éthiques et juridiques Les réponses possibles 2 Digital

Plus en détail

Data Mining et Big Data

Data Mining et Big Data Data Mining et Big Data Eric Rivals LIRMM & Inst. de Biologie Computationnelle CNRS et Univ. Montpellier 14 novembre 2015 E. Rivals (LIRMM & IBC) Big Data 14 novembre 2015 1 / 30 Introduction, contexte

Plus en détail

Systèmes de Fichiers

Systèmes de Fichiers Systèmes de Fichiers Hachage et Arbres B Serge Abiteboul INRIA February 28, 2008 Serge Abiteboul (INRIA) Systèmes de Fichiers February 28, 2008 1 / 26 Systèmes de fichiers et SGBD Introduction Hiérarchie

Plus en détail

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales

Ecole des Hautes Etudes Commerciales HEC Alger. par Amina GACEM. Module Informatique 1ière Année Master Sciences Commerciales Ecole des Hautes Etudes Commerciales HEC Alger Évolution des SGBDs par Amina GACEM Module Informatique 1ière Année Master Sciences Commerciales Evolution des SGBDs Pour toute remarque, question, commentaire

Plus en détail

Masses de données. 1. Introduction 2. Problématiques 3. Socle de formation (non présenté) 4. Liens avec Formation INSA

Masses de données. 1. Introduction 2. Problématiques 3. Socle de formation (non présenté) 4. Liens avec Formation INSA Masses de données 1. Introduction 2. Problématiques 3. Socle de formation (non présenté) 4. Liens avec Formation INSA Rédacteurs : Mjo Huguet / N. Jozefowiez 1. Introduction : Besoins Informations et Aide

Plus en détail

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21 IODAA de l 1nf0rmation à la Décision par l Analyse et l Apprentissage IODAA Informations générales 2 Un monde nouveau Des données numériques partout en croissance prodigieuse Comment en extraire des connaissances

Plus en détail

Big Data: développement, rôle des ARS?? Laurent Tréluyer, ARS Ile de France Alain Livartowski Institut Curie Paris 01/12/2014

Big Data: développement, rôle des ARS?? Laurent Tréluyer, ARS Ile de France Alain Livartowski Institut Curie Paris 01/12/2014 Big Data: développement, rôle des ARS?? Laurent Tréluyer, ARS Ile de France Alain Livartowski Institut Curie Paris 01/12/2014 1 Classiquement, le Big Data se définit autour des 3 V : Volume, Variété et

Plus en détail

Motivation : pourquoi exploration de données? Nous nous noyons dans les données, mais manquons cruellement de connaissances

Motivation : pourquoi exploration de données? Nous nous noyons dans les données, mais manquons cruellement de connaissances 1 Introduction Définition et motivations Tâches de data mining (fouille de données, exploration de données) Techniques et algorithmes Exemples et applications 1 Motivation : pourquoi exploration de données?

Plus en détail

Les datas = le fuel du 21ième sicècle

Les datas = le fuel du 21ième sicècle Les datas = le fuel du 21ième sicècle D énormes gisements de création de valeurs http://www.your networkmarketin g.com/facebooktwitter-youtubestats-in-realtime-simulation/ Xavier Dalloz Le Plan Définition

Plus en détail

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université

Plus en détail

FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis

FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis Joseph Salmon Télécom ParisTech Jeudi 6 Février Joseph Salmon (Télécom ParisTech) Big Data Jeudi 6 Février 1 / 18 Agenda Contexte et opportunités

Plus en détail

Fouille de données et sémantique : des techniques pour donner du sens aux données

Fouille de données et sémantique : des techniques pour donner du sens aux données Fouille de données et sémantique : des techniques pour donner du sens aux données Nathalie Aussenac-Gilles (IRIT) co-animatrice avec M. Boughanem de l axe masse de données et calcul http://www.irit.fr/-masses-de-donnees-et-calcul,677-?lang=fr

Plus en détail

Les protocoles cryptographiques: comment sécuriser nos communications?

Les protocoles cryptographiques: comment sécuriser nos communications? Les protocoles cryptographiques: comment sécuriser nos communications? Stéphanie Delaune Chargée de recherche CNRS au LSV, INRIA projet SecSI & ENS Cachan 21 Mars 2014 S. Delaune (LSV Projet SecSI) Les

Plus en détail

Big Data et le droit :

Big Data et le droit : Big Data et le droit : Comment concilier le Big Data avec les règles de protection des données personnelles? CRIP - Mercredi 16 Octobre 2013 Yann PADOVA, avocat Baker & McKenzie SCP est membre de Baker

Plus en détail

LIVRE BLANC GÉREZ LE CONTENU ET LES DOCUMENTS DE VOTRE ENTREPRISE GRÂCE À VOTRE CRM

LIVRE BLANC GÉREZ LE CONTENU ET LES DOCUMENTS DE VOTRE ENTREPRISE GRÂCE À VOTRE CRM LIVRE BLANC GÉREZ LE CONTENU ET LES DOCUMENTS DE VOTRE ENTREPRISE GRÂCE À VOTRE CRM LIVRE BLANC GÉREZ LE CONTENU ET LES DOCUMENTS DE VOTRE ENTREPRISE GRÂCE À VOTRE CRM 2 À PROPOS Il existe deux grands

Plus en détail

CONGRES BIG DATA PARIS

CONGRES BIG DATA PARIS CONGRES BIG DATA PARIS 21 Mars 2012 Retour d expérience CORPORAMA.COM Eric Barnet Nicolas Thauvin L information entreprise à 360 Corporama est un agrégateur web de données sociétés permettant une vision

Plus en détail

Humanités numériques. Serge Abiteboul INRIA Saclay & ENS Cachan

Humanités numériques. Serge Abiteboul INRIA Saclay & ENS Cachan 1 Humanités numériques Serge Abiteboul INRIA Saclay & ENS Cachan Basé sur un texte de l Encyclopédie de l humanisme méditerranéen avec Florence Hachez- Leroy, Université d Artois & EHESS ICDE 2012 2 Le

Plus en détail

Libérez votre intuition

Libérez votre intuition Présentation de Qlik Sense Libérez votre intuition Qlik Sense est une application nouvelle génération de visualisation de données en libre-service qui permet à chacun de créer facilement des visualisations

Plus en détail

Web et Industrie. Serge Abiteboul, INRIA Saclay & ENS Cachan. Juin 2009. S. Abiteboul INRIA Saclay

Web et Industrie. Serge Abiteboul, INRIA Saclay & ENS Cachan. Juin 2009. S. Abiteboul INRIA Saclay 1 Web et Industrie Serge Abiteboul, INRIA Saclay & ENS Cachan Juin 2009 2 Organisation Le Web grand public Le Web dans l industrie Gestion d information en P2P Perspective de recherche A l INRIA Zooms

Plus en détail

L algorithme : une notion info-documentaire à didactiser?

L algorithme : une notion info-documentaire à didactiser? L algorithme : une notion info-documentaire à didactiser? Par Julien Rousseau, professeur documentaliste, le 29 novembre 2015 Dans un autre article intitulé «Dominique Cardon dévoile les rêves des algorithmes»

Plus en détail

Mobilités : connaître pour mieux agir. Présentation du projet Octobre 2014 Projet co-financé par l Ademe

Mobilités : connaître pour mieux agir. Présentation du projet Octobre 2014 Projet co-financé par l Ademe Mobilités : connaître pour mieux agir Présentation du projet Octobre 2014 Projet co-financé par l Ademe 1 A propos mobi-lise est un projet de recherche qui vise à : Accroître la compréhension des pratiques

Plus en détail

Pair-à-Pair: Architectures et Services

Pair-à-Pair: Architectures et Services Pair-à-Pair: Architectures et Services Fabrice Le Fessant Fabrice.Le_Fessant@inria.fr Équipe ASAP (Réseaux très large échelle) INRIA Saclay Île de France Octobre 2008 Fabrice Le Fessant () Architectures

Plus en détail

PROFILAGE : UN DEFI POUR LA PROTECTION DES DONNEES PERSONNELLES Me Alain GROSJEAN Bonn & Schmitt

PROFILAGE : UN DEFI POUR LA PROTECTION DES DONNEES PERSONNELLES Me Alain GROSJEAN Bonn & Schmitt PROFILAGE : UN DEFI POUR LA PROTECTION DES DONNEES PERSONNELLES Me Alain GROSJEAN Bonn & Schmitt ASPECTS TECHNIQUES M. Raphaël VINOT CIRCL SEMINAIRE UIA ENJEUX EUROPEENS ET MONDIAUX DE LA PROTECTION DES

Plus en détail

Repenser le SI à l'ère du numérique : apports des solutions de big data, cloud computing et confiance numérique

Repenser le SI à l'ère du numérique : apports des solutions de big data, cloud computing et confiance numérique Repenser le SI à l'ère du numérique : apports des solutions de big data, cloud computing et confiance numérique Extraits d analyses publiées par MARKESS International Emmanuelle Olivié-Paul epaul@markess.com

Plus en détail

R, VISUALISATION ET APPRENTISSAGE

R, VISUALISATION ET APPRENTISSAGE R, VISUALISATION ET APPRENTISSAGE ANALYSE DE COMPORTEMENTS TOURISTIQUES À PARTIR DE DONNÉES PHOTOGRAPHIQUES GÉOTAGGÉES B.Branchet G.Chareyron J.Da-Rugna 2 PRÉSENTATION Bérengère Branchet Gaël Chareyron

Plus en détail

IBM Software Big Data. Plateforme IBM Big Data

IBM Software Big Data. Plateforme IBM Big Data IBM Software Big Data 2 Points clés Aide les utilisateurs à explorer de grands volumes de données complexes Permet de rationaliser le processus de développement d'applications impliquant de grands volumes

Plus en détail

TOP. année promet d être BIG (Business Intelligence Growth) PRINCIPALES TENDANCES EN MATIÈRE DE SOLUTIONS DÉCISIONNELLES POUR 2013

TOP. année promet d être BIG (Business Intelligence Growth) PRINCIPALES TENDANCES EN MATIÈRE DE SOLUTIONS DÉCISIONNELLES POUR 2013 0 Cette TOP 10 PRINCIPALES TENDANCES EN MATIÈRE DE SOLUTIONS DÉCISIONNELLES POUR 2013 année promet d être BIG (Business Intelligence Growth) Quel est le bilan de l année 2012 en matière de solutions décisionnelles?

Plus en détail

Le multimédia à l école élémentaire

Le multimédia à l école élémentaire Le multimédia à l école élémentaire 1. Evolution de la problématique Notre interrogation initiale concernait la connaissance de l équipement des écoles et, plus particulièrement, des usages générés par

Plus en détail

Indications pédagogiques E1 / 43

Indications pédagogiques E1 / 43 à la Communication Objectif général Indications pédagogiques E1 / 43 E : APPRECIER UN MESSAGE Degré de difficulté 1 Objectif intermédiaire Objectif opérationnel Pré-requis Nombre d exercices proposés 4

Plus en détail

Votre laisser-passer pour les. Big Data Guide visuel

Votre laisser-passer pour les. Big Data Guide visuel Votre laisser-passer pour les Big Data Guide visuel Les Big Data ont une immense valeur Apprenez à en libérer tout le potentiel Nul doute aujourd hui que les Big Data entraînent une profonde mutation du

Plus en détail

Création de jeu vidéo

Création de jeu vidéo Création de jeu vidéo Mathias Fontmarty Jeudi 5 Juin 2014 Collège Jacqueline Auriol Villeneuve-Tolosane Qui suis-je? TRAVAIL Naissance 1982 Primaire 1986 Enseignant Collège Lycée Bac S Ingénieur informatique

Plus en détail

Pérennisation de la documentation scientifique et technique au CEA DAM : le projet XediX

Pérennisation de la documentation scientifique et technique au CEA DAM : le projet XediX Pérennisation de la documentation scientifique et technique au CEA DAM : le projet XediX Didier Courtaud CEA DAM Île-de-France Courriel : Didier.Courtaud@cea.fr 1 Plan Projet XediX Contexte Genèse Choix

Plus en détail

Regards sur. Un phénomène massif d une rapidité. «Big data» : les données comme matière première? Le Big data

Regards sur. Un phénomène massif d une rapidité. «Big data» : les données comme matière première? Le Big data Regards sur «Big data» : les données comme matière première? Un phénomène massif d une rapidité extrême est intervenu ces dernières années : alors que 2 % des données étaient stockées sous format numérique

Plus en détail

Un monde de données. comprendre l implication sociale et politique des banques de données et leur accès

Un monde de données. comprendre l implication sociale et politique des banques de données et leur accès Un monde de données comprendre l implication sociale et politique des banques de données et leur accès Hubert Guillaud, éditeur de formation, vit à Romans-sur-Isère (Drôme). Il est rédacteur en chef d

Plus en détail

À PROPOS DE TALEND...

À PROPOS DE TALEND... WHITE PAPER Table des matières Résultats de l enquête... 4 Stratégie d entreprise Big Data... 5 Intégration des Big Data... 8 Les défis liés à la mise en œuvre des Big Data... 10 Les technologies pour

Plus en détail

UNION POSTALE UNIVERSELLE

UNION POSTALE UNIVERSELLE UPU UNION POSTALE UNIVERSELLE CEP C 2 2014.1 Doc 6b Original: anglais CONSEIL D EXPLOITATION POSTALE Commission 2 (Développement des marchés) Questions intéressant le Groupe «Economie postale appliquée

Plus en détail

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci http://liris.cnrs.fr/hamamache.kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de

Plus en détail

Dossier Spécial DE NOUVELLES PERSPECTIVES POUR UNE BUSINESS INTELLIGENCE AGILE

Dossier Spécial DE NOUVELLES PERSPECTIVES POUR UNE BUSINESS INTELLIGENCE AGILE Dossier Spécial DE NOUVELLES PERSPECTIVES POUR UNE BUSINESS INTELLIGENCE AGILE L es utilisateurs du décisionnel réclament plus de souplesse. Les approches mixtes, classiques et liées aux Big Data, répondent

Plus en détail

Dailymotion: La performance dans le cloud

Dailymotion: La performance dans le cloud Dailymotion: La performance dans le cloud CRiP Thématique Services IT dans le Cloud 06/11/14 Dailymotion en quelques chiffres? 130 millions visiteurs uniques par mois 3 milliards de vidéos vues par mois

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane

Plus en détail

Sommaire. 3. Les grands principes de GFS L architecture L accès de fichier en lecture L accès de fichier en écriture Bilan

Sommaire. 3. Les grands principes de GFS L architecture L accès de fichier en lecture L accès de fichier en écriture Bilan 1 Sommaire 1. Google en chiffres 2. Les raisons d être de GFS 3. Les grands principes de GFS L architecture L accès de fichier en lecture L accès de fichier en écriture Bilan 4. Les Evolutions et Alternatives

Plus en détail

GT Big Data. Saison 2014-2015. Bruno Prévost (Safran), Marc Demerlé (GDF SUEZ) CRiP Thématique Mise en œuvre du Big Data 16/12/14

GT Big Data. Saison 2014-2015. Bruno Prévost (Safran), Marc Demerlé (GDF SUEZ) CRiP Thématique Mise en œuvre du Big Data 16/12/14 GT Big Data Saison 2014-2015 Bruno Prévost (Safran), Marc Demerlé (GDF SUEZ) Sommaire GT Big Data : roadmap 2014-15 Revue de presse Business Education / Promotion Emploi Sécurité / Compliance Cuisine:

Plus en détail

HADOOP ET SON ÉCOSYSTÈME

HADOOP ET SON ÉCOSYSTÈME HADOOP ET SON ÉCOSYSTÈME Mars 2013 2012 Affini-Tech - Diffusion restreinte 1 AFFINI-TECH Méthodes projets Outils de reporting & Data-visualisation Business & Analyses BigData Modélisation Hadoop Technos

Plus en détail

Les communications explosent

Les communications explosent François Charron Les communications explosent Pages jaunes Journaux Circulaires Radio Télé Sites Internet Boutiques en ligne Courriels Blogues Facebook 16% des fans en un mois Twitter SMS Coupons Web Foursquare

Plus en détail

Jean-François Boulicaut & Mohand-Saïd Hacid

Jean-François Boulicaut & Mohand-Saïd Hacid e siècle! Jean-François Boulicaut & Mohand-Saïd Hacid http://liris.cnrs.fr/~jboulica http://liris.cnrs.fr/mohand-said.hacid Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205

Plus en détail

Institut Mines-Télécom. Chaire de recherche Valeurs et politiques des informations personnelles

Institut Mines-Télécom. Chaire de recherche Valeurs et politiques des informations personnelles Chaire de recherche Valeurs et politiques des informations personnelles 1- L ère des données massives 2 Un déluge de données devenu réalité quotidienne 3 + 1 Zettabytes en 2011 médias Contenus des utilisateurs

Plus en détail

Les communications explosent

Les communications explosent François Charron Les communications explosent Pages jaunes Journaux Circulaires Radio Télé Sites Internet Boutiques en ligne Courriels Blogues Facebook 16% des fans en un mois Twitter SMS Coupons Web Foursquare

Plus en détail

Le Etourismeen 2012. Jean-Luc BOULIN - MOPA. 1 ère Journée e-tourisme Pays de Bergerac

Le Etourismeen 2012. Jean-Luc BOULIN - MOPA. 1 ère Journée e-tourisme Pays de Bergerac Le Etourismeen 2012 Jean-Luc BOULIN - MOPA 1 ère Journée e-tourisme Pays de Bergerac Mission des Offices de Tourisme et Pays Touristiques d Aquitaine Renforcersa communication 5 MISSIONS D ACCOMPAGNEMENT

Plus en détail

BIG DATA : comment étendre et gérer la connaissance client? François Nguyen SFR Directeur SI décisionnel & Mkt relationnel GP

BIG DATA : comment étendre et gérer la connaissance client? François Nguyen SFR Directeur SI décisionnel & Mkt relationnel GP BIG DATA : comment étendre et gérer la connaissance client? François Nguyen SFR Directeur SI décisionnel & Mkt relationnel GP SFR en quelques chiffres Le Dataware Client GP de SFR en août 2011 150 applications

Plus en détail

lundi 27 février 2012 François Charron

lundi 27 février 2012 François Charron François Charron Présentation Entrepreneur depuis l âge de 18 ans (commerce de détail, manufacturier, importation, service et production) Chroniqueur Web et techno depuis 12 ans à TVA / Salut, Bonjour!

Plus en détail

Une brève introduction aux Données Massives - Challenges et perspectives. Romain Picot-Clémente Cécile Bothorel Philippe Lenca

Une brève introduction aux Données Massives - Challenges et perspectives. Romain Picot-Clémente Cécile Bothorel Philippe Lenca Une brève introduction aux Données Massives - Challenges et perspectives Romain Picot-Clémente Cécile Bothorel Philippe Lenca Plan 1 Big Data 2 4Vs 3 Hadoop et son écosystème 4 Nouveaux challenges, nouvelles

Plus en détail

Big Data? Big responsabilités! Paul-Olivier Gibert Digital Ethics

Big Data? Big responsabilités! Paul-Olivier Gibert Digital Ethics Big Data? Big responsabilités! Paul-Olivier Gibert Digital Ethics Big data le Buzz Le Big Data? Tout le monde en parle sans trop savoir ce qu il signifie. Les médias high-tech en font la nouvelle panacée,

Plus en détail

Les participants repartiront de cette formation en ayant une vision claire de la stratégie et de l éventuelle mise en œuvre d un Big Data.

Les participants repartiront de cette formation en ayant une vision claire de la stratégie et de l éventuelle mise en œuvre d un Big Data. Big Data De la stratégie à la mise en oeuvre Description : La formation a pour objet de brosser sans concession le tableau du Big Data. Les participants repartiront de cette formation en ayant une vision

Plus en détail

Big Data et l avenir du décisionnel

Big Data et l avenir du décisionnel Big Data et l avenir du décisionnel Arjan Heijmenberg, Jaspersoft 1 Le nouveau monde des TI L entreprise en réseau de McKinsey McKinsey sur le Web 2.0 McKinsey Global Institute, décembre 2010 Emergence

Plus en détail

Analyse détaillée des trajets effectués en Transports en commun en Ile-de-France

Analyse détaillée des trajets effectués en Transports en commun en Ile-de-France Etude sur les déplacements Analyse détaillée des trajets effectués en Transports en commun en Ile-de-France 18 Septembre 2014 ixxi-mobility.com 2 Transformer le temps de transport en temps utile Le temps

Plus en détail

MONEY, MONEY, MONEY PAYER, VENDRE ET ÉCHANGER DE L ARGENT DEMAIN

MONEY, MONEY, MONEY PAYER, VENDRE ET ÉCHANGER DE L ARGENT DEMAIN MONEY, MONEY, MONEY PAYER, VENDRE ET ÉCHANGER DE L ARGENT DEMAIN EDITO Il y a 20 ans, il fallait se déplacer en agence pour effectuer un virement ou passer un ordre de bourse. Aujourd hui, il nous est

Plus en détail

Big data et Marketing: alliance parfaite? Swiss Marketing Vaud

Big data et Marketing: alliance parfaite? Swiss Marketing Vaud Big data et Marketing: alliance parfaite? Swiss Marketing Vaud Silvia Quarteroni, Experte NLP Lausanne, 10 mars 2015 AGENDA Big data et Marketing: alliance parfaite? 1. Le Big data en deux mots 2. Big

Plus en détail

Travailler avec les télécommunications

Travailler avec les télécommunications Travailler avec les télécommunications Minimiser l attrition dans le secteur des télécommunications Table des matières : 1 Analyse de l attrition à l aide du data mining 2 Analyse de l attrition de la

Plus en détail

Un nouveau souffle sur les approches multicanal, les outils d analyse et la segmentation clients

Un nouveau souffle sur les approches multicanal, les outils d analyse et la segmentation clients Un nouveau souffle sur les approches multicanal, les outils d analyse et la segmentation clients Les tendances technologiques dans le secteur de l assurance vie : partie 1. * *La haute performance. Réalisée.

Plus en détail

UNIVERSITE D'EVRY VAL D'ESSONNE Référence GALAXIE : 4072

UNIVERSITE D'EVRY VAL D'ESSONNE Référence GALAXIE : 4072 UNIVERSITE D'EVRY VAL D'ESSONNE Référence GALAXIE : 4072 Numéro dans le SI local : Référence GESUP : Corps : Professeur des universités Article : 46-1 Chaire : Non Section 1 : 27-Informatique Section 2

Plus en détail

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST.

La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST. La gestion de données dans le cadre d une application de recherche d alignement de séquence : BLAST. Gaël Le Mahec - p. 1/12 L algorithme BLAST. Basic Local Alignment Search Tool est un algorithme de recherche

Plus en détail

Soutien illimité 7j/7 en maths: Coach, profs, exercices & annales, cours. Sujet de Bac 2013 Maths S Obligatoire & Spécialité - Amérique du Nord

Soutien illimité 7j/7 en maths: Coach, profs, exercices & annales, cours. Sujet de Bac 2013 Maths S Obligatoire & Spécialité - Amérique du Nord Sujet de Bac 2013 Maths S Obligatoire & Spécialité - Amérique du Nord EXERCICE 1 : 5 points On se place dans l espace muni d un repère orthonormé. On considère les points,, et. 1. Démontrer que les points,

Plus en détail

L informatique des entrepôts de données

L informatique des entrepôts de données L informatique des entrepôts de données Daniel Lemire SEMAINE 13 L exploration des données 13.1. Présentation de la semaine L exploration de données (ou data mining) est souvent associée à l intelligence

Plus en détail

BIG DATA et DONNéES SEO

BIG DATA et DONNéES SEO BIG DATA et DONNéES SEO Vincent Heuschling vhe@affini-tech.com @vhe74 2012 Affini-Tech - Diffusion restreinte 1 Agenda Affini-Tech SEO? Application Généralisation 2013 Affini-Tech - Diffusion restreinte

Plus en détail

Chercher sur le Web : juste un point fixe et quelques algorithmes

Chercher sur le Web : juste un point fixe et quelques algorithmes Chercher sur le Web : juste un point fixe et quelques algorithmes Serge Abiteboul, directeur de recherche Inria à l École Normale Supérieure de Cachan Le Web met à notre disposition une masse considérable

Plus en détail

Protection des données personnelles : Vers un Web personnel sécurisé

Protection des données personnelles : Vers un Web personnel sécurisé Rencontre Inria Industrie Les télécoms du futur Table ronde Sécurité des contenus Protection des données personnelles : Vers un Web personnel sécurisé Luc Bouganim - INRIA Paris-Rocquencourt EPI SMIS,

Plus en détail

Big Graph Data Forum Teratec 2013

Big Graph Data Forum Teratec 2013 Big Graph Data Forum Teratec 2013 MFG Labs 35 rue de Châteaudun 75009 Paris, France www.mfglabs.com twitter: @mfg_labs Julien Laugel MFG Labs julien.laugel@mfglabs.com @roolio SOMMAIRE MFG Labs Contexte

Plus en détail

SyMeTRIC. projet régional pour le développement de la Médecine Systémique. alban.gaignard@univ-nantes.fr

SyMeTRIC. projet régional pour le développement de la Médecine Systémique. alban.gaignard@univ-nantes.fr SyMeTRIC projet régional pour le développement de la Médecine Systémique alban.gaignard@univ-nantes.fr portage scientifique : Jérémie Bourdon (LINA), Richard Redon (Inst. du Thorax) Systems Medicine Développer

Plus en détail

Le Big Data est-il polluant? BILLET. Big Data, la déferlante des octets VIVANT MATIÈRE SOCIÉTÉS UNIVERS TERRE NUMÉRIQUE TERRE (/TERRE)

Le Big Data est-il polluant? BILLET. Big Data, la déferlante des octets VIVANT MATIÈRE SOCIÉTÉS UNIVERS TERRE NUMÉRIQUE TERRE (/TERRE) Donner du sens à la science Rechercher Se connecter / S'inscrire Suivre VIVANT MATIÈRE SOCIÉTÉS UNIVERS TERRE NUMÉRIQUE MES THÈMES Types DOSSIER Paru le 15.11.2012 Mis à jour le 29.01.2014 Big Data, la

Plus en détail

ELASTICSEARCH MAINTENANT EN VERSION 1.4

ELASTICSEARCH MAINTENANT EN VERSION 1.4 ELASTICSEARCH MAINTENANT EN VERSION 1.4 firm1 29 octobre 2015 Table des matières 1 Introduction 5 2 Les principaux atouts 7 2.1 Moteur de recherche vs Moteur d indexation.................... 7 2.2 Du

Plus en détail

professionnel et convivial

professionnel et convivial professionnel et convivial ARCO ADRESSES ARCO Adresses est une gestion de contacts performante particulièrement adaptée à des activités de marketing. Il est facile de reprendre automatiquement des adresses

Plus en détail

Ingénierie de Systèmes Intelligents

Ingénierie de Systèmes Intelligents Ingénierie de Systèmes Intelligents p. 1/ Ingénierie de Systèmes Intelligents Application : Web Intelligent Maria Malek EISTI Ingénierie de Systèmes Intelligents p. 2/ Objectif Traitement Intelligent des

Plus en détail

Un enrichissement exponentiel de la toile

Un enrichissement exponentiel de la toile Un enrichissement exponentiel de la toile Marie-Danièle CAMPION Recteur de l académie de Clermont-Ferrand Que ce soit au niveau des archives, des catalogues, des registres, des plans industriels qui étaient

Plus en détail

Gestion de Contenus Web (WCM)

Gestion de Contenus Web (WCM) Web Content Management 1 Gestion de Contenus Web (WCM) Bernd Amann Modelware : vers la modélisation et la sémantisation de l information École CEA-EDF-INRIA 16-27 juin 2003 Cours No 1 - Gestion de Contenus

Plus en détail

Business Intelligence avec Excel, Power BI et Office 365

Business Intelligence avec Excel, Power BI et Office 365 Avant-propos A. À qui s adresse ce livre? 9 1. Pourquoi à chaque manager? 9 2. Pourquoi à tout informaticien impliqué dans des projets «BI» 9 B. Obtention des données sources 10 C. Objectif du livre 10

Plus en détail

Journée Annuelle - 8 décembre 2015

Journée Annuelle - 8 décembre 2015 Journée Annuelle - 8 décembre 2015 «Définition du Big Data» Jean Pierre MALLE 1 jean-pierre malle datascientist, expert data-intelligence modèles et algorithmes brevetés : en analyse contextuelle en analyse

Plus en détail

Ministère des Affaires étrangères et européennes. Direction de la politique culturelle et du français. Regards VII

Ministère des Affaires étrangères et européennes. Direction de la politique culturelle et du français. Regards VII Ministère des Affaires étrangères et européennes Direction de la politique culturelle et du français Regards VII 3. Le recyclage de l électroménager Réalisation Thomas Sorin, CAVILAM Rédaction Lionel Favier,

Plus en détail

Algorithmique et Simulation

Algorithmique et Simulation Licence3 SV Université Nice Sophia Antipolis April 8, 2013 Plan Simulation à Événements Discrets 1 Simulation à Événements Discrets Schéma général Simulation à Événements Discrets objet de l étude (réel

Plus en détail

Comment ça se passe? Déroulé détaillé. INTRODUCTION / 10 minutes

Comment ça se passe? Déroulé détaillé. INTRODUCTION / 10 minutes De quoi s agit il Cette animation d une durée de 2 heures permet de sensibiliser les participants au domaine particulier des informations personnelles, du quantified self et de l usage marketing qui peut

Plus en détail

NoSQL. Introduction 1/23. I NoSQL : Not Only SQL, ce n est pas du relationnel, et le contexte. I table d associations - Map - de couples (clef,valeur)

NoSQL. Introduction 1/23. I NoSQL : Not Only SQL, ce n est pas du relationnel, et le contexte. I table d associations - Map - de couples (clef,valeur) 1/23 2/23 Anne-Cécile Caron Master MIAGE - BDA 1er trimestre 2013-2014 I : Not Only SQL, ce n est pas du relationnel, et le contexte d utilisation n est donc pas celui des SGBDR. I Origine : recherche

Plus en détail

LEVER L ANONYMAT AUDIENCE ANALYTICS. Online Intelligence Solutions

LEVER L ANONYMAT AUDIENCE ANALYTICS. Online Intelligence Solutions LEVER L ANONYMAT AUDIENCE ANALYTICS Online Intelligence Solutions Qui sommes nous? Augustin DECRE Managing Director France @Nuggad Samia ABARA Product Evangelist @Samia_Analytics The company APPLIED TECHNOLOGIES

Plus en détail

Data Mining. Exposés logiciels, systèmes et réseaux. Damien Jubeau IR3 Lundi 19 novembre 2012

Data Mining. Exposés logiciels, systèmes et réseaux. Damien Jubeau IR3 Lundi 19 novembre 2012 Data Mining Exposés logiciels, systèmes et réseaux. Damien Jubeau IR3 Lundi 19 novembre 2012 2 Plan Data mining : définition, utilisations et concepts Wolfram Alpha : extraction de données d'un compte

Plus en détail

communiqué de presse Xavier Darcos lance des cours d été gratuits en ligne Vendredi 19 juin 2009

communiqué de presse Xavier Darcos lance des cours d été gratuits en ligne Vendredi 19 juin 2009 communiqué de presse Xavier Darcos lance des cours d été gratuits en ligne Vendredi 19 juin 2009 Xavier Darcos a lancé aujourd hui un service de cours d été accessibles gratuitement en ligne. Ce nouveau

Plus en détail

Les médias sociaux Des outils de développement, de réseautage et de promotion Présenté par. CindyRivard.com

Les médias sociaux Des outils de développement, de réseautage et de promotion Présenté par. CindyRivard.com Les médias sociaux Des outils de développement, de réseautage et de promotion Présenté par CindyRivard.com Médias Sociaux Outil de diffusion d informations Permet la création et l échange de contenu en

Plus en détail

Cours IFT6266, Exemple d application: Data-Mining

Cours IFT6266, Exemple d application: Data-Mining Cours IFT6266, Exemple d application: Data-Mining Voici un exemple du processus d application des algorithmes d apprentissage statistique dans un contexte d affaire, qu on appelle aussi data-mining. 1.

Plus en détail

Utilisation des médias sociaux. Pour tirer le plein potentiel des médias sociaux

Utilisation des médias sociaux. Pour tirer le plein potentiel des médias sociaux Utilisation des médias sociaux Pour tirer le plein potentiel des médias sociaux Document réalisé par le Carrefour jeunesse-emploi Rivière-du-Nord 2013-2014 LES MÉDIAS SOCIAUX Les médias sociaux se sont

Plus en détail

Emergence du Big Data Exemple : Linked Open Data

Emergence du Big Data Exemple : Linked Open Data 1 CNRS - Misionpour l'interdisciplinarité Mokrane Bouzeghoub 1 Une approche interdisciplinaire des grandes masses de données (Défi Mastodons) Mokrane Bouzeghoub DAS INS2I / MI Ecole de L Innova.on Thérapeu.

Plus en détail

Plateforme OpenSource de services de Géolocalisation Indoor & Outdoor

Plateforme OpenSource de services de Géolocalisation Indoor & Outdoor C est quoi? Plateforme OpenSource de services de Géolocalisation Indoor & Outdoor Alexandre FUND 253 rue Saint Honoré - 75001 Paris alexandre.fund@tevolys.com 06 30 89 12 52 Open-Source 1 ère plateforme

Plus en détail

02.10.2015 Olivier Rafal, PAC CXP Group

02.10.2015 Olivier Rafal, PAC CXP Group 02.10.2015 Olivier Rafal, PAC CXP Group 1 Le groupe CXP L étude BARC Big Data Use Cases 2015 Etude internationale Plus de 550 participants 3e Edition Large couverture des types d industries & tailles d

Plus en détail

Analyses croisées de sites Web pour détecter les sites de contrefaçon. Prof. Dr. Olivier Biberstein

Analyses croisées de sites Web pour détecter les sites de contrefaçon. Prof. Dr. Olivier Biberstein Analyses croisées de sites Web pour détecter les sites de contrefaçon Prof. Dr. Olivier Biberstein Division of Computer Science 14 Novembre 2013 Plan 1. Présentation générale 2. Projet 3. Travaux futurs

Plus en détail

Web Data Mining Web Usage Mining

Web Data Mining Web Usage Mining Web Data Mining p. 1/1 Web Data Mining Web Usage Mining Maria Malek Options GL, ISICO & IdSI EISTI Web Data Mining p. 2/1 Fouille des Données de la Toile?!! Web Structure Mining Découverte de la connaissance

Plus en détail

Moteur d idées pour véhicules spécifiques. Le Pôle de compétitivité Véhicules et Mobilités du grand Ouest

Moteur d idées pour véhicules spécifiques. Le Pôle de compétitivité Véhicules et Mobilités du grand Ouest ] Moteur d idées pour véhicules spécifiques [ Le Pôle de compétitivité Véhicules et Mobilités du grand Ouest ] [Notre mission] Développer la compétitivité des entreprises par le biais de l innovation :

Plus en détail

Vision prospective et obstacles à surmonter pour les assureurs

Vision prospective et obstacles à surmonter pour les assureurs smart solutions for smart leaders Le «Big Data» assurément Rédigé par Pascal STERN Architecte d Entreprise Vision prospective et obstacles à surmonter pour les assureurs Un avis rendu par la cour de justice

Plus en détail

Privateimmo.com. Privateimmo.com, Fête ses 1 an! le dossier de presse. 1er site de vente privée immobilière

Privateimmo.com. Privateimmo.com, Fête ses 1 an! le dossier de presse. 1er site de vente privée immobilière le dossier de presse 1 er site de vente privée immobilière sur internet Privateimmo.com, 1er site de vente privée immobilière Fête ses 1 an! Contact presse : Matthieu BOREL Tel : 04 78 42 01 09 E-Mail

Plus en détail

Statistique et analyse de données pour l assureur : des outils pour la gestion des risques et le marketing

Statistique et analyse de données pour l assureur : des outils pour la gestion des risques et le marketing Statistique et analyse de données pour l assureur : des outils pour la gestion des risques et le marketing Gilbert Saporta Chaire de Statistique Appliquée, CNAM ActuariaCnam, 31 mai 2012 1 L approche statistique

Plus en détail

"Les médecins seront les infirmières de 2030"

Les médecins seront les infirmières de 2030 RECHERCHE par Laure Martin le 25-09-2014 38 RÉACTION(S) "Les médecins seront les infirmières de 2030" Afficher sur plusieurs pages Chirurgien-urologue et neurobiologiste de formation, le Dr Laurent Alexandre

Plus en détail