Big Data et documentation

Documents pareils
Open Data. François Bancilhon twitter.com/fbancilhon Printemps de la recherche EDF R&D 28/9/12

Le passage à l open source, une nouvelle priorité

Formation continue des personnels URCA. Offre de la Bibliothèque Universitaire

LA PLENIERE D OUVERTURE

Vision prospective et obstacles à surmonter pour les assureurs

Titre : La BI vue par l intégrateur Orange

PROSPECTER PAR LES RESEAUX SOCIAUX : du VIRTUEL au REEL & inversement

Servir ses utilisateurs sans bureau d accueil physique

Big data* et marketing

GT Big Data. Saison Bruno Prévost (Safran), Marc Demerlé (GDF SUEZ) CRiP Thématique Mise en œuvre du Big Data 16/12/14

Formations Web. Catalogue 2014 Internet Référencement Newsletter Réseaux sociaux Smartphone

Présentation générale du projet data.bnf.fr

Philippe Lemerle Big Data Secteur public. Copyright 2015, Oracle and/or its affiliates. All rights reserved.

Open Data. Enjeux et perspectives dans les télécommunications

ZOTERO Un outil gratuit de gestion de bibliographies

L auto-archivage en maths, quoi de neuf?

L avenir. est au numérique

Big Data et Graphes : Quelques pistes de recherche

EN MAÎTRISANT INTERNET, APPORTEZ UN NOUVEL ÉLAN À VOTRE ACTIVITÉ

SÉRIE NOUVELLES ARCHITECTURES

Protection des données personnelles : Vers un Web personnel sécurisé

INTERNET, C'EST QUOI?

et déterminant à elle seule la réussite ou non d une page.

Le BigData, aussi par et pour les PMEs

Big Data Feuille de route

Les documents primaires / Les documents secondaires

Compte-rendu conférence 17 avril 2014 Ferté-Fresnel

Livre Blanc. L hébergement à l heure du Cloud. Comment faire son choix?

CONFERENCE TECHNOM AIDE IBM

Séminaire OPTIMA 16 avril Optimod Lyon, une coopération public/privée pour la mobilité urbaine et l innovation

La gestion des documents administratifs à la Bibliothèque nationale de France

LES CHIFFRES CLÉS DU NUMÉRIQUE ET LES BONNES PRATIQUES DE NUMÉRISATION DES TPE /PME

e-science : perspectives et opportunités pour de nouvelles pratiques de la recherche en informatique et mathématiques appliquées

Affiliate link:

Panorama des contenus

Des Big Data aux Big Brothers Jean- Gabriel Ganascia Equipe ACASA LIP6 Université Pierre and Marie Curie Labex OBVIL PRES Sorbonne Université

Stratégie de contenus

- Présentation personnelle

Catalogue des formations Médecine et paramédical

Bienvenue aux 317 inscrits!!!

FORUM NTIC BIG DATA, OPEN DATA Big Data: les challenges, les défis

Internet et Big Brother : Réalité ou Fantasme? Dr. Pascal Francq

Les nouveaux défis pour les régulateurs et les opérateurs télécoms. M. Ahmed Khaouja, Ing.

L EAI. par la pratique. François Rivard. Thomas Plantain. Groupe Eyrolles, 2003 ISBN :

L'école et l'économie de l'attention. Université de Caen ISCC (Institut des Sciences de la Communication du CNRS

Archivistes en herbe!

Étude sur la présence des sociétés d assurance sur les réseaux sociaux en 2014 DECEMBRE 2014

Le Big Data est-il polluant? BILLET. Big Data, la déferlante des octets VIVANT MATIÈRE SOCIÉTÉS UNIVERS TERRE NUMÉRIQUE TERRE (/TERRE)

Les enjeux du Big Data Innovation et opportunités de l'internet industriel. Datasio 2013

3 logiciels «gratuits» pour gérer sa bibliographie

Big Graph Data Forum Teratec 2013

Rédiger : le numérique dans la préparation de la thèse

Big Data: comment passer de la stratégie à la mise en œuvre? Big Data Paris Mars 2015

Correspondance ancien / nouveau référentiel B2i pour le collège

Benchmark. Community Management d agences de communication

LES NOUVEAUX FACTEURS DE COMPÉTITIVITÉ BASÉS SUR LA 3 ÈME PLATEFORME INFORMATIQUE. Sébastien LAMOUR IDC Research & Consulting Manager

Formation Storytelling par l image Partie 1 L importance du visuel + Pinterest

Direction des bibliothèques. Sondage Ithaka S+R. Questionnaire français Université de Montréal

MASTER 1 INFORMATIQUE Recherche bibliographique 1 ère session : Rechercher et localiser de la documentation en informatique niveau 1

QUI SOMMES NOUS? Notre équipe se tient à votre disposition pour vous apporter de plus amples informations et vous conseiller.

Pour débuter sur LinkedIn

Métamorphoser son image en ligne

Twitter et Netvibes pour la veille

Big Data et Graphes : Quelques pistes de recherche

DocForum 18 Juin Réussites d un projet Big Data Les incontournables

Avant-propos. Les moteurs (et systèmes) de recommandation

Les archives ouvertes

LIVRET DE VISITE. Autoportraits du musée d. musée des beaux-arts. place Stanislas

Indexmed : Le big data en écologie? Pas encore disent certains. Pas si sûr! Avec IndexMed. Relevons ce challenge!

BIGDATA AN 3 : UNE NOUVELLE ERE DE B.I.

Big Data et l avenir du décisionnel

Une organisation internationale au cœur des enjeux de contenus et d accès à l information scientifique: L IFLA

BIG DATA : GESTION ET ANALYSE DES DONNÉES MASSIVES (BGD) Mastère Spécialisé. Appréhendez les challenges économiques et juridiques du Big Data

Les nouveaux tableaux de bord des managers

Programme de formations Webmarketing & Réseaux sociaux

Recherche bibliographique

EN MAÎTRISANT INTERNET, APPORTEZ UN NOUVEL ÉLAN À VOTRE ACTIVITÉ

Les 3 erreurs fréquentes qui font qu'un site e-commerce ne marche pas. Livret offert par Kiro créateur de la formation Astuce E-commerce

CREER UN UNIVERS NETVIBES

La recherche documentaire en français

Janvier BIG DATA : Affaires privées, données publiques

Les application Collaboratifs dans les entreprises

La Situation du Marché de l Emploi Informatique en Belgique

LA BATTERIE DU PORTABLE

Etapes de création d une revue électronique

Communiqué 8 novembre 2012

Les datas = le fuel du 21ième sicècle

Après le bac, trouver sa voie

Territoires géographiques/numériques

Are you Open for Innovation? Découvrez en avant-première les grandes lignes de l édition 2015 du Paris Open Source Summit et déposez vos contributions

ATELIER : Développer ses réseaux un atout pour votre recherche de stage ou d emploi

Archiviste - Documentaliste / Gestionnaire de l information / Consultant en archives et documentation

Ministère de la Culture et de la Communication

Big Data : Quel usage au sein des projetsinternet?

Les usages en matière de Technologies de l Information et de la Communication en Bourgogne 17 Avril 2015

Lettre de tendance : Le Big Data, un levier de croissance pour le tourisme? (octobre 2014)

Gérer son Google Drive pour gérer ses informations : le tutoriel

Transcription:

Big Data et documentation Jean-Michel Salaün ENS de Lyon Journée d'étude "Mieux accompagner la recherche : réalités d'aujourd'hui et perspectives pour les fonctions d IST" 30 septembre 2015

Chiffre d affaires «Les activités liées au Big Data ont représenté en France environ 1,5 milliards d euros cette année, et atteindront près de 9 milliards d ici 2020 (recouvrant les dépenses en logiciels, services, et dépenses internes des entreprises).» La nouvelle France industrielle, Big Data Feuille de route, Paul HERMELIN (PDG de CapGemini) et François BOURDONCLE (Président de FB&Cie). 2 juillet 2014 JM Salaün Lyon 30-09-2015 2

Emplois «En termes d emplois, l enjeu du Big Data est de créer ou consolider de l ordre de 137 000 emplois, soit directement dans l industrie informatique, soit dans les fonctions technologiques au sein des entreprises, soit dans les fonctions métiers (par exemple les fonctions de vente) des entreprises.» La nouvelle France industrielle, Big Data Feuille de route, Paul HERMELIN (PDG de CapGemini) et François BOURDONCLE (Président de FB&Cie). 2 juillet 2014 JM Salaün Lyon 30-09-2015 3

Activités «A l instar de ce qui s est passé pour la presse, le commerce de proximité, le tourisme ou encore l industrie musicale, ces sociétés [du numérique] tentent actuellement d utiliser [les données sur leurs clients] pour modifier profondément le paysage concurrentiel, et en particulier la relation client et la chaîne de valeur. C est ainsi que des secteurs comme l assurance, la banque, la grande distribution, le crédit à la consommation, l industrie automobile, les «utilities», l énergie, et bien d autres encore risquent de voir leur positionnement dans la chaîne de valeur réduite progressivement au rôle de soustraitant «technique», avec une très forte pression sur les marges et un risque potentiellement létal pour les plus faibles.» La nouvelle France industrielle, Big Data Feuille de route, Paul HERMELIN (PDG de CapGemini) et François BOURDONCLE (Président de FB&Cie). 2 juillet 2014 JM Salaün Lyon 30-09-2015 4

Des «data-scientists» 1. Actions de nature à développer l écosystème Big Data en France Action 1 Formation de «data scientists»... p.6 Le consensus aujourd hui est de définir le data scientist à l intersection de trois domaines d expertise : (i) l informatique, (ii) les statistiques et les mathématiques, et (iii) les connaissances métier. p.7 La nouvelle France industrielle, Big Data Feuille de route, Paul HERMELIN (PDG de CapGemini) et François BOURDONCLE (Président de FB&Cie). 2 juillet 2014 JM Salaün Lyon 30-09-2015 5

Le «big data» Ce sont les petites miettes de données que vous laissez derrière vous quand vous vous déplacez sur terre. Ce que ces miettes racontent, c'est l'histoire de votre vie. Elles disent ce que vous avez choisi de faire. C'est très différent de ce que vous mettez sur Facebook. Ce que vous mettez sur Facebook, c'est ce que vous voudriez dire aux gens, rédigé selon les normes d'aujourd'hui. (...) Si je peux connaitre certains de vos comportements, je peux inférer le reste juste en vous comparant avec la foule de ceux qui vous ressemblent. ( ) Alex Pentland in Reinventing Society In The Wake Of Big Data. Edge, août 30, 2012. JM Salaün Lyon 30-09-2015 6

Deux oublis La compétence d organisation de l information dans les compétencesmétiers Les données ne sont pas que des traces JM Salaün Lyon 30-09-2015 7

Quelles connaissances métiers? Deux «connaissances métiers» confondues : Les domaines d application : banques, voyage, tourisme, ecommerce, publicité, transport, édition, automobile, etc. L architecture de l information : conception de systèmes d information pour les utilisateurs. JM Salaün Lyon 30-09-2015 8

Big, big, big... «La conception et la mise en œuvre d une infrastructure d intermédiation se fait selon l organisation de trois types de données différentes qui suivent des logiques particulières et se superposent : les données brutes ou primaires (big data), les métadonnées ou données d index (big index) et les données de profilage des utilisateurs (big user).» S. Frénot Big data : Wikipédia, bibliothèques, BDD publiques, open data... Big index : Google, Booking.com... Big users : Facebook, Linkedin, Uber... Les trois «big» nécessitent des infrastructures et compétences informatiques différentes. JM Salaün Lyon 30-09-2015 9

Prométhée et Hermès JM Salaün Lyon 30-09-2015 10

Prométhée enchaîné «Je suis prêt à sacrifier tout cela parce que je ne peux, en mon âme et conscience, laisser le gouvernement américain détruire la vie privée, la liberté d'internet et les libertés essentielles des gens du monde entier avec ce système énorme de surveillance qu'il est en train de bâtir secrètement» (2013) JM Salaün Lyon 30-09-2015 11

Revisiter les sciences de l information «Organiser, c est ouvrir des possibilités en imposant volontairement un ordre et une structure.» Robert J. Glushko Prix ASIS&T du livre de l année 2014 Nouvelle édition augmentée en 2015 JM Salaün Lyon 30-09-2015 12

Les trois moments de l organisation 1. Le stockage 2. La logique de l organisation 3. La présentation JM Salaün Lyon 30-09-2015 13

Dans le monde de l information Moments Moment 1 : Stockage Moment 2 : Logique d organisation Moment 3 : Présentation En bibliothèque Acquisition et rangement Catalogage et description Interrogation du catalogue et résultats Avec un moteur de recherche Crawling Indexation Liste de résultats (PageRank) JM Salaün Lyon 30-09-2015 14

Salle des catalogues bibliothèque du Congrès, début du 20 e siècle (big index) JM Salaün Lyon 30-09-2015 15

Centre de données de Google, début 21 e siècle (big index) JM Salaün Lyon 30-09-2015 16

Les cathédrales du savoir Boston Public Library Photo Père Ubu JM Salaün Lyon 30-09-2015 17

Les usines de lecture JM Salaün Lyon 30-09-2015 18

JM Salaün Lyon 30-09-2015 19

JM Salaün Lyon 30-09-2015 20

L exploitation du web de données Big data Big indexes JM Salaün Lyon 30-09-2015 21

L exploitation des traces 7 millions d utilisateurs HAL Big data Big users JM Salaün Lyon 30-09-2015 22

Du document à la donnée Transformation de notre relation au savoir 19 e -20 e : Document scientifique = article de revue et livre» Transmettre et prouver 21 e : ressources scientifiques Documents numériques (hyper-) (Web 1) ArXive, ScienceDirect Gallica, Europeana, Google-Book Néodocuments (Web 2 - traces) Blogues Wikipédia Réseaux sociaux Sites dynamiques, etc. Données (Web 3 open data)» Partager et coconstruire? JM Salaün Lyon 30-09-2015 23

Vers des architectes de l information L architecte de l informa0on a six compétences principales JM Salaün Lyon 30-09-2015 24