Analyse de données sociales Pablo Jensen IXXI, LP ENS Lyon financé par IXXI Mastodons MI CNRS collaboration avec médialab, Sciences Po (Paris) merci gephi.org!
IXXI : favoriser collaborations, émergence communautés recherche interdisciplinaire (info, maths, physique... bio, santé, SHS) Priorité : Révolution numérique, changement majeurs : données = pétrole du XXIème siècle. sociaux équilibre liberté individuelle / bien commun? Importance économique des systèmes d intermédiation, qui contrôlent les fux et ont l exclusivité sur les données secondaires? Pourquoi l Europe incapable de produire Google ou Facebook, alors que la Chine a su créer des systèmes qui rivalisent avec les géants américains?
Comprendre (prédire?) la localisation des commerces F Puech (LET) C Baume, B Gagnaire (Chambre Commerce) G Duranton (Toronto) J Fraîchard (INSEE) J Michel (ENS Lyon, Maths)
Déterminants de la localisation type de produit vendu surface du magasin (loyer) environnement commercial (effet Pimkie) caractéristiques de la clientèle locale accessibilité (voiture, transports en commun) marché spécifique (musique près Conservatoire) type de produit vendu (alimentaire ou non) date d'implantation, opportunité (angle), rue passante Trop compliqué pour un physicien!
Quantifying interactions between activities Basic idea : interactions between activities A and B can be deduced from relative locations of A and B stores. Spatial quantification adapted to the inhomogeneities of urban regions (no stores in parks, rivers...): Duranton (2005), Puech (2006) * * * * * * * *
Exemple : magasins de chaussures concentrés!
Exemple : boulangeries à Lyon Répulsion r < 150m
Quantifier la qualité d'un emplacement Philosophie : si autour de x,y amis de boulangerie et pas d'ennemis, alors bon emplacement pour boulangerie QA (x,y) = B ab A NB(x,y) Nb de magasins B voisins en x,y Q bon indicateur qualité?
Boulangerie Carte de Lyon indiquant (en rouge) les bons sites potentiels Point pour ouvrirchaud des boulangeries
Bon indicateur qualité? Nouvelles boulangeries : implantées sur les bons sites
Bon indicateur qualité? Faillites des boulangeries : plutôt localisées sur de mauvais emplacements
Aide à la décision Développement d'un logiciel avec la CCI et AID Observatoire Points forts : rapide, embrasse toute la ville Points faibles : bases données incomplètes, interprétation http://www.lyon.cci.fr/site/cms/33912/lokeo--un-outil-geomarketing-gratuit-d-a a-l-implantation-commerciale-?id=33912
Draw (and govern?) scientific institutions through scientometrics How to draw an institution on a sheet of paper? Web of Science search on address Several global maps Less reductionist than indicators (as h) Distinction between reliable knowledge on metrics (formally robust indicators) and socially robust knowledge on metrics use (deliberation between stakeholders) Not so big data, big / relevant? dessine-moi l'ens...
Matériau de départ : articles (Web of Science, peu SHS) + traitements pour extraire masse infos Communautés thématiques (> 10 000 articles) Domaine de recherche : systèmes complexes France entière, 2007-2010 Réseaux hétérogènes détaillés (< 10 000 articles) Recherches en cours : Indicateurs topologiques des rôles des noeuds, interdisciplinarité dynamique
Bibliographic coupling
L is the total number of links ls links inside module s, ds total degree of nodes in module s.
Structure de la recherche en France (320 000 articles publiés 2007-2010)
Exemple : complex networks (482 article Subject (JSC) Computer Science Engineering Physics, Math Telecomm Physics, Multidisc Information Systems Mathematics Biology Infectious Disease Public Health Business Sociology % 24 12 11 9 9 7 7 3 2 2 1 1 Integration très forte 3ème, après Économétrie/énergie (160 art) Management (1100 art)
ENS de Lyon Gephi.org
Institut pluridisciplinaire Hubert Curien s Créé en 2006, l'iphc est un exemple de réussite de la pluridisciplinarité : trois laboratoires de culture scientifique différente (physique subatomique, chimie et eco-physiologie) regroupés en un institut unique. Unité scientifique ou administrative?
Discussion What knowledge generated from these studies? Compare to usual social sciences, Actor-Network theory :-( Useful for : scientists in the labs? CNRS/Labex (imust)/idex (Grenoble) policy? Help centers or individuals (both?) Big data = global vision from the center, already in 19th century, birth of strong States Favor refexivity!
La recherche en France (2010) Web of Science, 70 000 articles Noeud = article Lien = co-référence Groupes : modularité