Colloques d'épidémiologie clinique et biostatistique HUG 8 mars 2011 Gil Viry Introduction à la méthode d'analyse des réseaux sociaux FACULTÉ DES SCIENCES ÉCONOMIQUES ET SOCIALES
Plan du cours 1. Les principes de l'analyse des réseaux sociaux 2. Les données réseaux 3. Quelques concepts fondamentaux 4. Entre analyse exploratoire et test d'hypothèses 5. Discussion 2
La perspective réseau La perspective réseau se centre sur les relations entre acteurs davantage que sur leurs attributs. Le but principal de l analyse des réseaux sociaux est de détecter et interpréter le profil (ou la structure) des liens sociaux parmi les acteurs. 3
Réseau d'amitié parmi les étudiants d'un collège genevois
Réseau de soutien scolaire parmi les étudiants d'un collège genevois
Réseau d'activités extra scolaire parmi les étudiants d'un collège genevois
La perspective réseau Interpréter la structure des liens sociaux parmi les acteurs... au niveau du réseau, ex: observe t on une petite élite très connectée et une masse de personnes faiblement connectées? au niveau individuel, ex: les femmes sont elles plus centrales dans le réseau que les hommes, plus marginalisés? 7
La perspective réseau Dans un 2 e temps, on peut explorer les liens entre ce profil relationnel et d'autres variables d'intérêt. Au niveau du réseau, ex: un réseau peu connecté est il davantage en conflit? Au niveau individuel, ex: un individu connecté a t il un plus haut niveau de bien être qu'un individu marginal ds le réseau? 8
Elisabeth Bott et les réseaux conjugaux Bott, E. (1957). Family and Social Networks. London, Tavistock.
L approche des réseaux peut être appliquée à un nombre illimité d objets
Types de relations entre des acteurs Basées sur des rôles Mère de, femme de Chef de, enseignant de Amis de Cognitives ou perceptuelles Soutien Conflit Influence affective Aime, a confiance en d interactions Voit régulièrement, donne conseil, parle à, se dispute avec A des relations sexuelles avec, font des sorties ensemble D affiliations Appartient à une même organisation
Avantages de la perspective réseau Se centrer sur les relations mesurées empiriquement plutôt que des catégories à priori. Se centrer sur la structure globale et non les relations prises une à une. Aucun postulat sur l'indépendance des observations. Les configurations relationnelles sont en grande partie opaques et complexes, mais obéissent à des règles, formelles ou informelles. L'analyse réseau permet de révèler ces règles empiriquement.
Map of scientific collaborations from 2005 to 2009 Computed by O. Beauchesne, Science-Metrix, Inc. http://flowingdata.com/2011/01/27/map-of-scientific-collaboration-between-researchers/
Map of scientific collaborations from 2005 to 2009 Computed by O. Beauchesne, Science-Metrix, Inc. http://flowingdata.com/2011/01/27/map-of-scientific-collaboration-between-researchers/
Désavantages de la perspective réseau Analyses essentiellement exploratoires, statistique inférentielle complexe Difficultés dans la récolte des données (frontières du réseau, temps de passation lors d'entretiens, confidentialité) Très grande sensibilité aux données manquantes
Plan du cours 1. Les principes de l'analyse des réseaux sociaux 2. Les données réseaux 3. Quelques concepts fondamentaux 4. Entre analyse exploratoire et test d'hypothèses 5. Discussion 17
Données réseau Style de recherche Sources Type de données Type d'analyse Enquêtes Recherche ethnographique Recherche documentaire Questionnaires, entretiens Observations Textes Attributs Relationnelles Analyse de variable Analyse réseau 18
Données réseau A a une relation avec B, B avec C, etc. Acteur Sexe Age A 1 28 B 0 35 C 1 24 D 0 27 Acteurs par attribut A B C D A - X X X B X - X C X X - D X - Acteur par acteur 19
Données réseau Nombre Binaire Signé Valué + 3 Non dirigé + + - 7 2-6 Direction + + 5 9 Dirigé + + 7 4 + - 2-6 20
Données réseau Réseau complet Réseau ego centré Réseau 1 mode Réseau 2 mode (réseau d'affiliation) 21
Plan du cours 1. Les principes de l'analyse des réseaux sociaux 2. Les données réseaux 3. Quelques concepts fondamentaux 4. Entre analyse exploratoire et test d'hypothèses 5. Discussion 27
La densité d'un réseau EGO EGO densité = 18/36 = 0.5 = 50% densité = 11/36 = 0.3 = 30% 28
Les liens forts nous limite à interagir avec des individus ayant les mêmes caractéristiques, les mêmes informations, les mêmes ressources que nous Levy, Joye, Guye, Kaufmann (1997). Tous égaux?
La force des liens faibles (Burt, 1995)
La centralité des acteurs et la centralisation d'un réseau centralisation de degré = 64% 31
La centralité des acteurs et la centralisation d'un réseau centralisation = 100% centralisation = 0 32
Les sous groups cohésifs d'un réseau Un sous-groupe cohésif = ensemble d'individus du réseau caractérisés par de nombreux liens entre eux et de rares liens avec des individus extérieurs à l'ensemble. 33
Plan du cours 1. Les principes de l'analyse des réseaux sociaux 2. Les données réseaux 3. Quelques concepts fondamentaux 4. Entre analyse exploratoire et test d'hypothèses 5. Discussion 34
Tests d'hypothèse Exemples d'hypothèses: La densité du réseau de soutien est elle significativement supérieure à celle du réseau de conflit pour les mêmes acteurs? (niveau réseau) Est ce que la probabilité qu'il existe un lien de conflit entre deux individus d'un réseau diminue, sachant qu'il existe un lien de soutien entre eux? (niveau dyade) Est ce que la probabilité qu'il existe un lien d'amitié entre deux individus d'un réseau augmente, sachant qu'ils sont de même niveau de formation? (niveau individuel dyade) Est ce que le niveau de formation d'un individu influence sa centralité dans le réseau? (niveau individuel) 35
Principe des tests d'hypothèse en analyse réseau Générer aléatoirement des milliers de réseau aléatoires conservant la structure de base du réseau initial (taille, densité comparables) Calculer la proportion de réseaux aléatoires où la statistique étudiée (moyenne, différence de moyenne, corrélation, centralité, etc.) est aussi grande que dans le réseau réellement observé (p valeur du test) Si cette proportion est suffisamment petite (moins de 5% des cas), résultat observé dans le réseau réel n'est pas due au hasard mais est statistiquement significatif. 36
Corrélation entre un réseau réel et un réseau théorique Hypothèse: le soutien a une plus grande probabilité de s'exercer entre les personnes ayant des liens de sang dans les familles recomposées. réseau réel réseau théorique
Quelques logiciels d'analyse réseaux Ucinet: facile d'utilisation, nombreuses mesures réseaux Pajek: logiciel libre, adapté pour les très grands réseaux (plus de 1000 individus), nombreuses options de visualisation graphique (3D, etc.) R (modules: statnet, sna, igraph): permet le calcul d'indicateurs réseaux sur un grand nombre de réseaux Autres logiciels courants: GRADAP, Structure. 39