8Formulaire du projet EQUIPEX de l'uapv «H(ST) 2» Homme, Sciences, Toile, Sociétés,Technologies : des réseaux de réseaux Responsables : Didier Josselin & Marc El-Beze MODE D'EMPLOI Le projet Equipex (Équipement d'excellence) H(ST) 2 préfigure le montage du projet Structure Fédérative de Recherche «Sciences du Web» et Labex (laboratoires d'excellence) de l'uapv. Le processus est simple : Equipex est le support d'équipements mi-lourds partagé (y compris personnels le gérant) [date de dépôt : 15 septembre 2010] SFR est un projet de recherche fédérant les laboratoires de l'uapv [date de dépôt : 15 octobre 2010] ces deux projets (Equipex & SFR) serviront de base monter le dossier de demande de la création d'un laboratoire d'excellence (Labex) Afin de construire ensemble ces projets, et, pour commencer, Equipex, nous vous demandons de remplir les rubriques suivantes concernant votre thématique. Une thématique peut être un projet ou un ensemble cohérent de projets du même domaine. Merci de remplir ces rubriques pour le vendredi 23 Juillet dernier délai et SI POSSIBLE, pour le 16 Juillet ATTENTION! tous les projets doivent avoir une dimension TIC, sinon ils ne peuvent s'inscrire dans ces projets fédérateurs. Il est également préférable qu'ils soient pluri/interdisciplinaires. Nom de votre thématique Réseaux culturels et sociaux Analyse et modélisation des réseaux sociaux et culturels du WEB : aspects culturels, sociologiques et structurels du développement des réseaux sociaux sur la toile. Modélisation mathématique, informatique, analyse des usages. Résumé descriptif Résumez en ½ page grand maximum votre thématique, les verrous à ouvrir (en quoi est-il difficile d apporter une solution à ce problème), les enjeux identifiés en termes théoriques et/ou applicatifs... Les réseaux sociaux se sont fortement développés ces dernières années sur le WEB. Cet axe se concentre sur l'extraction des contenus et la modélisation des structures à la fois en termes de circulation de l'information et des contenus eux-mêmes. Une modélisation des aspects statiques et dynamiques de ces deux dimensions devrait permettre de concevoir des méthodes de recherche d'information efficaces, qui tiennent compte à la fois de la nature de l'information échangée et de la façon dont elle circule. Au delà des critères habituels exploités en recherche d'informations (motsclés, hyperliens...) de nouveaux critères devront être proposés et validés. Ceux-ci s'appuieront notamment sur une analyse sociologique des usages renforçant l'interdisciplinarité du projet. Nous proposons d'aborder ces questions dans deux contextes complémentaires, orientés
respectivement vers les analystes et les usagers des réseaux: outils d'analyse : les réseaux sociaux sont généralement analysés d'un point de vue sociologique et culturel. Leur taille, leur évolution permanente et la complexité des structures sous-jacentes rendent cette analyse très difficile à mener à l'échelle du WEB. L'objectif de cet axe est de concevoir les modèles mathématiques et informatiques susceptibles d'analyser les contenus, d'extraire les structures des réseaux en vue de fournir, aux analystes, des vues intelligibles de leur forme, de leurs évolutions à la fois en termes d'organisation, de contenus et d'usages. structuration des réseaux : les réseaux sociaux sont généralement basés sur l'échange d'informations issues des utilisateurs eux-mêmes. Ce mode auto-génératif permet d'augmenter le volume des contenus, mais l'ensemble est souvent mal structuré. Néanmoins, le graphe des relations entre utilisateurs ou entre les documents eux-même porte une information structurelle qui peut être analysée et utilisée dans des applications concrètes. Par ailleurs, l analyse des réseaux sociaux pose des problèmes difficiles, comme la modélisation des interactions "sociales", la fouille de données structurées (graphes, textes, données hétérogènes) et la prise en compte de l évolution temporelle des réseaux. De plus, les applications génèrent souvent des volumes de données très importants, avec des graphes comptant plusieurs dizaines de millions de nœuds, ce qui pose de sérieuses restrictions sur les algorithmes utilisables. <N'hesitez pas à faire des propositions sur ces deux axes!> Rationalité, problématique, contexte sociétal Dites en quoi votre thématique est intéressante, ce qu'elle pose comme questions, comment elle se positionne dans la Société, en soulignant son caractère innovant, l'attrait de la considérer sous un regard croisé (pluri ou inter disciplinaires), etc. (1 page max) Les réseaux sociaux commencent à prendre des dimensions importantes dans nos sociétés. Une enquête IFOP, réalisée en 2008, permet de prendre la mesure de la notoriété de ce phénomène : 78% de la population française déclaraient connaître un des sites listés (Facebook, MySpace, Friendster, Seesmic, LinkedIn, Viadeo & Twitter). Ce développement s'accompagne d'un changement profond dans la façon dont la connaissance est partagée par les utilisateurs de l'internet, avec l'émergence d'une intelligence collective considérée comme plus efficace et plus objective que celle issue des relations pair à pair. La modification du rapport de l'usager au WEB et aux communautés avec lesquelles il est en relation, le changement d'échelle associé, peuvent changer la façon dont l'information est structurée et cherchée dans l Internet. En effet, les techniques classiques de recherche d'information se basent sur l'analyse des contenus, sans faire d'hypothèse forte sur le profil des utilisateurs. C'est un point de vue pertinent dans le cadre très ouvert des moteurs de recherche généralistes, mais qui pourrait être reconsidéré dans le cas de réseaux sociaux qui regroupent des utilisateurs partageant, par affinités culturelles ou professionnelles, des ressources qualifiées et classifiées. Ces caractéristiques communes devraient être exploitées par des outils de recherche spécifiques, qui reposeraient sur des mémoires de recherche et/ou des analogies de profils utilisateurs plutôt que par une seule analyse des contenus. Le couplage des réseaux sociaux et de l'accès personnalisé à l'information suscite un intérêt croissant dans la communauté scientifique et chez les industriels du domaine. Google, le moteur de recherche, vient de lancer le service Google Buzz adossé au webmail Gmail. Il a créé une alliance avec d autres réseaux sociaux et acteurs majeurs du secteur tels que : MySpace, Yahoo, Hi5, Viadeo et Orkut entre autres. Google a également orienté son moteur vers la recherche sociale.
Dans ce thème, nous aborderons cette problématique d'un point de vue plus général, en confrontant et en combinant des vues complémentaires sur les réseaux sociaux, issues de l'analyse des usages et des usagers, d'une modélisation des contenus et de leur structure. La question majeure que nous voulons aborder est celle des liens entre ces vues : en quoi les structure logique d'un réseau permet d'expliquer ou de prédire le comportement des agents, et inversement, comment la connaissance des ces agents et des contenus permet de modéliser les réseaux. Par ailleurs, la modélisation des réseaux eux-mêmes constitue un défi scientifique, qui peut être abordé par analogie réseaux-sociaux/réseaux informatiques avec la question fondamentale du paradigme de modélisation (modèles graphiques, processus stochastiques, modèles évolutionnistes, etc..). En particulier, capturer la dynamique des réseaux présente un certain nombre de difficultés majeures, liées à la multiplicité et la diversité des facteurs qui contribuent à leur développement (facteurs humains individuels ou collectifs, liens et compétition des réseaux entre eux, styles éditoriaux et tonalité des réseaux. Enfin, l'analyse des contenus ouvre des perspectives scientifiques et applicatives intéressantes : quelles opinions sont exprimées, avec quel niveau d'objectivité, par quels circuits, etc. Alors que la modélisation de la structure organisationnelle des réseaux a fait l'objet de nombreuses études ces dernières années, l'analyse des contenus c'est plutot concentrée sur les problèmes de recherche d'information ou de catégorisation. Ces sujets pourront être développés en lien avec le thème «Neutralité de l'internet», qui fait partie de la proposition de l'uapv dans cet appel. Nous allons aborder la neutralité de l internet d'un point de vue technologique particulièrement pour les moteurs de recherche. Comment être certain de la neutralité des réponses des réponses à une requête sans pouvoir vérifier les sources de l'algorithme de recherche? Les regards se tournent évidemment vers Google, leader incontesté de la recherche web. État de l'art Situez cette thématique dans le contexte international scientifique, placer les travaux des équipes impliquées dans ce contexte, en soulignant leur apport peut être décisif en raison des compétences acquises dans le passé ; préciser en quoi votre projet et vos équipes sont leaders et incontournables au niveau national voire international (1 page max) L'analyse des réseaux sociaux s'est développé en parallèle dans les communautés scientifiques en informatique et en sociologie. En informatique, l'essentiel de l'effort a porté sur la modélisation à grande l'échelle des réseaux et de leur dynamique, avec des représentations en graphes modélisant l'infrastructure des relations entre les agents, qu'elle que soit la nature de ces relations ([4,[5]). D'une façon générale, la contribution des informaticiens a consisté à produire des modèles et à extraire des indicateurs suceptibles d'être interprétés par les analystes du Web. Les sciences sociales ont manifesté un intérêt croissant pour les réseaux sociaux ces dernières années, en particulier pour l'étude des relations entre acteurs plutôt que sur l'étude des comportements individuels de ces acteurs, qu'il s'agisse d'individus ou d'organisations. De ce point de vue, les graphes de relations dans le réseaux sont vus comme des objets d'analyse, qui servent à l'étude des acteurs dans leur tissus social ou de l'organisation sociale induite ou traduite dans le réseau ([1,2,3]. De façon générale, les réseaux peuvent être considérés sur 3 dimensions qui sont plus ou moins imbriquées : l'infrastructure, les usages et les contenus. Alors que les deux premières ont fait l'objet de nombreuses études, l'analyse des contenus c'est essentiellement développée dans le domaine des la recherche d'information ou de la catégorisation de texte. Dans ce thème, notre projet est d'étudier et des croiser ces différentes vues sur les résaux sociaux, en tirant parti de la diversité et de la complémentarité des compétences du consortium. Le LIA a une
activité reconnue dans les domaine des réseaux informatiques, en recherche opérationnelle et en traitement de la langue naturelle. Cette triple compétence et la reconnaissance internationale du laboratoire sur chacune de ces thématiques permettrait de conjuguer les approches structurelles et celles basées sur l'analyse des contenus (LIA). <présenter culture & com> [1] W. Barry and S.D. Berkowitz, eds., 1988. Social Structures: A Network Approach. Cambridge: Cambridge University Press. [2] L. Freeman, The Development of Social Network Analysis. Vancouver: Empirical Press, 2006. [3] A. Degenne, M. Forsé Les réseaux sociaux, Armand Colin, 1994-2 e édition (1 3 2004), 295 p. [4] S. Wasserman, K. Faust, Social network analysis. Methods and applications, Cambridge University Press, 1994, 857 p. [5] Kathleen M. Carley, 2003, Dynamic Network Analysis in Dynamic Social Network Modeling and Analysis: Workshop Summary and Papers, Ronald Breiger, Kathleen Carley, and Philippa Pattison, (Eds.) Committee on Human Factors, National Research Council, National Research Council. Pp. 133 145, Washington, DC. Objectifs et attendus Précisez les objectifs et les retombées potentiellement visées : économiques, sociales, technologiques, etc. (1 page max) Cette thématique de recherche devra proposer des méthodes et des outils d'analyse et de simulation des réseaux sociaux. Elle sera déclinée en différents projets qui se focaliseront sur des aspects complémentaires (en mobilité, exploitation des analogies entre infrastructures réseaux et relations entre usagers, analyse des facteurs d'audience et prédiction des Buzz, etc...). Les retombées attendues sont les suivantes : -une meilleure compréhension des mécanismes qui gouvernent les réseaux sociaux. -le développement d'outils méthodologiques et logiciels pour l'analyse des réseaux -amélioration de l'accès à l'information par la conception de moteurs de recherche basés à la fois sur l'analyse des contenus, des usages et des structures sous-jacentes. Communication et valorisation Sous quelle forme comptez-vous valoriser les résultats de votre thématique : publications scientifiques de haut niveau, outils d'aide à la décision pour des collectivités, technologies novatrices, démonstrateurs et simulateurs en ligne, etc.? (1 page max) Le croisement des cultures scientifiques et des approches complémentaires de l'objet d'étude devrait permettre de proposer un point de vue original sur les questions traitées. Plus concrètement, nous envisageons de développer un certain nombre de plateformes expérimentales. Une des plateformes, sera utilisée pour le festival d Avignon. En effet, l Université d Avignon est très impliquée dans le festival d Avignon et d autres festivals dans la région. Le laboratoire Culture et Communication (UAPV) a mené des enquêtes depuis plus de 15 ans sur les festivals d Avignon, de Cannes puis, plus récemment des Vieilles Charrues, des Transmusicales de Rennes, ou des Lumières à Lyon. En parallèle, le laboratoire d'informatique d Avignon participe activement à un projet dont l'objectif est de développer un réseau social pour le festival d Avignon. Nous souhaitons créer une communauté dédiée à la création et à la diffusion des événements culturels. Deux objectifs principaux : d une part, profiter du développement en cours d une plateforme logicielle au sein du LIA (Univ. Avignon) de type «réseau social» pour la décliner en version dédiée à la création et à la diffusion d événements culturels. La réussite de ce réseau pourra avoir un impact majeur sur l application que nous souhaitons développer dans les années à venir. Cette application, appelé MediaFaun, permettra une communication de masse pendant des événements médiatiques et culturels. Nous envisageons de
mettre en place cet outil notamment durant le Festival d'avignon. Cet outil offrira un moyen de diffuser rapidement des informations multimédia à travers une grande population et sur une zone géographique importante en utilisant le réseau DTN (Delay Tolerant Networks). Cette technologie est très prometteuse pour la communication dans des conditions "extrêmes" comme les réseaux interplanétaires, ainsi que pour le développement de nombreuses applications telles que les réseaux de piétons et les autoroutes intelligentes. Cette application offrira donc un fort potentiel pour faire, par exemple, de la publicité pour des spectacles ou d autres événements culturels de ce type pourvu qu un nombre important de personnes, utilisant ou possédant un téléphone portable, se croisent sans arrêt dans une zone bien définie. La nature hybride de l'architecture permettra à l'outil MobilFaun de s'interfacer avec le réseau social culturel, qui sera développé dans ce projet, afin de d accélérer la diffusion de l information à travers l Internet. Cette application nous permettra d archiver les traces des utilisations d'un site très fréquenté, qui pourra les analyser et exhiber les résultats scientifiques du projet. Une seconde plateforme se consacrée à l'analyse et la prédiction des buzz sur l'internet. Un buzz est la «sonorisation» sur le Web d'un événement qui suscite massivement des réactions de la part des usagers. Contrairement à la plupart des médias institutionnels comme la presse écrite ou la télévision, le Web est très peu structuré, peu contrôlé, et on ne dispose pas d'outils efficaces pour évaluer a priori l'impact médiatique d'un événement. Les enjeux liés à l'analyse et à la prédiction des buzz sont importants, le modèle économique du Web étant majoritairement basé sur la publicité et lié, de façon directe ou indirecte, à la fréquentation des sites. En observant l importance qu accordent déjà les journalistes et les politiques à ces phénomènes, on pressent à quel point des pans encore plus larges des domaines socio-économiques seront concernés dans le futur. La plateforme devra offrir des outils d'analyse, de modélisation et de prédiction des buzz, et permettre de mettre en relation les aspects culturels, sociologiques et structurels du phénomène. En particulier, elle proposera des outils d'identification des indices caractéristiques du vacarme médiatique, de visualisation des canaux d'information empruntés, de caractérisation des concepts potentiellement générateur de buzz et d'évaluation dynamique du risque de buzz lié à ces concepts et à leur contexte d'apparition. Ressources nécessaires Identifier ici vos besoins par rapport à Equipex : stockage d'informations volumineuses (bases de données, cartes, documents scannés, etc.) types d'accès nécessaire (accès aux ressources en ligne, sécurité, etc.) ressources en temps et puissance de calcul ressources logicielles particulières (utilisation de programmes distants spécifiques exécutés en ligne) possibilité d'échanges intensifs d'informations, ressources humaines spécifiques (hormis maintenance du matériel et de son accès) etc. L'analyse des contenus, notamment des contenus multimédia, requiert des ressources matérielles conséquentes pour l'archivage et le traitement des données expérimentales. L application MediaFaun sera développée pour des téléphones portables. Elle sera testée pendant le festival d Avignon. Budget éventuel Si vous avez déjà des éléments de budget : les insérer ici Espace de stockage 35T 1 serveur 1 x 30 k = 30 k Serveurs de calcul 5 seveurs de calcul 5*6ke = 30k Smart Phone (pour le Festival d Avignon) 50 x 0,4k = 20k Points d accès ou collecteurs 20 points d Acces *0,5ke = 10k Total l = 90ke
Laboratoires partenaires Listez les équipes impliquées, avec leur degré d'implication et les disciplines concernées Vous pouvez aussi identifier les équipes potentielles ou à contacter Wikio Équipe Localisation Statut* Projet Discipline Nbre personn es Temps total annuel approx LIA UAPV Port. RS Informatique 5 12 mois / homme Culture& Com UAPV Int. RS Culture et Com Personne contact R. El-Azouzi ou G. Linarès 3 V. Spies Wikio Paris contactée RS B. Peralta XeRoX Research Center?? (à confirmer) INRIA Sophia Antipolis DR RS Informatique et Mathématiqu es 2 E. Altman et K. Avrachenkov?? Labo Erci Labo Eric * porteuse, déjà intégrée au projet, contactée et en attente de réponse, équipe potentielle à contacter Liste des personnes actives sur ce projet Recensez les personnes participant à cette thématique en mentionnant leur équipe d'appartenance Georges Linares (LIA/UAPV) Rachid El-Azouzi (LIA/UAPV) B. Peralta (Wikio) V. Spies (Culture et Com/UAPV) Eitan Altman (INRIA) Marc El-Bèze (LIA/UAPV) Patrice Bellot (LIA/UAPV) San-Juan Eric (LIA/UAPV) Fabrice Lefevre (LIA/UAPV) Konstantin Avrachenkov (LIA/UAPV)?? Listes des projets connexes (lien avec SFR) Si vous entrevoyez la possibilité de mutualiser ces ressources avec d'autres projets pouvez-vous nous en donner des indications précises : en quoi le fait de développer votre projet dans un cadre fédératif est plus intéressant que de le faire isolément? Axes fédératifs (lien avec SFR) Selon vous, votre thématique s'insère dans le(s)quel(s) de ces 4 axes de la SFR et pourquoi? Développer l'argumentaire par votre propre compréhension des termes proposés ; votre thématique peut concerner plusieurs axes Ce projet s insère dans les deux axes : Sciences Fondamentales du Web et Technologies et usages du Net.