Voisinage et intrication dans les réseaux multiplexes
|
|
|
- Francis Vinet
- il y a 10 ans
- Total affichages :
Transcription
1 0 RMPD. Volume No. /2014 Voisinage et intrication dans les réseaux multiplexes Benjamin Renoust 1 Institut National de l Audiovisuel, Paris, France JFLI CNRS UMI 3527 & National Institute of Informatics, Tokyo, Japan LaBRI CNRS UMR 5800, Bordeaux, France [email protected] ABSTRACT. L intérêt du modèle de réseau complexe pour capturer la réalité des interactions sur les données de terrain n est plus à démontrer. De ces réseaux, nous dérivons souvent des modèles de réseaux bipartis, par association de nœuds et de communautés, ou de manière plus naturelle lorsque plusieurs familles d entités se croisent. Cependant, certaines données de terrains s adaptent mal au modèle biparti, qui ne traduit que le cas de l homophilie entre nœuds d une même partition. C est par exemple le cas du réseau de co-auteurs académiques dont on aura enrichi les interactions par des mots-clefs. Dans ce cas de figure, une autre approche, pour le moment peu exploitée, permet de capturer plus finement les interactions entre entités: ce sont les réseaux multiplexes, qui présentent plusieurs couches d interactions entre les mêmes entités. Les réseaux multiplexes concernent l union de plusieurs familles d interactions entre entités, ne se limitant pas au modèle biparti. Ce papier ainsi présente une étude préliminaire qui questionne la notion de voisinage dans les réseaux multiplexes et étend l approche globale de l intrication d arêtes (Renoust et al., 2013), avec deux mesures permettant la caractérisation des nœuds dans leur réseau. KEYWORDS: réseaux multiplexes, analyse d intrication, voisinage DOI: /RMPD..0 7 c 2014 Lavoisier 1. Introduction L analyse et l exploration d un réseau social dépend du type de relations en jeu. (Borgatti et al., 2009) ont proposé une taxonomie de ces relations en quatre différentes catégories: l homophilie (ou similarité), la relation sociale, l interaction directe, et le flux. Lorsque l on observe un réseau social, nous capturons souvent la superposition de plusieurs de ces types de relations, et notre étude se place sur un seul point de vue en particulier. Si l on prend l exemple du réseau de co-auteurs de publications scientifiques caractérisées par des mots-clefs, il est intéressant d étudier la similarité entre co-auteurs
2 Voisinage et intrication dans les réseaux multiplexes 1 au travers des mots-clefs de leurs publications. Nous pouvons donc associer les auteurs à leur mots-clefs, et capturer cette association au travers d un réseau biparti auteurs mots-clefs. Avec ce modèle, il y a souvent un jeu de nœuds qui est considéré comme primaire et responsable de la formation de liens (Opsahl, 2013), c està-dire que lorsque l on analyse le projeté du biparti sur un réseau à un seule mode, l autre jeu de nœuds (lui secondaire) pourra être considéré comme caractérisant les liens dans ce réseau. Si on analyse le projeté de ce réseau sur les auteurs (primaires), il rapproche immanquablement des auteurs ayant publié sur les mêmes thématiques (secondaires), sans qu ils aient pour autant co-publié. Le modèle de réseau multiplexe permet d éviter cette erreur en démultipliant la relation de co-publication grâce aux mots-clefs de ces mêmes co-publications, et chaque mot clef représentera une famille de liens dans le réseau. Ainsi si le réseau de co-auteurs se définit par G = (V, E), avec V les auteurs, et E la relation de co-publication, le réseau multiplexe de co-auteurs est définit par: G = (V, n t=1e t ), avec toujours V les auteurs, mais E t la relation de co-publication avec le mot-clef t. Peu d approches ont pour le moment été proposées pour étudier ce type d objets (Bródka, Kazienko, 2012), tout particulièrement concernant la position d un nœud dans son réseau multiplexe. Il convient malgré tout de rapporter d intéressants travaux qui se placent dans la même philosophie, telle que la prédiction de lien dans les réseaux multiplexes (Pujari, Kanawati, 2013). Aussi, beaucoup d approches considèrent une version aggrégée du réseau multiplexe, comme un graphe pour lequel on ne différenie aucune couche d arête et dont on étudie la topologie (Zhou et al., 2007 ; Borgatti, 2012), et il a été montré que ces graphes ont alors le défaut de contenir beaucoup de cliques (Guillaume, Latapy, 2005). Ainsi certaines méthodes se sont intéressées au filtrage d arêtes. C est le cas pour (Nick et al., 2013) qui recherchent la colonne vertébrale simmélienne dans la projection d un réseau à deux modes, mais aussi pour (Neal, 2013) qui lui filtre les arêtes en fonction de leurs propriétés statistiques. Les travaux de (De Domenico et al., 2013) cherchent à apporter une formulation mathématique sur la base des tenseurs qui permet d englober la définition de chaque famille de réseau comprenant plusieurs couches, sans pour le moment appuyer l analyse de ces réseaux. La combinaison topologie et attributs a été aussi au centre de récents travaux comme (Rossi, Villa-Vialaneix, 2012 ; Cruz et al., 2011), avec un point de vue souvent exclusivement centré sur les nœuds. Cependant, quelques mesures concernent particulièrement les réseaux multiplexes, bien que parfois se référant à un graphe biparti. On notera par exemple la multiplexité (Podolny, Baron, 1997) qui fait référence au nombre d arêtes parallèles. Se posant des questions similaires à celles de notre approche, la redondance (Latapy et al., 2008) est une mesure du recouvrement de voisinage d un nœud dans un graphe biparti. L exposition au réseau (Fujimoto et al., 2011) d un évènement mesure l influence son influence dans le projeté du modèle acteur-évènement sur un modèle acteur-acteur. L analyse d intrication (Renoust et al., 2013) mesure l entremêlement des couches d arêtes dans un réseau multiplexe, couche par couche, ainsi que de manière globale au réseau. C est sur la base de cette dernière analyse que nous proposons d exploiter un indice pour les nœuds d un réseau multiplexe.
3 2 RMPD. Volume No. /2014 L établissement de mesures caractérisant la place d un nœud dans un réseau multiplexe est primordiale. Elles permettent d identifier des individus saillants de par leur position dans le réseau multiplexe, mais surtout elles peuvent être un appui certain pour la réalisation d algorithmes de partitionnement propres au réseaux multiplexes (Kanawati, 2013). Ainsi de recents travaux tels que ceux de (Battiston et al., 2013) présentent une première érude sur lot de mesures intéressée par la relation entre les nœdus et les couches auxquelles ceux-ci participent. Après un bref rappel du concept d intrication d arêtes dans un réseau multiplexe, nous introduirons le questionnement de la position d un nœud dans son voisinage, et présenterons l intrication d un nœud que nous appliquerons sur des données tirées des documents de l INA. Enfin, nous discuterons ces résultats avant de conclure. 2. L intrication dans les réseaux multiplexes Nous avons présenté le concept d intrication dans (Renoust et al., 2013). Celuici se place dans le cas d un réseau multiplexe où chaque couche représente une famille d arêtes: G = (V, n t=1e t ). Le concept d intrication cherche à mesurer combien et comment les familles d arêtes s entremêlent dans un réseau multiplexe. Grâce à l analyse des co-occurrences de familles d arêtes, nous pouvons réduire le problème de l analyse d un réseau multiplexe (gourmand par la combinatoire que celui-ci introduit) à l analyse coordonnée de deux réseaux séparés: le réseau d interaction des nœuds (c est-à-dire la version aplatie du réseau multiplexe) et le réseau d interaction des familles d arêtes. Dans ce second réseau, une famille représente un nœud, et deux nœuds sont liés lorsqu au moins deux familles d arêtes co-occurrent entre eux. L analyse de ces objets va au delà des approches classiques considérant des poids sur des arêtes multiples comme le montre la figure 1. FIGURE 1. Ces exemples soulignent les nuances que prend en compte l analyse d intrication dans les réseaux multiplexes. Les deux réseaux multiplexes (à gauche) se projettent sous la même forme de clique-5, et si l on assigne des poids aux arêtes correspondant au nombre de familles d arêtes (en couleur) les liant, les deux réseaux serait exactement les mêmes. C est la forme de l interaction de ces familles d arêtes (à droite) qui permet de différencier ces deux cas.
4 Voisinage et intrication dans les réseaux multiplexes 3 L analyse d intrication nous permet ainsi de dégager un indice d intrication g s qui permet de mesurer l influence d un couche d arête s dans l entremêlement avec les autres couches. Le calcul du vecteur d indices d intrication (g s λ = s c s,s γ s) nécéssite l analyse algébrique d une matrice d intrication C, à partir de laquelle, nous pouvons évaluer deux autres mesures propres au réseau dans son ensemble: l intensité d intrication I(G) = λ C C, et l homogénéité d intrication H(G) = 1 C,γ 1 C γ. La matrice C et les différentes mesures sont introduites et formalisées dans (Renoust et al., 2013). L intensité d intrication mesure la quantité d intrication relative à un maximum théorique, c est-à-dire relative au cas où toutes les arêtes du réseau sont saturées par toutes les différentes familles présentes dans le réseau. L homogénéité d intrication mesure la répartition de cette intrication, c est-à-dire relative à un cas optimal où chaque famille d arête apporte autant à l intrication globale du groupe. Il est à noter que cette analyse ne concerne pas la topologie du réseau multiplexe aggrégé en lui-même, mais se concentre sur la co-occurrence des familles d arêtes. C est pour cela que nous avons combiné les deux réseaux (celui aggrégé et celui des familles) afin de permettre la compréhension de la structure du réseau multiplexe. Enfin, à travers divers exemples, nous avons démontré le lien entre les mesures d intensité et d homogénéité d intrication et la notion interprétative de cohésion d un ensemble d entités dans un réseau. C est inspiré par cette notion de cohésion que nous voulons questionner la place d un nœud dans son voisinage, en nous basant sur les mesure d intrication. 3. Le voisinage d un nœud dans un réseau multiplexe Nous devons considérer un certain nombre de faits avant de se lancer dans une quelconque mesure. Tout d abord, est-ce que ce sous-graphe ego-centré nécessite l inclusion d arêtes entre les voisins de u? Autrement dit, devons-nous considérer le sousgraphe induit (ici noté N G (u))? ou bien devons-nous considérer seulement les arêtes adjacentes à u (ici noté E G (u))? Cette différence, illustrée par la figure 2 dépend de la question que nous nous posons. Si l on veut questionner la légitimité de l appartenance d un nœud à son voisinage, N G (u) semble plus pertinent. Si on s intéresse à la cohésion des relations d un nœud, c est E G (u) qui se révéle plus pertinent. Une autre différence subtile peut aussi diriger notre choix. En effet, si le projeté "aggrégé" de sa composante connexe que nous étudions forme une clique, alors chacun des nœuds u de la clique présentera exactement le même voisinage N G (u), ce qui ne sera pas nécessairement le cas E G (u). Nous avons ainsi une méthode pour discriminer les différents nœuds d une même clique. 4. L intrication d un nœud dans un réseau multiplexe Lorsque nous nous intéressons à l intrication d arête au niveau d un nœud, la question est quelle est la cohésion de ce nœud dans son voisinage? De manière directe,
5 4 RMPD. Volume No. /2014 nous pouvons appliquer l analyse de l intrication du nœud dans un sous-graphe egocentré à chaque nœud u se composant du nœud et de son voisinage direct. Ainsi nous avons deux mesures, l intensité d intrication du nœud I NG (u) ou I EG (u), et l homogénéité d intrication du nœud H NG (u) ou H EG (u) dans son voisinage. Nous avons aussi étudié la correlation de nos mesures d intrication avec d autres mesures connues sur un jeu de données comprenant sujets de JT de l INA. Ces documents sont annotés avec un codage ethnographique (des mots-clefs) et près de 300 groupes ont été préalablement formés. Pour chacun des groupes, nous avons créé un réseau de documents où un lien est formé par proximité sémantique (plus de détails dans (Renoust, 2014)) et multiplexé ces liens avec les mots-clefs partagés par les deux documents proches. Pour chacun de ces documents, nous avons mesuré Tableau 1. Comparaison du coefficient de correlation de Pearson entre l intensité et l homogénéité d intrication avec neuf autres mesures en utilisant le sous-graph ego-centré des arêtes adjacentes. Ent. intensity Ent. homogeneity Betweenness centrality Closeness centrality Clustering coefficient Degree Eccentricity K-cores PageRank Strength # Familles de liens Multiplexity I NG (u), H NG (u), ainsi que neuf autres mesures connues, et renseigné le tableau 1 (nous utilisons le coeffficient de correlation de (Pearson, 1901), le détail se trouve en annexe A de (Renoust, 2014)). FIGURE 2. Les deux manières de concevoir le voisinage(en bleu) dans un réseau multiplexe: les arêtes adjacentes à un nœud E G (u) (gauche), et le sous-graphe induit à au voisinage d un nœud N G (u) (droite).
6 Voisinage et intrication dans les réseaux multiplexes 5 5. Discussion et conclusion La figure 3 suggère qu il y a de sérieuses différences entre les différents types de voisinage dans les réseaux multiplexes. C est sans surprise que l on constate beaucoup plus de cas d intensité et d homogénéité d intrication maximales pour les réseaux multiplexes ego-centrés incluant uniquement les arêtes adjacentes. Le principal avantage que l on retiendra dans ce cas de figure est la discrimination des différents individus dans le cas où la topologie aggrégée du réseau forme une clique. L intensité et l homogénéité d intrication d un nœud ne semblent pas correlées (ni anti-correlées) avec aucune autre mesure classique de réseau. Bien sûr ce papier court rapporte des travaux préliminaires et de plus amples études sont nécessaires avant d établir toute conclusion. A l exception de la multiplexité et du nombre de familles de liens, ces autres mesures s appliquent sur la version aggrégée du réseau multiplexe. Pour attester pleinement l originalité des mesures d intrication, il faudra aussi les comparer aux mesures présentées dans (Battiston et al., 2013 ; Pujari, Kanawati, Distributions de I NG (u), I EG (u), H NG (u) et H EG (u) Comparaison des deux distributions I EG (u) I NG (u), et H EG (u) H NG (u) FIGURE 3. Distribution des mesures d intrication parmi sujets de JT. La comparaison des distributions de I et H entre voisinages montre des différences significatives, E G présentant plus de valeurs optimales.
7 6 RMPD. Volume No. / ; Cozzo et al., 2013 ; Berlingerio et al., 2013), à la redondance, à l exposition au réseau et aux autres mesures présentées en section 1. Cette correspondance devra aussi être établie sur des modèles de graphes multiplexes aléatoires qui n ont pour le moment pas été produits. Ces résultats préliminaires semblent déjà encourager une solide piste dans l originalité de cette approche, ouvrant de nouvelles perspectives pour l analyse des réseaux multiplexes, et notamment dans la recherche de communautés pour les réseaux multiplexes. Bibliographie Battiston F., Nicosia V., Latora V. (2013). Metrics for the analysis of multiplex networks. arxiv preprint arxiv: Berlingerio M., Pinelli F., Calabrese F. (2013). Abacus: frequent pattern mining-based community discovery in multidimensional networks. Data Mining and Knowledge Discovery, vol. 27, n o 3, p Borgatti S. P. (2012). Two-mode concepts in social network analysis. In R. A. Meyers (Ed.), Computational complexity - theory, techniques, and applications, p Springer. Borgatti S. P., Mehra A., Brass D. J., Labianca G. (2009). Network analysis in the social sciences. Science, vol. 323, n o 5916, p Bródka P., Kazienko P. (2012). Multi-layered social networks. arxiv preprint arxiv: Cozzo E., Kivelä M., De Domenico M., Solé A., Arenas A., Gómez S. et al. (2013). Clustering coefficients in multiplex networks. arxiv preprint arxiv: Cruz J. D., Bothorel C., Poulet F. (2011). Entropy based community detection in augmented social networks. In Computational aspects of social networks (cason), 2011 international conference on, p De Domenico M., Solè-Ribalta A., Cozzo E., Kivelä M., Moreno Y., Porter M. A. et al. (2013). Mathematical formulation of multi-layer networks. arxiv preprint arxiv: physics.soc-ph. Fujimoto K., Chou C.-P., Valente T. W. (2011). The network autocorrelation model using twomode data: Affiliation exposure and potential bias in the autocorrelation parameter. Social networks, vol. 33, n o 3, p Guillaume J.-L., Latapy M. (2005). Bipartite graphs as models of complex networks. In Combinatorial and algorithmic aspects of networking, vol. 3405, p Springer. Kanawati R. (2013). Détection de communautés dans les grands graphes d interactions (multiplexes): état de l art. HAL Latapy M., Magnien C., Vecchio N. D. (2008). Basic notions for the analysis of large two-mode networks. Social Networks, vol. 30, n o 1, p Neal Z. (2013). Identifying statistically significant edges in one-mode projections. Social Network Analysis and Mining, p Nick B., Lee C., Cunningham P., Brandes U. (2013). Simmelian backbones: Amplifying hidden homophily in facebook networks. In 2013 international conference on advances in social networks analysis and mining (asonam), p
8 Voisinage et intrication dans les réseaux multiplexes 7 Opsahl T. (2013). Triadic closure in two-mode networks: Redefining the global and local clustering coefficients. Social Networks, vol. 35, n o 2, p Pearson K. (1901). Liii. on lines and planes of closest fit to systems of points in space. The London, Edinburgh, and Dublin Philosophical Magazine and Journal of Science, vol. 2, n o 11, p Podolny J. M., Baron J. N. (1997). Resources and relationships: Social networks and mobility in the workplace. American sociological review, vol. 62, n o 5, p Pujari M., Kanawati R. (2013). Link prediction in multiplex bibliographical networks. International Journal of Complex Systems in Science, vol. 3, n o 1, p Renoust B. (2014). Analysis and visualisation of edge entanglement in multiplex networks (Thèse de doctorat, University of Bordeaux). HAL. Renoust B., Melançon G., Viaud M.-L. (2013). Assessing group cohesion in homophily networks. In Advances in social network analysis and mining (asonam) 2013, p ACM/IEEE. Rossi F., Villa-Vialaneix N. (2012). Représentation dâun grand réseau à partir dâune classification hiérarchique de ses sommets. Journal de la Société Française de Statistique, vol. 152, n o 3, p Zhou T., Ren J., Medo M., Zhang Y.-C. (2007). Bipartite network projection and personal recommendation. Physical Review E, vol. 76, n o 4, p
Big Data et Graphes : Quelques pistes de recherche
Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université
Big Data et Graphes : Quelques pistes de recherche
Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci http://liris.cnrs.fr/hamamache.kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de
INF6304 Interfaces Intelligentes
INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie
Analysis and Visualisation of Edge Entanglement in Multiplex Networks
Graduate School of Mathematics and Computer Science (EDMI) University of Bordeaux Analysis and Visualisation of Edge Entanglement in Multiplex Networks by Benjamin Renoust A thesis submitted in fulfillment
Intégration de la dimension sémantique dans les réseaux sociaux
Intégration de la dimension sémantique dans les réseaux sociaux Application : systèmes de recommandation Maria Malek LARIS-EISTI [email protected] 1 Contexte : Recommandation dans les réseaux sociaux
Une nouvelle approche de détection de communautés dans les réseaux sociaux
UNIVERSITÉ DU QUÉBEC EN OUTAOUAIS Département d informatique et d ingénierie Une nouvelle approche de détection de communautés dans les réseaux sociaux Mémoire (INF 6021) pour l obtention du grade de Maîtrise
Analyse empirique et modélisation de la dynamique de la topologie de l Internet
Analyse empirique et modélisation de la dynamique de la topologie de l Internet Sergey Kirgizov Directrice de thèse: Clémence Magnien Complex Networks, LIP6, (UPMC, CNRS) Paris, 12 décembre 2014 Plan 1
Les capitalistes sociaux sur Twitter : détection via des mesures de similarité
Les capitalistes sociaux sur Twitter : détection via des mesures de similarité Nicolas Dugué, Anthony Perez LIFO - Université d Orléans rue Léonard de Vinci B.P. 6759 F-45067 ORLEANS Cedex 2 FRANCE RÉSUMÉ.
TRS: Sélection des sous-graphes représentants par l intermédiaire des attributs topologiques et K-medoïdes
TRS: Sélection des sous-graphes représentants par l intermédiaire des attributs topologiques et K-medoïdes Mohamed Moussaoui,Wajdi Dhifli,Sami Zghal,Engelbert Mephu Nguifo FSJEG, Université de Jendouba,
Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring
Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems
MABioVis. Bio-informatique et la
MABioVis Modèles et Algorithmes pour la Bio-informatique et la Visualisation Visite ENS Cachan 5 janvier 2011 MABioVis G GUY MELANÇON (PR UFR Maths Info / EPI GRAVITE) (là, maintenant) - MABioVis DAVID
Etude d un cas industriel : Optimisation de la modélisation de paramètre de production
Revue des Sciences et de la Technologie RST- Volume 4 N 1 /janvier 2013 Etude d un cas industriel : Optimisation de la modélisation de paramètre de production A.F. Bernate Lara 1, F. Entzmann 2, F. Yalaoui
Initiation à Pajek Logiciel pour l analyse des réseaux sociaux
Initiation à Pajek Logiciel pour l analyse des réseaux sociaux Laurent Beauguitte To cite this version: Laurent Beauguitte. Initiation à Pajek Logiciel pour l analyse des réseaux sociaux. 3ème cycle. Umr
Eteindre. les. lumières MATH EN JEAN 2013-2014. Mme BACHOC. Elèves de seconde, première et terminale scientifiques :
MTH EN JEN 2013-2014 Elèves de seconde, première et terminale scientifiques : Lycée Michel Montaigne : HERITEL ôme T S POLLOZE Hélène 1 S SOK Sophie 1 S Eteindre Lycée Sud Médoc : ROSIO Gauthier 2 nd PELGE
COURS SYRRES RÉSEAUX SOCIAUX INTRODUCTION. Jean-Loup Guillaume
COURS SYRRES RÉSEAUX SOCIAUX INTRODUCTION Jean-Loup Guillaume Le cours Enseignant : Jean-Loup Guillaume équipe Complex Network Page du cours : http://jlguillaume.free.fr/www/teaching-syrres.php Évaluation
Travaux pratiques avec RapidMiner
Travaux pratiques avec RapidMiner Master Informatique de Paris 6 Spécialité IAD Parcours EDOW Module Algorithmes pour la Fouille de Données Janvier 2012 Prise en main Généralités RapidMiner est un logiciel
Introduction au Data-Mining
Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme
Qu est ce qu un réseau social. CNAM Séminaire de Statistiques Appliquées 13/11/2013. F.Soulié Fogelman 1. Utilisation des réseaux sociaux pour le
Qui je suis Innovation Utilisation des réseaux sociaux pour le data mining Business & Decision Françoise Soulié Fogelman [email protected] Atos KDD_US CNAM Séminaire de Statistique appliquée
Apprentissage statistique dans les graphes et les réseaux sociaux
Apprentissage statistique dans les graphes et les réseaux sociaux Patrick Gallinari Collaboration : L. Denoyer, S. Peters Université Pierre et Marie Curie AAFD 2010 1 Plan Motivations et Problématique
Resolution limit in community detection
Introduction Plan 2006 Introduction Plan Introduction Introduction Plan Introduction Point de départ : un graphe et des sous-graphes. But : quantifier le fait que les sous-graphes choisis sont des modules.
THESE DE DOCTORAT. Informatique, Fouille de données
THESE DE DOCTORAT Informatique, Fouille de données THEME PRINCIPAL DE LA SOUMISSION : Contenus, Connaissances, Interactions TITRE DE LA THESE : Fouille de graphes avec attributs RESPONSABLES DE LA THESE
FaceBook aime les Maths!
FaceBook aime les Maths! Michel Rigo http://www.discmath.ulg.ac.be/ http://orbi.ulg.ac.be/ Réseaux Visualizing my Twitter Network by number of followers. Michael Atkisson http://woknowing.wordpress.com/
FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)
87 FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc) Dans le cadre de la réforme pédagogique et de l intérêt que porte le Ministère de l Éducation
Principe de symétrisation pour la construction d un test adaptatif
Principe de symétrisation pour la construction d un test adaptatif Cécile Durot 1 & Yves Rozenholc 2 1 UFR SEGMI, Université Paris Ouest Nanterre La Défense, France, [email protected] 2 Université
La classification automatique de données quantitatives
La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations
CONSEILS POUR LA REDACTION DU RAPPORT DE RECHERCHE. Information importante : Ces conseils ne sont pas exhaustifs!
CONSEILS POUR LA REDACTION DU RAPPORT DE RECHERCHE Information importante : Ces conseils ne sont pas exhaustifs! Conseils généraux : Entre 25 et 60 pages (hormis références, annexes, résumé) Format d un
Une méthode d apprentissage pour la composition de services web
Une méthode d apprentissage pour la composition de services web Soufiene Lajmi * Chirine Ghedira ** Khaled Ghedira * * Laboratoire SOIE (ENSI) University of Manouba, Manouba 2010, Tunisia [email protected],
Introduction au datamining
Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des
Classification Automatique de messages : une approche hybride
RECIAL 2002, Nancy, 24-27 juin 2002 Classification Automatique de messages : une approche hybride O. Nouali (1) Laboratoire des Logiciels de base, CE.R.I.S., Rue des 3 frères Aïssiou, Ben Aknoun, Alger,
FD/YMC N 1-5961 Contacts IFOP : Frédéric Dabi / Yves-Marie Cann POUR
FD/YMC N 1-5961 Contacts IFOP : Frédéric Dabi / Yves-Marie Cann POUR Enquête sur la responsabilité sociale du scientifique Résultats détaillés Février 2007 Annexes La publication des données qui fondent
Extraction d informations stratégiques par Analyse en Composantes Principales
Extraction d informations stratégiques par Analyse en Composantes Principales Bernard DOUSSET IRIT/ SIG, Université Paul Sabatier, 118 route de Narbonne, 31062 Toulouse cedex 04 [email protected] 1 Introduction
La NP-complétude. Johanne Cohen. PRISM/CNRS, Versailles, France.
La NP-complétude Johanne Cohen PRISM/CNRS, Versailles, France. Références 1. Algorithm Design, Jon Kleinberg, Eva Tardos, Addison-Wesley, 2006. 2. Computers and Intractability : A Guide to the Theory of
Introduction au maillage pour le calcul scientifique
Introduction au maillage pour le calcul scientifique CEA DAM Île-de-France, Bruyères-le-Châtel [email protected] Présentation adaptée du tutorial de Steve Owen, Sandia National Laboratories, Albuquerque,
Introduction au Data-Mining
Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane
LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN
LES OUTILS D ALIMENTATION DU REFERENTIEL DE DB-MAIN Les contenues de ce document sont la propriété exclusive de la société REVER. Ils ne sont transmis qu à titre d information et ne peuvent en aucun cas
Analyse des réseaux : Une introduction à Pajek
1 Analyse des réseaux : Une introduction à Pajek Laurent Beauguitte (UMR Géographie cités, groupe fmr flux, matrices, réseaux) Pierre Mercklé (Centre Max Weber, équipe «Dispositions, pouvoirs, cultures,
Le ranking de Augure Influencers La méthodologie AIR en détails
Le ranking de Augure Influencers La méthodologie AIR en détails V1.0 Octobre 2014 Oualid Abderrazek Product Marketing Sommaire 1. Contexte...3 2. L algorithme...3 a. Exposition...4 b. Echo...4 c. Niveau
INTRODUCTION AU DATA MINING
INTRODUCTION AU DATA MINING 6 séances de 3 heures mai-juin 2006 EPF - 4 ème année - Option Ingénierie d Affaires et de Projets Bertrand LIAUDET TP DE DATA MINING Le TP et le projet consisteront à mettre
INF 1250 INTRODUCTION AUX BASES DE DONNÉES. Guide d étude
INF 1250 INTRODUCTION AUX BASES DE DONNÉES Guide d étude Sous la direction de Olga Mariño Télé-université Montréal (Québec) 2011 INF 1250 Introduction aux bases de données 2 INTRODUCTION Le Guide d étude
Introduction. M2206 Intégration web. Introduction. Introduction 20/01/2014
Introduction M2206 Intégration web http://www.atinternet.fr/ressources/ressources/etudespubliques/barometre-des-moteurs/ Référencement des sites web et moteurs de recherche Introduction Introduction http://www.go-gulf.com/blog/social-networking-user/
Relation entre deux variables : estimation de la corrélation linéaire
CHAPITRE 3 Relation entre deux variables : estimation de la corrélation linéaire Parmi les analyses statistiques descriptives, l une d entre elles est particulièrement utilisée pour mettre en évidence
UNE EXPERIENCE, EN COURS PREPARATOIRE, POUR FAIRE ORGANISER DE L INFORMATION EN TABLEAU
Odile VERBAERE UNE EXPERIENCE, EN COURS PREPARATOIRE, POUR FAIRE ORGANISER DE L INFORMATION EN TABLEAU Résumé : Cet article présente une réflexion sur une activité de construction de tableau, y compris
La carte, le territoire et l'explorateur où est la visualisation? Jean-Daniel Fekete Equipe-projet AVIZ INRIA [email protected] www.aviz.
La carte, le territoire et l'explorateur où est la visualisation? Jean-Daniel Fekete Equipe-projet AVIZ INRIA [email protected] www.aviz.fr Quelques exemples 1 La campagne de Russie de Napoléon
Représentation des Nombres
Chapitre 5 Représentation des Nombres 5. Representation des entiers 5.. Principe des représentations en base b Base L entier écrit 344 correspond a 3 mille + 4 cent + dix + 4. Plus généralement a n a n...
Systèmes d information et bases de données (niveau 1)
Systèmes d information et bases de données (niveau 1) Cours N 1 Violaine Prince Plan du cours 1. Bibliographie 2. Introduction aux bases de données 3. Les modèles 1. Hiérarchique 2. Réseau 3. Relationnel
Enjeux mathématiques et Statistiques du Big Data
Enjeux mathématiques et Statistiques du Big Data Mathilde Mougeot LPMA/Université Paris Diderot, [email protected] Mathématique en Mouvements, Paris, IHP, 6 Juin 2015 M. Mougeot (Paris
Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI
1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage
Apprentissage Automatique
Apprentissage Automatique Introduction-I [email protected] www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs
Des réels aux flottants : préservation automatique de preuves de stabilité de Lyapunov
Des réels aux flottants : préservation automatique de preuves de stabilité de Lyapunov Olivier Hermant et Vivien Maisonneuve CRI, MINES ParisTech, PSL Research University [email protected]
LUT QU EST-CE QUE C EST? Version 1.0 Mars 2010
A1 BOX DOCUMENT TECHNIQUE LUT QU EST-CE QUE C EST? Version 1.0 Mars 2010 LUT veut dire Look Up Table, en francisant, table de conversion. Il en existe de différents degrés de complexité, dont les deux
NOTE SUR LA MODELISATION DU RISQUE D INFLATION
NOTE SUR LA MODELISATION DU RISQUE D INFLATION 1/ RESUME DE L ANALYSE Cette étude a pour objectif de modéliser l écart entre deux indices d inflation afin d appréhender le risque à très long terme qui
De la modélisation linguistique aux applications logicielles: le rôle des Entités Nommées en Traitement Automatique des Langues
De la modélisation linguistique aux applications logicielles: le rôle des Entités Nommées en Traitement Automatique des Langues Maud Ehrmann Joint Research Centre Ispra, Italie. Guillaume Jacquet Xerox
Analyse Sémantique de Nuages de Points 3D et d Images dans les Milieux Urbains
Analyse Sémantique de Nuages de Points 3D et d Images dans les Milieux Urbains Andrés Felipe SERNA MORALES Directrice de thèse: Beatriz MARCOTEGUI ITURMENDI [email protected] MINES ParisTech, Mathématiques
La segmentation à l aide de EG-SAS. A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM
La segmentation à l aide de EG-SAS A.Bouhia Analyste principal à la Banque Nationale du Canada. Chargé de cours à l UQAM Définition de la segmentation - Au lieu de considérer une population dans son ensemble,
Application de la méthode QFD comme outil d'extraction des connaissances métier en conception intégrée
Application de la méthode QFD comme outil d'extraction des connaissances métier en conception intégrée Estelle FREY, Samuel GOMES, Jean-Claude SAGOT Laboratoire Systèmes et Transports Equipe ERgonomie
Le Futur de la Visualisation d Information. Jean-Daniel Fekete Projet in situ INRIA Futurs
Le Futur de la Visualisation d Information Jean-Daniel Fekete Projet in situ INRIA Futurs La visualisation d information 1.Présentation 2.Bilan 3.Perspectives Visualisation : 3 domaines Visualisation scientifique
L'évaluation par les pairs dans un MOOC. Quelle fiabilité et quelle légitimité? Rémi Bachelet Ecole Centrale de Lille 24 novembre 2014, Université
L'évaluation par les pairs dans un MOOC. Quelle fiabilité et quelle légitimité? Rémi Bachelet Ecole Centrale de Lille 24 novembre 2014, Université Paris-Est séminaire annuel IDEA Les diapos seront tweetées
Vers une Optimisation de l Algorithme AntTreeStoch
Revue des Sciences et de la Technologie - RST- Volume 3 N 1 / janvier 2012 Vers une Optimisation de l Algorithme AntTreeStoch O. KADRI, H. MOUSS, A. ABDELHADI, R. MAHDAOUI Laboratoire d Automatique et
Système immunitaire artificiel
République Algérienne Démocratique et Populaire Ministère de l Enseignement Supérieure Université des Sciences et de la Technologie D Oran Mohammed Boudiaf (USTO) Faculté des Sciences Département d Informatique
Définition et diffusion de signatures sémantiques dans les systèmes pair-à-pair
Définition et diffusion de signatures sémantiques dans les systèmes pair-à-pair Raja Chiky, Bruno Defude, Georges Hébrail GET-ENST Paris Laboratoire LTCI - UMR 5141 CNRS Département Informatique et Réseaux
Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R
Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Yves Aragon, David Haziza & Anne Ruiz-Gazen GREMAQ, UMR CNRS 5604, Université des Sciences
Analyser les réseaux avec R (packages statnet, igraph et tnet)
Analyser les réseaux avec R (packages statnet, igraph et tnet) Laurent Beauguitte To cite this version: Laurent Beauguitte. Analyser les réseaux avec R (packages statnet, igraph et tnet). DEA. Analyser
Utilisation de l ingénierie des modèles pour la conception collaborative de produits mécaniques
Utilisation de l ingénierie des modèles pour la conception collaborative de produits mécaniques Mathias Kleiner Laboratoire des Sciences de l Information et des Systèmes (LSIS) - UMR CNRS 7296 Projet Ingenierie
EXTRACTION DE CONNAISSANCES À PARTIR DE DONNÉES TEXTUELLES VUE D ENSEMBLE
ème Colloque National AIP PRIMECA La Plagne - 7- avril 7 EXTRACTION DE CONNAISSANCES À PARTIR DE DONNÉES TEXTUELLES VUE D ENSEMBLE Bruno Agard Département de Mathématiques et de Génie Industriel, École
MASTER SIS PRO : logique et sécurité DÉTECTION D INTRUSIONS. Odile PAPINI, LSIS. Université de Toulon et du Var. papini@univ-tln.
MASTER SIS PRO : logique et sécurité DÉTECTION D INTRUSIONS Odile PAPINI, LSIS. Université de Toulon et du Var. [email protected] Plan Introduction Généralités sur les systèmes de détection d intrusion
Rapport d'analyse des besoins
Projet ANR 2011 - BR4CP (Business Recommendation for Configurable products) Rapport d'analyse des besoins Janvier 2013 Rapport IRIT/RR--2013-17 FR Redacteur : 0. Lhomme Introduction...4 La configuration
TRAITEMENT DES DONNEES MANQUANTES AU MOYEN DE L ALGORITHME DE KOHONEN
TRAITEMENT DES DONNEES MANQUANTES AU MOYEN DE L ALGORITHME DE KOHONEN Marie Cottrell, Smaïl Ibbou, Patrick Letrémy SAMOS-MATISSE UMR 8595 90, rue de Tolbiac 75634 Paris Cedex 13 Résumé : Nous montrons
Théorie des Graphes Cours 3: Forêts et Arbres II / Modélisation
IFIPS S7 - informatique Université Paris-Sud 11 1er semestre 2009/2010 Théorie des Graphes Cours 3: Forêts et Arbres II / 1 Forêts et arbres II Théorème 1.1. Les assertions suivantes sont équivalentes
Agrégation des portefeuilles de contrats d assurance vie
Agrégation des portefeuilles de contrats d assurance vie Est-il optimal de regrouper les contrats en fonction de l âge, du genre, et de l ancienneté des assurés? Pierre-O. Goffard Université d été de l
Techniques d interaction dans la visualisation de l information Séminaire DIVA
Techniques d interaction dans la visualisation de l information Séminaire DIVA Zingg Luca, [email protected] 13 février 2007 Résumé Le but de cet article est d avoir une vision globale des techniques
Optimisation de la compression fractale D images basée sur les réseaux de neurones
Optimisation de la compression fractale D images basée sur les réseaux de neurones D r BOUKELIF Aoued Communication Networks,Architectures and Mutimedia laboratory University of S.B.A [email protected]
Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar [email protected]
Intelligence Artificielle et Systèmes Multi-Agents Badr Benmammar [email protected] Plan La première partie : L intelligence artificielle (IA) Définition de l intelligence artificielle (IA) Domaines
Chaînes de Markov au lycée
Journées APMEP Metz Atelier P1-32 du dimanche 28 octobre 2012 Louis-Marie BONNEVAL Chaînes de Markov au lycée Andreï Markov (1856-1922) , série S Problème 1 Bonus et malus en assurance automobile Un contrat
L utilisation d un réseau de neurones pour optimiser la gestion d un firewall
L utilisation d un réseau de neurones pour optimiser la gestion d un firewall Réza Assadi et Karim Khattar École Polytechnique de Montréal Le 1 mai 2002 Résumé Les réseaux de neurones sont utilisés dans
données en connaissance et en actions?
1 Partie 2 : Présentation de la plateforme SPSS Modeler : Comment transformer vos données en connaissance et en actions? SPSS Modeler : l atelier de data mining Large gamme de techniques d analyse (algorithmes)
Chaque étape est à prendre en considération. Recommandation pour une meilleure approche de l'attribution
Chaque étape est à prendre en considération Recommandation pour une meilleure approche de l'attribution Vue d'ensemble Avec l avènement de la publicité en ligne vint la promesse d une nouvelle ère digitale,
Big Graph Data Forum Teratec 2013
Big Graph Data Forum Teratec 2013 MFG Labs 35 rue de Châteaudun 75009 Paris, France www.mfglabs.com twitter: @mfg_labs Julien Laugel MFG Labs [email protected] @roolio SOMMAIRE MFG Labs Contexte
Évaluation d une architecture de stockage RDF distribuée
Évaluation d une architecture de stockage RDF distribuée Maeva Antoine 1, Françoise Baude 1, Fabrice Huet 1 1 INRIA MÉDITERRANÉE (ÉQUIPE OASIS), UNIVERSITÉ NICE SOPHIA-ANTIPOLIS, I3S CNRS pré[email protected]
Introduction aux outils BI de SQL Server 2014. Fouille de données avec SQL Server Analysis Services (SSAS)
MIT820: Entrepôts de données et intelligence artificielle Introduction aux outils BI de SQL Server 2014 Fouille de données avec SQL Server Analysis Services (SSAS) Description générale Ce tutoriel a pour
Item 169 : Évaluation thérapeutique et niveau de preuve
Item 169 : Évaluation thérapeutique et niveau de preuve COFER, Collège Français des Enseignants en Rhumatologie Date de création du document 2010-2011 Table des matières ENC :...3 SPECIFIQUE :...3 I Différentes
Historique. Architecture. Contribution. Conclusion. Définitions et buts La veille stratégique Le multidimensionnel Les classifications
L intelligence économique outil stratégique pour l entreprise Professeur Bernard DOUSSET [email protected] http://atlas.irit.fr Institut de Recherche en Informatique de Toulouse (IRIT) Equipe Systèmes d
RI sociale : intégration de propriétés sociales dans un modèle de recherche
RI sociale : intégration de propriétés sociales dans un modèle de recherche Ismail Badache 1 Institut de Recherche en Informatique de Toulouse, UMR 5505 CNRS, SIG 118 Route de Narbonne F-31062 Toulouse
Laboratoire d informatique Gaspard-Monge UMR 8049. Journée Labex Bézout- ANSES
Laboratoire d informatique Gaspard-Monge UMR 8049 Journée Labex Bézout- ANSES Présentation du laboratoire 150 membres, 71 chercheurs et enseignants-chercheurs, 60 doctorants 4 tutelles : CNRS, École des
Suivi de la dynamique intrinsèque des interactions entre utilisateur et SI
Suivi de la dynamique intrinsèque des interactions entre utilisateur et SI Sébastien Heymann * Bénédicte Le Grand ** * Université Pierre et Marie Curie cnrs Laboratoire d Informatique de Paris 6 4 place
Mesure agnostique de la qualité des images.
Mesure agnostique de la qualité des images. Application en biométrie Christophe Charrier Université de Caen Basse-Normandie GREYC, UMR CNRS 6072 Caen, France 8 avril, 2013 C. Charrier NR-IQA 1 / 34 Sommaire
Banque d outils d aide à l évaluation diagnostique
Banque d outils d aide à l évaluation diagnostique Url : http://www.banqoutils.education.gouv.fr/index.php Niveau : GS au Lycée Conditions d'utilisation : Pas d'inscription nécessaire. Format des ressources
E-COMMERCE VERS UNE DÉFINITION INTERNATIONALE ET DES INDICATEURS STATISTIQUES COMPARABLES AU NIVEAU INTERNATIONAL
E-COMMERCE VERS UNE DÉFINITION INTERNATIONALE ET DES INDICATEURS STATISTIQUES COMPARABLES AU NIVEAU INTERNATIONAL Bill Pattinson Division de la politique de l information, de l informatique et de la communication
Data Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.
des des Data Mining Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne 2012-2013 1/65 des des 1 2 des des 3 4 Post-traitement 5 représentation : 6 2/65 des des Définition générale Le
RapidMiner. Data Mining. 1 Introduction. 2 Prise en main. Master Maths Finances 2010/2011. 1.1 Présentation. 1.2 Ressources
Master Maths Finances 2010/2011 Data Mining janvier 2011 RapidMiner 1 Introduction 1.1 Présentation RapidMiner est un logiciel open source et gratuit dédié au data mining. Il contient de nombreux outils
Etudier l informatique
Etudier l informatique à l Université de Genève 2015-2016 Les bonnes raisons d étudier l informatique à l UNIGE La participation à des dizaines de projets de recherche européens Dans la présente brochure,
Introduction à la B.I. Avec SQL Server 2008
Introduction à la B.I. Avec SQL Server 2008 Version 1.0 VALENTIN Pauline 2 Introduction à la B.I. avec SQL Server 2008 Sommaire 1 Présentation de la B.I. et SQL Server 2008... 3 1.1 Présentation rapide
www.lafamily.ch en 16 différences
Cas d étude no 3 www.lafamily.ch en 16 différences juin 2003 Le mandat réalisé avec QuickSite de transformation du site existant de Lafamily.ch, centre globale d information pour les familles, à été de
Le théorème de Perron-Frobenius, les chaines de Markov et un célèbre moteur de recherche
Le théorème de Perron-Frobenius, les chaines de Markov et un célèbre moteur de recherche Bachir Bekka Février 2007 Le théorème de Perron-Frobenius a d importantes applications en probabilités (chaines
L usage des concepts du web sémantique dans le filtrage d information collaboratif
Ministère de l enseignement Supérieur et de la recherche scientifique Institut National d Informatique Alger Mémoire présenté pour l obtention du diplôme de Magistère Option : Ingénierie des Systèmes d
Le Data Mining au service du Scoring ou notation statistique des emprunteurs!
France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative
Etude comparative de différents motifs utilisés pour le lancé de rayon
Etude comparative de différents motifs utilisés pour le lancé de rayon Alexandre Bonhomme Université de Montréal 1 Introduction Au cours des dernières années les processeurs ont vu leurs capacités de calcul
Enrichissement du profil utilisateur à partir de son réseau social dans un contexte dynamique : application d une méthode de pondération temporelle
Enrichissement du profil utilisateur à partir de son réseau social dans un contexte dynamique : application d une méthode de pondération temporelle Marie-Françoise Canut, Sirinya On-at, André Péninou,
Exemples de problèmes et d applications. INF6953 Exemples de problèmes 1
Exemples de problèmes et d applications INF6953 Exemples de problèmes Sommaire Quelques domaines d application Quelques problèmes réels Allocation de fréquences dans les réseaux radio-mobiles Affectation
