Analyse des réseaux sociaux

Dimension: px
Commencer à balayer dès la page:

Download "Analyse des réseaux sociaux"

Transcription

1 Analyse des réseaux sociaux Emmanuel Viennet Laboratoire de Traitement et Transport de l Information L2TI Université Paris 13 Réseaux sociaux, analyse et data mining École Normale Supérieure Journée organisée par le groupe «Data mining et apprentissage» Société Française de Statistique 16/02/2010 E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

2 Plan de l exposé 1 Introduction: fouille des réseaux sociaux 2 Caractérisation des réseaux sociaux 3 Analyse relations/contenu: un exemple d approche 4 Analyse structurelle: communautés 5 Catégorisation de nœuds 6 Méthodes à noyaux pour les graphes E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

3 Plan de l exposé 1 Introduction: fouille des réseaux sociaux 2 Caractérisation des réseaux sociaux 3 Analyse relations/contenu: un exemple d approche 4 Analyse structurelle: communautés 5 Catégorisation de nœuds 6 Méthodes à noyaux pour les graphes

4 Croissance du Web... E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

5 Croissance des médias sociaux Du web des contenus au web des utilisateurs? Début 2010: Facebook: 400 millions d utilisateurs Twitter: 20 à 60 millions Orkut: 25 millions au Brésil SkyBlog, MySpace, LinkedIn,... E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

6 Les entreprises collectent de plus en plus de données sur les relations entre leurs clients E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

7 Mais quels modèles économiques? Sites payants: peu d audience Sites institutionnels (services publics) Mécénat, donations (Wikipédia) Site gratuits, publicité Publicité personnalisée Marketing viral Marketing temps réel... Et pour fidéliser les visiteurs d un site social : animation de communauté, suivi d un site à l autre,... besoin d analyse (fouille) de données de type graphe E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

8 Mais quels modèles économiques? Sites payants: peu d audience Sites institutionnels (services publics) Mécénat, donations (Wikipédia) Site gratuits, publicité Publicité personnalisée Marketing viral Marketing temps réel... Et pour fidéliser les visiteurs d un site social : animation de communauté, suivi d un site à l autre,... besoin d analyse (fouille) de données de type graphe E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

9 Contexte: fouille de données structurées Des tables aux données structurées... Modèles: discrimination, régression, classification... E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

10 Réseaux (sociaux ou non) Pages Web Routeurs Internet Facebook Communications Citations Biologie E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

11 Réseaux sociaux à l ère Internet... Appels téléphoniques Courrier électronique Réseaux de co-auteurs Réseaux d amitié Réseaux organisationnels Réseaux d affiliation E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

12 Exemple: le réseau Twitter Chaque utilisateur: émet de courts messages (140 caractères) suit (reçoit) les messages de quelques utilisateurs suivi (lu) par d autres. Tous les messages sont publics Environ 25 millions d utilisateurs (?) E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

13 Analyse du réseau Twitter (2007, Bruno Peeters, Belgium) E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

14 Marketing & recommandation: la longue traine Chris Anderson, The Long Tail, Wired, Issue October 2004 E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

15 Marketing, recommandation et réseaux sociaux Besoin de recommandations personnalisées! > 50% font des recherches en ligne avant d acheter Les recommandations personnalisées sont basées sur les achats et notations passées, par ex. le système d Amazon les clients qui ont acheté ceci achètent aussi cela MovieLens, based on ratings of users like you... Epinions, based on the opinions of the raters you trust... Nous sommes plus facilement influencés par nos amis que par des inconnus! 68% des clients consultent leurs amis ou famille avant d acheter des produits électroniques (Burke 2003) E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

16 Applications de l analyse des réseaux sociaux Étude de la structure des réseaux: communautés, diffusion,... (animation, vente ciblée) Web: recherche, extraction d information Marketing: identifier des groupes de clients ou produits pour faire des recommandations (publicité ciblée, marketing viral) Personalisation (interfaces, services) Epidémiologie Détection de fraude Sécurité (contre-terrorisme)... E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

17 Problèmes intéressants pour la fouille de données Un domaine scientifiquement passionnant et pluri-disciplinaire: Data mining et Apprentissage pour: la caractérisation des réseaux sociaux la modèlisation de la diffusion d information (par ex. pour le marketing viral) la modèlisation de l évolution (par ex. créations de nouveaux liens) la classification de nœuds E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

18 Plan de l exposé 1 Introduction: fouille des réseaux sociaux 2 Caractérisation des réseaux sociaux 3 Analyse relations/contenu: un exemple d approche 4 Analyse structurelle: communautés 5 Catégorisation de nœuds 6 Méthodes à noyaux pour les graphes

19 Ordres de grandeurs Quelques jeux de données utilisés en recherche: Nombre de nœuds s labo sur 2 mois s sur 2 ans amitiés entre bloggueurs 4,4 millions Téléphone millions Communications IM 240 millions Parcimonie (sparseness): nombre de liens proportionnel au nombre de nœuds. E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

20 Graphes Théorie des graphes depuis Euler... Très nombreux résultats: chemins, flots, cliques, décompositions spectrales C A E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

21 Réseaux sociaux et graphes: quelles différences? Un réseau social est un graphe, mais: nœuds porteurs d attributs liens valués pouvant porter des données (messages) similarité entre deux nœuds = f (attributs, liens) caractéristique du réseau 6= graphe aléatoire (propriétés structurelles spéciales) E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

22 Exemple de propriété structurelle: l effet petit monde Longueur moyenne du plus court chemin reliant deux nœuds petite. six degrés de séparation Caractéristique liée à la distribution des degrés: graphe sans-échelle (Barabasi, 2000), suivant une loi de Pareto: P(degré d un nœud = k) k γ E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

23 Exemple: simulation du réseau Internet (Mahadevan et al., 2007) E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

24 Etude des réseaux sociaux: terminologie Contagion: flux dans le graphe (microbes, information, modes...) Connection: arêtes du graphe social Homophilie: qui se ressemble s assemble E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

25 Transitivité dans les réseaux sociaux Une relation sociale est transitive si tous les acteurs sont liés: triangles Coefficient de clustering Lié au nombre de voisins d un nœud qui sont eux mêmes reliés (Watts et Strogatz, 1998) A, C: grande transitivité, ancrés dans leurs groupes B, D: faible transitivité, ponts E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

26 Intermédiarité Définition Nombre de plus courts chemins passant par une arête (Newman 2004) Utilisation: nœuds importants pour la communication découpage en communautés E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

27 Communautés (P. Pons, 2007) Recherche de communautés = partitionnement du graphe en N Identification = recherche d une communauté autour d un nœud donné E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

28 E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

29 Hiérarchie de communautés et modularité D après Newman & Girvan, 2004 E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

30 Intérêt de la recherche de communautés Organisation structurelle (micro ou macro) Évolution temporelle (voir exposé de JL Guillaume) Visualisation Permettre une analyse locale des interactions Animation des réseaux sociaux... E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

31 Plan de l exposé 1 Introduction: fouille des réseaux sociaux 2 Caractérisation des réseaux sociaux 3 Analyse relations/contenu: un exemple d approche 4 Analyse structurelle: communautés 5 Catégorisation de nœuds 6 Méthodes à noyaux pour les graphes

32 Clustering à base de modèle pour les réseaux sociaux Ce type d approche vise à modéliser simulanément les distributions de probabilité des attributs de nœuds et de leurs positions dans l espace social : on introduit des variables latentes. Représentation du réseau social La matrice Y ij décrit les liens entre les nœuds. Z = z i R d donne les positions des nœuds dans l espace (latent) R d E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

33 Modélisation (suite): le modèle Exemple: approche de Handcock & Raftery, 2006 n nœuds, Y = y ij matrice d adjacence ( sociomatrix ). Les liens sont considérés comme indépendants: P(Y Z, X, β) = i j P(y ij z i, z j, x ij, β) où: X : attributs des nœuds (ou de la paire (i, j)) β : paramètres du modèle Modélisation par régression logistique: avec 1 n i z i 2 = 1 logit(y ij = 1 z i, z j, x ij, β) = β T 0 x ij β 1 z i z j E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

34 Modélisation (suite): estimation Clustering par modélisation des coordonnées z i en mixture de gaussiennes: z i G λ g exp( z i µ g 2 ) with λ g > 0 and λ g = 1 g=1 2σ 2 g G nombre de clusters, fixé à priori Estimation des paramètres : maximum de vraisemblance (chaîne de Markov ou Monte Carlo) estimation coûteuse en calculs E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

35 Modélisation (suite):: application 1 Le choix du nombre de clusters G se pose comme un problème de sélection de modèle (utiliser par exemple un critère BIC) lent! Relations entre moines Étude sociologique: amitié entre moines 18 nœuds (moines) 3 groupes de moines, qui correspondent à ceux identifiés par les sociologues E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

36 Modélisation (suite): application 2 Liens entre adolescents dans un collège Relations entre 71 adolescents (ici 6 clusters) E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

37 Modélisation (suite): conclusions Méthodes complexes (calculs lourds) mais précises Prise en compte simultanée des liens et des nœuds Applicable uniquement aux très petits réseaux! = on utilise souvent les méthodes structurelles d extraction de communautés, qui ne prennent en compte que les liens (le graphe) E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

38 Plan de l exposé 1 Introduction: fouille des réseaux sociaux 2 Caractérisation des réseaux sociaux 3 Analyse relations/contenu: un exemple d approche 4 Analyse structurelle: communautés 5 Catégorisation de nœuds 6 Méthodes à noyaux pour les graphes

39 Principal critère de qualité: la modularité La modularité mesure la qualité d un découpage du graphe en c communautés Q = i (d ii ( j d ij ) 2 ) D matrice c c, dont les éléments d ij donnent la proportion de liens reliant des nœuds de la communauté i à la communauté j Q [ 1, 1] mesure la densité des liens intra-communautaires vs inter-communautaires E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

40 Recherche de communautés structurelles De nombreux progrès récents Méthodes basées sur l intermédiarité Première proposition: Newman & Girvan (2004) Répéter: 1 calculer l intermédiarité des arêtes 2 couper l arête la plus importante jusqu à isoler tous les nœuds (méthode séparative) Pour un grand réseau parcimonieux de n nœuds: Newman & Girvan 2004 O(n 3 ) Newman 2004 O(n 2 ) Wakita & Tsurumi 2007 O(n log 2 n) Blondel et al. (Louvain) 2008 O(n log n) moins de 5 minutes pour 1 million de nœuds, ou 40 minutes pour 23 millions E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

41 Exemple 1: réseau de collaboration entre scientifiques D après K. Martin et M. Avnet, E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

42 Exemple 2: site web collaboratif Liens entre utilisateurs du site MyMondomix (projet ANR CADI) Modularité Q = 0, 62 E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

43 Exemple 3: XTelco Données d un opérateur téléphonique Numéro appelant Numéro appelé Durée d appel millions d appels, 25 millions de clients. Niveau Nœuds Modularité 0 22 millions 0,53 1 2,5 millions 0, , ,79 E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

44 Identification of communautés Chercher un voisinage (micro-communauté) à partir d un nœud donné E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

45 Principes de l approche physique (Wu & Huberman) On considère le graphe comme un circuit électrique Loi de Kirchhoff sur le nœud C: n I i = i=1 n i=1 V Di V C R = 0 Si graphe avec arcs valués par w ij, on défini R ij = w 1 ij On fixe la tension en deux nœuds: V 1 = 1, V 2 = 0 et on a: V i = 1 k i n V j a ij + 1 a i1 k i j=3 pour i = 3,..., n k i : degré du nœud i, a ij matrice d adjacence. Ce système d équations linéaires se résoud en O(n 3 ) (lent). E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

46 Résolution approchée rapide Méthode itérative: 1 fixer V 1 = 1, V 2 = = V n = 0 (en temps O(V )) 2 mettre à jour la tension de chaque nœud (en O(E)) 3 répèter l étape 2 La précision après l étape 2 ne dépend que du nombre d itérations, pas de la taille du graphe. Quelques dizaines d itérations suffisent pour converger. E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

47 Recherche de communautés: problèmes ouverts Prendre en compte (efficacement) les attributs des nœuds et la structure du graphe. La modularité est-elle le bon critère? (eg Fortunato 2006) Contrôler la distribution des tailles des communautés Communautés avec recouvrement Suivi dynamique Graphes bipartites E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

48 Plan de l exposé 1 Introduction: fouille des réseaux sociaux 2 Caractérisation des réseaux sociaux 3 Analyse relations/contenu: un exemple d approche 4 Analyse structurelle: communautés 5 Catégorisation de nœuds 6 Méthodes à noyaux pour les graphes

49 Catégorisation de nœuds Applications: marketing (churn, influence), categorization de textes,...?? E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

50 Catégorisation de nœuds Première approche: Relaxation labeling par ex. (Angelova et al 2006) Augmentation d un tiers du score F1 / SVM sur les noeuds seuls. => gains importants sur des applications diverses E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

51 Catégorisation de nœuds: une approche simple La RL est lente sur de grands graphes Idée: pour catégoriser les nœuds à partir de leurs attributs et de leur position dans le graphe, exprimer celle ci comme de nouveaux attributs: caractéristiques locales du graphe (degré, triangles,...) attributs décrivant la communauté à laquelle appartient le nœud E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

52 Exemple: catégorisation de texte E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

53 Catégorisation de texte (suite) E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

54 Application: triage de bugs (Bugzilla) Bug tracker du projet Eclipse (Open Source) Réseau de développeurs bug reports, 2100 utilisateurs liens: personnes travaillant sur le même bug objectif: associer le bug à un développeur Niveau # communautés Modularité Méthode Performance TF-IDF SVM 32% TF-IDF + Communauté de l auteur SVM 38% E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

55 Plan de l exposé 1 Introduction: fouille des réseaux sociaux 2 Caractérisation des réseaux sociaux 3 Analyse relations/contenu: un exemple d approche 4 Analyse structurelle: communautés 5 Catégorisation de nœuds 6 Méthodes à noyaux pour les graphes

56 Espace de représentation et noyaux Projection dans un espace de représentation: transformation Φ X Φ F O X Φ(Ο) Φ(X) Φ(Ο) O X X X Φ(Ο) Φ(X) O Φ(Ο) Φ(X) Φ(X) O X Φ(Ο) Φ(X) O Kernel K (x, y) = < φ(x), φ(y) > SVM non linéaire: ŷ = α i K (x i, x) + b i SV kernel trick utilisé dans de nombreux modèles, comme l ACP, l Analyse Discriminante, la régression PLS,... peut s appliquer aux cas où l on ne dispose pas de représentation vectorielle des exemples (chaînes de symboles, arbres, graphes...) E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

57 Définir des noyaux Condition d admissibilité symétrique: k(x, y) = k(y, x) semi-définie positive: c i c j k(x i, x j ) 0 On peut construire des noyaux à partir d autres noyaux: combinaison: k(x, y) = w α k α (x, y), w α 0 composition: k(x, y) = D k d (x d, y d ) (Haussler 1999) d=1 Exemples: noyaux pour séquences, arbres, graphes Exemple simple: noyau sur arbres t t c 0 c 1 c 2 c 0 c 1 k(t, t ) = 2 1 k c (c i, c j ) i=0 j=0 E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

58 Définir des noyaux Condition d admissibilité symétrique: k(x, y) = k(y, x) semi-définie positive: c i c j k(x i, x j ) 0 On peut construire des noyaux à partir d autres noyaux: combinaison: k(x, y) = w α k α (x, y), w α 0 composition: k(x, y) = D k d (x d, y d ) (Haussler 1999) d=1 Exemples: noyaux pour séquences, arbres, graphes Exemple simple: noyau sur arbres t t c 0 c 1 c 2 c 0 c 1 k(t, t ) = 2 1 k c (c i, c j ) i=0 j=0 E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

59 Apprentissage à base de noyaux pour la catégorisation de nœuds Rappel: condition d admissibilité K semi-définie positive: f x, f x f x K (x, x ) 0 x x Suivant l approche d Haussler (1999), on peut écrire: e βh = lim n (1 + βh n )n (1) = I + βh + β2 2! H2 + (2) H auto-adjoint K = e βh semi-définie positive. Le paramètre β contrôle la localité du noyau obtenu (diffusion sur le graphe). E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

60 Noyau de diffusion 1 si i j Laplacien du graphe: L = D A, soit L = d i si i = j 0 sinon Le Laplacien se retrouve souvent en analyse spectrale des graphes. Remarque: t w, w T Hw = Ψ = µ Ψ : équation de la chaleur Si K = e βh, on a d dβ K β = LK β & Lafferty 2002). (i,j) E (w i w j ) 2 : équation de la chaleur sur le graphe (Kondor K β (i, j) can be seen as the energy injected in i received in j, with diffusion parameter β E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

61 Noyau de diffusion: mise en œuvre K (0) = I ( K (β) = lim I + βl ) s s s Problème: K est une matrice dense, même si L est sparse. utilisation impossible sur de très grands graphes Mais résultats intéressants: exemple jeux de données WebKB : pages webs, 7 classes ( universités) - de 8 à 15% d erreur en ignorant le texte des pages! Applications possibles en transductif (suggéré par Gärtner et Smola 2007). E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

62 Conclusions L analyse des réseaux sociaux pose de nouveaux défis pour la fouille de données: échantillons non iid, structure, grands volumes, évolution... Les nouvelles applications industrielles (Telco, Web 2.0,...) produisent d énormes volumes de données en réseau, avec une forte valeur potentielle Nombreuses recherches, nouvelles méthodes et algorithmes. Aujourd hui Évolution des communautés: J.-L. Guillaume Outils industriels: F. Soulié-Fogelman Analyse des données d un grand site social : R. Kirche Apprentissage et inférence: L. Denoyer E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

63 Références principales (1) Ouvrages généraux Albert-Laszlo Barabasi. Linked. Perseus Publishing, Nicholas A. Christakis and James H. Fowler. Connected: The Surprising Power of Our Social Networks and How They Shape Our Lives. Little, Brown and Company, Chris Anderson. The Long Tail. Random House Business, E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

64 Références principales (2) Recherche de communautés M. E. J. Newman. Modularity and community structure in networks. PNAS, 103(23): , June Luciano da F. Costa, Francisco A. Rodrigues, Gonzalo Travieso, and P. R. Villas Boas. Characterization of complex networks: A survey of measurements. Advances in Physics, 56(1): , January Santo Fortunato. Community detection in graphs. Physics Reports, Jun V.D. Blondel, J.L. Guillaume, R. Lambiotte, and E.L.J.S. Mech. Fast unfolding of communities in large networks. Journal of Statistical Mechanics: Theory and Experiment, P10008: , E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

65 Références principales (3) Graphes et apprentissage Jure Leskovec. Dynamics of large networks. PhD thesis, Carnegie Mellon University, September Diane J. Cook and Lawrence B. Holder. Mining Graph Data. John Wiley & Sons, Nello Cristianini and John Shawe-Taylor. An introduction to support vector machines : and other kernel-based learning methods. Cambridge University Press, March E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

66 Merci de votre attention! Ce travail a été partiellement financé par l ANR (projets CADI 2007 TLOG 003, Ex DEUSS 2009 CORD 010), par la DGCIS (projet CEDRES ) et par le pôle Cap Digital E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

Analyse des réseaux sociaux et apprentissage

Analyse des réseaux sociaux et apprentissage Analyse des réseaux sociaux et apprentissage Emmanuel Viennet Laboratoire de Traitement et Transport de l Information Université Paris 13 - Sorbonne Paris Cité Réseaux sociaux? Réseaux sociaux? Analyse

Plus en détail

FaceBook aime les Maths!

FaceBook aime les Maths! FaceBook aime les Maths! Michel Rigo http://www.discmath.ulg.ac.be/ http://orbi.ulg.ac.be/ Réseaux Visualizing my Twitter Network by number of followers. Michael Atkisson http://woknowing.wordpress.com/

Plus en détail

AT41 - «Métropoles et réseaux»

AT41 - «Métropoles et réseaux» AT41 - «Métropoles et réseaux» Une approche par la théorie des graphes Plan Problématiques Quelques définitions Théorie des graphes: 1. Partitionnement de graphe : ex. les communautés 2. Analyse des réseaux

Plus en détail

Introduction à l Analyse des Réseaux Sociaux

Introduction à l Analyse des Réseaux Sociaux (ARS) 18 mars 2010 Analyse des réseaux sociaux Définition Propriétés Utilisation & Applications Analyse des réseaux sociaux Définition Propriétés Utilisation & Applications Etude des entités sociales (les

Plus en détail

Support Vector Machines

Support Vector Machines Support Vector Machines Séparateurs à vaste marge Arnaud Revel revel.arnaud@gmail.com Plan 1 Introduction 2 Formalisation 3 Utilisation des noyaux 4 Cas multi-classes 5 Applications des SVM 6 Bibliographie

Plus en détail

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université

Plus en détail

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci http://liris.cnrs.fr/hamamache.kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de

Plus en détail

Séance 12: Algorithmes de Support Vector Machines

Séance 12: Algorithmes de Support Vector Machines Séance 12: Algorithmes de Support Vector Machines Laboratoire de Statistique et Probabilités UMR 5583 CNRS-UPS www.lsp.ups-tlse.fr/gadat Douzième partie XII Algorithmes de Support Vector Machines Principe

Plus en détail

Introduction aux Support Vector Machines (SVM)

Introduction aux Support Vector Machines (SVM) Introduction aux Support Vector Machines (SVM) Olivier Bousquet Centre de Mathématiques Appliquées Ecole Polytechnique, Palaiseau Orsay, 15 Novembre 2001 But de l exposé 2 Présenter les SVM Encourager

Plus en détail

Graphes, réseaux et internet

Graphes, réseaux et internet Graphes, réseaux et internet Clémence Magnien clemence.magnien@lip6.fr LIP6 CNRS et Université Pierre et Marie Curie (UPMC Paris 6) avec Matthieu Latapy, Frédéric Ouédraogo, Guillaume Valadon, Assia Hamzaoui,...

Plus en détail

Projet I(M-RI)T. Comparaison de graphes et visualisation d évolution. Mai 2007

Projet I(M-RI)T. Comparaison de graphes et visualisation d évolution. Mai 2007 Projet I(M-RI)T Comparaison de graphes et visualisation d évolution Mai 2007 Table des matières 1 Description du projet 1 1.1 Contexte et problématiques................................... 1 1.1.1 Étude

Plus en détail

Statistique en grande dimension pour la génomique Projets 2014-2015 L. Jacob, F. Picard, N. Pustelnik, V. Viallon

Statistique en grande dimension pour la génomique Projets 2014-2015 L. Jacob, F. Picard, N. Pustelnik, V. Viallon Statistique en grande dimension pour la génomique Projets 2014-2015 L. Jacob, F. Picard, N. Pustelnik, V. Viallon Table des matières 1 Graph Kernels for Molecular Structure-Activity Relationship Analysis

Plus en détail

Apprentissage par méthodes à noyaux en reconnaissance d images

Apprentissage par méthodes à noyaux en reconnaissance d images Apprentissage par méthodes à noyaux en reconnaissance d images Alberto Bietti Table des matières Introduction 2 1 Apprentissage par méthodes à noyaux 2 1.1 Position du problème et motivation..........................

Plus en détail

Partie 1. La structure des réseaux sociaux

Partie 1. La structure des réseaux sociaux Partie 1. La structure des réseaux sociaux Analyse et Modélisation des Réseaux, Université Bordeaux IV Sections : Introduction 1 Introduction 2 3 L expérience de Milgram Les réseaux aléatoires 4 Le clustering

Plus en détail

Introduction à l Analyse des Réseaux Sociaux

Introduction à l Analyse des Réseaux Sociaux Introduction à l Analyse des Réseaux Sociaux Erick Stattner Laboratoire LAMIA Université des Antilles et de la Guyane, France erick.stattner@univ-ag.fr Guadeloupe, Novembre 2012 Erick Stattner Introduction

Plus en détail

Intégration de la dimension sémantique dans les réseaux sociaux

Intégration de la dimension sémantique dans les réseaux sociaux Intégration de la dimension sémantique dans les réseaux sociaux Application : systèmes de recommandation Maria Malek LARIS-EISTI maria.malek@eisti.fr 1 Contexte : Recommandation dans les réseaux sociaux

Plus en détail

Calculatrice vocale basée sur les SVM

Calculatrice vocale basée sur les SVM Calculatrice vocale basée sur les SVM Zaïz Fouzi *, Djeffal Abdelhamid *, Babahenini MohamedChaouki*, Taleb Ahmed Abdelmalik**, * Laboratoire LESIA, Département d Informatique, Université Mohamed Kheider

Plus en détail

Détection de communautés, étude comparative sur graphes réels

Détection de communautés, étude comparative sur graphes réels Détection de communautés, étude comparative sur graphes réels Emmanuel Navarro Rémy Cazabet IRIT, Université de Toulouse. 118 Route de Narbonne, 31062 Toulouse Cedex 9, France. Email : {navarro, cazabet}@irit.fr

Plus en détail

Une nouvelle approche de détection de communautés dans les réseaux sociaux

Une nouvelle approche de détection de communautés dans les réseaux sociaux UNIVERSITÉ DU QUÉBEC EN OUTAOUAIS Département d informatique et d ingénierie Une nouvelle approche de détection de communautés dans les réseaux sociaux Mémoire (INF 6021) pour l obtention du grade de Maîtrise

Plus en détail

Méthodes avancées en décision

Méthodes avancées en décision Méthodes avancées en décision Support vector machines - Chapitre 2 - Principes MRE et MRS Principe MRE. Il s agit de minimiser la fonctionnelle de risque 1 P e (d) = y d(x;w, b) p(x, y) dxdy. 2 La densité

Plus en détail

Ingénierie d aide à la décision

Ingénierie d aide à la décision Ingénierie d aide à la décision Maria Malek 1 er septembre 2009 1 Objectifs et débouchés Nous proposons dans cette option deux grands axes pour l aide à la décision : 1. La recherche opérationnelle ; 2.

Plus en détail

Cours de spécialité mathématiques en Terminale ES

Cours de spécialité mathématiques en Terminale ES Cours de spécialité mathématiques en Terminale ES O. Lader 2014/2015 Lycée Jean Vilar Spé math terminale ES 2014/2015 1 / 51 Systèmes linéaires Deux exemples de systèmes linéaires à deux équations et deux

Plus en détail

Sur l apprentissage de Réseaux Bayésiens à partir de bases d exemples incomplètes et application à la classification

Sur l apprentissage de Réseaux Bayésiens à partir de bases d exemples incomplètes et application à la classification Sur l apprentissage de Réseaux Bayésiens à partir de bases d exemples incomplètes et application à la classification et Philippe LERAY, Laboratoire LITIS, Rouen. Rencontres Inter-Associations La classification

Plus en détail

Optimisation de la géométrie du voisinage pour la segmentation d images texturées

Optimisation de la géométrie du voisinage pour la segmentation d images texturées Optimisation de la géométrie du voisinage pour la segmentation d images texturées Pierre Beauseroy & André Smolarz Institut des Sciences et Technologies de l Information de Troyes (FRE 73) Université de

Plus en détail

Apprentissage Automatique

Apprentissage Automatique Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs

Plus en détail

Apprentissage statistique dans les graphes et les réseaux sociaux

Apprentissage statistique dans les graphes et les réseaux sociaux Apprentissage statistique dans les graphes et les réseaux sociaux Patrick Gallinari Collaboration : L. Denoyer, S. Peters Université Pierre et Marie Curie AAFD 2010 1 Plan Motivations et Problématique

Plus en détail

COURS SYRRES RÉSEAUX SOCIAUX. Jean-Loup Guillaume

COURS SYRRES RÉSEAUX SOCIAUX. Jean-Loup Guillaume COURS SYRRES RÉSEAUX SOCIAUX Jean-Loup Guillaume Le cours http://jlguillaume.free.fr/www/teaching/syrres/ Exemple 1 : Expérience de Milgram Objectif faire transiter une lettre depuis les Nebraska à un

Plus en détail

LES RESEAUX SOCIAUX. Alain DEGENNE 1

LES RESEAUX SOCIAUX. Alain DEGENNE 1 5 Math. & Sci. hum. / Mathematics and Social Sciences (42 e année, n 168, 2004(4), p. 5-9) LES RESEAUX SOCIAUX Alain DEGENNE 1 INTRODUCTION Parmi les nombreux foyers de recherche actifs dans le domaine

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme

Plus en détail

Cours de Data Mining PageRank et HITS

Cours de Data Mining PageRank et HITS Cours de Data Mining PageRank et HITS Andreea Dragut Univ. Aix-Marseille, IUT d Aix-en-Provence Andreea Dragut Cours de Data Mining PageRank et HITS 1 / 48 Plan du cours Présentation Andreea Dragut Cours

Plus en détail

Motivation : pourquoi exploration de données? Nous nous noyons dans les données, mais manquons cruellement de connaissances

Motivation : pourquoi exploration de données? Nous nous noyons dans les données, mais manquons cruellement de connaissances 1 Introduction Définition et motivations Tâches de data mining (fouille de données, exploration de données) Techniques et algorithmes Exemples et applications 1 Motivation : pourquoi exploration de données?

Plus en détail

Introduction aux Méthodes de Monte Carlo

Introduction aux Méthodes de Monte Carlo Méthodes de Monte Carlo pour la Modélisation et le Calcul Intensif Applications à la Physique Numérique et à la Biologie Séminaire CIMENT GRID Introduction aux Méthodes de Monte Carlo Olivier François

Plus en détail

INTERNATIONAL CHAIR IN MATHEMATICAL PHYSICS AND APPLICATIONS (ICMPA) UNESCO CHAIR IN MATHEMATICAL PHYSICS AND APPLICATIONS

INTERNATIONAL CHAIR IN MATHEMATICAL PHYSICS AND APPLICATIONS (ICMPA) UNESCO CHAIR IN MATHEMATICAL PHYSICS AND APPLICATIONS INTERNATIONAL CHAIR IN MATHEMATICAL PHYSICS AND APPLICATIONS (ICMPA) UNESCO CHAIR IN MATHEMATICAL PHYSICS AND APPLICATIONS established in 2006 at the University of Abomey-Calavi (Republic of Benin) UNITWIN/UNESCO

Plus en détail

Qu est ce qu un réseau social. CNAM Séminaire de Statistiques Appliquées 13/11/2013. F.Soulié Fogelman 1. Utilisation des réseaux sociaux pour le

Qu est ce qu un réseau social. CNAM Séminaire de Statistiques Appliquées 13/11/2013. F.Soulié Fogelman 1. Utilisation des réseaux sociaux pour le Qui je suis Innovation Utilisation des réseaux sociaux pour le data mining Business & Decision Françoise Soulié Fogelman francoise.soulie@outlook.com Atos KDD_US CNAM Séminaire de Statistique appliquée

Plus en détail

Recommandation dans les réseaux sociaux professionnels

Recommandation dans les réseaux sociaux professionnels Recommandation dans les réseaux sociaux professionnels Application sur un réseau bibliographique 6 mai 2010 Objectif et Motivation Techniques utilisées Algorithme exhaustive de recherche de toutes les

Plus en détail

Le théorème de Perron-Frobenius, les chaines de Markov et un célèbre moteur de recherche

Le théorème de Perron-Frobenius, les chaines de Markov et un célèbre moteur de recherche Le théorème de Perron-Frobenius, les chaines de Markov et un célèbre moteur de recherche Bachir Bekka Février 2007 Le théorème de Perron-Frobenius a d importantes applications en probabilités (chaines

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane

Plus en détail

Propagation de labels avec barrages sur de grands graphes en utilisant Apache Hadoop et Apache Spark (GraphX)

Propagation de labels avec barrages sur de grands graphes en utilisant Apache Hadoop et Apache Spark (GraphX) Propagation de labels avec barrages sur de grands graphes en utilisant Apache Hadoop et Apache Spark (GraphX) Jean Philippe Attal *, ** Maria Malek * * EISTI: Ecole Internationale des Sciences du Traitement

Plus en détail

Analyse empirique et modélisation de la dynamique de la topologie de l Internet

Analyse empirique et modélisation de la dynamique de la topologie de l Internet Analyse empirique et modélisation de la dynamique de la topologie de l Internet Sergey Kirgizov Directrice de thèse: Clémence Magnien Complex Networks, LIP6, (UPMC, CNRS) Paris, 12 décembre 2014 Plan 1

Plus en détail

Initiation à la fouille de données et à l apprentissage automatiq

Initiation à la fouille de données et à l apprentissage automatiq Initiation à la fouille de données et à l apprentissage automatique 1 Laboratoire d Informatique Fondamentale de Marseille Université de Provence christophe.magnan@lif.univ-mrs.fr www.lif.univ-mrs.fr/

Plus en détail

Analyse intégrée des réseaux sociaux pour la détection et la visualisation de communautés

Analyse intégrée des réseaux sociaux pour la détection et la visualisation de communautés Analyse intégrée des réseaux sociaux pour la détection et la visualisation de communautés Juan David Cruz 1, Cécile Bothorel 1, François Poulet 2 1. Département LUSSI Télécom - Bretagne Technopôle Brest

Plus en détail

INF6304 Interfaces Intelligentes

INF6304 Interfaces Intelligentes INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie

Plus en détail

TP DE DATA MINING 2 : MODELISATION AVEC SPSS CLEMENTINE

TP DE DATA MINING 2 : MODELISATION AVEC SPSS CLEMENTINE TP DE DATA MINING 2 : MODELISATION AVEC SPSS CLEMENTINE EPF 4/ 5 ème année - Option Ingénierie d Affaires et de Projets - Finance Bertrand LIAUDET TP n 2 de DATA MINING : Modélisation 1 Jeu de données

Plus en détail

Fouille de données spatiales Mr Dib Abderrahim & Dr Mohamed-Khireddine KHOLLADI

Fouille de données spatiales Mr Dib Abderrahim & Dr Mohamed-Khireddine KHOLLADI Fouille de données spatiales Mr Dib Abderrahim & Dr Mohamed-Khireddine KHOLLADI Introduction On assiste de plus en plus à la création d entrepôts de données. Les raisons sont multiples : 1. le tout numérique

Plus en détail

Détection de communautés dans des réseaux scientifiques à partir de données relationnelles et textuelles

Détection de communautés dans des réseaux scientifiques à partir de données relationnelles et textuelles Détection de communautés dans des réseaux scientifiques à partir de données relationnelles et textuelles David Combe* Christine Largeron* Előd Egyed-Zsigmond** Mathias Géry* * Université de Lyon, F-42023,

Plus en détail

SONDY : une plateforme open-source d analyse et de fouille pour les réseaux sociaux en ligne

SONDY : une plateforme open-source d analyse et de fouille pour les réseaux sociaux en ligne SONDY : une plateforme open-source d analyse et de fouille pour les réseaux sociaux en ligne Adrien GUILLE, C. Favre, Djamel Abdelkader Zighed To cite this version: Adrien GUILLE, C. Favre, Djamel Abdelkader

Plus en détail

Théorie des graphes. Introduction. Programme de Terminale ES Spécialité. Résolution de problèmes à l aide de graphes. Préparation CAPES UCBL

Théorie des graphes. Introduction. Programme de Terminale ES Spécialité. Résolution de problèmes à l aide de graphes. Préparation CAPES UCBL Introduction Ces quelques pages ont pour objectif de vous initier aux notions de théorie des graphes enseignées en Terminale ES. Le programme de Terminale (voir ci-après) est construit sur la résolution

Plus en détail

Les logiciels Ucinet et Netdraw

Les logiciels Ucinet et Netdraw École d été Web intelligence 6 au 10 juillet 2009 Les graphes et leurs différentes formes Des données à la construction du graphe Une forme plus avancée de représentation Densité d un graphe Graphe connexe

Plus en détail

De la donnée à la décision. Sofian MAABOUT LaBRI. Université Bordeaux 1

De la donnée à la décision. Sofian MAABOUT LaBRI. Université Bordeaux 1 De la donnée à la décision Sofian MAABOUT LaBRI. Université Bordeaux 1 1 Décider c est choisir, parmi plusieurs actes possibles, celui qui apparaît comme le plus pertinent pour atteindre un résultat envisagé,

Plus en détail

L informatique des entrepôts de données

L informatique des entrepôts de données L informatique des entrepôts de données Daniel Lemire SEMAINE 13 L exploration des données 13.1. Présentation de la semaine L exploration de données (ou data mining) est souvent associée à l intelligence

Plus en détail

COURS SYRRES RÉSEAUX SOCIAUX INTRODUCTION. Jean-Loup Guillaume

COURS SYRRES RÉSEAUX SOCIAUX INTRODUCTION. Jean-Loup Guillaume COURS SYRRES RÉSEAUX SOCIAUX INTRODUCTION Jean-Loup Guillaume Le cours Enseignant : Jean-Loup Guillaume équipe Complex Network Page du cours : http://jlguillaume.free.fr/www/teaching-syrres.php Évaluation

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

Fouille de Données et Media Sociaux Cours 2 Master DAC Data Science UPMC - LIP6

Fouille de Données et Media Sociaux Cours 2 Master DAC Data Science UPMC - LIP6 Fouille de Données et Media Sociaux Cours 2 Master DAC Data Science UPMC - LIP6 Ludovic Denoyer 21 septembre 2015 Ludovic Denoyer () FDMS 21 septembre 2015 1 / 1 Contexte Observation La plupart des bonnes

Plus en détail

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique Objectifs Clustering On ne sait pas ce qu on veut trouver : on laisse l algorithme nous proposer un modèle. On pense qu il existe des similarités entre les exemples. Qui se ressemble s assemble p. /55

Plus en détail

Utilisation des diagrammes de Voronoï et des algorithmes génétiques pour l'étude des complexes protéine-protéine.

Utilisation des diagrammes de Voronoï et des algorithmes génétiques pour l'étude des complexes protéine-protéine. Utilisation des diagrammes de Voronoï et des algorithmes génétiques pour l'étude des complexes protéine-protéine. Anne Poupon Biologie et Bioinformatique des Systèmes de Signalisation INRA - Nouzilly France

Plus en détail

PRÉSENTATION TRAVAIL EN COURS - APPRENTISSAGE INTERACTIF. Ianis Lallemand, 21 janvier 2013

PRÉSENTATION TRAVAIL EN COURS - APPRENTISSAGE INTERACTIF. Ianis Lallemand, 21 janvier 2013 PRÉSENTATION TRAVAIL EN COURS - APPRENTISSAGE INTERACTIF Ianis Lallemand, 21 janvier 2013 APPRENTISSAGE INTERACTIF definition Contours encore assez flous dans le champ de l apprentissage automatique. Néanmoins,

Plus en détail

Traitements appliqués à la photointerprétation

Traitements appliqués à la photointerprétation Traitements numériques des images de télédétection Traitements appliqués à la photointerprétation OLIVIER DE JOINVILLE 3e partie Table des matières I - L'analyse en composantes principales 5 II - La détection

Plus en détail

SPLEX Statistiques pour la classification et fouille de données en

SPLEX Statistiques pour la classification et fouille de données en SPLEX Statistiques pour la classification et fouille de données en génomique Classification Linéaire Binaire CLB Pierre-Henri WUILLEMIN DEcision, Système Intelligent et Recherche opérationnelle LIP6 pierre-henri.wuillemin@lip6.fr

Plus en détail

Apprentissage pour la Recherche d Information

Apprentissage pour la Recherche d Information Apprentissage pour la Recherche d Information Massih-Reza Amini Université Joseph Fourier Laboratoire d Informatique de Grenoble 2/51 Apprentissage Evaluation en RI RI et catégorisation RI et ordonnancement

Plus en détail

Arbres binaires. Hélène Milhem. Institut de Mathématiques de Toulouse, INSA Toulouse, France IUP SID, 2011-2012

Arbres binaires. Hélène Milhem. Institut de Mathématiques de Toulouse, INSA Toulouse, France IUP SID, 2011-2012 Arbres binaires Hélène Milhem Institut de Mathématiques de Toulouse, INSA Toulouse, France IUP SID, 2011-2012 H. Milhem (IMT, INSA Toulouse) Arbres binaires IUP SID 2011-2012 1 / 35 PLAN Introduction Construction

Plus en détail

Principales caractéristiques de Mixmod

Principales caractéristiques de Mixmod Modèle de mélanges Principales caractéristiques de Mixmod Gérard Govaert et Gilles Celeux 24 octobre 2006 1 Plan Le modèledemélange Utilisations du modèle de mélange Les algorithmes de Mixmod Modèle de

Plus en détail

Formation Actuaire Data-Scientist PROGRAMME

Formation Actuaire Data-Scientist PROGRAMME Formation Actuaire Data-Scientist PROGRAMME 15 Septembre 2014 Arthur Charpentier, Romuald Élie & Jérémie Jakubowicz 15914 Programme Séance inaugurale : révolu-on numérique besoins des entreprises cadre

Plus en détail

L'ANALYSE DYNAMIQUE DE RESEAUX SOCIAUX METHODE ET APPLICATION (SIENA POUR LES NULS) COMPLETS AVEC SIENA. Ainhoa de Federico de la Rúa

L'ANALYSE DYNAMIQUE DE RESEAUX SOCIAUX METHODE ET APPLICATION (SIENA POUR LES NULS) COMPLETS AVEC SIENA. Ainhoa de Federico de la Rúa L'ANALYSE DYNAMIQUE DE RESEAUX SOCIAUX COMPLETS AVEC SIENA METHODE ET APPLICATION (SIENA POUR LES NULS) Ainhoa de Federico de la Rúa Université de Toulouse II Le Mirail CERS LISST RESEAUX CAUSES OU EFFETS?

Plus en détail

INTRODUCTION A LA SIMULATION SOUS Electronics Workbench (SPICE2.0).

INTRODUCTION A LA SIMULATION SOUS Electronics Workbench (SPICE2.0). INTRODUCTION A LA SIMULATION SOUS Electronics Workbench (SPICE2.0). 1970 : LINPACK, EISPACK STANFORD 1973 : SPICE (Thèse de doctorat) 1.0 : Berkeley Univ. Programme de Simulation de circuits linéaires

Plus en détail

Objectif du groupe GT1.1 Fusion de Données

Objectif du groupe GT1.1 Fusion de Données Objectif du groupe GT1.1 Fusion de Données Le groupe travaille dans trois directions Le vocabulaire (piloté par ADVITAM et l aide de SITE) L état de l art (piloté par SYROKKO) Deux applications illustratives

Plus en détail

Resolution limit in community detection

Resolution limit in community detection Introduction Plan 2006 Introduction Plan Introduction Introduction Plan Introduction Point de départ : un graphe et des sous-graphes. But : quantifier le fait que les sous-graphes choisis sont des modules.

Plus en détail

Glossaire Analyse en Composantes Principales (ACP) Analyse Factorielle des Correspondances (AFC) Apprentissage supervisé Apprentissage non supervisé

Glossaire Analyse en Composantes Principales (ACP) Analyse Factorielle des Correspondances (AFC) Apprentissage supervisé Apprentissage non supervisé Glossaire Analyse en Composantes Principales (ACP) : *méthode factorielle (Pearson 1901, Hotelling 1933) permettant de fournir un résumé descriptif (sous forme graphique le plus souvent) d une population

Plus en détail

Reconnaissance des formes : Classement d ensembles d objets

Reconnaissance des formes : Classement d ensembles d objets Reconnaissance des formes : Classement d ensembles d objets Données Méthodes Extraction de connaissances Applications Expertise Apprentissage Bernard FERTIL Directeur de Recherche CNRS Équipe LXAO, UMR

Plus en détail

Estimation de la densité d arcs dans les graphes de grande taille: une alternative à la détection de clusters

Estimation de la densité d arcs dans les graphes de grande taille: une alternative à la détection de clusters Estimation de la densité d arcs dans les graphes de grande taille: une alternative à la détection de clusters Marc Boullé Orange Labs, 2 avenue Pierre Marzin, 22300 Lannion marc.boulle@orange-ftgroup.com,

Plus en détail

MIXMOD. Un ensemble logiciel de classification des données par modèles de mélanges MIXMOD. F. Langrognet () MIXMOD Avril 2012 1 / 28

MIXMOD. Un ensemble logiciel de classification des données par modèles de mélanges MIXMOD. F. Langrognet () MIXMOD Avril 2012 1 / 28 MIXMOD Un ensemble logiciel de classification des données par modèles de mélanges MIXMOD F. Langrognet () MIXMOD Avril 2012 1 / 28 PLAN 1 La classification des données 2 MIXMOD, ensemble logiciel de classification

Plus en détail

Extraction hiérarchique de fenêtres de temps basée sur la structure communautaire

Extraction hiérarchique de fenêtres de temps basée sur la structure communautaire Extraction hiérarchique de fenêtres de temps basée sur la structure communautaire Thomas Aynaud et Jean-Loup Guillaume LIP6 CNRS Université Pierre et Marie Curie 4 place Jussieu 75005 Paris, France RÉSUMÉ.

Plus en détail

Master IAD Module PS. Reconnaissance de la parole (suite) Modèles de Markov et bases de données. Gaël RICHARD Février 2008

Master IAD Module PS. Reconnaissance de la parole (suite) Modèles de Markov et bases de données. Gaël RICHARD Février 2008 Master IAD Module PS Reconnaissance de la parole (suite) Modèles de Markov et bases de données Gaël RICHARD Février 2008 1 Reconnaissance de la parole Introduction Approches pour la reconnaissance vocale

Plus en détail

Connected. The Surprising Power of Our Social Networks and How They Shape Our Lives Nicholas A. Christakis and James H. Fowler

Connected. The Surprising Power of Our Social Networks and How They Shape Our Lives Nicholas A. Christakis and James H. Fowler Livres & Idées Connected. The Surprising Power of Our Social Networks and How They Shape Our Lives Nicholas A. Christakis and James H. Fowler Réseaux sociaux, reflets de la vie réelle morgan poulizac Consultant

Plus en détail

DATA MINING 2 Réseaux de Neurones, Mélanges de classifieurs, SVM avancé

DATA MINING 2 Réseaux de Neurones, Mélanges de classifieurs, SVM avancé I. Réseau Artificiel de Neurones 1. Neurone 2. Type de réseaux Feedforward Couches successives Récurrents Boucles de rétroaction Exemples de choix pour la fonction : suivant une loi de probabilité Carte

Plus en détail

Insertion de proximal SVM dans des arbres aléatoires, mode d emploi

Insertion de proximal SVM dans des arbres aléatoires, mode d emploi Insertion de proximal SVM dans des arbres aléatoires, mode d emploi Cédric Simon 1, Jérôme Meessen 2, Christophe De Vleeschouwer 1 1 Laboratoire de Télécommunication et Télédétection, UCL 2, Place du Levant,

Plus en détail

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé A. P. M. E. P. Exercice 1 5 points 1. Réponse d. : 1 e Le coefficient directeur de la tangente est négatif et n est manifestement pas 2e

Plus en détail

FOUILLE DE DONNEES. Anne LAURENT ECD. laurent@lirmm.fr

FOUILLE DE DONNEES. Anne LAURENT ECD. laurent@lirmm.fr FOUILLE DE DONNEES Anne LAURENT laurent@lirmm.fr ECD Pourquoi la fouille de données? Données disponibles Limites de l approche humaine Nombreux besoins : Industriels, Médicaux, Marketing, Qu est-ce que

Plus en détail

Réseaux complexes: d Internet aux pandémies

Réseaux complexes: d Internet aux pandémies Réseaux complexes: d Internet aux pandémies Marc Barthelemy CEA, Institut de Physique Théorique, Saclay, France EHESS, Centre d Analyse et de Mathématiques sociales, Paris, France marc.barthelemy@cea.fr

Plus en détail

Analyse et modélisation de visages

Analyse et modélisation de visages Analyse et modélisation de visages Pascal Bourdon Laboratoire XLIM-SIC (UMR CNRS 7252) / Université de Poitiers pascal.bourdon@univ-poitiers.fr Analyse et modélisation de visages Plan Introduction Outils

Plus en détail

Méthodes de classification organisée pour la recherche de communautés dans les réseaux sociaux

Méthodes de classification organisée pour la recherche de communautés dans les réseaux sociaux Méthodes de classification organisée pour la recherche de communautés dans les réseaux sociaux Nathalie Villa 1,2 & Fabrice Rossi 3 1 IUT STID, Carcassonne, Université de Perpignan Domaine Universitaire

Plus en détail

Analyse de données longitudinales continues avec applications

Analyse de données longitudinales continues avec applications Université de Liège Département de Mathématique 29 Octobre 2002 Analyse de données longitudinales continues avec applications David MAGIS 1 Programme 1. Introduction 2. Exemples 3. Méthodes simples 4.

Plus en détail

Théorie des Langages

Théorie des Langages Théorie des Langages Automates Claude Moulin Université de Technologie de Compiègne Printemps 2013 Sommaire 1 Automate fini 2 Automate et langages réguliers 3 Automate à pile Automate fini déterministe

Plus en détail

École Doctorale Cerveau et Coginition Laboratoire d InfoRmatique en Images et Systèmes d information LIRIS - UMR CNRS 5205 - Équipe TURING

École Doctorale Cerveau et Coginition Laboratoire d InfoRmatique en Images et Systèmes d information LIRIS - UMR CNRS 5205 - Équipe TURING Université Lumière Lyon2 École Doctorale Cerveau et Coginition Laboratoire d InfoRmatique en Images et Systèmes d information LIRIS - UMR CNRS 5205 - Équipe TURING UNE MODÉLISATION ÉVOLUTIONNISTE DU LIAGE

Plus en détail

RECHERCHE OPERATIONNELLE

RECHERCHE OPERATIONNELLE RECHERCHE OPERATIONNELLE PROBLEME DE L ARBRE RECOUVRANT MINIMAL I - INTRODUCTION (1) Définitions (2) Propriétés, Conditions d existence II ALGORITHMES (1) Algorithme de KRUSKAL (2) Algorithme de PRIM I

Plus en détail

Apprentissage de structure dans les réseaux bayésiens pour

Apprentissage de structure dans les réseaux bayésiens pour Apprentissage de structure dans les réseaux bayésiens pour la détection d événements vidéo Siwar Baghdadi 1, Claire-Hélène Demarty 1, Guillaume Gravier 2, et Patrick Gros 3 1 Thomson R&D France, 1 av Belle

Plus en détail

Examen de rattrapage

Examen de rattrapage Université Denis Diderot Paris 7 7 juin 4 Probabilités et Simulations UPS36 Examen de rattrapage durée : 3 heures Les documents et calculatrices ne sont pas autorisés. On prendra soin de bien justifier

Plus en détail

Statistique et analyse de données pour l assureur : des outils pour la gestion des risques et le marketing

Statistique et analyse de données pour l assureur : des outils pour la gestion des risques et le marketing Statistique et analyse de données pour l assureur : des outils pour la gestion des risques et le marketing Gilbert Saporta Chaire de Statistique Appliquée, CNAM ActuariaCnam, 31 mai 2012 1 L approche statistique

Plus en détail

Fouille de données et aide à la décision.

Fouille de données et aide à la décision. Fouille de données et aide à la décision. Introduction au datamining. Anne-Claire Haury M2 Informatique Université Denis Diderot Second semestre 2014-2015 1 Introduction 2 Outline 1 Peut-on faire dire

Plus en détail

Modèles à Événements Discrets. Réseaux de Petri Stochastiques

Modèles à Événements Discrets. Réseaux de Petri Stochastiques Modèles à Événements Discrets Réseaux de Petri Stochastiques Table des matières 1 Chaînes de Markov Définition formelle Idée générale Discrete Time Markov Chains Continuous Time Markov Chains Propriétés

Plus en détail

Théorie du chaos multiplicatif et application à l étude de la mesure MRM lognormale. 15 novembre 2010

Théorie du chaos multiplicatif et application à l étude de la mesure MRM lognormale. 15 novembre 2010 Théorie du chaos multiplicatif et application à l étude de la mesure MRM lognormale 15 novembre 2010 Table des matières 1 Rappel sur les Processus Gaussiens 2 Théorie du chaos multiplicatif gaussien de

Plus en détail

Classification. Session organisée par Charles Bouveyron et Francois Caron et Marie Chavent

Classification. Session organisée par Charles Bouveyron et Francois Caron et Marie Chavent Classification Session organisée par Charles Bouveyron et Francois Caron et Marie Chavent La classification a pour objet de regrouper des données en classes possédant des caractéristiques similaires. La

Plus en détail

Master ISI 2010-2011. Data Mining Recherche des sous-ensembles fréquents

Master ISI 2010-2011. Data Mining Recherche des sous-ensembles fréquents Master ISI 2010-2011 Data Mining Recherche des sous-ensembles fréquents Yves Lechevallier INRIA-Rocquencourt E_mail : Yves.Lechevallier@inria.fr 1 Processus Data Mining Phase A : Entrepôt de données Entrepôt

Plus en détail

Partie I : Automates et langages

Partie I : Automates et langages 2 Les calculatrices sont interdites. N.B. : Le candidat attachera la plus grande importance à la clarté, à la précision et à la concision de la rédaction. Si un candidat est amené à repérer ce qui peut

Plus en détail

Approche bayésienne des modèles à équations structurelles

Approche bayésienne des modèles à équations structurelles Manuscrit auteur, publié dans "42èmes Journées de Statistique (2010)" Approche bayésienne des modèles à équations structurelles Séverine Demeyer 1,2 & Nicolas Fischer 1 & Gilbert Saporta 2 1 LNE, Laboratoire

Plus en détail

BI = Business Intelligence Master Data-ScienceCours 7 - Data

BI = Business Intelligence Master Data-ScienceCours 7 - Data BI = Business Intelligence Master Data-Science Cours 7 - Data Mining Ludovic DENOYER - UPMC 30 mars 2015 Ludovic DENOYER - Typologie des méthodes de Data Mining Différents types de méthodes : Méthodes

Plus en détail

Notes de cours Moteurs de recherche : Master 2 Pro, Université Paris Diderot

Notes de cours Moteurs de recherche : Master 2 Pro, Université Paris Diderot Notes de cours Moteurs de recherche : Master 2 Pro, Université Paris Diderot Michel Habib and Antoine Meyer 22 janvier 2009 1 Introduction Ce document a été rédigé à partir des trois mémoires de thèses

Plus en détail

Introduction au datamining

Introduction au datamining Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des

Plus en détail

Recherche d information textuelle

Recherche d information textuelle Recherche d information textuelle Pré-traitements & indexation B. Piwowarski CNRS / LIP6 Université Paris 6 benjamin@bpiwowar.net http://www.bpiwowar.net Master IP - 2014-15 Cours et travaux pratiques

Plus en détail

L'intelligence d'affaires: la statistique dans nos vies de consommateurs

L'intelligence d'affaires: la statistique dans nos vies de consommateurs L'intelligence d'affaires: la statistique dans nos vies de consommateurs Jean-François Plante, HEC Montréal Marc Fredette, HEC Montréal Congrès de l ACFAS, Université Laval, 6 mai 2013 Intelligence d affaires

Plus en détail

Distributions bayésiennes nonparamétriques sur les matrices binaires triangulaires infinies : Applications aux modèles graphiques

Distributions bayésiennes nonparamétriques sur les matrices binaires triangulaires infinies : Applications aux modèles graphiques Distributions bayésiennes nonparamétriques sur les matrices binaires triangulaires infinies : Applications aux modèles graphiques Patrick Dallaire Université Laval Département d informatique et de génie

Plus en détail