Analyse des réseaux sociaux

Dimension: px
Commencer à balayer dès la page:

Download "Analyse des réseaux sociaux"

Transcription

1 Analyse des réseaux sociaux Emmanuel Viennet Laboratoire de Traitement et Transport de l Information L2TI Université Paris 13 Réseaux sociaux, analyse et data mining École Normale Supérieure Journée organisée par le groupe «Data mining et apprentissage» Société Française de Statistique 16/02/2010 E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

2 Plan de l exposé 1 Introduction: fouille des réseaux sociaux 2 Caractérisation des réseaux sociaux 3 Analyse relations/contenu: un exemple d approche 4 Analyse structurelle: communautés 5 Catégorisation de nœuds 6 Méthodes à noyaux pour les graphes E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

3 Plan de l exposé 1 Introduction: fouille des réseaux sociaux 2 Caractérisation des réseaux sociaux 3 Analyse relations/contenu: un exemple d approche 4 Analyse structurelle: communautés 5 Catégorisation de nœuds 6 Méthodes à noyaux pour les graphes

4 Croissance du Web... E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

5 Croissance des médias sociaux Du web des contenus au web des utilisateurs? Début 2010: Facebook: 400 millions d utilisateurs Twitter: 20 à 60 millions Orkut: 25 millions au Brésil SkyBlog, MySpace, LinkedIn,... E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

6 Les entreprises collectent de plus en plus de données sur les relations entre leurs clients E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

7 Mais quels modèles économiques? Sites payants: peu d audience Sites institutionnels (services publics) Mécénat, donations (Wikipédia) Site gratuits, publicité Publicité personnalisée Marketing viral Marketing temps réel... Et pour fidéliser les visiteurs d un site social : animation de communauté, suivi d un site à l autre,... besoin d analyse (fouille) de données de type graphe E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

8 Mais quels modèles économiques? Sites payants: peu d audience Sites institutionnels (services publics) Mécénat, donations (Wikipédia) Site gratuits, publicité Publicité personnalisée Marketing viral Marketing temps réel... Et pour fidéliser les visiteurs d un site social : animation de communauté, suivi d un site à l autre,... besoin d analyse (fouille) de données de type graphe E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

9 Contexte: fouille de données structurées Des tables aux données structurées... Modèles: discrimination, régression, classification... E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

10 Réseaux (sociaux ou non) Pages Web Routeurs Internet Facebook Communications Citations Biologie E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

11 Réseaux sociaux à l ère Internet... Appels téléphoniques Courrier électronique Réseaux de co-auteurs Réseaux d amitié Réseaux organisationnels Réseaux d affiliation E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

12 Exemple: le réseau Twitter Chaque utilisateur: émet de courts messages (140 caractères) suit (reçoit) les messages de quelques utilisateurs suivi (lu) par d autres. Tous les messages sont publics Environ 25 millions d utilisateurs (?) E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

13 Analyse du réseau Twitter (2007, Bruno Peeters, Belgium) E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

14 Marketing & recommandation: la longue traine Chris Anderson, The Long Tail, Wired, Issue October 2004 E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

15 Marketing, recommandation et réseaux sociaux Besoin de recommandations personnalisées! > 50% font des recherches en ligne avant d acheter Les recommandations personnalisées sont basées sur les achats et notations passées, par ex. le système d Amazon les clients qui ont acheté ceci achètent aussi cela MovieLens, based on ratings of users like you... Epinions, based on the opinions of the raters you trust... Nous sommes plus facilement influencés par nos amis que par des inconnus! 68% des clients consultent leurs amis ou famille avant d acheter des produits électroniques (Burke 2003) E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

16 Applications de l analyse des réseaux sociaux Étude de la structure des réseaux: communautés, diffusion,... (animation, vente ciblée) Web: recherche, extraction d information Marketing: identifier des groupes de clients ou produits pour faire des recommandations (publicité ciblée, marketing viral) Personalisation (interfaces, services) Epidémiologie Détection de fraude Sécurité (contre-terrorisme)... E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

17 Problèmes intéressants pour la fouille de données Un domaine scientifiquement passionnant et pluri-disciplinaire: Data mining et Apprentissage pour: la caractérisation des réseaux sociaux la modèlisation de la diffusion d information (par ex. pour le marketing viral) la modèlisation de l évolution (par ex. créations de nouveaux liens) la classification de nœuds E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

18 Plan de l exposé 1 Introduction: fouille des réseaux sociaux 2 Caractérisation des réseaux sociaux 3 Analyse relations/contenu: un exemple d approche 4 Analyse structurelle: communautés 5 Catégorisation de nœuds 6 Méthodes à noyaux pour les graphes

19 Ordres de grandeurs Quelques jeux de données utilisés en recherche: Nombre de nœuds s labo sur 2 mois s sur 2 ans amitiés entre bloggueurs 4,4 millions Téléphone millions Communications IM 240 millions Parcimonie (sparseness): nombre de liens proportionnel au nombre de nœuds. E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

20 Graphes Théorie des graphes depuis Euler... Très nombreux résultats: chemins, flots, cliques, décompositions spectrales C A E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

21 Réseaux sociaux et graphes: quelles différences? Un réseau social est un graphe, mais: nœuds porteurs d attributs liens valués pouvant porter des données (messages) similarité entre deux nœuds = f (attributs, liens) caractéristique du réseau 6= graphe aléatoire (propriétés structurelles spéciales) E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

22 Exemple de propriété structurelle: l effet petit monde Longueur moyenne du plus court chemin reliant deux nœuds petite. six degrés de séparation Caractéristique liée à la distribution des degrés: graphe sans-échelle (Barabasi, 2000), suivant une loi de Pareto: P(degré d un nœud = k) k γ E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

23 Exemple: simulation du réseau Internet (Mahadevan et al., 2007) E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

24 Etude des réseaux sociaux: terminologie Contagion: flux dans le graphe (microbes, information, modes...) Connection: arêtes du graphe social Homophilie: qui se ressemble s assemble E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

25 Transitivité dans les réseaux sociaux Une relation sociale est transitive si tous les acteurs sont liés: triangles Coefficient de clustering Lié au nombre de voisins d un nœud qui sont eux mêmes reliés (Watts et Strogatz, 1998) A, C: grande transitivité, ancrés dans leurs groupes B, D: faible transitivité, ponts E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

26 Intermédiarité Définition Nombre de plus courts chemins passant par une arête (Newman 2004) Utilisation: nœuds importants pour la communication découpage en communautés E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

27 Communautés (P. Pons, 2007) Recherche de communautés = partitionnement du graphe en N Identification = recherche d une communauté autour d un nœud donné E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

28 E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

29 Hiérarchie de communautés et modularité D après Newman & Girvan, 2004 E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

30 Intérêt de la recherche de communautés Organisation structurelle (micro ou macro) Évolution temporelle (voir exposé de JL Guillaume) Visualisation Permettre une analyse locale des interactions Animation des réseaux sociaux... E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

31 Plan de l exposé 1 Introduction: fouille des réseaux sociaux 2 Caractérisation des réseaux sociaux 3 Analyse relations/contenu: un exemple d approche 4 Analyse structurelle: communautés 5 Catégorisation de nœuds 6 Méthodes à noyaux pour les graphes

32 Clustering à base de modèle pour les réseaux sociaux Ce type d approche vise à modéliser simulanément les distributions de probabilité des attributs de nœuds et de leurs positions dans l espace social : on introduit des variables latentes. Représentation du réseau social La matrice Y ij décrit les liens entre les nœuds. Z = z i R d donne les positions des nœuds dans l espace (latent) R d E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

33 Modélisation (suite): le modèle Exemple: approche de Handcock & Raftery, 2006 n nœuds, Y = y ij matrice d adjacence ( sociomatrix ). Les liens sont considérés comme indépendants: P(Y Z, X, β) = i j P(y ij z i, z j, x ij, β) où: X : attributs des nœuds (ou de la paire (i, j)) β : paramètres du modèle Modélisation par régression logistique: avec 1 n i z i 2 = 1 logit(y ij = 1 z i, z j, x ij, β) = β T 0 x ij β 1 z i z j E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

34 Modélisation (suite): estimation Clustering par modélisation des coordonnées z i en mixture de gaussiennes: z i G λ g exp( z i µ g 2 ) with λ g > 0 and λ g = 1 g=1 2σ 2 g G nombre de clusters, fixé à priori Estimation des paramètres : maximum de vraisemblance (chaîne de Markov ou Monte Carlo) estimation coûteuse en calculs E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

35 Modélisation (suite):: application 1 Le choix du nombre de clusters G se pose comme un problème de sélection de modèle (utiliser par exemple un critère BIC) lent! Relations entre moines Étude sociologique: amitié entre moines 18 nœuds (moines) 3 groupes de moines, qui correspondent à ceux identifiés par les sociologues E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

36 Modélisation (suite): application 2 Liens entre adolescents dans un collège Relations entre 71 adolescents (ici 6 clusters) E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

37 Modélisation (suite): conclusions Méthodes complexes (calculs lourds) mais précises Prise en compte simultanée des liens et des nœuds Applicable uniquement aux très petits réseaux! = on utilise souvent les méthodes structurelles d extraction de communautés, qui ne prennent en compte que les liens (le graphe) E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

38 Plan de l exposé 1 Introduction: fouille des réseaux sociaux 2 Caractérisation des réseaux sociaux 3 Analyse relations/contenu: un exemple d approche 4 Analyse structurelle: communautés 5 Catégorisation de nœuds 6 Méthodes à noyaux pour les graphes

39 Principal critère de qualité: la modularité La modularité mesure la qualité d un découpage du graphe en c communautés Q = i (d ii ( j d ij ) 2 ) D matrice c c, dont les éléments d ij donnent la proportion de liens reliant des nœuds de la communauté i à la communauté j Q [ 1, 1] mesure la densité des liens intra-communautaires vs inter-communautaires E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

40 Recherche de communautés structurelles De nombreux progrès récents Méthodes basées sur l intermédiarité Première proposition: Newman & Girvan (2004) Répéter: 1 calculer l intermédiarité des arêtes 2 couper l arête la plus importante jusqu à isoler tous les nœuds (méthode séparative) Pour un grand réseau parcimonieux de n nœuds: Newman & Girvan 2004 O(n 3 ) Newman 2004 O(n 2 ) Wakita & Tsurumi 2007 O(n log 2 n) Blondel et al. (Louvain) 2008 O(n log n) moins de 5 minutes pour 1 million de nœuds, ou 40 minutes pour 23 millions E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

41 Exemple 1: réseau de collaboration entre scientifiques D après K. Martin et M. Avnet, E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

42 Exemple 2: site web collaboratif Liens entre utilisateurs du site MyMondomix (projet ANR CADI) Modularité Q = 0, 62 E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

43 Exemple 3: XTelco Données d un opérateur téléphonique Numéro appelant Numéro appelé Durée d appel millions d appels, 25 millions de clients. Niveau Nœuds Modularité 0 22 millions 0,53 1 2,5 millions 0, , ,79 E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

44 Identification of communautés Chercher un voisinage (micro-communauté) à partir d un nœud donné E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

45 Principes de l approche physique (Wu & Huberman) On considère le graphe comme un circuit électrique Loi de Kirchhoff sur le nœud C: n I i = i=1 n i=1 V Di V C R = 0 Si graphe avec arcs valués par w ij, on défini R ij = w 1 ij On fixe la tension en deux nœuds: V 1 = 1, V 2 = 0 et on a: V i = 1 k i n V j a ij + 1 a i1 k i j=3 pour i = 3,..., n k i : degré du nœud i, a ij matrice d adjacence. Ce système d équations linéaires se résoud en O(n 3 ) (lent). E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

46 Résolution approchée rapide Méthode itérative: 1 fixer V 1 = 1, V 2 = = V n = 0 (en temps O(V )) 2 mettre à jour la tension de chaque nœud (en O(E)) 3 répèter l étape 2 La précision après l étape 2 ne dépend que du nombre d itérations, pas de la taille du graphe. Quelques dizaines d itérations suffisent pour converger. E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

47 Recherche de communautés: problèmes ouverts Prendre en compte (efficacement) les attributs des nœuds et la structure du graphe. La modularité est-elle le bon critère? (eg Fortunato 2006) Contrôler la distribution des tailles des communautés Communautés avec recouvrement Suivi dynamique Graphes bipartites E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

48 Plan de l exposé 1 Introduction: fouille des réseaux sociaux 2 Caractérisation des réseaux sociaux 3 Analyse relations/contenu: un exemple d approche 4 Analyse structurelle: communautés 5 Catégorisation de nœuds 6 Méthodes à noyaux pour les graphes

49 Catégorisation de nœuds Applications: marketing (churn, influence), categorization de textes,...?? E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

50 Catégorisation de nœuds Première approche: Relaxation labeling par ex. (Angelova et al 2006) Augmentation d un tiers du score F1 / SVM sur les noeuds seuls. => gains importants sur des applications diverses E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

51 Catégorisation de nœuds: une approche simple La RL est lente sur de grands graphes Idée: pour catégoriser les nœuds à partir de leurs attributs et de leur position dans le graphe, exprimer celle ci comme de nouveaux attributs: caractéristiques locales du graphe (degré, triangles,...) attributs décrivant la communauté à laquelle appartient le nœud E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

52 Exemple: catégorisation de texte E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

53 Catégorisation de texte (suite) E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

54 Application: triage de bugs (Bugzilla) Bug tracker du projet Eclipse (Open Source) Réseau de développeurs bug reports, 2100 utilisateurs liens: personnes travaillant sur le même bug objectif: associer le bug à un développeur Niveau # communautés Modularité Méthode Performance TF-IDF SVM 32% TF-IDF + Communauté de l auteur SVM 38% E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

55 Plan de l exposé 1 Introduction: fouille des réseaux sociaux 2 Caractérisation des réseaux sociaux 3 Analyse relations/contenu: un exemple d approche 4 Analyse structurelle: communautés 5 Catégorisation de nœuds 6 Méthodes à noyaux pour les graphes

56 Espace de représentation et noyaux Projection dans un espace de représentation: transformation Φ X Φ F O X Φ(Ο) Φ(X) Φ(Ο) O X X X Φ(Ο) Φ(X) O Φ(Ο) Φ(X) Φ(X) O X Φ(Ο) Φ(X) O Kernel K (x, y) = < φ(x), φ(y) > SVM non linéaire: ŷ = α i K (x i, x) + b i SV kernel trick utilisé dans de nombreux modèles, comme l ACP, l Analyse Discriminante, la régression PLS,... peut s appliquer aux cas où l on ne dispose pas de représentation vectorielle des exemples (chaînes de symboles, arbres, graphes...) E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

57 Définir des noyaux Condition d admissibilité symétrique: k(x, y) = k(y, x) semi-définie positive: c i c j k(x i, x j ) 0 On peut construire des noyaux à partir d autres noyaux: combinaison: k(x, y) = w α k α (x, y), w α 0 composition: k(x, y) = D k d (x d, y d ) (Haussler 1999) d=1 Exemples: noyaux pour séquences, arbres, graphes Exemple simple: noyau sur arbres t t c 0 c 1 c 2 c 0 c 1 k(t, t ) = 2 1 k c (c i, c j ) i=0 j=0 E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

58 Définir des noyaux Condition d admissibilité symétrique: k(x, y) = k(y, x) semi-définie positive: c i c j k(x i, x j ) 0 On peut construire des noyaux à partir d autres noyaux: combinaison: k(x, y) = w α k α (x, y), w α 0 composition: k(x, y) = D k d (x d, y d ) (Haussler 1999) d=1 Exemples: noyaux pour séquences, arbres, graphes Exemple simple: noyau sur arbres t t c 0 c 1 c 2 c 0 c 1 k(t, t ) = 2 1 k c (c i, c j ) i=0 j=0 E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

59 Apprentissage à base de noyaux pour la catégorisation de nœuds Rappel: condition d admissibilité K semi-définie positive: f x, f x f x K (x, x ) 0 x x Suivant l approche d Haussler (1999), on peut écrire: e βh = lim n (1 + βh n )n (1) = I + βh + β2 2! H2 + (2) H auto-adjoint K = e βh semi-définie positive. Le paramètre β contrôle la localité du noyau obtenu (diffusion sur le graphe). E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

60 Noyau de diffusion 1 si i j Laplacien du graphe: L = D A, soit L = d i si i = j 0 sinon Le Laplacien se retrouve souvent en analyse spectrale des graphes. Remarque: t w, w T Hw = Ψ = µ Ψ : équation de la chaleur Si K = e βh, on a d dβ K β = LK β & Lafferty 2002). (i,j) E (w i w j ) 2 : équation de la chaleur sur le graphe (Kondor K β (i, j) can be seen as the energy injected in i received in j, with diffusion parameter β E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

61 Noyau de diffusion: mise en œuvre K (0) = I ( K (β) = lim I + βl ) s s s Problème: K est une matrice dense, même si L est sparse. utilisation impossible sur de très grands graphes Mais résultats intéressants: exemple jeux de données WebKB : pages webs, 7 classes ( universités) - de 8 à 15% d erreur en ignorant le texte des pages! Applications possibles en transductif (suggéré par Gärtner et Smola 2007). E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

62 Conclusions L analyse des réseaux sociaux pose de nouveaux défis pour la fouille de données: échantillons non iid, structure, grands volumes, évolution... Les nouvelles applications industrielles (Telco, Web 2.0,...) produisent d énormes volumes de données en réseau, avec une forte valeur potentielle Nombreuses recherches, nouvelles méthodes et algorithmes. Aujourd hui Évolution des communautés: J.-L. Guillaume Outils industriels: F. Soulié-Fogelman Analyse des données d un grand site social : R. Kirche Apprentissage et inférence: L. Denoyer E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

63 Références principales (1) Ouvrages généraux Albert-Laszlo Barabasi. Linked. Perseus Publishing, Nicholas A. Christakis and James H. Fowler. Connected: The Surprising Power of Our Social Networks and How They Shape Our Lives. Little, Brown and Company, Chris Anderson. The Long Tail. Random House Business, E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

64 Références principales (2) Recherche de communautés M. E. J. Newman. Modularity and community structure in networks. PNAS, 103(23): , June Luciano da F. Costa, Francisco A. Rodrigues, Gonzalo Travieso, and P. R. Villas Boas. Characterization of complex networks: A survey of measurements. Advances in Physics, 56(1): , January Santo Fortunato. Community detection in graphs. Physics Reports, Jun V.D. Blondel, J.L. Guillaume, R. Lambiotte, and E.L.J.S. Mech. Fast unfolding of communities in large networks. Journal of Statistical Mechanics: Theory and Experiment, P10008: , E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

65 Références principales (3) Graphes et apprentissage Jure Leskovec. Dynamics of large networks. PhD thesis, Carnegie Mellon University, September Diane J. Cook and Lawrence B. Holder. Mining Graph Data. John Wiley & Sons, Nello Cristianini and John Shawe-Taylor. An introduction to support vector machines : and other kernel-based learning methods. Cambridge University Press, March E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

66 Merci de votre attention! Ce travail a été partiellement financé par l ANR (projets CADI 2007 TLOG 003, Ex DEUSS 2009 CORD 010), par la DGCIS (projet CEDRES ) et par le pôle Cap Digital E. Viennet (L2TI) Analyse des réseaux sociaux 16/02/ / 69

Analyse des réseaux sociaux et apprentissage

Analyse des réseaux sociaux et apprentissage Analyse des réseaux sociaux et apprentissage Emmanuel Viennet Laboratoire de Traitement et Transport de l Information Université Paris 13 - Sorbonne Paris Cité Réseaux sociaux? Réseaux sociaux? Analyse

Plus en détail

FaceBook aime les Maths!

FaceBook aime les Maths! FaceBook aime les Maths! Michel Rigo http://www.discmath.ulg.ac.be/ http://orbi.ulg.ac.be/ Réseaux Visualizing my Twitter Network by number of followers. Michael Atkisson http://woknowing.wordpress.com/

Plus en détail

Introduction à l Analyse des Réseaux Sociaux

Introduction à l Analyse des Réseaux Sociaux (ARS) 18 mars 2010 Analyse des réseaux sociaux Définition Propriétés Utilisation & Applications Analyse des réseaux sociaux Définition Propriétés Utilisation & Applications Etude des entités sociales (les

Plus en détail

Introduction à l Analyse des Réseaux Sociaux

Introduction à l Analyse des Réseaux Sociaux Introduction à l Analyse des Réseaux Sociaux Erick Stattner Laboratoire LAMIA Université des Antilles et de la Guyane, France erick.stattner@univ-ag.fr Guadeloupe, Novembre 2012 Erick Stattner Introduction

Plus en détail

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université

Plus en détail

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci http://liris.cnrs.fr/hamamache.kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de

Plus en détail

Partie 1. La structure des réseaux sociaux

Partie 1. La structure des réseaux sociaux Partie 1. La structure des réseaux sociaux Analyse et Modélisation des Réseaux, Université Bordeaux IV Sections : Introduction 1 Introduction 2 3 L expérience de Milgram Les réseaux aléatoires 4 Le clustering

Plus en détail

Apprentissage Automatique

Apprentissage Automatique Apprentissage Automatique Introduction-I jean-francois.bonastre@univ-avignon.fr www.lia.univ-avignon.fr Définition? (Wikipedia) L'apprentissage automatique (machine-learning en anglais) est un des champs

Plus en détail

Calculatrice vocale basée sur les SVM

Calculatrice vocale basée sur les SVM Calculatrice vocale basée sur les SVM Zaïz Fouzi *, Djeffal Abdelhamid *, Babahenini MohamedChaouki*, Taleb Ahmed Abdelmalik**, * Laboratoire LESIA, Département d Informatique, Université Mohamed Kheider

Plus en détail

Une nouvelle approche de détection de communautés dans les réseaux sociaux

Une nouvelle approche de détection de communautés dans les réseaux sociaux UNIVERSITÉ DU QUÉBEC EN OUTAOUAIS Département d informatique et d ingénierie Une nouvelle approche de détection de communautés dans les réseaux sociaux Mémoire (INF 6021) pour l obtention du grade de Maîtrise

Plus en détail

Apprentissage statistique dans les graphes et les réseaux sociaux

Apprentissage statistique dans les graphes et les réseaux sociaux Apprentissage statistique dans les graphes et les réseaux sociaux Patrick Gallinari Collaboration : L. Denoyer, S. Peters Université Pierre et Marie Curie AAFD 2010 1 Plan Motivations et Problématique

Plus en détail

Cours de Data Mining PageRank et HITS

Cours de Data Mining PageRank et HITS Cours de Data Mining PageRank et HITS Andreea Dragut Univ. Aix-Marseille, IUT d Aix-en-Provence Andreea Dragut Cours de Data Mining PageRank et HITS 1 / 48 Plan du cours Présentation Andreea Dragut Cours

Plus en détail

Détection de communautés dans des réseaux scientifiques à partir de données relationnelles et textuelles

Détection de communautés dans des réseaux scientifiques à partir de données relationnelles et textuelles Détection de communautés dans des réseaux scientifiques à partir de données relationnelles et textuelles David Combe* Christine Largeron* Előd Egyed-Zsigmond** Mathias Géry* * Université de Lyon, F-42023,

Plus en détail

Intégration de la dimension sémantique dans les réseaux sociaux

Intégration de la dimension sémantique dans les réseaux sociaux Intégration de la dimension sémantique dans les réseaux sociaux Application : systèmes de recommandation Maria Malek LARIS-EISTI maria.malek@eisti.fr 1 Contexte : Recommandation dans les réseaux sociaux

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Gilles Gasso, Stéphane Canu INSA Rouen -Département ASI Laboratoire LITIS 8 septembre 205. Ce cours est librement inspiré du cours DM de Alain Rakotomamonjy Gilles Gasso, Stéphane

Plus en détail

Qu est ce qu un réseau social. CNAM Séminaire de Statistiques Appliquées 13/11/2013. F.Soulié Fogelman 1. Utilisation des réseaux sociaux pour le

Qu est ce qu un réseau social. CNAM Séminaire de Statistiques Appliquées 13/11/2013. F.Soulié Fogelman 1. Utilisation des réseaux sociaux pour le Qui je suis Innovation Utilisation des réseaux sociaux pour le data mining Business & Decision Françoise Soulié Fogelman francoise.soulie@outlook.com Atos KDD_US CNAM Séminaire de Statistique appliquée

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

INF6304 Interfaces Intelligentes

INF6304 Interfaces Intelligentes INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme

Plus en détail

Principales caractéristiques de Mixmod

Principales caractéristiques de Mixmod Modèle de mélanges Principales caractéristiques de Mixmod Gérard Govaert et Gilles Celeux 24 octobre 2006 1 Plan Le modèledemélange Utilisations du modèle de mélange Les algorithmes de Mixmod Modèle de

Plus en détail

COURS SYRRES RÉSEAUX SOCIAUX. Jean-Loup Guillaume

COURS SYRRES RÉSEAUX SOCIAUX. Jean-Loup Guillaume COURS SYRRES RÉSEAUX SOCIAUX Jean-Loup Guillaume Le cours http://jlguillaume.free.fr/www/teaching/syrres/ Exemple 1 : Expérience de Milgram Objectif faire transiter une lettre depuis les Nebraska à un

Plus en détail

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique Objectifs Clustering On ne sait pas ce qu on veut trouver : on laisse l algorithme nous proposer un modèle. On pense qu il existe des similarités entre les exemples. Qui se ressemble s assemble p. /55

Plus en détail

Analyse empirique et modélisation de la dynamique de la topologie de l Internet

Analyse empirique et modélisation de la dynamique de la topologie de l Internet Analyse empirique et modélisation de la dynamique de la topologie de l Internet Sergey Kirgizov Directrice de thèse: Clémence Magnien Complex Networks, LIP6, (UPMC, CNRS) Paris, 12 décembre 2014 Plan 1

Plus en détail

COURS SYRRES RÉSEAUX SOCIAUX INTRODUCTION. Jean-Loup Guillaume

COURS SYRRES RÉSEAUX SOCIAUX INTRODUCTION. Jean-Loup Guillaume COURS SYRRES RÉSEAUX SOCIAUX INTRODUCTION Jean-Loup Guillaume Le cours Enseignant : Jean-Loup Guillaume équipe Complex Network Page du cours : http://jlguillaume.free.fr/www/teaching-syrres.php Évaluation

Plus en détail

Objectif du groupe GT1.1 Fusion de Données

Objectif du groupe GT1.1 Fusion de Données Objectif du groupe GT1.1 Fusion de Données Le groupe travaille dans trois directions Le vocabulaire (piloté par ADVITAM et l aide de SITE) L état de l art (piloté par SYROKKO) Deux applications illustratives

Plus en détail

Le théorème de Perron-Frobenius, les chaines de Markov et un célèbre moteur de recherche

Le théorème de Perron-Frobenius, les chaines de Markov et un célèbre moteur de recherche Le théorème de Perron-Frobenius, les chaines de Markov et un célèbre moteur de recherche Bachir Bekka Février 2007 Le théorème de Perron-Frobenius a d importantes applications en probabilités (chaines

Plus en détail

FOUILLE DE DONNEES. Anne LAURENT ECD. laurent@lirmm.fr

FOUILLE DE DONNEES. Anne LAURENT ECD. laurent@lirmm.fr FOUILLE DE DONNEES Anne LAURENT laurent@lirmm.fr ECD Pourquoi la fouille de données? Données disponibles Limites de l approche humaine Nombreux besoins : Industriels, Médicaux, Marketing, Qu est-ce que

Plus en détail

Statistique et analyse de données pour l assureur : des outils pour la gestion des risques et le marketing

Statistique et analyse de données pour l assureur : des outils pour la gestion des risques et le marketing Statistique et analyse de données pour l assureur : des outils pour la gestion des risques et le marketing Gilbert Saporta Chaire de Statistique Appliquée, CNAM ActuariaCnam, 31 mai 2012 1 L approche statistique

Plus en détail

L'ANALYSE DYNAMIQUE DE RESEAUX SOCIAUX METHODE ET APPLICATION (SIENA POUR LES NULS) COMPLETS AVEC SIENA. Ainhoa de Federico de la Rúa

L'ANALYSE DYNAMIQUE DE RESEAUX SOCIAUX METHODE ET APPLICATION (SIENA POUR LES NULS) COMPLETS AVEC SIENA. Ainhoa de Federico de la Rúa L'ANALYSE DYNAMIQUE DE RESEAUX SOCIAUX COMPLETS AVEC SIENA METHODE ET APPLICATION (SIENA POUR LES NULS) Ainhoa de Federico de la Rúa Université de Toulouse II Le Mirail CERS LISST RESEAUX CAUSES OU EFFETS?

Plus en détail

L informatique des entrepôts de données

L informatique des entrepôts de données L informatique des entrepôts de données Daniel Lemire SEMAINE 13 L exploration des données 13.1. Présentation de la semaine L exploration de données (ou data mining) est souvent associée à l intelligence

Plus en détail

BI = Business Intelligence Master Data-ScienceCours 7 - Data

BI = Business Intelligence Master Data-ScienceCours 7 - Data BI = Business Intelligence Master Data-Science Cours 7 - Data Mining Ludovic DENOYER - UPMC 30 mars 2015 Ludovic DENOYER - Typologie des méthodes de Data Mining Différents types de méthodes : Méthodes

Plus en détail

Fouille de données et aide à la décision.

Fouille de données et aide à la décision. Fouille de données et aide à la décision. Introduction au datamining. Anne-Claire Haury M2 Informatique Université Denis Diderot Second semestre 2014-2015 1 Introduction 2 Outline 1 Peut-on faire dire

Plus en détail

Approche bayésienne des modèles à équations structurelles

Approche bayésienne des modèles à équations structurelles Manuscrit auteur, publié dans "42èmes Journées de Statistique (2010)" Approche bayésienne des modèles à équations structurelles Séverine Demeyer 1,2 & Nicolas Fischer 1 & Gilbert Saporta 2 1 LNE, Laboratoire

Plus en détail

INTRODUCTION AU DATA MINING

INTRODUCTION AU DATA MINING INTRODUCTION AU DATA MINING 6 séances de 3 heures mai-juin 2006 EPF - 4 ème année - Option Ingénierie d Affaires et de Projets Bertrand LIAUDET TP DE DATA MINING Le TP et le projet consisteront à mettre

Plus en détail

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA

Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA Tests d indépendance en analyse multivariée et tests de normalité dans les modèles ARMA Soutenance de doctorat, sous la direction de Pr. Bilodeau, M. et Pr. Ducharme, G. Université de Montréal et Université

Plus en détail

Rapport de TER : Collecte de médias géo-localisés et recherche de points d intérêt avec l algorithme Mean Shift Martin PUGNET Février 2014

Rapport de TER : Collecte de médias géo-localisés et recherche de points d intérêt avec l algorithme Mean Shift Martin PUGNET Février 2014 Rapport de TER : Collecte de médias géo-localisés et recherche de points d intérêt avec l algorithme Mean Shift Martin PUGNET Février 2014 résumé : Ce projet a pour but de récupérer des données géolocalisées

Plus en détail

Apprentissage Statistique. Bureau d étude :

Apprentissage Statistique. Bureau d étude : Apprentissage Statistique Bureau d étude : Score d appétence en GRC Hélène Milhem IUP SID M2 2011/2012 Institut de Mathématiques de Toulouse UMR CNRS C5219 Equipe de Statistique et Probabilités Université

Plus en détail

Modèles à Événements Discrets. Réseaux de Petri Stochastiques

Modèles à Événements Discrets. Réseaux de Petri Stochastiques Modèles à Événements Discrets Réseaux de Petri Stochastiques Table des matières 1 Chaînes de Markov Définition formelle Idée générale Discrete Time Markov Chains Continuous Time Markov Chains Propriétés

Plus en détail

Data Mining. Exposés logiciels, systèmes et réseaux. Damien Jubeau IR3 Lundi 19 novembre 2012

Data Mining. Exposés logiciels, systèmes et réseaux. Damien Jubeau IR3 Lundi 19 novembre 2012 Data Mining Exposés logiciels, systèmes et réseaux. Damien Jubeau IR3 Lundi 19 novembre 2012 2 Plan Data mining : définition, utilisations et concepts Wolfram Alpha : extraction de données d'un compte

Plus en détail

Apports des réseaux sociaux pour la gestion de la relation client

Apports des réseaux sociaux pour la gestion de la relation client Apports des réseaux sociaux pour la gestion de la relation client Ian Basaille-Gahitte, Lylia Abrouk, Nadine Cullot, Eric Leclercq To cite this version: Ian Basaille-Gahitte, Lylia Abrouk, Nadine Cullot,

Plus en détail

Master ISI 2010-2011. Data Mining Recherche des sous-ensembles fréquents

Master ISI 2010-2011. Data Mining Recherche des sous-ensembles fréquents Master ISI 2010-2011 Data Mining Recherche des sous-ensembles fréquents Yves Lechevallier INRIA-Rocquencourt E_mail : Yves.Lechevallier@inria.fr 1 Processus Data Mining Phase A : Entrepôt de données Entrepôt

Plus en détail

Introduction au datamining

Introduction au datamining Introduction au datamining Patrick Naïm janvier 2005 Définition Définition Historique Mot utilisé au départ par les statisticiens Le mot indiquait une utilisation intensive des données conduisant à des

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

Les indicateurs structurels d'un graphe: calculs, visualisation, interactivité

Les indicateurs structurels d'un graphe: calculs, visualisation, interactivité Les indicateurs structurels d'un graphe: calculs, visualisation, interactivité Brigitte GAY (*), Bernard DOUSSET (**), Radwen WANASSI (**) b.gay@esc-toulouse.fr, bernard.dousset@irit.fr, wanesradwen@gmail.com

Plus en détail

TECH. INFOTECH # 34 Solvabilité 2 : Le calcul du capital économique dans le cadre d un modèle interne. Introduction

TECH. INFOTECH # 34 Solvabilité 2 : Le calcul du capital économique dans le cadre d un modèle interne. Introduction INFO # 34 dans le cadre d un modèle interne Comment les méthodes d apprentissage statistique peuvent-elles optimiser les calculs? David MARIUZZA Actuaire Qualifié IA Responsable Modélisation et Solvabilité

Plus en détail

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures) CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE Cinquième épreuve d admissibilité STATISTIQUE (durée : cinq heures) Une composition portant sur la statistique. SUJET Cette épreuve est composée d un

Plus en détail

Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining.

Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining. 2 jours : Mardi 15 et mercredi 16 novembre 2005 de 9 heures 30 à 17 heures 30 Organisé par StatSoft France et animé par Dr Diego Kuonen, expert en techniques de data mining. Madame, Monsieur, On parle

Plus en détail

Recherche d information textuelle

Recherche d information textuelle Recherche d information textuelle Pré-traitements & indexation B. Piwowarski CNRS / LIP6 Université Paris 6 benjamin@bpiwowar.net http://www.bpiwowar.net Master IP - 2014-15 Cours et travaux pratiques

Plus en détail

Bilan de thèse à mi-parcours

Bilan de thèse à mi-parcours Bilan de thèse à mi-parcours Benjamin Lévy 26 mars 2012 Introduction La thèse de doctorat d informatique (école doctorale 130, EDITE) dont le titre officiel est le suivant : Avatars capables d écoute,

Plus en détail

Le Web, l'entreprise et le consommateur. Françoise Soulié Fogelman francoise@kxen.com

Le Web, l'entreprise et le consommateur. Françoise Soulié Fogelman francoise@kxen.com Le Web, l'entreprise et le consommateur Françoise Soulié Fogelman francoise@kxen.com Forum "Quel futur pour le Web" Lyon, mardi 21 septembre 2010 THE DATA MINING AUTOMATION COMPANY TM Agenda Le Web un

Plus en détail

Structures de données non linéaires

Structures de données non linéaires Structures de données non linéaires I. Graphes Définition Un graphe (simple) orienté G est un couple (S, A), où : S est un ensemble dont les éléments sont appelés les sommets. A est un ensemble de couples

Plus en détail

TRS: Sélection des sous-graphes représentants par l intermédiaire des attributs topologiques et K-medoïdes

TRS: Sélection des sous-graphes représentants par l intermédiaire des attributs topologiques et K-medoïdes TRS: Sélection des sous-graphes représentants par l intermédiaire des attributs topologiques et K-medoïdes Mohamed Moussaoui,Wajdi Dhifli,Sami Zghal,Engelbert Mephu Nguifo FSJEG, Université de Jendouba,

Plus en détail

Réseau Sociaux Plan. 1. Historique. 2. Définition et fonctionnalités. 3. Usages actuels. 4. Tendances. 5. Problématiques de recherche

Réseau Sociaux Plan. 1. Historique. 2. Définition et fonctionnalités. 3. Usages actuels. 4. Tendances. 5. Problématiques de recherche Réseaux Sociaux Révolution des usages sur Internet, et nouvelles problématiques de recherche Pierre Maret, Laboratoire Hubert Curien, St-Etienne Adrien Joly, Alcatel-Lucent Bell Labs France, Villarceaux

Plus en détail

Classification dans des bases de données par des méthodes de datamining

Classification dans des bases de données par des méthodes de datamining Classification dans des bases de données par des méthodes de datamining Yawo Eli Amesefe Guillaume Cernier Christophe Labrousse Introduction L utilisation généralisée de l informatique ces dernières dizaines

Plus en détail

Annexe 6. Notions d ordonnancement.

Annexe 6. Notions d ordonnancement. Annexe 6. Notions d ordonnancement. APP3 Optimisation Combinatoire: problèmes sur-contraints et ordonnancement. Mines-Nantes, option GIPAD, 2011-2012. Sophie.Demassey@mines-nantes.fr Résumé Ce document

Plus en détail

Resolution limit in community detection

Resolution limit in community detection Introduction Plan 2006 Introduction Plan Introduction Introduction Plan Introduction Point de départ : un graphe et des sous-graphes. But : quantifier le fait que les sous-graphes choisis sont des modules.

Plus en détail

Spécificités, Applications et Outils

Spécificités, Applications et Outils Spécificités, Applications et Outils Ricco Rakotomalala Université Lumière Lyon 2 Laboratoire ERIC Laboratoire ERIC 1 Ricco Rakotomalala ricco.rakotomalala@univ-lyon2.fr http://chirouble.univ-lyon2.fr/~ricco/data-mining

Plus en détail

NON-LINEARITE ET RESEAUX NEURONAUX

NON-LINEARITE ET RESEAUX NEURONAUX NON-LINEARITE ET RESEAUX NEURONAUX Vêlayoudom MARIMOUTOU Laboratoire d Analyse et de Recherche Economiques Université de Bordeaux IV Avenue. Leon Duguit, 33608 PESSAC, France tel. 05 56 84 85 77 e-mail

Plus en détail

Techniques de DM pour la GRC dans les banques Page 11

Techniques de DM pour la GRC dans les banques Page 11 Techniques de DM pour la GRC dans les banques Page 11 II.1 Introduction Les techniques de data mining sont utilisé de façon augmentaté dans le domaine économique. Tels que la prédiction de certains indicateurs

Plus en détail

Enjeux mathématiques et Statistiques du Big Data

Enjeux mathématiques et Statistiques du Big Data Enjeux mathématiques et Statistiques du Big Data Mathilde Mougeot LPMA/Université Paris Diderot, mathilde.mougeot@univ-paris-diderot.fr Mathématique en Mouvements, Paris, IHP, 6 Juin 2015 M. Mougeot (Paris

Plus en détail

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Yves Aragon, David Haziza & Anne Ruiz-Gazen GREMAQ, UMR CNRS 5604, Université des Sciences

Plus en détail

Arbres binaires de décision

Arbres binaires de décision 1 Arbres binaires de décision Résumé Arbres binaires de décision Méthodes de construction d arbres binaires de décision, modélisant une discrimination (classification trees) ou une régression (regression

Plus en détail

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1 Christophe CANDILLIER Cours de DataMining mars 2004 age 1 1. Introduction 2. rocessus du DataMining 3. Analyse des données en DataMining 4. Analyse en Ligne OLA 5. Logiciels 6. Bibliographie Christophe

Plus en détail

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé

Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé Baccalauréat ES Polynésie (spécialité) 10 septembre 2014 Corrigé A. P. M. E. P. Exercice 1 5 points 1. Réponse d. : 1 e Le coefficient directeur de la tangente est négatif et n est manifestement pas 2e

Plus en détail

Théorie des graphes pour l analyse de réseaux réels

Théorie des graphes pour l analyse de réseaux réels Théorie des graphes pour l analyse de réseaux réels Bertrand Jouve Laboratoire ERIC - IXXI - Université Lyon 2 Plan 1 Entre théorie des graphes et réseaux réels 2 Partitionnement métrique Exemple d étude

Plus en détail

J. Franco *1, O. Vasseur 2, B. Corre 1, M. Sergent 3. Communication orale 1. INTRODUCTION

J. Franco *1, O. Vasseur 2, B. Corre 1, M. Sergent 3. Communication orale 1. INTRODUCTION Un nouveau critère basé sur les arbres de longueur minimale pour déterminer la qualité de la répartition spatiale des points d un plan d expériences numériques en phase exploratoire. J. Franco *1, O. Vasseur

Plus en détail

Table des matières. PREMIÈRE PARTIE Étapes initiales des études marketing 7

Table des matières. PREMIÈRE PARTIE Étapes initiales des études marketing 7 Table des matières Préface Public 1 Structure de l ouvrage 1 Caractéristiques de l ouvrage 3 Contenu 3 Pédagogie 4 Remarques sur l adaptation française 4 Ressources numériques 5 Biographie 6 PREMIÈRE PARTIE

Plus en détail

Analyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57

Analyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57 Analyse de la vidéo Chapitre 4.1 - La modélisation pour le suivi d objet 10 mars 2015 Chapitre 4.1 - La modélisation d objet 1 / 57 La représentation d objets Plan de la présentation 1 La représentation

Plus en détail

TRAVAUX DE RECHERCHE DANS LE

TRAVAUX DE RECHERCHE DANS LE TRAVAUX DE RECHERCHE DANS LE DOMAINE DE L'EXPLOITATION DES DONNÉES ET DES DOCUMENTS 1 Journée technologique " Solutions de maintenance prévisionnelle adaptées à la production Josiane Mothe, FREMIT, IRIT

Plus en détail

Agenda de la présentation

Agenda de la présentation Le Data Mining Techniques pour exploiter l information Dan Noël 1 Agenda de la présentation Concept de Data Mining ou qu est-ce que le Data Mining Déroulement d un projet de Data Mining Place du Data Mining

Plus en détail

Empreintes conceptuelles et spatiales pour la caractérisation des réseaux sociaux

Empreintes conceptuelles et spatiales pour la caractérisation des réseaux sociaux Empreintes conceptuelles et spatiales pour la caractérisation des réseaux sociaux Bénédicte Le Grand*, Marie-Aude Aufaure** and Michel Soto* *Laboratoire d Informatique de Paris 6 UPMC {Benedicte.Le-Grand,

Plus en détail

Données biologiques haut-débit :

Données biologiques haut-débit : Données biologiques haut-débit : problèmes méthodologiques liés à la dimension et utilisation des algorithmes génétiques Christelle REYNES EA 2415 Epidémiologie, Biostatistique et Santé Publique Université

Plus en détail

Notice d Utilisation du logiciel Finite Element Method Magnetics version 3.4 auteur: David Meeker

Notice d Utilisation du logiciel Finite Element Method Magnetics version 3.4 auteur: David Meeker Notice d Utilisation du logiciel Finite Element Method Magnetics version 3.4 auteur: David Meeker DeCarvalho Adelino adelino.decarvalho@iutc.u-cergy.fr septembre 2005 Table des matières 1 Introduction

Plus en détail

Filtrage stochastique non linéaire par la théorie de représentation des martingales

Filtrage stochastique non linéaire par la théorie de représentation des martingales Filtrage stochastique non linéaire par la théorie de représentation des martingales Adriana Climescu-Haulica Laboratoire de Modélisation et Calcul Institut d Informatique et Mathématiques Appliquées de

Plus en détail

THESE DE DOCTORAT. Informatique, Fouille de données

THESE DE DOCTORAT. Informatique, Fouille de données THESE DE DOCTORAT Informatique, Fouille de données THEME PRINCIPAL DE LA SOUMISSION : Contenus, Connaissances, Interactions TITRE DE LA THESE : Fouille de graphes avec attributs RESPONSABLES DE LA THESE

Plus en détail

Analyse des réseaux sociaux et web sémantique: un état de l'art

Analyse des réseaux sociaux et web sémantique: un état de l'art Analyse des réseaux sociaux et web sémantique: un état de l'art Emetteur Guillaume Erétéo (guillaume.ereteo@orange-ftgroup.com) Contributeurs Guillaume Erétéo, Fabien Gandon, Michel Buffa, Patrick Grohan

Plus en détail

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring

ESSEC. Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring ESSEC Cours «Management bancaire» Séance 3 Le risque de crédit Le scoring Les méthodes d évaluation du risque de crédit pour les PME et les ménages Caractéristiques Comme les montants des crédits et des

Plus en détail

Web Science. Master 1 IFI. Andrea G. B. Tettamanzi. Université de Nice Sophia Antipolis Département Informatique andrea.tettamanzi@unice.

Web Science. Master 1 IFI. Andrea G. B. Tettamanzi. Université de Nice Sophia Antipolis Département Informatique andrea.tettamanzi@unice. Web Science Master 1 IFI Andrea G. B. Tettamanzi Université de Nice Sophia Antipolis Département Informatique andrea.tettamanzi@unice.fr 1 Annonce : recherche apprenti Projet Géo-Incertitude Objectifs

Plus en détail

Classification Automatique de messages : une approche hybride

Classification Automatique de messages : une approche hybride RECIAL 2002, Nancy, 24-27 juin 2002 Classification Automatique de messages : une approche hybride O. Nouali (1) Laboratoire des Logiciels de base, CE.R.I.S., Rue des 3 frères Aïssiou, Ben Aknoun, Alger,

Plus en détail

L'intelligence d'affaires: la statistique dans nos vies de consommateurs

L'intelligence d'affaires: la statistique dans nos vies de consommateurs L'intelligence d'affaires: la statistique dans nos vies de consommateurs Jean-François Plante, HEC Montréal Marc Fredette, HEC Montréal Congrès de l ACFAS, Université Laval, 6 mai 2013 Intelligence d affaires

Plus en détail

Améliorer les performances du site par l'utilisation de techniques de Web Mining

Améliorer les performances du site par l'utilisation de techniques de Web Mining Améliorer les performances du site par l'utilisation de techniques de Web Mining CLUB SAS 2001 17/18 octobre 2001 Stéfan Galissie LINCOLN stefan.galissie@lincoln.fr contact@web-datamining.net 2001 Sommaire

Plus en détail

EP 2 071 505 A1 (19) (11) EP 2 071 505 A1 (12) DEMANDE DE BREVET EUROPEEN. (43) Date de publication: 17.06.2009 Bulletin 2009/25

EP 2 071 505 A1 (19) (11) EP 2 071 505 A1 (12) DEMANDE DE BREVET EUROPEEN. (43) Date de publication: 17.06.2009 Bulletin 2009/25 (19) (12) DEMANDE DE BREVET EUROPEEN (11) EP 2 071 0 A1 (43) Date de publication: 17.06.09 Bulletin 09/2 (1) Int Cl.: G06Q /00 (06.01) (21) Numéro de dépôt: 0817092.3 (22) Date de dépôt: 03.12.08 (84)

Plus en détail

mission. Le premier poste du programme de travail du DREV vise la qualification, la quantification et le suivi

mission. Le premier poste du programme de travail du DREV vise la qualification, la quantification et le suivi Dans le cadre de la mission le DREV est chargé de conduire des études et expérimentations permettant de mieux comprendre les usages en matière de consommation de produits culturels en ligne et de produire

Plus en détail

Une comparaison de méthodes de discrimination des masses de véhicules automobiles

Une comparaison de méthodes de discrimination des masses de véhicules automobiles p.1/34 Une comparaison de méthodes de discrimination des masses de véhicules automobiles A. Rakotomamonjy, R. Le Riche et D. Gualandris INSA de Rouen / CNRS 1884 et SMS / PSA Enquêtes en clientèle dans

Plus en détail

Vous trouvez plus d information sur AREL. ainsi que sur : http://www.eisti.fr/ mma/html-iad/iad.html

Vous trouvez plus d information sur AREL. ainsi que sur : http://www.eisti.fr/ mma/html-iad/iad.html ainsi que sur : http://www.eisti.fr/ mma/html-iad/iad.html Option Deux thèmes : La recherche opérationnelle : Traiter des problèmes d optimisation, d aide à la décision et d évaluation de performances

Plus en détail

Modélisation du comportement habituel de la personne en smarthome

Modélisation du comportement habituel de la personne en smarthome Modélisation du comportement habituel de la personne en smarthome Arnaud Paris, Selma Arbaoui, Nathalie Cislo, Adnen El-Amraoui, Nacim Ramdani Université d Orléans, INSA-CVL, Laboratoire PRISME 26 mai

Plus en détail

Une pénalité de groupe pour des données multivoie de grande dimension

Une pénalité de groupe pour des données multivoie de grande dimension Une pénalité de groupe pour des données multivoie de grande dimension Laurent Le Brusquet 1, Arthur Tenenhaus 1,2, Gisela Lechuga 1, Vincent Perlbarg 2, Louis Puybasset 3 & Damien Galanaud 4. 1 Laboratoire

Plus en détail

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems

Plus en détail

Data 2 Business : La démarche de valorisation de la Data pour améliorer la performance de ses clients

Data 2 Business : La démarche de valorisation de la Data pour améliorer la performance de ses clients Data 2 Business : La démarche de valorisation de la Data pour améliorer la performance de ses clients Frédérick Vautrain, Dir. Data Science - Viseo Laurent Lefranc, Resp. Data Science Analytics - Altares

Plus en détail

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données

Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données Structure du cours : Il existe de nombreuses méthodes intéressantes qui couvrent l Analyse des Données et le Data Mining Nous suivons le plan suivant : Fonctionnement de Spad Catalogue des méthodes (statistiques

Plus en détail

Modélisation aléatoire en fiabilité des logiciels

Modélisation aléatoire en fiabilité des logiciels collection Méthodes stochastiques appliquées dirigée par Nikolaos Limnios et Jacques Janssen La sûreté de fonctionnement des systèmes informatiques est aujourd hui un enjeu économique et sociétal majeur.

Plus en détail

FIMA, 7 juillet 2005

FIMA, 7 juillet 2005 F. Corset 1 S. 2 1 LabSAD Université Pierre Mendes France 2 Département de Mathématiques Université de Franche-Comté FIMA, 7 juillet 2005 Plan de l exposé plus court chemin Origine du problème Modélisation

Plus en détail

SharePoint (Toute la Gamme)... 1 Office 2010 (Toute la Gamme)... 2 OLAP (Toute la Gamme)... 2 STATISTICA Connecteur PI (Produit Complémentaire)...

SharePoint (Toute la Gamme)... 1 Office 2010 (Toute la Gamme)... 2 OLAP (Toute la Gamme)... 2 STATISTICA Connecteur PI (Produit Complémentaire)... SharePoint (Toute la Gamme)... 1 Office 2010 (Toute la Gamme)... 2 OLAP (Toute la Gamme)... 2 STATISTICA Connecteur PI (Produit Complémentaire)... 3 Introduction... 3 Échelle Interactive... 4 Navigation

Plus en détail

Christelle REYNES EA 2415 Epidémiologie, Biostatistique et Santé Publique Université Montpellier 1. 8 Juin 2012

Christelle REYNES EA 2415 Epidémiologie, Biostatistique et Santé Publique Université Montpellier 1. 8 Juin 2012 Extraction et analyse des mesures haut-débit pour l identification de biomarqueurs : problèmes méthodologiques liés à la dimension et solutions envisagées EA 2415 Epidémiologie, Biostatistique et Santé

Plus en détail

Introduction d indices structuraux pour l analyse de réseaux multiplexes

Introduction d indices structuraux pour l analyse de réseaux multiplexes Introduction d indices structuraux pour l analyse de réseaux multiplexes Application à l analyse d un thésaurus Romain Boulet UMR ESPACE-DEV IRD 500 Avenue Jean-François Breton 34093 MONTPELLIER romain.boulet@ird.fr

Plus en détail

Formation Actuaire Data Scientist. Programme au 24 octobre 2014

Formation Actuaire Data Scientist. Programme au 24 octobre 2014 Formation Actuaire Data Scientist Programme au 24 octobre 2014 A. Eléments logiciels et programmation Python 24h Objectif : Introduction au langage Python et sensibilisation aux grandeurs informatiques

Plus en détail

Quelques points de traitement du signal

Quelques points de traitement du signal Quelques points de traitement du signal Introduction: de la mesure au traitement Source(s) BRUIT BRUIT Système d acquisition Amplitude (Pa) Temps (s) Amplitude (Pa) Mesure Opérations mathématiques appliquées

Plus en détail

connaissances «intéressantes» ou des motifs (patterns) à partir d une grande quantité de données.

connaissances «intéressantes» ou des motifs (patterns) à partir d une grande quantité de données. Data Mining = Knowledge Discovery in Databases (KDD) = Fouille de données 1 Définition : Processus ou méthode qui extrait des connaissances «intéressantes» ou des motifs (patterns) à partir d une grande

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail