Modèle de formation multiple de communautés dans un système de recommandation hybride

Dimension: px
Commencer à balayer dès la page:

Download "Modèle de formation multiple de communautés dans un système de recommandation hybride"

Transcription

1 Paper ID : Modèle de formation multiple de communautés dans un système de recommandation hybride An-Te Nguyen, Nathalie Denos, Catherine Berrut, Bich-Thuy Dong Thi Résumé Les systèmes de filtrage ont pour but de distribuer des informations de façon personnalisée aux utilisateurs, tout en s adaptant en permanence au besoin en information de chacun. Dans la plupart des systèmes de filtrage hybrides s appuyant sur le filtrage collaboratif, les communautés d utilisateurs sont monocritères et restent implicites. Nous proposons un modèle de formation multiple de communautés selon des critères variés et les moyens pour faciliter le positionnement d utilisateurs dans les diverses communautés en nous appuyant sur la théorie des Ensembles d Approximation, que nous complétons par un jeu de mesures de qualité de critères. Ces mesures permettent de choisir un critère comme décision pour gérer explicitement des communautés multicritères et d enrichir la contribution de la notion de communauté aux activités des systèmes de filtrage. Index Terms Hybrid recommender systems, collaborative filtering, multicriteria community creation, rough sets A I. INTRODUCTION UJOURD HUI un grand nombre de systèmes de filtrage, ou systèmes de recommandation (SR), sont utilisés dans divers domaines comme la recherche documentaire, le commerce électronique, etc. L objectif de ces systèmes est de filtrer un flux entrant d informations (documents) de façon personnalisée pour chaque utilisateur, tout en s adaptant en permanence au besoin d information de chacun. Pour cela, les moteurs de ces systèmes gèrent des profils d utilisateurs permettant de choisir quels documents transmettre à chacun, et adaptent ces profils au cours du temps en exploitant au mieux le retour de pertinence que les utilisateurs fournissent sur les documents reçus [7]. Les SR les plus connus sont : CiteSeer, Amazon, MovieLens, etc. Actuellement, il existe deux grandes approches de filtrage : le filtrage basé sur le contenu, où le profil décrit les caractéristiques de contenu que les documents intéressants sont censés présenter, et le filtrage collaboratif, où le profil est constitué de l historique des évaluations émis par l utilisateur sur des documents, sans qu aucun élément de contenu ne soit rendu explicite. Dans le premier cas, le système compare les nouveaux documents au profil de chaque utilisateur et recommande ceux qui sont le plus proche, et dans le second, le système compare les utilisateurs entre eux sur la base de leurs évaluations passés pour créer les communautés, et chaque utilisateur reçoit les documents jugés intéressants par sa communauté. Chacune de ces approches présente des avantages et des inconvénients, et de nombreux systèmes, dits «hybrides», les combinent (voir [3]). Ce que nous retenons de ces travaux sur le filtrage hybride, c est que la comparaison entre les profils donne lieu à la formation de regroupements d utilisateurs proches les uns des autres, regroupements que nous appelons «communautés». Alors, on peut dire que la notion de communauté est un des facteurs clés dans un SR hybride pour produire des recommandations. Cependant, nous observons deux problèmes fondamentaux autour de cette notion : la formation monocritère des communautés et le positionnement difficile d utilisateurs au sein des communautés. Formation monocritère de communautés. Nous constatons que les communautés dans la plupart des systèmes de recommandation 1 sont généralement formées sur un seul critère [11], par exemple les évaluations d utilisateurs. Cependant, il existe plusieurs critères sur lesquels la formation de communautés pourrait s appuyer. Prenons l exemple d un SR de films où on dispose les critères : Profession, Ville de résidence et Genre préféré de film (voir TABLEAU I). Si on crée un espace de communautés pour chacun de ces critères, les utilisateurs sont évidemment associés très différemment les uns aux autres selon le critère choisi. Dans ce contexte de variété de critères, la question se pose du choix du critère pour former les communautés internes au système. Nous pensons qu il est réducteur de regrouper les utilisateurs sur un seul critère, par exemple Evaluation comme dans les SR existants. Nous avons montré dans [9] que les espaces formés sur deux critères Genre et Evaluation étaient différents. Ainsi, on pourrait exploiter cette différence pour enrichir la production de recommandations : un utilisateur peut recevoir les recommandations de chacune des communautés auxquelles il appartient. Positionnement difficile d utilisateurs dans les espaces. Il est évident que le positionnement d utilisateurs dans les espaces dépend fondamentalement de la qualité des valeurs de critère. Cependant, dans la réalité certains critères demandent beaucoup d efforts pour les utilisateurs mais également pour le système [7]. Par exemple, un nouvel utilisateur définit de façon souvent difficile, incomplète et imprécise son genre préféré de films ; quels films le système doit-il alors proposer à cet utilisateur à évaluer pour inférer la valeur du critère Evaluation? Par ailleurs, les valeurs de critère de chaque utilisateur évoluent en même temps que l utilisateur lui-même. Ainsi, on peut citer deux Cette recherche a été partiellement soutenue par le Ministère Délégué à la Recherche et aux Nouvelles Technologies, dans le programme ACI Masses de Données, projet #MD Dans le reste de l article, le terme «système de recommandation» désigne, sauf précision autre, un système hybride qui combine le filtrage collaboratif avec d autres techniques de filtrage.

2 Paper ID : difficultés dans le positionnement d utilisateurs : l absence de valeur pour un ou plusieurs critères, et l existence de valeur douteuse. Ces problèmes s aggravent dans les SR existants où les communautés sont implicites et produites comme une étape de calcul intermédiaire pour générer des recommandations [11]. Nous pensons que l explicitation des communautés permettrait de faciliter la tâche de positionnement [9] et à terme de produire de meilleures recommandations. II. APPROCHE ET OBJECTIFS Nous proposons de définir de façon très large la notion de communauté, notamment en la paramétrant par ce que nous appelons un «critère de formation des communautés». Les communautés ne sont donc plus seulement formées sur la base des évaluations d utilisateurs mais aussi sur tous les autres critères de rapprochement entre utilisateurs, qui sont disponibles dans le SR en question. Donc, notre objectif est de concevoir un modèle d espaces de communautés qui permet de représenter le «polymorphisme» de communautés, la possibilité pour un utilisateur d appartenir à des communautés différentes selon le critère choisi, et qui offre les moyens facilitant le positionnement d utilisateurs dans les espaces de communautés. Dans la suite, nous définissons de façon précise la notion de communauté, et nous proposons dans IV un modèle de formation multiple de communautés, en nous appuyant au niveau formel sur la théorie des Ensembles d Approximation («rough sets» [10]). La partie V consacre à la validation du modèle proposé sur un jeu de données réelles et nombreuses, et enfin, nous terminons par la conclusion et les perspectives. III. CONTEXTE ET ETAT DE L ART A. Notion de communauté Perugini et al. présentent dans [11] une revue des études liées aux communautés dans les SR. Les auteurs donnent un point de vue social sur ces systèmes sous l angle de l effort à produire pour établir des relations entre utilisateurs. Dans [7], on trouve une revue des SR qui évoque aussi les communautés selon un point de vue fonctionnel. Ce qui ressort des travaux existants, c est que dans la plupart des SR ces communautés restent implicites, et ne sont pas exploitées en tant que telles. Ainsi, nous sommes conduits à donner une définition très simple des communautés dans un SR : elles sont composées des utilisateurs qui sont proches les uns des autres relativement à un critère particulier. B. Formation multiple de communautés selon des critères En général, dans tout SR on trouve plusieurs critères sur lesquels la formation de communautés pourrait s appuyer : données démographiques, domaines d intérêt, évaluations sur des documents, etc. [1]. En utilisant chacun de ces critères, le système peut créer autant d espaces de communautés sur les utilisateurs. Par conséquent, un utilisateur appartient non plus seulement à une communauté, mais à autant de communautés qu il y a de critères pour former ces communautés. C. Choix de la théorie des Ensembles d Approximation comme modèle formel Lors de l exploitation d un SR, les situations problématiques sont souvent liées à l absence de certaines informations de profil : par exemple un utilisateur est confronté au démarrage à froid car il n a pas encore évalué de document, et/ou ne sait pas définir son besoin en termes de contenu. L absence de ces informations met le système dans l impossibilité de produire des recommandations. Pour répondre à ce problème de données manquantes, on peut s en remettre aux techniques de fouille de données. Mais, d après Mazlack [6], ces techniques ne sont pas efficaces pour traiter des données nominales comme celles dans le TABLEAU I puisqu elles font l hypothèse que les données sont quantitatives et peuvent être mesurées par des métriques précises. Au contraire, pour traiter des données nominales, cela conduit à l obligation de quantifier les données. Par ailleurs, il existe deux approches classiques pour traiter les données nominales sans avoir besoin de les quantifier : la théorie de l évidence qui nécessite des informations a priori sur des données pour définir les fonctions de croyance [12], et la théorie des ensembles flous qui requiert aussi des informations a priori pour définir la fonction d appartenance [13]. A l opposé de ces deux approches subjectives, la théorie des Ensembles d Approximation (EA) ([10]) n a besoin d aucune information a priori pour traiter ces données. L idée principale de cette théorie est que l incertitude de données peut être mesurée par des bornes inférieure et supérieure. Elle permet d identifier et d exploiter les dépendances entre les attributs des données. Si nous considérons que les critères de formation des communautés sont les attributs des utilisateurs, nous pouvons envisager de compenser l absence de certaines valeurs d attributs en exploitant au mieux les attributs où les valeurs sont disponibles. Dans la suite, nous ne présentons que la partie de la théorie des EA qui est utile pour notre modèle (voir [10] pour des informations complètes). 1) Représentation des données Une table d information T est caractérisée par deux ensembles non vides : T = <U, A>, où U est l univers des objets et A est un ensemble d au moins deux attributs (voir TABLEAU I). En particulier, l ensemble A peut être divisé en deux parties : D contenant un seul attribut dit «décision» et C contenant les attributs restants dits «conditions». La table T est dite «table de décision», et chaque ligne est considérée comme une «règle de décision». Pour tout attribut a A, on définit la fonction d information Inf a de l univers U vers l ensemble V a des valeurs de a : Inf a (u) est la valeur que prend u sur l attribut a. On généralise cette fonction sur un sousensemble non vide P A : Inf P (u) = {(a, Inf a (u)) a P}. On peut voir le résultat de cette fonction comme le vecteur des valeurs que prend u sur les attributs de P. 2) Relation d indiscernabilité Soit P A, on définit la relation d'indiscernabilité, notée R P, comme une relation d équivalence sur U : u, u U, u R P u Inf P (u) = Inf P (u ) Alors, la classe d équivalence de u, notée [u] P, contient les

3 Paper ID : éléments qui sont en relation avec u. On dit aussi que l ensemble quotient U/R P est la partition de U regroupant les éléments prenant les mêmes valeurs sur P. Lorsque P = D, [u] D est appelée «concept», et on définit le rang r(d) comme le nombre de concepts que l on trouve dans D. On va maintenant travailler autour des concepts de D afin d étudier dans quelle mesure ils peuvent être définis au moyen des conditions. 3) Ensembles d approximation Un concept X est dit «définissable par P» avec P C, s il est une union de classes d équivalence suivantes R P. En cas où X est non définissable par P, il sera mesuré de façon approximative par deux ensembles suivants : a) la borne P-inférieure : P (X) = {u U [u] P X} (1) b) la borne P-supérieure : P (X) = {u U [u] P X } (2) La région positive de U/R P est alors définie comme l union des bornes P-inférieures pour tous les concepts de D : La borne inférieure POS P (D) = U X U/R D P(X) (3) P(X) contient les règles certaines pour X. Ce sont les objets qui peuvent être certainement classés dans X en se basant sur P. La région positive comprend donc toutes les règles certaines de la table T. En revanche, la borne supérieure comporte les règles possibles ou les objets qui sont possiblement classés dans X en se basant sur P. Pour résumer, nous retenons que : P (X) X P(X) et que X est un «P-ensemble d approximation» s il n est pas définissable par P car il requiert une approximation pour être défini. 4) Dépendance d attributs En utilisant la notion de région positive, on peut mesurer le «niveau de dépendance» de la décision D par rapport à l ensemble de conditions P par le coefficient suivant : POS P(D) k P,D = γ(p, D) = (4) U On dit aussi que D dépend de P au degré k. Si k = 1, on obtient une «dépendance totale», et tous les objets peuvent être certainement regroupés dans les concepts en utilisant P. Par contre, si k < 1, on a une «dépendance partielle». En termes de classification, le coefficient γ(p, D) représente la proportion des règles certaines dans U. De ce point de vue, la valeur γ(c,d) exprime aussi le «degré de consistance» de la table T. 5) Signification de conditions Une condition c P est dite «indispensable dans P» si : U/R P U/R P\{c}. Cela signifie que si on enlève c, la partition sera changée. Sinon, c est dite «dispensable dans P». On définit aussi la réduction de C comme le sous-ensemble P comprenant l ensemble minimal des conditions de C suffisant pour préserver la région positive : POS P (D) = POS C (D). Une table T peut donner plusieurs réductions. En théorie, la tâche de déterminer toutes ces réductions est un problème NP-complet. Il existe dans la littérature des algorithmes heuristiques permettant de déterminer l ensemble des réductions [14]. D ailleurs, on peut mesurer l importance de conditions sur l intervalle [0,1] plutôt que de façon binaire {dispensable, indispensable}. En effet, la signification de P peut être mesurée par l impact de sa suppression sur la consistance : γ(c \ P, D) σ C,D (P) = 1 (5) γ(c, D) Si C et D sont fixés, on peut simplifier la notation σ C,D (.) en σ(.). IV. MODELE DE FORMATION MULTIPLE DE COMMUNAUTES A. Représentation d espaces de communautés Dans notre modèle, la formation multiple de communautés est représentée par une table T = <U, A>, où U = {u 1,...,u M } est l ensemble d utilisateurs et A = {a 1,...,a N } contient les critères de formation des communautés. Pour tout critère a j A, on note Va j = {va j1,, va j rj } l ensemble des valeurs possibles pour a j, r j étant le rang de a j. Considérons la relation d indiscernabilité R {aj} : u, u U, u R {aj} u Inf {aj} (u) = Inf {aj} (u ) Les communautés relatives au critère a j, notées G jt, sont les classes d équivalence de U suivant R {aj}. La partition de U par a j, notée Ωa j, est appelée «espace de communautés» : Ωa j = U/R {aj} = {G j1,,g j rj }. Avec cette formalisation, on définit la notion de «critère composé» comme un ensemble P A. Le rang de P, r P, correspond au nombre de combinaisons distinctes des valeurs des divers attributs composés figurant dans P, et l espace de communautés composé est : Ω P = U/R P = {G P1,, G P rp }. Du point de vue d utilisateurs, chaque utilisateur u i est rattaché à une communauté dans chacun des espaces, d où un «vecteur de positionnement» (VP) qui est la liste de ses communautés d appartenance selon chacun des critères. Ce vecteur correspond à la ligne de u i dans la table T, chaque communauté étant désignée par la valeur que partagent les utilisateurs pour le critère considéré. Ces vecteurs caractérisent le polymorphisme du positionnement des utilisateurs au sein des communautés : un même utilisateur n aura pas les mêmes «voisins» selon le critère considéré. Ainsi, on peut voir T comme l ensemble des VP dans les N espaces de communautés. En pratique, les espaces de communautés pourraient servir à l interaction avec les utilisateurs en vue de réaliser des tâches délicates du processus de filtrage d information [9]. En rendant explicite le positionnement par les VP, notre modèle permet d intégrer explicitement les utilisateurs dans un discours autour des communautés, offrant ainsi une nouvelle dimension de personnalisation au-delà de celle du profil de filtrage classique. B. Signification de critères En réalité, les VP ne sont pas toujours parfaits : ils présentent souvent des valeurs manquantes ou douteuses. Par exemple, le VP d un nouvel utilisateur ne sera pas totalement rempli faute de retour de pertinence ; celui d un utilisateur dont les centres d intérêt sont en pleine évolution contient des valeurs périmées. Illustrons l apport du modèle dans le cas simple d un VP incomplet ou il ne manque qu une valeur : on peut prendre comme décision D le critère correspondant à la valeur manquante, et chercher une règle dans la région positive POS C (D) afin d inférer la valeur pour D. Si D dépendait

4 Paper ID : totalement des critères restants, on trouverait toujours une telle règle pour compléter la valeur pour D. Mais ce n est pas toujours le cas, et on doit alors faire appel à des techniques existantes que nous ne détaillons pas ici [4]. Une question demeure cependant dans le cas où plusieurs valeurs sont manquantes ou douteuses : il faut alors élaborer une stratégie pour décider dans quel ordre corriger ces valeurs, sachant que l on cherche logiquement à commencer par celles dont le résultat est le plus sûr. Cela revient à choisir un ordre sur les décisions à prendre en compte successivement. Cette question motive la suite du travail présenté ici : nous définissons les mesures de qualité de décision permettant de comparer les différents critères afin de déterminer un ordre, total ou partiel, sur lequel bâtir un mécanisme de correction (remplissage ou modification) des VP. 1) Mesures de qualité de décision Mesure basée sur la consistance. On voit dans III.C qu étant données la décision D et les conditions C, on peut calculer la valeur γ(c, D) qui reflète la consistance de la table T. Nous appuyons notre première mesure sur cette consistance. Soit deux décisions D 1 et D 2. On dit que D 2 est supérieure que D 1 si elle donne lieu à une meilleure consistance : D 1 D 2 POS A\ D1 (D 1 ) POS A\ D2 (D 2 ) (6) Cette mesure de qualité favorise la décision qui fournit les règles certaines les plus nombreuses. Mesures basées sur les réductions approximatives. Nous définissons une deuxième catégorie de mesures de qualité de décision à partir des réductions approximatives afin de tenir compte de la complexité du calcul. On cherche les décisions D j = {a j } permettant de réduire le nombre de critères à prendre en compte dans les conditions C j = A \ {a j }, tout en conservant une bonne signification telle que définie par un coefficient θ. Pour tout critère a j A, on définit d abord les «réductions approximatives» R jθ, étant donné le seuil θ : R jθ = {P jt C j σ(p jt ) θ} (7) Ce sont les sous-ensembles de critères «acceptables» et inclus dans C j. On peut ensuite définir diverses relations d ordre sur les décisions, soit en fixant un nombre maximum α de conditions à conserver, soit en fixant un ensemble C 0 des conditions jugées préférables dans ce contexte : D 1 D 2 {P R 1θ P α} {Q R 2θ Q α} (8) D 1 D 2 {P R 1θ C 0 P} {Q R 2θ C 0 Q} (9) La formule (8) favorise la décision qui donne de petites réductions, ce qui signifie que l on a besoin de connaître peu de choses sur l utilisateur. La formule (9) prend en compte le contenu des réductions, préférant par exemple les conditions demandant peu d effort à produire par l utilisateur (son code postal, par exemple). On peut aussi combiner ces deux mesures. En pratique, on peut limiter la taille de R jθ pour diminuer la complexité du calcul, ou calibrer le θ pour que les réductions dans R jθ contiennent dans la plupart des cas les critères de C 0. Mesure basée sur la consistance approximative. Nous proposons finalement une mesure complémentaire permettant de départager les décisions qui ne sont pas discriminantes par les mesures définies dans (8) ou (9). Elle repose sur la consistance µ de la table T par rapport aux réductions approximatives. µ(d j ) = 1 R jθ Pjt Rjθ σ(pjt) (10) D 1 D 2 µ(d 1 ) µ(d 2 ) (11) 2) Mécanisme de correction de vecteur de positionnement Une fois que la table T a été formée, on peut mettre en œuvre un mécanisme de correction des VP. Pour chaque type de situation où plusieurs valeurs de critère sont à corriger dans un VP, le système détermine un ordre dans lequel les critères seront tour à tour pris comme décision, ordre établi grâce aux mesures que nous venons de définir. Par exemple, pour un nouvel utilisateur, le système choisit comme décision le premier critère dans l ordre établi et cherche les règles permettant d inférer la valeur ; il passe ensuite au critère suivant, etc. L ordre des critères ne dépend que de la situation et pas des cas particuliers d utilisateurs. Nous voyons donc que notre modèle ne vise pas à remplacer les SR existants, mais offre plutôt des moyens supplémentaires prenant en compte un cadre plus large (communautés multicritère) et un mécanisme permettant de faciliter la tâche de positionnement dans les situations délicates. V. VALIDATION DU MODELE PROPOSE DANS UN SYSTEME DE RECOMMANDATION DE FILMS Nous validons ici la création de la table de communautés sur un cas concret, et nous illustrons l application des mesures de qualité de décision. Ces travaux de validation ne visent pas à calibrer des paramètres ou à améliorer la performance d un système particulier s appuyant sur notre modèle, mais plutôt à montrer comment on peut utiliser notre modèle de formation multiple de communautés dans un SR. Nous présentons d abord quelques chiffres sur le jeu de test, et puis nous décrivons comment nous avons exploité les critères pour créer la table de communautés. Enfin, nous donnons les résultats d analyse sur les mesures de qualité de décision. A. Création de la table de communautés Le jeu de données réelles MovieLens utilisé pour la validation est fourni par le groupe de recherche GroupLens [8]. Il contient évaluations de 943 utilisateurs sur films/vidéo. Alors, la table T contient 943 lignes correspondant au nombre d utilisateurs et 6 colonnes des critères : Age, Profession, Géographie, Motivation, Contenu et Evaluation. Pour le critère Age, nous avons créé 5 communautés par tranche d âge, et pour le critère Profession, nous avons regroupé les métiers proches et formé 7 communautés. Quant au critère Géographie, les utilisateurs ont donné leurs codes postaux aux Etats-Unis, ce qui nous a permis de construire 44 communautés selon les états américains. Le critère Motivation traduit la volonté des utilisateurs à fournir des évaluations pour que le système puisse réaliser le filtrage basé sur le contenu pour eux-mêmes et le filtrage collaboratif pour les communautés. Nous avons créé 5 communautés en fonction des valeurs de motivation : très faible, faible, moyenne, bonne et excellente. Le critère Contenu regroupe les utilisateurs partageant les mêmes intérêts quant aux genres de film. La construction des communautés est plus élaborée : nous avons appliqué d abord la méthode des fourmis

5 Paper ID : artificielles pour placer les utilisateurs dans un espace en 2D et ensuite la classification ascendante hiérarchique en vue d obtenir les communautés concrètes [5], [9]. Finalement, le critère Evaluation s appuie sur les évaluations des utilisateurs, et nous avons appliqué la même méthode que pour le critère Contenu. B. Méthodologie Parmi 6 critères définis, le nombre de communautés pour les 4 premiers est fixé, et il est flexible pour Contenu et Evaluation en raison de l application de la classification hiérarchique. Pourtant, comme nous l avons montré dans [9], les utilisateurs sont souvent bien regroupés dans Ω Contenu alors que Ω Evaluation nous donne une dispersion de positions des utilisateurs à cause du problème du faible nombre d objets jugés en commun entre utilisateurs [2]. Ainsi, la cardinalité Ω Contenu obtenu en utilisant un seuil calibré d entropie dans l application de la classification hiérarchique, est stable (8 communautés). En revanche, la valeur Ω Evaluation varie fortement en fonction du seuil d entropie. Pour cette raison, nous présentons nos résultats en donnant les mesures de qualité de décision en fonction de Ω Evaluation qui s échelonne de 10 à 93 dans le cadre de l expérimentation de classification hiérarchique menée sur ces données. En outre, nous précisons que bien que le calcul des ensembles d approximation soit en général un problème NP-complet, nous n avons utilisé aucune méthode heuristique [14] en raison du nombre faible de critères définis et du temps de calcul raisonnable (une dizaine de minutes par analyse) et pour éviter des effets extérieurs. C. Résultats d analyse Rappelons que nous cherchons à établir un ordre entre les critères, de façon à savoir lequel utiliser comme décision pour le mécanisme de correction de VP. Mesure basée sur la consistance. Dans le TABLEAU II, on obtient les priorités suivantes sur les choix de critères comme décision : Géographie > Age > Profession > Motivation > Contenu > Evaluation. On remarque aussi que plus la valeur Ω Evaluation diminue, plus la consistance se dégrade excepté celle relative au critère Evaluation qui montre la tendance inverse. Par ailleurs, nous soulignons un phénomène intéressant sur les critères Géographie et Contenu, et qui montre l utilité de notre modèle dans ce contexte applicatif. En principe, si on choisit en tant que système un critère comme décision qui forme un nombre élevé de concepts, la taille de la région positive, par conséquent la consistance de T, risque d être faible puisque la taille moyenne des concepts est aussi faible. Par contre, si on prend comme décision un critère créant un petit nombre de concepts, on a plus de chance d obtenir une meilleure consistance. Pourtant, notre mesure a montré que ce n est pas toujours le cas. En effet, elle permet d identifier Géographie qui domine absolument les autres dans la mesure de consistance de la table bien qu il donne lieu à 44 concepts. Par contre, le critère Contenu qui ne crée que 8 concepts n est pas bien classé (en 5 e position). En outre, nous croyons que la navigation dans les grandes communautés entrave la perception des utilisateurs qui risquent de s y perdre. En d autres termes, on peut penser qu ils sont plus à l aise en navigant dans de petites communautés. Il TABLEAU I TABLE DE COMMUNAUTES D UN SYSTEME DE RECOMMANDATION DE FILMS Utilisateur Profession Ville Genre préféré u1 Chercheur Paris Policier u2 Chercheur New York Documentaire u3 Commerçant Paris Documentaire u4 Commerçant Londres Documentaire u5 Commerçant New York Policier u6 Commerçant Londres Documentaire TABLEAU II ANALYSE DE LA FORMULE (6) (%) Géographie 77,62 85,68 89,82 93,64 95,55 95,97 Age 76,25 83,78 86,74 91,41 93,85 94,91 Profession 61,40 71,79 78,90 87,27 92,26 93,21 Motivation 60,13 69,99 76,67 86,21 91,20 92,90 Contenu 50,27 60,45 67,76 76,88 84,94 86,74 Evaluation 46,98 46,55 46,02 45,71 45,28 45,28 TABLEAU III ANALYSE DE LA FORMULE (8) AVEC θ = 0,70 ET α = 1 Géographie Age Motivation Profession Contenu Evaluation TABLEAU IV ANALYSE DE LA FORMULE (9) AVEC θ = 0,70 ET C 0 = {GEOGRAPHIE} Age Profession Motivation Contenu Evaluation TABLEAU V ANALYSE DE LA FORMULE (11) (%) AVEC θ = 0,70 Géographie - 72,75 75,19 80,62 81,04 82,38 Age - 71,79 78,05 78,15 80,51 81,07 Profession ,23 79,53 81,51 Motivation ,49 79,39 81,48 Contenu ,48 75,66 Evaluation semble à première vue que le choix de conditions préférées des utilisateurs soit en contradiction avec l objectif du système qui préfère les décisions donnant de meilleures consistances. Pourtant, le résultat d analyse nous a montré que le critère Géographie peut satisfaire à la fois ces deux exigences. Mesures basées sur les réductions approximatives. Dans notre approche présentée dans [9], le système pourrait utiliser les espaces de communautés comme un mécanisme d explication dans une situation douteuse. En réalité, parfois la sémantique d un critère ou d une communauté joue un rôle très important dans la compréhension et la perception qu un utilisateur peut

6 Paper ID : avoir sur ses communautés et/ou sur les recommandations qu il a reçues. Ainsi, nous pensons que les espaces construits à partir des critères simples facilitent la tâche d explication par rapport à des espaces résultant de critères composés. Par exemple, il est difficile de comprendre la sémantique du critère composé {Géographie, Motivation}. Pour cette raison, nous préférons (8) avec α = 1, et le TABLEAU III présente les résultat illustratifs de cette formule avec θ = 0,70. On voit que le critère Evaluation, qui est compliqué en termes de calcul de communautés, est déjà «éliminé» ; Géographie et Age sont toujours dominants mais il y a déjà un changement de priorité entre Motivation et Profession par rapport à la première mesure. Vue la différence négligeable entre ces critères, on pourrait toujours mettre Profession en priorité en raison de la complexité de calcul puisque sa formation de communautés est beaucoup plus facile que celle du critère Motivation. Le TABLEAU IV montre le résultat d une application de la formule (9) avec la même remarque sur le fait de mettre Profession en priorité par rapport au critère Motivation. Mesure basée sur la consistance approximative. Dans le TABLEAU V, on peut observer que les résultats sont similaires à la première mesure à part une diminution de consistance puisque l on n a traité que les réductions approximatives de conditions, et que le critère Evaluation est éliminé. Pour conclure, nous constatons que ces mesures de qualité de décision permettent de proposer un ordre dans lequel une certaine méthode de correction de VP pourrait être appliquée. VI. CONCLUSION ET PERSPECTIVES Dans cet article, nous avons proposé un modèle de formation multiple de communautés fondé sur la théorie des EA. Nous avons proposé des extensions de cette théorie avec des mesures de qualité de décision. Ce modèle et ces mesures permettent d étendre les fonctionnalités des SR, en les rendant capables de gérer des communautés multicritères explicites, et de mieux exploiter les différents critères selon la situation rencontrée en mesurant leur qualité en tant que critère clé ou décision. Nous avons également validé notre modèle par des expérimentations sur le jeu données réelles MovieLens. Dans les travaux futurs, nous envisageons de varier les mesures de qualité de décision. Les travaux de cet article nous amènent aussi à étudier l usage de la définition de bornes inférieures paramétrées [14] qui pourraient être utilisées dans les SR dont la majorité des critères ne donnent pas, en tant que décision, des tables de communautés de haute consistance. Par exemple, on peut définir qu un élément est dans la borne inférieure d un concept ssi sa classe d équivalence est «presque» incluse dans le concept (voir (1)). Finalement, du point de vue pratique, nous souhaitons réaliser des expérimentations sur la mise en œuvre de notre modèle dans d autres domaines tels que le commerce électronique ou la gestion de connaissances. REFERENCES [1] M. Bouzeghoub, D. Kostadinov, «Personnalisation de l information : Aperçu de l état de l art et définition d un modèle flexible de profils», Actes de la 2 ème COnférence en RI et Applications, France, [2] J. S. Breese, D. Heckerman, C. Kadie, «Empirical Analysis of Predictive Algorithms for Collaborative Filtering», in Proc. 14 th Conference on Uncertainty In AI, USA, [3] R. Burke, «Hybrid Recommender Systems: Survey and Experiments», Journal of Personalization Research, User Modeling and User-Adapted Interaction, Kluwer Academic Publishers, vol. 12 (4), [4] J. W. Grzymala-Busse, M. Hu, A Comparison of Several Approaches to Missing Attribute Values in Data Mining, in Proc. 2 nd Conference on Rough Sets and Current Trends in Computing, Canada, [5] A. K. Jain, M. N. Murty, P. J. Flynn, «Data Clustering: A Review», ACM Computing Surveys, vol. 31 (3), [6] L. Mazlack, Softly Focusing On Data, in Proc. 18 th North American Fuzzy Information Processing Society, USA, [7] M. Montaner, B. López, J. L. De La Rosa, «A Taxonomy of Recommender Agents on the Internet», AI Review, Kluwer Publishers, vol. 19, [8] MovieLens, [9] A-T. Nguyen, N. Denos, C. Berrut, «Cartes de communautés pour l adaptation interactive de profils dans un système de filtrage d information», Actes de la 32 ème Congrès INFORSID, France, [10] Z. Pawlak, «Some Issues on Rough Sets», Transaction on Rough Sets I, LNCS 3100, [11] S. Perugini, M. A. Gonçalves, E. A. Fox, «A Connection-Centric Survey of Recommender Systems Research», Journal of Intelligent Information Systems, vol. 23 (1), [12] G. Shafer, A Mathematical Theory of Evidence, Princeton Press, [13] L. Zadeh, «Fuzzy Sets», Information and Control, vol. 8(3), [14] M. Zhang, J. T. Yao, «A Rough Sets Based Approach to Feature Selection», in Proc. 23 th North American Fuzzy Information Processing Society, Canada, An-Te Nguyen a reçu son mastère en Informatique (1998) à l Université des Sciences Naturelles à HCM-Ville. Il est actuellement doctorant à l Université Joseph Fourier, Grenoble, France. Son sujet de thèse est la personnalisation dans les systèmes de recommandation hybrides, et concerne en particulier l interaction entre système et utilisateurs via des communautés pluri-critères. Nathalie Denos est née en 1970 à Seine-Saint-Denis, France. Après avoir obtenu un diplôme d ingénieur en Informatique à l ENSIMAG, elle a obtenu son doctorat en Informatique en 1998 à l Université Joseph Fourier. Elle est actuellement maître de conférences en Informatique à l Université Pierre Mendès France, Grenoble, et exerce ses activité de recherche au laboratoire CLIPS-IMAG à Grenoble, dans l équipe MRIM (Modélisation et Recherche d Information Multimédia). Ses travaux de recherche relèvent du domaine de la recherche d information au sens large, et concernent en particulier les thèmes suivants : pertinence en recherche d information, qualité des documents, filtrage d information, personnalisation de l accès à l information. Catherine Berrut est née en 1961 à Lyon, France. Après un doctorat en 1988 à l'université de Grenoble, elle soutient une Habilitation à Diriger des Recherches en Maître de conférences à l'université de Grenoble en 1989, elle devient Professeur dans cette même Université en Elle a effectué des séjours dans des universités étrangères : l'université de Genève (Suisse) en 1999, et Dublin City University (Irlande) en Directrice adjointe du laboratoire CLIPS-IMAG à Grenoble, elle dirige l'équipe MRIM. Ses domaines de recherche sont : la recherche d'information multimédia, l'indexation de documents, le filtrage d'information. Bich-Thuy Dong Thi a reçu son doctorat (1986) à l Université de Genève. Elle est actuellement professeur associé en Systèmes d Information à l Université des Sciences Naturelles (Université Nationale du Vietnam HCM-Ville). Ses domaines de recherche couvrent la modélisation des patrons de procédé métier, les systèmes d information intelligents incluant les technologies utilisées dans les systèmes de recommandation ou les systèmes question-réponse. Certaines de ses recherches sont réalisées en collaboration avec des groupes de recherche des universités européennes (groupe Bases de Données de l Université de Genève, CLIPS-IMAG à Grenoble, GRIMM- ISYCOM de l Université de Toulouse Le Mirail, France).

Cartes de communautés pour l adaptation interactive de profils dans un système de filtrage d information

Cartes de communautés pour l adaptation interactive de profils dans un système de filtrage d information Cartes de communautés pour l adaptation interactive de profils dans un système de filtrage d information An-Te Nguyen* Nathalie Denos* Catherine Berrut* * Laboratoire CLIPS-IMAG 385 rue de la Bibliothèque,

Plus en détail

COCoFil2 : Un nouveau système de filtrage collaboratif basé sur le modèle des espaces de communautés

COCoFil2 : Un nouveau système de filtrage collaboratif basé sur le modèle des espaces de communautés UNIVERSITÉ JOSEPH FOURIER GRENOBLE I N 0 attribué par la bibliothèque / / / / / / / / / / / THÈSE pour obtenir le grade de DOCTEUR DE L UNIVERSITÉ JOSEPH FOURIER GRENOBLE I Discipline : Informatique présentée

Plus en détail

INF6304 Interfaces Intelligentes

INF6304 Interfaces Intelligentes INF6304 Interfaces Intelligentes filtres collaboratifs 1/42 INF6304 Interfaces Intelligentes Systèmes de recommandations, Approches filtres collaboratifs Michel C. Desmarais Génie informatique et génie

Plus en détail

Etude d un cas industriel : Optimisation de la modélisation de paramètre de production

Etude d un cas industriel : Optimisation de la modélisation de paramètre de production Revue des Sciences et de la Technologie RST- Volume 4 N 1 /janvier 2013 Etude d un cas industriel : Optimisation de la modélisation de paramètre de production A.F. Bernate Lara 1, F. Entzmann 2, F. Yalaoui

Plus en détail

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com

Intelligence Artificielle et Systèmes Multi-Agents. Badr Benmammar bbm@badr-benmammar.com Intelligence Artificielle et Systèmes Multi-Agents Badr Benmammar bbm@badr-benmammar.com Plan La première partie : L intelligence artificielle (IA) Définition de l intelligence artificielle (IA) Domaines

Plus en détail

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring

Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Projet SINF2275 «Data mining and decision making» Projet classification et credit scoring Année académique 2006-2007 Professeurs : Marco Saerens Adresse : Université catholique de Louvain Information Systems

Plus en détail

Programmation linéaire

Programmation linéaire 1 Programmation linéaire 1. Le problème, un exemple. 2. Le cas b = 0 3. Théorème de dualité 4. L algorithme du simplexe 5. Problèmes équivalents 6. Complexité de l Algorithme 2 Position du problème Soit

Plus en détail

De la mesure à l analyse des risques

De la mesure à l analyse des risques De la mesure à l analyse des risques Séminaire ISFA - B&W Deloitte Jean-Paul LAURENT Professeur à l'isfa, Université Claude Bernard Lyon 1 laurent.jeanpaul@free.fr http://laurent.jeanpaul.free.fr/ 0 De

Plus en détail

Application de K-means à la définition du nombre de VM optimal dans un cloud

Application de K-means à la définition du nombre de VM optimal dans un cloud Application de K-means à la définition du nombre de VM optimal dans un cloud EGC 2012 : Atelier Fouille de données complexes : complexité liée aux données multiples et massives (31 janvier - 3 février

Plus en détail

Mécanisme de prédiction pour une plateforme de filtrage collaboratif*

Mécanisme de prédiction pour une plateforme de filtrage collaboratif* Mécanisme de prédiction pour une plateforme de filtrage collaboratif* Omar Nouali, Sabah Kirat, Hadar Meziani Division des théories d ingénierie et des systèmes d information, CERIST Rue des 3 frères Aïssou

Plus en détail

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING»

LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» LA NOTATION STATISTIQUE DES EMPRUNTEURS OU «SCORING» Gilbert Saporta Professeur de Statistique Appliquée Conservatoire National des Arts et Métiers Dans leur quasi totalité, les banques et organismes financiers

Plus en détail

Laboratoire 4 Développement d un système intelligent

Laboratoire 4 Développement d un système intelligent DÉPARTEMENT DE GÉNIE LOGICIEL ET DES TI LOG770 - SYSTÈMES INTELLIGENTS ÉTÉ 2012 Laboratoire 4 Développement d un système intelligent 1 Introduction Ce quatrième et dernier laboratoire porte sur le développement

Plus en détail

L usage des concepts du web sémantique dans le filtrage d information collaboratif

L usage des concepts du web sémantique dans le filtrage d information collaboratif Ministère de l enseignement Supérieur et de la recherche scientifique Institut National d Informatique Alger Mémoire présenté pour l obtention du diplôme de Magistère Option : Ingénierie des Systèmes d

Plus en détail

Introduction au Data-Mining

Introduction au Data-Mining Introduction au Data-Mining Alain Rakotomamonjy - Gilles Gasso. INSA Rouen -Département ASI Laboratoire PSI Introduction au Data-Mining p. 1/25 Data-Mining : Kèkecé? Traduction : Fouille de données. Terme

Plus en détail

Classification Automatique de messages : une approche hybride

Classification Automatique de messages : une approche hybride RECIAL 2002, Nancy, 24-27 juin 2002 Classification Automatique de messages : une approche hybride O. Nouali (1) Laboratoire des Logiciels de base, CE.R.I.S., Rue des 3 frères Aïssiou, Ben Aknoun, Alger,

Plus en détail

L apprentissage automatique

L apprentissage automatique L apprentissage automatique L apprentissage automatique L'apprentissage automatique fait référence au développement, à l analyse et à l implémentation de méthodes qui permettent à une machine d évoluer

Plus en détail

Représentation des Nombres

Représentation des Nombres Chapitre 5 Représentation des Nombres 5. Representation des entiers 5.. Principe des représentations en base b Base L entier écrit 344 correspond a 3 mille + 4 cent + dix + 4. Plus généralement a n a n...

Plus en détail

De la mesure à l analyse des risques

De la mesure à l analyse des risques De la mesure à l analyse des risques Séminaire FFA Jean-Paul LAURENT Professeur à l'isfa jean-paul.laurent@univ-lyon1.fr http://laurent.jeanpaul.free.fr/ 0 De la la mesure à l analyse des risques! Intégrer

Plus en détail

Annexe 6. Notions d ordonnancement.

Annexe 6. Notions d ordonnancement. Annexe 6. Notions d ordonnancement. APP3 Optimisation Combinatoire: problèmes sur-contraints et ordonnancement. Mines-Nantes, option GIPAD, 2011-2012. Sophie.Demassey@mines-nantes.fr Résumé Ce document

Plus en détail

Principe d un test statistique

Principe d un test statistique Biostatistiques Principe d un test statistique Professeur Jean-Luc BOSSON PCEM2 - Année universitaire 2012/2013 Faculté de Médecine de Grenoble (UJF) - Tous droits réservés. Objectifs pédagogiques Comprendre

Plus en détail

ACCÈS SÉMANTIQUE AUX BASES DE DONNÉES DOCUMENTAIRES

ACCÈS SÉMANTIQUE AUX BASES DE DONNÉES DOCUMENTAIRES ACCÈS SÉMANTIQUE AUX BASES DE DONNÉES DOCUMENTAIRES Techniques symboliques de traitement automatique du langage pour l indexation thématique et l extraction d information temporelle Thèse Défense publique

Plus en détail

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci http://liris.cnrs.fr/hamamache.kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de

Plus en détail

Le projet collaboratif 2.0

Le projet collaboratif 2.0 Florence Gicquel et Aref Jdey En collaboration avec Alpha Diallo Le projet collaboratif 2.0 Pour mobiliser la Documentation au service de l entreprise é d i t i o n s Les Editions de l ADBS publient des

Plus en détail

LE MARKETING DIRECT, SUPPORT DU MARKETING CLIENT

LE MARKETING DIRECT, SUPPORT DU MARKETING CLIENT 11 CHAPITRE PREMIER LE MARKETING DIRECT, SUPPORT DU MARKETING CLIENT En moins d un siècle, le marketing direct a profondément évolué. Passant de la commande traditionnelle par courrier à la multiplication

Plus en détail

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Yves Aragon, David Haziza & Anne Ruiz-Gazen GREMAQ, UMR CNRS 5604, Université des Sciences

Plus en détail

Sélection de Caractéristiques pour le Filtrage de Spams

Sélection de Caractéristiques pour le Filtrage de Spams Sélection de Caractéristiques pour le Filtrage de Spams Kamilia MENGHOUR, Labiba SOUICI-MESLATI Laboratoire LRI, Université Badji Mokhtar, BP 12, 23000, Annaba, Algérie. k_menghour@yahoo.fr, souici_labiba@yahoo.fr

Plus en détail

La classification automatique de données quantitatives

La classification automatique de données quantitatives La classification automatique de données quantitatives 1 Introduction Parmi les méthodes de statistique exploratoire multidimensionnelle, dont l objectif est d extraire d une masse de données des informations

Plus en détail

Entraînement, consolidation, structuration... Que mettre derrière ces expressions?

Entraînement, consolidation, structuration... Que mettre derrière ces expressions? Entraînement, consolidation, structuration... Que mettre derrière ces expressions? Il est clair que la finalité principale d une démarche d investigation est de faire acquérir des connaissances aux élèves.

Plus en détail

Principe de symétrisation pour la construction d un test adaptatif

Principe de symétrisation pour la construction d un test adaptatif Principe de symétrisation pour la construction d un test adaptatif Cécile Durot 1 & Yves Rozenholc 2 1 UFR SEGMI, Université Paris Ouest Nanterre La Défense, France, cecile.durot@gmail.com 2 Université

Plus en détail

Encryptions, compression et partitionnement des données

Encryptions, compression et partitionnement des données Encryptions, compression et partitionnement des données Version 1.0 Grégory CASANOVA 2 Compression, encryption et partitionnement des données Sommaire 1 Introduction... 3 2 Encryption transparente des

Plus en détail

Analyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57

Analyse de la vidéo. Chapitre 4.1 - La modélisation pour le suivi d objet. 10 mars 2015. Chapitre 4.1 - La modélisation d objet 1 / 57 Analyse de la vidéo Chapitre 4.1 - La modélisation pour le suivi d objet 10 mars 2015 Chapitre 4.1 - La modélisation d objet 1 / 57 La représentation d objets Plan de la présentation 1 La représentation

Plus en détail

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI 1 Déroulement d un projet en DATA MINING, préparation et analyse des données Walid AYADI 2 Les étapes d un projet Choix du sujet - Définition des objectifs Inventaire des données existantes Collecte, nettoyage

Plus en détail

La révision des indices du cours du franc suisse, nominaux et réels, pondérés par les exportations

La révision des indices du cours du franc suisse, nominaux et réels, pondérés par les exportations La révision des indices du cours du franc suisse, nominaux et réels, pondérés par les exportations par Robert Fluri et Robert Müller, Direction de la statistique, Banque nationale suisse, Zurich BNS 42

Plus en détail

Commentaires. Michael Narayan. Les taux de change à terme

Commentaires. Michael Narayan. Les taux de change à terme Commentaires Michael Narayan L étude de Levin, Mc Manus et Watt est un intéressant exercice théorique qui vise à extraire l information contenue dans les prix des options sur contrats à terme sur le dollar

Plus en détail

Intégration et probabilités TD1 Espaces mesurés Corrigé

Intégration et probabilités TD1 Espaces mesurés Corrigé Intégration et probabilités TD1 Espaces mesurés Corrigé 2012-2013 1 Petites questions 1 Est-ce que l ensemble des ouverts de R est une tribu? Réponse : Non, car le complémentaire de ], 0[ n est pas ouvert.

Plus en détail

Le Data Mining au service du Scoring ou notation statistique des emprunteurs!

Le Data Mining au service du Scoring ou notation statistique des emprunteurs! France Le Data Mining au service du Scoring ou notation statistique des emprunteurs! Comme le rappelle la CNIL dans sa délibération n 88-083 du 5 Juillet 1988 portant adoption d une recommandation relative

Plus en détail

TRS: Sélection des sous-graphes représentants par l intermédiaire des attributs topologiques et K-medoïdes

TRS: Sélection des sous-graphes représentants par l intermédiaire des attributs topologiques et K-medoïdes TRS: Sélection des sous-graphes représentants par l intermédiaire des attributs topologiques et K-medoïdes Mohamed Moussaoui,Wajdi Dhifli,Sami Zghal,Engelbert Mephu Nguifo FSJEG, Université de Jendouba,

Plus en détail

Transmission d informations sur le réseau électrique

Transmission d informations sur le réseau électrique Transmission d informations sur le réseau électrique Introduction Remarques Toutes les questions en italique devront être préparées par écrit avant la séance du TP. Les préparations seront ramassées en

Plus en détail

Big Data et Graphes : Quelques pistes de recherche

Big Data et Graphes : Quelques pistes de recherche Big Data et Graphes : Quelques pistes de recherche Hamamache Kheddouci Laboratoire d'informatique en Image et Systèmes d'information LIRIS UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université

Plus en détail

Introduction à l étude des Corps Finis

Introduction à l étude des Corps Finis Introduction à l étude des Corps Finis Robert Rolland (Résumé) 1 Introduction La structure de corps fini intervient dans divers domaines des mathématiques, en particulier dans la théorie de Galois sur

Plus en détail

Data Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto.

Data Mining. Vincent Augusto 2012-2013. École Nationale Supérieure des Mines de Saint-Étienne. Data Mining. V. Augusto. des des Data Mining Vincent Augusto École Nationale Supérieure des Mines de Saint-Étienne 2012-2013 1/65 des des 1 2 des des 3 4 Post-traitement 5 représentation : 6 2/65 des des Définition générale Le

Plus en détail

Nombre de marches Nombre de facons de les monter 3 3 11 144 4 5 12 233 5 8 13 377 6 13 14 610 7 21 15 987 8 34 16 1597 9 55 17 2584 10 89

Nombre de marches Nombre de facons de les monter 3 3 11 144 4 5 12 233 5 8 13 377 6 13 14 610 7 21 15 987 8 34 16 1597 9 55 17 2584 10 89 Soit un escalier à n marches. On note u_n le nombre de façons de monter ces n marches. Par exemple d'après l'énoncé, u_3=3. Pour monter n marches, il faut d'abord monter la première. Soit on la monte seule,

Plus en détail

Théorie et codage de l information

Théorie et codage de l information Théorie et codage de l information Les codes linéaires - Chapitre 6 - Principe Définition d un code linéaire Soient p un nombre premier et s est un entier positif. Il existe un unique corps de taille q

Plus en détail

Objectifs du cours d aujourd hui. Informatique II : Cours d introduction à l informatique et à la programmation objet. Complexité d un problème (2)

Objectifs du cours d aujourd hui. Informatique II : Cours d introduction à l informatique et à la programmation objet. Complexité d un problème (2) Objectifs du cours d aujourd hui Informatique II : Cours d introduction à l informatique et à la programmation objet Complexité des problèmes Introduire la notion de complexité d un problème Présenter

Plus en détail

L ATTRIBUTION EN MARKETING DIGITAL

L ATTRIBUTION EN MARKETING DIGITAL Online Intelligence Solutions L ATTRIBUTION EN MARKETING DIGITAL Par Jacques Warren WHITE PAPER WHITE PAPER A Propos de Jacques Warren Jacques Warren évolue en marketing digital depuis 1996, se concentrant

Plus en détail

Chapitre 2. Eléments pour comprendre un énoncé

Chapitre 2. Eléments pour comprendre un énoncé Chapitre 2 Eléments pour comprendre un énoncé Ce chapitre est consacré à la compréhension d un énoncé. Pour démontrer un énoncé donné, il faut se reporter au chapitre suivant. Les tables de vérité données

Plus en détail

Définition et diffusion de signatures sémantiques dans les systèmes pair-à-pair

Définition et diffusion de signatures sémantiques dans les systèmes pair-à-pair Définition et diffusion de signatures sémantiques dans les systèmes pair-à-pair Raja Chiky, Bruno Defude, Georges Hébrail GET-ENST Paris Laboratoire LTCI - UMR 5141 CNRS Département Informatique et Réseaux

Plus en détail

Le ROI du marketing digital

Le ROI du marketing digital Online Intelligence Solutions Le ROI du marketing digital et les Web Analytics Par Jacques Warren WHITE PAPER A propos de Jacques warren Jacques Warren évolue en marketing digital depuis 1996, se concentrant

Plus en détail

recommandation Domaine : Informatique, Intelligence Artificielle, Modélisation de préférences

recommandation Domaine : Informatique, Intelligence Artificielle, Modélisation de préférences Modélisation des utilisateurs atypiques dans les systèmes de recommandation Directeur de thèse : Anne BOYER Si le directeur de thèse n'apparait pas dans le menu déroulant, vous pouvez indiquer cette information

Plus en détail

Copyright 2014 edimap, Paris & Université d Économie de Katowice, Katowice Tous droits réservés pour tous pays

Copyright 2014 edimap, Paris & Université d Économie de Katowice, Katowice Tous droits réservés pour tous pays Le document ci-après est un extrait de l ouvrage collectif dirigé par Henryk Brandenburg, Projets locaux et régionaux. La coopération entre le monde scientifique, le monde des affaires et les collectivités

Plus en détail

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services 69 Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services M. Bakhouya, J. Gaber et A. Koukam Laboratoire Systèmes et Transports SeT Université de Technologie de Belfort-Montbéliard

Plus en détail

Les débats sur l évolution des

Les débats sur l évolution des D o c u m e n t d e t r a v a i l d e l a B r a n c h e R e t r a i t e s d e l a C a i s s e d e s d é p ô t s e t c o n s i g n a t i o n s n 9 8-0 7 C o n t a c t : La u re nt V e r n i è r e 0 1 4

Plus en détail

NON-LINEARITE ET RESEAUX NEURONAUX

NON-LINEARITE ET RESEAUX NEURONAUX NON-LINEARITE ET RESEAUX NEURONAUX Vêlayoudom MARIMOUTOU Laboratoire d Analyse et de Recherche Economiques Université de Bordeaux IV Avenue. Leon Duguit, 33608 PESSAC, France tel. 05 56 84 85 77 e-mail

Plus en détail

Bases de données documentaires et distribuées Cours NFE04

Bases de données documentaires et distribuées Cours NFE04 Bases de données documentaires et distribuées Cours NFE04 Introduction a la recherche d information Auteurs : Raphaël Fournier-S niehotta, Philippe Rigaux, Nicolas Travers prénom.nom@cnam.fr Département

Plus en détail

Traitement et exploration du fichier Log du Serveur Web, pour l extraction des connaissances: Web Usage Mining

Traitement et exploration du fichier Log du Serveur Web, pour l extraction des connaissances: Web Usage Mining Traitement et exploration du fichier Log du Serveur Web, pour l extraction des connaissances: Web Usage Mining Mostafa HANOUNE*, Fouzia BENABBOU* *Université Hassan II- Mohammedia, Faculté des sciences

Plus en détail

Hervé Couturier EVP, SAP Technology Development

Hervé Couturier EVP, SAP Technology Development Hervé Couturier EVP, SAP Technology Development Hervé Biausser Directeur de l Ecole Centrale Paris Bernard Liautaud Fondateur de Business Objects Questions à: Hervé Couturier Hervé Biausser Bernard Liautaud

Plus en détail

Pourquoi l apprentissage?

Pourquoi l apprentissage? Pourquoi l apprentissage? Les SE sont basés sur la possibilité d extraire la connaissance d un expert sous forme de règles. Dépend fortement de la capacité à extraire et formaliser ces connaissances. Apprentissage

Plus en détail

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme?

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme? Exercices Alternatifs Quelqu un aurait-il vu passer un polynôme? c 2004 Frédéric Le Roux, François Béguin (copyleft LDL : Licence pour Documents Libres). Sources et figures: polynome-lagrange/. Version

Plus en détail

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme?

Exercices Alternatifs. Quelqu un aurait-il vu passer un polynôme? Exercices Alternatifs Quelqu un aurait-il vu passer un polynôme? c 2004 Frédéric Le Roux, François Béguin (copyleft LDL : Licence pour Documents Libres). Sources et figures: polynome-lagrange/. Version

Plus en détail

Cours de Master Recherche

Cours de Master Recherche Cours de Master Recherche Spécialité CODE : Résolution de problèmes combinatoires Christine Solnon LIRIS, UMR 5205 CNRS / Université Lyon 1 2007 Rappel du plan du cours 16 heures de cours 1 - Introduction

Plus en détail

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21

IODAA. de l 1nf0rmation à la Décision par l Analyse et l Apprentissage / 21 IODAA de l 1nf0rmation à la Décision par l Analyse et l Apprentissage IODAA Informations générales 2 Un monde nouveau Des données numériques partout en croissance prodigieuse Comment en extraire des connaissances

Plus en détail

Article. Expériences en matière d enquêtes multimodales. par Mark Pierzchala

Article. Expériences en matière d enquêtes multimodales. par Mark Pierzchala Composante du produit n o 11-522-X au catalogue de Statistique Canada La série des symposiums internationaux de Statistique Canada : recueil Article Symposium 2008 : Collecte des données : défis, réalisations

Plus en détail

CONSEILS POUR LA REDACTION DU RAPPORT DE RECHERCHE. Information importante : Ces conseils ne sont pas exhaustifs!

CONSEILS POUR LA REDACTION DU RAPPORT DE RECHERCHE. Information importante : Ces conseils ne sont pas exhaustifs! CONSEILS POUR LA REDACTION DU RAPPORT DE RECHERCHE Information importante : Ces conseils ne sont pas exhaustifs! Conseils généraux : Entre 25 et 60 pages (hormis références, annexes, résumé) Format d un

Plus en détail

Université Paris-Dauphine DUMI2E 1ère année, 2009-2010. Applications

Université Paris-Dauphine DUMI2E 1ère année, 2009-2010. Applications Université Paris-Dauphine DUMI2E 1ère année, 2009-2010 Applications 1 Introduction Une fonction f (plus précisément, une fonction réelle d une variable réelle) est une règle qui associe à tout réel x au

Plus en détail

Cours 1 : Qu est-ce que la programmation?

Cours 1 : Qu est-ce que la programmation? 1/65 Introduction à la programmation Cours 1 : Qu est-ce que la programmation? Yann Régis-Gianas yrg@pps.univ-paris-diderot.fr Université Paris Diderot Paris 7 2/65 1. Sortez un appareil qui peut se rendre

Plus en détail

Rapport d évaluation du master

Rapport d évaluation du master Section des Formations et des diplômes Rapport d évaluation du master Management public de l Université de Lorraine Vague C 2013-2017 Campagne d évaluation 2011-2012 Section des Formations et des diplômes

Plus en détail

Utiliser un tableau de données

Utiliser un tableau de données Utiliser un tableau de données OBJECTIFS : - Définir une Base de Données. - Présentation : tableau de données. - Création d un tableau de données - Gestion d un tableau de données. - Trier et Filtrer des

Plus en détail

Probabilités conditionnelles Loi binomiale

Probabilités conditionnelles Loi binomiale Fiche BAC ES 05 Terminale ES Probabilités conditionnelles Loi binomiale Cette fiche sera complétée au fur et à mesure Exercice n 1. BAC ES. Centres étrangers 2012. [RÉSOLU] Un sondage a été effectué auprès

Plus en détail

Amélioration de la fiabilité d inspection en CND grâce à la fusion d information : applications en rayons X et ultrasons

Amélioration de la fiabilité d inspection en CND grâce à la fusion d information : applications en rayons X et ultrasons Amélioration de la fiabilité d inspection en CND grâce à la fusion d information : applications en rayons X et ultrasons Ahmad OSMAN 1a, Valérie KAFTANDJIAN b, Ulf HASSLER a a Fraunhofer Development Center

Plus en détail

ANALYSE DU RISQUE DE CRÉDIT

ANALYSE DU RISQUE DE CRÉDIT ANALYSE DU RISQUE DE CRÉDIT Banque & Marchés Cécile Kharoubi Professeur de Finance ESCP Europe Philippe Thomas Professeur de Finance ESCP Europe TABLE DES MATIÈRES Introduction... 15 Chapitre 1 Le risque

Plus en détail

Exercices Corrigés Premières notions sur les espaces vectoriels

Exercices Corrigés Premières notions sur les espaces vectoriels Exercices Corrigés Premières notions sur les espaces vectoriels Exercice 1 On considére le sous-espace vectoriel F de R formé des solutions du système suivant : x1 x 2 x 3 + 2x = 0 E 1 x 1 + 2x 2 + x 3

Plus en détail

WHITE PAPER Une revue de solution par Talend & Infosense

WHITE PAPER Une revue de solution par Talend & Infosense WHITE PAPER Une revue de solution par Talend & Infosense Master Data Management pour les données de référence dans le domaine de la santé Table des matières CAS D ETUDE : COLLABORATION SOCIALE ET ADMINISTRATION

Plus en détail

LE GRAND ÉCART L INÉGALITÉ DE LA REDISTRIBUTION DES BÉNÉFICES PROVENANT DU FRACTIONNEMENT DU REVENU

LE GRAND ÉCART L INÉGALITÉ DE LA REDISTRIBUTION DES BÉNÉFICES PROVENANT DU FRACTIONNEMENT DU REVENU LE GRAND ÉCART L INÉGALITÉ DE LA REDISTRIBUTION DES BÉNÉFICES PROVENANT DU FRACTIONNEMENT DU REVENU RÉSUMÉ Une étude de Tristat Resources commandée par l Institut Broadbent démontre que la majorité des

Plus en détail

Exercices - Fonctions de plusieurs variables : corrigé. Pour commencer

Exercices - Fonctions de plusieurs variables : corrigé. Pour commencer Pour commencer Exercice 1 - Ensembles de définition - Première année - 1. Le logarithme est défini si x + y > 0. On trouve donc le demi-plan supérieur délimité par la droite d équation x + y = 0.. 1 xy

Plus en détail

Article de recherche théorique et article de recherche empirique : particularités 1

Article de recherche théorique et article de recherche empirique : particularités 1 La présentation d un article de recherche de type théorique 1 Article de recherche théorique et article de recherche empirique : particularités 1 Gilles Raîche, professeur Université du Québec à Montréal

Plus en détail

LE ROLE DES INCITATIONS MONETAIRES DANS LA DEMANDE DE SOINS : UNE EVALUATION EMPIRIQUE.

LE ROLE DES INCITATIONS MONETAIRES DANS LA DEMANDE DE SOINS : UNE EVALUATION EMPIRIQUE. LE ROLE DES INCITATIONS MONETAIRES DANS LA DEMANDE DE SOINS : UNE EVALUATION EMPIRIQUE. Synthèse des travaux réalisés 1. Problématique La question D7 du plan d exécution du Programme National de Recherches

Plus en détail

Une méthode d apprentissage pour la composition de services web

Une méthode d apprentissage pour la composition de services web Une méthode d apprentissage pour la composition de services web Soufiene Lajmi * Chirine Ghedira ** Khaled Ghedira * * Laboratoire SOIE (ENSI) University of Manouba, Manouba 2010, Tunisia Soufiene.lajmi@ensi.rnu.tn,

Plus en détail

Théorèmes de Point Fixe et Applications 1

Théorèmes de Point Fixe et Applications 1 Théorèmes de Point Fixe et Applications 1 Victor Ginsburgh Université Libre de Bruxelles et CORE, Louvain-la-Neuve Janvier 1999 Published in C. Jessua, C. Labrousse et D. Vitry, eds., Dictionnaire des

Plus en détail

TP 2 Réseaux. Adresses IP, routage et sous-réseaux

TP 2 Réseaux. Adresses IP, routage et sous-réseaux TP 2 Réseaux Adresses IP, routage et sous-réseaux C. Pain-Barre INFO - IUT Aix-en-Provence version du 24/2/2 Adressage IP. Limites du nombre d adresses IP.. Adresses de réseaux valides Les adresses IP

Plus en détail

SECTION 5 BANQUE DE PROJETS

SECTION 5 BANQUE DE PROJETS SECTION 5 BANQUE DE PROJETS INF 4018 BANQUE DE PROJETS - 1 - Banque de projets PROJET 2.1 : APPLICATION LOGICIELLE... 3 PROJET 2.2 : SITE WEB SÉMANTIQUE AVEC XML... 5 PROJET 2.3 : E-LEARNING ET FORMATION

Plus en détail

V- Manipulations de nombres en binaire

V- Manipulations de nombres en binaire 1 V- Manipulations de nombres en binaire L ordinateur est constitué de milliards de transistors qui travaillent comme des interrupteurs électriques, soit ouverts soit fermés. Soit la ligne est activée,

Plus en détail

Mastère spécialisé. «Ingénierie de l innovation et du produit nouveau De l idée à la mise en marché»

Mastère spécialisé. «Ingénierie de l innovation et du produit nouveau De l idée à la mise en marché» Mastère spécialisé «Ingénierie de l innovation et du produit nouveau De l idée à la mise en marché» I- Présentation détaillée du programme d enseignement Répartition par modules et crédits ECTS : Intitulé

Plus en détail

EXPLORATION DES BASES DE DONNÉES INDUSTRIELLES À L AIDE DU DATA MINING PERSPECTIVES

EXPLORATION DES BASES DE DONNÉES INDUSTRIELLES À L AIDE DU DATA MINING PERSPECTIVES EXPLORATION DES BASES DE DONNÉES INDUSTRIELLES À L AIDE DU DATA MINING PERSPECTIVES Bruno Agard (1), Andrew Kusiak (2) (1) Département de Mathématiques et de Génie Industriel, École Polytechnique de Montréal,

Plus en détail

Créer le schéma relationnel d une base de données ACCESS

Créer le schéma relationnel d une base de données ACCESS Utilisation du SGBD ACCESS Polycopié réalisé par Chihab Hanachi et Jean-Marc Thévenin Créer le schéma relationnel d une base de données ACCESS GENERALITES SUR ACCESS... 1 A PROPOS DE L UTILISATION D ACCESS...

Plus en détail

CURRICULUM VITAE. Informations Personnelles

CURRICULUM VITAE. Informations Personnelles CURRICULUM VITAE Informations Personnelles NOM: BOURAS PRENOM : Zine-Eddine STRUCTURE DE RATTACHEMENT: Département de Mathématiques et d Informatique Ecole Préparatoire aux Sciences et Techniques Annaba

Plus en détail

Filtrage collaboratif

Filtrage collaboratif Chapitre 8 Filtrage collaboratif 8.1. Introduction 8.1.1. Motivation et application des systèmes de filtrage 8.1.1.1. Principe général L accès à l information s effectue à l heure actuelle selon différentes

Plus en détail

Qu est-ce qu une probabilité?

Qu est-ce qu une probabilité? Chapitre 1 Qu est-ce qu une probabilité? 1 Modéliser une expérience dont on ne peut prédire le résultat 1.1 Ensemble fondamental d une expérience aléatoire Une expérience aléatoire est une expérience dont

Plus en détail

Définitions. Numéro à préciser. (Durée : )

Définitions. Numéro à préciser. (Durée : ) Numéro à préciser (Durée : ) On étudie dans ce problème l ordre lexicographique pour les mots sur un alphabet fini et plusieurs constructions des cycles de De Bruijn. Les trois parties sont largement indépendantes.

Plus en détail

Projet 2. Gestion des services enseignants CENTRE D ENSEIGNEMENT ET DE RECHERCHE EN INFORMATIQUE. G r o u p e :

Projet 2. Gestion des services enseignants CENTRE D ENSEIGNEMENT ET DE RECHERCHE EN INFORMATIQUE. G r o u p e : CENTRE D ENSEIGNEMENT ET DE RECHERCHE EN INFORMATIQUE Projet 2 Gestion des services enseignants G r o u p e : B E L G H I T Y a s m i n e S A N C H E Z - D U B R O N T Y u r i f e r M O N T A Z E R S i

Plus en détail

Laboratoire d Automatique et Productique Université de Batna, Algérie

Laboratoire d Automatique et Productique Université de Batna, Algérie Anale. Seria Informatică. Vol. IX fasc. 2 Annals. Computer Science Series. 9 th Tome st Fasc. 2 La sélection de paramètres d un système industriel par les colonies de fourmis Ouahab Kadri, L. Hayet Mouss,

Plus en détail

Solutions. Une expertise au service de vos besoins logiciels.

Solutions. Une expertise au service de vos besoins logiciels. Solutions Une expertise au service de vos besoins logiciels. SIX Financial Information Solutions offre une combinaison parfaite des données, des process et du logiciel pour développer des produits sur

Plus en détail

CLOUD PUBLIC, PRIVÉ OU HYBRIDE : LEQUEL EST LE PLUS ADAPTÉ À VOS APPLICATIONS?

CLOUD PUBLIC, PRIVÉ OU HYBRIDE : LEQUEL EST LE PLUS ADAPTÉ À VOS APPLICATIONS? CLOUD PUBLIC, PRIVÉ OU HYBRIDE : LEQUEL EST LE PLUS ADAPTÉ À VOS APPLICATIONS? Les offres de Cloud public se sont multipliées et le Cloud privé se généralise. Désormais, toute la question est de savoir

Plus en détail

Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe

Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe Structuration des décisions de jurisprudence basée sur une ontologie juridique en langue arabe Karima Dhouib, Sylvie Després Faiez Gargouri ISET - Sfax Tunisie, BP : 88A Elbustan ; Sfax karima.dhouib@isets.rnu.tn,

Plus en détail

La fonction exponentielle

La fonction exponentielle DERNIÈRE IMPRESSION LE 2 novembre 204 à :07 La fonction exponentielle Table des matières La fonction exponentielle 2. Définition et théorèmes.......................... 2.2 Approche graphique de la fonction

Plus en détail

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique

Objectifs. Clustering. Principe. Applications. Applications. Cartes de crédits. Remarques. Biologie, Génomique Objectifs Clustering On ne sait pas ce qu on veut trouver : on laisse l algorithme nous proposer un modèle. On pense qu il existe des similarités entre les exemples. Qui se ressemble s assemble p. /55

Plus en détail

ISO/CEI 11172-3 NORME INTERNATIONALE

ISO/CEI 11172-3 NORME INTERNATIONALE NORME INTERNATIONALE ISO/CEI 11172-3 Première édition 1993-08-01 Technologies de l information - Codage de l image animée et du son associé pour les supports de stockage numérique jusqu à environ Ii5 Mbit/s

Plus en détail

IBM SPSS Direct Marketing 21

IBM SPSS Direct Marketing 21 IBM SPSS Direct Marketing 21 Remarque : Avant d utiliser ces informations et le produit qu elles concernent, lisez les informations générales sous Remarques sur p. 109. Cette version s applique à IBM SPSS

Plus en détail

JE MONTE UN SITE INTERNET

JE MONTE UN SITE INTERNET JE MONTE UN SITE INTERNET GUIDE PRATIQUE C O M M I S S I O N N A T I O N A L E D E L I N F O R M A T I Q U E E T D E S L I B E R T E S Janvier 2006 JE MONTE UN SITE INTERNET Le monde virtuel auquel vous

Plus en détail

Nouvelles propositions pour la résolution exacte du problème de sac à dos bi-objectif unidimensionnel en variables binaires

Nouvelles propositions pour la résolution exacte du problème de sac à dos bi-objectif unidimensionnel en variables binaires Nouvelles propositions pour la résolution exacte du problème de sac à dos bi-objectif unidimensionnel en variables binaires Julien Jorge, Xavier Gandibleux Laboratoire d Informatique de Nantes Atlantique

Plus en détail

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé

Baccalauréat ES Pondichéry 7 avril 2014 Corrigé Baccalauréat ES Pondichéry 7 avril 204 Corrigé EXERCICE 4 points Commun à tous les candidats. Proposition fausse. La tangente T, passant par les points A et B d abscisses distinctes, a pour coefficient

Plus en détail