GeniMiner, un moteur de recherche génétique

Dimension: px
Commencer à balayer dès la page:

Download "GeniMiner, un moteur de recherche génétique"

Transcription

1 GeniMiner, un moteur de recherche génétique Fabien Picarougne Nicolas Monmarché Antoine Oliver Gilles Venturini Laboratoire d Informatique de l Université de Tours, École Polytechnique de l Université de Tours, Département d Informatique 64, Avenue Jean Portalis, Tours. RÉSUMÉ. Nous présentons dans cet article une stratégie de recherche génétique pour un moteur de recherche. Nous commençons par montrer que des relations importantes existent entre les études statistiques des propriétés du Web, les moteurs de recherche fondés sur les approches à base d agents, et les techniques utilisées classiquement en optimisation : le Web est un graphe qui peut être exploré à l aide d une fonction d évaluation et d opérateurs fondés sur la création ou l exploration locale. Il devient alors possible de définir une fonction d évaluation qui est une formulation mathématique de la requête de l utilisateur et de définir un algorithme génétique qui fait évoluer une population de pages avec des opérateurs spécifiques. La création d individu consiste à interroger des moteurs classiques. La mutation consiste à explorer le voisinage d une page grâce à ses hyperliens. Nous présentons des résultats comparatifs obtenus avec un protocole de tests directement calqués sur ceux utilisés en optimisation. ABSTRACT. We present in this paper a genetic search strategy for a search engine. We begin by showing that important relations exist between Web statistical studies, search engines based on agent approach, and standard techniques in optimization: the web is a graph which can be searched for relevant information with an evaluation function and with operators based on creation or local exploration. It is then straightforward to define an evaluation function that is a mathematical formulation of the user request and to define a steady state genetic algorithm that evolves a population of pages with specific operators. The creation of individuals is performed by querying standard search engines. The mutation operator consists in exploring the neighborhood of a page thanks to the hyperlinks. We present a comparative evaluation which is performed with the same protocol as used in optimization. MOTS-CLÉS : moteur de recherche, Internet, algorithmes génétiques, optimisation. KEYWORDS: search engines, Internet, genetic algorithms, optimization. RSTI - RIA 17/2003, pages 319 à 330

2 320 RSTI - RIA 17/2003. EGC Introduction Les moteurs de recherche classiques sur le web ont des caractéristiques étonnantes : ils possèdent des milliards de documents dans leur index, ils peuvent traiter des millions de requêtes quotidiennement, ils donnent des réponses très volumineuses quasiment en temps réel et ils nécessitent des ressources informatiques et humaines considérables. On peut dire aujourd hui qu il est pratiquement impossible de concevoir une approche alternative pour un moteur de recherche sans passer par l un de ces «géants». Même si les points forts de ces moteurs sont nombreux, il ont aussi des faiblesses, comme des requêtes très simples, une présentation des résultats souvent pauvre en information, ou encore la nécessité pour l utilisateur d explorer un à un les nombreux liens qu ils donnent en sortie. Tout utilisateur régulier d un moteur de recherche a dû souvent passer beaucoup de temps à analyser les résultats donnés. Nous proposons dans cet article un moteur de recherche qui peut être considéré non pas comme concurrent des autres moteurs mais plutôt comme une approche complémentaire. Nous allons considérer que l utilisateur est prêt à attendre son résultat pendant plusieurs heures au profit d un gain dans la qualité. Notre outil va aider l utilisateur dans sa tâche d analyse des résultats et tenter de raccourcir cette tâche. Notre but final est de fournir un outil de veille stratégique fournissant à intervalles réguliers un rapport complet sur la manière dont est traité un sujet sur Internet. Si l on considère que la machine dispose de quelques heures pour donner un résultat, on peut envisager d effectuer des traitements supplémentaires qui font défaut aux moteurs classiques. Il s agit en particulier de formuler une requête plus riche, de télécharger les pages pour obtenir une version actualisée et mieux analysée en terme de contenu (Lawrence and Giles 1999), de proposer une classification des pages trouvées en fonction de leur contenu textuel (Zamir and Etzioni 2000) ou d effectuer une recherche avec une stratégie donnée. Nous nous intéressons dans cet article à ce dernier point en s appuyant notamment sur le principe d optimalité des algorithmes génétiques pour résoudre le dilemme d exploration versus exploitation (EVE) (Holland 1975) pour un nombre d essais donnés (i.e. téléchargements de pages Web), quelle stratégie optimale adopter pour espérer maximiser ses gains (i.e. trouver les pages correspondant le mieux à la requête de l utilisateur)? A partir de cette vue intuitive du problème, nous montrons en fait que les algorithmes génétiques, mais sans doute également d autres méthodes classiques en optimisation, peuvent apporter une contribution intéressante et complémentaire des moteurs classiques dans le domaine de la stratégie utilisée pour la recherche d information sur le Web. La suite de cet article est organisée comme suit la section 2 reformalise le problème traité comme un problème d optimisation avec la notion de paysage adaptatif, d opérateur de recherche et de voisinage en se basant d une part sur les études statistiques portant sur le Web et d autre part sur les moteurs de recherche à base d agents. La section 3 donne les principes de notre algorithme génétique qui manipule une population de pages Web. La section 4 donne des résultats expérimentaux avec notamment une comparaison avec des moteurs classiques. La section 5 conclut sur les nombreuses perspectives qui découlent de ce travail.

3 Moteur de recherche génétique Un problème d optimisation La modélisation que nous utilisons propose un parallèle entre le problème de la recherche d information sur le Web et le problème général d optimisation d une fonction (voir table 1). Des études statistiques récentes ont modélisé le Web comme un graphe dont les noeuds sont les pages et les arcs les liens qui existent entre les pages (Albert et al. 1999) (Broder et al. 2000). Nous utilisons cette modélisation pour définir notre espace de recherche par l ensemble des pages Web et pour définir grâce aux hyperliens une relation de voisinage entre les points. Cette relation associe à toute page l ensemble des pages (éventuellement vide) vers laquelle elle pointe. Optimisation Espace de recherche Fonction d évaluation Solution optimale Relation de voisinage Opérateur de création Opérateur de recherche locale Internet Ensemble des pages Adéquation de la page à la requête utilisateur Page maximisant l adéquation à la requête Défini par les liens sortant d une page Génération aléatoire d adresses IP Résultats de moteurs classiques Exploration d un lien d une page Tableau 1. Modélisation du problème de la recherche d information sur le Web comme un problème d optimisation À cet espace de recherche nous associons une fonction d évaluation qui peut évaluer numériquement chaque page Web. Dans les moteurs de recherche, résulte à la fois de l adéquation de la page à la requête (présence ou absence de mots clés, etc) mais aussi à d autres critères dépendant de la connectivité du graphe comme le «page rank» (Brin et Page 1998) ou des évaluations par des experts humains (comme dans Yahoo par exemple). Un moteur de recherche tend à donner en sortie des pages qui vont maximiser cette fonction. Pour parcourir l espace de recherche, les algorithmes d optimisation utilisent des opérateurs de recherche. Il en est de même pour les moteurs de recherche, et les opérateurs utilisés dans ces deux cadres sont les suivants 1) les opérateurs de création qui vont créer des points de à partir de «rien». En optimisation, un exemple classique d opérateur de création est la génération aléatoire d un point dans. Pour le Web, générer aléatoirement des adresses IP, par exemple, a déjà été étudié (Lawrence et Giles 1999) (Kishi et al. 2000) mais ne donne une adresse valide qu avec très peu de chance, et une adresse de site Web avec une probabilité encore plus faible. Donc ce type d opérateur aléatoire ne semble pas être utilisable pour explorer efficacement le Web. Un autre exemple d opérateur de création dans les problèmes d optimisation consiste à utiliser une heuristique qui va construire une solution en fonction des données du problème. Dans le cas du Web, de nombreux moteurs de recherche utilisent un tel opérateur qui consiste à interroger l index des moteurs

4 322 RSTI - RIA 17/2003. EGC ) Enregistrer la requète de l utilisateur et Définir la fonction d évaluation, 2), 3) Engendrer un descendant : a) Avec une probabilité mut (ou bien si ) Alors création heuristique (page issue des moteurs standards) b) Ou avec une probabilité mut choisir une page parent et engendrer un descendant Mutation (exploration des liens de ) 4) Evaluer 5) Insérer dans si (! #" ) ou si %$&(' )*,+.-0/1*2 3 4, 6) Aller en 3 ou Stop ( est le résultat proposé à l utilisateur). Figure 1. Algorithme génétique «steady state» utilisé dans le moteur de recherche. classiques et à donner en sortie le ou les liens fournis par ces moteurs. C est le cas notamment des méta-moteurs (Sander-Beuermann et Schomburg 1998) qui compilent des résultats ou des agents (Menczer et 1995) (Moukas 1997) qui initialisent leur recherche avec ces résultats, 2) les opérateurs de «transformation» qui vont se servir de points existants pour en générer de nouveaux. Les robots et plus généralement les agents (Menczer et 1995) (Moukas 1997) utilisent ce type de stratégie en explorant les liens trouvés dans les pages. Ainsi, un opérateur classique en optimisation comme l ascension locale peut être directement transposé sur le Web : à partir d une page Web donnée, il est possible d obtenir l ensemble de ses voisins, de les explorer un par un et de choisir le meilleur selon comme nouveau point de départ. Notre modélisation inspirée largement des travaux cités permet ainsi d envisager l utilisation d algorithmes classiques en optimisation l ascension locale, comme cela a été mentionné dans cette section, mais aussi des méthodes plus performantes comme les algorithmes génétiques. 3. Un moteur de recherche génétique 3.1. Algorithme principal L algorithme génétique que nous proposons combine les concepts mentionnés dans la section précédente avec ceux d un algorithme génétique «steady state» (Whitley 1989) comme représenté dans la figure 1. Un individu de la population est une page Web qui peut être évaluée numériquement par la fonction d évaluation. Initialement, la population est vide et va croître en taille jusqu à atteindre une taille maximale 5! #". Les premiers individus de la population sont donc créés par un opérateur de création heuristique d individus. Cet opérateur interroge les moteurs classiques (Google, Altavista, etc, voir section 4.2) pour obtenir des pages. Ensuite, les pages

5 Moteur de recherche génétique 323 peuvent être sélectionnées suivant leur qualité et peuvent donner des descendants soit par l opérateur de mutation (choisi selon une probabilité mut) soit par l opérateur de création (selon une probabilité mut ). La mutation consiste ici à choisir judicieusement un lien sortant d une page parent et à proposer comme descendant la page indiquée par (voir section 3.3). Les principes de l algorithme génétique «steady state» font qu à chaque génération un seul individu est engendré. Celui-ci est inséré dans la population s il reste de la place, et sinon s il est meilleur que le plus mauvais individu de la population. La qualité moyenne et maximale de la population ne peut donc que croître dès que la population à atteint son nombre maximum d individu. Intuitivement, l algorithme de recherche va avoir un comportement allant du metamoteur classique (avec mut ) à un moteur explorant le plus possible les liens trouvés dans les pages ( mut ). C est la stratégie de sélection de l algorithme génétique qui va décider de la survie d une page dans la population et donc du fait que les liens trouvés dans cette page seront explorés avec plus ou moins d intensité. À notre connaissance, les principales applications des algorithmes génétiques au Web sont en particulier (Sheth 1994) (Menczer et al. 1995) (Morgan et Kilgour 1996) (Moukas 1997) (Fan et al. 1999) (Monmarché et al. 1999) (Vakali et Manolopoulos 1999) mais elles ne concernent pas toutes la stratégie utilisée dans les moteurs de recherche. Dans (Menczer et al. 1995), les paramètres déterminant le comportement d une population d agents évoluent par sélection interactive effectuée par l utilisateur qui récompense les agents ramenant des informations intéressantes. Notre approche se distingue de ce travail dans la mesure où nous nous plaçons à un niveau plus proche du paysage adaptatif puisque nous faisons évoluer directement une population de pages (et non une population d agents recherchant des pages). Notre travail se distingue aussi par le fait que nous souhaitons faire intervenir l utilisateur le moins possible afin de diminuer au maximum le temps requis pour l analyse des résultats Requête utilisateur et fonction d évaluation La fonction d évaluation quantifiant la qualité d une page est une formulation numérique de la requête de l utilisateur. L algorithme génétique permet de définir n importe quelle fonction d évaluation à partir des informations obtenues sur une page. Nous avons défini un grand nombre de critères possible comme par exemple la présence impérative ou non de mots clés, le nombre d occurence de ces mots clés, leur répartition dans le texte, la présence souhaitée de mots, l absence souhaitée de mots, la présence/absence souhaitée ou imposée d expressions régulières, le volume du texte, le nombre d images, le référencement de fichiers de types donnés (PS, PDF, MP3,...), la date de publication, etc. Dans cet article, nous avons testé deux fonctions. La fonction est très proche du type d évaluation que l on trouve dans les méta-moteurs classiques et vaut pour une page :, si 1 sinon

6 RSTI - RIA 17/2003. EGC 2003 où signifie nombre d occurences du mot dans la page. obtient donc un score de 0 si un seul des mots clés ( ) manque, et plus le nombre de mots clés présents est élevé, plus le score de la page est élevé. La fonction est beaucoup plus complexe et se détache plus nettement de ce que proposent les moteurs classiques où. est une fonction qui favorise une représentation équitable des mots-clés et où est une fonction qui évalue l intérêt du -ème lien trouvé dans est fondée simplement sur une notion d entropie et prend une valeur maximale de 1 lorsque les proportions d apparition des mots-clés dans la page sont toutes égales. Les poids,, et servent à doser l importance relative des différent composants de la requête. La fonction "!pour un lien donné est d autant plus élevée que des mots clés de sont présents dans le voisinage textuel du lien. Autrement dit,. sera élevée si contient des mots clés en proportions égales, le plus de mots possible de ( ), le moins de mots possible de ( ) et si elle contient des liens potentiellement reliés au domaine thématique défini par les mots clés Opérateurs génétiques et incrémentalité de la recherche Comme mentionné dans la table 1, au moins deux types d opérateurs (création ou exploration locale) peuvent être définis pour explorer le Web avec un algorithme d optimisation. Nous utilisons ici un opérateur de création heuristique qui va donner une adresse de page Web en fonction des résultats donnés par les moteurs classiques (Altavista, Google, Lycos, Voila, Yahoo). La méthode utilisée consiste simplement à interroger chacun des ces moteurs avec les mots clés et à extraire les adresses données comme résultats. Ces interrogations de moteurs se font de manière incrémentale, au fur et à mesure que l opérateur de création est appelé. Si plus aucun des moteurs ne fournit de réponse, alors l opérateur de création n est plus utilisé dans l algorithme (voir table 1) et on se sert à la place de l opérateur de mutation. Notons qu il existe un très grand nombre de moteurs de recherche (voir mais nous nous sommes concentrés pour le moment sur les plus généraux et les plus importants. L opérateur de création permet donc de donner des points initiaux de bonne qualité dans la recherche génétique. Comme nous le verrons dans la section résultats, ces individus pourront être largement améliorés par l opérateur de mutation. L opérateur de mutation prend en entrée une page parent et engendre en sortie une page enfant en explorant le voisinage local de. Pour cela, les liens trouvés dans sont triés par ordre décroissant suivant la valeur de la fonction #décrite dans la section précédente. De cette manière, les liens ayant le plus de chance de

7 Moteur de recherche génétique 325 Num Mots clés Mots souhaités Mots non souhaités ( ) ( ) ( ) 1 telecom crisis analysis mobile future France 2 fiber optic technology network information 3 text poet flower wind Baudelaire Rimbaud 4 wine excellent price good Bourgueil Bordeaux 5 buy cd music michael jackson download mp3 6 mouse disney movie animation DVD 7 artificial ant algorithm 8 genetic algorithm artificial ant experimental comparison 9 javascript window opener tutorial free 10 dll export class template code example Tableau 2. Les 10 requêtes utilisées donner un mutant de bonne (ou de meilleure) qualité sont explorés en premier. Lorsque l on a exploré tout le voisinage d une page, on utilise l opérateur de création à la place de la mutation. Si aucun des deux opérateurs ne peux plus fournir de pages, la recherche s arrête. Notons que le graphe défini par les pages Web et leurs liens ne permet pas de définir facilement certains opérateurs de recherche comme un opérateur de croisement dans les AG. Il serait cependant possible de combiner les liens contenus dans deux pages parents et si ces deux pages ont des liens communs, ou des liens pointant vers le même serveur Web, alors il est peut être souhaitable de combiner ces informations en orientant la recherche vers des liens communs ou des serveurs Web communs. Afin d accéler l évaluation des pages et éviter de télécharger plusieurs fois les même pages, nous ajoutons à ces deux opérateurs une «liste noire» de pages ayant déjà été explorées par l algorithme. Ainsi, lorsque l opérateur de création ou de mutation engendre une page qui a déjà été explorée, celui-ci est relancé à nouveau pour obtenir une autre page. Cela permet de gagner du temps notamment dans les domaines où les liens sont souvent les mêmes. De même, notre outil peut utiliser un cache local des pages chargées de manière à accélérer significativement ses performances de manière incrémentale lorsque deux requêtes thématiquement très proches se succèdent. 4. Résultats 4.1. Méthode d évaluation Nous avons implémenté les algorithmes décrits dans cet article sur une machine de type PC (Celeron 500MHz, 128 Mo, connexion Internet à 64Ko/s). Nous nous

8 326 RSTI - RIA 17/2003. EGC 2003 Taille pop premiers premiers Tableau 3. Moyenne des premiers éléments de la population après 1000 pages explo- ) rés suivant la taille de la population ( plaçons donc dans le cas où un utilisateur utilise ce moteur sur sa propre machine standard (mais nous disposons d une version sur un serveur Web pour effectuer des tests à distance). Dans toute la suite nous n utilisons pas le cache disque mentionné précédemment car celui-ci améliore significativement les performances pour deux recherches successives avec la même requête. Nous avons défini dix requêtes différentes (voir table 2) pour tester le comportement de notre moteur. Ces dix requêtes portent sur plusieurs domaines thématiques et représentent différents niveaux dans les besoins d information d utilisateurs potentiels. Elles sont certainement plus spécifiques que les requêtes le plus fréquemment utilisées dans les moteurs de recherche (Silverstein et al. 1998) mais elles permettent de définir assez précisément un sujet. Nous avons utilisé un protocole de test et de comparaison similaire à celui utilisé dans la comparaison d algorithmes d optimisation on donne à chaque version de l algorithme le même nombre d évaluations. Dans la suite, chaque algorithme testé peut télécharger et évaluer 1000 pages Web. Cela représente environ 1 à 2 heures de temps de chargement et de calcul pour tester une requête. Dans toute la suite, la population a été limitée à population (voir table 3). individus suite aux tests réalisés sur la taille de la 4.2. Résultats pour une requête donnée Nous effectuons tout d abord une analyse du comportement de notre moteur pour la requête 3 (voir table 2) en faisant varier notamment le paramètre. Rappelons qu avec notre moteur ne fait qu utiliser les résultats fournis par les moteurs classiques. Il se comporte donc comme un méta-moteur. Plus augmente, plus l algorithme met en oeuvre la mutation qui a pour effet d explorer le voisinage local des pages. Sur la figure 2 nous montrons l évolution de la qualité moyenne des individus. Le début de la courbe est bruité du fait que la population initiale ne contient que très peu d individus. A partir de la génération 100, on constate que l amélioration est progressive pour les différentes courbes présentées. On peut remarquer que plus la probabilité d utiliser la mutation augmente, plus les résultats s améliorent en moyenne. Bien sûr, si cette probabilité se rapproche trop de 1, la qualité des résultats chute. Nous rete- comme valeur assurant un compromis entre la recherche heuristique nons

9 de Moteur de recherche génétique Quality Downloaded pages Figure 2. Évolution de la qualité moyenne de la population pour différentes valeurs de pour la fonction effectuée par les moteurs de recherche et la recherche locale guidée par les liens des individus. Les poids,, et servent à décrire l importance relative que nous attribuons au différents champs de la requêtes. Nous avons fixé respectivement des valeurs de, et pour les 3 premiers paramètres et de pour manière à favoriser les pages comportant des liens prometteurs pour l exploration Résultats comparatifs Nous présentons dans les tables 4 et 5 les résultats obtenus pour les 10 requètes et en moyenne pour 4 essais. Pour la fonction, GeniMiner et la méta-recherche (fondée sur les moteurs Altavista, Google, Lycos, Voila, Yahoo) obtiennent des résultats comparables voire meilleurs dans le second cas. On peut donc dire que la recherche génétique n apporte rien de plus qu une méta-recherche lorsque la fonction d évaluation est proche des évaluations utilisées dans les moteurs classiques. Pour la fonction, on constate que l utilisation de l algorithme génétique donne des résultats supérieurs pour 5 requêtes. Pour 4 autres requêtes, les meilleures pages trouvées par la méta-recherche l ont été aussi par GeniMiner. Notre analyse est la suivante les fonctions d évaluation utilisées dans les moteurs classiques sont faites pour donner des réponses très rapides à des requêtes simples. Par exemple, elles ordonnent

10 328 RSTI - RIA 17/2003. EGC 2003 Requête GeniMiner ( ) Meta-recherche ( ) Min Max Moy Min Max Moy Tableau 4. Résultats obtenus pour la fonction R GeniMiner GeniMiner Meta-recherche ( ) ( ) ( ) Min Max Moy Min Max Moy Min Max Moy Tableau 5. Résultats obtenus pour la fonction les pages sans tenir compte des mots clés de la requête car l analyse du contenu du document prendrait beaucoup trop de temps. Ces requêtes sont adaptées aux nombreux utilisateurs «grand public» d Internet mais pas aux problèmes d informations plus spécifiques et complexes comme cela est requis en veille stratégique. Si est la fonction d évaluation des pages que l utilisateur a «en tête», alors il va passer beaucoup de temps à analyser les résultats des moteurs classiques avant de trouver l information pertinente. Par contre, avec GeniMiner l information sera trouvée par l utilisateur beaucoup plus rapidement. Mais pour réaliser cela, GeniMiner requiert un temps de calcul beaucoup plus important que les moteurs standards. C est la raison pour laquelle nous considérons que notre approche est complémentaire des moteurs classiques car elle ne résout pas le même type de problèmes de recherche d information.

11 Moteur de recherche génétique 329 On peut noter également dans ce tableau que les résultats donnés par l utilisation des deux opérateurs, contrôlés par l algorithme génétique, contiennent dans 9 cas le meilleur élément. L utilisation de l algorithme génétique apporte un réel avantage en concentrant la recherche sur les points du graphe susceptibles de contenir de «bonnes» pages. 5. Conclusion Nous avons décrit dans cet article une partie importante d un moteur de recherche, à savoir la stratégie d exploration des pages. Nous avons montré comment il était possible de mettre en relation des études portant sur le Web avec les concepts utilisés classiquement en optimisation. Cela nous a permis de définir une stratégie de recherche d information qui implémente de la manière la plus directe possible les concepts utilisés dans un algorithme génétique. Nous avons montré que pour une fonction objectif complexe donnée et pour des requêtes portant dans des domaines différents, les résultats obtenus en moyenne sont supérieurs à une simple interrogation des moteurs de recherche classiques. L intérêt de l AG vient 1) de la facilité avec laquelle on peut changer la fonction d évaluation et ainsi placer en premier les pages maximisant l adéquation à la requète, 2) de l efficacité de la recherche par le biais de la sélection et de la mutation qui répartissent bien les ressources de calcul et de connexion. De nombreuses perspectives découlent de ce travail. Nous avons utilisé un algorithme génétique «standard» mais nous envisageons de le compléter par des techniques comme le réglage automatique des paramètres (Julstrom 1995) (Eiben et al. 1999), le redémarrage de la population (Maresky et al. 1995). Toutes ces techniques peuvent être aisément introduites dans ce moteur de recherche. Une perspective importante est la parallélisation de la recherche sur un réseau de machine. Les algorithmes génétiques parallèles existent depuis plusieurs années maintenant (Cantú-paz 2000). Un modèle du type «island model» permettrait de combiner à la fois l efficacité de la recherche génétique avec une accélération de la vitesse de traitements des informations, notamment l évaluation des pages. 6. Bibliographie Albert R., Jeong H. et Barabasi A.-L. (1999), Diameter of the World Wide Web. Nature, 401 : , Broder A., Kumar R., Maghoul F., Raghavan P., Rajagopalan S., Stata R., Tomkins A. et Wiener J. (2000), Graph structure in the Web, Proceedings of the Ninth International World Wide Web Conference, Elsevier, Brin S. et Page L. (1998), The anatomy of a large-scale hypertextual Web search engine, Computer Networks and ISDN Systems, 30, 1 7, pp , Cantú-Paz, E. (2000). Efficient and Accurate Parallel Genetic Algorithms, Kluwer Academic Publishers. Eiben A.E., Hinterding R. et Michalewicz Z. (1999), Parameter Control in Evolutionary Algorithms, IEEE Transactions on Evolutionary Computation, Vol 3, 2, 1999.

12 330 RSTI - RIA 17/2003. EGC 2003 Fan W., Gordon M.D., Pathak P. (1999), Automatic generation of a matching function by genetic programming for effective information retrieval, Proceedings of the 1999 Americas Conference on Information Systems, pp Holland J.H. (1975). Adaptation in natural and artificial systems. Ann Arbor : University of Michigan Press. Julstrom B.A. (1995), What have you done for me lately? Adapting operator probabilities in a steady-state genetic algorithm, Proceedings of the sixth International Conference on Genetic Algorithms, 1995, L. Eshelman (Ed.), Morgan Kaufmann, pp Lawrence S. et Giles C.L. (1999), Accessibility of information of the Web, Nature 400, pp Lawrence S. et Giles C.L. (1999), Text and image meta-search on the web, International Confrence on Parallel and Distributed Processing Techniques and Application, Maresky J., Davidor Y., Gitler D., Aharoni G. et Barak A. (1995), Selectively destructive restart, Proceedings of the sixth International Conference on Genetic Algorithms, 1995, L. Eshelman (Ed.), Morgan Kaufmann, pp Menczer F., Belew R.K., Willuhn W. (1995), Artificial life applied to adaptive information agents, Spring Symposium on Information Gathering from distributed, Heterogeneous Databases, AAAI Press, Monmarché N., Nocent G., Slimane M. et Venturini G. (1999), Imagine : a tool for generating HTML style sheets with an interactive genetic algorithm based on genes frequencies IEEE International Conference on Systems, Man, and Cybernetics (SMC 99), Interactive Evolutionary Computation session, October 12-15, 1999, Tokyo, Japan. Morgan J.J. et Kilgour A.C. (1996), Personalising information retrieval using evolutionary modelling, Proceedings of PolyModel 16 : Applications of Artificial Intelligence, ed by A.O. Moscardini and P. Smith, , Moukas A. (1997), Amalthea : information discovery and filtering using a multiagent evolving ecosystem, Applied Artificial Intelligence, 11(5) : , 1997 Picarougne F., Fruchet C., Monmarché N., Oliver A. et Venturini G. (2002), Web searching considered as a genetic optimization problem. In Local Search Two Day Workshop, London, UK, April Picarougne F., Monmarché N., Oliver A. et Venturini G. (2002), Web mining with a genetic algorithm. In Eleventh International World Wide Web Conference, Honolulu, Hawaii, 7-11 May 2002 Sheth B.D. (1994), A learning approach to personalized information filtering, Master s thesis, Department of Electrical Engineering and Computer Science, MIT, Silverstein C., Henzinger M., Marais H. et Moricz M. (1998), Analysis of a Very Large Alta- Vista Query Log, Digital SRC Technical note Vakali A. et Manolopoulos Y. (1999), Caching objects from heterogeneous information sources, Technical report TR99-03, Data Engineering Lab, Department of Informatics, Aristotle University, Greece. Whitley D. (1989), The Genitor algorithm and selective ressure : why rank-based allocation of reproductive trials is best, Proceedings of the third International Conference on Genetic Algorithms, 1989, J.D. Schaffer (Ed), Morgan Kaufmann, pp Zamir O. et Etzioni O. (2000), Grouper : a dynamic clustering interface to web search results, Proceedings of the Ninth International World Wide Web Conference, Elsevier, 2000.

EXPERIMENTATIONS DE METHODES PARALLELES DE RECHERCHE D INFORMATION SUR INTERNET

EXPERIMENTATIONS DE METHODES PARALLELES DE RECHERCHE D INFORMATION SUR INTERNET EXPERIMENTATIONS DE METHODES PARALLELES DE RECHERCHE D INFORMATION SUR INTERNET Fabien PICAROUGNE (*), Gilles VENTURINI(*), Christiane GUINOT(**) fabien.picarougne@univ-tours.fr, venturini@univ-tours.fr,

Plus en détail

Chapitre 1. L algorithme génétique

Chapitre 1. L algorithme génétique Chapitre 1 L algorithme génétique L algorithme génétique (AG) est un algorithme de recherche basé sur les mécanismes de la sélection naturelle et de la génétique. Il combine une stratégie de survie des

Plus en détail

Une méthode d apprentissage pour la composition de services web

Une méthode d apprentissage pour la composition de services web Une méthode d apprentissage pour la composition de services web Soufiene Lajmi * Chirine Ghedira ** Khaled Ghedira * * Laboratoire SOIE (ENSI) University of Manouba, Manouba 2010, Tunisia Soufiene.lajmi@ensi.rnu.tn,

Plus en détail

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services

Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services 69 Vers une approche Adaptative pour la Découverte et la Composition Dynamique des Services M. Bakhouya, J. Gaber et A. Koukam Laboratoire Systèmes et Transports SeT Université de Technologie de Belfort-Montbéliard

Plus en détail

Extraction de règles d association pour la prédiction de valeurs manquantes

Extraction de règles d association pour la prédiction de valeurs manquantes Cari 2004 7/10/04 12:00 Page 487 Extraction de règles d association pour la prédiction de valeurs manquantes Sylvie Jami 1, Tao-Yan Jen 2, Dominique Laurent 3, George Loizou 1, Oumar Sy 3,4 1. Birkbeck

Plus en détail

Formula Negator, Outil de négation de formule.

Formula Negator, Outil de négation de formule. Formula Negator, Outil de négation de formule. Aymerick Savary 1,2, Mathieu Lassale 1,2, Jean-Louis Lanet 1 et Marc Frappier 2 1 Université de Limoges 2 Université de Sherbrooke Résumé. Cet article présente

Plus en détail

Annotation Semi-automatique de Grandes BD Images : Approche par Graphes de Voisinage

Annotation Semi-automatique de Grandes BD Images : Approche par Graphes de Voisinage Lyon - France Annotation Semi-automatique de Grandes BD Images : Approche par Graphes de Voisinage Hakim Hacid Université Lumière Lyon 2 Laboratoire ERIC - 5, avenue Pierre Mendès-France 69676 Bron cedex

Plus en détail

MEDIAPLANNING & HYBRIDATION APPLIQUE A L INTERNET

MEDIAPLANNING & HYBRIDATION APPLIQUE A L INTERNET MEDIAPLANNING & HYBRIDATION APPLIQUE A L INTERNET MOBILE Gaël Crochet 1 & Gilles Santini 2 1 Médiamétrie, 70 rue Rivay, 92532 Levallois-Perret, France, gcrochet@mediametrie.fr 2 Vintco SARL, 8 rue Jean

Plus en détail

Vectorisation du modèle d appariement pour la recherche d images par le contenu

Vectorisation du modèle d appariement pour la recherche d images par le contenu - Vectorisation du modèle d appariement pour la recherche d images par le contenu Hanen Karamti 1 MIRACL, Université de Sfax Route de Tunis Km 10 B.P. 242, 3021, Sfax, Tunisie karamti.hanen@gmail.com RÉSUMÉ.

Plus en détail

Application de la logique floue à un modèle de recherche d information basé sur la proximité

Application de la logique floue à un modèle de recherche d information basé sur la proximité Application de la logique floue à un modèle de recherche d information basé sur la proximité Fuzzy set theory applied to a proximity model for information retrieval Michel BEIGBEDER 1 Annabelle MERCIER

Plus en détail

Choisir le bon outil pour chercher sur le Web : Cours

Choisir le bon outil pour chercher sur le Web : Cours Choisir le bon outil pour chercher sur le Web : Cours Avez-vous déjà essayé de trouver quelque chose dans Internet, pour finalement vous perdre et essayer de vous y retrouver à travers une douzaine d articles

Plus en détail

IC05 2004 Analyse de Réseaux Sociaux : perspective algorithmique

IC05 2004 Analyse de Réseaux Sociaux : perspective algorithmique IC05 2004 Analyse de Réseaux Sociaux : perspective algorithmique Eustache DIEMERT Université de Technologie de Compiègne - Réseaux, Territoires et Géographie de l Information 11 mai 2004 Réseaux Sociaux?

Plus en détail

Analyse de données symboliques et graphe de connaissances d un agent

Analyse de données symboliques et graphe de connaissances d un agent d un agent Philippe Caillou*, Edwin Diday** *LAMSADE - Université Paris Dauphine Place du maréchal de Lattre de Tassigny 7516 Paris caillou@lamsade.dauphine.fr **CEREMADE - Université Paris Dauphine Place

Plus en détail

Etude d un cas industriel : Optimisation de la modélisation de paramètre de production

Etude d un cas industriel : Optimisation de la modélisation de paramètre de production Revue des Sciences et de la Technologie RST- Volume 4 N 1 /janvier 2013 Etude d un cas industriel : Optimisation de la modélisation de paramètre de production A.F. Bernate Lara 1, F. Entzmann 2, F. Yalaoui

Plus en détail

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R

Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Les simulations dans l enseignement des sondages Avec le logiciel GENESIS sous SAS et la bibliothèque Sondages sous R Yves Aragon, David Haziza & Anne Ruiz-Gazen GREMAQ, UMR CNRS 5604, Université des Sciences

Plus en détail

Une application des algorithmes génétiques à l ordonnancement d atelier

Une application des algorithmes génétiques à l ordonnancement d atelier Une application des algorithmes génétiques à l ordonnancement d atelier VACHER Jean-Philippe - GALINHO Thierry - MAMMERI Zoubir Laboratoire d Informatique du Havre Université du Havre 25, Rue Philippe

Plus en détail

PRÉSENTATION TRAVAIL EN COURS - APPRENTISSAGE INTERACTIF. Ianis Lallemand, 21 janvier 2013

PRÉSENTATION TRAVAIL EN COURS - APPRENTISSAGE INTERACTIF. Ianis Lallemand, 21 janvier 2013 PRÉSENTATION TRAVAIL EN COURS - APPRENTISSAGE INTERACTIF Ianis Lallemand, 21 janvier 2013 APPRENTISSAGE INTERACTIF definition Contours encore assez flous dans le champ de l apprentissage automatique. Néanmoins,

Plus en détail

G. Lesauvage. Laboratoire d Informatique et du Traitement de l Information et des Systèmes

G. Lesauvage. Laboratoire d Informatique et du Traitement de l Information et des Systèmes Gestion dynamique des activités des chariots cavaliers sur un terminal portuaire à conteneurs en environnement incertain - approche par intelligence collective - G. Lesauvage Unité de Formation et de Recherche

Plus en détail

RI sociale : intégration de propriétés sociales dans un modèle de recherche

RI sociale : intégration de propriétés sociales dans un modèle de recherche RI sociale : intégration de propriétés sociales dans un modèle de recherche Ismail Badache 1 Institut de Recherche en Informatique de Toulouse, UMR 5505 CNRS, SIG 118 Route de Narbonne F-31062 Toulouse

Plus en détail

Introduction à la programmation en variables entières Cours 3

Introduction à la programmation en variables entières Cours 3 Introduction à la programmation en variables entières Cours 3 F. Clautiaux francois.clautiaux@math.u-bordeaux1.fr Université Bordeaux 1 Bât A33 - Bur 272 Sommaire Notion d heuristique Les algorithmes gloutons

Plus en détail

Introduction aux métaheuristiques

Introduction aux métaheuristiques Introduction aux métaheuristiques MTH6311 S. Le Digabel, École Polytechnique de Montréal H2014 (v3) MTH6311: Introduction aux métaheuristiques 1/25 Plan 1. Motivation et définitions 2. Classification des

Plus en détail

Application de K-means à la définition du nombre de VM optimal dans un cloud

Application de K-means à la définition du nombre de VM optimal dans un cloud Application de K-means à la définition du nombre de VM optimal dans un cloud EGC 2012 : Atelier Fouille de données complexes : complexité liée aux données multiples et massives (31 janvier - 3 février

Plus en détail

Apprentissage de structure dans les réseaux bayésiens pour

Apprentissage de structure dans les réseaux bayésiens pour Apprentissage de structure dans les réseaux bayésiens pour la détection d événements vidéo Siwar Baghdadi 1, Claire-Hélène Demarty 1, Guillaume Gravier 2, et Patrick Gros 3 1 Thomson R&D France, 1 av Belle

Plus en détail

Ingénierie et gestion des connaissances

Ingénierie et gestion des connaissances Master Web Intelligence ICM Option Informatique Ingénierie et gestion des connaissances Philippe BEAUNE Philippe.Beaune@emse.fr 18 novembre 2008 Passer en revue quelques idées fondatrices de l ingénierie

Plus en détail

VERSION 64 BITS DE SAS ET VOS FICHIERS MICROSOFT OFFICE 32-BITS

VERSION 64 BITS DE SAS ET VOS FICHIERS MICROSOFT OFFICE 32-BITS VERSION 64 BITS DE SAS ET VOS FICHIERS MICROSOFT OFFICE 32-BITS La plupart des PC, qu ils soient pour usage personnel ou professionnel, tournent aujourd hui sous un système Windows 64-bits. En tant qu

Plus en détail

Application du système immunitaire artificiel ordinaire et améliore pour la reconnaissance des caractères artificiels

Application du système immunitaire artificiel ordinaire et améliore pour la reconnaissance des caractères artificiels Application du système immunitaire artificiel ordinaire et améliore pour la reconnaissance des caractères artificiels Hiba KHELIL, Abdelkader BENYETTOU Laboratoire SIgnal IMage PArole SIMPA Université

Plus en détail

Recherche et Diffusion de l Information dans les Réseaux. Philippe Robert. Le 8 avril 2014

Recherche et Diffusion de l Information dans les Réseaux. Philippe Robert. Le 8 avril 2014 Recherche et Diffusion de l Information dans les Réseaux Philippe Robert Le 8 avril 2014 Présentation Présentation Directeur de recherche à l INRIA Responsable de l équipe de recherche Réseaux, Algorithmes

Plus en détail

Principe de symétrisation pour la construction d un test adaptatif

Principe de symétrisation pour la construction d un test adaptatif Principe de symétrisation pour la construction d un test adaptatif Cécile Durot 1 & Yves Rozenholc 2 1 UFR SEGMI, Université Paris Ouest Nanterre La Défense, France, cecile.durot@gmail.com 2 Université

Plus en détail

Algorithmes de Transmission et de Recherche de l Information dans les Réseaux de Communication. Philippe Robert INRIA Paris-Rocquencourt

Algorithmes de Transmission et de Recherche de l Information dans les Réseaux de Communication. Philippe Robert INRIA Paris-Rocquencourt Algorithmes de Transmission et de Recherche de l Information dans les Réseaux de Communication Philippe Robert INRIA Paris-Rocquencourt Le 2 juin 2010 Présentation Directeur de recherche à l INRIA Institut

Plus en détail

Département Informatique 5ème année 2008-2009. Cahier des Charges

Département Informatique 5ème année 2008-2009. Cahier des Charges École Polytechnique de l Université de Tours 64, Avenue Jean Portalis 37200 TOURS, FRANCE Tél. +33 (0)2 47 36 14 14 Fax +33 (0)2 47 36 14 22 www.polytech.univ-tours.fr Département Informatique 5ème année

Plus en détail

Indexation de sous-collections pour l amélioration de la haute précision

Indexation de sous-collections pour l amélioration de la haute précision Indexation de sous-collections pour l amélioration de la haute précision Joëlson Randriamparany *,** *IRIT, Institut de Recherche Informatique de Toulouse Université Paul Sabatier Toulouse III 118 Route

Plus en détail

Optimisation Combinatoire (Méthodes approchées) VI. Algorithmes à Population (Les bases)

Optimisation Combinatoire (Méthodes approchées) VI. Algorithmes à Population (Les bases) Optimisation Combinatoire (Méthodes approchées) VI. Algorithmes à Population (Les bases) Algorithmes à Population Idée principale 'Amélioration' d'un ensemble de solutions Recombiner des solutions Orienté

Plus en détail

Accès au Contenu Informationnel pour les Masses de Données de Documents

Accès au Contenu Informationnel pour les Masses de Données de Documents Accès au Contenu Informationnel pour les Masses de Données de Documents Grappa LILLE 3 - UR Futurs INRIA MOSTRARE Laboratoire d Informatique de Paris 6 Laboratoire de Recherche en Informatique Orsay -

Plus en détail

Accès personnalisé multicritères à de multiples sources d informations.

Accès personnalisé multicritères à de multiples sources d informations. Lyon - France Accès personnalisé multicritères à de multiples sources d informations. Samir kechid Université des Sciences et de la Technologie Houari Boumediene. USTHB BP 32 El Alia Bab Ezzouar Alger

Plus en détail

Une extension pour RDF/RDFS utilisant des relations procédurales

Une extension pour RDF/RDFS utilisant des relations procédurales Une extension pour RDF/RDFS utilisant des relations procédurales Jean-François Baget * * INRIA Sophia-Antipolis & LIRMM(CNRS - UM2) LIRMM, 161 rue Ada, 34392 Montpellier Cedex 5 baget@lirmm.fr RÉSUMÉ.

Plus en détail

AMESD-Puma2010-EFTS- Configuration-update-TEN (en-fr)

AMESD-Puma2010-EFTS- Configuration-update-TEN (en-fr) AMESD-Puma2010-EFTS- Configuration-update-TEN (en-fr) Doc.No. : EUM/OPS/TEN/13/706466 Issue : v3 Date : 7 May 2014 WBS : EUMETSAT Eumetsat-Allee 1, D-64295 Darmstadt, Germany Tel: +49 6151 807-7 Fax: +49

Plus en détail

Décomposition de domaine pour un milieu poreux fracturé

Décomposition de domaine pour un milieu poreux fracturé Décomposition de domaine pour un milieu poreux fracturé Laila AMIR 1, Michel KERN 2, Vincent MARTIN 3, Jean E ROBERTS 4 1 INRIA-Rocquencourt, B.P. 105, F-78153 Le Chesnay Cedex Email: laila.amir@inria.fr

Plus en détail

Plan du cours. Métaheuristiques pour l optimisation combinatoire. Quelques problèmes classiques (2/3) Quelques problèmes classiques (1/3)

Plan du cours. Métaheuristiques pour l optimisation combinatoire. Quelques problèmes classiques (2/3) Quelques problèmes classiques (1/3) Plan du cours Quelques problèmes classiques Quelques algorithmes classiques Métaheuristiques pour l optimisation combinatoire un peu de vocabulaire codage des solutions taxinomie méthodes complètes méthodes

Plus en détail

Des outils pour l optimisation et la robustesse. Marc Sevaux

Des outils pour l optimisation et la robustesse. Marc Sevaux Des outils pour l optimisation et la sse Marc Sevaux Université de Valenciennes et du Hainaut-Cambrésis Laboratoire d Automatique, de Mécanique et d Informatique Industrielles et Humaines (UMR CNRS 8530)

Plus en détail

Influence De La Taille Du Jeton Sur Les Performances De L algorithme D'exclusion Mutuelle De Ricart - Agrawala

Influence De La Taille Du Jeton Sur Les Performances De L algorithme D'exclusion Mutuelle De Ricart - Agrawala Influence De La Taille Du Jeton Sur Les Performances De L algorithme D'exclusion Mutuelle De Ricart - Agrawala Sarah Benkouider, Souhila Labgaa 2, Mohamed Yagoubi 3 Université Amar Telidji Département

Plus en détail

Evaluation et analyse de la fréquentation d un site

Evaluation et analyse de la fréquentation d un site cterrier.com 15/06/09 1 / 5 Cours Informatique commerciale Auteur : C. Terrier ; mailto:webmaster@cterrier.com ; http://www.cterrier.com Utilisation : Reproduction libre pour des formateurs dans un cadre

Plus en détail

Algorithme fourmi avec différentes stratégies phéromonales pour le sac à dos multidimensionnel

Algorithme fourmi avec différentes stratégies phéromonales pour le sac à dos multidimensionnel Algorithme fourmi avec différentes stratégies phéromonales pour le sac à dos multidimensionnel Inès Alaya * Christine Solnon ** Khaled Ghédira * * SOIE, Institut Supérieur de Gestion de Tunis 41 Rue de

Plus en détail

Guide de l utilisateur WebSeekurity

Guide de l utilisateur WebSeekurity SCRT Information Security Julia Benz Guide de l utilisateur WebSeekurity Version 1.0 Mars 2012 Table des matières Table des matières i 1 Introduction 1 1.1 Contributions.............................. 1

Plus en détail

La sélection collaborative de pages Web pertinentes

La sélection collaborative de pages Web pertinentes Environnements Informatiques pour l Apprentissage Humain, Montpellier 347 La sélection collaborative de pages Web pertinentes Jérôme Dinet Université de Metz Equipe Transdisciplinaire sur l Interaction

Plus en détail

Laboratoire 4 Développement d un système intelligent

Laboratoire 4 Développement d un système intelligent DÉPARTEMENT DE GÉNIE LOGICIEL ET DES TI LOG770 - SYSTÈMES INTELLIGENTS ÉTÉ 2012 Laboratoire 4 Développement d un système intelligent 1 Introduction Ce quatrième et dernier laboratoire porte sur le développement

Plus en détail

Problème de chargement de camions-citernes Tank Truck Loading Problem

Problème de chargement de camions-citernes Tank Truck Loading Problem Problème de chargement de camions-citernes Tank Truck Loading Problem Fabien Cornillier CENTOR, Université Laval fabien.cornillier@centor.ulaval.ca Fayez F. Boctor CENTOR, Université Laval Gilbert Laporte

Plus en détail

Indexation et interrogation de photos de presse décrites en MPEG-7

Indexation et interrogation de photos de presse décrites en MPEG-7 Indexation et interrogation de photos de presse décrites en MPEG-7 Emmanuel Bruno Jacques Le Maitre Elisabeth Murisasco Laboratoire SIS, Equipe Informatique Université de Toulon et du Var Bâtiment R, BP

Plus en détail

Métaheuristique. Jérémy CHANUT Charles BALLARINI

Métaheuristique. Jérémy CHANUT Charles BALLARINI Métaheuristique Jérémy CHANUT Charles BALLARINI 15 octobre 2012 CHAPITRE 1 INTRODUCTION Ce projet consiste en la résolution du problème des composants électroniques par deux méthodes : Recuit simulé Algorithme

Plus en détail

Les méthodes d optimisation appliquées à la conception de convertisseurs électromécaniques. Elec 2311 : S7

Les méthodes d optimisation appliquées à la conception de convertisseurs électromécaniques. Elec 2311 : S7 Les méthodes d optimisation appliquées à la conception de convertisseurs électromécaniques Elec 2311 : S7 1 Plan du cours Qu est-ce l optimisation? Comment l optimisation s intègre dans la conception?

Plus en détail

The Current State and Future of Search Based Software Engineering

The Current State and Future of Search Based Software Engineering The Current State and Future of Search Based Software Engineering Mark Harman 1 IEEE International Conference on Software Engineering FoSE 07: Future of Software Engineering 1 King's College, LONDON, UK

Plus en détail

Généralités sur les bases de données

Généralités sur les bases de données Généralités sur les bases de données Qu est-ce donc qu une base de données? Que peut-on attendre d un système de gestion de bases de données? Que peut-on faire avec une base de données? 1 Des données?

Plus en détail

Web search. Course Organization. 4 July 2011. 1 / 7 Pierre Senellart Licence de droits d usage

Web search. Course Organization. 4 July 2011. 1 / 7 Pierre Senellart Licence de droits d usage Web search Course Organization 1 / 7 Pierre Senellart Course scope Introduction to the technologies of Web search engines Prerequisites: basic math and computer science Labs prerequisites: Java programming

Plus en détail

INEX. Livrable n L2 LES CAPITALISTES SOCIAUX SUR TWITTER : DÉTECTION VIA DES MESURES DE SIMILARITÉ

INEX. Livrable n L2 LES CAPITALISTES SOCIAUX SUR TWITTER : DÉTECTION VIA DES MESURES DE SIMILARITÉ INEX Informatique en Nuage : Expérimentations et Vérification Livrable n L2 LES CAPITALISTES SOCIAUX SUR TWITTER : DÉTECTION VIA DES MESURES DE SIMILARITÉ Nicolas Dugué Anthony Perez 27 novembre 2012 2

Plus en détail

OrderGeneMiner : Logiciel pour l extraction et la visualisation de motifs partiellement ordonnés à partir de puces à ADN

OrderGeneMiner : Logiciel pour l extraction et la visualisation de motifs partiellement ordonnés à partir de puces à ADN OrderGeneMiner : Logiciel pour l extraction et la visualisation de motifs partiellement ordonnés à partir de puces à ADN Mickaël Fabrègue, Agnès Braud, Sandra Bringay, Florence Le Ber, Charles Lecellier,

Plus en détail

Comparaison de modèles mathématiques et implémentation d une métaheuristique pour le Master Surgical Scheduling Problem

Comparaison de modèles mathématiques et implémentation d une métaheuristique pour le Master Surgical Scheduling Problem École Polytechnique de l Université de Tours 64, Avenue Jean Portalis 37200 TOURS, FRANCE Tél. +33 (0)2 47 36 14 14 www.polytech.univ-tours.fr Département Informatique 5 e année 2013-2014 Rapport de Projet

Plus en détail

Approche pour le suivi de l évolution des données d usage du Web : application sur un jeu de données en marketing

Approche pour le suivi de l évolution des données d usage du Web : application sur un jeu de données en marketing Approche pour le suivi de l évolution des données d usage du Web : application sur un jeu de données en marketing Alzennyr Da Silva, Yves Lechevallier Projet AxIS, INRIA Paris-Rocquencourt Domaine de Voluceau,

Plus en détail

Recherche d information textuelle

Recherche d information textuelle Recherche d information textuelle Pré-traitements & indexation B. Piwowarski CNRS / LIP6 Université Paris 6 benjamin@bpiwowar.net http://www.bpiwowar.net Master IP - 2014-15 Cours et travaux pratiques

Plus en détail

Heuristique et métaheuristique. 8. Optimisation combinatoire et métaheuristiques. Optimisation combinatoire. Problème du voyageur de commerce

Heuristique et métaheuristique. 8. Optimisation combinatoire et métaheuristiques. Optimisation combinatoire. Problème du voyageur de commerce Heuristique et métaheuristique IFT1575 Modèles de recherche opérationnelle (RO) 8. Optimisation combinatoire et métaheuristiques Un algorithme heuristique permet d identifier au moins une solution réalisable

Plus en détail

Vers la conception interactive d une hiérarchie sémantique de descripteurs d images

Vers la conception interactive d une hiérarchie sémantique de descripteurs d images PROPOSITION DE STAGE Année 2016 Laboratoire L3i Sujet de stage : Vers la conception interactive d une hiérarchie sémantique de descripteurs d images Résumé du travail proposé : Ce travail s intéresse à

Plus en détail

Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet

Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet Comment reproduire les résultats de l article : POP-Java : Parallélisme et distribution orienté objet Beat Wolf 1, Pierre Kuonen 1, Thomas Dandekar 2 1 icosys, Haute École Spécialisée de Suisse occidentale,

Plus en détail

RECONNAISSANCE DE LA MAIN POUR LES INTERFACES GESTUELLES

RECONNAISSANCE DE LA MAIN POUR LES INTERFACES GESTUELLES RECONNAISSANCE DE LA MAIN POUR LES INTERFACES GESTUELLES Sébastien Marcel Olivier Bernier Daniel Collobert France Telecom - CNET DTL / DLI / TNT 2 avenue Pierre Marzin 22307 Lannion FRANCE Les interfaces

Plus en détail

Définition et diffusion de signatures sémantiques dans les systèmes pair-à-pair

Définition et diffusion de signatures sémantiques dans les systèmes pair-à-pair Définition et diffusion de signatures sémantiques dans les systèmes pair-à-pair Raja Chiky, Bruno Defude, Georges Hébrail GET-ENST Paris Laboratoire LTCI - UMR 5141 CNRS Département Informatique et Réseaux

Plus en détail

Recherche d information textuelle

Recherche d information textuelle Recherche d information textuelle Recherche Web B. Piwowarski CNRS / LIP6 Université Paris 6 benjamin@bpiwowar.net http://www.bpiwowar.net Master IP - 2014-15 Cours et travaux pratiques basés sur les documents

Plus en détail

Forthcoming Database

Forthcoming Database DISS.ETH NO. 15802 Forthcoming Database A Framework Approach for Data Visualization Applications A dissertation submitted to the SWISS FEDERAL INSTITUTE OF TECHNOLOGY ZURICH for the degree of Doctor of

Plus en détail

Guide à l usage des décideurs

Guide à l usage des décideurs Guide à l usage des décideurs Des concepts à connaître... 20 Enjeux stratégiques : pourquoi référencer son site?... 27 La place du référencement dans le marketing global de l entreprise... 30 Pourquoi

Plus en détail

Un Algorithme génétique pour le problème de ramassage et de livraison avec fenêtres de temps à plusieurs véhicules

Un Algorithme génétique pour le problème de ramassage et de livraison avec fenêtres de temps à plusieurs véhicules Un Algorithme génétique pour le problème de ramassage et de livraison avec fenêtres de temps à plusieurs véhicules I. Harbaoui Dridi (1),(2) R. Kammarti (1),(2) P. Borne (1) M. Ksouri (2) imenharbaoui@gmail.com

Plus en détail

Notes de cours Moteurs de recherche : Master 2 Pro, Université Paris Diderot

Notes de cours Moteurs de recherche : Master 2 Pro, Université Paris Diderot Notes de cours Moteurs de recherche : Master 2 Pro, Université Paris Diderot Michel Habib and Antoine Meyer 22 janvier 2009 1 Introduction Ce document a été rédigé à partir des trois mémoires de thèses

Plus en détail

france.ni.com Journée technique Du contrôle d instruments au banc de test

france.ni.com Journée technique Du contrôle d instruments au banc de test Journée technique Du contrôle d instruments au banc de test Quelles approches pour analyser vos données, Excel, LabVIEW, fichiers scripts, NI DIAdem National Instruments France Industries et applications

Plus en détail

Partie A Internet... 19. 1.1 D'Arpanet à Internet... 23 L ARPA... 23 Arpanet... 26 D Arpanet à Internet... 27

Partie A Internet... 19. 1.1 D'Arpanet à Internet... 23 L ARPA... 23 Arpanet... 26 D Arpanet à Internet... 27 Partie A Internet... 19 1 Se connecter à Internet... 21 1.1 D'Arpanet à Internet... 23 L ARPA... 23 Arpanet... 26 D Arpanet à Internet... 27 1.2 Les applications du Net... 36 Gopher... 36 Archie... 37

Plus en détail

Prototype de canal caché dans le DNS

Prototype de canal caché dans le DNS Manuscrit auteur, publié dans "Colloque Francophone sur l Ingénierie des Protocoles (CFIP), Les Arcs : France (2008)" Prototype de canal caché dans le DNS Lucas Nussbaum et Olivier Richard Laboratoire

Plus en détail

Les capitalistes sociaux sur Twitter : détection via des mesures de similarité

Les capitalistes sociaux sur Twitter : détection via des mesures de similarité Les capitalistes sociaux sur Twitter : détection via des mesures de similarité Nicolas Dugué, Anthony Perez LIFO - Université d Orléans rue Léonard de Vinci B.P. 6759 F-45067 ORLEANS Cedex 2 FRANCE RÉSUMÉ.

Plus en détail

Sélection de variables groupées avec les forêts aléatoires. Application à l analyse des données fonctionnelles multivariées.

Sélection de variables groupées avec les forêts aléatoires. Application à l analyse des données fonctionnelles multivariées. Sélection de variables groupées avec les forêts aléatoires. Application à l analyse des données fonctionnelles multivariées. Baptiste Gregorutti 12, Bertrand Michel 2 & Philippe Saint Pierre 2 1 Safety

Plus en détail

Cours de Master Recherche

Cours de Master Recherche Cours de Master Recherche Spécialité CODE : Résolution de problèmes combinatoires Christine Solnon LIRIS, UMR 5205 CNRS / Université Lyon 1 2007 Rappel du plan du cours 1 - Introduction Qu est-ce qu un

Plus en détail

Clustering par quantification en présence de censure

Clustering par quantification en présence de censure Clustering par quantification en présence de censure Svetlana Gribkova 1 Laboratoire de Statistique Théorique et Appliquée, Université Pierre et Marie Curie Paris 6, 4 place Jussieu, 75005 Paris Résumé.

Plus en détail

fonctionnant sur Internet et qui permet de consulter, avec un navigateur, des pages mises en ligne dans des sites.

fonctionnant sur Internet et qui permet de consulter, avec un navigateur, des pages mises en ligne dans des sites. Internet Les applications d Internet : World Wide Web (www) toile (d araignée) mondiale: système hypertexte public fonctionnant sur Internet et qui permet de consulter, avec un navigateur, des pages mises

Plus en détail

Gestion de Contenus Web (WCM)

Gestion de Contenus Web (WCM) Web Content Management 1 Gestion de Contenus Web (WCM) Bernd Amann Modelware : vers la modélisation et la sémantisation de l information École CEA-EDF-INRIA 16-27 juin 2003 Cours No 1 - Gestion de Contenus

Plus en détail

Analyse de survie appliquée à la modélisation de la transmission des maladies infectieuses : mesurer l impact des interventions

Analyse de survie appliquée à la modélisation de la transmission des maladies infectieuses : mesurer l impact des interventions Analyse de survie appliquée à la modélisation de la transmission des maladies infectieuses : mesurer l impact des interventions Génia Babykina 1 & Simon Cauchemez 2 1 Université de Lille, Faculté Ingénierie

Plus en détail

Chapitre II : Les Réseaux Informatiques. Smii_adn@yahoo.fr 1

Chapitre II : Les Réseaux Informatiques. Smii_adn@yahoo.fr 1 Chapitre II : Les Réseaux Informatiques Smii_adn@yahoo.fr 1 I- Introduction : Un réseau informatique est un ensemble d appareils(ordinateurs et périphériques)reliés entre eux dans le but de permettre à

Plus en détail

Mots-clés Optimisation par Essaims de Particules (OEP), Recuit Simulé (RS), Métaheuristique, Hybridation, ORPF, Système électrique de puissance.

Mots-clés Optimisation par Essaims de Particules (OEP), Recuit Simulé (RS), Métaheuristique, Hybridation, ORPF, Système électrique de puissance. Hybridation Intégrative OEP/RS Appliquée à l Ecoulement Optimal de la Puissance Réactive M. Lahdeb S. Arif A. Hellal Laboratoire d Analyse et de Commande des Systèmes d Energie et Réseaux Électriques (LACoSERE)

Plus en détail

Maintenance de charge pour l optimisation des entrepôts de données évolutifs : aide à l administrateur

Maintenance de charge pour l optimisation des entrepôts de données évolutifs : aide à l administrateur Maintenance de charge pour l optimisation des entrepôts de données évolutifs : aide à l administrateur Cécile Favre, Fadila Bentayeb, Omar Boussaid Université de Lyon (Laboratoire ERIC - Lyon 2) 5 av.

Plus en détail

Notes de cours (ENS Lyon, M1) Chapitre 4 : Internet et le Web

Notes de cours (ENS Lyon, M1) Chapitre 4 : Internet et le Web Notes de cours (ENS Lyon, M1) Chapitre 4 : Internet et le Web Table des matières 4 Internet et le Web 68 4.1 Le graphe du Web.......................... 68 4.1.1 Structure du Web...................... 68

Plus en détail

Ce qu est le Data Mining

Ce qu est le Data Mining Data Mining 1 Ce qu est le Data Mining Extraction d informations intéressantes non triviales, implicites, préalablement inconnues et potentiellement utiles à partir de données. Autres appellations: ECD

Plus en détail

SONDY : une plateforme open-source d analyse et de fouille pour les réseaux sociaux en ligne

SONDY : une plateforme open-source d analyse et de fouille pour les réseaux sociaux en ligne SONDY : une plateforme open-source d analyse et de fouille pour les réseaux sociaux en ligne Adrien GUILLE, C. Favre, Djamel Abdelkader Zighed To cite this version: Adrien GUILLE, C. Favre, Djamel Abdelkader

Plus en détail

CHAPITRE 1 : CONCEPTS DE BASE

CHAPITRE 1 : CONCEPTS DE BASE CHAPITRE 1 : CONCEPTS DE BASE 1.1 C est quoi l INTERNET? C est le plus grand réseau télématique au monde, créé par les Américains et issu du réseau ARPANET (Advanced Research Projects Agency ). Ce dernier

Plus en détail

Partie A Internet... 19. 1.1 D'Arpanet à Internet... 23 L ARPA... 23 Arpanet... 26 D Arpanet à Internet... 27

Partie A Internet... 19. 1.1 D'Arpanet à Internet... 23 L ARPA... 23 Arpanet... 26 D Arpanet à Internet... 27 Partie A Internet... 19 1 Se connecter à Internet... 21 1.1 D'Arpanet à Internet... 23 L ARPA... 23 Arpanet... 26 D Arpanet à Internet... 27 1.2 Les applications du Net... 36 Gopher... 36 Archie... 36

Plus en détail

THÈSE. présentée à TÉLÉCOM PARISTECH. pour obtenir le grade de. DOCTEUR de TÉLÉCOM PARISTECH. Mention Informatique et Réseaux. par.

THÈSE. présentée à TÉLÉCOM PARISTECH. pour obtenir le grade de. DOCTEUR de TÉLÉCOM PARISTECH. Mention Informatique et Réseaux. par. École Doctorale d Informatique, Télécommunications et Électronique de Paris THÈSE présentée à TÉLÉCOM PARISTECH pour obtenir le grade de DOCTEUR de TÉLÉCOM PARISTECH Mention Informatique et Réseaux par

Plus en détail

Clermont Ferrand - Janvier 2003

Clermont Ferrand - Janvier 2003 DISDAMIN: Algorithmes de Data Mining Distribués Valerie FIOLET (1,2) - Bernard TOURSEL (1) 1 Equipe PALOMA - LIFL - USTL - LILLE (FRANCE) 2 Service Informatique - UMH - MONS (BELGIUM) Clermont Ferrand

Plus en détail

Rank, l outil de la visibilité web

Rank, l outil de la visibilité web Rank, l outil de la visibilité web Développé par le pôle R&D de la société Brioude Internet, Rank a pour vocation de nous aider à suivre le positionnement d un site et de ses concurrents. Il ne s agit

Plus en détail

Initiation à la fouille de données et à l apprentissage automatiq

Initiation à la fouille de données et à l apprentissage automatiq Initiation à la fouille de données et à l apprentissage automatique 1 Laboratoire d Informatique Fondamentale de Marseille Université de Provence christophe.magnan@lif.univ-mrs.fr www.lif.univ-mrs.fr/

Plus en détail

Approche hybride de reconstruction de facettes planes 3D

Approche hybride de reconstruction de facettes planes 3D Cari 2004 7/10/04 14:50 Page 67 Approche hybride de reconstruction de facettes planes 3D Ezzeddine ZAGROUBA F. S.T, Dept. Informatique. Lab. d Informatique, Parallélisme et Productique. Campus Universitaire.

Plus en détail

AMESD-Puma2010-EFTS- Configuration-update-TEN (en-fr)

AMESD-Puma2010-EFTS- Configuration-update-TEN (en-fr) AMESD-Puma2010-EFTS- Configuration-update-TEN (en-fr) Doc.No. : EUM/OPS/TEN/13/706466 Issue : v2 Date : 23 July 2013 WBS : EUMETSAT Eumetsat-Allee 1, D-64295 Darmstadt, Germany Tel: +49 6151 807-7 Fax:

Plus en détail

Utilisation du serveur de calcul du LSTA

Utilisation du serveur de calcul du LSTA Utilisation du serveur de calcul du LSTA B. Michel 19 octobre 2012 Ce document contient les informations minimales à connaître pour utiliser R et Matlab sur le serveur Mac à 24 coeurs du laboratoire (ou

Plus en détail

Optimisation de la géométrie du voisinage pour la segmentation d images texturées

Optimisation de la géométrie du voisinage pour la segmentation d images texturées Optimisation de la géométrie du voisinage pour la segmentation d images texturées Pierre Beauseroy & André Smolarz Institut des Sciences et Technologies de l Information de Troyes (FRE 73) Université de

Plus en détail

BI = Business Intelligence Master Data-ScienceCours 7 - Data

BI = Business Intelligence Master Data-ScienceCours 7 - Data BI = Business Intelligence Master Data-Science Cours 7 - Data Mining Ludovic DENOYER - UPMC 30 mars 2015 Ludovic DENOYER - Typologie des méthodes de Data Mining Différents types de méthodes : Méthodes

Plus en détail

Artificial Intelligence AI

Artificial Intelligence AI Pedagogical Introduction Artificial Intelligence AI Lecture 0 Karim Bouzoubaa This Lecture General Information Examples Importance At the end Intelligent Systems Course Content, Other AI courses, Learning

Plus en détail

MANUEL D INSTALLATION

MANUEL D INSTALLATION Data Processing Commission Fast Advanced Software for Table soccer - v 1.0 Logiciel de gestion de tournoi de football de table MANUEL D INSTALLATION INSTALLATION INFORMATIQUE DE LA TABLE DE MARQUE & CONFIGURATION

Plus en détail

WEBEARLY 3 et MEMOWEB 3 Des outils pour accélérer la consultation et capturer des sites web

WEBEARLY 3 et MEMOWEB 3 Des outils pour accélérer la consultation et capturer des sites web 199 WEBEARLY 3 et MEMOWEB 3 Des outils pour accélérer la consultation et capturer des sites web 1 - Cédérom WEBEARLY 3 : accélérer la consultation des sites Web WebEarly 3 est un logiciel qui permet de

Plus en détail

Rapport Gestion de projet

Rapport Gestion de projet IN56 Printemps 2008 Rapport Gestion de projet Binôme : Alexandre HAFFNER Nicolas MONNERET Enseignant : Nathanaël COTTIN Sommaire Description du projet... 2 Fonctionnalités... 2 Navigation... 4 Description

Plus en détail

Comparaison de dissimilarités pour l analyse de l usage d un site web

Comparaison de dissimilarités pour l analyse de l usage d un site web Comparaison de dissimilarités pour l analyse de l usage d un site web Fabrice Rossi, Francisco De Carvalho, Yves Lechevallier, Alzennyr Da Silva, Projet AxIS, INRIA Rocquencourt Domaine de Voluceau, Rocquencourt,

Plus en détail

Classification. Session organisée par Charles Bouveyron et Francois Caron et Marie Chavent

Classification. Session organisée par Charles Bouveyron et Francois Caron et Marie Chavent Classification Session organisée par Charles Bouveyron et Francois Caron et Marie Chavent La classification a pour objet de regrouper des données en classes possédant des caractéristiques similaires. La

Plus en détail