Les métaheuristiques et leur adaptation pour l optimisation continue

Documents pareils

Les colonies de fourmis : apprentissage coopératif pour le problème du voyageur de commerce

Cours des Méthodes de Résolution Exactes Heuristiques et Métaheuristiques

Jean-Philippe Préaux

Modélisation multi-agents - Agents réactifs

Atelier Transversal AT11. Activité «Fourmis» Pierre Chauvet.

THÈSE DE DOCTORAT DE L UNIVERSITÉ PARIS 12-VAL DE MARNE UFR de Sciences et Technologie. par. Walid TFAILI. pour obtenir le grade de

ALGORITHME GENETIQUE ET MODELE DE SIMULATION POUR L'ORDONNANCEMENT D'UN ATELIER DISCONTINU DE CHIMIE

Une application des algorithmes génétiques à l ordonnancement d atelier

Optimisation Combinatoire (Méthodes approchées) II. Recherche Locale simple (Les bases)

Ordonnancement en temps réel d un jobshop par métaheuristique hybride : étude comparative

Problème à résoudre. min f(s) s.c. s S

L analyse d images regroupe plusieurs disciplines que l on classe en deux catégories :

Info0804. Cours 6. Optimisation combinatoire : Applications et compléments

Laboratoire d Automatique et Productique Université de Batna, Algérie

La programmation à mémoire adaptative ou l évolution des algorithmes évolutifs

Complexité et auto-organisation chez les insectes sociaux. Complexité et auto-organisation chez les insectes sociaux

Approche d'évaluation pour les problèmes d'ordonnancement multicritères : Méthode d'agrégation avec direction de recherche dynamique

LES MÉTA-HEURISTIQUES : quelques conseils pour en faire bon usage

Principes d implémentation des métaheuristiques

Etude d un cas industriel : Optimisation de la modélisation de paramètre de production

Hela Boukef. To cite this version: HAL Id: tel

Problèmes d ordonnancement dans les systèmes de production. Journée Automatique et Optimisation Université de Paris Mars 2003

Coup de Projecteur sur les Réseaux de Neurones

La classification automatique de données quantitatives

Méthaheuristiques pour l optimisation combinatoire et l affectation sous contraintes

Projet de Traitement du Signal Segmentation d images SAR

Des fourmis réelles aux fourmis artificielles

Ordonnancement robuste et décision dans l'incertain

Algorithme des fourmis appliqué à la détection et au suivi de contours dans une image

Optimisation non linéaire Irène Charon, Olivier Hudry École nationale supérieure des télécommunications

Introduction au datamining

Objectifs du cours d aujourd hui. Informatique II : Cours d introduction à l informatique et à la programmation objet. Complexité d un problème (2)

Souad EL Bernoussi. Groupe d Analyse Numérique et Optimisation Rabat http ://

I Stabilité, Commandabilité et Observabilité Introduction Un exemple emprunté à la robotique Le plan Problème...

Optimisation et programmation mathématique. Professeur Michel de Mathelin. Cours intégré : 20 h

Apprentissage Automatique

- MANIP 2 - APPLICATION À LA MESURE DE LA VITESSE DE LA LUMIÈRE

Christophe CANDILLIER Cours de DataMining mars 2004 Page 1

Système Immunitaire Artificiel Parallèle appliqué aux Flow Shop Hybride (FSH)

Texte Agrégation limitée par diffusion interne

DES FOURMIS POUR LIVRER DU MAZOUT

$SSOLFDWLRQGXNULJHDJHSRXUOD FDOLEUDWLRQPRWHXU

Différentes opérateurs évolutionnaires de permutation: sélections, croisements et mutations

Vers une Optimisation de l Algorithme AntTreeStoch

Sujet proposé par Yves M. LEROY. Cet examen se compose d un exercice et de deux problèmes. Ces trois parties sont indépendantes.

Chapitre 2 : communications numériques.

Introduction au Data-Mining

Deux stratégies parallèles de l'optimisation par colonie de fourmis

CONCOURS D ENTREE A L ECOLE DE 2007 CONCOURS EXTERNE. Cinquième épreuve d admissibilité STATISTIQUE. (durée : cinq heures)

Programmation linéaire

Sommaire. Introduction. I. Notions de routage a) Technologies actuelles b) Avantages et désavantages

Déroulement d un projet en DATA MINING, préparation et analyse des données. Walid AYADI

Quantification Scalaire et Prédictive

FORMATION CONTINUE SUR L UTILISATION D EXCEL DANS L ENSEIGNEMENT Expérience de l E.N.S de Tétouan (Maroc)

Fig.1. Structure d un AGQ

INF6304 Interfaces Intelligentes

Diverses techniques d'optimisation inspirées de la théorie de l'auto-organisation dans les systèmes biologiques

Fonctions de plusieurs variables

Systèmes de transmission

Formations spécifiques

Projet de synthèse de l'électronique analogique : réalisation d'une balance à jauges de contrainte

Contrôle par commande prédictive d un procédé de cuisson sous infrarouge de peintures en poudre.

Un modèle réactif pour l optimisation par colonies de fourmis : application à la satisfaction de contraintes

Nombres, mesures et incertitudes en sciences physiques et chimiques. Groupe des Sciences physiques et chimiques de l IGEN

Statistiques Descriptives à une dimension

Compression et Transmission des Signaux. Samson LASAULCE Laboratoire des Signaux et Systèmes, Gif/Yvette

CAPTEURS - CHAINES DE MESURES

Chapitre 2 : Systèmes radio mobiles et concepts cellulaires

Catalogue de formation

Optimisation de la compression fractale D images basée sur les réseaux de neurones

Une comparaison de méthodes de discrimination des masses de véhicules automobiles

Détection et suivi d'objets dans une séquence d'images par contours actifs

Intelligence des essaims (Swarm Intelligence)

Système immunitaire artificiel

Optimisation multi-objectif par colonies de fourmis : cas des problèmes de sac à dos

Exercices types Algorithmique et simulation numérique Oral Mathématiques et algorithmique Banque PT

Les algorithmes de base du graphisme

Cours de Master Recherche

Mario Geiger octobre 08 ÉVAPORATION SOUS VIDE

Les lières. MSc in Electronics and Information Technology Engineering. Ingénieur civil. en informatique. MSc in Architectural Engineering

Couplage efficace entre Optimisation et Simulation stochastique Application à la maintenance optimale d une constellation de satellites

Le théorème de Perron-Frobenius, les chaines de Markov et un célèbre moteur de recherche

Étude des Corrélations entre Paramètres Statiques et Dynamiques des Convertisseurs Analogique-Numérique en vue d optimiser leur Flot de Test

Chapitre 18 : Transmettre et stocker de l information

Sommaire. Introduction Définition Historique Domaine d application.2. 4.Les Travaux réalisés sur les domaines d application.

Analyse de la vidéo. Chapitre La modélisation pour le suivi d objet. 10 mars Chapitre La modélisation d objet 1 / 57

On distingue deux grandes catégories de mémoires : mémoire centrale (appelée également mémoire interne)

Présentation des algorithmes génétiques et de leurs applications en économie

Calculer avec Sage. Revision : 417 du 1 er juillet 2010

Algorithmes pour la planification de mouvements en robotique non-holonome

Sillage Météo. Notion de sillage

Figure 1 Différents éléments influençant les mesures de seuil réalisées en champ visuel

Élue Correspondant le 25 avril 1994, puis Membre le 30 novembre 2004 dans la section Sciences mécaniques et informatiques

Dr E. CHEVRET UE Aperçu général sur l architecture et les fonctions cellulaires

SIMULATION HYBRIDE EN TEMPOREL D UNE CHAMBRE REVERBERANTE

UE 503 L3 MIAGE. Initiation Réseau et Programmation Web La couche physique. A. Belaïd

Transcription:

Les métaheuristiques et leur adaptation pour l optimisation continue Patrick SIARRY, Univ. de Paris-Est Créteil (LiSSi, E.A. 3956) Principe des principales métaheuristiques Cadre général de l optimisation continue «difficile» Notre adaptation au cas continu de 4 métaheuristiques Exemple d application continue en génie biomédical

Principe des principales métaheuristiques 2

Les métaheuristiques sont des «méthodes approchées» Grandes familles de méthodes approchées : Méthodes par construction Méthodes par décomposition Méthodes de voisinage (une solution courante) : * heuristiques classiques * métaheuristiques de voisinage : - recuit simulé - recherche tabou, etc Métaheuristiques à base de population : - algorithmes évolutionnaires - colonies de fourmis - estimation de distribution - essaims particulaires, etc 3

Méthodes par construction A chaque itération, les décisions sont prises définitivement pour un sous-ensemble de variables. Décisions pour X o Décisions pour X 1 Décisions pour X 2.. on cherche un optimum local à chaque prise de décision algorithmes gloutons ou gourmands Décisions pour X q 4

Méthodes par décomposition de l ensemble des solutions du problème : procédure par séparation et évaluation - méthode arborescente - trouve une solution optimale, si on lui en laisse le temps de l ensemble des décisions à prendre : programmation dynamique - démonstration d optimalité sur la récurrence des calculs - selon les problèmes, algo. polynomial ou exponentiel 5

Méthodes de voisinage (manipulent une seule «solution courante» à la fois) 6

montagnes représentant les variations du niveau de la fonction à minimiser (en supposant que l on peut étaler les solutions du problème sur une surface) L objectif est de trouver le fond de la vallée la plus profonde 7

Aveugle parachuté en un point de départ quelconque, muni : - d une canne, - d un appareil de mesure de niveau, - d un appareil de mesure de position, - d un appareil pour communiquer. (quelques transparents empruntés à Marie-Claude Portmann, Ecole des Mines de Nancy) 8

Le voisinage de l aveugle est délimité par la longueur de sa canne. 9

Heuristiques «classiques» 10

Une approche «classique» : la plus forte pente L aveugle choisit toujours le point le plus bas de son voisinage et s y rend. Arrêt dans un optimum local, lorsqu aucun point du voisinage n est strictement meilleur. 11

Seconde méthode Méthode de descente. L aveugle choisit le premier point qu il découvre et qui lui permet de descendre. Divers critères d arrêt. 12

Amélioration de toute méthode qui se termine sur un minimum local : appliquer la même méthode avec plusieurs points de départ aléatoires. parachutage d un escadron d aveugles parachutistes. 13

Troisième méthode Marche stochastique. L aveugle erre de manière totalement aléatoire, on retient la meilleure position visitée. Arrêt par fatigue (après avoir visité N points). 14

Métaheuristiques de voisinage 15

Le recuit simulé Au départ l aveugle est plein d énergie : il accepte aléatoirement de remonter, si la remontée n est pas trop forte et si son énergie est suffisante. Il perd progressivement son énergie : il termine par une méthode de descente, lorsqu il n a plus d énergie. 16

Recuit simulé inspiré de la thermodynamique Pour que la structuration finale d'un matériau soit harmonieuse, il est nécessaire qu'il passe par des phases intermédiaires moins favorables. A haute température, le corps passe par de nombreux stades de transformation, qu'il atteint facilement grâce à l'énergie liée à sa température. Plus la température baisse et plus les transformations sont régulières et orientées vers l'état final. 17

Recuit simulé Problème d optimisation Fonction objectif Paramètres du problème Trouver une bonne configuration Système physique énergie libre coordonnées des particules trouver les états de basse énergie CONFIGURATION INITIALE TEMPERATURE INITIALE T MODIFICATION élémentaire variation d'énergie E REGLE D'ACCEPTATION de Metropolis - si E 0 : modification acceptée - si E 0 : modification acceptée avec la probabilité exp ( - E / T ) NON équilibre thermodynamique? OUI système figé? NON PROGRAMME DE RECUIT diminution lente de T STOP OUI 18

La recherche tabou On accepte de remonter, pour pouvoir échapper aux optima locaux (en pratique, on va vers le meilleur «voisin»). Pour ne pas y retomber, on place des «tabous», qui empêchent de retourner aux points déjà visités. mémoire à court terme. 19

Problème On sature la mémoire en y conservant la description de tous les points visités. Solution On ne conserve qu un nombre limité de points visités, les L derniers, dans une liste Tabou. Problème On peut avoir tout de même un blocage ou un bouclage. Variante très utilisée On ne met pas dans la liste Tabou les derniers points visités, mais les derniers mouvements faits et on interdit les mouvements inverses. 20

Problème On risque d interdire ainsi l accès à des solutions jamais visitées. Solution On lève le statut tabou, si la solution concernée est «suffisamment» intéressante : niveau d aspiration. Mécanismes de mémoire à long terme - diversification : on force la visite de régions non encore explorées. - intensification : on retourne visiter plus en détail des régions jugées prometteuses. Un slogan des fans de Tabou : TABOU BAT TOUT 21

Recherche tabou Idée de base : modélisation de la mémoire CONFIGURATION INITIALE s LISTE TABOU INITIALE VIDE NOUVELLE CONFIGURATION COURANTE s = t PERTURBATION DE s SUIVANT N MOUVEMENTS non tabous ; EVALUATION DES N VOISINS INSERTION DU MOUVEMENT t s DANS LA LISTE TABOU circulaire SELECTION DU MEILLEUR VOISIN t OUI amélioration observée récemment? NON STOP 22

Sixième méthode Le kangourou ou le tunnel. On passe immédiatement à un point distant meilleur, lorsqu on est coincé dans un optimum local. saut du kangourou tunnel 23

Septième méthode La méthode du bruitage ou le tremblement de terre. On secoue la montagne, i.e. on travaille temporairement sur une surface déformée aléatoirement. 24

Métaheuristiques à base de population 25

Algorithmes évolutionnaires Famille d'algorithmes s'inspirant de l'évolution des espèces vivantes. L'évolution d'une espèce est marquée par une suite de transformations, permettant d'améliorer l'adaptation de l'espèce à son milieu. Cette adaptation est réalisée grâce à la sélection naturelle (survival of the fittest) et aux mécanismes de la reproduction. 26

Algorithme génétique (AG) type Une population est un ensemble d'individus ; chaque individu représente une solution du problème d'optimisation considéré. Le plus souvent, un individu, ou chromosome, est représenté par une chaîne de bits, ou d'entiers, ou - plus récemment - de réels, de longueur fixée. Ces constituants sont appelés les gènes de l'individu. La qualité de cette solution est évaluée à l'aide de la fonction d'adaptation (fitness function), qui est bâtie à partir de la fonction objectif. 27

La population évolue grâce à 3 opérations principales : la sélection, qui favorise les "bons" individus, au détriment des "mauvais" : Exemple la sélection par "roulette biaisée" Surface proportionnelle à la force de l individu 28

le croisement, qui engendre 2 enfants, héritant des caractéristiques de chacun de leurs 2 parents : Parent 1 0 1 1 1 0 0 1 1 0 1 0 1 Enfant 1 0 1 0 1 0 1 1 1 1 1 0 0 Parent 2 Enfant 2 Point de croisement (en cas de codage binaire) Les croisements cherchent à conserver les meilleures caractéristiques des parents. 29

la mutation, qui altère un seul individu : Position choisie arbitrairement Individu à muter 0 1 0 1 0 1 Mutant 0 1 1 1 0 1 Les mutations servent à créer de la diversité, pour éviter la dégénérescence. 30

Algorithme génétique (AG) POPULATION INITIALE N "individus" : N points x pris au hasard Chaque individu est codé par une chaîne de caractères REPRODUCTION production de M "descendants", par application des opérateurs génétiques : "croisement" et "mutation" SELECTION formation de la nouvelle "génération", par sélection des N meilleurs individus (jaugés par f), parmi les N+M disponibles nombre maximal de générations successives atteint? NON OUI résultat = meilleur individu x rencontré En général, la taille de la population est gardée constante. 31

Théorie des schémas (sous les strictes hypothèses du SGA de Goldberg) On démontre que les algorithmes génétiques convergent vers de très bonnes solutions. "No free lunch theorem" Il n'existe pas de paramètres optimaux, qui garantiraient la meilleure efficacité possible, quel que soit le problème traité. 32

Colonies de fourmis Idée-force : la coopération prend le dessus sur la compétition des AGs Quoique dotées de facultés individuelles très limitées, les fourmis ont bâti une vie en société élaborée. En particulier, elles collaborent entre elles pour aller chercher de la nourriture à l'extérieur de la fourmilière. On a observé qu'elles suivent toujours le même chemin, et que ce chemin est le plus court possible. 33

Ce comportement s'explique par un mode de communication indirecte, via l'environnement (la "stigmergie") : chaque fourmi dépose, le long de son chemin, une substance chimique, la "phéromone". Tous les membres de la colonie perçoivent cette substance, et orientent préférentiellement leur marche vers les régions les plus "odorantes" : (par exemple) faculté collective de retrouver le plus court chemin, si celui-ci se trouve obstrué par un obstacle : 34

Nourriture? 50% 50% Nid 35

Application au problème du voyageur de commerce N villes à visiter au début de la recherche : pas de trace de phéromone sur les arcs du graphe. 36

M fourmis (ici 3) partent en exploration aléatoire et effectuent une tournée complète. Les traces de phéromone sont mises à jour à la fin, en fonction de l intérêt des tournées effectuées. 37

M nouvelles fourmis partent en exploration aléatoire. A partir de chaque ville, la probabilité de choisir la ville suivante est fonction de la densité de phéromone présente sur l arête y menant. Les traces de phéromone sont mises à jour à la fin, en fonction de l intérêt des tournées effectuées, etc renforcement progressif des arêtes présentes dans les bonnes tournées 38

Caractéristiques des algo. de colonies de fourmis Parallélisme intrinsèque élevé. Flexibilité : une colonie de fourmis est capable de s'adapter à des modifications de l'environnement. Robustesse : une colonie de fourmis est apte à maintenir son activité, si quelques individus sont défaillants. Décentralisation : une colonie de fourmis n'obéit pas à une autorité centralisée. Auto-organisation : une colonie de fourmis trouve d'ellemême une solution, qui n'est pas connue à l'avance. 39

Les algorithmes de fourmis paraissent indiqués pour les problèmes : distribués par nature susceptibles d évolution dynamique qui requièrent une forte tolérance aux pannes La transposition à chaque problème doit, cependant, faire l objet d un traitement spécifique, plus ou moins ardu. 40

Algorithmes à estimation de distribution (EDA) Choix d une distribution initiale D (souvent une gaussienne) et ainsi de suite.. Tirage d une population selon la distribution D Sélection des meilleurs individus + évaluation des individus Détermination d une distribution D représentative des meilleurs individus Tirage d une nouvelle population selon la distribution D 41

Les EDA entrent bien dans le cadre général de la «programmation à mémoire adaptative» mémoire = distribution associée aux meilleurs individus intensification = nouvelle population selon cette distribution diversification = utilisation d une population 42

L optimisation par essaim particulaire (OEP) L'OEP est aussi une technique fondée sur la coopération entre des agents : les «particules». Ces agents peuvent être vus comme des «animaux» aux capacités individuelles limitées : peu de mémoire et de facultés de raisonnement. L échange direct d'information entre ces agents rudimentaires permet néanmoins de résoudre des problèmes difficiles. 43

C'est le cas, par exemple, chez les abeilles vivant en essaim : exploitation de sources de nourriture, construction de rayons, etc Simple à comprendre et à programmer, l'oep se révèle efficace pour les problèmes d'optimisation non linéaire, à variables continues ou mixtes. Elle a fait ses preuves dans des domaines variés : - la régulation de systèmes électriques - la conception d'ailes d'avions - l'analyse d'images.. 44

Schéma de principe du déplacement d une particule Pour réaliser son prochain mouvement, chaque particule combine trois tendances : suivre sa propre vitesse revenir vers sa meilleure performance aller vers la meilleure performance de ses informatrices Position actuelle compromis psycho-social, entre confiance en soi et influence de ses relations sociales Vitesse actuelle Vers ma meilleure performance Nouvelle position Vers la meilleure performance de mes informatrices 45

algorithme OEP standard Pour chaque particule : v k+1 = a v k + b 1 r 1 (p 1 x k ) + b 2 r 2 (p 2 x k ) x k+1 = c x k + d v k+1 k = numéro de l itération x = position de la particule (solution candidate) v = vitesse de la particule p 1 = meilleure position de la particule en question p 2 = meilleure position dans le voisinage (essaim) a = coefficient d inertie b 1, b 2 = coefficients d attraction r 1, r 2 = nombres aléatoires, de distribution uniforme en [0,1] = produit vectoriel, élément par élément 46

Livre de Maurice Clerc paru en janvier 2005 Maurice Clerc a créé et met à jour régulièrement ce site dédié à l OEP : http://www.particleswarm.info/ conférence OEP 2007 : résumés et transparents en ligne : http://www.particleswarm.info/ oep_2007 47

Et il y a encore : Recuit microcanonique Méthode du seuil Méthode du grand déluge Méthode du voyage de record en record Méthode de recherche distribuée Méthode GRASP Algorithme de «scatter search» Algorithme de «path relinking» Méthode Aliénor Méthode de cross-entropie Méthode de l évolution différentielle Stratégies d évolution Algorithme des mouches Systèmes immunitaires artificiels Algorithmes mémétiques etc.. pour ne citer que les espèces les plus connues 48

Conclusion sur cet aperçu des métaheuristiques Une grande variété de méthodes existantes. Beaucoup de choix à faire pour essayer de les rendre les plus efficaces possible. Plus les problèmes sont difficiles, plus il devient intéressant d utiliser des méthodes hybrides, associant plusieurs approches. 49

Cadre général de l optimisation continue «difficile» 50

Problèmes «difficiles» en variables continues : (1) Optimisation Exemple : optimisation des performances d un circuit électronique Générateur de courant constant (CEA) objectif : i = C te, V 1 8 variables : dimensions (w i, l i ) des canaux des 4 transistors MOS 51

(2) Caractérisation, ou identification : Exemple : caractérisation d un modèle de moteur électrique synchrone (CEGELY, Lyon) objectif : faire coïncider au mieux les courbes calculées (sorties du modèle) et les courbes expérimentales (mesures relevées sur le moteur) 19 variables : tous les «paramètres» du modèle numérique 52

(3) Apprentissage (réseau de neurones, base de règles floues) Exemple : apprentissage d un réseau de neurones analogique (CEA) 470Ω 1N5233B 12 V R2 ENTREE X -3.14 V to +3.14 V R1 Source constante - TL074 12 V + R1 R1 - TL074 12 V + - TL074 12 V + R1 R1 - TL074 12 V + avec R1 = 10 kω et R2 = 20 k Ω +1V -1V R 1,1,1 R 1,1,2 R 1,2,1 R 1,2,2 R 1,3,1 R 1,3,2 R 1,4,1 R 1,4,2 R 1,5,1 R 1,5,2 N 1,1 N 1,2 N 1,3 N 1,4 N 1,5 + - + - + - + - + - objectif : reproduire au mieux la fonction «sinus» sous forme câblée 16 variables : les résistances (coefficients synaptiques) du réseau de neurones Nombreuses applications continues, dans tous les domaines de l ingénierie (électronique, mécanique, ) R2 R 2,1,1 R 2,1,2 R 2,1,3 R 2,1,4 R 2,1,5 R 2,1,6 - TL074 12 V + R1 R1 - TL074 12 V + N + 2,1 - Out net (X) VCLAMP + VCLAMP - avec R1 = 10 kω - + R1 TL074 12V élément de calcul VCLAMP + 1N914 R1 1N914 VCLAMP - - + - + TL074 12V R1 R1 TL074 12V Sortie + Sortie - 53

Existence de problèmes mixtes discrets / continus : Exemple : (J.P. Courat, G. Raynaud, I. Mrad & P. Siarry : Electronic component model minimization based on Log Simulated Annealing, IEEE Trans. on Circuits and Systems 41 (1994) 790-795) inductance MMIC Thomson Détermination automatique de la topologie et des valeurs des paramètres : «recuit simulé logarithmique» 54

Hypothèses problème mono-objectif fonction objectif f(x), à minimiser seules contraintes : «contraintes de boîte» : x i MIN < x i < x i MAX Difficultés spécifiques aux problèmes continus : (on parle aussi de «problèmes difficiles», mais sans référence ici à la théorie de la complexité ) pas d expression analytique de f f «bruitée» : - bruit expérimental (exploitation de mesures) - «bruit de calcul» numérique (utilisation d un simulateur de circuits électroniques) gradients de f non accessibles 55

f comporte des non-linéarités existence de corrélations (non précisément localisées) entre variables nombreux minimums locaux besoin d une méthode d optimisation : - «directe» (i.e. sans gradients) : interdit l emploi de méthodes classiques puissantes, de «type Newton» - «globale» (dans le sens suivant : méthode non piégée, en principe, dans un minimum local) N.B. : les termes «global» / «local» ne caractérisent pas ici le type de mouvement utilisé ( par exemple, recuit simulé : à la fois local, par son mécanisme, et global, par sa finalité ) 56

recours aux métaheuristiques, qui sont toutes à la fois «directes» et «globales» - l aspect «direct» des métaheuristiques, lié à leur origine combinatoire, n a pas d attrait particulier dans le cas discret - c est, au contraire, un avantage très important, dans le cas continu «difficile» sauf exception (Essaims particulaires), métaheuristiques conçues / cadre discret nécessité d une «adaptation» aux problèmes continus 57

Quelques écueils de cette adaptation - d ordre «culturel» : applications continues le plus souvent du ressort des sections 61 & 63 du CNU savoir-faire / métaheuristiques : plutôt section 27 informaticiens moins intéressés par les problèmes continus, peu standardisés peu de résultats théoriques - d ordre «technique» : hétérogénéité des domaines de définition des différentes variables variables de gammes très étendues (plus de 10 décades) 58

Confrontation avec les études empiriques des concurrents périlleuse : codes concurrents rarement publics délicat de programmer soi-même les méthodes concurrentes résultats publiés difficilement comparables : - jeux de fonctions de test de domaines d évolution des variables - choix du mode de sélection du point initial du nb d exécutions moyennées / résultat - définitions du «succès» (approche de x*) de l «erreur finale» (en f? en x?) du temps de calcul grand intérêt pour les travaux d E. Taillard : «A statistical test for comparing success rates» : http://www.optimization-online.org/db_html/2003/11/784.html confrontation facilitée, si les concurrents jouent le jeu! 59

La plupart des techniques développées pour adapter une métaheuristique ne sont pas applicables aux autres métaheuristiques En continu, comme en discret, aucune métaheuristique ne semble surpasser ses concurrentes Expérience / 4 métaheuristiques : - recuit simulé - recherche tabou - algorithmes génétiques - colonies de fourmis seules, ou hybridées avec une méthode «directe» et «locale» : l algo. du polytope de Nelder & Mead 60

Notre adaptation au cas continu de 4 métaheuristiques 61

Recuit simulé : cas continu - Il faut gérer la «discrétisation» de l espace de recherche - Procédure (intuitive) possible : variable x i «pas» de discrétisation STEP i : STEP i : variation maximale de x i en un seul «mouvement» STEP i est différent pour chaque variable x i pour STEP i donné, «mouvement» de x i : x i = F (x i, STEP i ) loi F? 62

STEP i doit être ajusté périodiquement, pour «maintenir constante l efficacité» de l optimisation, lorsque T diminue : efficacité : peut être évaluée à l aide : - du taux d acceptation des m vts tentés? - de l amplitude moyenne des m vts déjà effectués? fréquence d ajustement du pas? loi d ajustement du pas? Choix des variables x i concernées par un m vt donné? 63

Pas de résultats théoriques : - pour valider cette procédure intuitive - pour préciser ses diverses options approche empirique systématique, au moyen d une batterie de fonctions de test publiées : 64

Michalewicz (MZ) (n variables) : MZ( x) n = i= 1 sin( x). sin. i x i Π domaine de recherche : 0 x i π, i= 1, n n = 2, 1 minimum global : MZ(x*) = - 1.80 n = 5, 1 minimum global : MZ(x*) = - 4.687 n =10, 1 minimum global : MZ(x*) = - 9.68 2 i 20 Goldstein-Price (GP) (2 variables) : GP(x) = [1 + (x 1 + x 2 + 1) 2 (19-14x 1 + 13x 12-14x 2 + 6x 1 x 2 + 3x 22 ]. [30 + (2x 1-3x 2 ) 2 (18-32x 1 + 12x 12-48x 2-36x 1 x 2 + 27x 22 ] domaine de recherche : -2 x i 2, i = 1,2 ; 4 minimums locaux 1 minimum global : x* = (-1, 0) ; GP(x*) = 3. De Jong F6 (DJ F6) (2 variables) : F6 ( x) = 24 0.002+ 1 1 6 ( x1 Xi) + ( x2 Yi ) i= 01+ i+ 6 X i = [16(i mod 5)-2] & Y i = 16 [integer(i/5)-2] domaine de recherché : -65 x i 65, i = 1,2 ; 25 minimums : (32j, 32k), j, k = -1, - 0.5, 0, 0.5, 1 minimum global : x* = (-32, -32) ; F6(x*) 0.9980 65

Réglage retenu : code disponible (P. Siarry, G. Berthiau, F. Durbin, J. Haussy, ACM Trans. on Math. Softw. 23 (1997) 209-228) STEP i initial : ¼ du domaine de variation de x i STEP i modifié à l issue de chaque palier de T On exploite le taux d acceptation A i des m vts tentés, au cours du palier, pour x i : - si A i > 20%, STEP i est doublé - si A i < 5%, STEP i est divisé par 2 66

Si le domaine de variation de x i est «peu étendu» : x i = x i ± y. STEP i (y : nb. réel aléatoire [0,1]) Sinon (cas de plusieurs décades) : loi logarithmique Les n variables du problème sont modifiées par groupes de p, formés aléatoirement : typiquement, p n/3 Les fréquences de m vt des différentes variables sont égalisées 4 critères complémentaires pour l arrêt du programme 67

Variante, non «directe» Succès, tout particulièrement en électronique (Exemple : IRCOM, Limoges) d une variante du recuit simulé continu : la «diffusion simulée» («Simulated Diffusion» : Aluffi-Pentini et al., J. Optimiz. Theory Appl. 47 (1985) 1-16) Cette méthode a recours, toutefois, aux gradients de f 68

Décroissance adaptative de la température - Etude récente, théorique et expérimentale (E. Triki, Y. Collette & P. Siarry, EJOR 166 (2005) 77-92) - Principaux résultats : plusieurs lois adaptatives classiques, ayant des origines et des expressions mathématiques bien différentes, sont, en pratique, équivalentes : 69

on montre que ce sont des cas particuliers de la loi générique : T k+1 = T k. [ 1 T k. (T k ) / σ 2 (T k ) ] où : σ 2 (T k ) = < f Tk 2 > - < f Tk > 2 (T k ) : dépend de la loi adaptative choisie le choix le plus simple : (T k ) = C te ne correspond à aucune loi classique nous avons montré que ce choix peut être formateur, face à un problème nouveau 70

Recherche tabou : cas continu - Elaboration d un algorithme : code disponible ECTS («Enhanced Continuous Tabu Search») : R. Chelouah & P. Siarry, EJOR 123 (2000) 256-270 - ECTS se veut une transposition directe de la méthode combinatoire - Liste tabou : formée de «boules» centrées sur les dernières solutions retenues 71

- Notion de voisinage d une solution courante : s 0 * s 1 * s 2 * s 3 * espace solution s 2 ' s 1 ' s 2 * par exemple s 3 * = s 2 ' Sélection aléatoire d un point dans chaque «couronne» hyper-rectangulaire liste de voisins 72

Structure générale : (cœur de Tabou non décrit) INITIALISATION de paramètres DIVERSIFICATION détection de «zones prometteuses» liste prometteuse SELECTION de la MEILLEURE ZONE PROMETTEUSE parmi celles de la liste prometteuse INTENSIFICATION à l intérieur de la meilleure zone prometteuse MEILLEURE SOLUTION RENCONTREE 73

Quelques détails sur l algorithme ECTS - diversification : «zones prometteuses» minimum global de f? examen de x : comparaison à tous ses voisins (cœur de Tabou) x «prometteur» s il surpasse «nettement» ses voisins (au sens d un seuil fixé dynamiquement par ECTS) liste prometteuse : «boules» centrées sur les solutions prometteuses - intensification : une nouvelle recherche tabou est lancée à l intérieur de la meilleure zone prometteuse elle opère plus finement (réductions de la dimension de l espace de recherche, et de la taille de la liste tabou) 74

1 0.8 zone prometteuse 0.6 0.4 0.2 0-0.2-0.4 meilleure zone prometteuse optimum global -0.6-0.8-1 -1-0.8-0.6-0.4-0.2 0 0.2 0.4 0.6 0.8 1 Exemple de la fonction B2 : trajet suivi par ECTS (diversification) 75

- Principal écueil de cette approche : le nombre élevé de paramètres de réglage : tailles des listes tabou et prometteuse rayons des boules tabou et prometteuse étendue du voisinage nb de voisins du point courant. etc. - La plupart des paramètres d ECTS sont calculés automatiquement, ou ont été figés «au mieux» empiriquement - Validation expérimentale détaillée d ECTS le temps de calcul croît lentement ( linéairement) en fonction du nb de variables de f 76

Variante hybride (R. Chelouah & P. Siarry, EJOR 161 (2005) 636-654) - La convergence peut être accélérée, en ayant recours à l algo. du polytope de Nelder & Mead : x 3 x 3 x e x r x 3 x 2 x 2 x h x 2 x b x b x b b) réflexion c) extension a) Polytope initial x 3 x h sommet où la valeur de la fonction objectif est MAX x c x 2 x' c x b sommet où la valeur de la fonction objectif est MIN x b d) contraction (x c interne, x c externe) 77

- Les phases de diversification et d intensification sont alternées : DIVERSIFICATION détection d une solution prometteuse affinage de cette solution via l algo. du potytope actualisation de la liste prometteuse 78

Algorithmes génétiques : cas continu - Elaboration d un 1er algorithme : CGA («Continuous Genetic Algorithm») R. Chelouah & P. Siarry, J. of Heuristics 6 (2000) 191-213 code disponible - Particularités de CGA : alternance de phases de «diversification» et d «intensification» réductions dynamiques de la taille de la population, et de l espace de recherche codage réel des individus affiliation parfois débattue : RCGA («Real-Coded Genetic Algorithm») ou EA («Evolutionary Algorithm»)? 79

opérateurs de croisement et de mutation spécifiques réduction dynamique de la probabilité de mutation alternance «diversification» / «intensification» dans CGA : espace des solutions = domaine de recherche meilleur point trouvé effet de «zooms» successifs : * * voisinage d'un individu un individu meilleur point trouvé * nouveau voisinage d'un individu nouvel espace 80

Phase de «diversification» : AG classique, manipulant des individus «opulents» solution prometteuse x* Phase d «intensification» : - nouvel espace de recherche restreint, autour de x* - nouvel AG, avec une population réduite, formée d individus «amaigris» 81

Opérateur de croisement (dénommé «recombinaison» en codage réel) S inspire du croisement mono-point en binaire : individu = vecteur x de dimension n i ème composante de x = i ème variable d optimisation position i du croisement : sélectionnée au hasard les composantes d indice > i sont échangées entre les 2 parents 82

les composantes d indice i subissent des variations opposées : Exemple : n=2, i=2 Individu après recombinaison Individu avant recombinaison Opérateur de mutation affecte la valeur d une seule variable l amplitude maximale de la perturbation, et la probabilité de mutation sont progressivement diminuées (2ème point délicat) 83

Exemple typique de résultat 80 70 Fonction objectif 60 50 40 ECTS CGA 30 20 10 0 0 50 100 150 200 250 Nombre d'évaluations Optimisation de la fonction Goldstein-Price CGA est gagnant au début, mais s essouffle ensuite grand intérêt pour une hybridation 84

On peut effectuer l intensification via l algorithme du polytope : 1 0.9 Fonction objectif 0.8 0.7 CGA SS CHA avec intensification prématurée CHA bien réglée Optimisation de la fonction B2 0.6 0.5 0.4 0.3 0.2 0.1 0 0 1 2 3 4 5 6 7 8 9 10 Nombre de générations (R. Chelouah & P. Siarry, EJOR 148 (2003) 335-348) Principale difficulté : le passage de relais automatique entre les 2 approches 85

Application, au CEA, de la variante hybride : conception optimale d un capteur à courants de Foucault (contrôle non destructif) Atouts majeurs de l optimisation par AG (1) Optimisation «multimodale» On cherche à repérer tous les minimums locaux de f Schéma possible : AG multipopulation (P. Siarry, A. Pétrowski & M. Bessaou, Adv. in Eng. Softw. 33 (2002) 207-213) 86

Algorithme génétique multipopulation Fusion AG AG AG sous-pop 1 sous-pop 2 sous-pop n M I G R A T I O N Module de spéciation (a) Plusieurs AG, manipulant des sous-populations distinctes (b) Fusion, en une population unique, des sous-populations (c) «Spéciation» nouvelle répartition des individus en sous-populations, en fonction de leurs ressemblances (d) Retour en (a) ou arrêt 87

(2) Optimisation «multiobjectif» Thèse de Yann Collette (Univ. Paris 12, déc. 2002) : AG et recuit simulé appliqués à un problème combinatoire «difficile», à EDF : l optimisation des plans de rechargement de combustible nucléaire Problème ouvert, et non confidentiel 88

Colonies de fourmis : cas continu 2 premiers algorithmes en variables continues : CACO (1995, Bilchev & Parmee) API (2000, Monmarché & al.) -Principe de CACO («Continuous Ant Colony Optimization») : diversification : fourmis «globales», chargées de délimiter de grandes «régions» création et évaluation des régions : utilisent les mêmes opérateurs qu un AG intensification : fourmis «locales», affectées aux diverses «régions» dépôt de phéromone : proportionné à l amélioration de f 89

Inconvénients de CACO : - complexe : AG + fourmis - trop de paramètres -Principe de API : S inspire du comportement d une fourmi primitive : «Pachycondyla apicalis» Simule une forme de communication directe entre 2 fourmis : le «tandem-running» amène à rassembler les individus dans les meilleurs sites de chasse Inconvénient de API : N exploite pas de pistes de phéromone pas de «stigmergie» (communication indirecte, via l environnement) 90

Nouvel algorithme : CIAC «Continuous Interacting Ant Colony» (J. Dréo & P. Siarry, Future Generation Computer Systems 20 (2004) 841-856) Thèse de Johann Dréo (Univ. Paris 12, déc. 2004) notre idée est : - de préserver le cadre des colonies de fourmis - d exploiter plusieurs formes de communication Insectes sociaux et communication : (Hölldobler &Wilson : «The Ants». Springer, 1990) «Recrutement» : forme de communication, qui entraîne les individus à se regrouper en un endroit où un travail est nécessaire 91

- recrutement indirect par pistes : Nid Nourriture dépôt de phéromone suivi de piste - recrutement direct interindividuel : exemple : mobilisation Procède par «trophallaxies» : échanges de nourriture liquide entre 2 individus? 92

«Hétérarchie dense» : Hiérarchie Hétérarchie dense Wilson & Hölldobler, Dense Heterarchy and mass communication as the basis of organization in ant colonies. Trends in Ecology and Evolution, 3 (1988) 65-68 93

Principale particularité de CIAC : 2 canaux de communication 1) spots de phéromone mémoire externe / collective = NIVEAU GLOBAL 2) messages entre 2 individus mémoire interne / individuelle = NIVEAU LOCAL 94

Niveau global Diffusion de phéromone Recrutement = f(proximité) Recrutement = f(quantité) Toutes les fourmis impliquées 95

Niveau local Envoi de messages Informations : Amélioration fonction objectif Position zone d intérêt 96

Résultats La synergie entre les deux canaux de communication a été observée empiriquement : En présence des 2 canaux, l écart-type des valeurs de f est plus grand, et présente de plus amples oscillations «auto-organisation», avec alternance : - de phases de diversification (σ grand) - de phases d intensification (σ petit) 97

Validation sur un jeu de 13 fonctions de test «statiques» performances généralement inférieures / autres métaheuristiques 2 orientations actuelles : - (classique) hybridation - application en optimisation continue «dynamique» En optimisation dynamique, on attend une meilleure exploitation de la flexibilité et de l auto-organisation inhérentes à un algorithme de colonie de fourmis 98

Optimisation dynamique temps t temps t + 1 99

Exemple d application de l optimisation continue en Génie biomédical 100

Recalage d angiographies rétiniennes via un algorithme de colonie de fourmis 101

A. Contexte médical Maladies de la rétine cause majeure de cécité à tout âge Dégénérescence Maculaire Liée à l Age (DMLA) Rétinopathie Diabétique (RD) Rétinite à Cyto-Megalo Virus (RCMV) Laboratoire Images, Signaux et Systèmes Intelligents (LiSSi Université Paris 12, Créteil) 10 2 Service Ophtalmologique Universitaire de Créteil (SOUC Hôpital intercommunal, Université Paris 12, Créteil)

A. Contexte médical Imagerie de la rétine Angiographie rétinienne Technique de diagnostic dynamique Acquisition des images Colorant fluorescent Angiographe classique ou Ophtalmoscope à laser Fluorescéine sodium ou Vert d Indo-Cyanine 10 3 Tomographie à cohérence optique Analyseur d épaisseur rétinienne

A. Contexte médical Filtre monochromatique Tâches d hémorragies Filtre monochromatique «Drusens» Techniques de Diagnostic Pathologies Angiographie fluorescéine Vaisseau choroïdien classique ou bien défini 10 4 Angiographie fluorescéine Vaisseau choroïdien occulté ou mal défini

A. Contexte médical Méthode nécessaire pour le recalage d angiographie Recalage des angiographies rétiniennes Mouvements oculaires Fond non uniforme Sphéricité de la rétine Variations de fluorescence Travaux précédents => Recalage par «flot optique» J.C. Nunes, "Analyse multiéchelle d image. Application à l angiographie rétinienne et à la DMLA, Thèse de doctorat, Université Paris 12, Créteil. Décembre 2003. 10 5 J.C. Nunes, Y. Bouaoune, E. Deléchelle, and P. Bunel, "A Multiscale Registration Scheme of Retinal Angiograms". Computer Vision and Image Understanding Journal 95, 2004, pp. 129-149.

B. Recalage des angiographies rétiniennes Méthode proposée Pré-traitement non-linéaire Traitement d image débruitage (filtrage de Wiener) Calcul de gradient gradient morphologique Recalage Critère de similarité somme des carrés des différences d intensité entre images de gradient 10 6 Algorithme de colonie de fourmis modèle de translation à 2 paramètres

B. Recalage des angiographies rétiniennes Méthode proposée 10 7

B. Recalage des angiographies rétiniennes Colonie de fourmis Fonction de similarité 10 8 X Y

C. Résultats Recalage par translation avant recalage après recalage translation 10 9 Angiographie Fluorescéine

C. Résultats 1) Angiographie Fluorescéine avant recalage après recalage 2) 11 0 avant recalage après recalage

D. Conclusion Conclusion robuste face aux variations d éclairement, bruits, contrastes locaux faibles, mouvements oculaires totalement automatique pas d extraction des caractéristiques rétiniennes faible temps de calcul 11 1 temps de calcul peu dépendant de la résolution recalage d images à haute résolution

Quelques pages de publicité pour finir. 112

IEEE Congress on Evolutionary Computation CEC 2005 Edinburgh, UK, September 2-5, 2005 Special Session on Real-Parameter Optimization Prof. Kalyanmoy Deb and A/Prof. P. N. Suganthan epnsugan@ntu.edu.sg Chosen Benchmark functions, evaluation criteria and program files are available from : http://www.ntu.edu.sg/home/epnsugan 113

Sessions organisées dans le cadre des conférences CEC successives CEC 05 CEC 06 CEC 07 CEC 08 CEC 09 CEC 09 Single Objective Optimization Constrained Single Objective Optimization Multi-Objective Optimization Large-Scale Global Optimization Dynamic and Uncertain Environments Constrained Multi-Objective Optimization 114

European Journal of Operational Research Feature Issue on Adaptation of Discrete Metaheuristics to Continuous Optimization Guest editors: Zbigniew Michalewicz and Patrick Siarry Published in volume 185 2008 115

RAIRO Operations Research Feature Issue on Cooperative Methods for Multiobjective Optimization Guest editors: Clarisse Dhaenens, Patrick Siarry and El-Ghazali Talbi Published in volume 42 2008 116

Int. J. of Computational Intelligence Research Feature Issue on Particle Swarm Optimization Guest editors: Maurice Clerc, James Kennedy and Patrick Siarry Published in volume 4 2008 117

European Journal of Operational Research Feature Issue on Metaheuristics in Transportation and Logistics Guest editors: Patrick Siarry and Eric Taillard Published in volume 195 2009 118

Engineering Applications of Artificial Intelligence Feature Issue on Advances in Metaheuristics for Hard Optimization: New Trends and Case Studies Guest editor: Patrick Siarry Published in volume 23 2010 119

Engineering Applications of Artificial Intelligence Feature Issue on Local Search Algorithms for Real-World Scheduling and Planning Applications Guest editors: Raymond Chiong and Patrick Siarry To appear 2011 120

Ouvrage collectif sur les métaheuristiques (sept. 2003) Recuit simulé Recherche tabou Algorithmes évolutionnaires Colonies de fourmis Programmation à mémoire adaptative 3 «études de cas» détaillées 121

Ouvrage collectif sur un domaine d application (mars 2007) Métaheuristiques présentes dans 8 des 13 chapitres mais aussi autres techniques diverses : - 122

Ouvrage collectif sur les colonies de fourmis (déc. 2009) 123

Ouvrage collectif sur un domaine d application (juillet 2010) 124

Groupe META Collaborations nouvelles, via le groupe META, commun aux GdR MACS et RO du CNRS : Animateurs : P. Siarry siarry@univ-paris12.fr E.G. Talbi talbi@lifl.fr http://www.univ-valenciennes.fr/gdr-macs/groupes_details.php?gt=meta 125

Conference chairs: Rachid Chelouah and Patrick Siarry Invited guests James KENNEDY and Maurice CLERC http://icsi11.eisti.fr/ 126