Cartes topographiques neuronales pour l apprentissage par renforcement sur des problèmes de contrôle non-linéaire

Documents pareils
La voix en images : comment l évaluation objectivée par logiciel permet d optimiser la prise en charge vocale

Système de diffusion d information pour encourager les PME-PMI à améliorer leurs performances environnementales

Budget Constrained Resource Allocation for Non-Deterministic Workflows on a IaaS Cloud

statique J. Bertrand To cite this version: HAL Id: jpa

Dessin assisté par ordinateur en lycée professionnel

Notes de lecture : Dan SPERBER & Deirdre WILSON, La pertinence

L indice de SEN, outil de mesure de l équité des systèmes éducatifs. Une comparaison à l échelle européenne

Sur le grossissement des divers appareils pour la mesure des angles par la réflexion d un faisceau lumineux sur un miroir mobile

AGROBASE : un système de gestion de données expérimentales

Program Analysis and Transformation: From the Polytope Model to Formal Languages

Compte-rendu de Hamma B., La préposition en français

Les intermédiaires privés dans les finances royales espagnoles sous Philippe V et Ferdinand VI

Étude des formes de pratiques de la gymnastique sportive enseignées en EPS à l école primaire

Peut-on perdre sa dignité?

Jean-Luc Archimbaud. Sensibilisation à la sécurité informatique.

Les Champs Magnétiques

Comptabilité à base d activités (ABC) et activités informatiques : une contribution à l amélioration des processus informatiques d une banque

La complémentaire santé : une généralisation qui

Sylvain Meille. Étude du comportement mécanique du plâtre pris en relation avec sa microstructure.

Famille continue de courbes terminales du spiral réglant pouvant être construites par points et par tangentes

Un SIG collaboratif pour la recherche historique Partie. Partie 1 : Naissance et conception d un système d information géo-historique collaboratif.

Les déterminants du volume d aide professionnelle pour. reste-à-charge

Sur la transformation de l électricité statique en électricité dynamique

Adaptation et cloud computing : un besoin dabstraction pour une gestion transverse

Un exemple spécifique de collaboration : Le produit-partage

P h i l h a r m o n i s

e-science : perspectives et opportunités pour de nouvelles pratiques de la recherche en informatique et mathématiques appliquées

ISAN System: 5 Œuvre à épisodes ou en plusieurs parties

Jessica Dubois. To cite this version: HAL Id: jpa

Calculer les coûts ou bénéfices de pratiques sylvicoles favorables à la biodiversité : comment procéder?

LIVRAISON DE COLIS ET LOGISTIQUE URBAINE : QUELLES RECOMPOSITIONS DE LA MESSAGERIE EN MILIEU URBAIN?

l Agence Qui sommes nous?

AICp. Vincent Vandewalle. To cite this version: HAL Id: inria

Modèle d évaluation quantitative des risques liés au transport routier de marchandises dangereuses

Probabilités III Introduction à l évaluation d options

curité du patient 19 mai 2009 Aurore MAYEUX Guy CLYNCK LIE

Réseaux sociaux virtuels et création de valeur

ISAN System: 3 Création d un V-ISAN

Condition inf-sup pour l Elément Fini de Taylor-Hood È ¾ -iso-è ½

Services à la recherche: Data Management et HPC *

LES CLAUSES DES CONTRATS DE DETTE DES PETITES ENTREPRISES : CAS DES ENTREPRISES CANADIENNES

UNIVERSITE LYON 3 (JEAN MOULIN) Référence GALAXIE : 4140

Comment régler un litige avec son vendeur de produits financiers?

Perspectives du développement de l énergie solaire en U.R.S.S. : conversion thermodynamique en électricité

Les liaisons intermoléculaires de l eau étudiées dans

Protection de la vie privée basée sur des ontologies dans un système Android

Bourses d excellence pour les masters orientés vers la recherche

Un exemple d étude de cas

PLANIFICATION ET BUDGÉTISATION

ARCHIVES NATIONALES. Versement

Technique RSR /DCo

Introduction au pricing d option en finance

L'important C'est la rose

Association d'agilité du Canada

EMPLOI DU TEMPS du 4 ème SEMESTRE

Compression Compression par dictionnaires

SYSTEMES LINEAIRES DU PREMIER ORDRE

Méthodes de quadrature. Polytech Paris-UPMC. - p. 1/48

Automatisation. Industrialisation des tests

LA CONJONCTION MÊME SI N EXISTE PAS!

Durée de L épreuve : 2 heures. Barème : Exercice n 4 : 1 ) 1 point 2 ) 2 points 3 ) 1 point

MATHS FINANCIERES. Projet OMEGA

PeTEX Plateforme pour e-learning et expérimentation télémétrique


INTELLIGIBILITÉ DE LA PAROLE EN CHAMBRE SOURDE - INFLUENCE DU DIFFUSEUR

AVENIR EMPRUNTEUR. Etude Personnalisée. Caractéristiques du (des) prêt(s) Cotisations ASSURE 1 ASSURE 2. Votre conseiller

La diversification de la mise en valeur traditionnelle des bas-fonds en zone de savane humide du Togo et les conséquences sur l environnement

HAL-Pasteur. La plate-forme d archive ouverte de l Institut Pasteur. Formation au dépôt d articles.

La communication sociétale : entre opportunités et risques d opportunisme

100 % gratuit. inédit.

CURRICULUM VITAE FORMATION. 2001/2002 : Thèse ès sciences de gestion, option marketing, à l IAE de Dijon, Université de Bourgogne :

Lot 4: Validation industrielle. Youness LEMRABET Pascal YIM, 19/11/2010

Les travaux doivent être remis sous forme papier.

PROGRAMMATION MOTRICE ET STRATÉGIES COGNITIVES DANS UNE TÂCHE DE SYNCHRONISATION

Diplômes nationaux de 1er et 2ième cycle avec résultat manquant Année Universitaire : 2011/2012

La vidéosurveillance à l école : du maintien de l ordre à l autodiscipline

La modélisation des déplacements : Qu est ce qu un modèle, pour qui et pourquoi?

Projet Institutional Support to African Climate Initiative (ISACIP) ATELIER DE RENFORCEMENT DE CAPACITÉS Niamey, 17 au 25 mars 2014

Cours A7 : Temps Réel

JRES 2005 : La mémorisation des mots de passe dans les navigateurs web modernes

La régulation du réseau Internet

Master de Bioinformatique et Biologie des Systèmes Toulouse Responsable : Pr. Gwennaele Fichant

Accueil Events, l accueil personnalisé des touristes d affaires Informations, bonnes adresses, réservations et découvertes!

Contrôle d Admission Basé sur un Plan de Connaissance

BTS AG PME PMI LES QUALITES REQUISES

Jean Sykes Nereus, la collaboration européenne, et le libre accès

Fonctions de plusieurs variables, intégrales multiples, et intégrales dépendant d un paramètre

Analyse empirique et modélisation de la dynamique de la topologie de l Internet

La santé de votre entreprise mérite notre protection.

Cheque Holding Policy Disclosure (Banks) Regulations. Règlement sur la communication de la politique de retenue de chèques (banques) CONSOLIDATION

Méthode : On raisonnera tjs graphiquement avec 2 biens.

Les archives de Luc Bérimont à la bibliothèque universitaire d Angers

Cours 02 : Problème général de la programmation linéaire

ATTIJARI MARKET RESEARCH FX & COMMODITIES TEAM

Après la classe de Seconde

Les Réunions d information aux associations

RETHINKING JACQUES ELLUL AND THE TECHNOLOGICAL SOCIETY IN THE 21ST CENTURY REPENSER JACQUES ELLUL ET LA SOCIETE TECHNICIENNE AU 21EME SIECLE

Scroll down for the full contact details of these training centres.

Transcription:

Cartes topographiques neuronales pour l apprentissage par renforcement sur des problèmes de contrôle non-linéaire Emmanuel Daucé, Alain Dutech To cite this version: Emmanuel Daucé, Alain Dutech. Cartes topographiques neuronales pour l apprentissage par renforcement sur des problèmes de contrôle non-linéaire. 10e Colloque Africain sur la Recherche en Informatique et en Mathématiques Appliquées, Oct 2010, Yamoussoukro, Côte d Ivoire. pp.9 P., 2010. <inria-00494164> HAL Id: inria-00494164 https://hal.inria.fr/inria-00494164 Submitted on 22 Jun 2010 HAL is a multi-disciplinary open access archive for the deposit and dissemination of scientific research documents, whether they are published or not. The documents may come from teaching and research institutions in France or abroad, or from public or private research centers. L archive ouverte pluridisciplinaire HAL, est destinée au dépôt et à la diffusion de documents scientifiques de niveau recherche, publiés ou non, émanant des établissements d enseignement et de recherche français ou étrangers, des laboratoires publics ou privés.

rt s t r q s r s rt s t r q s r s r r t ss r r r t s r s r è s trô é r é st t t s s s t té s s s s rt rs té é t rr é 2 P rs 1 rs r t q s t q P r s s 2 t r r és é s rés t s r t t r r ù s t és rè r t ss r r r t t r t t r q s ré ét s à 2 1 tt r t t r st r r à trô r s s2stè s é r s é s s r s s s t s s rés t s s r rs rés t ts t s s tâ tt t s r s t r r t t r s r r t r r t t t r t ts s s r 2 r s t s s r t t r s t r t tr r s2st s t s s r s ts t s r r s 2 r s r tr r t r r t s tr t r r t t q t à trô r s2stè s t r t r s ét t st tâ é ér q t rt s s tér ss s à ss r è s ré té s q t s s tré s rs s s s rt s

t êtr r s s r s s s s 1 ré s s q r t s ss r 1 s 1 t s rt t é ss r s s s r t s s s r sé r s t st r r t ss r r r t tt rt té r t2 r è t t q trô r t à s r r s ré r tés r t t s s q ss r t r ré s s ét s ss q s ss s r r t 2 q s r s t s t s r s rét s t s ét t t s t té s à s r è s r s à s é s t s s rés t s r t t r trô r q ét s rét s t st é ss r s é r s trô r s q s s r t s s t à rs ré s s s ç s tr rt s r trô é r s r tr t r s r è s é r s s s s r s s ét s à 2 ö é 2 t r è t s r s s r s t q r t q ré r ss éq t tr r st rt t s ré r ét s2stè r 1 t rés t 1 r tér st q s rt t s rt s ér s rè r t ss r r r t à q r r tt t s2stè r s s s r r t q trô s q s ét s s t tt rè st s ré tr 1 s s t 1t r rt tt 1t r 1t r rt tt s r s r s à s rt r s s tt s r tt ê r s r s é r s rt r és r r t ss tr rt s tré s trô r s t r é s s r s t s à s r t t r q r t st s ré r r s t s t rt 1 ù r t s s r st tr t s s r tr s t té s t t sés q r t r îtr r st ss t s rr s tr t r s r è s é r s s ét s t2 s t és s t r t t r trô q s rés t s st s t t sté s r r è tt t ù r t r trô r st é r é r rét r t q t s r rs t sts st r s ts s r P r s s t t ré s r r s t r q à trô r é r ss q t tr s q t r q r t t r r r è é r té s tré s s rés t ts s t ét és s t t r t rt trô r r à r s é r s st s t q s s èr trô r r s s à tré t s x t r s t ré s s r t r y t st r r

t s tré rs s s rt y = f(x) s 2 t q t s r s ré s s r R s r s trô r s t st st q s t é r s s s s ù r ré s 2 é é r t s éré rs tré s t té r st r étré r t r s W s t t h r t h = Wx T ù W st t r s t x st t r st t é s tré s r ré s r st s t t t r é t r é ss t à r tré é rt t2 σ ré s r t y = h+n(0,σ 2 ) = Wx T +N(0,σ 2 ) r t r t ss rs r t ss s r ètr s s r s s t és r é r r ré s trô r s s s r s s t s à r à q s t s s r P 2 r t s W t = W t 1 +αr t Wt 1 logp Wt 1 (y t x t ) ù α ]0, 1[ st t r t ss t ér t r r t 1 t s tt rè s à r r é t r z s t r N(m,σ 2 ) s s té r té s 1 r r Pr(z) = 1 σφ(z m) ù Φ(z) = 1 2π exp( 1 2 z2 ) rs z Φ(z) = z.φ(z) t s t tt r r été t t q W logp W (y x) = WP W (y x) P W (y x) T = x(y Wx ) σ 2 P W (y x) P W (y x) = W(y Wx T ) y N(Wx T,σ 2 ) P W (y x) = (y h)x σ 2 rè r t ss s é r t W t = W t 1 +α r t σ2(y h)x. Pr r étés rè r t ss s ét s P 2 r t s t s ét r t st s t q t rè q s r s s rés t s r r étés r s à r tr é r r rs s s s r s rrés r t rt r t r t t t ss r r t st r t t é s é rt t2 s r t st s r t r t t s

s st ré s 2 s tr t rt èr r t s ré s t êtr éq t tâ q s t r Pr t s tré s s r rt t r q ès rs q t à st r st é r q rr s 1 s tér ss ts t ttr r str té s t à r r t s é r t s s r s s str é é é s té s à t rs s rts s st t à r t r s é s tré s r s s r s s r q 1 st é é r s tré s 1 s rt s st très r t r ss t s st t îtr sé râ 1 r r étés s t s 2 t sé s ö t r q r t rt t r q r rés t r t èr s t q tré x st r té s r s t s à s r s rés t s rs s rèt tt r t r s tré s s s t s s rt r s t q t r sés s r à 1 s s q r i ré t r st t tré (x i 1,x i 2) t s s ré t rs s t ré rt s ré èr t s r rt 1 s s rsq st s (x 1,x 2 ) st rés té q r r t s t ttr r t té s t 2 y i = K((x 1,x 2 ) (x i 1,x i 2)) r t s (x 1,x 2 ) s r s t s 2 1 s 2 1 t2 q t s s s t s 2 1 ss s r Pr r étés t r q P r r rt à s r r r r t t r q rt s r r st ss r t st s é r s r s r t r s s s rs tr 1 s t é t 1 r t r st t t ê rés t s r rt t r q s r ré s r t st é à t r s rs ss s r r rs q s rt t r q tt ré s st é r r s rt t q t r s rs ss s r ét t rt r st ss 2 r s ré sé t r t

X 1 i S =f( X 1 ) S i i S =f( X 2 ) X 2 X 2 X 1 r t r q t s r st s (0.55, 0.25) st r rés té r s rs r s t s s ré t rs s t ss s s t r q à t r 1 r s rs f(0.55) t f(0.25) s s r à r t t à r t t rs s tâ q s s t sé r r tr r st s ré r t ss s s s s rs t tt tâ ssè r tér st q r t r r tr s r t é r é r tèr s tr rét rés t rt t tr rét t r s t à ér ér tt tâ r st s t r t str r s r r étés tr r t tr s2stè t r r à trô r s é ts s2stè r tt r é t t st é sé r t q s tré s tr trô rs s r t s ts (x 1,x 2,ẋ 1,ẋ 2 ) ù (x 1,x 2 ) r rés t s t t t (ẋ 1,ẋ 2 ) s t ss s rt trô r t r r s (u 1,u 2 ) r tt t é r s2stè s tr s t trô r st r r ré s s r ss s t à s r c 1 = x 1 +ẋ 1 t tc 2 = x 2 +ẋ 2 t ù t = 500 s tré s2stè s s ér s 1 s ér ts s tré r tr s2stè s r tré st st t é r s r s ts P t s t S (P) = (x 1,x 2 ) r s t t ss S (V) = (ẋ 1,ẋ 2 ) t r q tré st t é rt s t r q s 16 16 r s

256 r s r P r é s s r s tr t r s ss t r é r 2 2 ss s r s st ρ = 0.125 256 r s r r é s s r s tr t r s ss t r é 2 2 ss s r s st ρ = 0.125 s s s éré s rét é r ù s t s t (x 1,x 2 ) st r t t tr s s trô r t rét r t q r q s t (x 1 = r.cos(θ),x 2 = r.sin(θ)) st é r é ( rcos(θ), rsin(θ)) r = log(1+b.r) log(1+b) t B = 4 rt s2stè s r s P t r tt t r t t s r s r s s rt q s s s r s t rs 2 4 r s t rs t r s t t r s r t s t s r t tr t t (π/2,π,3π/2,2π) s s s s s r s st r té s r s r s t rs h (M) = W (P) S (P) +W (V) S (V). ré sé s t s rt s r s t rs st rés t t t r é t r i,s (M) i h (M) i +N(0,σ) ù σ = 0.01 tr st s s s rt s s r s u 1 = 4 i=1 r t ss S (M) i cos(iπ/2) u 2 = 4 i=1 S (M) i sin(iπ/2). q tér t s2stè t tré st t ré é t r t s r N(0, 0.3) tt tré trô r r t é t (u 1,u 2 ) q t r îtr s r rét à s t e = (e 1,e 2 ) st tt s t tr r èr (0,0) st s r rr r t r t é ér r s ré s é t R = 0.2 e t α = 0.01 σ2 16 t à r s s s W (P) t W (V) t = W (P) t 1 + αr t σ 2 (S(M) t W (P) T t 1 S(P) (P) t )S t = W (V) t 1 + αr t σ 2 (S(M) t W (V) T t 1 S(V) (V) t )S t.

r rr r r t ss t s rr rs r t ss s t à rès t t r tér t s s s 1 s t r q é r à t r t q à r t st ré s r és t ts t s ss r r t r é t s rr rs r t ss r s ér ts t2 s t 3.10 6 1 s 2 q rr r 2 é s r êtr ss t s r s 500 r èr s tér t s t t r q st sûr st q s s rét r t q t s s trô r é r tt t s t ré s t r tèr é r tr s r t éré s s trô r t r q r st t rr r rés q r t s r s s s q s t s s r rés té s s s r t ss r st r r r ss P r st r ré s s 1 trô rs s r ré s q trô r à s s s ér t s t s ér t s r t s t ss s t r é tt ré s q t r 1 s rés t ts és rés ré s trô r é é t r à s r rés t t tt s t t s s s s t s r st é s s r s s s s t s s st é s s s 1 s s t és s 3 é r r t s t rr t t r s s st t é t é à t ss st rr t s r trô r à t r q ré s st ré s r s t t s s s s r s t é r s s s 2 s t s s st é r s r s s s st t é t é à t ss st ss rr t

r Pré s trô rès r r s t st s ér ts trô rs s s s ér t s t s t ss à s t à r t r s r t t t r q s s r 1 q t s é ts és rés r t s rt st s s s rés té r t t r trô r q s ss t t s r r t ss r r r t r t à q r é r st st q rés tr r t t r t s t r q s r t s s ré r s t rt 1 t q r t s r r st ss s r rés t t s ts s r s tt r t t r t été t stés s r 1 trô s s ss 3 é ér q s rés t ts t s q ré r s s rt t s é s 1 r r s t t t tt r t t r s rs t s rt s r s tr 1 s t r s s t s rs s rt s t t q r 1 r t s ts t sés P r s s t s r s ré s s s r t s r r s tâ ré ss t r t r é s s t s s s ss ss 2 r 1 r r é s r s tés 1 r t t t ss r r t ss q r str t r r s t st r s rt s rt s r s t

ss té t s r s r s s é s r r t t r t r tr r t t r à s r è s s 1 s r 1 trô r s s rs rés rté r ts t rt st r t ér t s P é ér s rt tt 1t r rt tt P 1t r s2 t t s s r s t t r r rt s tr t rs t2 rr str 1t r rt tt 1t r rt tt P r t r P P s r t r t s t Pr t t r t r r s t r s t r t s s rt ts t r t s 2r s ö ö r t r s Pr ss r tt rt tt rt r r r Pr ss r r t s s st t st r t r t s r t st r r t r r