Assistance à la saisie en milieu non structuré



Documents pareils
Remboursement d un emprunt par annuités constantes

Les jeunes économistes

EH SmartView. Identifiez vos risques et vos opportunités. Pilotez votre assurance-crédit. Services en ligne Euler Hermes

Plan. Gestion des stocks. Les opérations de gestions des stocks. Les opérations de gestions des stocks

Montage émetteur commun

Editions ENI. Project Collection Référence Bureautique. Extrait

Réseau RRFR pour la surveillance dynamique : application en e-maintenance.

En vue de l'obtention du. Présentée et soutenue par Meva DODO Le 06 novembre 2008

Integral T 3 Compact. raccordé aux installations Integral 5. Notice d utilisation

Interface OneNote 2013

Pourquoi LICIEL? Avec LICIEL passez à la vitesse supérieure EPROUVE TECHNICITE CONNECTE STABILITE SUIVIE COMMUNAUTE

Fiche n 7 : Vérification du débit et de la vitesse par la méthode de traçage

Pour plus d'informations, veuillez nous contacter au ou à

Terminal numérique TM 13 raccordé aux installations Integral 33

Dirigeant de SAS : Laisser le choix du statut social

Contrats prévoyance des TNS : Clarifier les règles pour sécuriser les prestations

Pro2030 GUIDE D UTILISATION. Français

Calculer le coût amorti d une obligation sur chaque exercice et présenter les écritures dans les comptes individuels de la société Plumeria.

MÉTHODES DE SONDAGES UTILISÉES DANS LES PROGRAMMES D ÉVALUATIONS DES ÉLÈVES

L enseignement virtuel dans une économie émergente : perception des étudiants et perspectives d avenir

DES EFFETS PERVERS DU MORCELLEMENT DES STOCKS

Système solaire combiné Estimation des besoins énergétiques

LE RÉGIME DE RETRAITE DU PERSONNEL CANADIEN DE LA CANADA-VIE (le «régime») INFORMATION IMPORTANTE CONCERNANT LE RECOURS COLLECTIF

COMPARAISON DE MÉTHODES POUR LA CORRECTION

VIELLE Marc. CEA-IDEI Janvier La nomenclature retenue 3. 2 Vue d ensemble du modèle 4

Mesure avec une règle

P R I S E E N M A I N R A P I D E O L I V E 4 H D

UNIVERSITÉ DU QUÉBEC À MONTRÉAL L ASSURANCE AUTOMOBILE AU QUÉBEC : UNE PRIME SELON LE COÛT SOCIAL MARGINAL MÉMOIRE PRÉSENTÉ COMME EXIGENCE PARTIELLE

INTERNET. Initiation à

GENESIS - Generalized System for Imputation Simulations (Système généralisé pour simuler l imputation)

Paquets. Paquets nationaux 1. Paquets internationaux 11

Prise en compte des politiques de transport dans le choix des fournisseurs

En vue de l'obtention du. Présentée et soutenue par Elayeb Bilel Le 26 juin 2009

GUIDE D ÉLABORATION D UN PLAN D INTERVENTION POUR LE RENOUVELLEMENT DES CONDUITES D EAU POTABLE, D ÉGOUTS ET DES CHAUSSÉES

1 Introduction. 2 Définitions des sources de tension et de courant : Cours. Date : A2 Analyser le système Conversion statique de l énergie. 2 h.

I. Présentation générale des méthodes d estimation des projets de type «unité industrielle»

Des solutions globales fi ables et innovantes.

Analyse des Performances et Modélisation d un Serveur Web

METHODE AUTOMATIQUE POUR CORRIGER LA VARIATION LINGUISTIQUE LORS DE L INTERROGATION DE DOCUMENTS XML DE STRUCTURES HETEROGENES

TABLE DES MATIERES CONTROLE D INTEGRITE AU SEIN DE LA RECHERCHE LOCALE DE LA POLICE LOCALE DE BRUXELLES-CAPITALE/IXELLES (DEUXIEME DISTRICT) 1

ErP : éco-conception et étiquetage énergétique. Les solutions Vaillant. Pour dépasser la performance. La satisfaction de faire le bon choix.

Exercices d Électrocinétique

22 environnement technico-professionnel

RAPPORT DE STAGE. Approcher la frontière d'une sous-partie de l'espace ainsi que la distance à cette frontière. Sujet : Master II : SIAD

STATISTIQUE AVEC EXCEL

IDEI Report # 18. Transport. December Elasticités de la demande de transport ferroviaire: définitions et mesures

Corrections adiabatiques et nonadiabatiques dans les systèmes diatomiques par calculs ab-initio

Le Prêt Efficience Fioul

Chapitre 3 : Incertitudes CHAPITRE 3 INCERTITUDES. Lignes directrices 2006 du GIEC pour les inventaires nationaux de gaz à effet de serre 3.

CREATION DE VALEUR EN ASSURANCE NON VIE : COMMENT FRANCHIR UNE NOUVELLE ETAPE?

Mots-clés : Système multicapteurs, Réseau local, Réseaux de neurones, Supervision, Domotique. xigences système d'une nouvelle

Parlons. retraite. au service du «bien vieillir» L Assurance retraite. en chiffres* retraités payés pour un montant de 4,2 milliards d euros

ACTE DE PRÊT HYPOTHÉCAIRE

Professionnel de santé équipé de Médiclick!

Contact SCD Nancy 1 : theses.sciences@scd.uhp-nancy.fr

Comparative performance for isolated points detection operators: application on surface defects extraction

BTS GPN 2EME ANNEE-MATHEMATIQUES-MATHS FINANCIERES MATHEMATIQUES FINANCIERES

Surveillance temps-réel des systèmes Homme-Machine. Application à l assistance à la conduite automobile

Assurance maladie et aléa de moralité ex-ante : L incidence de l hétérogénéité de la perte sanitaire

THESE. Khalid LEKOUCH

Stéganographie Adaptative par Oracle (ASO)

Les méthodes numériques de la dynamique moléculaire

Be inspired. Numéro Vert. Via Caracciolo Milano tel fax

ÉLÉMENTS DE THÉORIE DE L INFORMATION POUR LES COMMUNICATIONS.

Driss HARRIZI. MOTS CLES : contrôle de gestion - système d'éducation et de formation système d information - établissement public.

EURIsCO. Cahiers de recherche. Cahier n L épargne des ménages au Maroc : Une analyse macroéconomique et microéconomique.

hal , version 1-14 Aug 2009

Faire des régimes TNS les laboratoires de la protection sociale de demain appelle des évolutions à deux niveaux :

Prêt de groupe et sanction sociale Group lending and social fine

Les déterminants de la détention et de l usage de la carte de débit : une analyse empirique sur données individuelles françaises

CHAPITRE 14 : RAISONNEMENT DES SYSTÈMES DE COMMANDE

La théorie classique de l information. 1 ère partie : le point de vue de Kolmogorov.

La Quantification du Risque Opérationnel des Institutions Bancaires

CATALOGUE EXCLUSIF TOUCH MEDIA CATALOGUE DE SITES FORMATS GLOSSAIRE. Notre sélection de supports en représentation exclusive au Maroc

Les déterminants de la détention et de l usage de la carte de débit : une analyse empirique sur données individuelles françaises

Coefficient de partage

Impôt sur la fortune et investissement dans les PME Professeur Didier MAILLARD

LICENCE DE SCIENCES PHYSIQUES UV 3LSPH50. Année MODÉLISATION. Recherche des paramètres d'une représentation analytique J.P.

Evaluation de performances d'ethernet commuté pour des applications temps réel

Q x2 = 1 2. est dans l ensemble plus grand des rationnels Q. Continuons ainsi, l équation x 2 = 1 2

1. Les enjeux de la prévision du risque de défaut de paiement

Manuel d'installation du système

Grandeur physique, chiffres significatifs

INTRODUCTION. Jean-Pierre MAGNAN Chef de la section des ouvrages en terre Département des sols et fondations Laboratoire central

Ecole Polytechnique de Montréal C.P. 6079, succ. Centre-ville Montréal (QC), Canada H3C3A7

santé Les arrêts de travail des séniors en emploi

REPUBLIQUE ALGERIENNE DEMOCRATIQUE ET POPULAIRE MINISTERE DE L ENSEIGNEMENT SUPERIEUR ET DE LA RECHERCHE SCIENTIFIQUE. MEMOIRE Présentée à

1.0 Probabilité vs statistique Expérience aléatoire et espace échantillonnal Événement...2

APPROXIMATION PAR RÉSEAUX À FONCTIONS RADIALES DE BASE APPLICATION À LA DÉTERMINATION DU PRIX D ACHAT D UNE

- Acquisition de signaux en sismologie large bande. - Acquisition de signaux lents, magnétisme, MT.

GATE Groupe d Analyse et de Théorie Économique DOCUMENTS DE TRAVAIL - WORKING PAPERS W.P Préférences temporelles et recherche d emploi

The new Art of Smart. Loewe Art. La nouvelle intelligence télévisuelle.

TRAVAUX PRATIQUES SPECTRO- COLORIMETRIE

UNE ETUDE ECONOMÉTRIQUE DU NOMBRE D ACCIDENTS

Chapitre IV : Inductance propre, inductance mutuelle. Energie électromagnétique

Afflux de capitaux, taux de change réel et développement financier : évidence empirique pour les pays du Maghreb

Performances de la classification par les Séparateurs à Vaste Marge (SVM): application au diagnostic vibratoire automatisé

Généralités sur les fonctions 1ES

Les prix quotidiens de clôture des échanges de quotas EUA et de crédits CER sont fournis par ICE Futures Europe

Séparation de Sources par lissage cepstral des masques binaires

Transcription:

Assstance à la sase en mleu non structuré R. Gharb 1, N. Rezzoug 1, P. Gorce 1 P. Hoppenot 2, E. Colle 2 1 Laboratore ESP EA 3162 Unversté de Toulon et du Var BP 20132, 83957 La Garde gorce{rezzoug, gharb}@unv-tln.fr Résumé Dans cet artcle, nous présentons une méthode d apprentssage de la confguraton du bras MANUS mplanté sur la plateforme APRH lors de la sase d un objet. Fondée sur le prncpe de sem ou co-autonome, elle explote des nformatons fournes par l utlsateur et permet de l assster pour l accomplssement des tâches fastdeuses lors de l utlsaton du MANUS en mleu non structuré. Des résultats de smulaton llustrent les performances de la méthode. 1. Introducton Depus mantenant plus de tros décennes, le développement d ades technques robotsées a perms d amélorer de manère sgnfcatve l autonome des personnes à moblté très rédute. Dans cette optque, pluseurs systèmes robotques ont été développés. On en dénombre tros catégores : les statons de traval fxes (RAID, AFMASTER, [2]), les télémanpulateurs montés sur fauteul roulant (MANUS [4, 6]), et enfn, les télémanpulateurs sur base moble (MOVAID [3], APRH [9, 10]). Ces derners représentent la soluton la plus complexe, mas auss la plus souple dans le but d amélorer les performances de l' assstance à la manpulaton. L utlsaton de systèmes robotques par les personnes à moblté rédute ndut un certan nombre de partculartés. Ans, ls nécesstent : 1. Une bonne adéquaton entre leur commande et les capactés physques et cogntves de l utlsateur (ne pas surcharger l utlsateur de commandes complquées et fastdeuses), 2. une utlsaton combnée des capactés de l utlsateur et du système robotque de manère satsfasante (sem ou co-autonome), Une des fonctonnaltés souvent demandée par les utlsateurs potentels est de pouvor utlser leur robot dans des envronnements varés (à l ntéreur ou à l extéreur du domcle) [2, 7, 11]. Ans, les challenges à relever par la robotque de réhabltaton sont la 2 Laboratore Systèmes complexes IUP d Evry 40 rue du Pelvoux 91020 Evry hoppenot{colle}@up.unv-evry.fr navgaton et la prse d objet en mleu non structuré. En effet, dans ces condtons, la programmaton autonome d un robot n est pas possble et ses mouvements dovent être commandés manuellement par l utlsateur. Cec engendre une charge cogntve et physque supplémentares qu peuvent consttuer un fren psychologque à l utlsaton d un système robotsé. Afn de paller à cette dffculté, une voe ntéressante consste à fare exécuter de manère sem-automatque une parte de la tâche par le robot et, ans, lasser l utlsateur gérer les problèmes de haut nveau. Cec présente un double avantage : 1. l utlsateur est parte prenante dans le déroulement de la tâche, 2. l ne gère pas la commande manuelle fastdeuse pusque celle-c est dédée au robot. Dans ce cadre, nous proposons une méthode basée sur l apprentssage par renforcement afn de défnr de manère sem-automatque la confguraton d un robot MANUS lors de la sase d objets en mleu non structuré. 2. Archtecture du système ARPH Le système d' assstance ARPH est composé d un robot d assstance et d une staton de commande (Fg. 1). Staton de commande Robot d' assstance Fgure 1: Staton de commande et système robotsé L'utlsateur plote à dstance le robot à l'ade d'une staton fxe composée d'un organe de commande adapté aux capactés résduelles de la personne, d'un écran qu affche l'mage envoyée par la caméra et dfférents types d'nformaton nécessares à la commande (Fg. 2). 1/6

nveau d'attenton ou une dffculté de reprse en man des commandes. ARPH propose une sem-autonome varable centrée sur une coopératon homme-machne fasant appel à un ensemble de fonctons automatques adaptées aux crtères spécfques du domane de l assstance [1]. 2.3. Modes et stratéges pour le déplacement Fgure 2: Staton de commande et de contrôle. L'utlsateur est asssté pour agr et percevor par des technques trées du domane de la réalté vrtuelle et de la réalté augmentée. 2.1. Structure du robot Le robot ARPH, composé d'une base moble portant un bras manpulateur, est capable de se déplacer en évtant des obstacles, de sasr des objets usuels et d'aller explorer les dfférentes pèces du domcle. Le chox des éléments composant le robot moble correspond à un comproms entre pluseurs crtères notamment le coût, la fablté, la mantenablté. Les composants matérels sont pour l essentel, des produts du commerce [9]. La caméra orentable joue un rôle partculer pusqu'elle ntervent dans tros fonctons : le retour d'nformaton vdéo à l'utlsateur, la localsaton du robot dans le domcle et la commande du robot. 2.2. Commande du système ARPH Dans le domane de l assstance, la personne est parte prenante du servce que lu rend la machne [10]. Se pose le problème d'une coopératon entre la personne et la machne sem-autonome, chaque entté pouvant être consdérée comme "handcapée" au sens où ses moyens ne permettent pas d'effectuer complètement une tâche donnée. Le robot d'assstance est doté d'un ensemble de fonctons automatques destnées à lu assurer une certane autonome en respectant les mpératfs de coût et de complexté. Cependant, s on se fxe un nveau de complexté donné, toutes les tâches ne peuvent être automatsées. De plus, ben que l automatsaton at la proprété de rédure la charge de traval de l opérateur, elle ne présente pas mons des effets subversfs, tels qu une dmnuton du L exemple se lmte au déplacement du robot mas peut être étendu à la sase d objets. On dstngue tros types de modes: a) automatque, le robot est commandé par le système, b) manuel, l'utlsateur plote à dstance le robot, c) partagé, la commande du robot est partagée entre la machne et l'utlsateur. On peut cter en exemple le mode dans lequel la personne désgne la drecton à suvre tands que le robot évte localement les obstacles. Il exste actuellement dfférents modes de commande mplantés sur le robot dont le nveau d automatsaton est plus ou mons élevé. Cec a été réalsé volontarement, dans le but de fournr à l opérateur une souplesse optmale dans sa coopératon avec la machne. 2.4. Comportements de type human Pour évter que l'utlsateur sot projeté en dehors de la boucle de contrôle de la machne et fare en sorte qu'l reste la parte centrale du système Homme-machne, l dot être actvement mplqué dans la tâche, même s celle-c est partellement automatsée, et adéquatement nformé sur l état général de l actvté autonome. Une approche consste à donner un comportement de type human aux opératons automatques exécutées par le robot. C est dans ce sens qu ont été élaborés les dvers nveaux d automatsaton ntégrés aux modes de commande automatques ou partagés du robot, qu sont brèvement présentés dans les paragraphes suvants. Tout d abord, les modes de navgaton à domnante manuelle dans lesquels la personne plote drectement à dstance le déplacement du robot. Pour cela, la personne reçot comme retour d nformaton une mage vdéo à partr de la caméra embarquée et dfférents ponts de vue vrtuels destnés à précser les postons relatves des objets de la pèce (robot, portes, meubles, ). Dans ce mode, la charge de traval de l opérateur peut-être abassée en enclenchant la procédure d'évtement des obstacles à l'ade des capteurs télémétrques ultrasonores, l utlsateur n ayant qu à défnr la drecton vers la destnaton. D'autres modes partagés peuvent être magnés par exemple celu basé sur le comportement human d antcpaton vsuelle. Avec les modes de navgaton à domnante vsuelle, l utlsateur plote ndrectement le 2/6

robot va la caméra en utlsant le même prncpe qu'une personne qu se déplace selon la drecton de son regard. L'objectf, une drecton à suvre ou un objet à sasr, est à désgner par la personne qu utlse la caméra comme un organe de commande. La lo de commande qu le l'orentaton de la caméra à la drecton de déplacement du robot dépend du mode. Une lo smple consste à algner l'axe du robot le long de la drecton vsuelle. L'automatsaton permet également de dmnuer la charge humane de traval en utlsant une foncton de suv automatque d'objet. Une des utlsatons potentelles est le suv d'un objet en mouvement comme par exemple un fauteul roulant. Cependant ce type de mode qu semble très attractf est à affner pour prendre en compte des actons complémentares comme la phase d'approche ou l'usage momentanée de la caméra pour une rapde exploraton de la pèce. Enfn, on termnera par le mode de commande le mons lourd du pont de vue de la charge mentale, qu on pourrat baptser le mode de navgaton automatque. Dans celu-c, l opérateur n a qu à désgner un pont sur la représentaton schématque de la pèce. Par la sute, le programme établt automatquement la trajectore déale que va suvre de manère totalement autonome le robot. Cec dt, l reste mportant de noter qu en dépt de son fable coût cogntf, ce mode est lon d attendre les performances enregstrées avec les modes précédents. Outre la navgaton de la plate-forme moble, la foncton de sase revêt une mportance crucale. Dans la parte suvante, nous envsageons une méthode permettant sa mse en œuvre dans un envronnement non structuré. 3. Assstance à la sase Le manpulateur MANUS est doté de 6 degrés de lberté (Fg. 3) qu permettent de placer son organe effecteur dans la confguraton désrée. H H L 2 L 3 Fgure 3: Mobltés du manpulateur MANUS. Lors de la sase d un objet dans un envronnement non P L 1 structuré, le mouvement à effectuer comporte pluseurs phases : 1. une phase durant laquelle le préhenseur est amené au vosnage de l objet 2. une phase de sase où sont effectués des ajustements précs afn d orenter le préhenseur de manère adéquate. Cette dernère phase peut nécesster des mouvements assez fns et fastdeux s ls sont effectués en contrôle manuel. Afn de rédure la pénblté de cette tâche, nous nous proposons d automatser la phase de sase en travallant au vosnage de la confguraton adoptée manuellement lors de la phase d approche. Plus précsément, nous défnssons la confguraton angulare des dfférentes artculatons afn de placer le préhenseur dans une confguraton adéquate pour la sase. Ce problème est rendu dffcle car l possède pluseurs solutons qu dépendent de nombreux facteurs lés à l objet, au préhenseur et à la tâche. 3.1. Méthode Du fat de la précson du MANUS, cette opératon est rendue dffcle par l utlsaton d une commande classque. En effet, ces dernères nécesstent une connassance précse des données du problème. De plus, afn d dentfer l objet à attendre, l est nécessare d avor des nformatons provenant d une caméra, ce qu peut complquer notorement la tâche à accomplr. De ce fat, l semble mportant que la quantté d nformatons dsponble pour le contrôle sot la plus fable possble évtant ans la mse en œuvre de moyens nformatques trop mportants. Afn de tenr compte de ces deux ponts, nous consdérons que la phase d ajustement consste à fare correspondre deux ponts défns sur la surface de l objet et un pont stué sur chacun des mors de la pnce du MANUS. De cette manère, on gère non seulement les contrantes ndutes par le postonnement mas auss par l orentaton du repère du préhenseur par rapport au repère de l objet. De plus, on lmte les nformatons nécessares à la connassance de la poston de deux ponts dans l espace. L utlsaton d un formalsme d apprentssage par renforcement semble ben adapté pour résoudre ce genre de dffculté [5]. En effet, l est basé sur une recherche de soluton par essa erreur afn de défnr une confguraton adéquate à partr d un modèle du préhenseur qu peut être de fable précson. 3/6

Dfférentes technques basées sur ce prncpe ont été développées [5] et applquées [8]. On en dstngue prncpalement 2 types : les méthodes drectes et ndrectes. Ces dernères sont basées sur la constructon du modèle du processus à contrôler. A partr de ce modèle, l est possble d évaluer les actons entreprses afn d amélorer les performances. Dans le cadre des méthodes drectes, les nformatons pertnentes pour l apprentssage sont obtenues en perturbant le système de manère aléatore. Ans, une recherche stochastque de la soluton est effectuée. Cette technque semble très ntéressante car elle ne nécesste pas la constructon du modèle de l acton à accomplr, tâche qu peut être très dffcle. Sur la base de ces remarques, nous avons chos d utlser un méthode drecte qu est smple à mplémenter et qu donne de bons résultats. Celle-c passe par la mse en œuvre d un réseau de neurones multcouches dont l archtecture est défne dans la Fg.4. Confguraton du MANUS à l nstant t - Calcul du renforcement + - + Réseau pour la confguraton du MANUS Calcul de la poston des 2 ponts sur l objet Calcul de la poston des ponts sur chaque pnce Confguraton Poston de la pnce du MANUS à l nstant t +1 Cnématque drecte du bras Fgure 4: Archtecture du modèle de défnton de la posture du MANUS. Elle fonctonne de la manère suvante : 1. L entrée du réseau est consttuée par un vecteur qu comprend la dernère poston et vtesse des artculatons du robot. En sorte de ce réseau nous obtenons la nouvelle confguraton du bras, 2. A partr de la nouvelle confguraton du bras, on calcule la poston et orentaton de la pnce du MANUS. 3. A partr de cette dernère, on calcule la poston dans un repère global des ponts défns sur chaque mors de la pnce du MANUS. 4. On calcule la dstance entre les deux ponts défns sur la surface de l objet et le mors correspondant. 5. A partr de ces 2 dstances, on calcule la foncton d évaluaton de la posture et la valeur de renforcement, en découlant. Celle-c est utlsée pour mettre à jour les paramètres du réseau de neurones. 6. On rétère cette procédure jusqu à ce qu une soluton satsfasante sot obtenue ou que le nombre maxmum d tératons maxmum sot attent. Nous cherchons à optmser le placement de la pnce par rapport à l objet. Nous effectuons cette tâche en mnmsant la dstance entre deux ponts stués sur les mors de la pnce et deux ponts stués de part et d autre de l objet. Ans on défnt PX D D D D ( x y z ) =,, le vecteur des coordonnées d un des ponts défns sur la pnce du MANUS dans le repère global au pas de temps k. PX M T ( x M y M M z ) =,, représente la poston des ponts défns sur la surface de l objet. L erreur total au pas de temps est : E 2 D M k = PX PX = 1 3.2. Résultats de smulaton Dans cette secton, nous présentons des résultats de smulaton relatfs à la sase d un objet de forme paralléléppédque dans une confguraton «basse» qu smule un objet posé au sol et dans une confguraton «haute». Dans la Fg. 5 est représentée la posture fnale adoptée pour sasr l objet en poston «basse». Les graphques de la Fg. 6 (renforcement et écart-type) décrvent l évoluton des paramètres d apprentssage qu montrent la capacté du modèle à découvrr la confguraton adéquate. Au fur et à mesure que l apprentssage s opère, la valeur de renforcement ou récompense augmente graduellement ndquant que la tâche s effectue de meux en meux. Le paramètre d exploraton représenté par la valeur de l écart type dmnue ndquant que l algorthme restrent la talle de l espace où l recherche la soluton accélérant ans son apprentssage. Dans la Fg. 7 et 8 nous présentons les mêmes résultats pour la deuxème poston de l objet. A nouveau, on a une augmentaton de la récompense, une dmnuton de l erreur et de l écart type (Fg. 8) attestant du succès de la tâche (au sens du crtère chos). 4. Concluson La sem ou co-autonome est un concept qu pourrat T (1) (2) (3) 4/6

contrbuer à une melleure acceptaton et effcacté des robots à l usage des personnes attentes de défcences. Nous en avons proposé une applcaton dans cet artcle dans la cadre de la préhenson. Les prochanes étapes consstent à effectuer l ntégraton des fonctons de sase mas auss de navgaton afn de postonner non seulement le bras dans une confguraton, mas auss la base moble sur laquelle l est mplanté. Ans, on peut rendre plus convvale et asée leur utlsaton dans un envronnement non structuré. Fgure 7: Confguraton fnale du robot MANUS pour la sase d un objet en hauteur. 1.5 Ecart type Erreur (m) Fgure 5: Confguraton fnale du robot MANUS pour la sase d un objet au sol. 1 0.5 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 Ecart type 0 0 100 200 300 400 500 600 700 800 900 1000 pas Fgure 6: Evoluton du renforcement et de l écart type pour la premère tâche. 0 0 20 40 60 80 100 120 140 160 180 200 pas Fgure 8: Evoluton du renforcement, de l écart type et de l erreur pour la seconde tâche. Références [1] O. At Ader, P. Hoppenot et E. Colle, A Model to Image Straght Lne Matchng Method for Vson-Based Indoor Moble Robot Self-Locaton, Proc. IEEE Int.Conf. IROS'2002, 2002. [2] M. Busnel, R. Geln et B. Lesgne, Evaluaton of a robotzed MASTER/RAID Workstaton at home: Protocol and frst results, Proc. ICORR 2001, Vol. 9, pp. 299-305, 2001. [3] P. Daro, E. Guglelmell, C. Lasch et G. Tet, MOVAID: a personal robot n everyday lfe of dsabled and elderly people, Technology and Dsablty Journal, Vol.10, pp.77-93, 1999. [4] H.G. Evers, E. Beugels et G. Peters, MANUS towards a new decade, Proc. ICORR 2001, Vol. 9, pp. 155-161, 2001. [5] V. Gullapall, A stochastc renforcement learnng algorthm for learnng real valued functons, Neural Networks, Vol. 3, pp. 671-692, 1990. 5/6

[6] H. Kwee et C. A. Stanger, The Manus robot arm, Rehabltaton Robotcs Newsletter, Vol.5, No.2, 1993. [7] S. D. Pror, An electrc wheelchar mounted robotc arm - a survey of potental users, Journal of Medcal Engneerng & technology, Vol. 14, n 4, pp 143-154, 1990. [8] N. Rezzoug et P. Gorce, A bocybernetc method to learn hand graspng posture, Kybernetes, Vol. 32, No. 4, pp. 478-490, 2003. [9] Y. Rybarczyk, E. Colle et P. Hoppenot, Contrbuton of neuroscence to the teleoperaton of rehabltaton robot, Proc. IEEE Int.Conf. SMC'2002, 2002. [10] Y. Rybarczyk, S. Galerne, P. Hoppenot, E. Colle et D. Mestre, The development of robot human-lke behavour for an effcent human-machne cooperaton, AAAT, pp.274-279, 2001. [11] C. A. Stanger, C. Angln, W. S. Harwn, et D. P. Romlly, Devces for assstng manpulaton : a summary of user task prortes, Transactons of Rehabltaton engneerng, Vol. 4, n 2, pp 256-65, 1994. 6/6