Sensibilité aux contingences sensorimotrices et apprentissage chez le nourrisson et le robot L. Jacquey J.K. O Regan R. Esseily (lisa.jacquey@gmail.com) GOAL-Robots LPP LECD JJCR 16 07 novembre
Notre équipe : J.K O Regan G. Baldassarre R. Esseily J. Triesch J. Fagard J. Peters E. Somogyi A. Barto
Projet européen : Développer un nouveau paradigme pour construire des robots capables d apprentissage sans supervision : «Goal-based Open-ended Autonomous Learning» (GOAL). Pour cela, le robot devra être capable de : 1. Générer des buts et des tâches de manière autonome. 2. Autoréguler l apprentissage de nouvelles compétences. Inspiration chez les bébés : collaboration directe entre psychologie du développement et robotique développementale. Ø Comment les bébés apprennent-ils? Sensibilité aux contingences sensorimotrices (SMCs)!
Deux approches complémentaires : PSYCHOLOGIE DU DÉVELOPPEMENT : ROBOTIQUE DÉVELOPPEMENTALE :
Contingences sensorimotrices & nourrissons : Toucher double Succion non-nutritive Paradigme du mobile Préférence visuelle Pression d un bouton Contingent au regard
Deux approches complémentaires : PSYCHOLOGIE DU DÉVELOPPEMENT : ROBOTIQUE DÉVELOPPEMENTALE :
Contingences sensorimotrices & robots : Playground experiment (Oudeyer et al. 2005) Modèle GRAIL (Santucci et al. 2016)
Projet de recherche : Problématique : Comment par sa sensibilité aux contingences sensorimotrices (SMCs) entre ses actions et un retour sensoriel un agent peut-il d apprendre à interagir avec le monde? Hypothèse : à partir de sa sensibilité aux SMCs, et motivé par la curiosité, l agent génère des buts d apprentissage. à La réalisation de ces buts lui permet de développer de nouvelles compétences. Curiosity Goals Méthode : développer un modèle unique permettant d expliquer les données chez le bébés et de produire des robots capables d un apprentissage autonome de compétences complexes. SM skills
Un nouveau concept : le but. Définition : but = représentation interne d un état du monde d un état corporel ou d une combinaison des deux. Deux propriétés : Ø l agent peut activer cette représentation sans stimulus perceptif Ø l activation d un but à des effets motivationnels à guide le processus d apprentissage.
Mécanisme : L agent explore son environnement. Lorsqu il rencontre un événement, l agent forme un but. Il conserve ce but sous la forme d une représentation interne. L agent sélectionne un but. Il auto-génère un signal lui permettant sélectionner le but entrainant la plus forte amélioration de ses compétences (motivation intrinsèque). L agent décide quelles ressources computationnelles entrainées pour atteindre ce but à apprentissage de nouvelles compétences. Il utilise sa représentation interne du but pour savoir quand celui-ci est atteint (= amélioration de compétences impossible).
Déroulement du projet : 1 ère partie : La sensibilité aux contingences sensorimotrices chez le nourrisson : un phénomène plus complexe qu il n y paraît. 2 ème partie : Comment les nourrissons et les robots apprennent-ils à interagir avec le monde? (a) Acquisition de la connaissance corporelle (b) Différentiation entre les modalités sensorielles (c) Interactions avec les partenaires sociaux
Connaissance corporelle chez le nourrisson : Connaissance corporelle : capacité d un organisme à bouger et ressentir son corps de manière à interagir efficacement avec son environnement. Indices d une acquisition progressive de la connaissance corporelle (Rovee-Collier et al., 1978, Thelen, 1994, Heathcock et al., 2004, 2005, Watanabe & Taga, 2006, 2009, 2011, 2013). Ø Notre hypothèse : acquisition allant d une connaissance indifférenciée (i.e. globale) à une connaissance différenciée (i.e. locale).
Deux approches : Mesurer la connaissance corporelle sans apprentissage préalable de la tâche : Ø Etude préliminaire #1 : Buzzers Mesurer la connaissance corporelle via l apprentissage d une nouvelle contingence : Ø Etude préliminaire #2 : Bracelets
Etude préliminaire #1: Buzzers But : étudier la connaissance corporelle sans apprentissage spécifique de la tâche. Méthode : stimulation avec des pastilles vibrantes (35 secondes). 5 positions de stimulation : front main gauche main droite pied gauche pied droit Mesures : - activité de chaque membre - frottements des mains et des pieds - regards ou mouvements dirigés vers le buzzer Sujets : nourrissons de 3 mois, 4 mois, 5 mois et 6 mois. Nourrisson de 3 mois avec stimulation de la main gauche
Opérationnalisation des hypothèses : Connaissance corporelle indifférenciée (i.e. globale) Différentiation haut/bas Connaissance corporelle différenciée (i.e. locale)
Résultats : Connaissance corporelle indifférenciée (i.e. globale) : ü Validée à 3 mois Différentiation entre le haut et le bas du corps : ü Validée à partir de 4 mois Connaissance corporelle différenciée (i.e. locale) : ü Validée à partir de 5 mois Tester l influence de stimulations tactiles préalables (ex : massages).
Modélisation : Modélisation de l apprentissage préalable via du «self-touch» : Architecture of the network Echo-state network
Etude préliminaire #2 : Bracelets But : étudier l acquisition de la connaissance corporelle à travers l apprentissage d une nouvelle contingence. Méthode : type paradigme du mobile Setup expérimental : bracelets générant un retour sensoriel contingent aux mouvements du nourrisson (Baldassarre et al, ISTC, Rome) Mesure : activité de chaque membre. Sujets : nourrissons de 2 mois, 4 mois et 6 mois. Nourrisson de 6 mois avec le bras droit connecté
Opérationnalisation des hypothèses : Connaissance corporelle indifférenciée (i.e. globale) Différentiation haut/bas Connaissance corporelle différenciée (i.e. locale)
Résultats : Connaissance corporelle indifférenciée (i.e. globale) : ü Validée à 2 mois Différentiation entre le haut et le bas du corps : ü Tendance validée à 4 mois Connaissance corporelle différenciée (i.e. locale) : Non validée à 6 mois Sensibilité aux contingences des bébés est plus complexe qu il n y paraît.
Prochaines étapes : 1) Trouver un setup expérimental pour lequel les bébés apprennent facilement la contingence. 2) Modéliser l apprentissage de cette contingence. 3) Tester l effet de la modification de différentes caractéristiques de la contingence (délai temporel, difficulté de la règle, intermodalités, etc.).
A terme : Créer un langage commun entre psychologie et robotique Faciliter l échange et la rencontre entre les chercheurs des deux disciplines Permettre aux roboticiens de «demander» les expériences dont ils ont besoin et tester les prédictions faites par leurs modèles Permettre au psychologue de transformer dans un langage formel leurs hypothèses et de jouer avec les paramètres de celles-ci
Merci pour votre attention! Contact : lisa.jacquey@gmail.com