Modélisation du développement du mouvement d'atteinte d'un bras mobile virtuel.

Etudiant :

Cassagnabère Christophe

Axe :

Equipe :

MESC

 

Responsable :

P. Preux

 

Version française

English version

 

 

 

 

Résumé :

Cette recherche concerne l’étude des comportements adaptatifs. Nous envisageons un cas particulier qui est celui de l’apprentissage d’un mouvement défini par un bras mobile articulé virtuel. La capacité à apprendre ce mouvement est une résultante des propriétés adaptatives du comportement des composants du bras (muscles).

Notre objectif ici, est de concevoir un artefact exprimant la même dynamique comportementale que celle observée chez un nouveau né lors de l’apprentissage du mouvement de préhension. Nous nous attachons ici, à ce que ce comportement complexe soit reproduit de façon réaliste.

Le système de simulation développé repose sur la sélection des comportements par leurs conséquences (algorithme Q-learning). L'architecture de MAABAC (Multi-Agent Animat for Behavioral Arm Control) est totalement décentralisée chaque muscle reçoit peu de stimulus de l'environnement et décide de son action sur cette base.

Nous portons un grand intérêt à la comparaison entre la dynamique démontrée par MAABAC et le développement des mouvements d'atteinte chez le jeune enfant. Malgré sa simplicité, MAABAC démontre des comportements tels que la généralisation et l'extinction. Il est également sensible au façonnage, une technique bien connue de l'analyse du comportement des organismes.

 

Mots clés : IA basée sur le comportement, simulation, MAABAC, préhension, mouvement d'atteinte, apprentissage par reforcement, Loi de l'effet, système multi-agents, dynamique coopérative complexe, Q-learning.

 

Abstract :

The main objective of this work, is to study and modelise an adaptive behaviours. In this case, studied behaviour, is the learning of a reaching movement. A virtual arm has to reach a determined zone in the simulation space. The capacity to learn correctly this movement, is a result from adaptive properties of the arm components (muscles).

Our goal, is to build an artefact which could be able to show exactly the same dynamic that the one observed on a human baby during the learning of a reaching movement. An important point is that this complex behaviour has to be realistic in our simulation.

We implemented a simulation system that is based on behaviour selection by their consequences (Q-learning algorithm). The MAABAC (Multi-Agent Animat for Behavioural Arm Control) system, is absolutely decentralised, and each component of the arm receives very few stimulation from they simulation environment.

We take a great care of the comparison between MAABAC dynamic, and the development of the reaching movement of a baby. However it is quite simple, MAABAC shows complex behaviours such as generalisation, and extinction. It is also able to reproduce shaping behaviour.

 

Keywords : behaviour based AI, MAABAC, reaching movement, reinforcement learning, Law of effet, Multi-agent system, cooperative dynamic, complex dynamic, Q-learning