Coordenação dos atuadores das pernas de robôs móveis usando aprendizado por reforço: simulação e implementação

Jeeves Lopes dos Santos; Cairo Lúcio Nascimento Júnior

Journal ArticleOPEN ACCESS

Coordenação dos atuadores das pernas de robôs móveis usando aprendizado por reforço: simulação e implementação

Santos J
Nascimento Júnior C

Sba: Controle & Automação Sociedade Brasileira de Automatica (2012) 23(1) 78-93

DOI: 10.1590/s0103-17592012000100007

N/ACitations

15Readers

Abstract

Este artigo apresenta uma solução para o problema de coordenação dos atuadores das pernas de robôs móveis com o objetivo principal de maximizar a sua velocidade frontal. É assumido que a posição no tempo de cada atuador é descrita por uma função periódica que deve ser determinada de forma iterativa por um algoritmo de aprendizado por reforço. As pernas similares do robô são identificadas e agrupadas visando diminuir o número de funções que precisam ser determinadas. O toolbox SimMechanics do software MATLAB/Simulink é usado para simular o caminhar do robô em uma superfície plana. O desempenho do robô simulado é medido considerando: a) a velocidade frontal e a suavidade na locomoção do robô, e b) o máximo torque e o consumo de energia dos atuadores. As funções que foram determinadas no ambiente de simulação pelo algoritmo de reforço são então usadas nos atuadores do robô real construído usando o kit de robótica educacional Bioloid Comprehensive Kit. O desempenho do robô real é então medido e comparado com o desempenho do robô simulado. Este artigo apresenta dois estudos de caso: um robô quadrúpede e um trípode. Nos dois casos os robôs possuem três atuadores por perna. As soluções obtidas pela aplicação do método proposto são apresentadas e se mostraram satisfatórias.This article presents a solution to the problem of how to coordinate the actuators of a legged robot such that its frontal speed is maximized. It is assumed that the position of each leg actuator is described by a periodic function that has to be determined using a reinforcement learning technique called Learning Automata. Analysis of the robot morphology is used to group similar legs and decrease the number of actuator functions that must be determined. MATLAB/Simulink and the SimMechanics Toolbox are used to simulate the robot walking on a flat surface. The simulated robot response is evaluated by the reinforcement learning technique considering: 1) the robot frontal speed, 2) the smoothness of the robot movements, 3) the largest torque required by all actuators, and 4) the energy consumption. After the reinforcement learning algorithm converges to a solution, the actuators functions are applied to the real robot that was built using the Bioloid Comprehensive Kit, an educational robot kit manufactured by Robotis. The response of the real robot is then evaluated and compared with the simulated robot response. This article presents two case studies: a quadrupedal robot and a tripedal robot. In both cases, each leg has three actuators. The solutions obtained by the proposed methodology are presented and shown to be satisfactory.

Cite

CITATION STYLE

APA

Santos, J. L. dos, & Nascimento Júnior, C. L. (2012). Coordenação dos atuadores das pernas de robôs móveis usando aprendizado por reforço: simulação e implementação. Sba: Controle & Automação Sociedade Brasileira de Automatica, 23(1), 78–93. https://doi.org/10.1590/s0103-17592012000100007

Coordenação dos atuadores das pernas de robôs móveis usando aprendizado por reforço: simulação e implementação

Abstract

Cite

Register to see more suggestions