Control PD con compensaci´ on neuronal aplicado a un sistema sub-actuado Adrian A. Gorgon 1 , Ramon Garcia-Hernandez 2 and Miguel A. Llama 3 Resumen— En este trabajo se presentan dos controladores del tipo PD utilizando compensaci´ on neuronal aplicados a un sistema sub-actuado carro-p´ endulo. La diferencia entre ambos controladores radica en la forma de entrenar la red neuronal: en l´ ınea y fuera de l´ ınea. Se propone el uso de dos superficies deslizantes acopladas con ganancias adecuadas como funci´ on de salida. Los resultados experimentales validan los esquemas de control aqu´ ı propuestos I. INTRODUCCI ´ ON En general cuando se requiere controlar un robot se dise˜ na un sistema de control para cada tarea en espec´ ıfico que se requiere que un robot ejecute. Incluso para tareas que una persona puede realizar de manera intuitiva, como levantar objetos o cortar alimentos, estos controladores pueden ser muy dif´ ıciles de dise˜ nar porque no hay manera de traducir f´ acilmente esta intuici´ on natural en c´ odigo. Tambi´ en puede ser extremadamente complejo escalar estos enfoques a la gran cantidad de desaf´ ıos con los que estos robots deben lidiar en un ambiente no controlado. En los primeros d´ ıas de la inteligencia artificial se resolvieron problemas que eran intelectualmente dif´ ıciles para los seres humanos pero relativamente f´ aciles para las computadoras; problemas que pueden ser descritos por una lista de reglas matem´ aticas formales. El reto para la inteligencia artificial fue el de resolver tareas que eran f´ aciles de realizar por las personas pero dif´ ıciles de describir formalmente; problemas con soluciones intuitivas como reconocimiento de palabras, o rostros en im´ agenes. La soluci´ on a dicho problema permite a las computadoras aprender de la experiencia y entender el mundo en t´ erminos de jerarqu´ ıa de conceptos. La jerarqu´ ıa de conceptos permite a la computadora aprender conceptos complicados a partir de conceptos m´ as simples. Las redes neuronales artificiales (RNA) son parte importante del ´ area pr´ actica de la inteligencia artificial; estas pretenden ser una estimaci´ on de sus hom´ onimas biol´ ogicas las cuales tienen la caracter´ ıstica de ser no lineales, complejas y que su forma de trabajar sea en *This work was supported by CONACyT grant: 887273 1 Adrian A. P. Gorgon is with Tecnol´ ogico Nacional de M´ exico/I. T. La Laguna, Torre´ on, 27000, M´ exico, aagorgon@gmail.com 2 Ramon Garcia-Hernandez is with Tecnol´ ogico Nacional de M´ exico/I. T. La Laguna, Torre´ on, 27000, M´ exico, rgarciah@correo.itlalaguna.edu.mx 3 Miguel A. Llama is with Tecnol´ ogico Nacional de M´ exico/I. T. La Laguna, Torre´ on, 27000, M´ exico, mllama@correo.itlalaguna.edu.mx paralelo con otras redes conectadas entre s´ ı. Una caracter´ ıstica de gran importancia es la capacidad de la red de realizar mapeos de entradas y salidas de datos, esto podr´ ıa interpretarse como aprendizaje de la informaci´ on. Un ejemplo de esto es cuando una persona aprende matem´ aticas, se presentan problemas una y otra vez hasta que eventualmente la persona se vuelve capaz de realizar problemas matem´ aticos sin mayor dificultad; de la misma forma una RNA es capaz, por m´ etodos iterativos,de aprender a calcular, comprimir, separar, identificar, entre otras actividades [4]. A continuaci´ on se mencionan algunos trabajos previos relacionados con la aplicaci´ on de redes neuronales al control de robots. En [1], [5], [8] y [9] se presentan algoritmos de aprendizaje en l´ ınea que no requieren de ajustes pre- eliminares fuera de l´ ınea. En [7] se propone un controlador neuronal basado en leyes adaptables para conseguir el control robusto de robots manipuladores de eslabones r´ ıgidos. En [10] se presenta un controlador neuronal adaptable para resolver el problema de control de un p´ endulo de Furuta, tambi´ en se hace una comparaci´ on experimental con otros esquemas. Otros trabajos relacionados se encuentran en [6], [11], [12] y [13]. En este documento se har´ a uso de la propiedad de mapeo de las redes neuronales para desarrollar una metodolog´ ıa de control para sistemas mecatr´ onicos; esta metodolog´ ıa implica entrenamientos fuera de l´ ınea utilizando el algoritmo ’backpropagation’ y el criterio de los m´ ınimos cuadrados y un entrenamiento en l´ ınea utilizando leyes de adaptaci´ on que cumplir´ ıan con la estabilidad necesaria para que el sistema converja en tiempo finito. II. DESCRIPCI ´ ON DEL SISTEMA El sistema experimental es un sistema carro p´ endulo el cual consta de un p´ endulo de rotaci´ on libre con m´ ınima fricci´ on y una estructura de aluminio montada sobre una banda de silic´ on reforzado, la banda a su vez est´ a conectada a un actuador el´ ectrico. La figura 1 representa el diagrama de cuerpo libre del sistema, donde M es la masa del carro, m es la masa del p´ endulo, l es la longitud al centro de masa del p´ endulo medido desde el centro de la conexi´ on al carro, I es el momento de inercia con respecto al centro de masa del p´ endulo, g representa la aceleraci´ on de la gravedad, x y˙ x representan la posici´ on y la velocidad traslacional del carro respectivamente, θ y ˙ θ representan la posici´ on y la