Control De Humanoides
Enviado por arckoe • 29 de Noviembre de 2011 • 3.750 Palabras (15 Páginas) • 533 Visitas
CONTROL DE COLABORACIÓN EN UNA TAREA HUMANOIDE DINÁMICO
Este artículo describe un esquema de control de colaboración que rige el comportamiento dinámico de un robot articulado móvil con varios grados de libertad (DOF) y los despidos.
Estos tipos de robots necesitan un alto nivel de coordinación entre el rendimiento motores para completar sus movimientos. En el esquema empleado, los actuadores que intervienen en una parte específica información de la tarea, la computación en las acciones de control integrado. Las funciones de control se encuentran utilizando una técnica de aprendizaje por refuerzo estocástica que permite al robot de forma automática a generar sobre la base de experiencias. Este tipo de control se basa en el principio de modularización: el comportamiento global complejo es el resultado de la interacción de los componentes individuales de simple. A diferencia de los procedimientos estándar, este enfoque no tiene la intención de seguir una trayectoria generada por un planificador, en cambio, la trayectoria surge como consecuencia de la colaboración entre los movimientos de las articulaciones mientras se busca la consecución de un objetivo.
El aprendizaje de la coordinación sensorio en un humanoide simulada se presenta como una demostración
Introduccion
Robots con varios grados de libertad (DOF) y configuraciones redundantes son más frecuentemente construidos; humanoides como Qrio (. Kuroki et al, 2003), o HRP-2 (Kaneko et al., 2004), y los robots de entretenimiento, como Aibo (Fujita y Kitano, 1998) son ejemplos de ello.
Movimientos complejos en robots complejos, no son fáciles de calcular, la participación de múltiples articulaciones y sus requisitos de sincronización requieren nuevos enfoques que dotar al robot con la capacidad de coordinación.
Un intento de impulsar la dinámica de su cuerpo de forma óptima, la medición de su desempeño en todas las configuraciones posibles, llevaría a una explosión combinatoria de su espacio de soluciones.
El uso habitual de los modelos matemáticos simplificados para representar complejos sistemas de robótica, es decir, la aproximación no-lineales e incertidumbres, se traduciría en las políticas que se ejecutan controlan aproximadamente el óptimo, por lo tanto, dos comandos principales hipótesis del trabajo desarrollado. En primer lugar, no existe un modelo matemático pre-establecidos de la física del cuerpo del robot de la que podría ser una ley de control computarizada, y en segundo lugar, la filosofía de diseño de control se centra en el rendimiento de la acción del robot y no en el logro de la trayectoria por su articulaciones, como alternativa, estocástico técnicas de aprendizaje por refuerzo aplicado a modelos de simulación numérica se estudian.
Un problema de control óptimo, donde se minimiza una función de costos para calcular
las políticas, se dice.
El objetivo de este trabajo es para resolver un problema robot multi-articulares de movimiento, donde la coordinación es necesario. Los planificadores y los generadores de trayectoria por lo general estan a cargo de los movimientos complejos en las articulaciones, están involucradas y la estabilización mecánica del robot está en riesgo, la relación entre las señales sensoriales y los comandos del motor en el ámbito de la dinámica es vista como un ladrillo de bajo nivel en el edificio de la jerarquía de control. Aquí se utiliza un esquema de control dinámico que también resuelve el problema de la trayectoria.
Es importante mencionar que un trabajo anterior utiliza la coordinación a nivel de la dinámica de ampliar la capacidad del robot manipulador (Rosenstein y Barto,
2001), su objetivo era utilizar un enfoque de inspiración biológica para aprovecharlos movimientos sinérgica entre las articulaciones, como la relación de los músculos humanos. Utilizan un hecho a mano preestablecidos controladores PID en todas las articulaciones del robot y el par final aplicado en cada motor es la combinación lineal de las del PID de salida, la colaboración se muestra. Los parámetros se obtienen mediante la combinación de los métodos de búsqueda directa (Rosenstein, 2003). Mediante el uso de controladores lineales para resolver un problema no lineal, que implementar un programa de motor jerárquico que corre varios controladores de retroalimentación, es decir, cambiar de PID (parámetros y metas) en el centro de la moción. Aquí extender ese resultado, proponiendo un esquema más general, donde la información del sensor se procesa en capas independientes y específicos para producir coordinar las acciones de control. Además, en la definición de la arquitectura, las funciones de control no restringido a la EPI y su combinación lineal. Por otra parte, usamos aprendizaje por refuerzo para calcular todos los controladores de la arquitectura. Este trabajo se organiza de la siguiente sección 2 está dedicada a la presentación de la arquitectura y la aplicación lineal de uso práctico se resume en tres; mientras que la sección 4 se valida a través de un experimento de simulación de una tarea de equilibrio dinámico del robot. Sección 6 recoge las conclusiones y puntos para el trabajo futuro.
2 CONTROL DE COOPERACIÓN EN CAPAS
La Cooperativa de capas de control (LCC) plan está destinado a generar movimientos, mientras que la resolución de una tarea dinámica (DT). Se supone que la configuración final del DT se conoce, es decir, el punto de ajuste de los ángulos de las articulaciones está preestablecido, pero la forma de coordinar los movimientos para llegar a esta configuración, restringido a la dinámica de su cuerpo, es desconocida. También se supone que los estados del sistema son observables y que cada posición de la articulación es comandada por servos independientes.
La figura 1 representa esquemáticamente la idea principal de la LCC. Las acciones de control que llevan los motores son procesadas por dos capas de las funciones del controlador. Cada componente de la primera capa (D) manipula la dinámica de un conjunto singular, la salida de esta capa tiene la intención de su posición común correspondiente en una previamente se especifica el ángulo, sino que se filtra por la segunda capa de controladores (f).Cada motor es accionado por una función diferente, que calcula la acción de control sobre la base de todas las señales originadas en la capa anterior.
Los controladores de la primera capa se relacionan con la dinámica de la relación, deben ser establecidas de una vez. La segunda capa de funciones (f) deben ser diseñados
frente a la DT la intención de ser completado. Funcional y computacionalmente hablando de la arquitectura en capas, cada paso de dos asignaciones de llevarse a cabo, una por razones de error
...