Trabajo de Control: Pendulo Doble Invertido
Trabajo de Control: Pendulo Doble Invertido
Trabajo de Control: Pendulo Doble Invertido
OBJETIVOS:
Con este trabajo la aplicación de los conocimientos adquiridos en los diversos estudios
correspondientes al estudio en ingeniería electrónica, en lo que se refiere a análisis y
diseño de sistemas de control, por ello elegimos como sistema de estudio un sistema de
péndulo doble invertido (SPDI).
Objetivos específicos:
Desde su desarrollo a mediados del siglo XX, la teoría de control moderna ha estado
presente en muchos ámbitos de la actividad humana, sus aplicaciones son tan variadas
que se pueden encontrar infinidad de ejemplos en áreas tan distantes entre sí como lo son
la ingeniería aeroespacial y la ingeniería de manufactura y fabricación. En el ámbito
académico es común que la teoría de control moderna se utilice para controlar
mecanismos sencillos como muestra de una aplicación práctica a sistemas inestables.
Entre estos mecanismos está el péndulo invertido.
Este sistema mecánico, inherentemente presenta cuatro puntos de equilibrio, uno estable
y tres inestables. El punto de equilibrio estable corresponde al estado en que ambos brazos
se sitúan en posición vertical hacia abajo; en ausencia de cualquier fuerza el sistema
regresará naturalmente a este estado. Uno de los puntos de equilibrio inestable
corresponde al estado en que los dos brazos se sitúan en posición vertical hacia arriba,
para mantener esta posición se requiere la aplicación de fuerzas externas sobre el sistema.
Siendo esta última configuración la más atractiva para fines de control y es la que se elige
como punto de operación.
Descripción general
En adelante se usará la palabra eslabón en vez de péndulo para nombrar a los elementos
que conforman el péndulo doble con el fin de utilizar la palabra sólo en referencia al
nombre del sistema y no a los componentes del mismo. En la Figura 2.2 se presenta un
esquema con los componentes que conforman al sistema péndulo doble y enseguida una
tabla con la descripción de dichos elementos.
Las componentes de posición del centro de masa del eslabón 1 expresadas en el plano x-
y mostrado son:
El vector velocidad v1 del centro de masa de dicho eslabón tiene en consecuencia las
Componentes:
Por otro lado, las coordenadas del centro de masa del eslabón 2 expresadas en el plano x-
y son:
El vector velocidad v2 del centro de masa de dicho eslabón tiene en consecuencia las
componentes:
La energía cinética para este mecanismo puede descomponerse en la suma de dos partes
𝑇 = 𝑇 + 𝑇 , donde 𝑇 𝑦 𝑇 , son las energías cinéticas asociadas a las masas m1 y m2
respectivamente.
La energía cinética correspondiente al movimiento del eslabón 1 es 𝑇 = 𝑚 𝑣 y la
energía cinética que corresponde al movimiento del segundo eslabón es 𝑇 = 𝑚 𝑣 ,
de tal forma que:
De forma similar, la energía potencial puede descomponerse como la suma de dos partes,
𝑉 = 𝑉 + 𝑉 donde 𝑉 𝑦 𝑉 son las energías potenciales asociadas a las masas m1 y m2
respectivamente.
Se tiene entonces que 𝑉 = 𝑚 𝑔𝑦 𝑦 𝑉 = 𝑚 𝑔𝑦 , por lo tanto la energía potencial del
sistema queda definida por lo siguiente:
Dónde:
𝑞 : Son las coordenadas generalizadas del sistema mecánico.
L : Lagrangiano.
𝑄 : Fuerzas externas.
𝐷 : Función de disipación de Rayleigh.
Para este caso existen dos grados de libertad y por tanto las coordenadas generalizadas 𝑞
y 𝑞 corresponden a 𝜃 y 𝜃 , mientras que la fuerza externa 𝑄 esta representada por Ƭ
que es el par aplicado al primer eslabón por el actuador y para 𝑄 no se tiene componente
ya que el segundo eslabón no recibe un par externo (no está accionado por ningún motor).
Las constantes de disipación son representados por 𝑏 y 𝑏 , que son los coeficientes de
fricción viscosa correspondientes al primer y segundo eslabón respectivamente. En
resumen:
Así la ecuación general en variables de estado para un sistema dinámico lineal e invariante
en el tiempo descrito por un conjunto de ecuaciones diferenciales de n-ésimo orden, con
una sola entrada (m=1), está dado por:
Donde para la ecuación (2.18) n es el número de variables de estado y x1, x2, ... , 𝑋
representa el conjunto de éstas que definen el vector de estados, 𝑎 y 𝑏 son los
coeficientes constantes de las matrices A y B respectivamente y u es la señal de entrada.
Por otro lado, en la ecuación (2.19) p es el número de salidas del sistema y los coeficientes
𝑐 y 𝑑 son los coeficientes constantes que conforman las matrices C y D,
respectivamente.
Para obtener la descripción del sistema péndulo doble en variables de estado a partir de
las ecuaciones de movimiento obtenidas anteriormente, se tienen que realizar algunos
reacomodos de los términos presentes en dichas ecuaciones. Así se tiene lo siguiente:
Si definimos al torque aplicado por el actuador como la entrada u del sistema se tiene
entonces que u = Ƭ.
Por lo que se obtiene a partir de las ecuaciones (2.21) y (2.23) la siguiente representación:
Como se mencionó anteriormente la entrada u del sistema corresponde al torque aplicado
por el motor al primer eslabón del péndulo doble, conocer el torque que se necesita
entregar al sistema para cambiar la posición de los eslabones es muy útil, sin embargo,
para este caso resulta de mayor utilidad saber cuál es el voltaje que se necesita suministrar
al motor para que éste aplique dicho torque al sistema, es por lo anterior que se requiere
en este punto agregar al modelo del sistema péndulo doble el modelo del motor, el cual
se muestra enseguida:
Donde:
𝑘 = Constante de par, relaciona el par del motor y la corriente.
𝑘 = Constante de velocidad, relaciona la FCEM y la velocidad angular.
R = Resistencia
u͂ = Voltaje aplicado
ω = Velocidad angular.
Para este caso, debido a que el acoplamiento entre el motor y el primer eslabón del sistema
es un acoplamiento directo, es decir, no hay elementos mecánicos adicionales para la
transmisión de potencia del motor al sistema, la velocidad del motor será igual a la
velocidad del primer eslabón, en otras palabras, ω = X2. Teniendo esto presente, es
posible reescribir el modelo del motor de la siguiente forma:
De las funciones que componen h, las únicas dos que no son lineales son ℎ y ℎ , por lo
tanto la ecuación (2.27) para estas dos funciones queda definida por lo siguiente:
x͂1 = x1 - π
x͂2 = x2
x͂3 = x3 - π
x͂4 = x4
Con esto se obtiene el modelo linealizado del sistema péndulo doble teniendo como
entrada el voltaje aplicado al motor y no el torque como se definió al inicio de este
desarrollo.
Ahora la ecuación (2.28) para este nuevo sistema de ecuaciones queda definida de la
siguiente manera:
Donde:
El modelo de estados propiamente dicho, no considera cuáles señales o variables del
proceso son las que se pueden medir. Esta información viene dada por medio de la
ecuación de salida. Como las posiciones angulares de ambos eslabones son las únicas
variables de las que se tendrá información continua (registros que se realizan con ayuda
de dos decodificadores de posición o encoders), éstas son las únicas salidas del sistema,
por lo tanto la ecuación de salida resulta ser
Este modelo linealizado servirá posteriormente para el diseño del sistema de control para
el péndulo doble.
SISTEMA LINEAL DE VARIABLES DE ESTADO. LAZO ABIERTO
𝝁𝟎 = 𝟎. 𝟏𝟓.
𝜷𝟎 = 𝟎. 𝟐𝑵. 𝒔/𝒎
Relación entre los parámetros del sistema. Para la selección de los valores de parámetros
más adecuados para la simulación y validación del sistema de péndulo doble invertido,
se hicieron varias pruebas con diferentes valores para tales parámetros, al realizar estas
pruebas encontramos algunas relaciones interesantes entre ellos.
0 0 0 0 0 0
0 0 0 0 0 0
⎛0 0 0 0 0 0 ⎞
𝐴=⎜
⎜0 −4.3377 0.4820 0 0.9836 −0.2459 ⎟⎟
0 96.3934 −43.3770 0 −13.5246 22.1311
⎝0 −115.6721 110.8525 0 1.2295 −56.5574 ⎠
0
0
⎛ 0 ⎞
𝐵 = ⎜ 0.9016 ⎟
−6.1475
⎝ 7.3770 ⎠
1 0 0 0 0 0
𝐶= 0 1 0 0 0 0
0 1 1 0 0 0
0
𝐷= 0
0
CONTROL ÓPTIMO
El diseño de los sistemas de control óptimo y los sistemas reguladores óptimos basados
en tales índices de desempeño cuadráticos se reducen a la determinación de los elementos
de la matriz K. Una ventaja de usar el esquema de control óptimo cuadrático es que el
sistema diseñado será estable, excepto en el caso que el sistema no sea controlable.
El sistema de control óptimo se basa en minimizar el índice de desempeño, que para los
sistemas con vectores reales y matrices reales, se presenta que:
El regulador cuadrático lineal produce una solución óptima cuando la dinámica del
sistema es lineal. Como ya vimos el SPDI no es lineal, pero su linealización alrededor del
punto de operación escogido, hace posible derivar una solución lineal aproximada para el
problema de control óptimo.
La solución continua del LQR se obtiene por: donde: , en donde P es la solución de estado
estable de la ecuación diferencial de Riccati.
Determinación de las matrices de ponderación
R=2
En todos los casos, las variables ponderadas con valores diferentes de cero son justamente
la posición del carrito y la posición del primer y segundo péndulo. Con la selección
encontrada obtuvimos por simulación en matlab, la matriz de ganancias siguiente:
Modelo lineal en lazo abierto. La simulación del sistema linealizado en lazo abierto,
figura, presenta un sistema inestable, siendo evidente después de aproximadamente 800
milisegundos
Modelo no lineal en lazo cerrado. Ahora veamos el sistema en lazo cerrado. La figura
nos presenta la simulación del comportamiento de las trayectorias del carrito y de cada
uno de los péndulos, el inferior y superior, una vez se aplica al sistema no lineal la matriz
de ganancias K obtenida en la estabilización optima del sistema.