fbpx
Wikipedia

Control lineal cuadrático gaussiano

En la teoría de control, el problema de control lineal cuadrático gaussiano (LQG) es uno de los más fundamentales de control óptimo. Se refiere a sistemas lineales inciertos perturbados por ruido blanco gaussiano aditivo, que tiene la información de estado incompleta (es decir, no todas las variables de estado se miden y disponible para la regeneración) y sometidos a control de sujetos a cuadráticas costes. Además, la solución es única y constituye una ley de control de realimentación dinámico lineal que se calcula y fácil de implementar. Finalmente el controlador LQG también es fundamental para el control óptimo de los sistemas no lineales perturbados.[1]

El controlador LQG es simplemente la combinación de un filtro de Kalman es decir, un estimador lineal cuadrática (LQE) con un regulador lineal cuadrático (LQR). El principio de separación garantiza que estos pueden ser diseñados y calculan de forma independiente. LQG de control se aplica tanto a los sistemas lineales invariantes en el tiempo, así como sistemas de variables en el tiempo lineales. La aplicación a los sistemas invariantes en el tiempo lineales es bien conocido. La aplicación de sistemas de variables en el tiempo lineal permite el diseño de controladores de captación lineal para sistemas inciertos no lineales.

El controlador LQG en sí es un sistema dinámico como el sistema que controla. Ambos sistemas tienen la misma dimensión estado. Por lo tanto la aplicación de la controlador LQG puede ser problemático si la dimensión del estado del sistema es grande. El problema LQG de orden reducido (problema LQG orden fijo) supera está fijando a priori el número de estados del controlador LQG. Este problema es más difícil de resolver porque ya no es separable. También la solución ya no es único. A pesar de estos hechos algoritmos numéricos están disponibles[2][3][4][5]​ para resolver los asociados ecuaciones de proyección óptimos[6][7]​ que constituyen condiciones necesarias y suficientes para que un controlador LQG de orden reducido localmente óptima.[2]

Por último, una palabra de precaución. LQG optimalidad no garantiza automáticamente buenas propiedades de solidez.[8]​ La estabilidad robusta del sistema de circuito cerrado debe ser revisado por separado después de que el controlador LQG ha sido diseñado. Promover robustez algunos de los parámetros del sistema puede suponer estocástico en lugar de determinista. El problema de control más difícil asociada conduce a un controlador óptimo similar de la cual sólo los parámetros del controlador son diferentes.[3]

Descripción matemática del problema y la solución

Tiempo continuo

Considere el sistema dinámico lineal,

 
 

donde   representa el vector de las variables de estado del sistema,   el vector de las entradas de control y   el vector de salidas medidas disponibles para la retroalimentación. Tanto ruido blanco gaussiano aditivo sistema   y aditivo blanco gaussiano ruido de medición   afectar el sistema. Teniendo en cuenta este sistema el objetivo es encontrar la historia entrada de control   que en cada momento   puede depender sólo de las últimas mediciones   de tal manera que la siguiente función de costo se minimiza,

 
 

donde   denota el valor esperado. La hora final (horizonte)   puede ser finito o infinito. Si el horizonte tiende a infinito el primer término   de la función de coste se convierte en insignificante e irrelevante para el problema. Además de mantener los costos finitas la función de coste hay que tener para ser  .

El controlador LQG que resuelve el problema de control de LQG se especifica mediante las siguientes ecuaciones:

 
 
 
 

La matriz   se llama la ganancia de Kalman del filtro de Kalman asociado representado por la primera ecuación. En cada momento   este filtro genera estimaciones   del Estado   usando las mediciones y entradas pasadas. La ganancia de Kalman   se calcula a partir de las matrices  , las dos matrices de intensidad   asociado a los ruidos gaussianos blancos   and   y finalmente  . Estas cinco matrices determinan la ganancia de Kalman a través de la siguiente ecuación diferencial de Riccati asociada a la matriz:

 
 

Dada la solución   la ganancia de Kalman es igual:

 

La matriz   se llama la matriz de ganancia de retroalimentación . Esta matriz está determinada por las matrices   and   a través de la siguiente ecuación diferencial de Riccati asociada a la matriz:

Dada la solución   la ganancia de Kalman es igual

 

Observe la similitud de las dos ecuaciones diferenciales de la matriz de Riccati, la primera que corre hacia adelante en el tiempo, la segunda que corre hacia atrás en el tiempo. Esta similitud se llama dualidad . La primera ecuación diferencial de la matriz de Riccati resuelve el problema de estimación lineal cuadrática (LQE). La ecuación diferencial de la segunda matriz Riccati resuelve el problema del regulador lineal-cuadrático (LQR). Estos problemas son duales y juntos resuelven el problema de control lineal-cuadrático-Gaussiano (LQG). Entonces, el problema de LQG se separa en el problema LQE y LQR que se puede resolver de forma independiente. Por lo tanto, el problema de LQG se llama separable .

Cuando   y las matrices de intensidad de ruido  ,   no dependen de   y cuando   tiende a infinito, el controlador LQG se convierte en un sistema dinámico invariante en el tiempo. En ese caso, ambas ecuaciones diferenciales de la matriz de Riccati pueden ser reemplazadas por las dos ecuaciones de Riccati algebraicas asociadas.

Tiempo discreto

Dado que el problema de control de LQG en tiempo discreto es similar al del tiempo continuo, la siguiente descripción se centra en las ecuaciones matemáticas.

Las ecuaciones del sistema lineal de tiempo discreto son:

 
 

Referencias

  1. Athans M. (1971). «The role and use of the stochastic Linear-Quadratic-Gaussian problem in control system design». IEEE Transaction on Automatic Control. AC-16 (6): 529-552. doi:10.1109/TAC.1971.1099818. 
  2. Van Willigenburg L.G., De Koning W.L. (2000). «Numerical algorithms and issues concerning the discrete-time optimal projection equations». European Journal of Control 6 (1): 93-100.  Associated software download from Matlab Central.
  3. Van Willigenburg L.G., De Koning W.L. (1999). «Optimal reduced-order compensators for time-varying discrete-time systems with deterministic and white parameters». Automatica 35: 129-138. doi:10.1016/S0005-1098(98)00138-1.  Associated software download from Matlab Central.
  4. Zigic D., Watson L.T., Collins E.G., Haddad W.M., Ying S. (1996). «Homotopy methods for solving the optimal projection equations for the H2 reduced order model problem». International Journal of Control 56 (1): 173-191. doi:10.1080/00207179208934308. 
  5. Collins Jr. E.G, Haddad W.M., Ying S. (1996). «A homotopy algorithm for reduced-order dynamic compensation using the Hyland-Bernstein optimal projection equations». Journal of Guidance Control & Dynamics 19 (2): 407-417. doi:10.2514/3.21633. 
  6. Hyland D.C, Bernstein D.S. (1984). «The optimal projection equations for fixed order dynamic compensation». IEEE Transaction on Automatic Control. AC-29 (11): 1034-1037. doi:10.1109/TAC.1984.1103418. 
  7. Bernstein D.S., Davis L.D., Hyland D.C. (1986). «The optimal projection equations for reduced-order discrete-time modeling estimation and control». Journal of Guidance Control and Dynamics 9 (3): 288-293. doi:10.2514/3.20105. 
  8. Green, Limebeer: Linear Robust Control, p. 27
  •   Datos: Q1798304

control, lineal, cuadrático, gaussiano, teoría, control, problema, control, lineal, cuadrático, gaussiano, más, fundamentales, control, óptimo, refiere, sistemas, lineales, inciertos, perturbados, ruido, blanco, gaussiano, aditivo, tiene, información, estado, . En la teoria de control el problema de control lineal cuadratico gaussiano LQG es uno de los mas fundamentales de control optimo Se refiere a sistemas lineales inciertos perturbados por ruido blanco gaussiano aditivo que tiene la informacion de estado incompleta es decir no todas las variables de estado se miden y disponible para la regeneracion y sometidos a control de sujetos a cuadraticas costes Ademas la solucion es unica y constituye una ley de control de realimentacion dinamico lineal que se calcula y facil de implementar Finalmente el controlador LQG tambien es fundamental para el control optimo de los sistemas no lineales perturbados 1 El controlador LQG es simplemente la combinacion de un filtro de Kalman es decir un estimador lineal cuadratica LQE con un regulador lineal cuadratico LQR El principio de separacion garantiza que estos pueden ser disenados y calculan de forma independiente LQG de control se aplica tanto a los sistemas lineales invariantes en el tiempo asi como sistemas de variables en el tiempo lineales La aplicacion a los sistemas invariantes en el tiempo lineales es bien conocido La aplicacion de sistemas de variables en el tiempo lineal permite el diseno de controladores de captacion lineal para sistemas inciertos no lineales El controlador LQG en si es un sistema dinamico como el sistema que controla Ambos sistemas tienen la misma dimension estado Por lo tanto la aplicacion de la controlador LQG puede ser problematico si la dimension del estado del sistema es grande El problema LQG de orden reducido problema LQG orden fijo supera esta fijando a priori el numero de estados del controlador LQG Este problema es mas dificil de resolver porque ya no es separable Tambien la solucion ya no es unico A pesar de estos hechos algoritmos numericos estan disponibles 2 3 4 5 para resolver los asociados ecuaciones de proyeccion optimos 6 7 que constituyen condiciones necesarias y suficientes para que un controlador LQG de orden reducido localmente optima 2 Por ultimo una palabra de precaucion LQG optimalidad no garantiza automaticamente buenas propiedades de solidez 8 La estabilidad robusta del sistema de circuito cerrado debe ser revisado por separado despues de que el controlador LQG ha sido disenado Promover robustez algunos de los parametros del sistema puede suponer estocastico en lugar de determinista El problema de control mas dificil asociada conduce a un controlador optimo similar de la cual solo los parametros del controlador son diferentes 3 Indice 1 Descripcion matematica del problema y la solucion 1 1 Tiempo continuo 1 2 Tiempo discreto 2 ReferenciasDescripcion matematica del problema y la solucion EditarTiempo continuo Editar Considere el sistema dinamico lineal x t A t x t B t u t v t displaystyle dot mathbf x t A t mathbf x t B t mathbf u t mathbf v t y t C t x t w t displaystyle mathbf y t C t mathbf x t mathbf w t donde x displaystyle mathbf x representa el vector de las variables de estado del sistema u displaystyle mathbf u el vector de las entradas de control y y displaystyle mathbf y el vector de salidas medidas disponibles para la retroalimentacion Tanto ruido blanco gaussiano aditivo sistema v t displaystyle mathbf v t y aditivo blanco gaussiano ruido de medicion w t displaystyle mathbf w t afectar el sistema Teniendo en cuenta este sistema el objetivo es encontrar la historia entrada de control u t displaystyle mathbf u t que en cada momento t displaystyle mathbf t puede depender solo de las ultimas mediciones y t 0 t lt t displaystyle mathbf y t 0 leq t lt t de tal manera que la siguiente funcion de costo se minimiza J E x T T F x T 0 T x T t Q t x t u T t R t u t d t displaystyle J E left mathbf x mathrm T T F mathbf x T int 0 T mathbf x mathrm T t Q t mathbf x t mathbf u mathrm T t R t mathbf u t dt right F 0 Q t 0 R t gt 0 displaystyle F geq 0 quad Q t geq 0 quad R t gt 0 donde E displaystyle mathbf E denota el valor esperado La hora final horizonte T displaystyle mathbf T puede ser finito o infinito Si el horizonte tiende a infinito el primer termino x T T F x T displaystyle mathbf x mathrm T T F mathbf x T de la funcion de coste se convierte en insignificante e irrelevante para el problema Ademas de mantener los costos finitas la funcion de coste hay que tener para ser J T displaystyle mathbf J T El controlador LQG que resuelve el problema de control de LQG se especifica mediante las siguientes ecuaciones S t A T t S t S t A t S t B t R 1 t B T t S t Q t displaystyle dot S t A mathrm T t S t S t A t S t B t R 1 t B mathrm T t S t Q t S T F displaystyle mathbf S T F x t A t x t B t u t L t y t C t x t x 0 E x 0 displaystyle dot hat mathbf x t A t hat mathbf x t B t mathbf u t L t left mathbf y t C t hat mathbf x t right hat mathbf x 0 mathbb E left mathbf x 0 right u t K t x t displaystyle mathbf u t K t hat mathbf x t La matriz L t displaystyle mathbf L t se llama la ganancia de Kalman del filtro de Kalman asociado representado por la primera ecuacion En cada momento t displaystyle mathbf t este filtro genera estimaciones x t displaystyle hat mathbf x t del Estado x t displaystyle mathbf x t usando las mediciones y entradas pasadas La ganancia de Kalman L t displaystyle mathbf L t se calcula a partir de las matrices A t C t displaystyle mathbf A t C t las dos matrices de intensidad V t W t displaystyle mathbf V t W t asociado a los ruidos gaussianos blancos v t displaystyle mathbf v t and w t displaystyle mathbf w t y finalmente E x 0 x T 0 displaystyle mathbb E left mathbf x 0 mathbf x mathrm T 0 right Estas cinco matrices determinan la ganancia de Kalman a traves de la siguiente ecuacion diferencial de Riccati asociada a la matriz P t A t P t P t A T t P t C T t W 1 t C t P t V t displaystyle dot P t A t P t P t A mathrm T t P t C mathrm T t mathbf W 1 t C t P t V t P 0 E x 0 x T 0 displaystyle P 0 mathbb E left mathbf x 0 mathbf x mathrm T 0 right Dada la solucion P t 0 t T displaystyle P t 0 leq t leq T la ganancia de Kalman es igual L t P t C T t W 1 t displaystyle mathbf L t P t C mathrm T t W 1 t La matriz K t displaystyle mathbf K t se llama la matriz de ganancia de retroalimentacion Esta matriz esta determinada por las matrices A t B t Q t R t displaystyle mathbf A t B t Q t R t and F displaystyle mathbf F a traves de la siguiente ecuacion diferencial de Riccati asociada a la matriz Dada la solucion S t 0 t T displaystyle mathbf S t 0 leq t leq T la ganancia de Kalman es igual K t R 1 t B T t S t displaystyle mathbf K t R 1 t B mathrm T t S t Observe la similitud de las dos ecuaciones diferenciales de la matriz de Riccati la primera que corre hacia adelante en el tiempo la segunda que corre hacia atras en el tiempo Esta similitud se llama dualidad La primera ecuacion diferencial de la matriz de Riccati resuelve el problema de estimacion lineal cuadratica LQE La ecuacion diferencial de la segunda matriz Riccati resuelve el problema del regulador lineal cuadratico LQR Estos problemas son duales y juntos resuelven el problema de control lineal cuadratico Gaussiano LQG Entonces el problema de LQG se separa en el problema LQE y LQR que se puede resolver de forma independiente Por lo tanto el problema de LQG se llama separable Cuando A t B t C t Q t R t displaystyle mathbf A t B t C t Q t R t y las matrices de intensidad de ruido V t displaystyle mathbf V t W t displaystyle mathbf W t no dependen de t displaystyle mathbf t y cuando T displaystyle mathbf T tiende a infinito el controlador LQG se convierte en un sistema dinamico invariante en el tiempo En ese caso ambas ecuaciones diferenciales de la matriz de Riccati pueden ser reemplazadas por las dos ecuaciones de Riccati algebraicas asociadas Tiempo discreto Editar Dado que el problema de control de LQG en tiempo discreto es similar al del tiempo continuo la siguiente descripcion se centra en las ecuaciones matematicas Las ecuaciones del sistema lineal de tiempo discreto son x i 1 A i x i B i u i v i displaystyle mathbf x i 1 A i mathbf x i B i mathbf u i mathbf v i y i C i x i w i displaystyle mathbf y i C i mathbf x i mathbf w i Referencias Editar Athans M 1971 The role and use of the stochastic Linear Quadratic Gaussian problem in control system design IEEE Transaction on Automatic Control AC 16 6 529 552 doi 10 1109 TAC 1971 1099818 a b Van Willigenburg L G De Koning W L 2000 Numerical algorithms and issues concerning the discrete time optimal projection equations European Journal of Control 6 1 93 100 Associated software download from Matlab Central a b Van Willigenburg L G De Koning W L 1999 Optimal reduced order compensators for time varying discrete time systems with deterministic and white parameters Automatica 35 129 138 doi 10 1016 S0005 1098 98 00138 1 Associated software download from Matlab Central Zigic D Watson L T Collins E G Haddad W M Ying S 1996 Homotopy methods for solving the optimal projection equations for the H2 reduced order model problem International Journal of Control 56 1 173 191 doi 10 1080 00207179208934308 Collins Jr E G Haddad W M Ying S 1996 A homotopy algorithm for reduced order dynamic compensation using the Hyland Bernstein optimal projection equations Journal of Guidance Control amp Dynamics 19 2 407 417 doi 10 2514 3 21633 Hyland D C Bernstein D S 1984 The optimal projection equations for fixed order dynamic compensation IEEE Transaction on Automatic Control AC 29 11 1034 1037 doi 10 1109 TAC 1984 1103418 Bernstein D S Davis L D Hyland D C 1986 The optimal projection equations for reduced order discrete time modeling estimation and control Journal of Guidance Control and Dynamics 9 3 288 293 doi 10 2514 3 20105 Green Limebeer Linear Robust Control p 27 Datos Q1798304Obtenido de https es wikipedia org w index php title Control lineal cuadratico gaussiano amp oldid 133137486, wikipedia, wiki, leyendo, leer, libro, biblioteca,

español

, española, descargar, gratis, descargar gratis, mp3, video, mp4, 3gp, jpg, jpeg, gif, png, imagen, música, canción, película, libro, juego, juegos