Mathematics | Higher education » Folytonos rendszerek leírása az állapottérben

Datasheet

Year, pagecount:2004, 37 page(s)

Language:Hungarian

Downloads:63

Uploaded:May 05, 2007

Size:99 KB

Institution:
-

Comments:

Attachment:-

Download in PDF:Please log in!



Comments

No comments yet. You can be the first!

Content extract

1 3. Folytonos rendszerek leírása az állapottérben Számos tudományos és mérnöki terület használja dinamikus rendszerek leírására az úgynevezett állapotegyenleteket. Az állapotteres leírás szükségességét többféle módon származtatják Talán a legegyszerûbb annak a felismerése, hogy bonyolult dinamikus rendszerek igen széles osztályának mûködését viszonylag nagy pontossággal modellezhetjük elsôrendû vektor differenciál egyenlettel dx = x˙ = f ( x , u) dt (3.1) y = g( x , u) Az állapotváltozónak nevezett x vektor a skalár xi komponenseket gyûjti vektorba. Az u a rendszer bemenô, az y pedig a kimenô jele. Az x állapotvektor dimenzióját a rendszer rendjének nevezzük Az f ( x,u) függvény az állapotvektor "sebességét" adja az állapot és a bemenôjel függvényében. A g( x, u) függvényt érzékelési illetve mérési függvénynek nevezzük, mivel a rendszer kimenôjelét szolgáltatja. Vegyük észre, hogy itt f (

x,u) és g( x, u) nem függ explicit módon az idôtôl. (Ezt a tulajdonságot véletlenül se keverjük össze azzal, hogy természetesen az állapotegyenlet jelei idôtôl függnek !!!) Az ilyen rendszereket idôinvariánsnak hívjuk. Az állapotváltozókat olyan változóknak is szokták hívni, amelyek összefoglalják a rendszer múltjára vonatkozó információkat, hogy a jelek jövôbeli értékeit jósolni tudjuk, ezért az állapotvektor a rendszer memóriáját is jelentheti. Mérnöki rendszerekben az állapotváltozók igen sokszor kapcsolódnak olyan alapvetô fizikai folyamatokhoz, ahol tömeg, áram, impulzus, energia, stb. tárolásához szükséges összefüggéseket kell kiszámítanunk. (Felhívjuk a figyelmet, hogy egyes szakterületeken - például kémiában - az állapotváltozó megnevezés nem egyezik meg a fenti általános rendszerelméleti fogalommal, sokkal 2 inkább a vizsgálat tárgyát képezô anyag, elegy, oldat, stb. fiziko-kémiai

állapotára utaló változókat jelenti: nyomás, hômérséklet, összetétel, stb.) Az állapotváltozók, mint koordináták egy teret - az állapotteret (state space) - definiálnak. Ebben a térben helyezkedik el az x ( t ) állapotvektor. Végpontjának elmozdulása jelenti a rendszer mozgását Az állapotvektor végpontja által leírt görbe az állapottrajektória. A (3.1) egyenlet párral adott rendszer a nemlineáris dinamikus rendszerek egy speciális osztályát jelenti, amelynek lehetséges ( x o ,uo ) egyensúlyi állapota (ahol ẋ = 0), amely az f ( x o ,uo ) = 0 (3.2) egyenletbôl adódik. (Jegyezzük meg, hogy általános esetben több egyensúlyi állapot is adódhat Az egyensúlyi állapotok különbözô jellegû stabilitási állapotokat jelenthetnek. Ezek minôségi vizsgálatához az f ( x,u) másodrendû deriváltjainak vizsgálata is szükséges.) Statikus rendszerek elfajult állapotegyenlettel írhatók le, hiszen nincs memóriájuk, illetve az ennek

megfelelô állapotuk, tehát leírásukhoz a (3.1) egyenletpár második egyenlete elegendô: y = g( u) (3.3) Taylor sorba fejtve a most skalár egyenletet az uo pontban az y = g( u o ) + d g( u o ) (u − uo ) + K = g(uo ) + g′(uo ) (u − uo ) + K du (3.4) 3 alakra jutunk, amelynek elsôrendû tagjából az y − yo = ∆y = y − g( uo ) = g′( uo ) ( u − uo ) = g′( uo ) ∆u (3.5) linearizált modellt kapjuk. A linearizált model az uo munkapontban az eredeti görbét az érintôjével helyettesíti és a munkapont körüli (∆y, ∆u) megváltozások között teremt statikus lineáris kapcsolatot. Lényegében hasonló gondolatmenet alapján végezhetjük el a (3.1) állapotegyenlet linearizálását is Az ( x o ,uo ) egyensúlyi állapot körüli kis megváltozásokra érvényes x = x o + ∆x ; u = uo + ∆u ; y = y o + ∆y (3.6) jelölésekkel számítsuk ki a (3.1) elsôrendû linearizált közelítését d f ( x o , uo ) d f ( x o , uo ) dx ∆ +

∆u x = f ( x o + ∆x , uo + ∆u) ≈ f ( x o , uo ) + dt du d xT y = g( x o + ∆x , uo + ∆u) ≈ g( x o , uo ) + d g( x o , u o ) d xT d g( x o , u o ) ∆x + ∆u du (3.7) Használjuk fel, hogy az egyensúlyi pontban f ( x o ,uo ) = 0 és vezessük be az yo = g( x o , uo ) jelölést, így a kis megváltozásokra érvényes linearizált modellünk az alábbi alakú lesz d ( x − x o ) d ∆x = = A( x − x o ) + b ( u − uo ) = A∆x + b ∆u dt dt y − yo = ∆y = c T ( x − x o ) + d ( u − uo ) = c T ∆x + d ∆u (3.8) 4 ahol bevezettük az A= c = T d f ( x o , uo ) d xT d g( x o , u o ) d xT ; b= d f ( x o , uo ) du d g( x o , u o ) ; d= du (3.9) jelöléseket. A kapott modell egy lineáris idô invariáns (Linear Time-Invariant = LTI), azaz idôben nem változó rendszer. Eléggé elterjedt gyakorlat, hogy az egyszerûség kedvéért a jelölt megváltozások ( ∆x, ∆u, ∆y) helyett az eredeti ( x, u, y) változókat használjuk és mindig

munkapont körüli megváltozásokra gondolunk. Így kapjuk a rendszer- és irányításelmélet általánosan használt lineáris (LTI) állapotegyenletét dx = Ax + b u dt (3.10) y = cT x + d u Itt A, b, c T , d a rendszer paraméter mátrixai. Mivel a jegyzetben egy bemenetû - egy kimenetû (Single Input - Single Output = SISO) rendszerekkel foglalkozunk, ezért n-edrendû esetben az A egy (n × n) -es négyzetes mátrix, az u.n állapotmátrix, a b egy (n × 1) -es oszlopvektor, a c T egy (1 × n) -es sorvektor és d skalár. A (310) állapotegyenletnek megfelelô blokkvázlat a 31 ábrán látható 5 d x(0) + u b ẋ + ∫ x cT + y + A 3.1 ábra Lináris idô invariáns rendszer állapotegyenletének megfelelô blokkvázlat 3.1 Az állapotegyenletek megoldása a fekvencia tartományban A frekvencia tartományba az állapotegyenletek a (3.10) Laplace transzformációjával vihetôk át Jelölje az x, u, y idôfüggvények transzformáltját X (s ),U (s ),Y (s

) . Figyelembevéve a differenciálhányados transzformálásának a szabályait sX ( s ) = A X ( s ) + b U ( s ) + x (0) = A X ( s ) + b U ( s ) + I x (0) Y (s ) = c T X (s ) + d U (s ) (3.11) Az elsô egyenletben a kezdeti feltételek x (0) vektora olyan bemenôjelnek tekinthetô, amely egy egységmátrixon keresztül hat a rendszerre. Az elsô egyenletbôl kapjuk, hogy 6 X ( s ) = ( sI − A) −1 [bU (s ) + x (0)] = (sI − A)−1 bU (s ) + (sI − A)−1 x (0) (3.12) ahol I az egységmátrix. A mátrix invertálás szabályai szerint −1 (sI − A) = adj ( sI − A) adj ( sI − A) = det ( sI − A) K(s ) (3.13) Itt adj (sI − A) olyan mátrix transzponáltja, amelynek elemei az ( sI − A) mátrix megfelelô elemeihez tartozó elôjeles aldeterminánsok. A det ( sI − A) pedig az ( sI − A) mátrix determinánsa, amely s -nek nedfokú polinomja K ( s ) = s n + k1 s n −1 + K + k n −1 s + k n = det ( sI − A) (3.14) A K (s ) az A mátrix karakterisztikus

polinomja, a K ( s ) = 0 karakterisztikus egyenlet s1 ,K s n gyökei pedig az A mátrix sajátértékei, amelyeket a rendszer pólusainak nevezünk. A (3.13) egyenlet számlálójában álló mátrix elemei is s -nek a polinomjai, amelyek azonban - mivel ( n −1)-edrendû aldeterminánsból származnak - legfeljebb ( n −1)-edfokúak, következésképpen az egyes elemek és a K( s ) hányadosa szigorúan szabályos átviteli függvényeket képez. A (3.12) szerint az állapotvektor mozgását az x (0) kezdeti állapot és az U ( s ) bemenô jel határozza meg. Az x (0) -tól függô rész valamennyi elemének nevezôjében a karakterisztikus polinom áll, ezért a kifejtési tételbôl következôen idôfüggvényeiket kizárólag a rendszer pólusai határozzák meg. A megoldásnak ez a része a nyugalmi helyzebôl kitérített és magára hagyott rendszer mozgását írja le és 7 mind a frekvencia, mind az idôtartományban kizárólag a rendszer paraméterek egyikétôl, az

A állapotmátrixtól függ. A megoldásnak az U ( s ) -tôl függô összetevôjében az egyes elemek nevezôje K ( s ) -en kívül az U ( s ) nevezô polinomját is tartalmazza, így az idôfüggvények nemcsak a rendszer, hanem a bemenôjel pólusaitól is függenek. A megoldásnak ez a része a gerjesztett rendszer mozgását írja le A kimenôjel a (3.11) és ((312) egyenletekbôl Y ( s ) = c T ( sI − A) −1 [bU (s ) + x (0)] + d U (s ) (3.15) A gerjesztett mozgás kimenô jele, amikor x (0) = 0 [ −1 ] Y ( s ) = c T ( sI − A) b + d U ( s ) (3.16) A rendszer átviteli függvénye tehát G(s ) = Y (s ) −1 −1 = c T ( sI − A) b + d = c T ( sI − A) b d =0 U (s ) (3.17) A G ( s ) elsô tagja szigorúan szabályos, mivel csak szigorúan szabályos elemek lineáris kombinációjából áll. Ha tehát d = 0, akkor G ( s ) szigorúan szabályos, számlálója minimálisan eggyel alacsonyabb fokszámú, mint a nevezô. Ha d ≠ 0, akkor G ( s ) szabályos, azaz a

számláló fokszáma megegyezik a nevezôjével. A d fizikai jelentése: a bemenô jel közvetlen, dinamika nélküli hatása a 8 kimenô jelre. Jegyezzük meg, hogy ez a hatás nem tûnik el igen nagy frekvenciákon sem, tehát a frekvencia függvényre fennáll, hogy G ( jω ∞) = d . Ez egyben azt is jelenti, hogy az átmeneti függvény ugrása a t = 0 pillanatban v( t = 0) = d . A gyakorlatban a d ≠ 0 esetet az ỹ = y − d u új kimenôjel bevezetésével rendszerint visszavezetjük a d = 0 esetre. A d ≠ 0 esetre azt is mondhatjuk, hogy nem megfelelôen történt a munkaponti linearizálás, ami korrekcióra szorul. 3.2 Az állapotegyenletek megoldása az idôtartományban A (3.10) állapotegyenletek idôtartománybeli megoldása az t  t A t −τ  A t −τ x ( t ) = e A t x (0) + ∫ e ( ) b u( τ ) d τ = e A t x (0) +  ∫ e ( ) u( τ ) d τ b 0  0 (3.21) zárt formában is elôállítható. Az elsô tag az x (0) kezdeti értékbôl induló

magára hagyott rendszer mozgása; a második tag - a konvolúciós integrál - az x (0) = 0 kezdeti értékbôl induló gerjesztett mozgás. A (3.21) ellenôrzése képpen deriváljuk a fenti egyenletet idô szerint t d x (t ) A t −τ = A e A t x (0) + ∫ A e ( ) b u( τ ) d τ + b u( t ) = A x ( t ) + b u(t ) dt 0 (3.22) ami igazolja a (3.21) egyenlet helyességét Itt e A t a rendszer alapmátrixa, amelyet minden t-re konvergens Taylor sora definiál, mint a mátrix függvényeket általában 9 eAt = I + At + 1 1 2 n ( A t) + K + ( A t) + K 2 n! (3.23) Differenciálva az egyenletet az alapmátrix egy érdekes és fontos tulajdonságát kapjuk d eAt 1 1 = A + A2 t + A3 t 2 + K + A n t n −1 + K = 2 dt (n − 1)!   1 1 2 n = A  I + A t + ( A t ) + K + ( A t ) + K = A e A t = e A t A   2 n! (3.24) A (3.12) és (321) egyenletek összevetésébôl kapjuk az U (s ) = 0 esetre az alapmátrix Laplacetranszformáltját { } L e A t = ( sI − A) −1 =

Φ(s ) (3.25) amely alapján egy újabb összefüggést kapunk az alapmátrix kiszámítására { e A t = L−1 ( sI − A) −1 }=L −1 {Φ(s )} (3.26) A (3.10) és (321) egyenleteket kombinálva a rendszer kimenô jele  t A t −τ  y( t ) = c T e A t x (0) + c T  ∫ e ( ) u( τ ) d τ b + d u(t ) 0  (3.27) 10 Zérus kezdeti feltételekre ( x (0) = 0) és d = 0 esetén az u( t ) = δ( t ) gerjesztésre az utolsó egyenletbôl egyszerûen kaphatjuk a rendszer súlyfüggvényét { w( t ) = c T e A t b = c T L−1 ( sI − A) −1 } b = L {c −1 T −1 (sI − A) b} = L−1 {G(s ) d =0 } (3.28) (A mátrix függvények és a CAYLEY-HAMILTON tétel következtében az alapmátrix véges összeg −1 formájában is számítható e A τ = α o ( τ ) I + α1 ( τ ) A + K + α n-1 ( τ ) A n −1 illetve e A t = L−1 ( sI − A) = L−1 {Φ( s )}). { } 11 3.3 Az állapotegyenletek transzformációja A rendszer bemenô és kimenô jele

rendszerint konkrét fizikai változó, az állapotváltozók, viszont függnek a választott koordináta rendszertôl. Az A, b, c T paraméter mátrixok szintén függnek a koordináta rendszertôl. Vezessük be a z új állapotvektort, amely az eredeti x-bôl a z = T x lineáris transzformációval származtatható, ahol T reguláris. A (310) felhasználásával az új állapotegyenlet dz ˜ x + b˜ u = T ( A x + b u) = T AT −1 z + T b u = A dt y = c T x + d u = c T T −1 z + d u = ˜c T z + d˜ u (3.31) ahol à = T AT −1 ; b̃ = T b ; c̃ T = c T T −1 ; d̃ = d (3.32) Egyszerû ellenôrizni, hogy a rendszer súlyfüggvénye és átviteli függvénye invarians a lineáris transzformációra ˜ w( t ) = ˜c T e A t b˜ = c T T −1eT AT −1 t ( T b = cTe A t b ˜ )−1 b˜ = c T T −1 sI − T AT −1 G ( s ) = ˜c T (sI − A ) −1 (3.33) −1 T b = c T (sI − A) b A (3.33)-ban figyelembe vettük az egyszerûen belátható (3.34) 12 (e T AT −1)

t = Te A t T −1 (3.35) azonosságot. Ismeretes, hogy a lineáris transzformációk rendelkeznek kitüntetett irányokkal (vi ), amelyekben a vektorok irányát megtartják, csak hosszúságukat változtatják λ i -szeresére, azaz Avi = λ i vi ; i = 1,K , n (3.36) Itt vi az A mátrix sajátvektora, az λ i pedig a hozzátartozó sajátérték. A sajátérték probléma más formában, mint homogén n ismeretlenes egyenletrendszer is felírható (λ i I − A) v = 0 (3.37) ahol az ismeretlenek a v komponensei. Az egyenletnek akkor van a triviálistól ( v = 0) eltérô megoldása, ha teljesül a det ( λ i I − A) = K ( λ i ) = 0 (3.38) feltétel, azaz az λ i sajátértékek a karakterisztikus polinom gyökei. Ha az egyenlet gyökei egyszeresek, akkor összesen n darab sajátérték van és mindegyikhez egyetlen egységnyi hosszúságú sajátvektor határozható meg. Diagonális kanonikus alak 13 Egyszeres sajátértékek esetén speciális Td transzformációs

mátrix megválasztásával elérhetô, hogy Td A (Td ) −1 diagonális legyen λ 1  0 −1 Ãd = Td A (Td ) = Λ =  M  0 0 λ2 M 0 K 0  K 0 O M  K λn (3.39) A szükséges Td transzformációs mátrix a sajátvektorok mátrixának inverze Td = [v1 , v 2 ,K , v n ] −1 (3.310) A diagonális transzformációval kapott kanonikus állapotegyenlet (diagonális alak) λ 1  dz  0 = dt  M  0 y = [ γ1 0 K 0  β1     λ 2 K 0  β 2  z+ u = Λz +βu M O M M    0 K λ n  β n  (3.311) γ2 K γn ] z + d u = γ T z + d u A transzformált rendszer átviteli függvénye βi γ i +d i =1 s − λ i n G(s ) = ∑ (3.312) 14 A kanonikus alakból tehát az átviteli függvény részlettörtes formában adódik. Vegyük észre, hogy az A mátrix sajátértékei vannak a nevezôben. Az átviteli függvény változatlan marad, ha βi és γ i úgy változnak, hogy szorzatuk

állandó marad. Így végtelen sok olyan kanonikus alak van, amelyek a β és γ T mátrixokban különböznek, de átviteli függvényük közös. Egyszeres pólusok esetén kanonikus koordinátákban az állapotegyenlet rendszer n egymástól független elsôrendû differenciálegyenletre esik szét. Az állapotváltozók elkülönülnek és a rendszer egy-egy pólusához rendelhetôk. Ha a karakterisztikus egyenletnek többszörös gyöke van, az Ãd mátrix csak kivételes esetekben diagonalizálható, általában azonban Jordan alakra hozható  J1  0 J = M  0 0 K 0  J2 K 0  M O M   0 K Jm  (3.313) Itt Ji a λ i sajátértékhez rendelt, a sajátérték multiplicitásával megegyezô rendszámú négyzetes mátrix, amelynek fôátlójában a sajátértékek, az attól jobbra esô elsô mellékátlóban egyesek állnak, a többi elem zérus. Ha például λ1 háromszoros sajátérték, a J1 részmátrix λ 1  J1 =  0  0 1 λ1

0 alakú lehet. 0  1 λ1  (3.314) 15 (Az egyesek száma attól függ, hogy a többszörös λ1 sajátértékhez hány egymástól lineárisan független sajátvektor található. Ha csupán egyetlen - ez a (3311)-nek megfelelô normális eset - a mellékátló valamennyi eleme egyes. Ha ehhez képest a független sajátvektorok száma eggyel nô, az egyesek száma eggyel csökken. Ha létezik a multiplicitással azonos számú független sajátvektor, a Jordan mátrix diagonális. Ettôl az esettôl eltekintve a transzformációs mátrix megkeresése a korábbiaktól eltérô megfontolásokat igényel, amelyekre itt nem térünk ki.) Irányíthatósági kanonikus alak Jóllehet az állapotegyenleteket a modellezési gyakorlatban rendszerint közvetlenül írjuk fel a fizikai változókra megfogalmazott differenciál egyenletek alapján, számos alkalommal elôfordul, hogy a kiindulási információ egy átviteli függvény illetve a neki megfelelô n-edrendû

lineáris differenciál egyenlet. Ezt az eljárást az állapotegyenletek felírásának, konstruálásának (rekonstruálásának) is szokták nevezni. Tegyük fel, hogy egy rendszer mûködését az alábbi differenciálegyenlet írja le dn y d n −1 y d n −1 u + a1 n −1 + K + a n y = b1 n −1 + K + bn u d tn dt dt (3.315) A Laplace-transzformáltakra érvényes egyenlet B (s ) b1 s n −1 + K + bn −1 s + bn Y (s ) = n U s = U (s ) = G (s )U (s ) ( ) A(s ) s + a1 s n −1 + K + a n −1 s + a n Vezessük be az alábbi állapotváltozókat Laplace-transzformáltjaikkal együtt (3.316) 16 s n −1 X1 ( s ) = U (s ) A(s ) 1 s n−2 X 2 (s ) = U ( s ) = X1 ( s ) A(s ) s M X n (s ) = 1 1 U ( s ) = X n −1 ( s ) A(s ) s d x2 = x1 dt (3.317) M d xn = x n −1 dt amelyek alapján sX1 ( s ) = −a1 X1 ( s ) − K − a n X n ( s ) + U ( s ) Y (s ) = b1 X1 (s ) + K + bn X n (s ) d x1 = −a1 x1 − K − a n x n + u dt (3.318) y = b1 x1 + K + bn x n Az eredményül

kapott állapotegyenletek tehát most az alábbiak −a1 −a 2  1 0 dx  = 0 1 dt  M  M  0 0 K −a n −1 −a n  1    K 0 0  0 K 0 0  x + 0 u    O M M   M K 1 0  0 y = [b1 b2 K bn −1 bn ] x (3.319) 17 Ezt az alakot a hozzátartozó speciális felépítésû −a1 −a 2  0  1 Ac =  0 1  M  M  0 0 K −a n −1 −a n   K 0 0  K 0 0   O M M  K 1 0  1   0 ; bc = 0 ; ccT = [b1    M 0 b2 K bn −1 bn ] (3.320) rendszermátrixokkal irányíthatósági (controllability) kanonikus alaknak vagy fázisváltozós alaknak hívjuk. Jellegzetessége, hogy - az utolsót kivéve - mindegyik állapotváltozó a hatásirányban következô állapotváltozó deriváltja, és valamennyi az elsô állapotváltozó bemenetére van visszacsatolva. A visszacsatolási tényezôk a karakterisztikus

egyenlet negatív együtthatói, amelyek így az A mátrix elsô sorában jelennek meg. A bemenô jel csak x1 -re hat A kimenô jelet képezô elôrecsatoló tényezôk az átviteli függvény számlálójának együtthatói. Amennyiben a G ( s ) nem szigorúan szabályos, tehát B ( s ) = bo s n + b1 s n −1 + K + bn −1 s + bn , az állapotegyenletben d = bo is szerepel. Az eredeti bi együtthatók helyett viszont a bi′ együtthatók szerepelnek, amelyeket a B ( s ) bo s n + b1 s n −1 + K + bn −1 s + bn b1′ s n −1 + K + bn′ −1 s + bn′ G(s ) = = = bo + n A ( s ) s n + a1 s n −1 + K + a n −1 s + a n s + a1 s n −1 + K + a n −1 s + a n (3.321) felbontással kapunk. Itt a második tag már szigorúan szabályos és a számláló együtthatói a bi′ = bi − bo ai összefüggéssel számíthatóak. 18 Az irányíthatósági kanonikus alak karakterisztikus polinomja s + a1   −1 K ( s ) = det  0   M  0 a 2 K a n −1 s K 0 −1 K

0 M O M 0 K −1 an   0 0  = Kn ( s ) = sKn −1 ( s ) + a n  M s  (3.322) ahol a rekurzív összefüggést az utolsó sor szerinti kifejtéssel kapjuk. Egyszerûen belátható, hogy K ( s ) = Kn ( s ) = s n + a1 s n −1 + K + a n −1 s + a n = A (s ) (3.323) azaz a karakterisztikus egyenlet az átviteli függvény nevezôje. Jegyezzük meg, hogy az  0   M Ac =  0   0 −a n 1 M 0 0 −a n −1 K 0 O M K 1 K 0 K −a 2 0 0     M  0 0  ; bc = 0    1   M 1 −a1  ; ccT = [bn bn −1 K b2 b1 ] (3.323) paramétermátrix választás szintén irányíthatósági kanonikus alakot ad, ahol az állapotváltozók jelölésekor a sorszám fordított az elôzô (3.319) alakhoz képest 19 Megfigyelhetôségi kanonikus alak Ennek az alaknak a konstruálásához válasszuk az állapotváltozókat Laplace-transzformáltjaikkal a következô rekurzív

megfogalmazás alapján X1 ( s ) = Y ( s ) sX1 ( s ) = −a1 X1 ( s ) + X 2 ( s ) + b1U ( s ) sX 2 ( s ) = −a 2 X 2 (s ) + X 3 ( s ) + b2U ( s ) d x1 = −a1 x1 + x 2 + b1 u dt d x2 = −a 2 x 2 + x 3 + b2 u dt (3.324) M sX n ( s ) = −a1 X1 ( s ) + bnU ( s ) d xn = −a n x n + bn u dt ahol Y ( s ) a (3.316) szerinti Az összefüggések alapján az alábbi állapotegyenleteket írhatjuk fel −a1  −a 2 dx  = M dt  −a n −1 −a n 1 0 M 0 0 0 1 M 0 0 K K O K K 0 b1     0 b2  0 x + M  u    1  bn −1  0 bn  y = [1 0 K 0 0] x Ezt az alakot a hozzátartozó speciális felépítésû (3.325) 20 −a1  −a 2 Ao = M  −a n −1 −a n 1 0 M 0 0 0 1 M 0 0 K K O K K 0  0 M  1 0 b1    b 2    ; bo = M    bn −1  bn  ; coT = [1 0 K 0 0] (3.326) rendszermátrixokkal

megfigyelhetôségi (observability) kanonikus alaknak hívjuk. Jellegzetessége, hogy az x1 állapotváltozó maga a kimenôjel, amely valamennyi állapotváltozó bemenetére vissza van csatolva. A visszacsatolási tényezôk a karakterisztikus egyenlet negatív együtthatói, amelyek így az A mátrix elsô oszlopában jelennek meg. Jegyezzük meg, hogy az 0  1 Ao = M  0 0 K K O K K 0 0 M 1 0 0 0 M 0 1 −a n   −a n −1   M  −a 2  −a1  bn    bn −1  ; bo = M  ; coT = [0 0 K 0 1]   b2  b1  (3.327) paramétermátrix választás szintén megfigyelhetôségi kanonikus alakot ad, ahol az állapotváltozók jelölésekor a sorszám fordított az elôzô (3.325) alakhoz képest Amennyiben a G ( s ) nem szigorúan szabályos, az állapotegyenletben d = bo is szerepel és érvényesek az elôzôekben a (3.321) felbontással kapcsolatban mondottak 21 (Ha az átviteli függvény

pólusai és részlettörtes alakja is ismert, akkor további kanonikus alakok konstruálhatók.) 3.4 Az irányíthatóság és megfigyelhetôség fogalma Az irányítás lényeges kérdése, hogy a bemenô jellel valamennyi állapotváltozó tetszôlegesen befolyásolható-e. Erre a kérdésre a KÁLMÁN által bevezetett irányíthatóság ad választ A rendszer állapotirányítható, ha az állapotvektora az u irányítás hatására tetszôleges x ( t o ) kezdeti állapotból ( t v − t o ) idô alatt a tetszôlegesen elôírt x ( t v ) állapotba vihetô át. Ha a definíció csak a kimenô jelre teljesül, kimeneti irányíthatóságról van szó. Lineáris idô invariáns rendszereknél a kezdeti idôpontot ( t o = 0)-ra, így a kezdeti állapotot x (0) -ra választhatjuk. Ilyenkor az irányíthatóság rendszerhez kötôdô fogalom. Ha valamilyen kezdeti állapotra teljesül, bármilyen állapotból kiindulva is fennmarad, hiszen pl. az x (0) -ból megfelelô irányító

jellel x ( t o ) -ba vihetô az állapotvektor Az irányíthatóság kanonikus koordinátákban mutatkozik meg a legszemléletesebben. Ha a (3311) kanonikus alakban valamelyik állapotváltozóra βi zérus, akkor ez az állapot nem irányítható. Ez annyit jelent, hogy ilyenkor a λ i sajátértékhez tartozó sajátvektorra semmilyen irányítás nem képez párhuzamos összetevôt, csak merôlegeset, tehát az irányítás hatása mindig a sajátvektorra merôleges síkban marad. A kanonikus alak alapfeltételébôl következve a rendszer csak akkor állapotirányítható, ha a kanonikus koordináták pólusai különböznek. Attól, hogy a rendszer nem állapotirányítható, kimenô jele még irányítható lehet mindaddig, amíg legalább egy állapotváltozó irányítható és erre a változóra vonatkozó γ i nem zérus (lásd a (3.311)-t) 22 A kanonikustól eltérô koordinátákban az állapováltozók kölcsönös összefüggése miatt az elôzôekben megfogalmazott

feltételek nem ismerhetôk fel közvetlenül, ezért általánosabb kritériummal kell azokat helyettesíteni. Az egyszerûség kedvéért x (0) = 0 kezdeti feltételt választva az állapotegyenlet (3.21) megoldása  t A t −τ  t  x ( t ) =  ∫ e ( ) u( τ ) d τ b =  ∫ e A τ u(t − τ ) d τ b 0  0  (3.41) alakú, ahol az alapmátrix véges összegû alakját felhasználva írhatjuk, hogy e A τ = α o ( τ ) I + α1 ( τ ) A + K + α n -1 ( τ ) A n −1 (3.42) Az állapotegyenlet megoldása így az alábbi zárt alakban adódik t t t 0 0 0 x ( t ) = b ∫ α o ( τ ) u( τ ) d τ + Ab ∫ α1 ( τ ) u( τ ) d τ + K + A n −1b ∫ α n-1 ( τ ) u( τ ) d τ (3.43) Az egyenlet jobb oldala tehát az [ Mc = b Ab K A n −1b ] (3.44) irányíthatósági (controllability) mátrix oszlopainak a lineáris kombinációja. Ezért az a feltétel, hogy az állapottér minden pontját elérhessük azt jelenti, hogy az M c -nek n

darab lineárisan független oszlopának kell lennie, azaz M c invertálható, reguláris legyen. Mivel M c az A-tól és b-tôl függ ezért az A;b pár irányíthatóságáról is szokás beszélni. 23 Az elôzô megállapításokat értelemszerûen a kimenôjelre vonatkoztatva a kimeneti irányíthatóság feltétele, hogy [ m cT = c T b c T Ab K c T A n −1b ] (3.45) legalább egy eleme nem zérus. A (3.319) irányíthatósági kanonikus alak irányíthatósági mátrixa speciális 1  0 M cc = M  0 0 a1 a 2 1 a1 M M 0 0 0 0 K K O K K −1 a n −1   a n−2   M  a1  1  (3.46) ( ) amit az alábbiak szerint láthatunk be egyszerûen, ha képezzük az M cc M cc [b c Ac bc 1  0 n −1 K ( Ac ) bc M  0 0 ] a1 a 2 K a n −1   1 a1 K a n − 2   = [w o M M O M  0 0 K a1  0 0 K 1  w1 w 2 K w n -1 ] −1 szorzatot (3.47) 24 Az Ac és bc rendszermátrixok (3.320)

szerinti speciális felépítése alapján írhatjuk, hogy w o = bc w1 = a1bc + Ac bc M (3.48) w n -1 = a n -1bc + a n -2 Ac bc + K + ( Ac ) n -1 bc ahol a következô rekurzív összefüggés áll fenn w k = a k bc + Ac w k −1 (3.49) A rekurzív összefüggés felhasználásával [w o w1 w 2 1  0 K w n -1 ] =0  M 0 0 0 K 0  1 0 K 0 0 1 K 0  M M O M 0 0 K 1 (3.410) adódik, ami bizonyítja a (3.45) érvényességét Az irányíthatósági kanonikus alakkal - amelyet mindig átviteli függvénybôl képezünk - kapott speciális M cc mindig reguláris, mivel egy reguláris mátrix inverze. (Háromszögmátrix determinánsa a fôátlóbeli elemek szorzata, ami most egy.) Tehát ha a rendszer szigorúan szabályos átviteli függvénye 25 a (3.321) szerinti, akkor az irányítható Ez az alak megkívánja, hogy ne szerepeljen integráló hatás, tehát A( s = 0) ≠ 0 is teljesüljön. Érdekes kérdés, hogy a z = T x

lineáris transzformáció hogyan befolyásolja a irányíthatósági mátrixot. A (3.32) egyenletek alapján írhatjuk b˜ = T b ˜ ˜ = T AT −1 T b = T Ab Ab (3.411) M ˜ n −1 b˜ = T A n −1 b A amelyek alapján [ ˜ c = b˜ M ] [ ˜˜ K A ˜ n −1b˜ = T b Ab ] Ab K A n −1b = T M c (3.412) −1 Az irányíthatósági mátrix fenti transzformációs alakja alapján a Tc = M cc ( M c ) transzformációs mátrix alkalmazásával minden irányítható rendszer irányítható kanonikus alakra hozható. Az irányíthatósági mátrixot azonban nem mindig - sôt általában nem - átviteli függvény alapján képezzük. Ilyenkor természetesen mindig közvetlenül az M c irányíthatósági mátrix vizsgálatára van szükség. 26 S u S 3.2 ábra Egy nem irányítható rendszer 3.41 Példa Egy megegyezô elsôrendû alrendszerekbôl álló rendszer (lásd a blokkvázlatot a 3.2 ábrán) teljes állapotegyenlete d x −1 0 1 = x +   u = A x

+ b u d t  0 −1 1 (3.413) Az irányíthatósági mátrix M c = [b 1 −1 Ab] =   1 −1 amely szinguláris, így a rendszer nem irányítható. (3.414) 27 Az irányítás lényeges kérdése, hogy a kimenô jel érzékelésével valamennyi állapotváltozó megfigyelhetô-e. Erre a kérdésre a KÁLMÁN által bevezetett megfigyelhetôség ad választ Az irányíthatósággal rokon megfigyelhetôség arra ad választ, hogy egy ismeretlen állapotú rendszer kimenô és bemenô jelének bizonyos ideig tartó mérése után rekonstruálható-e a mérés kezdetekor fennálló állapot. A rendszer megfigyelhetô, ha a t o < t < t v intervallumban megfigyelt y( t ) és u( t ) jelekbôl x ( t o ) meghatározható. A vizsgálatot elegendô u( t ) ≡ 0-ra, tehát a kezdeti értékek által generált mozgásra elvégezni. Legegyszerûbben ismét kanonikus koordinátákban lehet megállapítani a megfigyelhetôséget. Ennek két kritériuma van:

az y jel valamennyi kanonikus állapotváltozótól függjön; a rendszer pólusai különbözôek legyenek. Ha ugyanis (3311)-ben bármely γ i zérus, a kimenôjel nem tartalmaz információt az érintett kanonikus állapotváltozóra, így azt a mérésekbôl nem lehet rekonstruálni. Ez annyit jelent, hogy ilyenkor a λ i sajátértékhez tartozó sajátvektorra semmilyen megfigyelés nem képez párhuzamos összetevôt, csak merôlegeset, tehát a megfigyelés hatása mindig a sajátvektorra merôleges síkban marad. A kanonikustól eltérô koordinátákban az állapováltozók kölcsönös összefüggése miatt az elôzôekben megfogalmazott feltételek nem ismerhetôk fel közvetlenül, ezért általánosabb kritériummal kell azokat helyettesíteni. Amikor az irányíthatóságot tárgyaltuk, akkor a rendszer kimenetét hanyagoltuk el. Most a megfigyelhetôség tárgyalásakor a rendszer bemenetét hanyagoljuk el, ahogy azt már említettük. Tekintsük tehát az alábbi

rendszert 28 dx = Ax dt (3.415) y = cT x A kimenôjel egymásutáni deriválásával kapjuk az  y    d y  c T     T t d c A x  = M    n -1  M  d y  T n −1   d t n -1  c A  (3.416) egyenletet, amely alapján a kimenôjel és deriváltjainak megfigyelésébôl az állapotvektor egyértelmûen meghatározható, ha az c T    T c A  Mo =   M  T n −1  c A  (3.417) megfigyelhetôségi (observability) mátrixnak n darab lineárisan független sorának kell lennie, azaz M o invertálható, reguláris legyen. Mivel M o az A-tól és c T -tôl függ ezért az A;c T pár megfigyelhetôségérôl is szokás beszélni. (A (3416)-ban ( n −1)-edrendûnél magasabb deriváltak számítására a CAYLEYHAMILTON tétel következtében nincs szükség) 29 Az megfigyelhetôségi kanonikus alak megfigyelhetôségi mátrixa speciális 1 0  1 a1 M oo = a 2 a1

 M M a n −1 a n − 2 K K O K K −1 0 0  0 0 0 0  1 0 a1 1  (3.418) ( ) amit az alábbiak szerint láthatunk be egyszerûen, ha képezzük az M oo 1 0  1 a1 a 2 a1  M M a n −1 a n − 2 K K O K K 0 0 0 1 a1 −1 M oo szorzatot 0 T  w T  co 0 T   oT  c A  = w1  0 o o  M  M 0 T  n −1   co ( Ao )  w nT-1   1  (3.419) Az Ao és coT rendszermátrixok (3.326) szerinti speciális felépítése alapján írhatjuk, hogy w oT = coT w1T = a1coT + coT Ao (3.420) M w nT-1 = a n -1coT + a n -2 coT Ao + K + coT ( Ao ) n -1 30 ahol a következô rekurzív összefüggés áll fenn w kT = a k coT + w kT−1 Ao (3.421) A rekurzív összefüggés felhasználásával 1 w T    oT  0 w1  =0 M    T  M w n -1   0 0 0 K 0  1 0 K 0 0 1 K 0  M M O M 0 0

K 1 (3.422) adódik, ami bizonyítja a (3.418) érvényességét A megfigyelhetôségi kanonikus alakkal - amelyet mindig átviteli függvénybôl képezünk - kapott speciális M oo mindig reguláris, mivel egy reguláris mátrix inverze. (Háromszögmátrix determinánsa a fôátlóbeli elemek szorzata, ami most egy.) Tehát ha a rendszer szigorúan szabályos átviteli függvénye a (3.321) szerinti, akkor az megfigyelhetô Ez az alak megkívánja, hogy ne szerepeljen integráló hatás, tehát A ( s = 0) ≠ 0 is teljesüljön. Érdekes kérdés, hogy a z = T x lineáris transzformáció hogyan befolyásolja a megfigyelhetôségi mátrixot. A (332) egyenletek alapján írhatjuk 31 ˜c T = c T T −1 ˜ = c T T −1 T AT −1 = c T A T −1 ˜c T A (3.423) M ˜ n −1 = c T A n −1 T −1 ˜c T A amelyek alapján ˜c T  c T   T    ˜  c T A  −1 ˜ c A  ˜o= M T = M o T −1 = M  M   T n −1   T n −1  ˜

 c A  ˜c A (3.424) −1 Az megfigyelhetôségi mátrix fenti transzformációs alakja alapján a To-1 = ( M o ) M oo transzformációs ( ) mátrix (azaz To = M oo −1 M o ) alkalmazásával minden irányítható rendszer irányítható kanonikus alakra hozható. Az megfigyelhetôségi mátrixot azonban nem mindig - sôt általában nem - átviteli függvény alapján képezzük. Ilyenkor természetesen mindig közvetlenül az M o megfigyelhetôségi mátrix vizsgálatára van szükség. 32 S y S 3.3 ábra Egy nem megfigyelhetô rendszer 3.42 Példa Egy megegyezô elsôrendû alrendszerekbôl álló rendszer (lásd a blokkvázlatot a 3.3 ábrán) teljes állapotegyenlete d x −1 0 = x = A x d t  0 −1 (3.425) y = [1 1] = c T x A megfigyelhetôségi mátrix  1 1 Mo =   −1 −1 amely szinguláris, így a rendszer nem megfigyelhetô. (3.426) 33 A KÁLMÁN-féle dekompozíció Az irányíthatóság és

megfigyelhetôség koncepciója lehetôvé teszi, hogy megértsük egy lineáris rendszer struktúráját. Emlékezzünk, hogy az irányítható állapotok tere az irányíthatósági mátrix oszlopai által kifeszített altér. Ha ennek dimenziója n, akkor a teljes tér irányítható Vezessük be x c -t az irányítható, x c -t a nem irányítható állapotok jelölésére. Ekkor az állapotegyenlet d  x c   A11  = d t x c   0 A12  x c  b1    +   u A22 x c   0  (3.427) alakú, ahol világosan látszik a struktúrából, hogy az x c állapotokat nem tudjuk befolyásolni u-val. Hasonlóképpen vezessük be x o -t a megfigyelhetô, x o -t a nem megfigyelhetô állapotok jelölésére. Az így adódó állapotegyenlet d  x o   A11  = d t x o   A21 [ y = c1T 0  x o    A22 x o  0T ] (3.428) x o    x o  alakú, ahol jól látszik, hogy

az x o állapotokra nem keletkezik kimenô jel komponens. Lineáris rendszerek négy alrendszerre bonthatók, amelyek • S co irányítható és megfigyelhetô x co 34 • S co irányítható és nem megfigyelhetô • S co nem irányítható és megfigyelhetô • S co nem irányítható és nem megfigyelhetô x co x co x co ahol a megfelelô állapotváltozókat is feltüntettük. A lineáris rendszer teljes KÁLMÁN -féle dekompozíciója így  x co   A11    d  x co   A21 = d t  x co   0    x co   0 [ y = c1T 0 A22 0 0 0T A13 A23 A33 A43 c2T 0  x co   b1      A24  x co  b2  + u = Ax + bu 0  x co   0      A44 x co   0  (3.429) ] 0T x Az egyes alrendszereket feltüntetô blokkvázlat a 3.4 ábrán látható A hatásvázlat nyilait követve megállapíthatjuk, hogy a bemenôjel az S co és S co alrendszereket befolyásolja, a

kimenôjel pedig csak az S co és S co alrendszerektôl függ. Az S co alrendszer sem a bemenethez, sem a kimenethez nem kapcsolódik. 35 u y Sco Sco Sco Sco 3.4 ábra Lineáris rendszer KÁLMÁN-féle dekompozíciója Egyszerû számítással kapjuk, hogy a teljes rendszer átviteli függvénye −1 G ( s ) = c1T ( s I − A11 ) b1 (3.430) azaz teljes mértékben meghatározott az S co alrendszerrel. Megfordítva is mondhatjuk, hogy az átviteli függvénybôl csak a teljes rendszer S co irányítható és megfigyelhetô alrendszere adható meg. 3.43 Példa A KÁLMÁN-féle dekompozícióval megmagyarázható az irányítás egy régóta fennálló problémája, nevezetesen pólusok és zérusok kiejtése. A probléma illusztrálásához tekintsük az 36 dy du −y= −u dt dt (3.431) rendszert. A differenciálegyenlet integrálásával kapott megoldás y( t ) = u(t ) + ce t (3.432) ahol c egy konstans. A rendszer átviteli függvénye Y (s ) s − 1 = =1 U (s )

s − 1 (3.433) ahol a kiejtés után kapott y( t ) = u( t ) rendszer nyilvánvalóan nem egyezik meg a (3.432)-vel Sco y u Sco dx =x dt 3.5 ábra A (3431) teljes KÁLMÁN-féle alakja 37 A 3.5 ábrán bemutatjuk a teljes rendszer KÁLMÁN-féle alakját, amely az S co és S co alrendszerekbôk áll Az S co egy statikus rendszer G ( s ) = 1 átviteli függvénnyel, az S co nem irányítható, de megfigyelhetô alrendszer dx =x (3.434) dt dinamikával. Kiejtésnél soha nem szabad elfelejtenünk, hogy az állapotegyenlet teljes megoldása a (3.21) szerinti, azaz szerepel benne a kezdeti feltétel is, amelynek dinamikája (magára hagyott rendszer) a teljes rendszer pólusaitól függ, az esetleg kiejtettôl is. Ha ez a pólus labilis, akkor ennek nem eltûnô hatása meg fog jelenni a megoldásban