Tartalmi kivonat
Előadásvázlat a Lineáris algebra II. tárgyhoz Kovács Zoltán 2005. január 4 Tartalomjegyzék 1. Euklideszi vektorterek 1.1 Bilineáris és kvadratikus formák, skaláris szorzatok 1.2 Norma, szög, távolság euklideszi vektorterekben 1.3 Merőlegesség 1.4 Lineáris operátorok euklideszi vektorterekben 2. Lineáris transzformációk szerkezete 2.1 Invariáns altér, sajátvektor, sajátérték 2.2 A karakterisztikus polinom 2.3 Önadjungált transzformációk szerkezete 2.4 Ortogonális transzformációk szerkezete . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 3 3 5 8 12 . . . . 17 17 20 23 26 3. Geometriai alkalmazások 29 3.1 Geometriai
transzformációk 29 3.2 Kúpszeletek elemi és analitikus geometriája 34 3.3 Másodrendű görbék a valós síkon 35 2 1. fejezet Euklideszi vektorterek Ebben a fejezetben (végesen generált) valós vektorterekről lesz szó. 1.1 Bilineáris és kvadratikus formák, skaláris szorzatok Definíció. Legyen V vektortér R felett Egy L: V × V F leképezést bilineáris formának nevezünk, ha mindkét változójában lineáris, azaz ∀x, y, z ∈ V, α, β ∈ F : L(αx + βy, z) = αL(x, z) + βL(y, z), illetve ∀x, y, z ∈ V, α, β ∈ F : L(x, αy + βz) = αL(x, y) + βL(x, z). Definíció. Legyen L bilineáris forma egy n dimenziós V vektortéren, (e1 , . , en ) pedig V bá¡ ¢ zisa. L ezen bázisra vonatkozó mátrixán az M = L(ei , ej ) ∈ Mn×n mátrixot értjük 1.1 Tétel (Bilineáris formák báziselőállítása) Legyen L bilineáris forma egy n dimenziós V vektortéren, (e1 , .
, en ) V bázisa Ha az x vektor koordinátái X = (x1 , , xn )t , az y vektor koordinátái Y = (y1 , . , yn )t , továbbá az L mátrixa M = (mij ), akkor L(x, y) = n X xi yj mij , i,j=1 azaz L(x, y) = X t · M · Y. Bizonyítás: n n n n X X X X L(x, y) = L( xi ei , yj ej ) = xi yj L(ei , ej ) = xi yj mij . i=1 j=1 i,j=1 3 i,j=1 1.2 Tétel Rögzítsük a V vektortér (e1 , , en ) és (e01 , , e0n ) bázisát, az (e1 , . , en ) (e01 , , e0n ) báziscsere mátrixa legyen S. Egy L bilineáris forma mátrixa az első bázisban M , a második bázisban M 0 . Ekkor teljesül, hogy M 0 = S t M S. Bizonyítás: Az S illetve S t mátrix elemeit jelöljük sij -vel, illetve ŝij -vel! Ã n ! n n X n n X n X X X X m0ij = L(e0i , e0j ) = L ski ek , slj el = ski slj L(ek , el ) = ski slj mkl = = n X Ã n X l=1 k=1 k=1 ! ski mkl slj = l=1 Ã n n X X l=1 l=1 k=1 ! ŝik mkl slj = k=1 l=1 k=1 n X (S t M )il slj = (S t M S)ij l=1 Definíció. Az L
bilineáris formát szimmetrikusnak nevezzük, ha ∀x, y : L(x, y) = L(y, x). 1.3 Tétel Egy bilineáris forma akkor és csakis akkor szimmetrikus, ha tetszőleges bázisra vonatkozó mátrixa szimmetrikus Bizonyítás: Ha az L bilineáris forma szimmetrikus, akkor (a báziselőállításnál alkalmazott jelölésekkel) L(ei , ej ) = L(ej , ei ) ⇐⇒ mij = mji , Innen közvetlenül látható, hogy ha L szimmetrikus, akkor a mátrixa is szimmetrikus. Most tegyük fel, hogy L mátrixa valamely (e1 , . , en ) bázisra vonatkozóan szimmetrikus Ekkor n n n n X X X X L(x, y) = xi yj mij és L(y, x) = yi xj mij = yj xi mji = yj xi mij . i,j=1 i,j=1 i,j=1 i,j=1 Definíció. Legyen L egy szimmetrikus bilineáris forma A Q : V F, Q(x) = L(x, x) módon értelmezett függvényt kvadratikus formának nevezzük, melynek poláris formája L. 1.4 Tétel Kvadratikus forma poláris formája egyértelmű Bizonyítás: Ha Q(x) = L(x, x) teljesül (ahol L szimmetrikus bilineáris forma),
akkor L(x + y, x + y) = L(x, x) + L(y, y) + 2L(x, y), azaz 2L(x, y) = Q(x + y) − Q(x) − Q(y). L(x, y) értékét Q tehát egyértelműen meghatározza. 4 Definíció. Egy kvadratikus forma rögzített bázisra vonatkozó mátrixán a poláris forma mátrixát értjük. A bilineáris formák báziselőállításából közvetlenül következik az alábbi állítás: 1.5 Tétel (Kvadratikus formák báziselőállítása) Legyen Q kvadratikus forma egy n dimenziós V vektortéren, (e1 , , en ) V bázisa Ha az x vektor koordinátái (x1 , , xn ), továbbá a Q mátrixa M = (mij ), akkor n X Q(x) = xi xj mij . i,j=1 Definíció. A V valós vektortéren értelmezett Q kvadratikus formát pozitív definitnek mondunk, ha ∀x ∈ V {0} : Q(x) > 0. Definíció. Legyen V valós vektortér V -n adott skaláris szorzaton olyan h, i : V × V R szimmetrikus bilineáris formát értünk, melyből képezett kvadratikus forma pozitív definit Ilyenkor a (V, h, i) párt
euklideszi vektortérnek, vagy röviden euklideszi térnek nevezzük. Példa. A szabadvektorok tere a benne geometriai úton értelmezett skaláris szorzattal Példa. (Rn , h, i), ahol az X = (x1 , , xn ) és Y = (y1 , , yn ) szám n-esek ún kanonikus skaláris szorzatát a következőképpen értelmezzük: hX, Y i = n X xi yi . i=1 Példa. Legyen P n a legfeljebb n-edfokú (valós együtthatós) polinomok tere Benne a skaláris szorzatot értelmezhetjük a következőképpen: Z 1 hp, qi = p(t) · q(t) dt, p, q ∈ P n . −1 1.2 Norma, szög, távolság euklideszi vektorterekben p ¡ ¢ Definíció. Legyen E, h, i euklideszi vektortér Az x vektor hosszán az kxk = hx, xi számot értjük. 1.6 Tétel (A Cauchy–Bunyakovszkij–Schwarz-egyenlőtlenség) Egy euklideszi vektortér bármely két vektorára teljesül, hogy hx, yi2 ≤ hx, xi · hy, yi. Egyenlőség akkor és csakis akkor áll fenn, ha x és y lineárisan függők. 5 Bizonyítás: y = 0-ra az
állítás triviálisan teljesül, a továbbiakban feltesszük, hogy y 6= 0. Legyen λ ∈ R tetszőleges, s tetszőlegesen rögzített x-re és y 6= 0-ra tekintsük az alábbi kifejezést: f (λ) = hx − λy, x − λyi = hx, xi − 2λhx, yi + λ2 hy, yi. ∀λ ∈ R : f (λ) ≥ 0, mert vektor önmagával való skaláris szorzata mindig nemnegatív, tehát a másodfokú polinom diszkriminánsa nem pozitív: hx, yi2 − hx, xihy, yi ≤ 0. Egyenlőség akkor és csakis akkor állhat fenn, ha x − λy = 0, amiből x és y lineáris függősége következik. Megfordítva, ha x és y lineárisan függők, akkor vagy x = λy vagy y = λx valamely alkalmas skalárra Bármelyiket behelyettesítve az egyenlőtlenség egyik ill másik oldalába, egyenlő kifejezéseket kapunk. Megjegyzés. A CBS egyenlőtlenség mások szokásos (az előzővel triviálisan ekvivalens) alakja: |hx, yi| ≤ kxk · kyk. Példa. Rn kanonikus skaláris szorzatára a CBS egyenlőtlenséget az
alábbiak szerint írhatjuk (ezt az alakot tanultuk a bevezető analízis tárgyból): Ã n ! Ã n ! Ã n ! X X X xi y i ≤ x2i · yi2 , xi , yi ∈ R, i = 1, . , n i=1 i=1 i=1 1.7 Tétel (Minkowski-egyenlőtlenség) Egy euklideszi vektortér tetszőleges x és y vektorára: kx + yk ≤ kxk + kyk. Bizonyítás: kx + yk2 = = ≤ ≤ = hx + y, x + yi = hx, xi + 2hx, yi + hy, yi ≤ hx, xi + 2|hx, yi| + hy, yi ≤ hx, xi + 2kxk · kyk + hy, yi = kxk2 + 2kxk · kyk + kyk2 = (kxk + kyk)2 . A következő tételben összefoglaljuk a norma tulajdonságait: ¡ ¢ 1.8 Tétel Az E, h, i euklideszi vektortérben a k k : E R normafüggvény rendelkezik az alábbi tulajdonságokkal: (N1) ∀x ∈ E : kxk ≥ 0; továbbá kxk = 0 ⇐⇒ x = 0. (N2) ∀x ∈ E, ∀λ ∈ R : kλxk = |λ| · kxk. 6 (N3) ∀x, y ∈ E : kx + yk ≤ kxk + kyk. Bizonyítás: Az első tulajdonság következik a skaláris szorzás pozitív definit voltából, a második pedig a bihomogenitásból. A
harmadik állítás a Minkowski-egyenlőtlenség megismétlése Az eddigiekben a norma mindig egy (a vektortéren adott) skaláris szorzatból származott. A fentebbi tételben megfogalmazott három tulajdonság vezet el a normált vektortér fogalmához. Hangsúlyozzuk, hogy a következő definíció kiindulópontja nem egy euklideszi vektortér, hanem egy vektortér, azaz nincs benne adva skaláris szorzat. Definíció. Egy V vektorteret normált vektortérnek nevezünk, ha benne adva van egy k k: V R normafüggvény, mely rendelkezik az N1, N2, N3 tulajdonságokkal. Fontos kérdés, hogy a definíció valóban újdonságot ad-e, vagy egy normához mindig be lehet vezetni a vektortéren olyan skaláris szorzatot, mely éppen az adott normát definiálja. A válasz tagadó, azaz vannak olyan normált vektorterek, melyek nem euklideszi vektortérből származnak. Erre vonatkozik az alábbi tétel: ¡ ¢ 1.9 Tétel Legyen adva egy V, k k normált vektortér Egy norma akkor és
csakis akkor származik skaláris szorzatból, ha a vektortérben teljesül a paralelogramma reláció: ¡ ¢ ∀x, y ∈ V : kx + yk2 + kx − yk2 = 2 kxk2 + kyk2 . Bizonyítás: Ld. feladatgyűjtemény: 289 feladat Definíció. Egy euklideszi vektortér x és y vektorának távolságán a d(x, y) = kx − yk számot értjük. 1.10 Tétel Tetszőleges euklideszi vektortér metrikus tér az előbb értelmezett távolságfüggvényre Bizonyítás: A metrikus tér axiómái közül csak a háromszög-egyenlőtlenség teljesülése nem magától érthetődő. d(x, y) + d(y, z) = kx − yk + ky − zk ≥ ≥ kx − zk = d(x, z), alkalmazva a Minkowski-egyenlőtlenséget. 1.11 Tétel (Pitagorasz tétele) Egy euklideszi vektortér x és y vektora akkor és csakis akkor merőlegesek egymásra, ha d(x, y)2 = kxk2 + kyk2 7 Bizonyítás: d(x, y)2 = hx − y, x − yi = hx, xi2 + hy, yi2 − 2hx, yi = kxk2 + kyk2 − 2hx, yi. hx,yi (ϕ ∈ [0, π]) összefüggéssel Definíció. Az
x és y nem nullvektorok ϕ szögét a cos ϕ = kxk·kyk értelmezzük. A nullvektor tetszőleges vektorral bezárt szöge derékszög Megjegyzés. Az előbbi definíció jobb oldalán −1 és 1 közötti szám van, ezt a CBS egyenlőtlenség garantálja 1.3 Merőlegesség Definíció. Egy euklideszi vektortér két vektorát egymásra ortogonálisnak vagy merőlegesnek mondjuk, ha skaláris szorzatuk zéró. Egy vektorrendszert ortogonálisnak mondunk, ha egymásra merőleges vektorok alkotják. Az olyan vektort, melynek hossza 1, egységvektornak nevezzük Egy vektorrendszert ortonormáltnak mondunk, ha egymásra merőleges egységvektorok alkotják. 1.12 Tétel Nemzéró vektorok ortogonális rendszere mindig lineárisan független Bizonyítás: Legyen (e1 , . , ek ) nemzéró vektorok ortogonális rendszere, s tekintsük olyan lineáris kombinációjukat, amely zérusvektort ad: α1 e1 + · · · + αk ek = 0. Szorozzuk skalárisan az egyenlőség mindkét oldalát ei
-vel (i = 1, . , n): α1 he1 , ei i + · · · + αk hek , ei i = 0. A bal oldalon i 6= j-re hej , ei i = 0, tehát αi hei , ei i = 0, ahol a skaláris szorzat pozitív definitsége miatt hei , ei i 6= 0, tehát αi = 0. 1.13 Tétel Legyen B = (b1 , , bn ) bázisa egy euklideszi vektortérnek Létezik a térben olyan E = (e1 , . , en ) ortonormált bázis, hogy ∀1 ≤ k ≤ n-re: L(b1 , . , bk ) = L(e1 , , ek ) Bizonyítás (A Gram-Schmidt eljárás): A bizonyítás konstruktív. e1 = kbb11 k , továbbá tegyük fel, hogy (e1 , . , ej ) (j < n) olyan ortonormált lineárisan független rendszer, melyre ∀1 ≤ k ≤ jL(b1 , . , bk ) = L(e1 , , ek ) 8 Megkonstruáljuk a j + 1-edik vektort. Legyen fj+1 = −hbj+1 , e1 ie1 − · · · − hbj+1 , ej iej + bj+1 . Ezzel egy olyan vektort kaptunk, mely e1 , . , ej mindegyikére merőleges Szorozzuk ugyanis az előző sort skalárisan ei -vel! Ekkor hbj+1 , er iher , ei i = 0 i 6= r-re, tehát 1 z }| {
hfj+1 , ei i = −hbj+1 , ei i hei , ei i +hbj+1 , ei i = 0 (i = 1, . , j) Mivel az (e1 , . , ej , fj+1 ) vektorrendszerből lineárisan kombinálható a (b1 , , bj , bj+1 ) vektorrendszer s megfordítva, ezért a lineáris kombináció tranzitivitását használva teljesül, hogy L(b1 , . , bj+1 ) = L(e1 , , ej , fj+1 ) A L(b1 , . , bj+1 ) j + 1 dimenziós altérben tehát (e1 , , ej , fj+1 ) j + 1 tagú generátorrendszer, tehát bázis. Ebből az is következik, hogy fj+1 nem lehet nullvektor, tehát normálható, s ej+1 = fj+1 -re kfj+1 k (e1 , . , ej , ej+1 ) a megfelelő ortonormált vektorrendszer. Az eljárás n lépésben a vektortér n tagú generátorrendszerét, vagyis bázisát adja, melyre a megkívánt generátortulajdonság teljesül Következmény. Minden euklideszi vektortérnek van ortonormált bázisa Minden ortonormált rendszer vagy bázis, vagy kiegészíthető ortonormált bázissá. Az ortonormált bázisok használata leegyszerűsít
bizonyos számításokat, amint azt az alábbi fontos példák mutatják. 1.14 Tétel Legyen adva egy euklideszi vektortér, s abban rögzítsünk egy ortonormált bázist! Ha az x és y vektorok koordinátái a rögzített bázisra vonatkozóan (x1 , . , xn ) ill (y1 , , yn ) akkor a két vektor skaláris szorzatát az alábbi módon számíthatjuk ki: hx, yi = x1 y1 + · · · + xn yn . 1.15 Tétel (Vektor Fourier-előállítása) Legyen E = (e1 , , en ) ortonormált bázis egy (V, h, i) euklideszi vektortérben. Ekkor ∀x ∈ V : n X x= hx, ei iei . i=1 Bizonyítás: Mindkét állítás triviális számolás. 9 1.16 Tétel (Bessel-egyenlőtlenség) Legyen E = (e1 , , ek ) ortonormált vektorrendszer egy (V, h, i) euklideszi vektortérben. Ekkor ∀x ∈ V : k X hx, ei i2 ≤ kxk2 . i=1 Továbbá minden x-re akkor és csakis akkor teljesül egyenlőség, ha E bázis. Bizonyítás: Egészítsük ki E-t ortonormált bázissá (ha már bázis akkor nem veszünk
hozzá vektort): (e1 . , ek , , en ) Ekkor n k n X X X hx, ei i2 = hx, ei i2 + hx, ei i2 = kxk2 i=1 i=1 i=k+1 teljesül, amiből az állítás leolvasható. Ha E bázis, akkor az egyenlőség minden x-re teljesül. Megfordítva, ha E nem lenne bázis, akkor kiegészíthető ortonormált bázissá. Legyen egy kiegészítő vektor e x = e-re a bal oldal 0-t, a jobb oldal 1-t ad, ami ellentmondás. Definíció. A (V, h, iV ) és (W h, iW ) euklideszi tereket izometrikusan izomorf nak nevezzük, ha létezik olyan ϕ: V W bijektív lineáris leképezés (azaz izomorfizmus), melyre ∀x, y ∈ V : hx, yiV = hϕ(x), ϕ(y)iW . 1.17 Tétel (Véges dimenziós euklideszi terek struktúratétele) Egy n dimenziós euklideszi vektortér izometrikusan izomorf Rn -nel, ahol Rn -ben a skaláris szorzat a kanonikus. Bizonyítás: A véges dimenziós vektorterek struktúratételének bizonyításában már konstruáltunk izomorfizmust egy valós n dimenziós vektortér és Rn között.
Ehhez bázis rögzítésére volt szükség Most azt látjuk be, hogy ha ortonormált bázist rögzítünk, akkor ez az izomorfizmus izometrikus Legyen tehát (V, h, i) n dimenziós euklideszi vektortér, benne (e1 , , en ) ortonormált bázis. Értelmezzük a V Rn leképezést úgy, hogy minden vektorhoz rendeljük hozzá az (e1 , . , en ) bázisra vonatkozó koordinátáit: V 3 x 7 (x1 , . , xn ) ∈ Rn , ha x = x1 e1 + · · · + xn en A véges dimenziós vektorterek struktúratételéből már tudjuk, hogy ez a leképezés izomorf leképezése V -nek Rn -re. Most belátjuk a leképezés izometrikus voltát Legyen x, y ∈ V két tetszőleges vektor, x 7 (x1 , . xn ), y 7 (y1 , , yn ) A vektorok skaláris szorzatát V -ben a koordináták kompozítumaként számíthatjuk ki (ld. 114): hx, yi = x1 y1 + · · · + xn yn , ez pontosan megegyezik az Rn -beli képek skaláris szorzatával. 10 Következmény. Két euklideszi vektortér akkor és csakis akkor
izometrikusan izomorf, ha ugyanaz a dimenziójuk. Definíció. Legyen (V, h, i) euklideszi vektortér, H ⊂ V altér H ortogonális komplementerén a következő H ⊥ ⊂ V halmazt értjük: H ⊥ = { x ∈ V |∀y ∈ H : hx, yi = 0 }, azaz minden olyan vektort V -ből, mely az összes H-beli vektorra merőleges. 1.18 Tétel x ∈ H ⊥ akkor és csakis akkor teljesül, ha x merőleges H tetszőleges bázisának minden vektorára. Bizonyítás: Ha x ∈ H ⊥ , akkor x minden H-beli vektorra merőleges, többek közt egy tetszőleges bázis minden vektorára is. Megfordítva, legyen (e1 , . , ek ) egy bázis H-ban, s teljesüljön, hogy ∀i : hx, ei i = 0. Legyen y ∈ H tetszőleges: y = Pk i=1 αi ei . hx, yi = hx, k X αi ei i = i=1 k X αi hx, ei i = 0, i=1 azaz x ∈ H ⊥ . Megjegyzés. Az előző tétel a síkra merőleges egyenes tételének általánosítása 1.19 Tétel Egy altér ortogonális komplementere mindig altér, továbbá, ha H ⊂ V
altér, akkor H ⊕ H ⊥ = V, H ⊥⊥ = H. Bizonyítás: Először belátjuk, hogy H ⊥ altér. A zéróvektor nyilván benne van H ⊥ -ben, mert a zéróvektor minden vektorra merőleges. Ha x1 , x2 ∈ H ⊥ , akkor ∀y ∈ H : hy, x1 i = 0 és hy, x2 i = 0 =⇒ hy, x1 + y2 i = hy, x1 i + hy, x2 i = 0, tehát az összegvektor is benne van H ⊥ -ben. A skalárszorosra hasonlóan: hy, x1 i = 0 =⇒ hy, αx1 i = αhy, x1 i = 0. A direktösszeg tulajdonságot úgy látjuk be, hogy ellenőrizzük, H és H ⊥ egy-egy ortonormált bázisának egyesítése a tér bázisát adja. Legyen tehát (e1 , , er ) ortonormált bázis H-ban, f1 , . , fs pedig H ⊥ -ben Az egyesített rendszer ortogonális, tehát lineárisan független (ld 112) Ha nem lenne bázis, akkor egészítsük ki ortonormált bázissá. Legyen e egy a kiegészítő vektorok közül. e ⊥ ei (i = 1, , r), tehát e ∈ H ⊥ , ugyanakkor e ⊥ fi (i = 1 , s) tehát (e, f1 , , fs ) 11 lineárisan
független vektorrendszer lenne H ⊥ -ben, ami nyilván ellentmondás, mert (f1 , . , fs ) maximális lineárisan független rendszer H ⊥ -ben. H ⊥⊥ = H. H ⊂ H ⊥⊥ , mert ∀x ∈ H ⊥ és ∀y ∈ H: x ⊥ y Az, hogy a tartalmazás nem valódi, onnan következik, hogy a dimenziójuk megegyezik: ¾ H ⊕ H ⊥ = V =⇒ dim H + dim H ⊥ = dim V =⇒ dim H = dim H ⊥⊥ . H ⊥ ⊕ H ⊥⊥ = V =⇒ dim H ⊥ + dim H ⊥⊥ = dim V Definíció. Rögzítsük egy V euklideszi vektortér H alterét! Ekkor ∀x ∈ V egyértelműen felbomlik x = prH x + ortH x alakban, ahol prH x ∈ H, ortH x ∈ H ⊥ . A prH x vektort az x vektor merőleges vetületének nevezzük a H altérre, míg ortH x az x vektor H-ra merőleges komponense. Az k ortH xk számot az x vektor H altértől való távolságának nevezzük (melyre a d(x, H) jelölést is alkalmazhatjuk). 1.20 Tétel (Az előző definíció jelöléseivel) d(x, H) = min{ kx − yk | y ∈ H }. Bizonyítás: Az
egyszerűség kedvéért: prH x = x0 . Ekkor ortH x = x − x0 A Pitagorasz-tételt alkalmazva: kx − yk2 = k(x − x0 ) + (x0 − y)k2 = k(x − x0 )k2 + kx0 − yk2 ≥ k(x − x0 )k2 . 1.4 Lineáris operátorok euklideszi vektorterekben 1.21 Tétel Legyen (V, h, i) euklideszi vektortér, ϕ ∈ L(V ; V ) lineáris operátor Ekkor az L : V × V R, L(x, y) = hϕ(x), yi (∗) leképezés bilineáris forma. Megfordítva, minden bilineáris formához egyértelműen létezik olyan ϕ ∈ L(V ; V ) lineáris operátor, hogy (∗) teljesül. A tételt analóg módon megfogalmazhatjuk a második változóval kapcsolatban. Bizonyítás: Legyen ϕ : V V lineáris operátor, és L(x, y) = hϕ(x), yi. L(x1 + x2 , y) = hϕ(x1 + x2 ), yi = hϕ(x1 ) + ϕ(x2 ), yi = hϕ(x1 ), yi + hϕ(x2 ), yi = L(x1 , y) + L(x2 , y) 12 L definíciója ϕ lineáris a skaláris szorzás lineáris L definíciója továbbá L(αx, y) = hϕ(αx), yi = hαϕ(x), yi = αhϕ(x), yi = αL(x, y) L
definíciója ϕ lineáris a skaláris szorzás lineáris L definíciója. Belátjuk az egyértelműséget. Tegyük fel, hogy ∀x, y : hϕ(x), yi = L(x, y) és hψ(x), yi = L(x, y) egyaránt teljesül. Ez azt jelenti, hogy ∀x, y hϕ(x), yi = hψ(x), yi =⇒ h(ϕ − ψ)(x), yi = 0. Rögzített x mellett ez előbbi egyenlőség minden y-ra teljesül, azaz ∀x : (ϕ − ψ)(x) = 0 =⇒ ϕ = ψ. A létezés bizonyítása maradt hátra. Rögzítsünk egy (e1 , , en ) ortonormált bázist! Ebben a bázisban L mátrixa legyen (mij ) ∈ Mn×n . ψ-t értelmezzük úgy, hogy ϕ(ei ) = n X mik ek . k=1 (Azaz ψ mátrixa L mátrixának transzponáltja.) A lineáris kiterjesztés tétele szerint így valóban meghatároztunk egy lineáris operátort. Ellenőrizni kell a (∗) tulajdonság teljesülését Mivel (∗) mindkét oldalán bilineáris forma van, elegendő azt bebizonyítani, hogy az előbb rögzített ortonormált bázison ugyanazokat az értékeket veszik fel. n X
mik ek , ej i hϕ(ei ), ej i = h = k=1 n X mik hek , ej i k=1 hek , ej i csak k = j-re ad 0-tól különböző értéket, nevezetesen 1-et: = mij . Megjegyezzük, hogy ha az L(x, y) = hx, ϕ(y)i feltétellel keresünk lineáris operátort, akkor az előző bizonyításrész úgy módosul, hogy ϕ konstrukciójakor L mátrixát használjuk (nem pedig a transzponáltat). 13 Definíció. Egy euklideszi vektortér ϕ lineáris operátorának adjungáltja az a ϕ∗ -gal jelölt lineáris operátor, melyre ∀x, y : hϕ(x), yi = hx, ϕ∗ (y)i. 1.22 Tétel Egy euklideszi vektortér minden lineáris operátorának egyértelműen létezik adjungáltja Bizonyítás: Legyen ϕ lineáris operátor, ekkor hϕ(x), yi = L(x, y) bilineáris forma, ehhez egyértelműen létezik olyan ψ lineáris operátor, hogy L(x, y) = hx, ψ(y)i. ψ lesz az ϕ operátor adjungáltja 1.23 Tétel Ortonormált bázisban az operátor mátrixa és az adjungált operátor mátrixa egymás
transzponáltja. Bizonyítás: L(x, y) = hϕ(x), yi = hx, ϕ∗ (y)i. Tetszőleges ortonormált bázisban ϕ mátrixa L mátrixának transzponáltja, ϕ∗ mátrixa pedig megegyezik L mátrixával. 1.24 Tétel Az adjungálásra teljesülnek az alábbi tulajdonságok: (ϕψ)∗ (ϕ∗ )∗ (ϕ + ψ)∗ (λϕ)∗ (λ id)∗ = ψ ∗ ϕ∗ =ϕ = ϕ∗ + ψ ∗ = λϕ∗ = id . Bizonyítás: Valamennyi tulajdonság a definíció szerint egyszerűen ellenőrizhető. Pl az első tulajdonság: h(ϕψ)(x), yi = hϕ(ψ(x)), yi = hψ(x), ϕ∗ (y)i = hx, ψ ∗ (ϕ∗ (y))i = hx, (ψ ∗ ϕ∗ )(y)i. Másik lehetőség a bizonyításra az, hogy minden tulajdonságot visszavezethetünk a mátrixok transzponálásának megfelelő tulajdonságára, ugyanis az előzőek szerint a lineáris transzformációk adjungálásának a mátrixok transzponálása felel meg. Definíció. Egy lineáris operátort önadjungáltnak nevezünk, ha megegyezik az adjungáltjával 1.25 Tétel Egy lineáris
operátor akkor és csakis akkor önadjungált, ha tetszőleges ortonormált bázisban a mátrixa szimmetrikus. Definíció. Egy euklideszi vektortér egy lineáris operátorát ortogonális operátornak nevezzük, ha adjungáltja megegyezik az inverzével. 1.26 Tétel Egy euklideszi vektortér lineáris operátora akkor és csakis akkor ortogonális, ha tetszőleges ortonormált bázisra vonatkozó mátrixa egymásra merőleges, egységnyi hosszú oszlopvektorokból (ill. sorvektorokból) áll Az ilyen mátrixot ortogonális mátrixnak nevezzük 14 Bizonyítás: A ϕ operátor akkor és csakis akkor ortogonális, ha ϕϕ∗ = id, ϕ∗ ϕ = id . Ortonormált bázis rögzítése után ϕ mátrixát jelölje U , ϕ∗ mátrixa ekkor U t . A fenti első összefüggés pedig azzal ekvivalens, hogy U U t = I, amiből a mátrixszorzás definícióját felhasználva adódik az oszlopokra vonatkozó állítás. (U t oszlopai megegyeznek U soraival!) A sorokra az állítás az U t U =
I összefüggést felhasználva jön ki. 1.27 Tétel Ortogonális mátrix inverze megegyezik a transzponáltjával Bizonyítás: Ld. az előző bizonyítást 1.28 Tétel Legyen V euklideszi vektortér, ϕ ∈ τV A következő állítások ekvivalensek: 1. ϕ ortogonális; 2. ϕ megtartja a skaláris szorzatot, azaz ∀x, y ∈ V : hϕ(x), ϕ(y)i = hx, yi; 3. ϕ megtartja a vektorok hosszát: ∀x ∈ V : kϕ(x)k = kxk; 4. ϕ megtartja a távolságot: ∀x, y ∈ V : d(ϕ(x), ϕ(y)) = d(x, y); 5. tetszőleges ortonormált bázis képe ortonormált bázis Bizonyítás: 1 ⇐⇒ 2 Először teljesüljön, hogy ϕ∗ ϕ = id. Ekkor hϕ(x), ϕ(y)i = hx, ϕ∗ ϕ(y)i = hx, yi. Megfordítva, ha ϕ megtartja a skaláris szorzatot, azaz hϕ(x), ϕ(y)i = hx, yi, akkor hϕ∗ ϕ(x), yi = hx, yi hϕ∗ ϕ(x), yi = hid(x), yi, 15 amiből következik, hogy ∀x, y ∈ V : h(ϕ∗ ϕ − id)(x), yi = 0, vagyis ϕ∗ ϕ = id. 2 ⇐⇒ 3 2 =⇒ 3 nyilvánvaló, a norma definíciója
miatt: p p kϕ(x)k = hϕ(x), ϕ(x)i = hx, xi = kxk. Megfordítva, könnyen ellenőrizhető, hogy: hx, yi = ¢ 1¡ kx + yk2 − kxk2 − kyk2 , 2 azaz a skaláris szorzat a normából kifejezhető. 3 ⇐⇒ 4 Következik onnan, hogy a norma és távolság egymásból kölcsönösen kifejezhetők: d(x, y) = kx − yk, kxk = d(x, 0). 2 =⇒ 5 A skaláris szorzat tartásból következik, hogy ortonormált vektorrendszer képe ortonormált vektorrendszer, P hisz a hossz és aP merőlegesség megmarad. n 5 =⇒ 2 P Legyen x = i=1 xi ei , y P = ni=1 yi ei , ahol (e1 , . , en ) ortonormált bázis Ekn n kor ϕ(x) = i=1 xi ϕ(ei ) és ϕ(y) = i=1 yi ϕ(ei ) is teljesül. Mivel (ϕ(e1 ), , ϕ(en )) is ortonormált bázis: hx, yi = hϕ(x), ϕ(y)i = n X i=1 n X xi y i xi y i . i=1 Az előző tétel közvetlen következménye az alábbi: 1.29 Tétel Ha egy báziscsere olyan, hogy mind a régi, mind az új bázis ortonormált, akkor a báziscsere mátrixa ortogonális.
Bizonyítás: Legyen (e1 , . , en ) a régi bázis, (f1 , , fn ) az új bázis Értelmezzük a ϕ lineáris transzformációt a lineáris kiterjesztés tétele alapján a ϕ(ei ) = fi relációval ϕ ortonormált bázist ortomormált bázisba visz át, ezért ortogonális operátor. ϕ mátrixa az (e1 , , en ) bázisra vonatkozóan megegyezik a báziscsere mátrixával: fi = ϕ(ei ) = n X sji ej . j=1 Azt már tudjuk, hogy ortogonális operátor mátrixa ortonormált bázisban ortogonális mátrix. 16 2. fejezet Lineáris transzformációk szerkezete A fejezet fő problémája a következő: Egy lineáris operátorhoz keresünk olyan bázist, melyben a mátrixa „egyszerű”. Egyszerű mátrixnak számít, ha „elég sok” zérus van benne, pl a mátrix diagonális, vagy trianguláris (Majd később látjuk, a diagonális mátrix általában nem érhető el, de komplex vektorterekben az elérhető, hogy zérustól különböző elem legfeljebb a
fődiagonálisban, vagy közvetlenül alatta szerepeljen.) A következőekben ismét általánosan, F feletti vektorterekről lesz szó, ahol F = R vagy C. 2.1 Invariáns altér, sajátvektor, sajátérték Definíció. Egy V vektortér H alterét az ϕ : V V lineáris operátor invariáns alterének nevezzük, ha ∀x ∈ H : ϕ(x) ∈ H. Az x ∈ V nem zéró vektort az ϕ lineáris operátor sajátvektorának nevezzük, ha ∃λ ∈ F, hogy ϕ(x) = λ · x. λ-t ilyenkor az x sajátvektorhoz tartozó sajátértéknek nevezzük. Példa. V és {0} minden lineáris operátornak invariáns altere Ezeket triviális invariáns altereknek nevezzük Példa. Egy sajátvektor által generált altér mindig invariáns (Ellenőrizzük!) Példa. Lineáris operátor képtere és magtere invariáns altér (Ellenőrizzük!) Példa. Tekintsük R2 origó körüli elforgatását Egyszerű geometriai megfontolás mutatja, hogy ha az elforgatás nem identitás, vagy középpontos tükrözés,
akkor nincs valódi (azaz egy dimenziós) invariáns altere. A középpontos tükrözésnek minden egy dimenziós altér invariáns altere lesz. R3 -ban tekintsünk egy tengely körüli elforgatást, a tengely illeszkedjen az origóra. A tengely egy dimenziós, az origóra illeszkedő, s a tengelyre merőleges sík két dimenziós invariáns altér. 17 A fejezet kérdésfelvetése (mi az a „legegyszerűbb” mátrix, amihez egy mátrix hasonló) szempontjából a legegyszerűbb szituáció az, amikor a mátrix egy diagonális mátrixhoz hasonló: 2.1 Tétel Egy lineáris operátor akkor és csakis akkor diagonalizálható, ha van a térben a sajátvektoraiból álló bázis. Bizonyítás: Legyen először (a1 , . , an ) a ϕ lineáris operátor sajátvektoraiból álló bázis Ekkor ϕ(ai ) = λi ai , ahol λi a ϕ megfelelő sajátértéke. Ez azt jelenti, hogy ϕ mátrixának i-edik oszlopa i ^ (0, . , λi , , 0)t , azaz az i-edik oszlopban csak az i-edik elem
lehet zérustól különböző Megfordítva, ha van olyan bázis, amelyben az operátor mátrixa diagonális, akkor az a bázis sajátvektorokból áll. Valóban, legyen (e1 , , en ) a szóban forgó bázis, melyben az operátor mátrixa λ1 0 . 0 0 λ2 . 0 . . . . 0 0 . λn A lineáris operátor mátrixának képzési szabálya szerint ekkor fennáll, hogy ϕ(ei ) = λi ei , tehát ei a λi sajátértékhez tartozó sajátvektor. 2.2 Tétel Legyen λ a ϕ : V V lineáris operátor sajátértéke! Az Lλ = { v ∈ V |ϕ(v) = λv } halmaz a ϕ operátor invariáns altere, melyet a λ sajátértékhez tartozó sajátaltérnek nevezünk. Úgy is fogalmazhatunk, hogy egy lineáris operátor egy sajátértékéhez tartozó sajátvektorai a nullvektorral kiegészítve alteret alkotnak, mely altér invariáns. Bizonyítás: Először belátjuk, hogy Lλ altér. A zérusvektor triviálisan kielégíti a ϕ(0) = λ0 összefüggést, tehát a
halmaz nem üres. Legyen x, y ∈ Lλ , azaz ϕ(x) = λx, ϕ(y) = λy Ekkor: ϕ(x + y) = ϕ(x) + ϕ(y) = λx + λy = λ(x + y), továbbá α ∈ F-re: ϕ(αx) = αϕ(x) = αλx = λ(αx). Belátjuk, hogy Lλ invariáns altér. Teljesüljön, hogy x ∈ Lλ , azaz ϕ(x) = λx Be kell látni, hogy ϕ(x) szintén benne van Lλ -ban. ϕ(ϕ(x)) = ϕ(λx) = λϕ(x), ez pontosan a bizonyítandó állítást jelenti. 18 Definíció. A Lλ altér dimenzióját a λ sajátérték geometriai multiplicitásának nevezzük 2.3 Tétel Az ϕ : V V lineáris operátor különböző sajátértékekhez tartozó sajátvektorai lineárisan függetlenek. Bizonyítás: Legyenek λ1 , . , λk különböző sajátértékek, a1 , , ak hozzájuk tartozó egy-egy sajátvektor, azaz ϕ(ai ) = λi ai (i = 1, . , k) A bizonyítást a sajátértékek száma szerinti teljes indukcióval végezzük el. k = 1-re az állítás nyilván teljesül, mert egy nem zérusvektor önmagában mindig lineárisan
független vektorrendszert alkot. Tegyük fel, hogy n = k − 1-re az állítás igaz, azaz a1 , . , ak−1 lineárisan függetlenek Állítsuk elő a zérusvektort az a1 , . , ak vektorok lineáris kombinációjaként: µ1 a1 + · · · + µk−1 ak−1 + µk ak = 0. (∗) Alkalmazzuk (∗) mindkét oldalára a ϕ lineáris operátort! A linearitás miatt: µ1 ϕ(a1 ) + · · · + µk−1 ϕ(ak−1 ) + µk ϕ(ak ) = 0. Használjuk fel, hogy ϕ(ai ) = λi ai : µ1 λ1 a1 + · · · + µk−1 λk−1 ak−1 + µk λk ak = 0. (†) Most (∗) mindkét oldalát szorozzuk meg λk -val! µ1 λk a1 + · · · + µk−1 λk ak−1 + µk λk ak = 0. (‡) Végezetül vonjuk ki (†)-ból (‡)-ot: µ1 (λ1 − λk )a1 + · · · + µk−1 (λk−1 − λk )ak−1 + µk (λk − λk )ak = 0. {z } | 0 Mivel a1 , . , ak−1 lineárisan függetlenek, ezért ez utóbbi összefüggésben valamennyi együttható zérus: µ1 (λ1 − λk ) = 0, . , µk−1 (λk−1 − λk ) = 0 Mivel
λi − λk 6= 0 (i = 1, . , k − 1), ezért µ1 = = µk−1 = 0 Ezeket az értékeket (∗)-ba visszahelyettesítve µk ak = 0 következik, azaz ak 6= 0 miatt µk = 0 is. Ez azt jelenti, hogy a (∗) lineáris kombinációban minden együttható 0. Következmény. Egy n dimenziós vektortér egy lineáris operátorának legfeljebb n különböző sajátértéke van. Ha pontosan n (különböző) sajátérték van, akkor létezik a térben az operátor sajátvektoraiból álló bázis, s ebben a bázisban az operátor mátrixa diagonális, a főátlóban pedig az operátor sajátértékei állnak. Bizonyítás: Az állítás első része onnan következik, hogy egy n dimenziós vektortérben bármely lineárisan független vektorrendszer legfeljebb n tagú, márpedig az előző tétel miatt a különböző sajátértékekhez tartozó sajátvektorok lineárisan függetlenek. Az állítás második része a 2.1-ből következik Világos, hogy ez az állítás nem
megfordítható, tehát lehet a mátrix diagonális, ebből még nem következik, hogy a sajátértékek különbözők. Gondoljunk az identikus operátorra, illetve az egységmátrixra 19 2.2 A karakterisztikus polinom 2.4 Tétel Jelölje az n × n-es egységmátrixot I! Az F test feletti n dimenziós vektortér ϕ lineáris operátorának mátrixát valamely rögzített bázisra vonatkozóan jelölje M ! ϕ sajátértékei pontosan a det(M − λI) = 0 (∗) (λ-ra felírt) egyenlet megoldásai az F testben. Az előbbi egyenletet a ϕ karakterisztikus egyenletének illetve az M mátrix karakterisztikus egyenletének nevezzük Bizonyítás: A λ ∈ F skalár akkor és csakis akkor sajátérték, ha létezik olyan x 6= 0 vektor, hogy ϕ(x) = λx. Jelölje id a vektortér identikus operátorát! Ekkor: ϕ(x) = λx ⇐⇒ ϕ(x) = (λ id)(x) ⇐⇒ (ϕ − λ id)(x) = 0. Tehát λ ∈ F akkor és csakis akkor sajátérték, ha létezik olyan nem nulla vektor, hogy (ϕ − λ
id)(x) = 0. Bázis rögzítése után ez a feltétel azt jelenti, hogy az (M − λI)X = 0 homogén lineáris egyenletrendszernek van triviálistól különböző megoldása. (Az x vektor adott bázisra vonatkozó koordinátáit az X oszlopvektor jelöli.) A triviálistól különböző megoldás létezésének szükséges és elégséges feltétele, hogy az M − λI mátrix rangja kisebb legyen mint n, a vektortér dimenziója, azaz a mátrix determinánsa 0 legyen. (Indokolhatunk a Cramer-szabállyal is: ha a determináns nem nulla, akkor a megoldás egyértelmű, vagyis csak a triviális megoldás van.) 2.5 Tétel (∗) bal oldalán egy n-edfokú polinom áll, melynek főegyütthatója (−1)n Ezt a polinomot a ϕ operátor, vagy az M mátrix karakterisztikus polinomjának nevezzük Bizonyítás: Az M − λI mátrixot a következőképpen írhatjuk fel: m11 − λ m22 − λ . mnn − λ A determináns definícióját alkalmazva, tehát a
determinánst összegként felírva, az összeg mindegyik tagjában szerepel tényezőként valahány elem a főátlóból, esetleg egy sem. Ez azt jelenti, hogy λ egy n-edfokú polinomját kapjuk, a főegyüttható pedig akkor jelentkezik, amikor valamennyi tényezőt a főátlóból választottuk: (m11 − λ)(m22 − λ) · · · (mnn − λ) = (−1)n λn + . 20 2.6 Tétel Egy lineáris operátor karakterisztikus polinomja független a bázis megválasztásától Hasonló mátrixok karakterisztikus polinomja megegyezik. Bizonyítás: Azt kell belátni, hogy ha S tetszőleges invertálható mátrix, akkor M és S −1 M S karakterisztikus polinomja megegyezik. det(S −1 M S − λI) = = = = det(S −1 M S − λS −1 IS) = det(S −1 (M − λI)S) = szorzástétel det(S −1 ) det(M − λI) det(S) = det(S −1 ) det(S) det(M − λI) = det(M − λI) {z } | =det(S −1 S=1) 2.7 Tétel Egy komplex test feletti vektortér, vagy egy valós test feletti páratlan
dimenziós vektortér minden lineáris operátorának van sajátvektora Bizonyítás: Ha komplex test feletti a vektortér, akkor a karakterisztikus polinom egy komplex együtthatós n-edfokú polinom, s a karakterisztikus egyenlet gyökeit C-ben keressük. Az algebra alaptétele szerint mindig lesz gyök C-ben, tehát mindig van sajátérték. Valós test feletti vektortér esetén a karakterisztikus polinom valós együtthatós n-edfokú polinom, s a karakterisztikus egyenletnek nem biztos, hogy van valós gyöke. Ha azonban a karakterisztikus polinom fokszáma páratlan, akkor van valós gyök, amint azt szintén az algebrából tudjuk. Definíció. Egy sajátérték algebrai multiplicitásán azt értjük, hogy hányszoros multiplicitású gyöke a karakterisztikus egyenletnek. Egy lineáros operátor spektruma a sajátértékek olyan sorozata, melybe minden sajátérték annyiszor szerepel, ahányszoros az algebrai multiplicitása A spektrum teljes, ha a spektruma n tagú, azaz a
tagszám megegyezik a vizsgált vektortér dimenziójával. 2.8 Tétel Komplex test feletti vektortér bármely lineáris operátorának spektruma teljes, azaz multiplicitásokkal együtt annyi sajátértéke van, amennyi a vektortér dimenziója. Az operátor karakterisztikus egyenlete pedig (λ − λ1 )(λ − λ2 ) · · · (λ − λn ) = 0, ahol (λ1 , . , λn ) az operátor spektruma Bizonyítás: Az algebrából tudjuk, hogy egy n-edfokú polinomnak multiplicitásokkal együtt pontosan n gyöke van C-ben, s a polinom a tételben leírt módon bomlik elsőfokú tényezők szorzatára. (Mivel a tételben a karakterisztikus egyenletet írtuk fel, ezért a karakterisztikus polinom a bal oldaltól egy (−1)n faktorban különbözik!) A következőekben a geometriai és az algebrai multiplicitás összehasonlításával foglalkozunk. Először egy konkrét példán szemléltetjük a két fogalmat. 21 Példa. Tekintsük a deriválást, mint lineáris operátort a komplex
együtthatós, legfeljebb (n − 1) edfokú polinomok n dimenziós terében! A λ ∈ C szám akkor lesz sajátérték, ha valamely nemzéró polinomra p0 (t) = λp(t). Mivel a deriválás során a fokszám eggyel csökken, ezért ez az összefüggés csak λ = 0-ra és konstans polinomokra teljesülhet. A λ = 0 tehát egyetlen sajátértéke a deriválás operátornak, s mivel a spektrum teljes, ezért az algebrai multiplicitásnak n-nek kell lennie. A λ = 0-hoz tartozó sajátaltér azonban a konstans polinomokból áll, s így a sajátérték geometriai multiplicitása 1. A két fogalom tehát nem egyezik meg 2.9 Tétel Egy sajátérték geometriai multiplicitása nem lehet nagyobb az algebrai multiplicitásnál Bizonyítás: Legyen λ0 a ϕ operátor sajátértéke, L0 a hozzá tartozó invariáns altér. Vegyünk fel V -ben úgy egy bázist, hogy egy L0 -ban felvett (e1 , . , eg ) bázist kiegészítünk a tér bázisává (e1 , . , eg ) a ϕ operátor sajátvektoraiból
áll, és a λ0 sajátérték geometriai multiplicitása g Ebben a bázisban ϕ mátrixa ¯ λ0 . 0 ¯ ¯ . ¯ ¯ 0 . λ ¯ ¯ 0 ¯ , ¯ ¯ ¯ ¯ ¯ 0 azaz a karakterisztikus polinom: ¯ ¯ ¯ λ0 − λ . 0 ¯ ¯ ¯ . ¯ ¯ . ¯ ¯ ¯ 0 . λ0 − λ ¯¯ ¯ P (λ) = ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯ 0 ¯ ¯ ¯ ¯ ¯ ¯ ¯ ¯. ¯ ¯ ¯ ¯ ¯ Az első r oszlopból (λ0 − λ)-t kiemelve azt kapjuk, hogy a karakterisztikus polinomra: P (λ) = (λ0 − λ)g · P̃ (λ). A karakterisztikus polinomot tehát (λ0 − λ)-nak legalább g-edik hatványa osztja, ami az algebrai multiplicitás definíciója szerint az állításunkat jelenti. 2.10 Tétel Egy komplex test feletti lineáris operátor akkor és csakis akkor diagonalizálható, ha minden sajátértékének geometriai multiplicitása megegyezik az algebraival. Egy valós test feletti lineáris operátor akkor és csakis akkor diagonalizálható, ha
spektruma teljes, továbbá, ha minden sajátértékének geometriai multiplicitása megegyezik az algebraival. 22 Bizonyítás: Tehát annak szükséges és elégséges feltételét keressük, hogy legyen sajátvektorokból álló bázis. Legyen a tér n dimenziós Az előző tétel szerint legfeljebb annyi lineárisan független sajátvektor lehet, ahány tagú a spektrum. Tehát pontosan n lineárisan független sajátvektor pontosan akkor létezik, ha a spektrum egyrészt teljes, másrészt minden sajátértékhez annyi lineárisan független (hozzá tartozó) sajátvektort tudunk felsorolni, ahányszor a spektrumban előfordul. 2.11 Tétel (Jordan-féle normálalak) Egy C feletti vektortérben minden lineáris operátorhoz létezik olyan bázis, melyben az operátor mátrixa a következő alakú: a főátlóban az operátor (λ1 , . , λk ) sajátértékei szerepelnek, közvetlenül a főátló alatt 1 vagy nulla szerepel, minden más mátrixelem zérus: ¯ λ1
0 . 0 ¯¯ ¯ 1 . 0 ¯ ¯ 0 1 λ1 0 ¯ ¯ 0 0 1 λ1 ¯ . . . ¯ . ¯ ¯ ¯λk 0 . 0 ¯ ¯ ¯ 1 . 0 ¯ ¯ 0 1 λk 0 ¯ ¯ 0 0 1 λk (Egy sajátérték több blokkban is szerepelhet. Ha egy blokk mérete 1 × 1, akkor a blokkban nem szerepel egyes.) Megjegyzés. A tételt úgy is fogalmazhatjuk, hogy minden (komplex elemekből álló) négyzetes mátrix hasonló a tételben megadotthoz. Bizonyítás: Nem tárgyaljuk. 2.3 Önadjungált transzformációk szerkezete Ebben a paragrafusban kiindulópontunk egy (V, h, i) euklideszi vektortér, tehát a vektortér R feletti. Tudjuk, ilyenkor egy lineáris operátor sajátértékeiről általában semmit nem tudunk garantálni, a karakterisztikus polinomnak nem biztos, hogy vannak valós gyökei Az önadjungált operátorok esetében azonban teljesül a diagonalizálhatóság, amint azt a
paragrafus fő tétele kimondja. Az alábbi technikai jellegű állítás könnyen ellenőrizhető: Lemma. Értelmezzük a következő Cn × Cn C leképezést: (X, Y ) 7 hX, Y i = x1 ȳ1 + · · · + xn ȳn , 23 ahol X = (x1 , . , xn ), Y = (y1 , , yn ) A definiált leképezés mindkét változóban additív, az első változóban (komplex) homogén, hX, Xi = 0 ⇐⇒ X = 0, továbbá hX, λY i = λ̄hX, Y i. Megjegyzés. A definiált leképezés nem skaláris szorzat, mert nem valós test fölötti vektortérben vagyunk. 2.12 Tétel R feletti n × n-es szimmetrikus mátrix karakterisztikus egyenletének multiplicitásokkal együtt n valós gyöke van Bizonyítás: Legyen A valós elemekből álló szimmetrikus mátrix. Ekkor az LA : Cn Cn , X 7 LA (X) = A · X lineáris operátorra könnyen teljesül, hogy hLA (X), Y i = hX, LA (Y )i azaz hA · X, Y i = hX, A · Y i. A komplex test feletti téren ható LA lineáris operátor spektruma teljes, azaz
multiplicitásokkal együtt n (komplex) sajátértéke van, ezek A karakterisztikus egyenletének gyökei. Jelöljön egy sajátértéket λ! Ekkor egyrészt ∀X ∈ Cn sajátvektorra : hA · X, Xi = hλX, Xi = λhX, Xi (∗) hA · X, Xi = hX, A · Xi = hX, λXi = λ̄hX, Xi. (∗∗) másrészt (∗)-ot és (∗∗)-ot összehasonlítva: (λ − λ̄) hX, Xi = 0, | {z } 6=0 azaz λ = λ̄, tehát λ valós. 2.13 Tétel (Önadjungált operátorok spektruma) Legyen adott egy euklideszi téren egy ϕ önadjungált lineáris operátor! Ekkor ϕ spektruma teljes, továbbá létezik a térben ϕ sajátvektoraiból álló ortonormált bázis. Ebben a bázisban ϕ mátrixa diagonális, a főátlóban ϕ sajátértékei állnak. Bizonyítás: A lemma alapján tudjuk, hogy a ϕ operátor karakterisztikus egyenletének multiplicitásokkal együtt n valós gyöke van, hiszen ortonormált bázisban ϕ mátrixa szimmetrikus. A sajátvektorokból álló ortonormált bázis létezését kell
bizonyítani. A bizonyítás az euklideszi tér dimenziója szerinti teljes indukció 1 dimenziós térben 1 sajátérték van, s az ehhez tartozó tetszőleges sajátvektor a tér kívánt bázisa. Tegyük fel, hogy az állítás igaz minden n − 1 24 dimenziós euklideszi térre. Bebizonyítjuk, hogy n dimenziósra is igaz Legyen tehát dim V = n, ϕ : V V önadjungált lineáris operátor. A lemma miatt tudjuk, hogy létezik sajátvektor, jelölje ezt v. Legyen H = L(v), azaz H a v sajátvektor által generált 1 dimenziós altér Jelölje ennek ortogonális komplementerét H ⊥ . H ⊥ -ről azt állítjuk, hogy invariáns altere a ϕ operátornak Valóban, legyen x ∈ H ⊥ Ez azt jelenti, hogy x merőleges v-re: hx, vi = 0 Be kell látni, hogy ϕ(x) is merőleges v-re: hϕ(x), vi = hx, ϕ(v)i = hx, λvi = λhx, vi = 0 ϕ önadjungált v sajátvektor linearitás H ⊥ invariáns tulajdonsága azt jelenti, hogy ϕ leszűkíthető H ⊥ -re, tehát a leszűkítés
egy n − 1 dimenziós téren ható önadjungált operátor. Erre az indukciós feltevés miatt igaz, hogy létezik v -vel a tér kívánt ortonorbenne a ϕ sajátvektoraiból álló ortonormált bázis. Ezt kiegészítve kvk mált bázisát kapjuk. Az előző tétel fontos következménye, hogy a diagonális mátrix nemcsak önadjungált operátoroknál, hanem kvadratikus formáknál is elérhető. 2.14 Tétel (Kvadratikus formák főtengelytranszformációja) Egy n dimenziós euklideszi téren értelmezett Q kvadratikus forma esetén létezik a térnek olyan ortonormált bázisa, hogy ebben Q mátrixa diagonális. Bizonyítás: Legyen Q poláris formája az L szimmetrikus bilineáris forma. Tudjuk (121), hogy L-hez létezik olyan ϕ lineáris operátor, hogy L(x, y) = hϕ(x), yi. Mivel L szimmetrikus, ezért ortonormált bázisra vonatkozó mátrixa szimmetrikus, mátrixa transzponáltja pedig megegyezik ϕ mátrixával (a rögzített ortonormált bázisban). Mindez azt jelenti,
hogy ϕ mátrixa ortonormált bázisban szimmetrikus, tehát ϕ önadjungált. Tehát létezik olyan ϕ önadjungált operátor, hogy ∀x ∈ V : Q(x) = hϕ(x), xi. Legyen (e1 , . , en ) a ϕ sajátvektoraiból álló ortonormált bázis Kvadratikus forma (adott bázisra vonatkozó) mátrixa megegyezik a poláris formájának mátrixával Ennek i-edik sora j-edik eleme: L(ei , ej ) = hϕ(ei ), ej i = hλi ei , ej i = λi hei , ej i, ahol λi a ϕ megfelelő sajátértéke. ( hei , ej i = A megadott bázisban tehát Q mátrixa: λ1 0 0 λ2 0 0 1, ha i = j 0, ha i 6= j 0 0 , . λn . . . 25 ahol (λ1 , . , λn ) a ϕ spektruma Definíció. Azon ortonormált bázis vektorait, melyben egy kvadratikus forma mátrixa diagonális, a kvadratikus forma főtengelyeinek nevezzük. Ha olyan báziscserét hajtunk végre, hogy az új bázis a kvadratikus forma főtengelyeiből áll, akkor ezt a báziscserét főtengelytranszformációnak
nevezzük. Az előző tétel közvetlen következménye az alábbi: 2.15 Tétel (Kvadratikus formák négyzetösszegre transzformálása) Főtengelyek alkotta ortonormált bázisban teljesül, hogy Q(x) = λ1 x21 + · · · + λn x2n , ahol (x1 , . , xn ) az x vektor koordinátái, λ1 , , λn pedig Q (erre a bázisra vonatkozó) mátrixának sajátértékei Megjegyezzük, hogy egy kvadratikus forma mátrixa nemcsak ortonormált bázisban lehet diagonális, s a főátlóban álló elemek sincsenek egyértelműen meghatározva, azaz ha két különböző bázisra vonatkozóan a kvadratikus forma mátrixa diagonális, akkor a diagonálisban álló elemek nem biztos, hogy megegyeznek. Ezzel kapcsolatban bizonyítás nélkül mondjuk ki a következő összefüggést: 2.16 Tétel (Tehetetlenségi tétel) Kvadratikus formák kétféle négyzetösszegre transzformálásakor a pozitív együtthatók száma mindkét esetben megegyezik Hasonlóan a negatív együtthatók száma
mindkét esetben megegyezik, s végül a zérus együtthatók száma is mindkét esetben megegyezik. 2.4 Ortogonális transzformációk szerkezete 2.17 Tétel Tetszőleges ortogonális mátrix determinánsa +1 vagy −1 Bizonyítás: Legyen M ortogonális mátrix. Alkalmazzuk a szorzástételt, s azt a tényt, hogy négyzetes mátrix és transzponáltja determinánsa megegyeznek: 1 = det(M · M −1 ) = det M · det M −1 = (det M )2 . 2.18 Tétel Ortogonális mátrix karakterisztikus egyenletének gyökei olyan komplex számok, melyek modulusa (abszolút értéke) 1 Bizonyítás: Legyen M ortogonális mátrix! Az LM : Cn Cn , X 7 LM (X) = M · X lineáris operátorról egyszerű számolással látható, hogy hX, Y i = hLM (X), LM (Y )i(= hM · X, M · Y i). 26 Legyen LM , azaz M egy sajátértéke λ. hX, Xi = hM · X, M · Xi = hλX, λXi = λλ̄hX, Xi, Tehát λλ̄ = 1. 2.19 Tétel R2 tetszőleges ortogonális operátorának mátrixa tetszőleges ortonormált
bázisban µ ¶ cos α ∓ sin α , sin α ± cos α ahol a felső előjelek a +1 determinánsú, míg az alsó előjelek a −1 determinánsú operátorra vonatkoznak. A fentebbi mátrix az összes 2 × 2-es ortogonális mátrixot megadja. Bizonyítás: Foglalkozzunk a +1 determinánsú esettel, a −1 determinánsú eset analóg. Legyen tetszőleges ortonormált bázisban a ϕ ortogonális operátor mátrixa µ ¶ α β U= . γ δ Mivel U ortogonális, ezért inverze megegyezik a transzponáltjával: µ α β γ δ ¶−1 µ = ¶ α γ . β δ (∗) Másrészt az inverz mátrixot a tanult módon a kofaktorokkal meghatározva: µ α β γ δ ¶−1 µ = ¶ δ −β . −γ α (∗∗) (∗)-ot és (∗∗)-ot összehasonlítva: α = δ, γ = −β, tehát a keresett mátrix: µ ¶ α −β , β α ahol α2 + β 2 =1 (a mátrix determinánsa 1), tehát létezik olyan α ∈ [0, π), hogy α = cos α, β = sin α, ami a bizonyítandó állítást jelenti. 2.20 Tétel R2
egy −1 determinánsú ortogonális operátorának spektruma (−1, +1) Létezik az operátor sajátvektoraiból álló ortonormált bázis, melyben az operátor mátrixa µ ¶ 1 0 , 0 −1 vagyis az operátor tengelyes tükrözés. 27 Bizonyítás: A karakterisztikus egyenlet: λ2 + bλ − 1 = 0 (b valamilyen konstans), melynek diszkriminánsa b2 + 4 > 0, tehát van két (különböző) valós sajátérték. Mivel a sajátértékek abszolút értéke 1, ezért a sajátértékek +1 ill −1 Azt kell belátni, hogy az ehhez tartozó sajátvektorok ortogonálisak. (Normálással tehát valóban ortonormált bázishoz jutunk) Legyen az 1 sajátértékhez tartozó egyik sajátvektor e1 , a −1-hez tartozó pedig e2 . he1 , e2 i = hϕ(e1 ), ϕ(e2 )i = h1 · e1 , −1 · e2 i = −he1 , e2 i, tehát he1 , e2 i = 0. 2.21 Tétel R3 +1 determinánsú ortogonális operátorához létezik olyan ortonormált bázis melyben mátrixa: 1 0 0 0 cos α − sin α . 0 sin α
cos α R3 −1 determinánsú ortogonális operátorához létezik olyan ortonormált bázis melyben mátrixa: −1 0 0 0 cos α − sin α . 0 sin α cos α Bizonyítás: Három dimenzióban biztosan van valós sajátérték, s ez (lévén az abszolút értéke +1) +1 vagy −1. Ebből következik, hogy az operátornak van 1 dimenziós invariáns altere, melyet jelöljön H. Egyszerűen látható, hogy H ⊥ is invariáns altér, melyen tehát az operátor leszűkítése szintén ortogonális operátor. x ∈ H ⊥ : ∀ϕ(y) ∈ H, hϕ(x), ϕ(y)i = hx, yi = 0. H ⊥ -re az előző tételt alkalmazva rövid esetvizsgálat után adódik állításunk. (Esetleg szükség lesz a bázisvektorok sorrendjének megváltoztatására.) 28 3. fejezet Geometriai alkalmazások 3.1 Geometriai transzformációk Geometriai alapfogalmak Rn néhány objektumára lineáris algebrai jellegű és geometriai jellegű elnevezések egyaránt használatosak. Definíció. Rn egy
nulla dimenziós lineáris sokaságát (vagyis Rn egy vektorát) Rn egy pontjának nevezzük. Rn egy egydimenziós lineáris sokaságát Rn egyenesének nevezzük Rn egy n − 1 dimenziós lineáris sokaságát Rn egy hipersíkjának nevezzük. Példa. R hipersíkjai a pontok, R2 hipersíkjai az egyenesek, R3 hipersíkjai a kétdimenziós lineáris sokaságok Példa. Legyenek x 6= y ∈ Rn pontok! Ekkor a következő halmaz, melyet (x, y) felezőmerőleges hipersíkjának nevezünk, hipersík: { u ∈ Rn | kx − uk = ky − uk }. 3.1 Tétel Legyenek x, y ∈ Rn pontok, x 6= y Ekkor Rn minden egyenese felírható ` = { tx + (1 − t)y | t ∈ R } alakban. Megfordítva, minden ilyen előállítás Rn egy egyenesét adja meg Bizonyítás: Legyen ` = L(v) + y = { y + tv | t ∈ R } (v 6= 0) egydimenziós lineáris sokaság. Definiáljuk x-et a következőképpen: x = y + v. Ekkor y + tv = y + t(x − y) = tx + (1 − t)y. Megfordítva, tx + (1 − t)y = y + (x − y)t. ` tehát egy
L(x − y) irányterű, y eltolóvektorú lineáris sokaság. 29 Definíció. Az (x1 , , xn+1 ) (xi ∈ Rn ) pontokat általános helyzetűeknek nevezzük, ha nincsenek benne egyetlen hipersíkban sem Példa. Jelölje Rn természetes bázisát (e1 , , en ) (0, e1 , , en ) általános helyzetűek 3.2 Tétel Legyenek (P0 , , Pn ) általános helyzetű pontok Rn -ben Ekkor (P1 − P0 , , Pn − P0 ) bázis Rn -ben. jel. Bizonyítás: Legyen L(P1 − P0 , . , Pn − P0 ) = H Ha H 6= Rn , akkor H-t tartalmazza egy e e + P0 hipersíkban valamennyi pont benne van, ami H-val jelölt n − 1 dimenziós altér. A H ellentmondás. Affin transzformációk Definíció. Az F : Rn Rn bijektív leképezést affin transzformációnak nevezzük, ha egyenestartó, azaz tetszőleges egyenes képe egyenes Példa. Jelölje Gl(n) Rn bijektív lineáris transzformációinak csoportját Minden ϕ ∈ Gl(n) lineáris leképezés egyben affin transzformáció is. Valóban: ϕ[tx + (1
− t)y] = tϕ(x) + (1 − t)ϕ(y). Mivel x 6= y és ϕ bijektív, ezért ϕ(x) 6= ϕ(y). Tehát ϕ(`) = { tϕ(x) + (1 − t)ϕ(y) | t ∈ Rn } egyenes. Példa. Legyen w ∈ Rn Értelmezzük az alábbi leképezést: τw : Rn Rn , x 7 τw (x) = x + w. Legyen ` = { x + tv | t ∈ R } (v 6= 0) egyenes. τw (x + tv) = x + w + tv, azaz τw (`) a L(v) irányterű, x + w eltolóvektorú egyenes. A τw transzformációt w vektorú eltolásnak nevezzük τw affin, de w 6= 0-ra τw ∈ / Gl(n), mert τw (0) = w 6= 0. Példa. Legyen λ 6= 0 valós szám Értelmezzük a következő leképezést: δλ : Rn Rn , x 7 δλ (x) = λx. Mivel δλ ∈ Gl(n), ezért az első példa szerint affin. δλ -t λ arányú, origó középpontú homotéciának vagy középpontos hasonlóságnak nevezzük 3.3 Tétel (Az affin leképezések főtétele) Az F : Rn Rn bijekció akkor és csakis akkor affin leképezés, ha ∃ϕ ∈ Gl(n) és w ∈ Rn , hogy F = τw ◦ ϕ, azaz ∀x ∈ Rn : F (x) = ϕ(x)
+ w. 30 Következmény. (Rn affin transzformációi) Legyen F : Rn Rn affin transzformáció, jel. F (X) = X 0 X ∈ Rn . Ekkor ∃A ∈ Mn×n invertálható mátrix és v ∈ Rn vektor, hogy X 0 = AX + v. Ezt a mátrixalakban leírt összefüggést részletesen kiírva pl. két dimenzióban, a következő összejel függést kapjuk. Ha F : R2 R2 affin transzformáció, F (x, y) = (x0 , y 0 ) Ekkor ∃A = (aij ) ∈ M2×2 invertálható mátrix és ∃(v1 , v2 ) ∈ R2 számpár, hogy x0 = a11 x + a12 y + v1 y 0 = a21 x + a22 y + v2 , det A = a11 a22 − a12 a21 6= 0. Definíció. Az F : Rn Rn leképezésnek x ∈ Rn fixpontja, ha F (x) = x 3.4 Tétel (Az affin transzformációk fixponttétele) Legyen F : Rn Rn affin, F = τv ◦ ϕ, ahol ϕ ∈ Gl(n), v ∈ Rn . (i) Ha ker(ϕ − idRn ) = {0}, akkor F -nek egyértelműen létezik fixpontja. (ii) Ha F -nek van n + 1 általános helyzetű fixpontja, akkor F = idRn . Bizonyítás: (i) Legyen ker(ϕ − idRn ) = {0}. A
nullitás+rang tétel szerint ekkor im(ϕ − idRn ) = Rn . Tehát speciálisan −F (0)-hoz ∃!x ∈ Rn : ϕ(x) − x = F (0) Ez ekvivalens azzal, hogy F (x) − F (0) − x = F (0) ⇐⇒ F (x) = x, azaz x fixpont. Az egyértelműség bizonyítása. Teljesüljön, hogy F (x) = x és F (y) = y Ez ekvivalens azzal, hogy ϕ(x) + v = x és ϕ(y) + v = y ⇐⇒ ϕ(x) − x = v és ϕ(y) − y = v =⇒ ϕ(x − y) − (x − y) = 0 =⇒ x − y ∈ ker(ϕ − idRn ) = {0} ⇐⇒ x − y = 0 ⇐⇒ x = y. (ii) Legyenek (P0 , . , Pn ) az általános helyzetű fixpontok: ∀i ∈ {0, . , n} : ϕ(Pi ) + v = Pi ⇐⇒ (ϕ − idRn )(Pi ) = v. A ϕ − idRn lineáris transzformáció tehát a (P1 − P0 , . , Pn − P0 ) bázis minden vektorán a zéróvektort veszi fel, ezért ez a transzformáció a zérus leképezés, amiből az állításunk nyilvánvalóan következik. 3.5 Tétel (Az affin transzformációk alaptétele) Legyenek (P0 , P1 , . , Pn ) és (Q0 , Q1 , , Qn )
általános helyzetű pont (n + 1)-esek. Egyértelműen létezik olyan F : Rn Rn affin leképezés, melyre teljesül, hogy: ∀i ∈ {0, . , n} : F (Pi ) = Qi 31 Bizonyítás: Tudjuk, hogy E = (P1 − P0 , . , Pn − P0 ) továbbá E 0 = (Q1 − Q0 , , Qn − Q0 ) Rn egy-egy bázisát alkotják. A lineáris kiterjesztés tétele szerint egyértelműen létezik olyan ϕ ∈ Gl(n) lineáris izomorfizmus, hogy ϕ(E) = E 0 . Legyen F = τQ0 ϕτ−P0 Azaz: ∀X ∈ Rn : F (X) = ϕ(X − P0 ) + Q0 . Egyszerű behelyettesítés mutatja, hogy F rendelkezik a kívánt tulajdonsággal. Az egyértelműséget a következőképpen látjuk be. Legyenek F1 és F2 affin transzformációk a kívánt tulajdonsággal. ∀i ∈ {0, . , n} : F2−1 F1 (Pi ) = Pi , ami a fixponttétel szerint azt jelenti, hogy F2−1 F1 = idRn ⇐⇒ F1 = F2 . Izometriák Definíció. Az F : Rn Rn bijektív leképezést izometriának vagy egybevágóságnak nevezzük, ha távolságtartó, azaz ¡
¢ ∀x, y ∈ Rn : d F (x), F (y) = d(x, y). Példa. Rn ortogonális transzformációi egyben Rn izometriái is, amint arról már korábban volt szó. Izometria továbbá minden eltolás is: kτv (x) − τv (y) = kx + v − (y + v)k = kx − yk. Példa. Legyen H Rn egy hipersíkja Az x ∈ Rn pont x0 -vel jelölt képét definiáljuk a következőképpen Ha x ∈ H, akkor x = x0 , egyébként x0 az az egyértelmű pont, melyre (x, x0 ) felezőmerőleges hipersíkja H. Az így definiált leképezés izometria, melyet a H hipersíkra vonatkozó tükrözésnek nevezzük 3.6 Tétel (Az izometriák főtétele) Egy F : Rn Rn bijektív leképezés akkor és csakis akkor izometria, ha ∃ϕ ∈ Gl(n) ortogonális transzformáció és v ∈ Rn vektor, hogy F = τv ◦ ϕ, azaz ∀x ∈ Rn : F (x) = ϕ(x) + v. Bizonyítás: Mivel minden ortogonális transzformáció és eltolás izometria, ezek kompozíciója is az. Legyen most F : Rn Rn egybevágóság. v-t és ϕ-t a
következőképpen konstruáljuk meg v = F (0), ϕ : Rn Rn , ϕ(c) = F (x) − v. (ϕ-ről pillanatnyilag még nem tudjuk, hogy lineáris leképezés.) Először belátjuk, hogy az előbbiekben megkonstruált ϕ megtartja a skaláris szorzatot. Emlékeztetünk arra, hogy n ∀ξ, η ∈ R : kξk2 + kηk2 − kξ − ηk2 . hξ, ηi = 2 32 Tehát kϕ(x)k2 + kϕ(y)k2 − kϕ(x) − ϕ(y)k2 = 2 kF (x) − F (0)k2 + kF (y) − F (0)k2 − kF (x) − F (0) − F (y) + F (0)k2 = = 2 kxk2 + kyk2 − kx − yk2 kx − 0k2 + ky − 0k2 − kx − yk2 = = hx, yi , = 2 2 hϕ(x), ϕ(y)i = felhasználva, hogy F izometria. Végezetül belátjuk, hogy ϕ lineáris. Az előző bizonyításrészből közvetlenül következik, ¡ ¢ hogy ha E = (e1 , . , en ) ortonormált bázis, akkor E 0 = ϕ(e1 ), , ϕ(en ) is ortonormált bázis. Vegyük ϕ(x) Fourier-előállítását E 0 -re vonatkozóan: ϕ(x) = n X hϕ(x), ϕ(ei )i ϕ(ei ) = i=1 n X hx, ei i ϕ(ei ). i=1 ϕ(x)-nek ez
a kifejezése x-ben lineáris. Következmény. Minden izometria affin leképezés Valóban, minden izometria egy (speciális, nevezetesen ortogonális) lineáris leképezés kompozíciója, ezért az affin leképezés. A 2 × 2-es ortogonális mátrixok ismeretében explicit leírást adhatunk R2 izometriáira. jel. Következmény. (R2 izometriái) Legyen F : R2 R2 , F (x, y) = (x0 , y 0 ) izometria Ekkor ∃α ∈ [0, 2π) és ∃(v1 , v2 ) ∈ R2 : x0 = cos α · x ∓ sin α · y + v1 y 0 = sin α · x ± cos α · y + v2 . 3.7 Tétel Rn minden izometriája legfeljebb n + 1 hipersíkra vonatkozó tükrözés szorzata Bizonyítás: Legyenek (x1 , . , xn+1 ) általános helyzetű pontok, F : Rn Rn izometria, F (xi ) = x0i , (i = 1, . , n + 1) Egészen pontosan azt fogjuk belátni, hogy ha x1 , , xk fixpontok, de xk+1 6= x0k+1 , akkor F előáll mint legfeljebb n + 1 − k hipersíkra vonatkozó tükrözés szorzata (k = 0, . , n + 1) k szerinti, lefelé haladó
indukcióval bizonyítunk k = n + 1 esetén x1 = x01 , x2 = x02 . , xn+1 = x0n+1 , ekkor nyilvánvalóan F = id Indukciós feltevésként tegyük fel, hogy az állítás 1 ≤ k ≤ n + 1-re igaz. Teljesüljön, hogy x1 = x01 , x2 = x02 , . , xk−1 = x0k−1 , de xk 6= x0k Ekkor ∀i ∈ {1, . , k − 1} : d(xi , xk ) = d(x0i , x0k ) = d(xi , x0k ), azaz x1 , . , xk−1 benne vannak (xk , x0k ) H-val jelölt felezőmerőleges hipersíkjában A H hipersíkra vonatkozó tükrözésnek x1 , , xk−1 fixpontjai, xk 7 x0k F ◦ ρH -re alkalmazható az indukciós feltevés. 33 Hasonlóságok Definíció. Az F : Rn Rn bijektív leképezést hasonlóságnak nevezzük, ha ∃λ > 0 valós szám, hogy ¡ ¢ ∀x, y ∈ Rn : d F (x), F (y) = λ · d(x, y). λ-t a hasonlóság arányának nevezzük. Példa. Korábban affin leképezésre egyik példánk a(z origó középpontú) középpontos hasonlóság volt, melyről könnyű látni, hogy hasonlóság 3.8 Tétel F :
Rn Rn bijektív leképezés akkor és csakis akkor hasonlóság, ha ∃ϕ ∈ Gl(n), v ∈ Rn , λ 6= 0 : F = τv ◦ δλ ◦ ϕ, azaz F (x) = λ · ϕ(x) + v. jel. Következmény. (R2 hasonlóságai) Legyen F : R2 R2 , F (x, y) = (x0 , y 0 ) hasonlóság Ekkor ∃α ∈ [0, 2π), λ 6= 0, (v1 , v2 ) ∈ R2 : x0 = λ(cos α · x ∓ sin α · y) + v1 y 0 = λ(sin α · x ± cos α · y) + v2 . 3.9 Tétel (A hasonlóságok fixponttétele) Ha egy hasonlóság nem izometria, akkor egyértelműen létezik fixpontja Bizonyítás: Legyen ϕ egy λ 6= 1 arányú hasonlóság. Azt ellenőrizzük, hogy teljesül az affin leképezések fixponttételében előírt feltétel. x ∈ ker(ϕ − idRn ) ⇐⇒ ϕ(x) − x = 0 ⇐⇒ F (X) − F (0) = x − 0 =⇒ kF (x) − F (0)k = kx − 0k. Ugyanakkor k6=1 kF (x) − F (0)k = λkx − 0k =⇒ x = 0. 3.2 Kúpszeletek elemi és analitikus geometriája Hajós György:Bevezetés a geometriába: 41. § 34 3.3 Másodrendű görbék a
valós síkon Definíció. Legyen A : R2 R2 nem zéró önadjungált lineáris operátor, b ∈ R2 rögzített vektor, c ∈ R rögzített szám. Másodrendű görbén az alábbi halmazt értjük: q = {x ∈ R2 |hA(x), xi + 2hb, xi + c = 0}. Az hA(x), xi + 2hb, xi + c = 0 egyenletet a másodrendű görbe előállításának nevezzük. A másodrendű görbéhez tartozó vektorokat gyakran a másodrendű görbe pontjainak mondjuk. Megjegyzés. Euklideszi térben az önadjungált lineáris operátorok és a kvadratikus formák közt, valamint a lineáris formák és a vektorok közt kölcsönösen egyértelmű megfeleltetés van, ennek megfelelően a másodrendű görbe előállítását a következőképpen is megadhatjuk: q = {x ∈ R2 |Q(x) + 2l(x) + c = 0}, ahol Q egy nem triviális kvadratikus forma, l pedig lineáris forma. Valóban, a definícióból kiindulva Q(x) = hA(x), xi (x ∈ R2 ) egy kvadratikus forma, l(x) = hb, xi egy lineáris forma; illetve megfordítva,
tetszőleges kvadratikus formából és lineáris formából kiindulva az előbbi formulák egyértelműen meghatározzák A-t és b-t. A későbbiekben néha ezt az előállítást is használjuk Q rangját ill. szignatúráját a másodrendű görbe rangjának ill szignatúrájának nevezzük Megadjuk a másodrendű görbék koordinátás előállítását is. Felhívjuk a figyelmet arra, hogy szokásos módon a vektorok, (pontok) koordinátáit 2 dimenzióban nem indexeljük, hanem xszel és y-nal jelöljük. Ez kis figyelmet kíván, mert az x gyakran vektort jelöl (azaz R2 elemét), máskor pedig egy bázisra vonatkozó első koordinátát. A kvadratikus formák és a lineáris formák báziselőállításából közvetlenül következik az alábbi tétel: 3.10 Tétel (Másodrendű görbe egyenlete) Legyen q = { x ∈ R2 | hA(x), xi + 2hb, xi + c = 0 } egy másodrendű görbe. Rögzítsünk R2 -ben egy bázist, a ϕ(x) = hA(x), xi kvadratikus forma erre vonatkozó
mátrixa µ ¶ a11 a12 ,(a12 = a21 ) a21 a22 az l(x) = hb, xi lineáris forma együtthatórendszere (b1 , b2 ). R2 egy vektora akkor és csakis akkor eleme a q másodrendű görbének, ha (x, y) koordinátáira a11 x2 + 2a12 xy + a22 y 2 + 2b1 x + 2b2 y + c = 0 teljesül. A fenti összefüggést a q egyenletének is nevezzük Úgy is fogalmazhatunk, hogy egy másodrendű görbe egy kétváltozós másodfokú polinom zérushelyeinek halmaza R2 -ben. Megjegyezzük, hogy egy másodrendű görbének nemcsak másodfokú egyenlete lehet, de ha egy másodrendű görbe egyenletéről beszélünk, akkor mindig az előző tétel szerint hozzá tartozó kétváltozós másodfokú egyenletre gondolunk. (Egyébként még ez a másodfokú egyenlet sem egyértelműen tartozik a görbéhez, ld. később) 35 Példa. Az alábbi előállítások másodrendű görbéket határoznak meg R2 -ben: {(x, y) ∈ R2 |F (x, y) = 0}, ahol F (x, y) = x2 + y 2 − 1 kör. F (x, y) = x2 + y 2 + 1
üres halmaz. F (x, y) = x2 − y 2 − 1 hiperbola. F (x, y) = x2 − y 2 = (x + y)(x − y) metsző egyenespár. F (x, y) = x2 + y 2 egyetlen pont. F (x, y) = y − x2 parabola. F (x, y) = x2 − 1 párhuzamos egyenespár. F (x, y) = x2 az x = 0 egyenes. F (x, y) = x2 + 1 ez a másodrendű görbe ismét az üres halmaz. Megjegyezzük, hogy a definíció szerint egy egyenes (R2 -ben) mindig tekinthető másodrendű görbének. Legyen ugyanis az egyenes normálegyenlete F (x, y) = 0 ahol F a változók elsőfokú polinomja Az [F (x, y)]2 = 0 egyenlet nyilvánvalóan ugyanannak a ponthalmaznak az egyenlete, de a változóknak már másodfokú polinomja. Az üres halmaz is mindig tekinthető másodrendű görbének. A következőekben a másodrendű görbe egyenletének egyszerűsítése a cél. 3.11 Tétel (Euklideszi normálegyenletek) Létezik az A önadjungált operátor sajátvektoraiból álló ortonormált bázis úgy, hogy a q = {x ∈ R2 |hA(x), xi +
2hb, xi + c = 0} másodrendű görbe egyenlete az alábbiak közül valamelyik: a1 (x − u)2 + a2 (y − v)2 = 0 a1 (x − u)2 + a2 (y − v)2 = 1 a1 (x − u)2 = 2(y − v), (I) (II) (III) ahol a1 , a2 , u, v konstansok; I-nél és II-nél a1 és a2 közül legalább az egyik nem 0, III-nál a1 6= 0. 36 Bizonyítás: Legyenek az A sajátértékei λ1 és λ2 . A sajátvektoraiból álló ortonormált bázisban a q egyenlete ekkor λ1 x2 + λ2 y 2 + 2b1 x + 2b2 y + c = 0, hiszen ortonormált bázisban az A mátrixa és a ϕ(x) = hA(x), xi kvadratikus forma mátrixa megegyezik. Legyen először mindkét sajátérték zérustól különböző Ekkor a q egyenlete ¶2 µ ¶2 µ b2 b2 b2 b1 + λ2 y + = −c + 1 + 2 . λ1 x + λ1 λ2 λ1 λ2 Ha ν = −c + b21 λ1 b21 λ1 + b22 λ2 b22 λ2 = 0, akkor rögtön megkaptuk az I. egyenletet: a1 = λ1 , a2 = λ2 Ha + 6= 0, akkor ezzel mindkét oldalt osztva a II. egyenletet kapjuk: a1 = λν1 , ν = −c + a2 = λν2 . Legyen most
az egyik sajátérték zéró, ekkor a másik biztosan nullától különböző, mert feltettük, hogy A nem zéró operátor. A sajátvektorokból álló ortonormált bázisban a bázisvektorok sorrendje most legyen olyan, hogy az első bázisvektor tartozzon a nemzéró sajátértékhez: λ1 6= 0, λ2 = 0. q egyenlete ebben a bázisban: ¶2 µ b2 b1 = −2b2 y − c + 1 . λ1 x + λ1 λ1 Ha b2 = 0 és b21 λ1 − c = 0, akkor az I. egyenletet kapjuk a1 = λ1 és a2 = 0-val Ha b2 = 0, de µ = λb12 − c 6= 0, akkor 1 b2 6= 0, akkor b21 λ1 − c-vel osztva a II. egyenletet kapjuk: a1 = µ λ1 b1 x+ λ1 ¶2 µ = −2b2 c b21 y+ − 2b2 2λ1 b2 λ1 , µ a2 = 0. Végül, ha ¶ , s ezt az egyenletet (−b2 )-vel osztva a III. egyenletet kapjuk 3.12 Tétel A másodrendű görbék R2 -ben pontosan az alábbiak: ellipszis/kör, parabola, hiperbola, egyenespár, pont, üres halmaz Az egyenespár lehet metsző egyenespár, párhuzamos de nem egybeeső egyenespár,
egybeeső egyenespár.1 Bizonyítás: Az euklideszi normálegyenletek alapján egy másodrendű görbe az alábbi 8 alakzat valamelyike, azok közül pontosan az egyik: 1. Üres halmaz: II egyenlet a1 ≤ 0, a2 ≤ 0, (de a21 + a22 > 0) 2. Pont: I egyenlet, a1 > 0, a2 > 0 3. Párhuzamos egyenespár (beleértve az egybeeső egyenespárt, vagyis az egyenest is): II egyenlet, a két együttható közül az egyik pozitív, a másik 0, vagy I. egyenlet, a két együttható közül az egyik pozitív, a másik 0 1 Mint az a lineáris algebrában szokásos, két egyenest párhuzamosnak nevezünk, ha egysíkúak és nincs közös pontjuk, vagy egybeesnek. Az egybeeső egyenespárra a kettős egyenes elnevezést is használjuk 37 4. Metsző egyenespár: I egyenlet, a két együttható ellentétes előjelű 5. Ellipszis (vagy kör): II egyenlet, mindkét együttható pozitív 6. Parabola: III egyenlet 7. Hiperbola: II egyenlet, a1 és a2 ellentétes előjelű Az
előforduló a1 , a2 együtthatók minden lehetséges szignatúráját megvizsgáltuk, tehát a felsoroltakon kívül más típusú egyenlethez nem juthatunk. Nyilvánvaló, hogy egy másodrendű görbe nem tartozhat két csoportba is, hiszen a csoportok között geometriai jellegű különbség van. (Pl egy ellipszis sohasem hiperbola, mert más tulajdonságú pontok halmaza az ellipszis ill. a hiperbola, stb) A másodrendű görbéről bizonyos információt euklideszi normálegyenletük nélkül is kaphatunk. Az előző bizonyítást figyelmesen tanulmányozva észrevehetjük, hogy det A = λ1 · λ2 előjele megegyezik a1 · a2 előjelével (a III. egyenletben legyen a1 = 1, a2 = 0), tehát sgn(det A) = sgn(a1 · a2 ). Ez azt jelenti, hogy sgn a1 a2 meghatározásához nem kell a görbét normálalakra hozni. Definíció. A q = {x ∈ R2 |hA(x), xi + 2hb, xi + c = 0} másodrendű görbét elliptikusnak nevezzük, ha det A > 0, parabolikusnak, ha det A = 0,
hiperbolikusnak, ha det A < 0. Következmény. Az elliptikus másodrendű görbék az ellipszis a pont és az üres halmaz, a parabolikus másodrendű görbék a parabola, párhuzamos egyenespár (beleértve a kettős egyenest is) és az üres halmaz, a hiperbolikus másodrendű görbék a hiperbola és a metsző egyenespár. (Mint láttuk, az üres halmazra – mint valós másodrendű görbére – a definíció az előállítástól függ, van elliptikus és parabolikus előállítása is az üres halmaznak.) Az euklideszi normálegyenletben szereplő u, v konstansok „eltüntetésével” az egyenleteket tovább egyszerűsíthetjük, ehhez azonban már affin koordinátarendszert kell használni. Ha az origót az (u, v) koordinátájú pontban rögzítjük (az euklideszi normálegyenlethez tartozó bázist használva), akkor az I. II. III. a1 x2 + a2 y 2 = 0 a1 x2 + a2 y 2 = 1 a1 x2 = y, egyenletekhez jutunk, de az itt szereplő koordináták már nem egy bázisra,
hanem egy olyan Descartes-féle koordinátarendszerre vonatkoznak, mely az A operátor sajátvektoraiból álló ortonormált bázisból, s az előbb megadott origóból áll. Ezekben az egyenletekben a konstansokat átjelölve, az ortonormált bázis vektorait esetleg felcserélve kapjuk az ún. kanonikus egyenleteket 38 3.13 Tétel (Másodrendű görbék kanonikus egyenlete) Tetszőleges másodrendű görbéhez létezik olyan Descartes-féle koordinátarendszer, melyben a görbe egyenlete az alábbiak valamelyike: típus I II III y2 y2 x2 x2 hiperbolikus a2 − b2 = 0 a2 − b2 = 1 x2 1 2 = 1 2p x =y parabolikus x2 = 0 a2 x2 = −1 a2 y2 y2 x2 x2 + b2 = 0 a2 + b2 = 1 elliptikus a2 2 x2 + yb2 = −1 a2 39