Tartalmi kivonat
http://www.doksihu MAXIMÁLKORRELÁCIÓ Szakdolgozat Írta : Fegyverneki Tamás Matematika BSc Alkalmazott matematikus szakirány Témavezető : Móri Tamás, egyetemi docens Valószı́nűségelméleti és Statisztika Tanszék Eötvös Loránd Tudományegyetem Természettudományi Kar Eötvös Loránd Tudományegyetem Természettudományi Kar 2010 http://www.doksihu Tartalomjegyzék 1. Bevezetés 3 2. A problémakör 6 2.1 Matematikai eszköztár 6 2.2 Összefüggőségi mérőszámok 8 2.21 A korrelációs együttható 10 2.22 A korrelációs hányados 10 2.23 A kontingencia 11 2.3 Néhány tulajdonság az operátorokról 13 3. A maximálkorreláció 17 3.1 Definı́ció és tulajdonságok 17 3.11 Definı́ció és Rényi követelményei 17 3.12 További
tulajdonságok 19 3.2 A maximálkorreláció kiszámı́tása 26 3.21 Elégséges feltétel és operátorok 26 3.22 Speciális esetek 35 3.23 Algoritmikus közelı́tés 49 2 http://www.doksihu 1. fejezet Bevezetés Valószı́nűségi változók vizsgálatának fontosságát nem szükséges hangsúlyoznunk. Az előrejelzések fontos eszközei alapulnak különböző mért adatok, jellemzők változásainak megfigyelésén és ezek összefüggéseinek vizsgálatán, legyen szó gazdasági folyamatok összejátszásáról, tünetegyüttesek közös megjelenéséről vagy akár az időjárás előrejelzéséről. A mért ismeretek statisztikai feldolgozásánál természetesen nem csak a hipotetikus eloszlások önálló tulajdonságai érdekesek, hanem egymásra gyakorolt hatásuk, összefüggésük mértéke
is. A kölcsönös, vagy éppen nem feltétlenül kölcsönös függés nagyságának kifejezésére a valószı́nűségszámı́tás és matematikai statisztika fejlődése közben számos jó és kevésbé jó, használható és kevésbé használható eszközt definiáltak. Ilyen összefüggőségi mérőszámok megalkotásában is vitathatatlan az – egyébként a világ első egyetemi statisztikai tanszékét megalapı́tó – Karl Pearson munkássága, aki speciális alakban több ilyen, később a teljesség igénye nélkül ismertetett mennyiséget definiált, legalábbis speciális alakban. Az ő nevéhez fűződik a napjainkban is legelterjedtebb és legismertebb mérőszám, a korrelációs együttható, vagy egyszerűen korreláció megalkotása is, amely, mint ismert, a valószı́nűségi vátozók közötti lineáris összefüggés mértéke. Ezt a mérőszámot
használjuk leggyakrabban, az alkalmazás számos területén, holott hátrányai közismertek, gyakorlatban és az elméletben is természe- 3 http://www.doksihu Maximálkorreláció Fegyverneki Tamás tesnek tűnő elvárásokat nem teljesı́t. Jelen dolgozat célja egy, a korreláció hiányosságait áthidaló mérőszám, a maximálkorreláció ismertetése, valamint néhány tulajdonságának körüljárása. A maximálkorreláció alapötlete Hans Gebelein Das statistische Problem der Korrelation als Variations- und Eigenwertproblem und sein Zusammenhang mit der Ausgleichsrechnung cı́mű 1941es cikkéből származik, ahol speciális esetekben már definiált a mennyiség. A maximálkorreláció megfelel a ”jó” mérőszámokról alkotott elképzeléseinknek, viszont általánosságban akadnak problémák kiszámı́thatóságával. Látni fogjuk, hogy pontos értékének meghatározása
korántsem olyan egyszerű, mint a klasszikus Pearson-féle korreláció esetében, ez az oka annak, hogy bár sok szempontból pontosabb képet ad a vizsgálandó összefüggések mértékéről, nem terjedt el a gyakorlatban. Mindenesetre a cél adott, minél jobb eszközöket alkotni a kiszámı́tásra, vagy legalábbis a maximálkorreláció értékének jó becslésére vagy közelı́tésére, hogy elvi előnyei mellett alkalmazásszinten is használható legyen, jelentősen javı́tva ezzel sta-tisztikai vizsgálati, előrejelzési lehetőségeinket. A dolgozat első részében röviden áttekintjük a használatos fogalmak egy részét, bevezetve későbbi jelöléseinket is, majd az összefüggőségi mérőszámok kérdését járjuk körül oly módon, hogy Rényi Alfréd[13] nyomán rögzı́tjük a velük szemben támasztott alapvető követelményeinket, majd néhány lehetséges
mérőszámot tárgyalunk, vizsgálva ezek viszonyát elvárásainkkal. Természetesen a dolgozatban emlı́tetteknél sokkal több használatos mérőszám létezik összefüggés mérésére, elég például a Spearman-féle vagy a Kendall-féle rangkorrelációra gondolnunk. Az itt ismertetett mérőszámok a maximálkorreláció fogalmának kialakulásához vezető út egy-egy lépcsőfokának tekinthetők, másrészt a maximálkorreláció kiszámı́tásához tartozó eszközök tárgyalásakor kapnak szerepet A fejezet utolsó részében tovább bővı́tjük a felhasználandó eszköztárat a később használandó operátorok rövid vizsgálatával A következő fejezetben definiáljuk szintén Rényi nyomán a maximálkorrelációt, olyan esetekre is tárgyalva, amelyeket Gebelein még nem dolgo- 4 http://www.doksihu Maximálkorreláció zott fel. Fegyverneki Tamás A fejezet
első szakaszában a definiáláson túl belátjuk, hogy a maximálkorreláció egy jó mérőszám, olyan értelemben, hogy tényleg teljesı́ti elvi elvárásainkat. Ezek után a kiszámı́táshoz hasznos tulajdonságokat tárgyalunk, visszavezetve operátoregyenletek megoldásaira a problémát. Látni fogjuk, hogy a maximálkorreláció kiszámı́tásához sok esetben adhat segı́tséget operátorok sajátértékeinek és sajátfüggvényeinek meghatározása Az emlı́tett eszközök közül nem mindegyik használatára fogunk példát mutatni, van közöttük, amely egyszerűen csak hasznos segı́tségnek tűnhet egy-egy felmerülő speciális gyakorlati probléma esetén. Ezek után a felépı́tett módszerek egy részének segı́tségével bemutatunk néhány konkrét esetet, amikor a maximálkorreláció értékét pontosan meg tudjuk határozni, leginkább Csáki Péter és Fischer
János[4][5][6] munkásságát felhasználva, valamint példát emlı́tve Székely Gábor és Móri Tamás[17] nyomán, legvégül pedig emlı́tésszinten bemutatunk két vázlatos algoritmust a fent emlı́tett optimális sajátfüggvények kiszámı́tására, melyek közül az egyik sokkal általánosabb esetben is működik függvénytérbeli legjobb transzformáló függvények közelı́tésére. 5 http://www.doksihu 2. fejezet A problémakör 2.1 Matematikai eszköztár A fejezetben elsőként áttekintjük a továbbiakban használatos jelöléseket és terminológiát, majd az összefüggőségi mértékek vizsgálatának egy speciális funkcionálanalı́zisbeli megközelı́tésmódját taglaljuk, nevezetesen a probléma visszavezetését operátorok vizsgálatára. Legyen [Ω, A, P ] egy valószı́nűségi mező, azaz Ω egy nemüres eseménytér, A Ω bizonyos részhalmazaiból
álló σ-algebra, P pedig egy valószı́nűségi mérték A-n. Egy ξ valószı́nűségi változó várható értékét és szórását jelölje rendre Eξ és Dξ. Ha ξ várható értéke és szórása létezik, valamint Dξ > 0, akkor legyen ξ∗ = ξ − Eξ Dξ (2.1) a ξ valószı́nűségi változó standardizáltja. Egy valószı́nűségi változót standardnak nevezünk, ha ξ = ξ ∗ teljesül rá A ξ és η valószı́nűségi változók együttes eloszlását jelölje Qξ,η , eloszlásaikat rendre Qξ és Qη , valamint eloszlásaik direkt szorzatát Qξ × Qη , tehát a valós számegyenes bármely A és B részhalmazára Qξ × Qη (A × B) = P (ξ ∈ A)P (η ∈ B) 6 (2.2) http://www.doksihu Maximálkorreláció Fegyverneki Tamás ahol A×B a halmazok direkt szorzata. A fenti definı́ció a mértékkiterjesztési tétel értelmében kiterjeszthető a sı́k
Borel-halmazaira az ismert módon. A ξ és az η közötti összefüggőséget regulárisnak nevezzük, ha az együttes eloszlásuk abszolút folytonos az eloszlásaik direkt szorzatára nézve, tehát ha Qξ,η Qξ × Qη . L2 = L2 (Ω, A, P ) jelenti azon ζ valószı́nűségi változóknak a terét, amelyekre E(ζ 2 ) véges. Ez Hilbert-tér, amelyben hζ1 , ζ2 i = E(ζ1 ζ2 ) a skaláris p szorzata ζ ∈ L2 -nek és ζ ∈ L2 -nek, tehát kζk = E(ζ 2 ) adódik ζ ∈ L2 normájaként. Könnyen látható, hogy ez valóban skaláris szorzat és norma A ξ valószı́nűségi változó eloszlásfüggvénye legyen F (x), ekkor legyen Z ∞ 2 2 LF = f (x) : f (x)dF (x) < ∞ ! (2.3) −∞ L2F szeparábilis Hilbert-teret alkot az alábbi skaláris szorzattal : Z ∞ f1 (x)f2 (x)dF (x). hf1 (x), f2 (x)i = (2.4) −∞ Legyen f (x) ∈ L2F , ekkor az f = f (ξ) valószı́nűségi változóra f ∈ L2 . Az ilyen
alakú valószı́nűségi változók terét jelölje L2ξ ! Nyilvánvalóan ekkor fennáll L2ξ = L2 (Ω, Aξ , P ), ahol Aξ jelöli a legszűkebb olyan σ-algebrát, ahol ξ mérhető. Funkcionálanalı́zisből ismert, hogy létezik kölcsönösen egyértelmű megfeleltetés a most definiált L2ξ és L2F terek között, amely skalárszorzattartó és természetesen normatartó is, ı́gy L2ξ is szeparábilis Hilbert-tér lesz, amely ξ véges értékkészlete esetén véges dimenziós, speciálisan ha ξ egy diszkrét valószı́nűségi változó, amely n különböző értéket vehet fel, akkor L2ξ euklideszi tér lesz, amely n-dimenziós. Valójában a fent definiált terek valószı́nűségi változók és függvények ekvivalenciaosztályainak terei, L2 és L2ξ terekben a P -majdnem mindenütt egyenlőség, L2F esetén pedig az F -majdnem mindenütt egyenlőség jelenti az
ekvivalenciarelációt. Jelölje L20 az L2 -beli, 0 várható értékű és véges szórású valószı́nűségi változók alterét, és analóg módon jelölje L2F,0 és L2ξ,0 a megfelelő altereket! 7 http://www.doksihu Maximálkorreláció Fegyverneki Tamás Minden L2 -beli ζ valószı́nűségi változó egyértelműen felbontható ζ 0 + ζ 00 alakban, ahol ζ 0 ∈ L2ξ és ζ 00 ortogonális az L2ξ térre, tehát létezik pontosan egy ζ 0 ∈ L2ξ , hogy ∀f ∈ L2ξ hζ 0 , f i = hζ, f i (2.5) Ekkor természetesen ζ 00 = ζ − ζ 0 , és a merőleges vetületre teljesül, hogy min kζ − f k = kζ − ζ 0 k. Legyen Aξ az L2ξ zárt altérre való ortogonális projekció. Ekkor minden ζ ∈ L2 , f ∈ L2ξ esetén hAξ ζ, f i = hζ, f i. (2.6) A fenti ζ esetében Aξ ζ = E(ζ|ξ) 1 valószı́nűséggel, azaz a ζ feltételes várható értéke ξ-re megegyezik ζ L2ξ -re vett
ortogonális projekciójával, ugyanis ha veszünk egy A ∈ Aξ halmazt, tehát létezik egy B Borel-halmaz, hogy A = {ξ ∈ B}, akkor speciálisan az ( f = χA = 1, ξ ∈ B 0, ξ ∈ /B függvényre felhasználva (2.6) egyenlőséget: Z Z Aξ ζdP = ζdP, A (2.7) (2.8) A amiből következik, hogy Aξ ζ = E(ζ|ξ) 1 valószı́nűséggel. 2.2 Összefüggőségi mérőszámok Legyenek ξ és η valószı́nűségi változók az [Ω, A, P ] valószı́nűségi mezőn, mégpedig úgy, hogy egyikük se legyen P -majdnem mindenütt konstans! A statisztikai vizsgálatok szinte minden területén gyakran felmerülő probléma a két valószı́nűségi változó összefüggőségének, annak erősségének numerikus karakterizációja. Erre számos ismert és gyakorlatban is használatos mérőszám áll rendelkezésünkre. Egy ilyen definiálásánál viszont szükségszerűnek tűnik néhány
megszorı́tást bevezetnünk, amelyek alapján eldönthető egy ilyen menynyiségről, mennyire jó, azaz mennyire ad pontos információt az összefüggés 8 http://www.doksihu Maximálkorreláció Fegyverneki Tamás mértékéről. A követelményeket Rényi Alfréd[13] nevéhez köthetjük, mint egyfajta ésszerű elvárásokat az összefüggőségi mérőszámokkal szemben. Jelöljön esetünkben δ(ξ, η) egy ilyen mérőszámot! Természetesnek tűnik, hogy ezt a [0,1] intervallumba eső értékekkel definiáljuk, az 1 értéket a szoros összefüggés, a 0 értéket a teljes függetlenség jellemzőjének tekintve. A δ(ξ, η)-ra vonatkozó követelmények az alábbiak: A) δ(ξ, η) legyen definiálva minden olyan ξ, η valószı́nűségiváltozó-párra, amelyek nem 1 valószı́nűséggel konstansok B) δ(ξ, η) = δ(η, ξ), azaz legyen szimmetrikus C) 0 ≤ δ(ξ, η) ≤ 1 D) δ(ξ, η)
= 0 akkor és csak akkor, ha ξ és η függetlenek E) δ(ξ, η) = 1, ha ξ és η között egyenes összefüggés van, például ha ξ = g(η) vagy η = f (ξ) teljesül, ahol f (x) és g(x) Borel-mérhető függvények F) Ha az f (x) és g(x) Borel-mérhető függvények kölcsönösen egyértelmű leképezések a valós tengelyről saját magára, akkor δ(f (ξ), g(η)) = δ(ξ, η) G) Ha ξ és η együttes eloszlása normális, akkor δ(ξ, η) = |R(ξ, η)|, ahol R(ξ, η) a két valószı́nűségi változó korrelációs együtthatója Az E) jelű feltétel esetében felmerülhet, hogy miért nem követelünk meg az D) esethez hasonlóan szükségességet és elégségességet is, ahogy az természetesnek tűnne. Ezt az elvárást Rényi túlságosan korlátozó erejűnek vélte, ezért vetette el. A továbbiakban röviden áttekintjük – a teljesség igénye nélkül – az ismert és
használatos mérőszámokat, valamint hogy mennyire felelnek meg a Rényi-féle követelményeknek. 9 http://www.doksihu Maximálkorreláció 2.21 Fegyverneki Tamás A korrelációs együttható Tegyük fel, hogy Dξ és Dη pozitı́v és véges, ekkor a klasszikus Pearson-féle korrelációs együttható : E (ξ − Eξ)(η − Eη) = E(ξ ∗ η ∗ ) (2.9) R(ξ, η) = DξDη Jól ismert, hogy a korrelációs együttható lineáris esetekben használható jól, mégis szokás bármilyen összefüggésben használni. A fenti elvárásoknak való megfelelés vizsgálatakor látható, hogy mint köztudott, a korreláció a [-1, 1] intervallumban veszi fel értékeit, tehát a C) pontnak csak az abszolútértéke felel meg, ı́gy eleve csak azt érdemes megnéznünk. Az abszolútérték nyilvánvalóan teljesı́ti a B), C) és G) követelményeket, de a többi pontot nem Nyilván nem definiáljuk minden
A)-beli esetben, hiszen csak pozitı́v és véges szórású valószı́nűségi változók esetében értelmeztük. Látható, hogy nem csak függetlenség esetében lesz 0, hiszen például ha ξ standard normális eloszlású, η = ξ 2 , akkor R(ξ, η) = 0, hiszen a standard normális eloszlás esetén a harmadik momentum 0. Ez jó példa arra is, hogy bár egyértelmű függvénykapcsolat van a két valószı́nűségi változó között, a korreláció mégsem lesz 1. Szintén jól ismert, hogy |R(ξ, η)| = 1 akkor és csak akkor, ha lineáris kapcsolat áll fenn. 2.22 A korrelációs hányados Tegyük fel, hogy η szórása véges és pozitı́v, ekkor az η valószı́nűségi változó ξ-re vett korrelációs hányadosa vagy korrelációs aránya D(E(η|ξ)) Θξ (η) = (2.10) Dη E mennyiség bevezetése speciális alakban szintén Pearson nevéhez fűződik, általánosan pedig Kolmogorov
nevéhez köthető. Értékeit a [0,1] intervallumból veszi fel, de nem szimmetrikus, valamint a Θξ (η) = 0 egyenlőségből nem következik ξ és η függetlensége (lásd [14]). Természetesen ebből a menynyiségből származtatható szimmetrikus mérőszám, Θ(ξ, η) = max(Θξ (η), Θη (ξ)), 10 (2.11) http://www.doksihu Maximálkorreláció Fegyverneki Tamás amely viszont továbbra sem teljesı́ti kimerı́tően Rényi feltételeit (lásd [13]). Belátható, hogy Θξ (η) és Θ(ξ, η) teljesı́ti a G) jelű követelményt, valamint Θξ (η) = sup(f ) R(f (ξ), η), ahol f = f (x) végigfut az összes Borel-mérhető függvényen, amelynek szórásnégyzete véges és pozitı́v. Belátható továbbá (lásd [12]), hogy minden esetben ∃f0 (x) : 0 < D2 (f0 ) < ∞; Θξ (η) = R(f0 (ξ), η). (2.12) Felhasználva a korábban tárgyalt megfeleltetést a feltételes várható érték és
az ortogonális projekció között, adódik, hogy Θξ (η) = kAξ η ∗ k, (2.13) Θ2ξ (η) = hAξ η ∗ , Aξ η ∗ i = hη ∗ , Aξ η ∗ i. (2.14) innen pedig A két egyenletet elosztva egymással Θξ (η) = hη ∗ , Aξ η ∗ i = R(η, Aξ η). kAξ η ∗ k (2.15) Amennyiben η ∈ L2 és f ∈ L2ξ teljesülnek, (2.6) egyenlőség miatt kAξ η ∗ − hf ∗ , η ∗ if ∗ k2 = kAξ η ∗ k2 − hf ∗ , η ∗ i2 , (2.16) Θ2ξ (η) = hf ∗ , η ∗ i2 + kAξ η ∗ − hf ∗ , η ∗ if ∗ k2 . (2.17) ı́gy A korrelációs hányados ilyen megközelı́tésű vizsgálatának jelentős szerepe van a kétváltozós sztochasztikus kapcsolatok funkcionálanalı́zisbeli eszközökkel való vizsgálatában. 2.23 A kontingencia A kontingenciát diszkrét valószı́nűségi változókra a korábbiakhoz hasonlóan Pearson vezette be, általánosan Rényi[13]. Ha a ξ és η közötti összefüggőség 11
http://www.doksihu Maximálkorreláció Fegyverneki Tamás reguláris, akkor a Radon-Nikodym-tétel értelmében létezik egy Borel-mérhető k(x, y) = dQξ,η dQξ×η , hogy minden A és B Borel-halmazára a számegyenesnek Z Z P (ξ ∈ A, η ∈ B) = Qξ,η (A × B) = k(x, y)dF (x)dG(y) x∈A (2.18) y∈B ahol F (x) és G(y) rendre ξ és η eloszlásfüggvényei, Qξ,η az együttes eloszlás. Ekkor legyen a két valószı́nűségi változó kontingenciája Z ∞ Z ∞ C(ξ, η) = −∞ 12 2 k(x, y) − 1 dF (x)dG(y) (2.19) −∞ A kontingencia szintén az összefüggés egy mérőszámának tekinthető, a B), D) és F) jelű tulajdonságokat teljesı́ti is. Értékkészlete a [0,+∞] tartomány, de ez egyszerűen transzformálható [0,1]-re, például ha C helyett a √ C(ξ,η) mennyiséget tekintjük, ez teljesı́ti C) és G) pontokat is, de A) és 2 1+C (ξ,η) E) továbbra sem teljesül.
Szintén a korábban tárgyalt vetı́tési operátorok segı́tségével definiálható a kontingencia a következő módon is : Legyen fn és gn teljes ortonormált rendszer L2ξ,0 -ban és L2η,0 -ban! Ekkor definiálhatjuk a következő normákat: k|Aη k|2 = XX i k|Aξ k|2 = (2.20) hfi , Aξ gk i2 , (2.21) k XX i hAη fi , gk i2 k ahol az Aξ és Aη operátorok értelmezési tartományai rendre az L2η és L2ξ terek. Ekkor a kontingencia : C(ξ, η) = k|Aξ k| = k|Aη k| (2.22) Belátható, hogy ez a definı́ció megegyezik a korábbival (lásd [4]). A korrelációs hányados esetéhez hasonlóan ez a tárgyalásmód szintén lényeges szerepet kap az összefüggőség operátor-sajátértékekre vonatkozó problémaként 12 http://www.doksihu Maximálkorreláció Fegyverneki Tamás való tárgyalásakor. A kontingencia, a korrelációs hányados és a korreláció között fennáll a
következő egyenlőtlenség (lásd [14]): 0 ≤ |R(ξ, η)| ≤ min Θξ (η), Θη (ξ) ≤ max Θξ (η), Θη (ξ) ≤ C(ξ, η) (2.23) Itt érdemes megjegyezni, hogy információelméleti meggondolások alapján 1 Linfoot definiált egy összefüggőségi mérőszámot, az L(ξ, η) = (1 − e−2I(ξ,η) ) 2 mennyiséget, ahol I(ξ, η) a valószı́nűségi változók egymásra vonatkozó információtartalmát jelöli. Ha a ξ és η közötti kapcsolat reguláris, akkor R∞ R∞ I(ξ, η) = −∞ −∞ k(x, y) log k(x, y)dF (x)dG(y) összefüggés igaz. Ez a mérőszám Rényi összes követelményét teljesı́ti 2.3 Néhány tulajdonság az operátorokról Ebben a szakaszban áttekintünk néhány eredményt, amelyek a későbbiekben hasznos eszközöket szolgáltatnak az összefüggőség és kiszámı́thatóság problémájának operátor-sajátértékekre való visszavezetésekor.
Legyen ξ és η együttes eloszlásfüggvénye F (x, y), amely meghatározza a P valószı́nűséget a sı́kon! Hasonló módon a peremeloszlásokhoz tartozó eloszlásfüggvények legyenek F1 (x) és F2 (y), amelyek rendre a P1 és P2 valószı́nűségi mértékeket határozzák meg a valós számegyenesen. A korábban tárgyalt értelemben L2ξ és L2F1 izomorfak, hasonlóan L2η és L2F2 is A korábban definiált Aη operátornak megfeleltethető egy A1 operátor, amely L2F1 -ből L2F2 -be képez, mégpedig ha f (x) ∈ L2F1 és f = f (ξ) ∈ L2ξ , akkor a g = Aη f valószı́nűségi változóhoz egyértelműen létezik g(y) ∈ L2F2 , amelyre g = g(η). Ekkor A1 az az operátor, ami f (x)-et g(y)-ba viszi Teljesen hasonló módon Aξ -hez is létezik A2 , ami L2F2 elemeit transzformálja L2F1 -beliekké. A konstrukcióból látható, hogy analóg módon adódnak Aξ és 13 http://www.doksihu
Maximálkorreláció Fegyverneki Tamás Aη tulajdonságai A2 -re és A1 -re is. A kétváltozós függőség problémakörének néhány eszközéhez szükséges annak vizsgálata, hogy mikor lesz az imént definiált két operátor integráloperátor. Csáki és Fischer[4] a következőt látták be : 1.Állı́tás A fentiekben definiált A1 és A2 operátorok akkor és csak akkor integráloperátorok, ha P P1 ×P2 . Ebben az esetben létezik k(x, y) függvény, amelyre ZZ k(x, y)dP1 dP2 , P (B) = (2.24) B ahol B a sı́k egy tetszőleges mérhető halmaza; ezen kı́vül Z ∞ k(x, y)f (x)dF1 (x) A1 f (x) = (2.25) −∞ és Z ∞ A2 g(y) = k(x, y)g(y)dF2 (x) (2.26) −∞ teljesül. Az 1.Állı́tás [4]-ben tárgyalt bizonyı́tása azt is megmutatja, hogy a tárgyalt operátorok közül vagy mindkettő integráloperátor vagy egyik sem Az állı́tás-nak továbbá lényeges szerepe van
annak bizonyı́tásakor is, hogy a kontingencia két tárgyalt definı́ciója ekvivalens: Legyenek {f0 (x), f1 (x), .} és {g0 (y), g1 (y), } teljes ortonormált rendszerek rendre L2F1 -ben és L2F2 -ben úgy, hogy f0 (x) ≡ g0 (y) ≡ 1 teljesül! Ekkor {f1 (x), f2 (x), .} és {g1 (y), g2 (y), } teljes ortonormált rendszerek L2F1 ,0 -ban és L2F2 ,0 -ban. Ekkor C2 (ξ, η) = |kAη |k2 = XX hA1 fi (x), gk (y)i2 = i≥1 k≥1 XX hA1 fi (x), gk (y)i2 − 1 i≥0 k≥0 (2.27) teljesül, és i ≥ 1 esetben hA1 fi (x), g0 (y)i = hfi (x), A2 g0 (y)i = hfi (x), f0 (y)i = 0, 14 (2.28) http://www.doksihu Maximálkorreláció Fegyverneki Tamás hasonlóan k ≥ 1 esetben hA1 f0 (x), gk (y)i = 0, (2.29) hA1 f0 (x), g0 (y)i = 1. (2.30) továbbá Ha P P1 × P2 , az 1. Állı́tás szerint Z ∞ XX 2 |kA1 |k = k 2 (x, y)f (x)dF1 (x) = hA1 fi (x), gk (y)i2 −∞ (2.31) i≥0 k≥0 teljesül, ekkor viszont (2.27)-ből és (231)-ből azonnal
adódik, hogy C2 (ξ, η) = |kAη |k2 = |kA1 |k2 − 1, (2.32) és ez pontosan ugyanazt adja, mint (2.19) Amennyiben |kA1 |k < ∞ teljesül, akkor A1 egy folytonos integráloperátor, ı́gy az 1.Állı́tás szerint P < P1 × P2 teljesül, ha nem véges, akkor pedig C(ξ, η) = ∞, ami szintén a másik definı́ciót adja vissza. Legyen P a már definiált valószı́nűség a sı́kon, amelyet az együttes eloszlás határoz meg, ekkor legyen a valós számegyenes egy rögzı́tett mérhető A halmazára PA (B) = P (A × B), ahol B egy tetszőleges mérhető halmaz. Hasonlóan definiáljuk rögzı́tett B melletti tetszőleges A mérhető halmazokra P B (A) = P (A × B)-t! Mivel PA (B) ≤ P2 (B); P B (A) ≤ P1 (A), (2.33) következik, hogy PA P2 és P B P1 . A Radon-Nikodym–tétel értelmében az ismert módon létezik P1 (A|y) és P2 (B|x), hogy ( R PA (B) = B P1 (A|y)dP2 R P B (A) = A P2 (B|x)dP1 . (2.34) Legyen
χA (x) az A mérhető halmaz indikátora, ekkor Z Z ∞ A1 χA (x)dP2 = χB (y)A1 χA (x)dF2 (y) = hA1 χA (x), χB (y)i = PA (B), B −∞ (2.35) 15 http://www.doksihu Maximálkorreláció Fegyverneki Tamás tehát A1 χA (x) = P1 (A|y) (2.36) P2 -majdnem minden y-ra. Hasonlóan P1 -majdnem minden x-re A2 χB (y) = P2 (B|x). Az abszolút folytonosság miatt, ha P1 (A) = 0, akkor Z PA (B) = P1 (A|y)dP2 = 0, (2.37) (2.38) B amiből P1 (A|y) = 0 következik P2 -majdnem mindenütt, viszont ebből nem követezik, hogy P1 (.|y) P1 (), erre Csáki és Fischer[4] következő állı́tása ad egy feltételt: 2.Állı́tás P1 (.|y) P1 () P2 -majdnem minden y-ra, P2 (|x) P2 () P1 - majdnem minden x-re és P P1 × P2 közül vagy mindegyik teljesül, vagy egyik sem. Következésképp az 1.Állı́tás és a 2Állı́tás miatt adódik, hogy az alábbi három tulajdonság egyenértékű: 1. P1 (|y) P1 () P2 -majdnem minden
y-ra, 2. P P1 × P2 , 3. A1 integráloperátor Természetesen teljesen hasonló és ekvivalens állı́tás vonatkozik a P2 valószı́nűségi mértékre és A2 operátorra is. A fentiekben tárgyalt eszközökkel a továbbiakban már részletes áttekintést tudunk adni az összefüggőség egy olyan mérőszámáról, amely pótolja a gyakorlatban használatos ismertetett mérőszámok hiányosságait, és megfelel a bevezetett követelményeknek. 16 http://www.doksihu 3. fejezet A maximálkorreláció 3.1 3.11 Definı́ció és tulajdonságok Definı́ció és Rényi követelményei Korábban láttuk a korrelációs hányados esetében, hogy Θξ (η) = sup R(f (ξ), η) (3.1) (f ) teljesül, ı́gy természetszerűleg adódik ennek további javı́tására a következő mennyiség : S(ξ, η) = sup R(f (ξ), g(η)), (3.2) f,g ahol f (x) és g(x) végigfut minden olyan Borel-mérhető
függvényen, amelyek szórásnégyzete pozitı́v és véges, azaz S(ξ, η) = sup R(f (ξ), g(η)) (3.3) f ∈L2ξ ,g∈L2η Ez a mennyiség a ξ és η valószı́nűségi változók maximálkorrelációja. Ezt a mérőszámot H. Gebelein[8] vezette be olyan esetekben, ahol ξ és η eloszlása egyaránt diszkrét vagy egyaránt abszolút folytonos, általánosabb tárgyalása Rényi[13] és Sarmanov[15][16] nevéhez köthető. Először belátjuk, hogy a maximálkorreláció rendelkezik a Rényi által 17 http://www.doksihu Maximálkorreláció Fegyverneki Tamás előı́rt optimalitási tulajdonságokkal. Az A) tulajdonság nyilvánvaló, hiszen tetszőleges valószı́nűségi változókra értelmes a definı́ció, ugyancsak adódik a szimmetria és a [0,1]-beli értékek felvétele is (B) és C)). A D) tulajdonsághoz, nevezetesen hogy S(ξ, η) = 0 akkor és csak akkor, ha ξ és η függetlenek,
tekintsük a következőket: Ha a két valószı́nűségi változó független, a maximálkorreláció nulla a definı́ció alapján. Megfordı́tva feltesszük, hogy S(ξ, η) = 0, ekkor R(f (ξ), g(η)) = 0 (3.4) minden értelmes f -re és g-re. Speciálisan válasszuk a következő függvényeket: ( fA (x) = ( 1, X ∈ A gB (x) = 0, egyébként 1, X ∈ B 0, egyébként, (3.5) ahol A és B tetszőleges rögzı́tett részhalmazai a valós számegyenesnek, és természetesen 0 < P (ξ ∈ A) < 1 és 0 < P (η ∈ B) < 1. Ekkor R(fA (ξ), gB (η)) = p P (ξ ∈ A, η ∈ B) − P (ξ ∈ A)P (η ∈ B) , P (ξ ∈ A)(1 − P (ξ ∈ A))P (η ∈ B)(1 − P (η ∈ B)) (3.6) ebből pedig következik, hogy a maximálkorreláció nulla értéke mellett a számláló zérus, azaz tetszőleges A és B esetén P (ξ ∈ A, η ∈ B) = P (ξ ∈ A)P (η ∈ B), (3.7) ez pedig pontosan ξ és η
függetlenségét jelenti. Az E) tulajdonság teljesülését vizsgáljuk általánosabban! Tegyük fel, hogy ξ és η között függvénykapcsolat áll fenn f0 (ξ) = g0 (η) értelemben, ahol f és g Borel-mérhetőek. Ekkor legyen f1 (ξ) = f0 (ξ) g0 (η) = = g1 (η)! 1 + |f0 (ξ)| 1 + |g0 (η)| (3.8) Mivel f1 (ξ) és g1 (η) korlátosak, szórásnégyzeteik léteznek és pozitı́vak, R(f1 (ξ), g1 (η)) = 1, 18 (3.9) http://www.doksihu Maximálkorreláció Fegyverneki Tamás ennek speciális eseteként pedig az E) tulajdonság is teljesül. Ugyanakkor ez jól mutatja, hogy ha az eredeti feltételekben Rényi a túlzottan megszorı́tónak ı́télt ”akkor és csak akkor” kapcsolatot követeli meg, azt a maximálkorreláció nem teljesı́tené. Az F) tulajdonság teljesülése triviális a definı́cióból, hiszen ha u és v kölcsönösen egyértelmű R R Borel-mérhető leképezések, akkor
S(u(ξ), v(η)) = R(f (u(ξ)), g(v(η))) = sup f ∈L2ξ ,g∈L2η = sup R(f (ξ), g(η)) = S(ξ, η) (3.10) f ∈L2ξ ,g∈L2η teljesül Az utolsó követelményt a maximálkorreláció szintén teljesı́ti, azaz ha a két valószı́nűségi változó együttes eloszlása normális, akkor a maximálkorreláció értéke megegyezik a klasszikus Pearson-féle korreláció abszolútértékével. A tulajdonság bizonyı́tását már Lancaster[9] is közölte 1957-ben, Dembo, Kagan és Shepp[7] pedig példát közöltek olyan speciális esetre is, amikor az együttes eloszlás nem normális, de a maximálkorreláció szintén azonos a korreláció abszolútértékével. Ezt a példát a speciális esetek között tárgyaljuk A Rényi-féle G) tulajdonság meglétének egy új bizonyı́tását közölte Yu[18] 2008-ban, a későbbiekben ezt a bizonyı́tást a további tulajdonságok között
tárgyalt két állı́tás ismeretében át is tekintjük. 3.12 További tulajdonságok Az előző fejezetben láttuk, hogy az összefüggőségi mérőszámokra vonatkozó Rényi-féle követelményeket a Gebelein által definiált maximálkorreláció hiánytalanul teljesı́ti. Ezeken az előnyös tulajdonságokon kı́vül áttekintünk néhány további összefüggést, amelyek hasznosak lehetnek a maximálkorreláció kiszámı́thatóságával és közelı́thetőségével kapcsolatban. 19 http://www.doksihu Maximálkorreláció Fegyverneki Tamás Tekintsük a korábban tárgyalt Aξ és Aη operátorokat, leszűkı́tve értelmezési tartományukat rendre az L2η,0 és L2ξ,0 terekre! Ekkor a következő állı́tás igaz (lásd [4]): 3.Állı́tás S(ξ, η) = kAη k = kAξ k (3.11) Bizonyı́tás. kAη f k = sup f ∈L2ξ,0 ,kf k=1 sup f ∈L2ξ,0 ,kf k=1 Aη f ,f kAη f k ≤
S(ξ, η) (3.12) teljesül, továbbá ha f ∈ L2ξ,0 , kf k = 1, g ∈ L2η,0 , kgk = 1, akkor a (2.17) egyenlőség szerint |hf, gi| ≤ Aη f ,f , kAη f k tehát S(ξ, η) ≤ sup f ∈L2ξ,0 ,kf k=1 Aη f ,f , kAη f k (3.13) (3.14) ı́gy az egyenlőség teljesül, S(ξ, η) = kAη f k = kAη k. sup (3.15) f ∈L2ξ,0 ,kf k=1 Teljesen hasonlóan Aξ esetén is igaz. Az előző állı́táshoz hasonlót bizonyı́t Rényi[13] is: 4.Állı́tás Az L2ξ,0 térben értelmezett Aξ Aη operátor önadjungált, pozitı́v szemidefinit és S2 (ξ, η) = sup hAξ Aη f, f i = kAξ Aη k. (3.16) f ∈L2ξ,0 ,kf k=1 Az állı́tás bizonyı́tását a maximálkorreláció kiszámı́tásásra vonatkozó elégséges feltételek tárgyalásánál tekintjük át. Az ismertetett mérőszámok vizsgálatakor emlı́tett (2.23) egyenlőtlenséget kiegészı́thetjük a maximálkorrelációval: 20
http://www.doksihu Maximálkorreláció Fegyverneki Tamás 5.Állı́tás 0 ≤ |R(ξ, η)| ≤ min Θξ (η), Θη (ξ) ≤ Θ(ξ, η) ≤ S(ξ, η) ≤ C(ξ, η), (3.17) ahol Θ(ξ, η) = max Θξ (η), Θη (ξ) . Bizonyı́tás. Az egyenlőtlenségekből valójában az utolsót nem láttuk még Az általánosság megszorı́tása nélkül feltehetjük, hogy E(f (ξ)) = E(g(η)) = 0 és D(f (ξ)) = D(g(η)) = 1 teljesül, különben vehetjük a standardizáltakat. A korrelációs együttható definı́ciójából és a feltételekből ekkor Z ∞Z ∞ R(f (ξ), g(η)) = f (x)g(y)[k(x, y) − 1]dF (x)dG(y), −∞ (3.18) −∞ a Cauchy-Schwarz-Bunyakovszkij egyenlőtlenség szerint pedig ekkor R(f (ξ), g(η)) ≤ C(ξ, η), (3.19) és ez minden f és g esetén fennáll, tehát S(ξ, η) ≤ C(ξ, η) (3.20) A következő két állı́tás felhasználásával adott Yu[18] rövid bizonyı́tást arra, hogy a
maximálkorreláció teljesı́ti Rényi követelményei közül az utolsót: 6.Állı́tás Ha a nem 1 valószı́nűséggel konstans ξ és η valószı́nűségi változók feltételesen függetlenek adott ζ feltétel mellett, akkor S(ξ, η) ≤ S(ξ, ζ)S(ζ, η), (3.21) és egyenlőség áll fenn, ha (ξ, ζ) és (η, ζ) azonos eloszlásúak. 7.Állı́tás Ha a nem 1 valószı́nűséggel konstans ξ és η valószı́nűségi változók függetlenek és azonos eloszlásúak, és ζ = f (ξ, η), ahol f (x, y) szimmetrikus függvénye x-nek és y-nak, akkor 1 S(ζ, ξ) ≤ 2− 2 21 (3.22) http://www.doksihu Maximálkorreláció Fegyverneki Tamás Az előző két állı́tás segı́tségével most belátjuk az utolsó Rényi-tulajdonság meglétét: Jelölje S(ρ) a maximálkorrelációját egy ρ korrelációjú valószı́nűségiváltozópárnak, amelyek együttes eloszlása
normális! Legyenek ξ, α, β független standard normális eloszlású valószı́nűségi változók és −1 < ρ1 < 1 valamint −1 < ρ2 < 1 mellett ζ = ρ1 ξ + q 1 − ρ21 α, η = ρ2 ζ + q 1 − ρ22 β! (3.23) Ekkor ζ és η is standard normális eloszlású valószı́nűségi változók, és a (ξ, η, ζ) véletlen vektor kovarianciamátrixa 1 ρ1 ρ2 ρ1 ρ1 ρ2 1 ρ2 ρ1 ρ2 1 . (3.24) Ebből ξ és η feltételes kovarianciamátrixa a ζ feltétel mellett ! ! ! 0 ρ1 1 − ρ21 1 ρ1 ρ2 , − ρ1 , ρ2 = 0 1 − ρ22 ρ2 ρ1 ρ2 1 (3.25) tehát ξ és η feltételesen függetlenek, mivel a feltételes eloszlás is normális. Ekkor alkalmazható a 6.Állı́tás, ı́gy S(ρ1 ρ2 ) = S(ξ, η) ≤ S(ξ, ζ)S(η, ζ) = S(ρ1 )S(ρ2 ), (3.26) és ρ = ρ1 = ρ2 esetben, azaz ha (ξ, η) és (ξ, ζ) azonos eloszlásúak, akkor S(ρ2 ) = S2 (ρ). Az előző
egyenlőtlenségből következik ρ1 = ρ0 és ρ2 = ρ ρ0 mellett az is, hogy ha |ρ| ≤ |ρ0 |, akkor S(ρ) ≤ S(ρ0 ), azaz a maximálkorreláció monoton függvénye |ρ|-nak. 1 Legyenek µ és ν független standard normálisak, ekkor R(µ + ν, µ) = 2− 2 , és a 7.Állı́tás szerint 1 1 S(2− 2 ) = S(µ, µ + ν) ≤ 2− 2 1 (3.27) 1 Mivel R ≤ S, következik, hogy S(2− 2 ) = 2− 2 . Erre alkalmazva (326)-ot (m − 1) alkalommal, kapjuk a következőt: m m 1 2− 2 ≤ S(2− 2 ) ≤ S(2− 2 ) 22 m m = 2− 2 , (3.28) http://www.doksihu Maximálkorreláció Fegyverneki Tamás tehát itt végig egyenlőség teljesül. S(ρ2 ) = S2 (ρ) egyenletbe behelyettesı́tve m ρ = 2− 2n -t és iterálva visszavezetve m -t m2 -re: 2n m m R(2− 2n ) = 2− 2n . (3.29) Mivel minden ρ ∈ (0, 1) szám tetszőleges pontossággal közelı́thető q = m 2n esetén 2−q alakban, legyen 2−pk ≤ ρ ≤ 2−qk , k =
1, 2, ., (3.30) és kihasználva a maximálkorreláció monotonitását, 2−pk ≤ S(ρ) ≤ 2−qk , k = 1, 2, ., (3.31) és k ∞ mellett S(ρ) = ρ. Amennyiben ρ < 0, a szimmetria miatt S(ρ) = −ρ adódik. Látható, hogy a maximálkorreláció rendelkezik mindazon tulajdonságokkal, amelyek elvben jobb mérőszámmá teszik a klasszikus korrelációnál és az emlı́tett további mérőszámoknál is. A gyakorlatban viszont fontos kérdés a mérőszám kiszámı́thatósága, és ellentétben például a valamiképp hasonlóan definiált korrelációs hányados esetével, a maximálkorrelációnál nem tudunk (2.12)-höz hasonló állı́tást kimondani, azaz nem minden esetben létezik f0 (x) és g0 (x) függvény, hogy S(ξ, η) = R(f0 (ξ), g0 (η)). (3.32) A követező példa egy olyan esetet mutat be, amikor nem léteznek ilyen optimális függvények: Legyen u konvex, kellően sima
függvény, amelyre u(0) = 0, u0 (0) = 1! Legyen a = u00 (0) > 0! A G tartomány legyen G = {(x, y) ∈ [0, 1]2 : v(x) ≤ y ≤ u(x)}, ahol v = u−1 ! 23 (3.33) http://www.doksihu Maximálkorreláció Fegyverneki Tamás Ezen kı́vül legyen ( f (x) = g(x) = 1, 0 ≤ x ≤ ε (3.34) 0, x > ε! Ekkor belátjuk, hogy R(f (X), g(Y )) 1, ha ε 1. Legyen A = {X ≤ ε} és B = {Y ≤ ε}, ekkor P (A ∩ B) − P (A)P (B) R(f (X), g(Y )) = p P (A)(1 − P (A))P (B)(1 − P (B)) = = P (A) − P (A B) − P (A)2 P (A B) P (A ∩ B) − P (A)2 = =1− . P (A)(1 − P (A)) P (A)(1 − P (A)) P (A)(1 − P (A)) (3.35) Ekkor elegendő belátnunk, hogy P (AB) P (A) 0, mivel ε 0 esetén P (A 0). Ekkor tekintsük a következőket: P (A) arányos az AOE görbevonalú háromszög területével, P (AB) pedig arányos az ADB görbevonalú háromszög területével, a lenti ábra alapján. Az AD egyenes C pontban metszi az OB átlót.
Ekkor a valószı́nűségek hányadosát felülről tudjuk becsülni valódi háromszögek területeivel: P (A B) TADB BD ε − v(ε) ≤ = = , P (A) TACB EC ε−z valamint ez a párhuzamos szelők tételéből következően pontosan (3.36) AB AE = u(ε)−ε . u(ε)−z Tehát az előzőek alapján ε − v(ε) u(ε) − ε = , ε−z u(ε) − z 24 (3.37) http://www.doksihu Maximálkorreláció Fegyverneki Tamás átalakı́tva kapjuk, hogy z= és ε−z = u(ε)v(ε) − ε2 , u(ε) + v(ε) − 2ε (3.38) (u(ε) − ε)(ε − v(ε)) . u(ε) + v(ε) − 2ε (3.39) Ekkor tehát a felső becslésünk P (A B) u(ε) + v(ε) − 2ε ≤ . P (A) ε − v(ε) (3.40) Az u függvény Taylor-sorfejtése szerint u(ε) = ε + a2 ε2 + o(ε2 ), valamint v-re igaz, hogy v(0) = 0, v 0 (0) = 1, v 0 (t) = u0 1 , v(t) 0 −1 00 v 00 (t) = 2 u v(t) v (t) u0 v(t) és ı́gy v 00 (0) = −1 · a · 1 = −a, 1 25 (3.41) (3.42)
(3.43) http://www.doksihu Maximálkorreláció Fegyverneki Tamás teljesül, hogy a v(ε) = ε − ε2 + o(ε2 ). 2 Ezekből viszont a felső becslésre u(ε) + v(ε) − 2ε o(ε2 ) = a 2 0, ε − v(ε) ε + o(ε2 ) 2 (3.44) (3.45) ha ε 0, tehát ekkor R(f (X), g(Y )) = 1 − P (A B) 1, P (A)(1 − P (A)) (3.46) tehát a maximálkorreláció értéke 1. Ekkor viszont nem létezik olyan f0 és g0 , amelyekre (3.32) fennállna, mivel ebben az esetben f0 (X) = g0 (Y ) teljesülne, ebből pedig az adódna, hogy ZZ |f0 (x) − g0 (y)|dxdy = 0, (3.47) G és ı́gy f0 (x) ≡ g0 (x) ≡ c, ahol c konstans, ilyen esetben viszont nemdefiniált az R(f0 (X), g0 (Y )) mennyiség. Elégséges feltételeket a maximálkorreláció kiszámı́thatóságára a következő fejezetben tárgyalunk, Rényi[13], valamint Csáki és Fischer[4] munkái alapján, valamint bemutatunk speciális eseteket, amikor konkrét eredmény is adható. 3.2
3.21 A maximálkorreláció kiszámı́tása Elégséges feltétel és operátorok A szakasz cı́me valójában kissé félrevezető. Mint korábban emlı́tettük, a maximálkorreláció esetén nem tudunk mindig olyan optimális függvényeket mondani, mint hasonló esetben a korrelációs hányadosnál. A továbbiakban tárgyaltak olyan értelemben nem elégséges feltételei a kiszámı́thatóságnak, hogy ha teljesülnek a tételekben állı́tottak, akkor pontosan ki tudjuk számolni 26 http://www.doksihu Maximálkorreláció Fegyverneki Tamás a maximálkorreláció értékét, csupán az optimális függvények létére jelentenek elégségességet. A szakasz második részében lényegében az eszköztárat bővı́tjük ki néhány speciális eset tárgyalásához szükséges állı́tásokkal. Amennyiben a (3.32) egyenlőség fennáll, azaz a maximálkorreláció optimális
függvényei f0 és g0 , akkor feltéve, hogy az emlı́tett függvények várható értéke 0, szórásuk pedig 1, látható, hogy E(f0 (ξ)|η) = S(ξ, η)g0 (η) (3.48) E(g0 (η)|ξ) = S(ξ, η)f0 (ξ), (3.49) és Ekkor az optimáis függvényeket lényegében az egyenletrendszer megoldásaiként keressük, feltéve, hogy léteznek. Az egyenleteket más alakban felı́rva: ( E(E(f0 (ξ)|η)|ξ) = S2 (ξ, η)f0 (ξ) (3.50) E(E(g0 (η)|ξ)|η) = S2 (ξ, η)g0 (η). Nyilván elegendő például a (3.50) egyenlőségből meghatározni az f0 függvényt, a g0 meghatározható az eredeti egyenletrendszerből f0 ismeretében Láthatjuk, hogy a korábban definiált operátorokkal felı́rva az eredeti rendszer a következő: ( Aη f0 = S(ξ, η)g0 Aξ g0 = S(ξ, η)f0 (3.51) Ekkor legyen tetszőleges f = f (ξ) ∈ L2ξ esetén Af = Aξ Aη f = E(E(f (ξ)|η)|ξ), (3.52) ı́gy a (3.50) egyenlőséget átı́rhatjuk a Af0 = S2
(ξ, η)f0 (3.53) alakba. Vizsgáljuk innentől az A operátort! Tudjuk, hogy ez egy korlátos lineáris transzformáció az L2ξ,0 térben, valamint önadjungált és pozitı́v szemidefinit. 27 http://www.doksihu Maximálkorreláció Fegyverneki Tamás Legyenek f és g egységnyi szórásúak, rendre az L2ξ,0 és L2η,0 terekből! Ekkor a teljes várható érték tétele és a Cauchy-Schwarz-Bunyakovszkij–egyenlőtlenség szerint E 2 f (ξ)g(η) = E 2 E(f (ξ)|η)g(η) ≤ E E 2 (f (ξ)|η) = hAf, f i. (3.54) Legyen λ = kAk = sup hAf, f i, (3.55) f ∈L2ξ,0 ,kf k=1 és ı́gy S2 (ξ, η) ≤ λ. (3.56) Másrészt ha f ∈ L2ξ,0 és kf k = 1, g(η) = E(f (ξ)|η) helyettesı́téssel kapjuk, hogy D2 g(η) = E f (ξ)g(η) ≤ S(ξ, η)D g(η) , (3.57) tehát D g(η) ≤ S(ξ, η) teljesül, innen pedig hAf, f i = E g(η)E(f (ξ)|η) = E f (ξ)g(η) ≤ S(ξ, η)D g(η) ≤ S2 (ξ, η), (3.58) 2 és
ebből következik, hogy λ ≤ S (ξ, η), ehhez hozzávéve a (3.56) egyenlőtlenséget, adódik, hogy S2 (ξ, η) = λ = sup hAf, f i. (3.59) f ∈L2ξ,0 ,kf k=1 Ismert, hogy ha az A korlátos önadjungált operátor teljesen folytonos, azaz kompakt, akkor λ = supkf k=1 hAf, f i az operátor legnagyobb sajátértéke, és létezik a sajátértékhez tartozó sajátfüggvény. Így a maximálkorrelációra beláttuk a következő tételt: 1.Tétel Ha a fenti módon definiált A operátor kompakt, akkor a ξ és η maximálkorrelációjára fennáll a (3.32) egyenlőség, ahol is f0 az A legnagyobb sajátértékéhez, S2 (ξ, η)-hoz tartozó sajátfüggvény és g0 = 1 E f0 (ξ)|η S(ξ, η) 28 (3.60) http://www.doksihu Maximálkorreláció Fegyverneki Tamás Az operátorra való feltétel teljesülésére Rényi[13] bizonyı́tott egy hasznos tételt: 2.Tétel Ha a ξ és η közötti
összefüggés reguláris és a kontingenciájuk véges, az A transzformáció egyenletesen folytonos, és ı́gy a maximálkorrelációhoz léteznek az 1.Tételben tárgyalt optimális transzformáló függvények A 2.Tételben szereplő feltétel természetesen nem szükséges, csak elégséges, például ha ξ = η teljesül, akkor a maximálkorreláció értéke nyilván 1, optimális függvényekre jó lesz f0 (x) ≡ g0 (x) ≡ x, ekkor viszont az összefüggés nem reguláris, ı́gy a kontingenciát nem is értelmezzük. Beláttuk tehát, hogy ha tekintjük az alábbi, már vázolt egyenletrendszert, nevezetesen ( Aη f = µg Aξ g = µf f ∈ L2ξ,0 ; g ∈ L2η,0 , (3.61) tehát µ sajátérték és f, g egy sajátfüggvénypár az Aη , Aξ operátorpárhoz, akkor a maximálkorreláció definı́ciójában a supremum akkor és csak akkor maximum, ha S(ξ, η) = |µ0 |, ahol µ0 a maximális
abszolútértékű sajátérték. Sok esetben a kiszámı́thatóságra, valamint a merőlegesvetı́tés-operátorokra vonatkozó vizsgálatokat megkönnyı́ti a kétváltozós eloszlás változókban vett szimmetriája, ugyanis szimmetria esetén Q(A × B) = Q(B × A), ı́gy tehát Q1 = Q2 , ezért az alterekre L2F1 = L2F2 , tehát A1 = A2 , tehát az operátoregyenletekre ( A1 f = µg A1 g = µf (3.62) adódik. Ekkor ha f (x) = g(x), akkor f (x) sajátfüggvénye az operátornak, ha nem, akkor a két egyenletet kivonva egymásból (f (x) − g(x)) lesz a sajátfüggvény, tehát ilyen esetekben elegendő egy operátor sajátértékeit vizsgálnunk, ahelyett, hogy két operátor spektrálfelbontását végeznénk el. Belátható, hogy minden kétváltozós eloszlás helyett bevezethető egy használható, változóiban szimmetrikus eloszlás, ugyanis ha az eredeti kétváltozós 29 http://www.doksihu
Maximálkorreláció Fegyverneki Tamás eloszlás Q, akkor legyen a változóiban szimmetrikus eloszlás Q(A × B) = hA2 A1 χA (x), χB (x)iL2F = hA1 χA (x), A1 χB (x)iL2F , 1 (3.63) 2 ahol A és B a valós számegyenes tetszőleges mérhető halmazai. Ez valószı́nűségi mérték lesz a sı́kon, Q(B×A) = Q(A×B), és a hozzá tartozó eloszlásfüggvényre F (x, y) = F (y, x), valamint a peremeloszlásokra Q1 = Q2 = Q1 , és ı́gy L2F1 = L2F2 = L2F1 . A (3.63) egyenlőség utolsó tagjára Z ∞ Q1 (A|y)Q1 (B|y)dF2 (y), hA1 χA (x), A1 χB (x)iL2F = 2 (3.64) −∞ ı́gy ésszerűnek látszik a Q eloszlás azon megközelı́tése, hogy rögzı́tjük η egy tetszőleges értékét és függetlenül választunk ξ értékei közül kettőt, ekkor Q az ilyen párok eloszlásainak keveréke, η feltétellel. Ilyen transzformációkat javasol Gebelein[8] és Sarmanov[16] is, speciális esetekben. Csáki és
Fischer[4] is belátták, hogy az A1 és A2 operátorok helyett érdemes az A2 A1 operátor viselkedését vizsgálni, ha a Q eloszlást vizsgáljuk, mivel igaz a következő összefüggés: 3.Tétel Z ∞ Z ∞ f (x)g(y)dF (x, y) = hA2 A1 f (x), g(x)i, −∞ (3.65) −∞ ahol f (x) ∈ L2F1 és g(x) ∈ L2F2 . Megjegyzés. A 3Tételből következik, hogy Z ∞Z ∞ f (x)f (y)dF (x, y) = Θ2η f (ξ) , −∞ (3.66) −∞ ahol f (x) ∈ L2F1 ,0 és kf (x)k = 1. A 3.Tétel követezményeképp látható, hogy az A = A2 A1 operátor generálja a feltételes várható értéket a következő értelemben: Z ∞ Af (x) = f (x)dF 1 (x|y). −∞ További következmény az alábbi állı́tás: 30 (3.67) http://www.doksihu Maximálkorreláció 8.Állı́tás Fegyverneki Tamás A maximálkorreláció F (x, y) eloszlásfüggvény mellett a négyzete az F (x, y) mellettinek. A korábban emlı́tett állı́tás,
mely szerint Q mindkét peremeloszlása megegyezik az egyik eredeti peremeloszlással, eléggé használhatónak és hasznosnak tűnik olyan esetekben, ha az egyik marginális diszkrét vagy differenciálható. Vizsgáljuk továbbra is a sajátfüggvényekre vonatkozó egyenletrendszerünket! Sok szempontból előnyös eset a lineáris összefüggés fennállása, ı́gy felmerül a feltételes várható értékek linearizálásának problémája. Erre a következőket mondhatjuk: 4.Tétel Az f ∈ L2ξ,0 és g ∈ L2η,0 standard valószı́nűségi változókra a következő állı́tások ekvivalensek: 1. f és g sajátfüggvénypárt alkotnak, 2. Θξ (g) = Θη (f ) = hf, gi, 3. f és g lineárisan korreláltak, és Θf (g) = Θξ (g), Θg (f ) = Θη (f ) Ennek következményeként kimondhatjuk a következőt is: 5.Tétel Ha az f = f (ξ) és g = g(η) standard valószı́nűségi változók lineárisan
korreláltak, és f (x) és g(y) injektı́v függvények, akkor f és g sajátfüggvénypárt alkot. Bizonyı́tás. Az injektivitás miatt L2f = L2ξ és L2g = L2η , tehát az előző tétel 3. pontja teljesül A maximálkorrelációhoz tartozó f és g standard sajátfüggvények távolságáról a következőket mondhatjuk: Mivel f ∈ Lξ,02 és g ∈ L2η,0 , ı́gy kf − gk2 = 2 1 − hf, gi , 31 (3.68) http://www.doksihu Maximálkorreláció Fegyverneki Tamás ekkor pedig kf − gk2 = 2 1 − inf f ∈ g∈ L2 ξ,0 , kf k L2 η,0 , kgk =1 hf, gi = 2 1 − S(ξ, η) . (369) sup f ∈ L2 ξ,0 , kf k = 1 =1 g ∈ L2 η,0 , kgk = 1 Tekintsünk egy kissé módosı́tott infimum-problémát, egészen pontosan a következőt: inf 2 kf − λgk2 = 1 − 2λhf, gi + λ2 inf 2 f ∈ Lξ,0 , kf k = 1 f ∈ Lξ,0 , kf k = 1 g ∈ L2 η,0 , kgk = 1 g ∈ L2 η,0 , kgk = 1 −∞ < λ < ∞ −∞ < λ
< ∞ 2 = 1 − S2 (ξ, η). (3.70) Nyilvánvaló, hogy a második esetben az infimum kisebb, mint az elsőben, kivéve S(ξ, η) = 1 esetet, amikor egyenlőek. Az első összefüggésből követezik az is, hogy a maximálkorreláció pontosan akkor 1, ha az L2ξ,0 és az L2η,0 terek egységgömbjeinek távolsága zérus. Ha ilyen esetben az egységgömbök diszjunktak, akkor a maximálkorrelációra nem léteznek optimális transzformáló függvények, azaz supremum nem lesz maximum. A korábban tekintett példa a függvények nemlétére pontosan ilyet ı́r le. A (3.70)-ben tekintett infimum értéke megegyezik a sajátfüggvénypár feltételes szórásnégyzetével, mivel inf2 kf − Aη f k2 = inf2 (1 − kAη f k2 ) = f ∈ Lξ,0 f ∈ Lξ,0 kf k = 1 kf k = 1 = inf2 f ∈ Lξ,0 1 − Θ2η (f ) = 1 − S2 (ξ, η). (3.71) kf k = 1 Néhány szempontból előnyös feltenni a homoszkedaszticitást, azaz
jelen esetben a feltételes szórásnégyzet állandóságát, egészen pontosan a ζ standard valószı́nűségi változóra a következő összefüggést: Aξ ζ 2 − (Aξ ζ)2 ≡ 1 − Θ2ξ (ζ). Erre a következőt állı́hatjuk: 32 (3.72) http://www.doksihu Maximálkorreláció Fegyverneki Tamás 6.Tétel A ξ és η lineárisan korrelált standard valószı́nűségi változókra a következőek egyenértékűek: 1. ξ és η homoszkedasztikusan összefüggnek 2. ξ 2 − 1 és η 2 − 1 sajátfüggvénypárt alkotnak a hξ, ηi2 sajátértékkel Ennek következményeként pedig a következőt állı́thatjuk: 7.Tétel Ha a ξ = ξ ∗ és η = η ∗ valószı́nűségi változók közötti kapcsolat lineáris és homoszkedasztikus, továbbá 0 < |hξ, ηi| < 1 teljesül, akkor ξ és η harmadik momentuma is zérus. Bizonyı́tás. Az előző tétel szerint hξ, ξ 2 − 1i = hη, η
2 − 1i = 0, (3.73) mivel különböző sajátértékekhez tartozó sajátfüggvények ortogonálisak. Ekkor pedig E(ξ 3 ) = E(ξ) = E(η 3 ) = E(η) = 0. (3.74) Érdemes megjegyezni, hogy kétváltozós normális eloszlás esetén mind a 6.Tétel, mind a 7Tétel feltételei teljesülnek Az eddig felépı́tett eszköztár elég sok eszközt ad a kezünkbe, amelyekkel a maximálkorreláció pontos értékét ki tudjuk számı́tani, esetleg meg tudunk találni optimális transzformáló függvényeket. Maga a pontos kiszámı́tás, mint láttuk, nem egyszerű feladat, de bizonyos speciális esetekben akár nagyon egyszerű is lehet, erre ad egy következő jó lehetőséget az alábbi tétel: 8.Tétel Legyenek ϕ1 , ϕ2 , és ψ1 , ψ2 , rendre lineárisan független rendszerek az L2ξ,0 és L2η,0 terekben! Ekkor az fn = n X k=1 akn ϕk ; gn = n X k=1 33 a0kn ψk ; n = 1, 2, . (3.75)
http://www.doksihu Maximálkorreláció Fegyverneki Tamás függvények a sajátfüggvényei az Aξ , Aη operátorpárnak akkor és csak akkor, ha léteznek olyan bkn és b0kn együtthatók, hogy Aη ϕ n = n X bkn ψk ; Aξ ψn = k=1 n X b0kn ϕk ; n = 1, 2, . , (3.76) k=1 és ebben az esetben a pontos sajátértékek: λn = p bnn b0nn ; n = 1, 2, . , (3.77) továbbá az akn és az a0kn együtthatókra teljesülnek a n X bik akn = k=i λn a0in ; n X b0ik akn = λn ain ; i = 1, . , n; n = 1, 2, (378) k=1 egyenlőségek. Bizonyı́tás. Lásd [5] Amennyiben {λn } a nem nulla sajátértékeket jelenti és a maximálkorreláció előáll maximumként, akkor S(ξ, η) = max n p bnn b0nn (3.79) fennáll. Ha az együttes eloszlás változóiban szimmetrikus, (376) és (378) egyenlőségei az a0kn = akn , b0kn = bkn alakra redukálódnak, ekkor értelemszerűen λn = bnn teljesül. A fentiek
következményeként állı́thatjuk a következőt is: 9.Állı́tás A 8.Tétel alkalmazható, ha a lineárisan független függvényeket a következőképp választjuk: ϕn = ξ n − E(ξ n ) ∈ L2ξ,0 ; ψn = η n − E(η n ) ∈ L2η,0 ; n = 1, 2, . (3.80) Ilyen speciális esetekben a 8.Tétel szerint a sajátfüggvények polinomok akkor és csak akkor, ha minden n esetén az n-edik feltételes momentum legfeljebb n-edfokú polinomja a feltételben szereplő változónak. 34 http://www.doksihu Maximálkorreláció Fegyverneki Tamás A 8.Tétel következményeként a sajátértékek minden további számı́tás nélkül megtalálhatóak, a sajátfüggvények együtthatói pedig lineáris egyenletrendszerből meghatározhatóak, feltéve, hogy a vizsgált terekben a lineárisan független rendszerek minden egyes függvénye olyan, hogy a tételbeli alakban felı́rható a feltételes várható
értéke. 3.22 Speciális esetek A következő szakaszban áttekintünk néhány pontosan kiszámı́tható speciális esetet az előzőekben tárgyaltak felhasználásával, bizonyos esetekben újabb szükséges tételek emlı́tésével. Példa S(ξ, η) = R(ξ, η) esetre A következő példában a maximálkorreláció és a korreláció értéke megegyezik. Ezen az egyszerű példán – azon túl, hogy ilyen esetekben pontosan meg tudjuk határozni a maximálkorreláció értékét – jól bemutatható a 8.Tétel alkalmazhatósága. Legyen az együttes sűrségfüggvény a következő: ( 1 log (1−x)y , 0≤x≤y≤1 f (x, y) = 1 log x(1−y) , 0 ≤ y ≤ x ≤ 1. (3.81) Ekkor az együttes eloszlás változóiban szimmetrikus, elegendő a probléma egyoldali tárgyalása. A marginális és feltételes sűrűségfüggvényekre most f1 (x) = 1, 0 ≤ x ≤ 1 (3.82) f1 (x|y) = f (x, y), 0 ≤ x ≤
1, 0 ≤ y ≤ 1. (3.83) és Ekkor a 8.Tétel felhasználásával ! n i X 1 η 1 + ; n = 1, 2, . Aη ξ n = n + 1 n + 1 i=1 i 35 (3.84) http://www.doksihu Maximálkorreláció Fegyverneki Tamás és λn = bnn = 1 ; n(n + 1) n = 1, 2, . (3.85) adódik. A ξ n − E(ξ n ) függvények rendszere L2ξ,0 -ban teljes lesz, ı́gy {λn } az összes sajátérték halmaza, ebből pedig 1 S(ξ, η) = λ1 = . 2 (3.86) Trinomiális eloszlás Legyen ξ = i és η = k együttes valószı́nűsége pik , a marginálisok pedig értelemszerűen pi· és p·k ! Ekkor a trinomiális eloszlás a következő: pik = N! pi1 pk2 (1 − p1 − p2 )N −i−k , i!k!(N − i − k)! (3.87) ahol p1 > 0, p2 > 0, p1 + p2 < 1; i = 0, 1, . , N ; k = 0, 1, , N ; i + k ≤ N Ekkor a marginálisok: N i pi· = p1 (1 − p1 )N −i ; i i = 0, 1, . , N (3.88) és N k p·k = p (1 − p2 )N −k ; k = 0, 1, . , N, (3.89) k 2 a
feltételes eloszlások pedig pik N − k p1 i 1 − p1 − p2 N −k−i = ; i = 0, 1, . , N − k (390) p·k i 1 − p2 1 − p2 és pik = pi· N − i p2 k 1 − p1 − p2 N −i−k ; k 1 − p1 1 − p1 k = 0, 1, . , N − i (391) Ekkor alkalmazzuk a 8.Tételt: n p j X 1 n Aη ξ = ajn (N −η)(N −η−1) . (N −η−j +1); n = 1, , N, 1 − p2 j=1 (3.92) p j 2 Aξ η n = (N −ξ)(N −ξ −1) . (N −ξ −j +1); n = 1, , N, ajn 1 − p 1 j=1 n X (3.93) 36 http://www.doksihu Maximálkorreláció Fegyverneki Tamás ahol ann = 1, ı́gy a sajátértékek n2 p1 p2 ; λn = (1 − p1 )(1 − p2 ) n = 1, . , N, (3.94) és a maximálkorreláció r S(ξ, η) = p1 p 2 . (1 − p1 )(1 − p2 ) (3.95) Trihipergeometrikus eloszlás Az előző esethez hasonló jelölésekkel a trihipergeometrikus eloszlás: N1 N2 N −N1 −N2 i pik = k N n n−i−k , (3.96) ahol n, N1 , N2 és N
pozitı́v egészek, N1 + N2 < N ; i = 0, 1, . , n, k = 0, 1, , n; i + k ≤ n A trinomiális esethez teljesen hasonlóan eljárva a következő sajátértékeket kapjuk: " λm = N −N1 −m N −N2 −m N2 −m N1 −m N −N1 N −N2 N2 N1 # 12 , (3.97) és a maximumra most s S(ξ, η) = λ1 = Észrevehető, hogy p1 = N1 , N p2 = N2 N N1 N2 . (N − N1 )(N − N2 ) (3.98) esetben a trinomiális eset ugyanezt adja eredményül. Példa S(ξ, η) = C(ξ, η) esetre Legyen most a szimmetrikus sűrűségfüggvény f (x, y) = p1 a(x)a(y) + p2 a(x)b(y) + b(x)a(y) + p3 b(x)b(y), 37 (3.99) http://www.doksihu Maximálkorreláció Fegyverneki Tamás ahol a(x) és b(x) lineárisan függetlenek. Az egyszerűség kedvéért feltehetjük, hogy a(x) és b(x) is sűrűségfüggvény, p1 ≥ 0, p2 ≥ 0, p3 ≥ 0, p1 +2p2 +p3 = 1. Ekkor a peremeloszlásokra f1 (x) = pa(x) + qb(x); p = p1 + p2 ; q = p2 + p3 . (3.100)
Az f (x, y) sűrűségfüggvény ekkor olyan, hogy legfeljebb egy nem nulla sajátérték lehetséges, tehát S(ξ, η) = C(ξ, η). (3.101) A korábban definiáltak miatt C2 (ξ, η) a következő kifejezés integrálásából fejezhető ki: a(x) − b(x) a(y) − b(y) f (x, y) − f1 (x)f1 (y) p = (p1 p3 −p22 ) p ·p . (3102) f1 (x)f1 (y) pa(x) + qb(x) pa(y) + qb(y) Innen 2 a(x) − b(x) dx = C(ξ, η) = |p1 p3 − p22 | −∞ pa(x) + qb(x) ! Z ∞ |p1 p3 − p22 | a(x)b(x) = 1− dx . pq −∞ pa(x) + qb(x) ∞ Z (3.103) Ekkor tehát |p1 p3 − p22 | S(ξ, η) = 1− pq ahol F (x, y) = 2 1 + y1 x ! a(x) b(x) F , dx , 2q 2p −∞ ∞ Z , a kapcsolódó sajátfüggvény pedig p2 = 0 esetben ∞ Z S(ξ, η) = 1 − F −∞ és p1 = p3 = 0, p2 = 1 2 a(x)b(x) . pa(x)+qb(x) a(x) b(x) , dx, 2p3 2p1 (3.104) Speciálisan (3.105) esetben Z ∞ F a(x), b(x) dx. S(ξ, η) = 1 − −∞ A következőkben áttekintünk
három példát a tárgyalt esetre: 38 (3.106) http://www.doksihu Maximálkorreláció Fegyverneki Tamás a) Legyen a szimmetrikus sűrűségfüggvény most f (x, y) = √ y2 1 √ − x2 2 2 2 2 ( 2e 2 − ex )e−y + ( 2e− 2 − ey )e−x ! 2π (3.107) (lásd [14]) Ekkor a peremeloszlások standard normálisak, korrelálatlanok, de nem függetlenek. A fentebb tárgyaltakat nézve p1 = p3 = 0, p2 = 1 2 x2 1 √ 1 2 2 a(x) = √ ( 2e− 2 − ex ), b(x) = √ e−x , π π és (3.108) és innen r Z ∞ √ 3x2 2 2 ( 2e−x − e− 2 )dx = √ − 1 ≈ 0, 1547. (3109) S(ξ, η) = 1 − π −∞ 3 b) A következő speciális esetben legyen f (x, y) = 4p1 xy + 2p2 (x + y) + p3 ; 0 ≤ x ≤ 1; 0 ≤ y ≤ 1, (3.110) ahol a(x) = 2x és b(x) = 1 minden [0, 1]-beli x-re. Ekkor szintén a korábbiak szerint a maximálkorreláció S(ξ, η) = |p1 p3 − p22 | (arthp − p). p3 (3.111) Speciálisan, ha f (x, y) = x + y vagy f (x, y) = 2xy
+ 21 , akkor S(ξ, η) = log 3 − 1 ≈ 0, 0986. (3.112) c) A következő példa jól mutatja a kapcsolatot az összefüggés erőssége és a maximálkorreláció értéke között. Legyen a T tartomány két egységnégyzet uniója, pontosabban T = {−1 ≤ x ≤ 0; a − 1 ≤ y ≤ a} ∪ {0 ≤ x ≤ 1; −a ≤ y ≤ 1 − a}, (3.113) ahol 0 ≤ a ≤ 12 , mint a következő ábrán látható. 39 http://www.doksihu Maximálkorreláció Fegyverneki Tamás Legyen ξ és η együttes eloszlása egyenletes ezen a T -n! Ezt átalakı́thatjuk változóiban szimmetrikus eloszlássá, ahogyan azt korábban tárgyaltuk, ekkor az együttes sűrűségfüggvény Z ∞ f (x, t)f (y, t) f (x, y) = dt. f2 (t) −∞ (3.114) Az új együttes eloszlásfüggvényhez tartozó sajátértékek a négyzetei az eredetiknek(lásd [4]), jelen esetben p 1 = p3 = 1−a a , p2 = ; a(x) = 1 − 1 ≤ x ≤ 0, b(x) = 1 0 ≤ x ≤ 1. 2 2
(3.115) Ekkor a (3.104) egyenlőség szerint s |p1 p3 − p22 | √ S(ξ, η) = = 1 − 2a. pq (3.116) Többszörös sajátértékek Tekintsük a következő együttes sűrűségfüggvényt: f (x, y) = k(x − y) 0 ≤ x ≤ 2π; 0 ≤ y ≤ 2π, (3.117) ahol a k(x) függvény nemnegatı́v, 2π szerint periodikus, integrálható a (0, 2π) R 2π 1 és k(−x) = k(x)! Ekkor a marginális és intervallumon, 0 k(x)dx = 2π feltételes sűrűségfüggvényekre f1 (x) = 1 , 2π 0 ≤ x ≤ 2π 40 (3.118) http://www.doksihu Maximálkorreláció Fegyverneki Tamás és f1 (x|y) = 2πk(x − y), 0 ≤ x ≤ 2π, 0 ≤ y ≤ 2π. (3.119) A sajátértékek ekkor Z λn = 2π 2π k(x) cos nxdx; n = 1, 2, . , (3.120) n = 1, 2, . , (3.121) 0 és a megfelelő sajátfüggvények fn,1 = cos nξ; fn,2 = sin nξ; ı́gy a λn -ek kétszeres sajátértékek, S(ξ, η) = max |λn |. (3.122) n Bártfai publikálatlan
példájának általánosı́tása Legyen a sı́kon definiált T tartomány a következő: T = {(x, y) : |x|p + |y|q ≤ 1} p > 0, q > 0, (3.123) és legyen (ξ, η) egyenletes eloszlású T -n! A példa alapjai Bártfaitól erednek, nevezetesen a p = q = 2 esetre való megoldás, amit viszont soha nem publikált. Az általános esetből az is ki fog derülni, hogy p = q esetben ”keskenyebb” T esetén a maximálkorreláció értéke nagyobb. 41 http://www.doksihu Maximálkorreláció Fegyverneki Tamás 1 , t Az együttes eloszlásfüggvény tehát f (x, y) = ha (x, y) ∈ T , ahol a következők igazak: 1 ZZ Z t= 1 (1−y q ) p Z Z dxdy = 4 dxdy = 4 0 T 0 1 1 (1 − y q ) p dy (3.124) 0 A peremeloszlások sűrűségfüggvényei ekkor 1 2 f1 (x) = (1 − |x|p ) q , t 1 2 f2 (y) = (1 − |y|q ) p , t és a feltételes sűrűségfüggvények f1 (x|y) = 1 2(1 − |y|q ) 1 p 1 f2 (y|x) = |x|
≤ 1, (3.125) |y| ≤ 1, (3.126) 1 , |x| ≤ (1 − |y|q ) p , |y| ≤ 1, , |y| ≤ (1 − |x|p ) q , |x| ≤ 1. (3.127) 1 (3.128) 2(1 − |x|p ) A 8.Tétel alkalmazásához szükséges lineárisan független függvényeket vá1 q lasszuk a következőképp: ϕn = |ξ|pn − E(|ξ|pn ), ψn = |η|qn − E(|η|qn ) n = 1, 2, . (3.129) Tekintsük a következő egyenlőséget: 1 Z 1 |x|pn f1 (x|y)dx = −1 Z 1 (1 − |y|q ) 1 p (1−|y|q ) p xpn dx = 0 1 (1 − |y|q )n , pn + 1 (3.130) ebből a feltételes várható értékekre A η ϕn = 1 1 (1 − |η|q )n − E(|ξ|pn ), Aξ ψn = (1 − |ξ|p )n − E(|η|qn ), pn + 1 qn + 1 (3.131) ekkor pedig az együtthatókra a 8.Tétel szerint bnn = (−1)n (−1)n , b0 nn = ; pn + 1 qn + 1 n = 1, 2, . , (3.132) ı́gy a sajátértékek a következőek: λn = p 1 (pn + 1)(qn + 1) 42 ; n = 1, 2, . (3.133) http://www.doksihu Maximálkorreláció Fegyverneki Tamás
Az ilyen sajátértékekhez tartozó sajátfüggvények viszont nem minden esetben alkotnak teljes rendszert, ı́gy szükséges C(ξ, η) meghatározása. Belátható, hogy ezek a λ-k adják az összes nem nulla sajátértéket, mivel belátható (lásd [5]), hogy 1 + C2 (ξ, η) = 1 + ∞ X λ2n . (3.134) n=1 Ekkor tehát a maximálkorreláció értéke 1 S(ξ, η) = max p n (pn + 1)(qn + 1) 1 =p (p + 1)(q + 1) , (3.135) a kapcsolódó sajátfüggvények pedig f1 = |ξ|p − 1 1 , g1 = |η|q − . p+2 q+2 (3.136) Érdemes megjegyezni, hogy ebben a példában a korreláció és a korrelációs hányados is zérus, valamint a maximálkorreláció kiszámı́tásakor akkor és csak akkor helyettesı́thető ξ és η rendre |ξ|-vel és |η|-val, ha S(ξ, η)-hoz páros sajátfüggvénypár tartozik. Ennek következtében nyilván a T tartomány helyett is elegendő csak a felső félsı́kba vagy akár az
első sı́knegyedbe eső részét vizsgálni. Valószı́nűségi változók sorozatának részösszegei Korábban emlı́tettük, hogy az együttes normális eloszlás nem szükséges követelménye annak, hogy a maximálkorreláció és a hagyományos korreláció értéke megegyezzen, erre most bemutatunk egy lehetőséget. Dembo, Kagan és Shepp[7] belátták a következő állı́tást független azonos eloszlású valószı́nűségi változók sorozatára, felhasználva Efron és Stein egy állı́tását ilyen változók egy szimmetrikus függvényének felbontásáról: 10.Állı́tás Legyenek ξ1 , ξ2 , . független, azonos eloszlású valószı́nűségi vál2 P tozók, legyen Sk = ki=1 ξi ! Ha egy h függvényre E h(Sk ) < ∞, akkor l ≤ k számokra 2 2 1 − l 2 l E E(h(Sk )|Sl ) ≤ E h(Sk ) + E(h(Sk )) . k k 43 (3.137) http://www.doksihu Maximálkorreláció Fegyverneki
Tamás Az állı́tást valójában egy általánosabb alakban látták be, egészen pontosan ha h(ξ1 , . , ξk ) szimmetrikus függvény véges második momentummal, akkor 2 E E(h(ξ1 , . , ξk )|ξ1 , , ξl ) ≤ 2 1 − l 2 l E h(ξ1 , . , ξk ) + E(h(ξ1 , . , ξk )) (3.138) k k egyenlőtlenség teljesül. Ezt felhasználva bizonyı́thatjuk a következő tételt: ≤ 9.Tétel Legyenek ξ1 , ξ2 , független, azonos eloszlású valószı́nűségi válP tozók, E(ξ 2 ) < ∞, Sk = ki=1 ξi ! Ekkor ha m ≤ n pozitı́v egészek, akkor Sm és Sn maximálkorrelációja megegyezik a klasszikus korrelációjukkal, és ı́gy nem függ a valószı́nűségi változók eloszlásától. A maximálkorreláció értéke ekkor r S(Sm , Sn ) = R(Sm , Sn ) = m , n m ≤ n. (3.139) Bizonyı́tás. Válasszuk a megfelelő terekből f és g függvényeket úgy, hogy E f (Sm ) = 0, E g(Sn ) = 0, E f
(Sm )2 < ∞ és E g(Sn )2 < ∞ teljesüljön! Ekkor a teljes várható érték tétele szerint E f (Sm )g(Sn ) = E f (Sm )E(g(Sn )|Sm ) (3.140) teljesül. A Cauchy-Schwarz-Bunyakovszkij egyenlőtlenség és az előző állı́tás felhasználásával ekkor 2 2 m |E f (Sm )g(Sn ) |2 ≤ E f (Sm ) E E(g(Sn )|Sm ) ≤ E f (Sm ). (3141) n Mivel ez minden megfelelő f és g függvény esetén igaz, a maximálkorreláció definı́ciója szerint m . (3.142) n A másik irányú egyenlőtlenséghez tekintsük először a hagyományos korrelációt, S2 (Sm , Sn ) ≤ ennek értéke r E (Sm − E(Sm ))(Sn − E(Sn )) m R(Sm , Sn ) = = , D(Sm )D(Sn ) n 44 (3.143) http://www.doksihu Maximálkorreláció Fegyverneki Tamás valamint a (3.17) egyenlőtlenség szerint r S(Sm , Sn ) ≥ R(Sm , Sn ) = m . n (3.144) Mivel mindkét irányban megkaptuk az egyenlőtlenséget, a tétel igaz. Megjegyezendő, hogy E(ξi2 ) =
∞ esetében a fenti bizonyı́tásból is látható, p hogy S(Sm , Sn ) ≤ m , ha m ≤ n pozitı́v egészek, a másik irány viszont nem n látszik. Az állı́tás végtelen szórásnégyzetek esetén is igaz, egy bizonyı́tását közölte Novak[11] 2004-ben, majd 2005-ben Bryc, Dembo és Kagan[2] szintén tárgyalta a problémát. Az állı́tás nem azonos eloszlású valószı́nűségi változók esetén nem ismert. Markov-láncok és maximálkorreláció Markov-láncok konvergenciájának vizsgálatakor kiderül, hogy a konvergencia szoros kapcsolatban áll a lánc két állapotának korreláltságával. Ilyen irányú vizsgálatok esetén is érdemes a maximálkorrelációt vizsgálnunk, és bizonyos esetekben pontos értékét is meg tudjuk határozni. Legyen {Xt } egy irreducibilis, véges állapotterű folytonos Markov-lánc p(t) = pij (t) , t ≥ 0 átmenetvalószı́nűségekkel, és a Q =
(qij ) infinitezimális generátorral! Legyen a lánc π stacionárius eloszlása időben megfordı́tható, azaz teljesüljön pij πj = πi pij ! (3.145) Innentől eszerint az eloszlás szerint vizsgáljuk a dolgokat. 11.Állı́tás Ekkor a maximálkorreláció értéke S(Xt , X0 ) = eλ1 t , t ≥ 0, ahol λ1 < 0 jelöli a Q mátrix legnagyobb nemtriviális sajátértékét. 45 (3.146) http://www.doksihu Maximálkorreláció Fegyverneki Tamás Bizonyı́tás. A maximálkorreláció f és g transzformáló függvényeire igaz, hogy mivel definı́ció szerint Ef = Eg = 0 és kf k = kgk = 1, R(f (Xt ), g(X0 )) = hp(t)f, gi, (3.147) és ı́gy létezik a térben {ϕi } ortonormált bázis az átmenetmátrix sajátvektoraiból. Mivel az átmenetmátrixra p(t) = e Qt ∞ X Qk tk = k! k=0 , (3.148) az átmenetmátrix sajátértékei kifejezhetők a generátor sajátértékeiből, tehát ha Q
sajátértékeit λi jelöli, akkor p(t) sajátértékei eλi t alakban állnak elő. Az ortonormált bázisban ı́rjuk fel a transzformáló függvényeket: f= X hf, ϕi iϕi , g = X i hg, ϕi iϕi . (3.149) i Ekkor látható, hogy speciálisan f0 = g0 = ϕ1 esetén R(f0 (Xt ), g0 (X0 )) = hp(t)f0 , g0 i = hp(t)ϕ1 , ϕ1 i = heQt ϕ1 , ϕ1 i = = heλ1 t ϕ1 , ϕ1 i = eλ1 t hϕ1 , ϕ1 i = eλ1 t , (3.150) tehát léteznek olyan transzformáló függvények, amelyekkel a korreláció az állı́tásbeli értéket veszi fel. Általános, de természetesen standard esetben pedig a következő egyenlőtlenség igaz: D Qt R(f (Xt ), g(X0 )) = hp(t)f, gi = e X i = DX eλi t hf, ϕi iϕi , i X = ≤ eλ1 t i hg, ϕi iϕi = i λi t i e hf, ϕi ihg, ϕi i ≤ X i X E E X hg, ϕi iϕi = heλi t hf, ϕi iϕi , hg, ϕi iϕi i = i X hf, ϕi iϕi , X e λi t i hf, ϕi i2 + hg, ϕi i2 2 ! = eλ1 t 46 ! hf, ϕi i2 + hg,
ϕi i2 ≤ 2 ! P P 2 2 hf, ϕ i + hg, ϕ i i i i i = 2 http://www.doksihu Maximálkorreláció Fegyverneki Tamás 1+1 = e λ1 t , (3.151) 2 tehát bármilyen más transzformáló függvények esetén sem lehet nagyobb a = e λ1 t · módosı́tott korreláció, tehát a (3.146) egyenlőség igaz Érdemes megjegyezni, hogy diszkrét paraméterű stacionárius lánc esetére Liu bizonyı́tott hasonlót, szoros összefüggésben a lánc konvergenciájának vizsgálatával, visszavezetve a konvergenciasebesség kérdését a dolgozatban tárgyalt operátorproblémákhoz hasonló eszközökkel egy kovarianciaproblémára, majd felhasználva saját 1991-es eredményét, mely szerint a maximálkorreláció kifejezhető a következő alakban is: X S(ξ, η) = D2 E(h(ξ), η) . (3.152) E(h)=0,D2 (h)=1 Ez természetesen teljesen hasonló az operátorok tárgyalásakor látott egyenlőségekhez, amelyek a feltételes
várható érték operátorának normájáról szóltak. Egyenletes eloszlású mintaelemek A következő példa elsősorban egy felső becslést ad bizonyos esetben a maximálkorreláció értékére, valamint speciális esetben egyenlőséget is láthatunk. A becslést adó tételt speciálisan kételemű mintára, ahola mintaelemek eloszlása folytonos, Terrell látta be 1983-ban, a következő tétel ennek egy általánosabb formája, Székely és Móri[17] tétele: 10.Tétel Legyenek X1 , X2 , , Xn független, azonos eloszlású valószı́nűségi változók, és jelölje X̂1 ≤ X̂2 ≤ ≤ X̂n a belőlük álló rendezett statisztikát. Rögzı́tett 1 ≤ i ≤ j ≤ n mellett tegyük fel, hogy X̂i és X̂j véges szórásúak. Ekkor R(X̂i , X̂j ) ≤ i(n + 1 − j) j(n + 1 − i) ! 21 , (3.153) és egyenlőség akkor és csak akkor áll fenn, ha az Xi valószı́nűségi változók
egyenletes eloszlásúak. 47 http://www.doksihu Maximálkorreláció Fegyverneki Tamás A tételt a szerzők ennél általánosabban bizonyı́tják, valójában ezt a felső becslést a maximálkorrelációra is belátják. A tétel bizonyı́tásából kiderül, hogy mivel a (0,1) intervallumon egyenletes eloszlásból vett minta esetén a rendezett mintaelemek béta-eloszlásúak, azaz sűrűségfüggvényeik fX̂i (x) = B(i, n + 1 − i)−1 xi−1 (1 − x)n−i , 0 < x < 1 (3.154) fX̂j (y) = B(j, n + 1 − j)−1 y j−1 (1 − y)n−j , 0 < y < 1, (3.155) és az együttes eloszlásfüggvény pedig fX̂i ,X̂j (x, y) = B(i, j−i, n+1−j)−1 xi−1 (y−x)j−i−1 (1−y)n−j , 0 < x < y < 1, (3.156) ahol B(t1 , t2 , . , tk ) = Γ(t1 )Γ(t2 ) · · · Γ(tk ) , Γ(t1 + t2 + . + tk ) (3.157) azaz a béta-eloszlásnál megismert normáló konstans, ha a ξ és η valószı́nűségi
változók együttes eloszlása ilyen, akkor a tétel szerint teljesül az egyenlőség, tehát ha fξ,η (x, y) = fαβγ (x, y) = B(α, β, γ)−1 xα−1 (y − x)β−1 (1 − y)γ−1 , 0 < x < y < 1, α, β, γ > 0, akkor S(ξ, η) = αγ (α + β)(γ + β) (3.158) ! 21 . (3.159) Ebből az általános esetből következik szintén a fent emlı́tett szerzők példája: Legyenek az X1 , X2 , . , Xn valószı́nűségi változók egyenletes eloszlásúak a következő tartományon: ( x∈R n n X |x| 1 ti ) ≤ 1 , 0 < ti < ∞, i=1 48 (3.160) http://www.doksihu Maximálkorreláció Fegyverneki Tamás ekkor 1 t1 1 t2 S(X1 , X2 ) = R(|X1 | , 1 − |X2 | ) = ahol T = Pn t1 t2 (1 + T − t1 )(1 + T − t2 ) 1 i=1 ti . ! 12 , (3.161) 1 Ez pedig onnan adódik, hogy |X1 | t1 és 1 − |X2 | t2 együttes sűrűségfüggvénye pontosan olyan, mint az előbb tárgyalt általánosabb esetben, α = t1 ,
β = 1 + T − t1 − t2 és γ = t2 helyettesı́tésekkel, valamint belátható, hogy S(X1 , X2 ) = S(|X1 |, |X2 |). Látható, hogy ez az eset a Bártfai példájánál leı́rtak általánosı́tása. 3.23 Algoritmikus közelı́tés A konkrétan kiszámı́tható esetek mellett meglehetősen sokan tárgyalnak módszereket az optimális transzformáló függvények vagy a sajátértékek közelı́tésére. Nyilvánvalóan cél lehet egy általános érvényű módszer megalkotása, amellyel kiszámı́tható esetben a létező optimális függvényeket tetszőlegesen jól közelı́ti, és olyan esetekben, amikor nem léteznek legjobb transzformáló függvények, akkor is valamilyen szempontból optimális eredményt ad. A következő szakaszban áttekintünk két lehetőséget röviden a maximálkorreláció iteratı́v közelı́tésére. Az első algoritmus tárgyalásához tekintsünk
Sarmanov[16] eredeti megközelı́tését a maximálkorrelációra, teljesen analóg módon az eddigiekkel: Legyen f (x, y) a korrelációt meghatározó sűrűségfüggvény ξ és η valószı́nűségi változókra, amelyeket a T = {a ≤ ξ ≤ b; c ≤ η ≤ d} (3.162) tartományon tekintünk, ami akár végtelen is lehet. A valószı́nűségi változók peremeloszlásaira ekkor Z f1 (x) = d Z f (x, y)dy; f2 (y) = c f (x, y)dx. a 49 b (3.163) http://www.doksihu Maximálkorreláció Fegyverneki Tamás Tegyük fel, hogy a k(x, y) = √ f (x,y) f1 (x)f2 (y) magfüggvény négyzetesen integrálha- tó mindkét változó szerint! Az f (x, y) sűrűségfüggvény meghatároz két szimmetrikus sűrűségfüggvényt, mégpedig Z b Z d f (x, t)f (y, t) f (t, x)f (t, y) dt és g2 (x, y) = dt g1 (x, y) = f2 (t) f1 (t) c a (3.164) függvényeket, és két szimmetrikus magfüggvényt, nevezetesen g1 (x, y)
k1 (x, y) = p és k2 (x, y) = p f1 (x)f1 (y) g2 (x, y) f2 (x)f2 (y) (3.165) függvényeket. Ezek a magfüggvények pozitı́vak és ugyanazok a sajátértékeik, jelölje ezeket 1 < λ21 ≤ λ22 ≤ . , valamint a két magfüggvényhez tartozó sajátfüggvényeket rendre |ϕi (x)| és |ψi (x)|, ahol i = 1, 2, , ekkor természetesen a sajátfüggvényekről nem állı́thatjuk általánosságban, hogy megegyeznének. Ekkor a korábban definiáltakkal teljesen analóg módon az f (x, y) együttes sűrűségfüggvénnyel meghatározott eloszláshoz tartozó maximálkorrelációra S(ξ, η) = 1 |λ1 | teljesül, és teljesen hasonlóan a korábbiak- hoz a 8.Állı́tás igaz, miszerint a definiált szimmetrikus eloszlásokhoz tartozó maximálkorreláció értéke a négyzete az eredeti eloszláshoz tartozónak, azaz értéke 1 . λ21 A bevezetett tárgyalásmódra nézve a maximálkorreláció
kiszámı́tására a következő közelı́tő eljárást adhatjuk: Legyen az r0 (y) kezdő közelı́tésünk egy tetszőleges függvény, aminek van szórása és várható értéke 0! Ekkor a következő iterációt tekintjük: Z d f (x, y) r2k+1 (x) = r2k (y) dy f1 (x) c és Z b r2k (y) = r2k+1 (x) a f (x, y) dx, f2 (y) (3.166) (3.167) ahol k = 1, 2, . Sarmanov bizonyı́totta a módszer konvergenciáját, valamint hogy az első sajátfüggvények meghatározhatók normáló konstansokkal való szorzás erejéig, mint határérték, egészen pontosan a1 ψ1 (y) = lim r2k (y)λ2k 1 k∞ 50 (3.168) http://www.doksihu Maximálkorreláció Fegyverneki Tamás és b1 ϕ1 (x) = lim r2k+1 (x)λ2k 1 . k∞ (3.169) Így ha k elég nagy, akkor a szimmetrikus eloszlásokhoz tartozó maximálkorreláció értéke 1 r2k (y) r2k+1 (x) ≈ ≈ . 2 λ1 r2k−2 (y) r2k−1 (x) (3.170) A következő módszer nem a
maximálkorreláció értékét, hanem kiszámı́tásához az optimális transzformáló függvényeket közelı́ti. A módszer alapvetően sokkal általánosabb esetben ad jó algoritmust optimális transzformáló függvényekre. Valójában a regresszióanalı́zisben adódó feltételes várható értékek esetén a változókat gyakran valamilyen függvénybe helyettesı́tve módosı́tják a feladatot, hogy optimalizálják a problémát, például Y valószı́nűségi változó és a feltételt képező Xi , i = 1, . , p valószı́nűségi változók esetén inkább θ(Y ) és φi (Xi ) változókat vizsgálják, minimalizálandó a P E (θ(Y ) − pi=1 φi (Xi ))2 D2 θ(Y ) (3.171) kifejezést. Breiman és Friedman[1] algoritmusa bizonyos feltételek mellett optimális függvényeket kiszámı́tó módszert ad a problémára. Látható, hogy p = 1 esetben ez pontosan a
maximálkorreláció optimális függvényeire ad közelı́tést. Az eddigi jelöléseinkkel tehát minimalizálni akarjuk a következő kifejezést: 2 E f (ξ) − g(η) , (3.172) ahol persze feltehetünk minden korábbit a várható értékekre és szórásokra. Ekkor rögzı́tett g(η) mellett, megtartva E(f 2 (ξ)) = 1-et, az f -re vett minimalizálásra adódik E(g(η)|ξ) , (3.173) kE(g(η)|ξ)k azaz egy normált feltételes várható érték, ami szintén analóg a korábban f 0 (ξ) = tárgyaltakkal. Természetesen a másik irányú minimalizálásra teljesen hasonlóan adható g 0 képlete, de ezt elegendő normálás nélkül tekintenünk 51 http://www.doksihu Maximálkorreláció Fegyverneki Tamás Ekkor a módszer úgynevezett alternáló feltételes várható értékeken alapuló algoritmus(ACE), és legalapvetőbb formája a következő: Legyen f (ξ) = ξ ! kξk Egy iterációs
lépés legyen az alábbi: g 0 (η) = E(f (ξ)|η), helyettesı́tsük g helyére g 0 -t; f 0 (ξ) = E(g(η)|ξ), helyettesı́tsük f helyére f 0 -t! 2 Az iterációs lépést addig ismételgetjük, amı́g E f (ξ) − g(η) csökken, mikor nem csökken tovább, megállunk, és a kapott f és g függvényeket választjuk. Breiman és Friedman belátták, hogy az algoritmus valóban a kérdéses optimális transzformáló függvényeket adja meg, természetesen általánosabb esetben is, nem csak két változóra, továbbá beláttak Rényi, Csáki és Fischer eredményeihez teljesen hasonlókat az optimális függvények létezésére, valamint kapcsolatukra a feltételesvárhatóérték-operátorokkal. A fent emlı́tett módszert tárgyalja Buja[3] is, emellett egy úgynevezett ALS-algoritmust, azaz alternáló legkisebb négyzetes közelı́tésekkel dolgozó algoritmust is. 52 http://www.doksihu
Köszönetnyilvánı́tás Szeretnék köszönetet mondani témavezetőmnek, Móri Tamásnak türelméért, segı́tségéért a téma szakirodalmának összegyűjtésében, a LATEX használatában való javaslatokért valamint a dolgozat felépı́tésében és szerkesztésében adott hasznos tanácsokért és iránymutatásért. http://www.doksihu Irodalomjegyzék [1] Breiman, L., Friedman J : Estimating optimal transformations for multiple regression and correlation J Amer Stat. Assoc 80 (1985) 580-598 [2] Bryc, W., Dembo, A, Kagan, A : On the maximal correlation coefficient Theory Probab Appl 49 (2005) 132-138 [3] Buja, A. : Remarks of functional canonical variates, alternating least squares methods and ACE Annals of Statistics 18 (1990) 1032-1069 [4] Csáki P., Fischer J : On bivariate stochastic connection MTA Mat. Kut Int Közl 5 (1960) 311-323 [5] Csáki P., Fischer J : Contributions to the problem of maximal correlation. MTA Mat
Kut Int Közl 5 (1960) 325-337. [6] Csáki P., Fischer J : On the general notions of maximal correlation. MTA Mat Kut Int Közl 8 (1963) 27-51 [7] Dembo, A., Kagan, A, Shepp, L A : Remarks on the maximum correlation coefficient. Bernoulli 7 (2001) 343350 [8] Gebelein, H. : Das statistische Problem der Korrelation als Variation- und Eigenwertproblem und sein Zusammen54 http://www.doksihu Maximálkorreláció Fegyverneki Tamás hang mit Ausgleichsrechnung. Zeitschrift für angewandte Mathematik und Mechanik 21 (1947) 364-379. [9] Lancaster, H. O : Some properties of the bivariate normal distribution considered in the form of a contingency table. Biometrika 44 (1957) 289-292. [10] Linfoot, E. H : An informational measure of dependence Information and Control 1 (1957) 85-89. [11] Novak, S. Y : On Gebelein’s correlation coefficient Statistics and Probability Letters 69 (2004) 299-303. [12] Rényi A. : New version of the probabilistic generalization of the large sieve. Acta
Math Acad Sci Hung 10 (1959) 218-226. [13] Rényi A. : On measures of depence Acta Math Acad Sci. Hung 10 (1959) 441-451 [14] Rényi A. : Valószı́nűségszámı́tás Tankönyvkiadó (1981) [15] Sarmanov, O. V : The maximal correlation coefficient (symmetric case) Dok. Akad Nauk USSR 120 (1958) 715718 [16] Sarmanov, O. V : The maximal correlation coefficient (nonsymmetric case) Dok. Akad Nauk USSR 121 (1958) 52-55. [17] Székely G. J, Móri T F : An extremal property of rectangular distributions Statistics and Probability Letters 3 (1985) 107-109. [18] Yu, Y. : On the maximal correlation coefficient Statistics and Probability Letters 78 (2008) 1072-1075. 55