Tartalmi kivonat
Biometria II - Nem paraméteres statisztikai módszerek 1. Rangokon alapuló próbák Alkalmazásuk akkor merül föl, ha az adatok legalább sorrendi skálán értelmezhetők, de az eloszlás nem normális. 1.1 Két független minta összehasonlítása (Wilcoxon-Mann-Whitney) 1. példa (Conover: Nonparametric statistics, p. 101) Akik iskola előtt óvodába jártak, azok jobban teljesítenek-e iskolában, mint azok, akik nem jártak óvodába? Minta: 12 gyerek : - 8 nem volt óvodás - 4 óvodás volt Értékelés: Az iskolában elért átlageredményüket néztük (sorrendi skála, a sorrend nyilvánvaló, a különbségek a rangok között nem egyenlők). Sorba rendeztük átlageredményeik alapján a d iákokat. 1-es sorszámot a legjobb átlagú diák kapta, a 12-es sorszámot pedig a legrosszabb átlageredményű diák kapta. Ha az óvodát jártak jobbak, rangszámaik kisebbek, a nem jártakéi nagyobbak, világos helyzet. Itt az óvodát jártak rangszámai: 2,5,6,9. Kismintás
módszer (Small sample procedure) 12 12 ⋅11 ⋅10 ⋅ 9 Az összes konfigurációk száma: = = 495 1⋅ 2 ⋅ 3 ⋅ 4 4 Ha véletlenszerűen helyezkednek el, bármelyik konfiguráció valószínűsége 1/495. Csoportosítsuk a konfigurációkat az óvodát jártak rangszámának összege (W) szerint: 1,2,3,4 1,2,3,5 1,2,3,6 1,2,4,5 1,2,3,7 1,2,4,6 1,3,4,5 1,2,3,8 1,2,4,7 1,2,5,6 2,3,4,5 1,3,4,6 1,2,3,9 1,2,4,8 1,2,5,7 1,3,5,6 1,3,4,7 W 10 11 12 P (W= ) 1/495 1/495 2/495 P (W≤ ) 1/495=0.002 2/495=0.004 4/495=0.008 13 3/495 7/495=0.014 14 5/495 12/495=0.024 15 6/495 18/495=0.036 2,3,4,6 A példa szerinti egyoldali eset H 0 : az óvodát jártak nem jobbak a nem jártaknál (rosszabbak vagy ugyanolyanok), véletlenszerűen osztódnak ki a rangszámok (1/495-nél nem nagyobb a valószínűsége, hogy kisebb rangszámot kapjon egy óvodát járt gyerek). H 1 : az óvodát jártak jobbak, kisebb a rangszámuk (1/495-nél nagyobb a
valószínűsége, hogy kisebb rangszámot kapjon egy óvodát járt gyerek). Ha H 0 egyenlőség-része igaz, akkor annak valószínűsége, hogy az óvodát jártak rangszámösszege 15 vagy kisebb legyen, 0.036 Ha H 0 egyenlőtlenség része igaz (1/495-nél kisebb a valószínűsége, hogy kisebb rangszámot kapjanak, vagyis az óvodát jártak ténylegesen rosszabbak), akkor annak valószínűsége, hogy az óvodát jártak rangszám-összege 15 vagy kisebb legyen, kisebb, mint 0.036 16-nál már túllépnénk a 0.05-os határt Az elutasítási tartomány 10-15, ha 15 va gy ennél kisebb a rangszámok összege, akkor 0.05-os szignifikanciaszinten el kell utasítani a H 0 -t, vagyis ki kell mondani, hogy az óvodát jártak jobban teljesítenek az iskolában. A példában 2,5,6,9, Σ=22, tehát elfogadjuk a H 0 -t. Összegezve: Ezek az adatok nem támasztják alá, hogy az óvodába jártak jobb tanulmányi eredményt értek el, mint azok a diákok, akik nem jártak óvodába.
Kapcsolt (tie) rang Ez akkor merül föl, ha két gyerek egyforma rangszámot kapna. Pl ha a 6 é s 7 he lyen egyforma a r angszám (mert az iskolai átlaguk egyforma), akkor mindkét gyerek 6.5-es sorszámot kap. További lehetséges hipotézis-párok Kétoldali eset H 0 : az óvodába járt diákok tanulmányi eredménye megegyezik az óvodába nem járt diákok tanulmányi eredményével, az óvodát jártak nem különböznek a nem jártaktól, vagyis véletlenszerűen osztódnak ki a rangszámok H 1 : az óvodát jártak különböznek, kisebb vagy nagyobb a rangszámuk. Az ellenhipotézis érvényessége esetén az óvodát jártak rangszáma vagy a rangsor elején (1, 2, 3, 4), vagy a rangsor végén van (9, 10, 11, 12). 9+10+11+12=42 (=W max ), 38-nál van a 0.025-es határ Az elutasítási tartomány kétoldali határ esetén: (10-14) és (38-42) A nullhipotézist elfogadjuk, ha 14≤W≤38 A másik egyoldali hipotézis-pár a következő lenne: H 0 : az óvodát jártak
nem rosszabbak a nem jártaknál (jobbak vagy ugyanolyanok), véletlenszerűen osztódnak ki a rangszámok (1/495-nél nem kisebb a valószínűsége, hogy kisebb rangszámot kapjon egy óvodát járt gyerek). H 1 : az óvodát jártak rosszabbak, nagyobb a rangszámuk (1/495-nél kisebb a valószínűsége, hogy kisebb rangszámot kapjon egy óvodát járt gyerek). Ha 37 vagy ennél nagyobb a rangszámok összege, akkor 0.05-os szignifikanciaszinten el kell utasítani a H 0 -t, vagyis ki kell mondani, hogy az óvodát jártak rosszabbul teljesítenek az iskolában. A föntebb ismertetett próbát Wilcoxon eredetileg két azonos elemszámú minta (n 1 =n 2 ) összehasonlítására dolgozta ki. Mann és Whitney a következő módosított próbastatisztikát javasolta különböző elemszámú mintákra: U =W − n1 ⋅ (n1 + 1) 2 4⋅5 = 12 2 A számolás egzakt, nagy mintára azonban nehéz. A példában U = 22 − Nagymintás (közelítő) módszer (Large sample procedure)
Kihasználjuk, hogy a centrális határeloszlás tétele értelmében bármilyen eloszlásból vett mintaelemek összege normális eloszláshoz közelít, minél nagyobb elemszámú mintát veszünk, annál inkább, tehát a W valószínűségi változó normális eloszlású. u≈ W − E (W ) Var (W ) E (W H 0 ) = n1 ⋅ (n1 + n 2 + 1) n1 ⋅ ( N + 1) = 2 2 Var (W H 0 ) = u0 = n1 ⋅ (n1 + n2 + 1) ⋅ n2 12 (a fejezet végén bemutatott levezetés szerint). n1 ( N + 1) 2 n1 n2 ( N + 1) 12 W− A példában: E (W H 0 ) = 4 ⋅ (4 + 8 + 1) = 26 2 Var (W H 0 ) = 4 ⋅ (4 + 8 + 1) ⋅ 8 = 34.67 12 u0 ≈ 22 − 26 34.67 = −0.6794 Ha az ellenhipotézis igaz, W kicsi, tehát alsó határ kell. A -06794-es értékhez az u-táblázatból 0.248-at olvasunk le P(u ≤ −06794) = 0248 Elfogadjuk H 0 -t, mert 0248>>005 Folytonossági (Yates-) korrekció A binomiális eloszlás diszkrét, a normális eloszlás folytonos. Tehát amikor annak valószínűségét
keressük, hogy az ábrán szereplő binomiális eloszlású valószínűségi változó az x=7 értéket vegye föl, a normális eloszlásból annak valószínűségét kell kiolvasnunk, hogy az x 6.5 és 75 köz ött legyen Az emiatt hozzáadott (ill levont) 05-es értéket folytonossági korrekciónak nevezik. k − 0.5 − np k + 0.5 − np k − 0.5 − np k + 0.5 − np , − Φ =Φ ≤u≤ p( k ) ≈ P np(1 − p) np(1 − p) np(1 − p) np(1 − p) ahol Φ a standardizált normális eloszlás eloszlásfüggvénye. 0.3 0.2 0.1 0.0 0 1 2 3 4 5 6 7 8 9 10 x=b=7 A 0.5 természetesen csak akkor megfelelő korrekció, ha az eredeti binomiális eloszlású valószínűségi változó értékkészlete az egész számokat tartalmazza, ez pl. a selejtes darabok számára teljesül. Ha a mintabeli selejtarány a valószínűségi változó, annak értékei 1/n egész számú
többszörösei lehetnek, ilyenkor a korrekció 0.5/n Ha azt kell kiszámítanunk, hogy az x binomiális eloszlású valószínűségi változó milyen valószínűséggel nem halad meg egy b (pl. b=7)értéket, hozzá kell a korrekciót adni bhez: b + 0.5 − np . P( x ≤ b ) ≈ P u ≤ 1 np − p ( ) 0.3 0.2 0.1 0.0 0 1 2 3 4 5 6 7 8 9 10 x≤b=7 Ha a kérdés az, hogy az x binomiális eloszlású valószínűségi változó milyen valószínűséggel marad b alatt, le kell vonni a korrekciót b-ből: b − 0.5 − np . P( x < b ) ≈ P u < np(1 − p) 0.3 0.2 0.1 0.0 -2 0 2 4 6 8 10 12 x<b=7 Visszatérve az 1. példa adataira: 22 − 26 + 0.5 u0 ≈ = −0.5944 , p = 0276 34.67 Ellenőrizzük a közelítő (nagymintás) módszer jóságát az egzakt (kismintás) módszerrel kapott P(W≤14)=0.024 határra: u (W =14 ) ≈ 14 − 26 34,67 = −2.038 A –2.038-hez 00225-es
érték tartozik (u-tábl) A közelítő (nagymintás) módszerrel kapott 0.0225 csak kicsivel kisebb, mint az egzakt (kismintás) módszerrel kapott 0.0242, tehát nem rossz a közelítés Ha kapcsolt rangok (ties) is vannak, a képletekben bizonyos korrekciókat kell alkalmazni, az . n ( N + 1) n ( N + 1) W− 1 W− 1 2 2 = u0 = N n1 n2 ( N + 1) n1 n2 ∑ Rk2 − NR 2 12 N (N − 1) k =1 helyett az n1 ( N + 1) 2 próbastatisztika érvényes. 2 N n1n2 n1n2 ( N + 1) 2 ∑ Rk − 4(N − 1) N ( N − 1) k =1 W− u0 = N s R2 = 1 (Rk − R )2 = ∑ N − 1 k =1 N Var (W H 0 ) = ∑R k =1 2 k − NR 2 N −1 n1 n2 2 sR N 2. példa (J. Krauth: Distribution-free statistics, An application-oriented approach, Elsevier, 1988, p 50) Pszichiátriai betegeket lítium-készítménnyel ill. placebóval kezelnek A 6 páciens közül véletlenszerűen választották ki azt a hármat, akik a kezelést kapják. A függő változó a páciensek önértékelése a
depressziós skálán (VAS: Visual Analogue Scale, nagy érték súlyosabb). A kérdés az, hogy a lítium-készítménnyel való kezelés csökkenti-e a depressziót Legyen az elsőfajú hiba megengedett valószínűsége α = 0.05 ! Az eredmények: kezelt (T) score 7 10 11 kontroll (C) score 10 15 12 rang 1 2.5 4 rang 2.5 6 5 Kismintás eljárás A rangok és rangszám-összegek számítása a két csoportban: csoport score T 7 T 10 C 10 T 11 C 12 C 15 rang 1 2.5 2.5 4 5 6 A kezeltek (T) rangszám-összege: W= 7.5 A kontroll csoport (C) rangszám-összege: 13.5 Tegyük fel, hogy a rangszám csak a véletlentől függ. Hogyan lehet kiosztani a rangszámokat? 6 = 20 , a 6 páciensből a 3-at 20-féleképpen lehet kiválasztani, tehát a teljesen véletlenszerű 3 kiosztásnál egy konfiguráció valószínűsége 0.05 Ha a (bizonyos rangszámmal jelzett) egyedeket cserélgetjük a két csoport között, a rangszámösszegek a
következőképpen változnak. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 s.it 1 1 (T) 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2.5 1 (T) 1 1 1 2 2 2 2 2 2 1 1 1 1 1 4 1 (T) 2 2 2 1 1 1 2 2 2 1 1 1 2 2 2.5 2 (C) 1 2 2 1 2 2 1 1 2 1 2 2 1 1 6 2 (C) 2 1 2 2 1 2 1 2 1 2 1 2 1 2 5 2 (C) 2 2 1 2 2 1 2 1 1 2 2 1 2 1 W 7.5 6 9.5 8.5 7.5 11 10 9.5 8.5 12 9 12.5 11.5 11 10 Ha az igazi kísérletben W minimális, az arra utal, hogy a kezelésnek van hatása. A legkisebb rangszám-összeg a 6, tehát itt lenne a legmeggyőzőbb a Li hatása. H 0 : a kezeltek eredményei nem jobbak a nem kezeltekénél (rosszabbak vagy ugyanolyanok), véletlenszerűen osztódnak ki a rangszámok (1/20-nál nem nagyobb a valószínűsége, hogy valamelyik kisebb rangszámot kapja egy kezelt egyed). H 1 : a kezeltek eredményei jobbak, kisebb a rangszámuk (1/20-nál nagyobb a valószínűsége, hogy valamelyik kisebb rangszámot kapja egy kezelt egyed). A kísérletben W=7.5, ezen kívül még egy ilyen kombináció van, és
még egy W=6-os is Annak valószínűsége, hogy a W próbastatisztika értéke a talált vagy annál szélsőségesebb 3 (kisebb) legyen, ha a nullhipotézis igaz: P(W ≤ 7.5) = = 0.15 , ez meghaladja az α = 005 20 határt, tehát el kell fogadnunk a nullhipotézist. Elhisszük, hogy a véletlen műveként állt elő a kezeltek adott rangszáma, az adatok nem mondanak ellent annak a feltételezésnek, hogy a Linak nincs hatása a depresszióra. Tegyük fel, hogy W=6-ra jön ki!. 1 = 0.05 20 Határeset, elvetnénk a nullhipotézist. P (W ≤ 6) = Nagymintás (közelítő eljárás) E (R H 0 ) = R = E (W H 0 ) = N +1 = 3.5 2 n1 ⋅ ( N + 1) 3 ⋅ (3 + 3 + 1) = = 10.5 2 2 A varianciára nem használhatjuk az egyszerű képletet, mert kapcsolt rangok vannak! N s R2 = ∑R k =1 2 k − NR 2 N −1 Var (W H 0 ) = u0 ≈ 1 6 ⋅ 72 = 12 + 2.5 2 + 4 2 + 25 2 + 6 2 + 5 2 − 5 4 = 3.4 n1 n2 2 3 ⋅ 3 ⋅ 3.4 = 51 sR = 6 N 7.5 − 105 5.1 =
−1.328 Alsó határt kell néznünk, az u-táblázatból ez -1.645, elfogadjuk a nullhipotézist Másképpen, annak valószínűsége, hogy u a talált –1.328 értéket vagy annál szélsőségesebbet (kisebbet) vegyen föl, 1-0.9082=00918, ez meghaladja a 005-ot Folytonossági korrekcióval: u0 ≈ 7.5 + 05 − 105 5.1 = −1.107 Az u-táblázatból p=0.134, ez már közel van a pontos módszer szerinti 015-hoz Ha kétoldali lenne az ellenhipotézis, akkor a folytonossági korrekciót az egyik oldalon pozitív, a másik oldalon negatív irányban kellene alkalmazni. Ehelyett úgy járunk el, hogy a kezeltek (T) rangszám-összege (itt W= 7.5) és a kontroll csoport (C) rangszám-összege (itt W= 13.5) közül a kisebbiket helyettesítjük, és a pozitív korrekciót (+05) alkalmazzuk A folytonossági (Yates-) korrekció alkalmazásával nehezebben utasítjuk el a nullhipotézist, mint nélküle, tehát a próba így konzervatívabb. A Mann-Whitney-Wilcoxon-próba
alkalmazásának feltételei: 1.) Mindkét mintának véletlennek kell lennie 2.) A mintáknak egymástól is függetlennek kell lenniük 3.) Legalább sorrendi skála legyen A nullhipotézis és ellenhipotézis megfogalmazása (egyoldali esetre) Legyen F (ξ ) az x változó eloszlásfüggvénye, G (ξ ) az y változóé, ezekkel H 0 : F (ξ ) ≤ G (ξ ) , P(x < y ) ≤ P( x > y ) H 1 : F (ξ ) > G (ξ ) , P( x < y ) > P(x > y ) (x többnyire kisebb y-nál) F(ξ) x G(ξ) y y x C t T t Az ellenhipotézis szerint sztochasztikusan kisebb x az y-nál, x többnyire kisebb, mint y. (Vargha András: „két változó ugyanakkoraságának vizsgálata”) A H 1 : E (x ) < E ( y ) használhatóbb (a paraméteres próbáknál megszokott alakú) hipotézis lenne, de az előbbiből csak akkor következik, ha 4.) A két eloszlás alakja azonos, legfeljebb a helyzetükben térnek el: F (ξ ) = G (ξ + c ) A föntebbi ábra éppen ilyen esetet mutat. Ha a 4
feltétel nem teljesül, a k ét változó ugyanakkoraságára vonatkozó hipotézis nem egyenértékű a két valószínűségi változó várható értéknek vagy mediánjának egyenlőségére vonatkozó hipotézissel. Az alábbi ábra két olyan eloszlást mutat, amelyek várható értéke azonos, de az nem igaz rájuk, hogy x többnyire ugyanakkora, mint y, mert ha az eloszlások alakja különböző, nemcsak helyzetükben térnek el. Ebben az esetben a k étféle hipotézis nem ugyanazt jelenti Az egyik görbe a 3 szabadsági fokú χ2-eloszlás sűrűségfüggvénye, tehát a várható érték 3, a másik a 6 -χ2 változó sűrűségfüggvénye utóbbinak is 6-3= 3 a v árható értéke. A várható értékek azonosak, a H 0 : F (ξ ) ≤ G (ξ ) , P(x < y ) ≤ P( x > y ) nullhipotézisnek mégis ellentmondanak. 0.24 0.22 0.20 0.18 0.16 0.14 0.12 0.10 0.08 0.06 0.04 0.02 0.00 -5 0 5 10 15 20 25 A Mann-Whitney-Wilcoxon-próbát akkor használjuk, ha folytonos
(intervallum-) skálán mért adataink vannak, de az ingadozás nem normális eloszlású, vagy ha nem folytonos az eloszlás, pl. sorrendi skálán mért adataink vannak A sorrendi skálán az adatok helyett rangokat alkalmazunk. A normális eloszlású ingadozás esetén kétmintás t próbát használunk: x1 − x2 t0 = 1 1 s + n1 n2 Ha nem normális az eloszlás, a rangokra használunk analóg próbát: R1 − R2 t0 = 1 1 sR + n1 n2 Látszik, hogy a Mann-Whitney-Wilcoxon-próba közel áll a rangokon végzett t-próbához. Feladat: hasonlítsuk össze a 2 . példa adatain a Mann-Whitney-Wilcoxon-próbát a rangokra végzett t-próbával! Fisher-Pitman-féle randomizációs próba intervallum-skálán mért adatokra 3. példa (J. Krauth: Distribution-free statistics, An application-oriented approach, Elsevier, 1988, p 43) Az állatoknak meg kellett tanulniuk, hogy úgy jussanak el a szalonnához, hogy az áramütést elkerüljék. A tanulási időt mérték A vizsgálatban a
kérdés az volt, hogy a kezelés (amfetamin) rontja-e a tanulási képességeket. H 0 : a kezeltek tanulási képessége nem rosszabb a nem kezeltekénél (jobb vagy ugyanolyan), az elsajátítási idő rövidebb vagy ugyanakkora, H 1 : a kezeltek tanulási képessége rosszabb, az elsajátítási idő hosszabb, vagyis egyoldali (fölső) az ellenhipotézis. T 35.2 32.4 28.6 35.2 36.0 C 28.6 30.4 A W próbastatisztika itt a tanulási idők összege az amfetaminnal kezelt egyedeknél (rangszámot nem használunk, mert a tanulási idő intervallumskála, több információt hordoz, mint a rangszám, a különbség is értelmezhető). A táblázat első sora a tényleges eredmény, a továbbiak az egyedek (idő-eredmények) csoportok közötti fölcserélgetésével adódnak. W = 35.2 + 324 + 286 + 352 + 360 = 1674 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 35.2 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 2 32.4 1 1 1 1 1 1 1 1 1 1 2 2 2 2 2 1 1 1 1 1 2 28.6 1 1 1 1 1 1 2 2
2 2 1 1 1 1 2 1 1 1 1 2 1 35.2 1 1 1 2 2 2 1 1 1 2 1 1 1 2 1 1 1 1 2 1 1 36.0 1 2 2 1 1 2 1 1 2 1 1 1 2 1 1 1 1 2 1 1 1 28.6 2 1 2 1 2 1 1 2 1 1 1 2 1 1 1 1 2 1 1 1 1 30.4 2 2 1 2 1 1 2 1 1 1 2 1 1 1 1 2 1 1 1 1 1 W 167.4 160.0 161.8 160.8 162.6 155.2 167.4 169.2 161.8 162.6 163.6 165.4 158.0 158.8 165.4 160.8 162.6 155.2 156.0 162.6 158.8 7 7 ⋅6⋅5⋅ 4⋅3 = = 21 5 2 ⋅ 3 ⋅ 4 ⋅ 5 7 7 ⋅6 = = 21 2 2 Ha a véletlenen múlik csak a tanulási idő, bármelyik konfiguráció előfordulási valószínűsége 1/21. A táblázat szerint 3 ol yan konfiguráció van, amelyben W akkora vagy nagyobb, mint a kísérleti eredmények szerinti (a W próbastatisztika akkora vagy szélsőségesebb értéket vesz föl, ha csak a véletlenen múlik a feladat megoldásának idő-szükséglete, vagyis ha a nullhipotézis igaz), ezek az 1., 7 és 8 sorok Vagyis a nullhipotézis érvényessége esetén 3 / 21 = 0.143 a
valószínűsége annak, hogy a W próbastatisztika akkora vagy szélsőségesebb értéket vegyen föl, mint a kísérleti eredmények szerinti. Ez meghaladja a választott 005-os határt, ill p=0143 3 P (W ≥ 167.4) = = 0.14 21 H 0 -t elfogadjuk, nem szignifikáns a kezelés hatása. Feladat: Hasonlítsuk össze a 3. pé lda adatain a randomizációs, a k is-és nagymintás MannWhitney-Wilcoxon-próbát, a szokásos és a rangokra végzett t-próbát! A próba relatív ereje Legyen n 1 és n 2 a szükséges minta-elemszám a k ét próbára adott α és β mellett. Az első próba másodikra vonatkozó relatív ereje n 2 és n 1 hányadosa (hányszor nagyobb minta kell a második próbához, mint az elsőhöz). Ha n 2 >n 1 , az első próba erősebb A próba aszimptotikus relatív ereje (asymptotic relative efficiency): n ARE = lim 2 n1 ∞ n 1 Az irodalom szerint a két összehasonlítandó sokaság normális eloszlása esetén a M annWhitney-Wilcoxon-próba majdnem olyan erős
mint a kétmintás t-próba (ARE= 0.95), nem normális eloszlás esetén erősebb. Tehát ha kétségünk van az eloszlást illetően, nem veszítünk sokat normális eloszlás esetén sem, ha ezt a próbát alkalmazzuk. A Wilcoxon-próba levezetése Vegyünk két csoportot, az első (például kezelt) csoport minta-elemszáma n 1 , a másiké n 2 , az összes N. A Wilcoxon-féle rang-összeg-próba próbastatisztikája: n1 W = ∑ Ri i =1 Az R i rang-számok (tehát hogy melyik elem melyik rangot kapja) valószínűségi változók, mert ha újra elvégeznénk a kísérleteket, nem ugyanezt a kiosztást kapnánk (pl. másutt lehetnének a kapcsolt rangok). Annak valószínűsége, hogy az i-edik elem a k rangot kapja, p k = P(R = k ) . Valamely elem rangszámának várható értéke: N E (R ) = ∑ Ri pi i =1 Varianciája: { } N Var (R ) = E [R − E (R )] = ∑ [Ri − E (R )] pi 2 2 i =1 A nullhipotézis: minden mintaelemhez bármely rang hozzárendelése egyformán
valószínű, tehát annak p i valószínűsége, hogy az i-edik elem az R i rangot kapja, 1/N, vagyis 1 H 0 : pi = i = 1,., N N N E (R H 0 ) = ∑ Ri pi = i =1 Var (R H 0 ) = 1 N 1 N N ∑R i =1 N i =R. 2 ∑ [Rk − E (R )] = k =1 1 N N ∑ (R k =1 − R) = 2 k 1 N 2 ∑ R k − NR 2 = A N k =1 A rangszámok (ha nincsenek kapcsolt rangok) egy 1 növekményű számtani sor elemei, amelyre k = N ( N + 1) 2 2 k = N ( N + 1)(2 N + 1) 6 N ∑R k =1 N ∑R k =1 E (R H 0 ) = R = Var (R H 0 ) = N +1 2 N 2 −1 1 N 2 ( N + 1)(2 N + 1) ( N + 1) − = =A ∑ R k − NR 2 = N k =1 6 4 12 2 W várható értéke a nullhipotézis érvényessége esetén: n1 n1 n ( N + 1) E (W H 0 ) = E ∑ Ri = ∑ E (Ri ) = n1 R = 1 2 i =1 i =1 W varianciája (nem független valószínűségi változók összegének varianciája): n1 n1 n1 n1 Var (W ) = Var ∑ Ri = ∑Var (Ri ) + ∑ ∑
Cov (Ri , R j ) i =1 j =1, j ≠ i i =1 i =1 A kovariancia, figyelembe véve, hogy P (Ri = k , R j = l ) = 1 (mivel R i N féle értéket N ( N − 1) vehet föl, az R j már csak N-1 félét, mivel j≠i): Cov (Ri , R j H 0 ) = = N N 1 1 [(Rk − R )(Rl − R )] = E [(Ri − R )(R J − R )] = ∑ ∑ N ( N − 1) N ( N − 1) k =1 l =1,l ≠ k N N 1 A N 2 ∑ (Rk − R )∑ (Rl − R ) − ∑ (Rk − R ) = − N −1 N (N − 1) k =1 l =1 k =1 és kihasználtuk, hogy N ∑ (R k =1 n1 Var (W H 0 ) = ∑ A − i =1 k − R)= 0 n (n − 1) nn n n ( N + 1) 1 n1 n1 A = n1 A − 1 1 A= 1 2 A= 1 2 ∑ ∑ N − 1 i =1 j =1, j ≠i N −1 N −1 12 Vigyázat, ez az összefüggés csak akkor használható, ha nincsenek kapcsolt rangok! Szokás használni a következő jelölést is: N s R2 = 1 (Rk − R )2 = ∑ N − 1 k =1 N Var (W H 0 ) = ∑R k =1 2 k − NR 2 N −1 = N A , ezzel N −1 n1 n2 nn A = 1 2 s R2 N −1 N Ez utóbbi
összefüggés kapcsolt rangok esetén is érvényes! 1.2 Egymintás Wilcoxon-próba (Wilcoxon signed rank test) Emlékeztetőül az egymintás t-próba: E ( x ) = µ 0 = x ref t0 = x ref : standard x − µ0 s n 4. példa (QS-9000, Measurement systems analysis, Reference manual, 3rd ed. 2002, p 87) Egy munka-etalon méretét nagyon pontos eszközzel meghatározták (x ref =6.00), majd ezt a munka-etalont 15-ször megmérték a minősítendő mérőeszközzel. Vizsgáljuk meg, hogy a mérőrendszer torzít-e! i xi 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 5.8 5.7 5.9 5.9 6.0 6.1 6.0 6.1 6.4 6.3 6.0 6.1 6.2 5.6 6.0 di = xi − x ref -0.2 -0.3 -0.1 -0.1 0.0 0.1 0.0 0.1 0.4 0.3 0.0 0.1 0.2 -0.4 0.0 R i xi − x ref ≠ 0 Ri′ Ri′ 6.5 8.5 3 3 -6.5 -8.5 -3 -3 42.25 72.25 9 9 3 3 9 3 10.5 8.5 3 10.5 8.5 9 110.25 72.25 3 6.5 10.5 3 6.5 -10.5 9 42.25 110.25 2 Az egymintás t-próba eredménye: Test of means against reference constant (value) (gagebias) Mean Std.Dv N
StdErr Reference t-value df p Variable Constant x 6.006667 0212020 15 0054743 6.000000 0121781 14 0904804 A Wilcoxon-próba nullhipotézise: H0 : µe = µ0 d i = xi − µ 0 próbastatisztikája: W= ∑ R′ i∈d1 〉 0 i ahol Ri′ az előjeles rang (signed rank). Lehet a pozitív különbségek helyett a negatív különbségekre is szummázni, ill. szokás a két szumma közül a kisebbik értékűt választani, esetünkben ez 31.5 Az Ri′ előjeles rangot úgy kapjuk, hogy a zérus különbségek figyelmen kívül hagyásával rangsoroljuk a különbségek abszolút értékét (ez adja a föntebbi táblázat R i oszlopát), majd e rangokhoz a különbség előjelét rendeljük. Nagy mintára a normális eloszlással közelítjük a W eloszlását: u= W − E (W ) Var (W ) u0 = ∑ R′ i i ∑ R′ i i 2 , de ebben a képletben már nemcsak a pozitív különbségekre szummázunk, hanem az összes előjeles rangokat összegezzük, ahol a különbség nem zérus.
A példában u 0 = ∑ R′ i i ∑ R′ i i 2 = 3 494.5 = 0.135 Az alkalmazás feltétele: • legalább sorrendi (ill. intervallum-) skála • szimmetrikus eloszlás (transzformáció segíthet, ha nem teljesül) • az adatok független valószínűségi változók egyetlen sokaságból Páros próba (Wilcoxon matched pairs) Emlékeztetőül a páros t-próba t0= d sd / n Akkor használható, ha a d különbségek eloszlása normális, konstans varianciával. Ha kevésbé szigorú feltételek mellett alkalmazható próbát szeretnénk, nem-paraméteres próbát kell végezni. (Ugyanaz, mint az egymintás próba, csak különbségekre végezzük) 5. példa (G. E P Box, W G Hunter, J S Hunter: Statistics for experimenters, J Wiley, 1978, p 97) boy 1 2 3 4 5 6 7 8 9 10 material A 13.2(L) 8.2(L) 10.9(R) 14.3(L) 10.7(R) 6.6(L) 9.5(L) 10.8(L) 8.8(R) 13.3(L) material B 14.0(R) 8.8(R) 11.2(L) 14.2(R) 11.8(L) 6.4(R) 9.8(R) 11.3(R) 9.3(L) 13.6(R) average difference B–A
difference d Ri′ 0.8 0.6 0.3 -0.1 1.1 -0.2 0.3 0.5 0.5 0.3 9 8 4 -1 10 -2 4 6.5 6.5 4 0.41 15 13 wear 11 9 7 material A material B 5 0 1 2 3 4 5 6 7 8 9 10 11 boys u0 = ∑R i i ′ 2 ∑ Ri′ = 49 382.5 = 2.505 i Az u-táblázatból p/2=0.0061, p=0012, a páros t-próbánál p=00085 volt az eredmény Matched pairs (összeillesztett párok) Mivel a páros próba sokkal érzékenyebb a kétmintásnál, használata előnyösebb, ha erre lehetőség van, pl. fogyókúránál mindenkire a saját testsúlyának-változását kell nézni Sajnos nem mindig lehet olyan kísérletet végezni, ahol mindenki önmaga kontrollja. Ilyenkor minél több szempontból ugyanolyan egyedeket keresnek, ezeket pároknak tekintjük. S. Siegel: Nonparametric statistics for the behavioral sciences, McGraw-Hill, 1956, p 63: “Wherever it is feasible, the method of using each subject as his own control is preferable to the pairing method. The reason for this is that we
are limited in our ability to match people by our ignorance of the relevant variables which determine behavior. Moreover, even when we do not know what variables are important and therefore should be controlled by the pairing process, our tools for measuring these variables may be faulty. A matching design is only as good as the experimenter’s ability to determine how to match the pairs, and this ability is frequently very limited.” 2. A binomiális eloszláson alapuló próbák 2.1 Binomiális próba 2.11 Hipotézisvizsgálat az előfordulások arányára, egy minta esetén Nem sorrendi, hanem névleges skálán vannak az adatok (pl.: gyógyult-nem gyógyult, fejírás) 6. példa (Conover: Practical nonparametric statistics, J. Wiley, 1999, p 96) Az előírás szerint π≤0.05 a selejtarány egy termék gyártásánál n=10 elemű mintát vesznek, k= 3 selejtes van a 10 között. Megvizsgálandó, hogy teljesül-e az előírás (egyoldali ellenhipotézis). H 0 : π ≤ π 0 =
0.05 H1: π > π 0 Kismintás (egzakt) eljárás A próbastatisztika a mintában talált selejtes elemek k 0 száma. p: annak a valószínűsége, hogy k a talált értéket (k 0 =3) vagy ennél nagyobbat vegyen fel: n P(k ) = π k (1 − π ) n − k k k 0 1 2 3 4 π=0.05 P(k 0 = k ) 0.59874 0.31512 0.07463 0.01048 0.00096 P(k 0 ≥ k ) 1.00000 0.40126 0.08614 0.01150 0.00103 π=0.04 P(k 0 = k ) 0.66483 0.27701 0.05194 0.00577 0.00042 P(k 0 ≥ k ) 1.00000 0.33517 0.05815 0.00621 0.00044 π=0.10 P(k 0 = k ) 0.34868 0.38742 0.19371 0.05740 0.01116 P(k 0 ≤ k ) 0.34868 0.73610 0.92981 0.98720 0.99837 P(k 0 ≥ 3 π = 0.05) = 00115 (ha a nullhipotézis egyenlőség-része igaz) Ha a nullhipotézis egyenlőtlenség-része igaz (pl. π=004), még kisebb valószínűséggel kapjuk a talált értéket vagy annál szélsőségesebbet. Elvetjük a H 0 -t. Kérdés: Milyen k 0 értéknél fogadnánk még el a nullhipotézist? Ez volt a binomiális
statisztikai próba. Itt az arányra vonatkozik a hipotézis Nagy minták esetében a kézi számolás nehézkes lenne, ezért normális eloszlással közelítik a binominális eloszlást. A közelítés akkor jogos, ha a kiszámítandó p valószínűségre: 1 n < p< n +1 n +1 Mivel ez itt nem teljesül, nem alkalmazhatnánk. Nagymintás (közelítő) eljárás Végezzük el a számolást normális eloszlással való közelítéssel! u0 = k − nπ 0 nπ (1 − π ) A sokaság π paramétere nem ismert. Kétféle közelítés szokásos Az elsőnél (Wald-statisztika) a paramétert a megfelelő mintabeli relatív gyakorisággal helyettesítjük ( π ≈ πˆ ). A másik módszer szerint (ún. score-statisztika) π-re a nullhipotézis szerinti értéket helyettesítjük ( π = π 0 ): u0 = u0 = k − nπ 0 nπ 0 (1 − π 0 ) k − nπ 0 nπ (1 − π ) = =u + 3 − 0.05 ⋅ 10 10 ⋅ 0.05 ⋅ (1 − 005) = 3.627 nπ − nπ 0 nπ (1 − π ) Ha az ellenhipotézis
igaz ( π > π 0 ), a második tag pozitív, a próbastatisztika u-hoz képest fölfelé tolódik el, vagyis azt kell kérdeznünk (p), hogy a nullhipotézis (egyenlőség részének) teljesülése esetén milyen valószínűséggel kapnánk a talált u 0 értéket vagy annál nagyobbat. Az u-eloszlás táblázatából p≈0.00014 Így nagyon más eredményt kapunk (pontos számolással 0.0115 adódott), tehát itt tényleg nem használható a n ormális eloszlással való közelítés. Ebből természetesen nem ítélhető meg, hogy azért rossz a k özelítés, mert a m inta nem elég nagy, vagy pedig azért, mert p kicsi, 1 n mindenesetre nagy mintára kis p értékkel is teljesíthető az feltétel. < p< n +1 n +1 Ha a folytonossági korrekciót is alkalmaznánk, még nagyobb lenne az eltérés: u0 = k + 0.5 − nπ 0 nπ 0 (1 − π 0 ) = 3 + 0.5 − 005 ⋅ 10 10 ⋅ 0.05 ⋅ (1 − 005) = 4.353 Az u-eloszlás táblázatából p≈0.000007 A binomiális próba
alkalmazásának feltételei (tulajdonképpen a binomiális eloszlás érvényességének feltételei): • Az n mintaelem egymástól független • Minden mintaelemre azonos a π valószínűség (a példában az, hogy selejtesnek találjuk) 2.12 A szükséges minta-elemszám számítása Az előző példában a nullhipotézist elég nagy biztonsággal utasítottuk el. Ha a 10 elem közül nem 3, ha nem 1 va gy 2 lett volna selejtes, a nullhipotézist elfogadtuk volna. Előfordulhat, hogy a valóságban a selejtarány nem a nullhipotézis szerinti 0.05 ( vagy kisebb), hanem pl 0.1 7. példa A föntebbi táblázat szerint (ha az előírt α szignifikanciaszint 0.05) pontos számítással akkor fogadjuk el a nullhipotézist, ha k ≤ 2 . Ekkor α nem is pontosan 005, hanem 00115 Mi a valószínűsége annak, hogy a nullhipotézist elfogadjuk, ha a valóságban a selejtarány 0.1? A táblázat utolsó oszlopa szerint a k ≤ 2 eset előfordulásának valószínűsége 0.9298 Mekkora
minta kellene ahhoz, hogy 90% biztonsággal kimutassuk (β= 0.1), ha π=01? Végezzük a számítást a nagymintás módszerrel! A próbastatisztika kifejezése (az utolsó egyenlőségnél a paraméteres próbáknál megismert módon két részre bontva): u0 = k 0 − nπ 0 nπ 0 (1 − π 0 ) =u k0 k0 −π 0 −π π −π 0 π (1 − π ) n n + = = = π 0 (1 − π 0 ) π 0 (1 − π 0 ) π (1 − π ) π 0 (1 − π 0 ) n n n π −π0 π (1 − π ) + π 0 (1 − π 0 ) π 0 (1 − π 0 ) n Akkor fogadjuk el a nullhipotézist, ha u 0 < uα (egyoldali fölső határ esetén). Az elsőfajú hiba valószínűsége: P(u 0 ≥ uα H 0 ) = α A másodfajú hiba valószínűsége (egy konkrét π = π 1 ellenhipotézisre): π1 −π 0 π 1 (1 − π 1 ) β = P(u 0 < uα H1 ) = P u + < uα = π 0 (1 − π 0 ) π 0 (1 − π 0 ) n π 0 (1 − π 0 ) π1 −π 0 = P u < uα − π 1 (1 − π 1 )
π 1 (1 − π 1 ) n Az egyenlőtlenség-jel jobb oldalán lévő kifejezést nevezhetjük u1− β = −u β -nak: uα π 0 (1 − π 0 ) π1 −π 0 − = u1− β = −u β π 1 (1 − π 1 ) π 1 (1 − π 1 ) n A szükséges minta-elemszám átrendezéssel: 2 π 1 (1 − π 1 ) uα + u β π 0 (1 − π 0 ) π 0 (1 − π 0 ) n= (π 1 − π 0 )2 Példánkban α =0.05, β=01, π 0 =005, π 1 =01, uα = 1645 , u β = 1285 2 2 π 1 (1 − π 1 ) 0.05 ⋅ (1 − 005) uα + u β 1.645 + 1285 ⋅ ( ) π 1 π − ( ) ⋅ − 0 . 1 1 0 . 1 0 0 ⋅ 0.05 ⋅ (1 − 005) = 1263 ( ) − = n= π 1 π 0 0 2 2 (π 1 − π 0 ) (0.1 − 005) Tehát 127 elemű mintát kell vennünk a sokaságból, ha 90% biztonsággal észre akarjuk venni, hogy a selejtarány nem 0.05, hanem 01 2.13 Konfidencia-intervallum a binomiális eloszlás π paraméterére Nagy mintából a normális
eloszlással való közelítés alapján számolhatunk konfidenciaintervallumot π-re: P − uα 2 < < uα 2 = 1 − α nπ (1 − π ) k 0 − nπ Bevezetve, hogy a négyzetgyökjel alatt π ≈ πˆ = k0 (Wald) n k k k k k k P 0 − uα 2 02 1 − 0 < π < 0 + uα 2 02 1 − 0 = 1 − α n n n n n n P(a ≤ π ≤ b ) = 1 − α 8. példa Adjunk 95%-os konfidencia-intervallumot a nagymintás eljárás szerint a 6. példa mintavételi eredményei alapján (egy termék gyártásánál. n=10 elemű mintát vesznek, k=3 selejtes van a 10 között.) a sokaságbeli selejtarányra! k k k k k k P 0 − uα 2 02 1 − 0 < π < 0 + uα 2 02 1 − 0 = 1 − α n n n n n n 3 3 3 3 3 3 1 1 . 96 P − 1.96 ⋅ π 1 < < − ⋅ − − = 0.95 10
10 10 2 10 10 2 10 P(0.3 − 0284 < π < 03 + 0284) = 095 P(0.016 < π < 0584) = 095 Igen széles a konfidencia-intervallum, mert nagyon kicsi a minta. Ha a mintabeli gyakoriság nulla (nincs előfordulás a mintában), az előbbi összefüggéssel számított konfidencia-intervallum (0, 0), ami nyilvánvalóan rossz. k A Wald-féle helyettesítés ( π ≈ πˆ = 0 ) helyett tartsuk meg a nevezőben is az ismeretlen π n értéket, így (k − nπ )2 ≤ uα2 2 = 1 − α P 0 nπ (1 − π ) Az egyenlőségből másodfokú egyenletet kapunk π-re, megoldva: n n + uα2 2 π = πˆ 1 uα2 2 + 2 n + uα2 2 ± uα 2 nπˆ (1 − πˆ ) (n + u ) 2 α 2 2 + ( uα2 2 4 ⋅ n + uα2 2 ) 2 9. példa Adjunk 95%-os konfidencia-intervallumot a nagymintás eljárás szerint a másodfokú összefüggés fölhasználásával a 6. pé lda mintavételi
eredményei alapján (egy termék gyártásánál. n=10 elemű mintát vesznek, k= 3 selejtes van a 1 0 között) a s okaságbeli selejtarányra! 2 10 1 1.96 ± 1.96 ⋅ π = 0.3 ⋅ + ⋅ 2 2 10 + 1.96 2 10 + 196 10 ⋅ 0.3 ⋅ 07 (10 + 1.96 ) 2 2 + ( 1.96 2 4 ⋅ 10 + 1.96 2 ) 2 = (0.108, 0603) 10. példa (A. Agresti: Categorical data analysis, J Wiley, 2002, p 16) Hogy a f iatalok közötti vegetáriánusok arányát becsüljék, egy 25 fős tankört megkérdeztek, hogy ki tekinti magát vegetáriánusnak. Senki nem jelentkezett Adjunk 95%-os konfidenciaintervallumot a sokaságbeli arányra! Csak a másodfokú összefüggés jöhet szóba: 2 25 1 1.96 ± uα 2 + ⋅ 2 2 25 + 1.96 2 25 + 196 π = 0⋅ = 0.069 ± 0069 = (0, 0138) nπˆ (1 − πˆ ) (25 + 1.96 ) 2 2 + ( 1.96 2 4 ⋅ 25 + 1.96 2 ) 2 = Kis mintára pontosan számolhatunk. n n n
−i = ∑ π Li (1 − π L ) 2 i =k i Az alsó határra: P(π ≤ a ) = α A fölső határra: P(π ≥ b ) = α k n n −i = ∑ π Ui (1 − π U ) 2 i =0 i Ezek az egyenletek oldandók meg a π L alsó és π U fölső határra. Az egyenletek nem oldhatók meg algebrailag, csak numerikusan. 10 8 6 4 0.66 0.07 2 0 0.0 0.2 0.4 0.6 p 2.14 Medián-próba A binomiális próba speciális esete, π = 0.5 11. példa 0.8 ka kf Egy tanteremben egy tárgyból két (A és B) csoportban írnak zárthelyit, a csoportokba való kijelölés véletlenszerűen történt. 9 dolgozat beadása után az oktató aggódni kezd, hogy egyforma nehézségű volt-e a k ét feladatsor, mert az A csoportból addig csak 3-an, a B csoportból pedig 6-an készültek el. Jogos-e az aggodalom? Legyen π annak a valószínűsége, hogy az A feladatsorral végez valaki gyorsabban. H 0 : π ≥ 0.5 H 1 : π < 0.5 A tanár aggodalma (research
question) az ellenhipotézisben fogalmazódik meg. Legyen a k 0 próbastatisztika az A csoportból beadott dolgozatok száma. Mi a valószínűsége annak, hogy a nullhipotézis (egyenlőség-részének) érvényessége esetén a t apasztalt vagy annál is szélsőségesebb eredményt kapjunk? n P(k ) = π k (1 − π ) n − k k k 0 1 2 3 4 5 6 7 8 9 P(k ) 0.0020 0.0176 0.0703 0.1641 0.2461 0.2461 0.1641 0.0703 0.0176 0.0020 π =0.5 P(k 0 ≤ k ) 0.0020 0.0195 0.0898 0.2539 0.5000 0.7461 0.9102 0.9805 0.9980 1.0000 P(k ) 0.0101 0.0605 0.1612 0.2508 0.2508 0.1672 0.0743 0.0212 0.0035 0.0003 π =0.4 P(k 0 ≤ k ) 0.0101 0.0705 0.2318 0.4826 0.7334 0.9006 0.9750 0.9962 0.9997 1.0000 P(k ) 0.0003 0.0035 0.0212 0.0743 0.1672 0.2508 0.2508 0.1612 0.0605 0.0101 π =0.6 P(k 0 ≤ k ) 0.0003 0.0038 0.0250 0.0994 0.2666 0.5174 0.7682 0.9295 0.9899 1.0000 P(k 0 ≤ 3 π = 0.5) = 0254 Ha a nullhipotézisnek az egyenlőtlenség-része az igaz (az A feladatsor
könnyebb, π > 0.5 ), a tapasztalt (k=k 0 =3) vagy annál is szélsőségesebb eredmény valószínűsége kisebb ( π = 0.6 -re 0.099) Ha az elsőfajú hiba megengedett valószínűsége 0.05, akkor utasítjuk el a nullhipotézist, ha az A csoportból legföljebb egy hallgató adta be az első 9-ben a dolgozatát (mert legföljebb kettőre az előfordulás valószínűsége már 0.0898) Ha ez az elfogadási tartomány, a másodfajú hiba valószínűsége, vagyis hogy elfogadjuk a nullhipotézist (mert legalább kettő volt A csoportbeli), pedig nem igaz, π = 0.4 -hez 1-00705=09295 Kérdés: Mekkora az elsőfajú hiba elkövetésének valószínűsége π = 0.6 esetén? π milyen értékénél maximális α értéke az elfogadási tartomány határán? Beugrató kérdés: Mekkora a másodfajú hiba elkövetésének valószínűsége π = 0.6 esetén? Végezzük el a számolást normális eloszlással való közelítéssel: u0 = 3 + 0.5 − 9 ⋅ 05 k + 0.5 − nπ = =
−0.66 9 ⋅ 0.5 ⋅ (1 − 05) nπ (1 − π ) (Képzeljük el a normális eloszlás sűrűségfüggvényében annak valószínűségét, hogy k ≤ 3 !) Az u-eloszlás táblázatából p≈0.255, tehát itt jó a közelítés Kérdés: milyen p érték kiszámításához használhatnánk a normális eloszlással való közelítést? A próba általánosítható π = 0.5 -től eltérő esetekre, ilyenkor nem medián, hanem kvantilispróbának nevezik, mert a h ipotézis nem a s okaság mediánjára, hanem valamely kvantilisére vonatkozik (pl. azt kérdezzük, hogy hihető-e, hogy a lakosság 90%-ának éves jövedelme nem haladja meg a 3 millió Ft-ot). 2.15 Előjel-próba A medián-próba (és így a binomiális próba) egy változata, páros mintákra. Alkalmazási feltételek: • A párok (az x i , y i kétdimenziós valószínűségi változók, valószínűségi vektor-változók) kölcsönösen függetlenek egymástól • A párokon belüli különbség legalább sorrendi
skálán értelmezhető, (ha xi > yi , +; ha • xi < yi , –; ha xi = yi , 0) A párok konzisztensek: ha P(+ ) > P(− ) egy párra, akkor ez igaz mindegyik párra, másképp fogalmazva egyazon sokaságból vannak A k 0 próbastatisztika a + párok száma A hipotézis-pár kétoldali változata: H 0 : P(+ ) = P(− ) H 1 : P(+ ) ≠ P(− ) 12. példa (G. E P Box, W G Hunter, J S Hunter: Statistics for experimenters, J Wiley, 1978, p 97) boy 1 2 3 4 5 material A 13.2(L) 8.2(L) 10.9(R) 14.3(L) 10.7(R) material B 14.0(R) 8.8(R) 11.2(L) 14.2(R) 11.8(L) A-B előjel -0.8 -0.6 -0.3 0.1 -1.1 + - 6.6(L) 9.5(L) 10.8(L) 8.8(R) 13.3(L) 6 7 8 9 10 6.4(R) 9.8(R) 11.3(R) 9.3(L) 13.6(R) 0.2 -0.3 -0.5 -0.5 -0.3 + - k0 = 2 10 10 ⋅ 9 ⋅ 0.5 2 ⋅ 058 = ⋅ 0.510 = 00439 1⋅ 2 2 10 10 10 n P(k ≤ k 0 ) = ∑ π k (1 − π ) n −k = + + ⋅ 0.510 =
00546 k =0 k 0 1 2 k0 Ezt kell kétszer venni, minthogy kétoldali az ellenhipotézis: p = 2 ⋅ 0.0546 = 01092 A következő táblázatban összehasonlítjuk az ugyanazon nullhipotézisre végzett háromféle próbánál kapott p értékeket: p 0.109 0.012 0.0085 próba előjel-próba Wilcoxon-próba páros t-próba A Wilcoxon-próbánál p= 0.012, a páros t-próbánál p=00085 volt az eredmény Az előjelpróba sokkal gyengébb, mint a Wilcoxon-próba, kevesebb információt használ föl (nem vesszük figyelembe, hogy mennyivel kopik jobban). A páros t-próba hasznosítja a legtöbb információt (a különbség mértékén fölül annak eloszlását is), ennek köszönhetően a legerősebb, vagyis vele a legnagyobb a kimutatási biztonság adott minta-elemszámhoz. Jogos lenne-e a normális eloszlással való közelítés? 1 n , ahol p a közelítéssel kiszámítandó valószínűség (itt, ha α=0.05, p≈0025 az < p< n +1 n +1
érdekes tartomány). u0 = 2 + 0.5 − 10 ⋅ 05 10 ⋅ 0.5 2 = −1.58 Az u-táblázatból F (− 1.58) = 1 − 094295 = 0057 , p = 2 ⋅ 0057 = 0114 2.2 A binomiális eloszláson alapuló kétmintás próbák (két arány összehasonlítása, 2x2 táblázat, homogenitásvizsgálat) Ezeknél a próbáknál kétféle kezelést, kétféle gyógyszert stb. hasonlítunk össze, és a 2x2-es táblázatban a sorok összege (vagy az oszlopok összege) adott. 2.21 Nagymintás próba két arány összehasonlítására 13. példa (M.J Campbell, D Manchin, Medical Statistics A commonsense approach, 2nd edition, J Wiley & Sons, 1993, p. 71) A páciensek kétféle gyógyszert kaptak, kisorsolva, hogy ki melyiket. Kettős vak vizsgálatot végeztek: az orvos és a páciens sem tudja, hogy ki melyik gyógyszert kapja. A kérdés, hogy van-e a két gyógyszer között különbség a tekintetben, hogy egyforma arányban gyógyultak-e tőlük a betegek. Az eredmények: Gyógyszer típusa A
B Σ Gyógyult 23 18 41 Nem gyógyult 7 13 20 Σ 30 31 61 Jelölje π 1 annak valószínűségét, hogy a beteg, aki az A gyógyszert kapja, meggyógyul, π 2 annak valószínűségét, hogy a beteg, aki az B gyógyszert kapja, meggyógyul. A hipotézis-pár: H0 :π1 = π 2 H1 : π 1 ≠ π 2 (kétoldali) Az A és B gyógyszernél a g yógyulás relatív gyakorisága külön-külön binomiális eloszlást követ. A gyógyulás relatív gyakorisága a valószínűség (az eloszlás π paraméterének) becslése: πˆ1 = 23 18 = 0.7667 , πˆ 2 = = 0.5806 30 31 Elég nagy minták esetén a binomiális eloszlás jól közelíthető normális eloszlással. Ezért ueloszlása van a következő kifejezésnek: u= πˆ1 − πˆ 2 − (π 1 − π 2 ) πˆ1 − πˆ 2 − (π 1 − π 2 ) = Var (πˆ1 − πˆ 2 ) Var (πˆ1 ) + Var (πˆ 2 ) A nullhipotézisnek a számlálóba való behelyettesítésével kapjuk a próbastatisztikát: u0 = πˆ1 − πˆ 2 Var (πˆ1 ) + Var (πˆ
2 ) Var (πˆ ) = π (1 − π ) n Var (πˆ1 ) + Var (πˆ 2 ) = π 1 (1 − π 1 ) π 2 (1 − π 2 ) + n1 n2 Behelyettesítve: u0 = πˆ1 − πˆ 2 π 1 (1 − π 1 ) π 2 (1 − π 2 ) + n1 n2 A folytonossági korrekcióval a formula a következő: 1 1 1 u0 = πˆ1 − πˆ 2 − + 2 n1 n2 π 1 (1 − π 1 ) n1 + π 2 (1 − π 2 ) n2 A két sokaság π 1 ill. π 2 paramétere nem ismert Kétféle közelítés szokásos Az elsőnél (Wald-statisztika) a két paramétert a megfelelő mintabeli relatív gyakorisággal helyettesítjük: π 2 ≈ πˆ 2 π 1 ≈ πˆ1 u0 = πˆ1 = 0.7667 , πˆ 2 = 05806 πˆ1 − πˆ 2 πˆ1 (1 − πˆ1 ) πˆ 2 (1 − πˆ 2 ) n1 + ill. a folytonossági korrekcióval n2 1 1 1 πˆ1 − πˆ 2 − + 2 n1 n 2 u0 = πˆ1 (1 − πˆ1 ) πˆ 2 (1 − πˆ 2 ) n1 u0 = + n2 0.7667 − 05806 0.7667 ⋅ (1 − 07667) 05806 ⋅ (1 − 05806) + 30 31 = 1.583
Az u-eloszlás táblázatából kikeresve (ill. statisztikai programmal pontosabban számolva) 1 − F (1.583) = 1 − 9433 = 0057 , tehát p = 2 ⋅ 0057 = 0114 (A folytonossági korrekcióval u0 = 1 1 1 0.7667 − 05806 − + 2 30 31 = 1.304 ) 0.7667 ⋅ (1 − 07667) 05806 ⋅ (1 − 05806) + 30 31 A másik módszer szerint (ún. score-statisztika) a nullhipotézist (π 1 =π 2 ) is figyelembe vesszük, tehát πˆ = n1`πˆ1 + n2πˆ 2 n1 + n2 Ezzel 1 1 πˆ1 − πˆ 2 u0 = 1 1 + n1 n2 1 1 + n1 n2 πˆ (1 − πˆ ) πˆ ≈ u0 = 1 πˆ1 − πˆ 2 − + 2 n1 n2 ill. a folytonossági korrekcióval u 0 = πˆ (1 − πˆ ) 23 + 18 41 = = 0.672 61 61 23 18 − 30 31 1 1 0.672 ⋅ (1 − 0672) ⋅ + 30 31 = 1.547 Az u-eloszlás táblázatából kikeresve (ill. statisztikai programmal pontosabban számolva) 1 − F (1.547 ) = 1 −
0939 = 0061 , tehát p = 2 ⋅ 0061 = 0122 H 0 -t elfogadjuk, tehát A és B gyógyszer hatása között nem mutatható ki különbség. (A folytonossági korrekcióval u0 = 23 18 1 1 1 − − + 30 31 2 30 31 = 1.274 ) 1 1 0.672 ⋅ (1 − 0672) ⋅ + 30 31 A nullhipotézis szerint a két binomiális eloszlás (az A és a B gyógyszert kapottak gyógyulása) azonos, ezért a próbát homogenitás-vizsgálatnak is nevezik. A későbbiekben használni fogjuk, hogy a standard normális eloszlású valószínűségi változó négyzete ν= 1 szabadsági fokú khi-négyzet eloszlású valószínűségi változó u 2 = χ 2 , tehát a következő próbastatisztika is használható: χ 02 = u 02 = 1.547 2 = 2393 A χ2-eloszlás táblázatából kikeresve (ill. statisztikai programmal pontosabban számolva) p=0.122, tehát ugyanazt a választ kapjuk 14. példa Oldjuk meg az előző példát azzal a változtatással, hogy a kérdés az, hogy az
A (új) gyógyszer jobb-e a B (elfogadott jelenlegi) gyógyszernél, vagyis egyoldali legyen az ellenhipotézis: H0 :π1 ≤ π 2 H1 : π 1 > π 2 Az előbbi példából u0 = 23 18 − 30 31 1 1 0.672 ⋅ (1 − 0672) ⋅ + 30 31 = 1.547 Ha az ellenhipotézis igaz ( π 1 > π 2 ), a próbastatisztika jobbra tolódik el az u-eloszláshoz képest, ezért az u-eloszlás táblázatából most egyoldali (fölső) határhoz kell kiolvasnunk az eloszlásfüggvény értékét, és nem kell kettővel szorozni, hogy p-t kapjunk: p = 1 − F (1.547 ) = 1 − 0939 = 0061 Ezt a nullhipotézist is el kell fogadnunk. Ha a folytonossági korrekcióval élünk, u0 = 23 18 0.5 05 − − + 30 31 30 31 1 1 0.672 ⋅ (1 − 0672) ⋅ + 30 31 = 1.274 p = 1 − F (1.274) = 1 − 0899 = 0101 Kérdés: ha a f eladat úgy szólna, hogy vizsgáljuk meg, a B gyógyszer jobb-e, mint az A, milyen u határt kellene venni?
2.22 A szükséges minta-elemszám meghatározása Legyen a vizsgálandó hipotézis-pár változatlanul H0 :π1 ≤ π 2 H1 : π 1 > π 2 A feladat először a másodfajú hiba valószínűségének kifejezése. Ehhez a próbastatisztika kifejezését alakítsuk át úgy, hogy az első tag biztosan u-eloszlású legyen, a második pedig a nullhipotézistől való eltérést mutassa: πˆ1 − πˆ 2 πˆ1 − πˆ 2 − (π 1 − π 2 ) π1 −π 2 = + π 1 (1 − π 1 ) π 2 (1 − π 2 ) π 1 (1 − π 1 ) π 2 (1 − π 2 ) π 1 (1 − π 1 ) π 2 (1 − π 2 ) u0 = + n n n + n n + n Akkor fogadjuk el a nullhipotézist, ha u 0 < uα (egyoldali fölső határ esetén). Az elsőfajú hiba valószínűsége: P(u 0 ≥ uα H 0 ) = α ( ) π π − π1 −π 2 1 2 H1 = P (u < −u ) β = P u + < uα H1 = P u < uα − β π 1 (1 − π 2 ) π 2 (1 − π 2 ) π 2 (1 − π 2 ) π 2 (1 − π 2 )
+ + n n n n (π 1 − π 2 )H1 u β = uα − π 2 (1 − π 2 ) π 1 (1 − π 1 ) + n n n= (u α + uβ ) 2 (π 1 − π 2 )2H [π 1 (1 − π 1 ) + π 2 (1 − π 2 )]H 1 1 Ha a folytonossági korrekciót alkalmazni kívánjuk, az u β kifejezésénél a számlálóban is megjelenik n, ezért másodfokú összefüggést kapnánk. 15. példa Számítsuk ki az ahhoz szükséges minta-elemszámot ( n1 = n2 = n ), hogy 80% biztonsággal kimutassuk, ha az A gyógyszerről a B gyógyszerre áttérve a gyógyulás valószínűsége 0.2-ről 0.3-re nő, amennyiben a próba α szignifikancia-szintje 005 (egyoldali)! α =0.05, β=02, πA =02, πB =03, uα = 1645 , u β = 084 2 ( 1.645 + 084 ) [0.2 ⋅ (1 − 02) + 03 ⋅ (1 − 03)] = 2284 n= (0.2 − 03)2 A Statistica Power Analysis eredményei: πA 0.2 πB 0.3 n (korr. nélkül) 231 n (korrekcióval) 251 0.3 0.3 0.1 0.4 0.4 0.4 0.5 0.3 0.6 0.3 281 71 49 77 281 300 83 58 86 300 A
táblázatból látható, hogy nagyobb javulás (vagy romlás) kimutatásához kevesebb kísérlet is elég. Minél kisebb értéket kell ugyanannyival javítani, annál kevesebb kísérlet kell. (A placebóval való kísérletezést egyre többször tiltják, és helyettük ismert szereket kell használni, ezért több kísérlet kell.) 2.23 Kismintás (egzakt) eljárás A próba a normális eloszlással való közelítés nélkül is megoldható, de csak kis minták esetén. 16. példa A szokásos 2x2-es táblázat: Gyógyszer típusa A B Σ Gyógyult 1 3 4 Nem gyógyult 9 1 10 Σ 10 4 14 Az adatokból úgy tűnik, hogy a B gyógyszertől nagyobb arányban gyógyulnak a betegek. A kérdés az, hogy ez csak a véletlen műve-e? Általánosabb jelölésekkel: Gyógyszer típusa A B Σ Gyógyult a c c1 Nem gyógyult b d c2 Σ r1 r2 N Összesen 14-en vesznek részt a vizsgálatban. π 1 : annak a valószínűsége, hogy az A gyógyszert szedő csoportból valaki meggyógyul π 2
: annak a valószínűsége, hogy a B gyógyszert szedő csoportból valaki meggyógyul A szakmai kérdés az, hogy a B gyógyszer hatásosabb-e. A hipotézis-pár: H0 :π1 ≥ π 2 H1 : π 1 < π 2 A nullhipotézis egyenlőség-része szerint a gyógyulás valószínűsége független attól, hogy a páciens melyik gyógyszert kapja, vagyis a k ét binomiális eloszlás (az A és a B gyógyszert kapottaké) egyforma. A vizsgálatot ezért nevezik homogenitás-vizsgálatnak is Annak valószínűsége, hogy r 1 közül (akik az A gyógyszert szedik) a gyógyuljon meg: r a r −a P(x1 = a ) = 1 π 1 ⋅ (1 − π 1 ) 1 a Annak valószínűsége, hogy r 2 közül (akik a B gyógyszert szedik) c gyógyuljon meg: r c r −c P( x2 = c ) = 2 ⋅ π 2 ⋅ (1 − π 2 ) 2 c A két esemény független egymástól, ezért annak valószínűsége, hogy éppen azt a kísérleti eredményt kapjuk, amit kaptunk, ha a nullhipotézis
egyenlőség-része igaz (π 1 =π 2 =π): r r r r −a r r −c r + r − a −c P (x1 = a; x2 = b H 0 ) = 1 π a (1 − π ) 1 2 π c (1 − π ) 2 = 1 2 π a +c (1 − π ) 1 2 a c c a A hipotézisvizsgálat eredményeképpen kiszámítandó p érték annak valószínűsége, hogy a kapott vagy annál is szélsőségesebb eredmény adódjék. Ezek a konfigurációk a következők: 1 3 9 1 0 3 10 1 1 4 9 0 0 4 10 0 Ha H 0 (egyenlőség része) igaz, akkor mi a valószínűsége, hogy ez, vagy ennél szélsőségesebb kép álljon elő: r2 a r r r +r − x − x p = P(x1 ≤ a, x2 ≥ c ) = ∑ ∑ 1 2 π x1 − x2 (1 − π ) 1 2 1 2 x1 = 0 x2 = c x1 x 2 Ahhoz, hogy a képlettel számolni tudjunk, nem elég a nullhipotézis (egyenlőség része) igazságának feltételezése, hanem π számértékére is
szükség van. Keressük azt a π-t, ami mellett p maximális. Ez az érték π=03-hez tartozik a r észletes számolást bemutató táblázat szerint. p = P (1,9,3,1) + P (0,10,3,1) + P (1,9,4,0) + P (0,10,4,0) = = 0.0002288 + 00009806 + 00021355 + 00091522 = 001249515 Ha H 0 igaz, akkor annak a valószínűsége, hogy a talált konfiguráció vagy ennél szélsőségesebb jöjjön ki: p=0.0125 A nagymintás (közelítő) eljárással: πˆ = u0 = a + c 1+ 3 = = 0.2857 N 14 πˆ1 − πˆ 2 1 1 πˆ (1 − πˆ ) + n1 n2 = 1 3 − 10 4 1 1 0.2857 ⋅ (1 − 02857 ) ⋅ + 10 4 = −2.43 Ha H 1 igaz, a próbastatisztika az u-eloszláshoz képest balra tolódik el, vagyis p annak valószínűsége, hogy u<-2.43 adódjék, amennyiben H 0 igaz: p=0.0075 Yates v. folytonossági korrekcióval 1 1 1 3 1 − + 0.5 ⋅ + 10 4 10 1 0.2857 ⋅ (1 − 02857 ) ⋅ + 10 πˆ 1 − πˆ
2 + + n1 n 2 = u0 = 1 1 πˆ (1 − πˆ ) + n1 n 2 1 4 1 4 = −1.78 p=0.038 A pontos (kismintás) eljárással p=0.0125 adódott Kérdés: hogyan kellene a kismintás módszerrel számolni, ha a szakmai kérdés az lenne, hogy B hatásosabb-e, mint A? 17. példa Nézzünk két még kisebb táblázatot, amelyekre a később ismertetendő módszerekkel való összehasonlításhoz szükség lesz: Σ 3 1 4 Σ 4 4 8 1 3 4 Itt a vizsgálandó (a talált és annál szélsőségesebb) konfigurációk a következők: 3 1 1 3 4 1 0 3 3 0 1 4 4 0 0 4 5 0 0 5 A π azon értéke, ami mellett p maximális, itt 0.5, p=00977 Σ 4 1 4 1 5 1 4 Σ 5 5 10 1 4 5 5 1 0 4 4 0 1 5 A π azon értéke, ami mellett p maximális, itt 0.5, p=00352 a 0 1 0 1 b 10 9 10 9 c 4 4 3 3 d 0 0 1 1 r1 10 10 10 10 r2 4 4 4 4 c1 4 5 3 4 c2 10 9 11 10 N 14 14 14 14 π=0.9 π=0.8 π=0.7 π=0.6 π=0.5 π=0.4 π=0.3 π=0.2
π=0.1 a 3 4 3 4 b 1 0 1 0 c 1 1 0 0 d 3 3 4 4 r1 4 4 4 4 r2 4 4 4 4 c1 4 4 4 4 c2 4 4 4 4 N 8 8 8 8 π=0.9 π=0.8 π=0.7 π=0.6 π=0.5 π=0.4 π=0.3 π=0.2 π=0.1 a 4 4 5 5 b 1 1 0 0 c 5 1 1 0 d 0 4 4 5 r1 5 5 5 5 r2 5 5 5 5 c1 9 5 6 5 c2 1 5 4 5 N 10 10 10 10 π=0.9 0.00000000007 0.00000000590 0.00000000003 0.00000000262 0.00000000862 0.00104976000 0.00236196000 0.00002916000 0.00006561000 0.00350649000 0.0001476 0.0002657 0.0000033 0.0000059 0.0004225 0.00000004 0.00000168 0.00000004 0.00000168 0.00000344 0.01048576 0.01048576 0.00065536 0.00065536 0.02228224 π=0.8 0.00262144 0.00209715 0.00013107 0.00010486 0.00495452 0.00000142 0.00003308 0.00000243 0.00005671 0.00009364 0.03111696 0.01815156 0.00333396 0.00194481 0.05454729 π=0.7 0.010210 0.004765 0.000875 0.000408 0.016259 π=0.6 0.000014 0.000204 0.000036 0.000544 0.000797 0.053084 0.019907 0.008847 0.003318 0.085156 0.01991 0.00597 0.00265 0.00080 0.02933 π=0.5 0.02441 0.00488
0.00488 0.00098 0.03516 0.000061 0.000610 0.000244 0.002441 0.003357 0.062500 0.015625 0.015625 0.003906 0.097656 π=0.4 0.01991 0.00265 0.00597 0.00080 0.02933 0.000155 0.001032 0.000929 0.006192 0.008307 0.053084 0.008847 0.019907 0.003318 0.085156 π=0.3 0.0102103 0.0008752 0.0047648 0.0004084 0.0162586 0.0002288 0.0009806 0.0021355 0.0091522 0.0124971 0.0311170 0.0033340 0.0181516 0.0019448 0.0545473 π=0.2 0.0026214 0.0001311 0.0020972 0.0001049 0.0049545 0.00017180 0.00042950 0.00274878 0.00687195 0.01022202 0.01048576 0.00065536 0.01048576 0.00065536 0.02228224 π=0.1 0.00003486784 0.00003874205 0.00125524238 0.00139471376 0.00272356604 0.00104976000 0.00002916000 0.00236196000 0.00006561000 0.00350649000 0.00014762250 0.00000328050 0.00026572050 0.00000590490 0.00042252840 2.24 A hatás nagyságának becslése Az egy mintára végzett binomiális próbához gyűjtött adatokból (pl. a tételből 10 elemű mintát veszünk) nemcsak hipotézisvizsgálatot
lehetett végezni (pl. H 0 : π ≤ π 0 = 005 ), hanem becslést is lehetett adni a s okaság π paraméterére (pont- és intervallum-becslést). Ugyanígy a két binomiális eloszlás (pl. A és B gyógyszerrel kezeltek) összehasonlítására is indokolt a hipotézisvizsgálaton túl paraméterbecslést is végezni. Szakmailag érdekes lehet, hogy mennyivel nő meg a gyógyulás esélye, ha az egyik gyógyszer helyett a másikat alkalmazzuk, de azt is lehet kérdezni, hogy hányszorosára nő meg ez az esély. Utóbbi az ún. kockázati arány (RR= Risk Ratio) RR = π1 π2 Becslése RR = πˆ1 πˆ 2 Behelyettesítve, hogy πˆ1 = br b c és πˆ 2 = , RR = 2 cr1 r1 r2 A becsült kockázati arány logaritmusának varianciája (mivel a két minta független): Var (ln RR ) = Var (ln πˆ1 − ln πˆ 2 ) = Var (ln πˆ1 ) + Var (ln πˆ 2 ) A hibaterjedési törvény analógiájára egy x valószínűségi változó f ( x ) függvényének varianciája általánosan Var[ f (x
)] ≈ [ f ′( x )] Var ( x ) 2 d (ln πˆ1 ) 1 1 πˆ (1 − πˆ1 ) 1 − πˆ1 = Var (ln πˆ1 ) ≈ Var (πˆ1 ) = 2 Var (πˆ1 ) = 2 1 πˆ1r1 r1 πˆ1 πˆ1 dπˆ1 2 Behelyettesítve, hogy (a 2×2-es táblázat szokásos jelöléseivel) πˆ1 = Var (ln πˆ1 ) ≈ a r1 b ar1 Hasonlóan Var (ln πˆ 2 ) ≈ 1 − πˆ 2 d , és = πˆ 2 r2 cr2 Var (ln RR ) = Var (ln πˆ1 ) + Var (ln πˆ 2 ) = b d + ar1 cr2 A becsült kockázati arány logaritmusát közelítőleg normális eloszlásúnak véve a konfidenciaintervallum ln br2 br b d b d − uα 2 + < ln RR < ln 2 + uα 2 + cr1 ar1 cr2 cr1 ar1 cr2 Magára a kockázati arányra: br2 br2 b d uα 2 b + d + < RR exp − uα 2 exp < cr1 ar1 cr2 cr1 ar1 cr2 18. példa (B. Rosner: Fundamentals of Biostatistics, Duxbury Press, 5th ed 2000, p 358) Azt vizsgálták, hogy 40 és 44 év közötti életkorú nőknél a
fogamzásgátló tabletta szedése növeli-e a szívinfarktus kockázatát. Az eredmények: szedett-e tablettát? igen nem Σ kapott-e infarktust? igen nem 13 4987 7 9993 20 14980 Σ 5000 10000 15000 Jelölje π 1 annak valószínűségét, hogy a páciens, aki szedett fogamzásgátló tablettát (exposed), infarktust kapjon, π 2 pedig annak valószínűségét, hogy valaki, aki nem szedett fogamzásgátló tablettát (unexposed), kapjon infarktust. πˆ1 = 13 7 = 0.0026 , πˆ 2 = = 0.0007 5000 10000 A kockázati arány becslése: 13 πˆ 0.0026 RR = 1 = 5000 = = 3.71 7 πˆ 2 0.0007 10000 A tablettát szedők kockázata az infarktusra 3.71-szorosa a nem szedőkének A kockázati arány logaritmusára a 95%-os konfidencia-intervallum alsó határa: ln br2 b d 4987 9993 4987 ⋅10000 − 1.96 + = − uα 2 + = ln ar1 cr2 cr1 13 ⋅ 5000 7 ⋅10000 7 ⋅ 5000 = 1.312 − 196 ⋅ 04685 = 0394 fölső határa: = 1.312 + 196 ⋅ 04685 = 2230 A 95%-os konfidencia-intervallum
magára a kockázati arányra: (e 0.394 ) , e 2.230 = (15, 93) Tehát azt mondhatjuk, hogy a tablettát szedők kockázata az infarktusra 95% valószínűséggel legalább 1.5-szerese, legföljebb 93-szerese a nem szedőkének Egy másik, gyakran használt kifejezés az esélyhányados-arány (odds ratio). Esélyhányadosnak a következő kifejezést nevezik: 54 odds = π 1−π Ha két csoportot (két binomiális eloszlást) hasonlítunk össze, az esélyhányados-arány (odds ratio) a következő: π1 1−π1 OR = π2 1−π 2 Pontosabban ezt a kifejezést a megbetegedés esélyhányados-arányának nevezik (disease odds ratio). Becslése a 2x2-es táblázat adataiból: a b OR = c d (a + b ) (a + b ) = ad (c + d ) bc (c + d ) Ha OR = 1 , a két csoport megbetegedésének valószínűsége egyforma. Ha OR értéke nagy, az első csoport (exposed) megbetegedésének valószínűsége nagyobb, mint a másodiké (unexposed). Zérus és végtelen között vehet föl
értékeket. Helyettesítsük be OR kifejezésébe az RR kockázati arányt: OR = RR 1−π 2 1−π1 Ha a megbetegedés kockázata mindkét csoportban kicsi ( π 1 << 1, π 2 << 1 ), akkor az esélyhányadosarány a képletből láthatóan jó közelítéssel egyenlő a kockázati aránnyal. A példa adataival: OR = ad 13 ⋅ 9993 = 3.72 = bc 7 ⋅ 4987 A fogamzásgátló tablettát szedők esélyhányadosa 3.72-szor akkora, mint a nem szedőké Ez a számérték gyakorlatilag megegyezik a kockázati arány értékével (3.71) Az esélyhányados-arány különösen retrospektív (case-control) vizsgálatnál igen hasznos. 22. példa (A. Agresti: Categorical data analysis, J Wiley, 2002, p 41) 709 tüdőrákkal diagnosztizált páciens mellé választottak 709 olyan pácienst, akit ugyanabban a kórházban kezeltek, ügyelve arra, hogy nem- és kor-eloszlásuk hasonló legyen. Jelölje azt az eseményt, hogy valakinek tüdőrákja van, T, azt, hogy a m egkérdezett
páciens dohányos, D. Az eredmények: dohányos igen ( D ) nem ( D ) Σ tüdőrákban szenved igen ( T ) nem (T ) 688 650 21 59 709 709 55 A dohányzás hatását akarják vizsgálni a tüdőrákban való megbetegedés valószínűségére, tehát a P(T D ) valószínűség ill. a P (T D ) P T D kockázati arány a k érdés A dohányzás szerinti két ( ) csoportba nem válogathatták véletlenül a pácienseket, mint a szokásos gyógyszer-kísérleteknél, nem a dohányzás (igen/nem) a rögzített, és a tüdőrák előfordulása a valószínűségi változó, hanem az oszlop-összegek rögzítettek, és az a valószínűségi változó, hogy a kiválasztott tüdőrákban szenvedő (vagy nem szenvedő) dohányos-e. Ezért csak a P(D T ) P D T arányt, az esélyhányadost tudjuk ( ) kiszámítani. Ha P(D T ) és P D T ( ) adott, a bennünket érdeklő P(T D ) valószínűség a Bayes-tétellel lenne kiszámítható: P(T D ) = P(D T )P(T ) ( ) P(D T )P(T ) + P D T P
(T ) A számításhoz tudni kell a tüdőrák vizsgált populációban való előfordulásának P(T ) valószínűségét (ún. prevalencia) Egyszerűen kiszámítható viszont az esélyhányados-arány: π1 π 11 π 1 − π1 OR = = 12 π2 π 21 π 22 1−π2 a OR = a + c b b+d c a + c = ad d bc b+d Itt most π 1 annak valószínűsége, hogy a tüdőrákban szenvedő megkérdezett páciens dohányos, π 2 pedig annak valószínűsége, hogy a tüdőrákban nem szenvedő megkérdezett páciens dohányos. Ez az esélyhányados-arány a veszélyeztetettség esélyhányados-aránya (exposure odds ratio). Vegyük észre, hogy a veszélyeztetettség becsült esélyhányados-arányának kifejezése pontosan ugyanaz, mint a megbetegedés becsült esélyhányados-arányáé ( ad bc )! a a+b b ad 688 ⋅ 59 = = 2.97 OR = a + b = c bc 650 ⋅ 21 c+d d c+d Számítsuk ki az esélyhányados-arányt a példa adataira (természetesen a valószínűségek helyett a képletben a relatív
gyakoriságokat kell vennünk): 56 D P 688 T 709 D P 650 T OR = = 709 = 2.97 21 D P T 709 59 D P 709 T A becsült esélyhányados-arány logaritmusa: ln OR=1.089 Minthogy a megbetegedés kockázata mindkét csoportban kicsi (ezt nem a példa adataiból tudjuk), a kockázati arány közel van az esélyhányados-arányhoz. Tehát a dohányzás 3-szorosára növeli a tüdőrák kockázatát. Az esélyhányados-arány varianciájának becslése: Var [ln (OR )] = 1 1 1 1 + + + a b c d A példa adataival: Var [ln (OR )] = 1 1 1 1 + + + = 0.0676 688 650 21 59 Az esélyhányados-arány logaritmusának 95%-os konfidencia-intervalluma: 1.089 ± 196 ⋅ 00676 = (0579, 1599) Az esélyhányados-arány 95%-os konfidencia-intervalluma: (1.745, 4948) 2.3 A binomiális eloszláson alapuló páros próbák (két szempont szerinti osztályozás összefüggésének ill. függetlenségének vizsgálata)
Ahogyan a páros t-próba érzékenyebben kimutatja a h atást, mint a kétmintás t-próba, mert egyedeken (blokkokon) belüli összehasonlítást végez, így az egyedenkénti különbségek kiküszöbölődnek, és ugyanez igaz a Mann-Whitney-próba és Wilcoxon páros próbája között, a kategorikus változókkal operáló próbák is érzékenyebbek, ha egyedeken belüli összehasonlításokat végzünk. A kísérlet úgy zajlik, hogy kiválasztunk N egyedet (i=1,N), és két szempont (x és y) szerint besoroljuk őket két-két csoportba. Itt a sorok és oszlopok összege nem adott (véletlen), csak N x Σ 0 1 0 a c c1 y 1 b d c2 Σ r1 r2 N Néhány példa: 57 23. példa (G.AWalker: Common statistical methods for clinical research with SAS examples, CollinsWellesley Publishing, San Diego, California, 1996) A páciensek kezelést kapnak. A kérdés az, hogy a k ezelésnek van-e mellékhatása a vizelet bilirubin-szintjére, vagyis hogy a kezeléstől megváltozik-e a
bilirubin-szint. A táblázatban a „nincs” azt jelenti, hogy nem magas a szint, a „van” azt jelenti, hogy magas. Kezelés előtt Σ nincs van Kezelés után nincs van 60 14 6 6 66 20 Σ 74 12 86 Véletlenszerűen kiválasztottak 86 pácienst. Mindenkinek megmérték a bilirubin-szintjét kezelés előtt és kezelés után is. Itt a két szempont, ami szerint a kategorizálást végezték, a kezelés előtti és utáni állapot. Ha valakinek a kezelés előtt és a kezelés után egyforma valószínűséggel magas a bilirubin-szintje, az azt jelenti, hogy a kezelés utáni bilirubin-szintet nagy mértékben meghatározza a kezelés előtti szint, vagyis a kezelés nincs az illetőre ilyen szempontból hatással. Másképp fogalmazva a kezelés előtti és utáni szint között erős az összefüggés. Ha viszont annak a valószínűsége, hogy valakinek a kezelés után magas legyen a bilirubin-szintje, független a kezelés előtti szinttől, a két eseményt függetlennek
minősítjük. Az eredményeket más alakban is fölírhatnánk, de ez nem tükrözné, hogy a kezelés előtt és a kezelés után ugyanazoknak a személyeknek a bilirubin-szintjét mérték meg, vagyis a kezelés előtt és a kezelés után vizsgált személyek nem függetlenek egymástól. Ez a táblázat akkor lenne érvényes, ha kiválasztottak volna 86 személyt, akit a kezelés előtt vizsgálnak meg, és másik 86-ot, akit a kezelés után, de a valóságban nem így végezték a kísérletet. Kezelés előtt Kezelés után nincs 74 66 van 12 20 Σ 86 86 24. példa (A. Agresti: Categorical data analysis, J Wiley, 2002, p 444) A vizsgálatban résztvevőknek két kérdést tettek föl: 1. Egyetért-e azzal, hogy a halálos betegeknek joguk van az öngyilkossághoz? 2. Ha valaki gyógyíthatatlan beteg, van-e joga az orvosnak ahhoz, hogy a páciens és családja kérésére véget vessen a beteg szenvedéseinek? öngyilkosság Σ egyetért nem eutanázia egyetért 1097
203 1300 nem 90 435 525 Σ 1187 638 1825 58 Itt a két szempont, ami szerint a kategorizálást végezték, a két kérdésre adott válasz egy-egy személynél. Azt vizsgálták, hogy van-e összefüggés a két kérdésre adott válaszok között, vagy pedig a két kérdésre adott válasz az egyes személyeknél független. 25. példa (B. Rosner: Fundamentals of Biostatistics, Duxbury Press, 5th ed 2000, p 377) Kétféle kemoterápiás kezelést hasonlítottak össze párokon (matched pairs). A párosítás szempontjai: életkor, klinikai állapot. A vizsgálat előtt nem tudták, hogy a kétféle kezelés közül melyik jobb. Hogy ki melyik kezelést kapja, véletlenszerűen jelölték ki A táblázatban a párok száma van (pl. a hasonló korú és állapotú párok közül 5 volt olyan, hogy a pár A kezelést kapott tagja nem élte túl az 5 évet, a B kezelést kapott tagja pedig igen). A kezelés Σ túlél 5 évet nem B kezelés túlél 5 évet 510 5 515 nem 16 90
106 Σ 526 95 621 Itt nem egy egyedet kategorizáltak két szempont szerint, hanem egy párt. Jelölje x az A kezelés, y a B kezelés eredményét. Azt az eseményt, hogy egy beteg túlélte az öt évet 1-gyel, azt hogy nem élte túl, 0-val jelöljük. A kérdés az, hogy a túlélés valószínűsége ugyanakkora-e a párok két tagjára. Ha igen, ez azt jelenti, hogy a túlélés valószínűségét a párok jellemzői (kor, állapot) határozzák meg, nem a kezelés fajtája. Úgy is megfogalmazhatjuk a kérdést, hogy az, hogy a pár A kezelést kapott tagja túléli az 5 évet, független-e attól, hogy a mási túléli-e. 2.31 A McNemar-próba két szempont összehasonlítására (összefüggés-vizsgálat) Ezzel a p róbával azt vizsgáljuk, hogy a kétféle szempont szerinti besorolás összefügg-e. Pontosabban azt kérdezzük, hogy a főátlón kívüli cellákba eső előfordulások szimmetrikusak-e. Többféleképpen is beláthatjuk, hogy csak azok az egyedek
érdekesek, akiknek a besorolása x és y szerint különböző (ún. diszkordáns párok) H 0 : P( xi = 0, yi = 1) = P(xi = 1, yi = 0) vagy π 12 = π 21 H1 : P(xi = 0, yi = 1) ≠ P(xi = 1, yi = 0 ) vagy π 12 ≠ π 21 A nullhipotézis ebben a formájában azt jelenti, hogy annak a valószínűsége, hogy valaki a táblázat b cellájából a c cellájába kerüljön át, ugyanakkora, mint annak, hogy a c cellájából a b cellájába kerüljön át. Adjuk hozzá az egyenletek mindkét oldalához a P(xi = 0, yi = 0 ) valószínűséget, így a nullhipotézis: H 0 : P( xi = 0, yi = 1) + P( xi = 0, yi = 0) = P(xi = 1, yi = 0) + P(xi = 0, yi = 0) A kifejezés bal oldala P( xi = 0) , a jobb oldala P ( yi = 0 ) , ezzel 59 H 0 : P ( xi = 0 ) = P ( y i = 0 ) H 1 : P ( xi = 0 ) ≠ P ( y i = 0 ) A nullhipotézis ebben a formájában azt jelenti, hogy annak a valószínűsége, hogy valaki az egyik (x) szempont szerint az első csoportba tartozzék, ugyanakkora, mint hogy a másik (y)
szempont szerint tartozzék az első csoportba. Ezt úgy mondhatjuk, hogy a két szempont szerint homogén (másként mondva azonos) az eloszlás, ezért a próbát homogenitás-vizsgálatnak is nevezik. Még másképp nézve a feladat ugyanaz, mint az előjel-próbánál (sign test), ahol azt nézzük, hogy a pozitív irányú különbség (itt a változás) és a negatív irányú különbség (itt a változás) valószínűsége azonos-e, a „nincs különbség” (itt „nincs változás”) nem ad információt. Így jól érthető, hogy a próba elvégzésének feltétele, hogy a P(xi = 0, yi = 1) − P(xi = 1, yi = 0 ) azonos előjelű kell legyen minden i-re (minden egyedre), és hogy az x i , y i párok függetlenek legyenek az x j , y j pároktól (j≠i). Ha a 2x2-es táblázatnak csak azokat a c elláit nézzük, amelyek a két szempont (x és y) szerinti különbözőségre (változásra) vonatkoznak (b és c), akkor a nullhipotézis érvényessége esetén annak a
valószínűsége, hogy a különbség (változás) egyik irányú, ugyanúgy 0.5, mint hogy a másik irányú (mint az előjel-próbánál): H 0 : P( xi = 0, yi = 1) = P( xi = 1, yi = 0 ) = 0.5 H1 : P( xi = 0, yi = 1) ≠ 0.5 Kismintás eljárás Legyen n = b + c (a két szempont szerint különböző besorolású – diszkordáns - egyedek száma). Az eljárást akkor vagyunk kénytelenek használni, ha a diszkordáns egyedek (párok) száma nem éri el a 20-at. Annak valószínűsége, hogy b vagy kevesebb előfordulás legyen a jobb fölső cellában ( xi = 0, yi = 1 ) n közül (feltéve, hogy b<c): b n p = P(k ≤ b ) = ∑ ⋅ 0.5 n k =0 k Ez egyben a próba kiértékelésére szolgáló p érték. Nagymintás eljárás Az eljárás akkor használható, ha a diszkordáns egyedek (párok) száma legalább 20. A próbastatisztika: u0 = b − n ⋅ 0.5 n ⋅ 0.5 2 Számolásra ez az alak is alkalmas, de az irodalomban más formában szokás írni.
Utóbbihoz úgy jutunk, ha az n = b + c helyettesítést elvégezzük: b−c b−c u0 = 2 = b+c b+c 4 A folytonossági korrekcióval: 60 u0 = b − c −1 b+c Mivel az u-eloszlású valószínűségi változó négyzete χ2- eloszlású, a következőt is írhatjuk: χ 2 0 2 ( b − c) = b+c ( b − c − 1) = 2 χ ill. 2 0 b+c Vegyük észre, hogy a próbastatisztika kifejezésében sem a kismintás, sem a nagymintás eljárásnál nem szerepelnek a 2 x2-es táblázat a és d cellájában lévő számok, vagyis azon egyedek száma, amelyek besorolása x és y szerint azonos (ún. konkordáns egyedek)! 23. példa Nyilvánvalóan azokkal nem kell foglalkoznunk, akiknek a bilirubin-szintje a k ezelés során változatlan (változatlanul magas vagy változatlanul alacsony) maradt (ún. konkordáns párok), csak azokkal, akiknek a kezelés előtt nem volt magas a bilirubin- szintje, de kezelés után megnőtt, illetve akiknek magas volt, de a kezelés után lecsökkent
(ún. diszkordáns párok) A nullhipotézis értelmében annak az esélye, hogy valakinek a kezelés előtt magas volt, és a kezelés után alacsony lett, ugyanannyi, mint annak, hogy valakinek a kezelés előtt alacsony volt, és a kezelés után magas lett. A nagymintás eljárással számolva (a diszkordáns egyedek száma 20): u0 = b−c 14 − 6 = = 1.788 b+c 14 + 6 p = 2 ⋅ (1 − 0.963) = 0074 Ha a folytonossági korrekciót is alkalmazzuk: u0 = b − c − 1 14 − 6 − 1 = = 1.565 b+c 14 + 6 p = 2 ⋅ (1 − 0.9412) = 0118 A szükséges minta-elemszámot a binomiális próbánál levezetett képletből számolhatjuk: 2 π 1 (1 − π 1 ) uα + u β π 0 (1 − π 0 ) π 0 (1 − π 0 ) n= (π 1 − π 0 )2 A nullhipotézis szerinti π 0 = 0.5 Vegyük észre, hogy a képletből az n = b + c számot kapjuk, vagyis azoknak az (ún. diszkordáns) egyedeknek a s zükséges számát, akiknek a b esorolása x és y szerint nem azonos, nem pedig a
vizsgálandó összes egyedek N számát! Hogy az utóbbit is megkaphassuk, meg kell adni annak p D valószínűségét, hogy egy egyed besorolása x és y szerint különböző (vagyis diszkordáns) legyen. Természetesen ezt a vizsgálat előtt nem tudhatjuk, de a számításhoz valamilyen becslésre (jóslásra) van szükség, ebben a szakmai tapasztalatok segíthetnek. 61 N= n pD 26. példa Vegyük a diszkordáns esetek előfordulásának valószínűséget 0.2-nek, és számítsuk ki az ahhoz szükséges N minta-elemszámot, hogy 80% biztonsággal kimutassuk, ha a kezelés mellékhatásaként a bilirubin-szint nem változatlan, hanem 2/3 valószínűséggel megváltozik, ha a próba α szignifikancia-szintje 0.05 (egyoldali)! α =0.05, β=02, π1 =0666, π0 =05, p D =02, uα = 1645 , u β = 084 2 2 π 1 (1 − π 1 ) 0.666 ⋅ 0333 uα + u β 1.645 + 084 2 π (1 − π ) 0.5 2 ( ) π π − 1 0 . 5 0 0 0 0 = N=
= 267.2 2 2 pD 0.2 (π 1 − π 0 ) (0.666 − 05) 2.32 Két szempont szerinti osztályozás függetlenségének vizsgálata A kérdést nemcsak úgy tehetjük föl, hogy a két szempont szerinti besorolás eloszlása azonos-e, vagyis hogy az azonosságtól való eltérés szimmetrikus-e, hanem azt is kérdezhetjük, hogy a kétféle besorolás független-e egymástól. A kérdés úgy is megfogalmazható, hogy az, hogy az egyik szempont szerint egy egyed ugyanabba a kategóriába esik, mint a másik szempont szerint, csak a véletlen műve. Nyilvánvalóan a két állítás (az összefüggés vagy azonosság egyfelől, a függetlenség másfelől) egymásnak ellentmond, tehát egyszerre mindkettő nem lehet igaz, de könnyen előfordulhatnak olyan esetek, amikor egyiket sem fogadhatjuk el vagy mindkettőt elfogadjuk. Az eredmények táblázatát a valószínűségekkel fölírva (az indexekre a szokásos mátrix-jelölést – sor, oszlop - alkalmazva): x 0 1 Σ y 0 π 11 π 21
c1 1 π 12 π 22 c2 Σ r1 r2 N A függetlenség hipotézise a következő: H 0 : π ij = π i +π + j ahol c π i + = ∑ π ij j r π + j = ∑ π ij i A hipotézis vizsgálatának módszereit a 3. fejezetben a χ2 próbáknál ismertetjük (342pont) 2.4 Fisher „egzakt” próbája 62 A próba neve megtévesztő. Láttuk a két független minta összehasonlításánál (22 alfejezet) és a páros összehasonlításnál (2.3 alfejezet), hogy a binomiális eloszláson alapuló próbák egzakt módon, elhanyagolás nélkül is elvégezhetők, de gyakorlatilag ennek a minta mérete határt szab. A Fisher-féle ún. egzakt próba jellegzetessége, hogy a 2x2-es táblázatban a sor- és oszlop-összegek is rögzítettek. Az előfordulások eloszlását ezért a hipergeometrikus eloszlás írja le A hipergeometrikus eloszlás urna-modellje a következő: Egy urnában van N db golyó, M fekete és N-M fehér Kiveszünk véletlenszerűen n db golyót az urnából, ezek közül k
fekete, n-k fehér. Hányféleképpen fordulhat elő ez az eredmény? N Az összes lehetőségek száma (hányféleképpen lehet N közül n-et kiválasztani): . n A kedvező lehetőségek száma, figyelembe véve, hogy a fekete golyók nem különböztethetők meg M N − M . egymástól, és a fehér golyók sem: k n − k Annak valószínűsége, hogy éppen k fekete és n-k fehér golyót húzzunk: M N − M k n − k p(k ) = N n A fekete golyók k előfordulási számának akkor van hipergeometrikus eloszlása, ha csak a véletlenen múlik, milyen színű akad a kezünkbe, vagyis annak valószínűsége, hogy fekete golyót húzzunk, M N . Éppen ez a próba nullhipotézise H0 :π = π 0 = M N Kismintás eljárás Ha a minta-elemszám nem túlságosan nagy, a számítás gyakorlatilag is elvégezhető, amint ezt a
következő példák illusztrálják. 27. példa (A. Agresti: Categorical data analysis, J Wiley, 2002, p 444) Fisher kolléganője szerint a teát úgy kell helyesen készíteni, hogy először a tejet öntik a csészébe, utána a teát. Fisher kétségbe vonta, hogy észre lehetne venni a tea ízéből, ha más a sorrend Mindkét sorrend szerint 4 csésze teát készített, ezeket kolléganője - aki tudta, hogy mindkét receptúrával 4-4 tea készült, de természetesen nem tudta, hogy melyik csésze tea hogyan készült - megkóstolta. Az eredmények a következők: tényleges sorrend tej előbb vélt sorrend tej előbb tea előbb 3 1 4 tea előbb 1 4 3 63 4 4 8 A nullhipotézis az, hogy annak valószínűsége, hogy egy csésze tea ízlelésénél a vélt sorrend helyes, 0.5 (vagyis az ízleléssel csak találgatnak) N = r1 + r2 = 8 , M = r1 = 4 , n = c1 = 4 , k = a = n11 = 3 Itt a sorok összege ismert (4 teát készítettek mindkét sorrenddel), és az
oszlopok összege is ismert (a hölgy tudta, hogy 4 teára kell azt mondania, hogy a tejet tették bele előbb a csészébe, és 4 teára azt, hogy a teát). Annak valószínűsége, hogy a nullhipotézis érvényessége esetén a talált táblázatot kapjuk: 4 4 ⋅ 3 1 P(3) = = 0.229 8 4 A próba elvégzéséhez annak p valószínűségét kell kiszámítanunk, hogy a talált vagy annál szélsőségesebb eredmény álljon elő, amennyiben a nullhipotézis igaz. Itt a szélsőségesebb csak az lehet, hogy a hölgy mind a 4 í zben jól állapítja meg a tea elkészítésének sorrendjét, vagyis k=3. Ennek valószínűsége: 4 4 ⋅ 4 0 P(4 ) = = 0.0143 8 4 A p érték: p = 0.2423 , vagyis ∼25% annak a valószínűsége, hogy ilyen a véletlen műveként is kijöjjön, ezért formálisan el kellene fogadni Ho-t.
A kis minta-elemszám miatt nagyok az ugrások, akkor lenne csak a p érték 0.05 alatt, ha mind a 4 esetben sikerült volna eltalálni a sorrendet Vizsgáljuk meg a 16. példában is számolt következő táblázat hipotetikus esetét Σ 4 1 5 Σ 5 5 10 1 4 5 Itt a talált és szélsőségesebb konfigurációk a következők, ha rögzítve tartjuk a sor- és oszlopösszegeket: 4 1 1 4 5 0 0 5 Az első konfiguráció előfordulási valószínűsége 0.1032, a másodiké 00040, ha a véletlen műveként (vagyis a hipergeometrikus eloszlásból) áll elő. Itt a p érték 01072, meggyőzőbb az előző (3, 1, 1, 3) táblázaténál, de még mindig túlságosan diszkrét a lépés. A következő táblázat és annál szélsőségesebb konfigurációk előfordulási valószínűsége a nullhipotézis érvényessége esetén a p érték 0.040+00011=00411: Σ 64 Σ 5 1 6 1 5 6 6 6 12 Itt már, ha 0.05 a viszonyítási határ, vagyis az elsőfajú hiba megengedett
valószínűsége (a szignifikancia-szint), elutasítanánk a nullhipotézist. Nagymintás eljárás A hipergeometrikus eloszlás is közelíthető normális eloszlással. Várható értéke és varianciája: E (k ) = nπ Var (k ) = nπ (1 − π ) N −n N −1 A 2x2-es táblázatra alkalmazva: N = r1 + r2 = c1 + c2 , M = r1 , n = c1 , k = a = n11 , π 0 = E (k ) = M r1 = N N c1r1 N Var (k ) = c1r1 N − r1 N − c1 N N N −1 A próbastatisztika: u0 = c1r1 N c1r1 ( N − r1 )( N − c1 ) N 2 ( N − 1) a− A tea-példára a nagymintás eljárás nyilvánvalóan nem alkalmazható. 2.5 A 2x2-es táblázatra használható próbák összevetése Láttuk, hogy igen hasonló szerkezetű adatok nagyon különböző kísérleti tervekből adódhatnak. A következő példában megvizsgáljuk, hogy az azonos 2x2-es táblázatból mennyire adódnak más következtetések, ha a mögöttük álló kísérleti tervek (a kísérlet elvégzésének módja) különbözőek. Mindegyik
számításnál kismintás próbát alkalmazunk. 28. példa Fisher tea-példáját a f eladat természete miatt (a 2x2-es táblázatban a s or- és oszlop-összegek is rögzítettek) Fisher egzakt próbájával kellett megoldani. tényleges tej előbb vélt sorrend tej előbb tea előbb 3 1 4 65 sorrend tea előbb 1 3 4 4 4 8 Ha a sorok összege rögzített lenne, de az oszlopoké nem, mert az ízlelést végző nem tudná, hogy 4 teára kell azt mondania, hogy a tejet tették bele előbb a csészébe, és 4 teára azt, hogy a teát, a következő hipotézis-párt kellene vizsgálni: H0 :π1 ≥ π 2 H1 : π 1 < π 2 A 17. példában kiszámoltuk, hogy p=00977 A kísérleti tervet úgy is végre lehetett volna hajtani, hogy az ízlelőtől különböző személy főz sok csésze teát, fölváltva előbb a tejet ill. előbb a teát töltve a csészébe, és mindegyiket számmal jelöli, majd e számok közül kisorsolnak 8-at, és megízlelik. Ekkor a sorok összege
nem lenne rögzített, mert aki ízlelésre föltálalja, nem 4 ilyet és 4 olyat választ ki, hanem a sorsolás eredménye szerint. Az oszlopok összege sem lenne rögzített, mert az ízlelő nem tudja, hogy hány csésze teáról kell azt gondolnia, hogy így ill. úgy készítették Minden csésze teát két szempontból kategorizálnánk: hogy mi volt a k észítésnél a t ea és tej adagolásának tényleges sorrendje, ill. hogy az ízlelő milyen sorrendet vélelmezett. Ekkor Mc-Nemar-próbát kellene végezni, ahol a p érték számítására szolgáló képlet a következő: b n p = P(k ≤ b ) = ∑ ⋅ 0.5 n k =0 k A példánkban b=1, n=2 (a diszkordáns párok száma), vagyis 1 2 p = P(k ≤ 1) = ∑ ⋅ 0.5 2 = 025 + 05 = 075 k =0 k Az eredmény nem meglepő. A nullhipotézis szerint a valóságos „tej előbb” receptúrával készült tea „tea előbb” vélelmezése pont ugyanolyan valószínű, mint a
fordított irányú tévedésé, és ennek nem mondhat ellent egy olyan táblázat, amiben mindkét irányú tévedés egyszer fordul elő. Látható, hogy ugyanabból a 2x2-es táblázatból más kísérleti elrendezést föltételezve radikálisan más eredményt kapunk. sorok összege rögzített rögzített véletlen oszlopok összege rögzített véletlen véletlen Fisher „egzakt” homogenitás függetlenség (McNemar) hipergeometrikus két binomiális multinomiális p 0.2423 0.0977 0.7500 66 3. χ2-próbák 3.1 χ2-próba az eloszlás (illeszkedés) vizsgálatára 3.11 Illeszkedésvizsgálat a Poisson-eloszlásra 29. példa (G.EP Box, WG Hunter, JS Hunter: Statistics for experimenters, J Wiley, 1978, p 143) Müzligyár ellenőrzi a mazsolák számát. Az előírás az, hogy egy mintavevő kanálnyi müzliben 36 szem mazsolának kell lennie. Az adagonkénti mazsolák számának előfordulási valószínűsége Poisson-eloszlással írható le, melynek valószínűségi
függvénye: e − λ ⋅ λk k! p(k ) = E (k ) = λ , Var (k ) = λ Az eloszlásnak egyetlen paramétere van, az egységben való előfordulás λ valószínűsége. 12 mintát vettek, az ezekben talált mazsola-szemek száma a következő: 43, 46, 50, 40, 38, 29, 31, 35, 41, 52, 48, 37. H 0 : λ = λ0 = 36 H1 : λ ≠ 36 A nullhipotézis tehát az, hogy az adatok adott paraméterű Poisson-eloszlást követnek (a feladat ún. tiszta illeszkedésvizsgálat). A Poisson-eloszlás közelíthető normális eloszlással, ha a λ paraméter elég nagy: 0.4 λ =10 λ =1 p(x) 0.3 0.2 0.1 0.0 0 2 4 6 8 10 12 14 16 18 20 x u≈ k −λ ∑u i λ 2 i , ez az egy adagban található mazsola-szemek számára érvényes. A több mintára: = χ 2 , a szabadsági fok a minták száma. 67 Az eloszlás akkor ilyen, ha az adagonként található mazsola-szemek száma független egymástól. A próbastatisztika: χ 02 = ∑ i k i − λ0 λ0 Behelyettesítve: χ 02 =
(37 − 36) 2 (43 − 36) 2 (46 − 36) 2 + + . + = 24.06 , ν=12 36 36 36 A χ2-táblázat szerint a 0.025 egyoldali valószínűséghez tartozó kritikus érték 23337, t ehát a hipotézist α=0.05 (kétoldali) szignifikancia-szinten elutasítjuk (pontosan számolva p=002) A nullhipotézist, hogy mintavevő kanalanként átlagosan 36 szem mazsola van a müzliben, és a mazsolák eloszlása Poisson, elutasítottuk. Lehetséges, hogy nem 36 szem mazsola jut egy kanálra, de az is lehet, hogy nem Poisson-eloszlást követnek a mazsolák. Vizsgáljuk először az első problémát, ami úgy fogalmazható meg, hogy a Poisson-eloszlás λ paramétere nem 36. A Poisson-eloszlás additív tulajdonságú, tehát a Poisson-eloszlású valószínűségi változók összege is Poisson-eloszlást követ, melynek λ paramétere az összeadandók λ paramétereinek összege. A nullhipotézis az, hogy a 12 kanálnyi müzliben összesen 12 ⋅ 36 = 432 szem mazsola van: H 0 : λ = λ0 = 432 H1 :
λ ≠ 432 (490 − 432) 2 χ = = 7.79 , ν=1 432 A χ2-táblázat szerint a 0.025 egyoldali valószínűséghez tartozó kritikus érték 5024, tehát a hipotézist α=0.05 (kétoldali) szignifikancia-szinten elutasítjuk (pontosan számolva p=00053) Az egy mintavevő kanálra jutó mazsola-szám eszerint nem 36. Adjunk rá becslést a minta adataiból (a 12 mintában összesen 490 szem mazsola volt): 490 λˆ = = 40.83 12 Nézzük most a második problémát, ami úgy fogalmazható meg, hogy a m azsola-szemek előfordulása nem Poisson-eloszlás szerinti (overdispersion). Pontosabban azt fogjuk kérdezni, hogy a minták jöhettek-e olyan Poisson-eloszlásból, amelynek becsült paramétere 40.83 ( ún becsléses illeszkedésvizsgálat). 2 0 χ 02 = (43 − 40.83) 2 (37 − 40.83) 2 + . + = 14.34 40.83 40.83 A szabadsági fok eggyel csökkentendő, mivel az eloszlás próbával vizsgált paraméterét is az adatokból becsültük: ν = 12 − 1 = 11 A χ2-táblázat szerint a 0.025
egyoldali valószínűséghez tartozó kritikus érték 2192, tehát a hipotézist elfogadjuk (pontosan számolva p=0.215) 68 Tehát az egy mintavevő kanálra jutó mazsola-szám ugyan Poisson-eloszlás szerint ingadozik (az egyes kanalakban a mazsola-szám független), de nem 36 szem mazsola jut átlagosan egy mintavevő kanálra. 3.12 Multinomiális eloszlás A binomiális eloszlásnál a k ísérletnek kétféle kimenetele lehet, pl. fej vagy írás Más esetben többféle kimenetel lehet. Legyen c a lehetséges kimenetelek (kategóriák) száma, π j a j-edik kategória előfordulásának valószínűsége. Például a kockadobásnak hatféle kimenetele lehet, mindegyik 1/6 valószínűséggel Legyen n j a j-edik kategóriába eső előfordulások száma, pl. n 1 n dobásból az 1-es dobások száma A valószínűségi függvény: p(n1 , n2 ,., nc ) = n! π 1n1π 2n2 ⋅ ⋅ ⋅ π cnc n1!n2 ! ⋅ ⋅ ⋅ nc ! Azért nem Poisson-eloszlású az egyes kategóriákban az
előfordulások száma, mert az összes kategóriákbeli számok n összege rögzített. Az eloszlásnak c-1 paramétere van, az egyes kategóriákbeli előfordulások valószínűsége, melyek összege 1 kell legyen. A j-edik kategóriába eső előfordulások n j számának várható értéke: E (n j ) = nπ j A multinomiális eloszlás speciális esete a binomiális eloszlás c=2-re. Megmutatható, hogy az n j számokból képezett következő statisztika elég nagy n j értékek esetén χ2-eloszlású: 2 ( ni − nπ i ) 2 χ =∑ nπ i i A kifejezés szabadsági fokszáma c-1, mert a szumma tagjai nem függetlenek egymástól, közöttük egy összefüggés van. Szokás ezt a képletet a következőképpen írni: (O − Ei )2 χ2 = ∑ i Ei i ahol O i az i-edik kategóriában kapott előfordulási szám (observed), E i ennek várható vagy feltételezett értéke (expected). Látjuk, hogy nemcsak a binomiális és Poisson-eloszlású valószínűségi változóból képezhetünk
χ2statisztikát. 30. példa (A. C Wardlaw: Practical statistics for experimental biologists, J Wiley & Sons, 1985 p 112) A vércsoport genotípusa és fenotípusa között a következő az összefüggés (az A és B allél domináns, a 0 recesszív): genotípus fenotípus AA A A0 A AB AB BB B B0 B 00 0 69 129 olyan gyermek vércsoportját vizsgálták, akinek mindkét szülője AB vércsoportba tartozott. 28 gyermeknek volt A (AA), 36-nak B (BB) és 65-nek AB a vércsoportja. A Mendel-féle öröklődési szabályok szerint az esetek ¼-ében kell A, ¼-ében B, ½-ében pedig AB előfordulásnak lennie. A kérdés az, hogy a talált adatok ellentmondanak-e ennek az aránynak. 1 1 2 , π BB = , π AB = 4 4 4 Az előfordulási számok multinomiális eloszlást követnek. H 0 : π AA = Talált (O) A 28 B 36 AB 65 Összesen 129 2 2 Feltételezett (E) 129 = 32.25 4 129 = 32.25 4 129 = 64.5 2 129 2 129 129 129 65 − 36
− 28 − 2 4 4 2 χ0 = =1 + + 129 129 129 2 4 4 ν=3-1=2 Elfogadjuk H 0 -t, az adatok nem mondanak ellent a Mendel-féle elméletnek. 70 3.2 χ2-próba a 2x2-es táblázatok elemzésére Egy tipikus 2x2 táblázat és szokásos jelölései a következők: a c c1 r1 r2 N b d c2 A táblázat celláira az ábrán látható betűkkel, vagy a mátrixjelöléssel megegyező módon a következő számokkal hivatkozunk: a:11, b:12, c:21, d:22. A 2x2 táblázat példáján szemléltetve a következő kísérleti elrendezések fordulhatnak elő: Típus Rögzített Véletlen Eloszlás I. N, c 1 , c 2 , r1, r2 4 független Poisson H0 Próba Megjegyzés log-linear II. III. IV. V. N c1, c2 r1 , r2 c 1 ,c 2 , r 1 , r 2 c1, r1 r1 c1 - multinomiális két független két független hiperbinomiális binomiális geometrikus p 12 =p 21 p b =p c McNemar, χ2 crosssectional p 11 =p 12 p a =p b p 11 =p 21 p a =p c χ2 χ2 p11 p 22 =1 p12 p 21
pa pd =1 pb p c Fisher egzakt, χ2 case-control, clinical trial, retrospective prospective A III. és IV típusnál (ezeket tárgyaltuk a 22 pontban) két binomiális eloszlású sokaságot hasonlítunk össze, előbbinél az oszlop-összegek, utóbbinál a sor-összegek rögzítettek. A IV elrendezés a tipikus klinikai kísérlet: r 1 páciens kapja az egyik kezelést, r 2 a másikat. Az oszlopokban a gyógyultak/nem gyógyultak száma van, ez a valószínűségi változó. A III. típus a retrospektív vizsgálat, amelynél c 1 esetet választunk ki az egyik sokaságból (a 22 példában a tüdőrákosok közül: case), c 2 esetet a másik sokaságból (nem szenved tüdőrákban: control). Itt az a véletlenszerű, hogy egyik ill másik csoportban hány páciensről találják úgy, hogy dohányos. A II. típusnál (ezt tárgyaltuk a 23 pontban) N egyedet választunk ki, és két szempont (a sorbeli és az oszlopbeli) szerint soroljuk be őket. Itt nem tudjuk előre, hogy hányan
lesznek az egyik és a másik sorban ill. oszlopban, a sor- és oszlop-összeg tehát véletlen Az V. esetben a sor- és oszlop-összeg is rögzített, ide illik a 24 pontban tárgyalt tea-példa 3.21 A sorösszegek rögzítettek (homogenitás-vizsgálat) 31. példa 71 (M.J Campbell, D Manchin, Medical Statistics A commonsense approach, 2nd edition, J Wiley & Sons, 1993, p. 71) A páciensek kétféle gyógyszert kaptak, kisorsolva, hogy ki melyiket. Kettős vak vizsgálatot végeztek: az orvos és a páciens sem tudja, hogy ki melyik gyógyszert kapja. A kérdés, hogy van-e a két gyógyszer között különbség a tekintetben, hogy egyforma arányban gyógyultak-e tőlük a betegek. Az eredmények: Gyógyszer típusa A B Σ Gyógyult 23 18 41 Nem gyógyult 7 13 20 Σ 30 31 61 Az A és B gyógyszernél a gyógyulás relatív gyakorisága külön-külön binomiális eloszlást követ. Jelölje π 1 annak valószínűségét, hogy a beteg, aki az A gyógyszert kapja,
meggyógyul, π 2 annak valószínűségét, hogy a beteg, aki az B gyógyszert kapja, meggyógyul. A hipotézis-pár: H0 :π1 = π 2 ami úgy is írható, hogy π 1 A = π 1 B H1 : π 1 ≠ π 2 (kétoldali) A feladatot 13. példaként a binomiális eloszlás normális eloszlással való közelítésével oldottuk meg. Tiszta illeszkedésvizsgálatnál azt kérdeznénk, hogy az adatok adott π 1 ill. π 2 paraméterű sokaságokból származnak-e. Itt nem ez a helyzet, itt a paramétereket is az adatokból kell becsülni, vagyis becsléses illeszkedésvizsgálatról van szó. A próbastatisztika a következő volt: u0 = πˆ1 − πˆ 2 1 1 + n1 n2 πˆ (1 − πˆ ) πˆ = n1`πˆ1 + n2πˆ 2 n1 + n2 Mivel a standard normális eloszlású valószínűségi változó négyzete ν= 1 szabadsági fokú khinégyzet eloszlású valószínűségi változó ( u 2 = χ 2 ), tehát a következő próbastatisztika is használható: ( πˆ1 − πˆ 2 )2 2 2 χ
0 = u0 = 1 1 πˆ (1 − πˆ ) + n1 n2 Gyógyszer típusa A B Gyógyult a c Nem gyógyult b d Σ r1 r2 72 c1 Σ c2 N A táblázat celláinak betű-jelöléseivel fejezzük ki a próbastatisztikát (itt n 1 = r 1 és n 2 = r 2 ): πˆ1 = πˆ ≈ a a c c , πˆ 2 = = = r1 a + b r2 c + d a+c a+c = N a+b+c+d Ezeket χ 02 = u02 kifejezésébe helyettesítve algebrai átalakítások után a következő kifejezést kapjuk: (ad − bc )2 (a + b )(c + d )(a + c )(b + d ) 2 ( Oi − Ei ) 2 Használjuk most a χ = χ 02 = N ∑ általános képletet! A várható előfordulási szám (E i ) Ei becslésénél figyelembe kell venni a π 1 = π 2 = π nullhipotézist. π jelenti az (első oszlopba esés) gyógyulás valószínűségét. A második oszlopba esés valószínűsége 1-π (mivel egy személy vagy gyógyult, vagy nem). Így például az a jelű cellába esés gyakoriságának becslése: a+c E1 = r1πˆ ≈ ( a + b ) N a+c E1 = r1πˆ = (a + b
) N ugyanez a b cellára: b+d a+c E2 = r1 (1 − πˆ ) ≈ ( a + b ) 1 − = (a + b) N N b+d E 2 = r1 (1 − πˆ ) = (a + b ) N s.it A táblázat négy cellája adja a szumma négy tagját: 2 2 2 2 ( a − r1π ) ( b − r1 (1 − π ) ) ( c − r2π ) ( d − r2 (1 − π ) ) 2 + + + χ = r1π r1 (1 − π ) r2π r2 (1 − π ) i Behelyettesítve és közös nevezőre hozva éppen a χ 02 = N (ad − bc )2 (a + b )(c + d )(a + c )(b + d ) kifejezést kapjuk. Ha a Yates- (folytonossági) korrekciót is figyelembe vesszük, a próbastatisztika 2 N ad − bc − 2 χ 02 = N (a + b )(c + d )(a + c )(b + d ) Ez is a megfelelő u 0 négyzete. Helyettesítsük be a példa számadatait: 2 2 2 2 30 ⋅ 41 30 ⋅ 20 31 ⋅ 41 31 ⋅ 20 13 − 18 − 7 − 23 − 61 61 61 61 2 χ0 = = 2.394 + + + 30 ⋅ 41 30 ⋅ 20 31 ⋅ 41 31 ⋅ 20 61 61 61 61 73
Átalakítva: χ 02 = N (a ⋅ d − b ⋅ c )2 (23 ⋅13 − 7 ⋅18)2 = 2.394 = 61 ⋅ (a + b )(c + d )(a + c )(b + d ) (23 + 7 )(18 + 13)(23 + 18)(7 + 13) Yates-korrekcióval: 2 2 61 N 23 ⋅13 − 7 ⋅18 − ad − bc − 2 2 = 61 ⋅ = 1.62 Y=N (a + b )(c + d )(a + c )(b + d ) 762600 Megjegyzendő, hogy az u 0 próbastatisztika a következőképpen is átalakítható: u0 = πˆ1 − πˆ 2 1 1 + n 1 n2 = πˆ (1 − πˆ ) ad − bc = N = r1r2 c1c2 a c − a+b c+d = a+c b+d 1 1 + N N a+b c+d r1c1 N r1r2 c1c2 N3 a− 3.22 A sor- és oszlop-összegek sem rögzítettek: McNemar-próba 32. példa (G.AWalker: Common statistical methods for clinical research with SAS examples, CollinsWellesley Publishing, San Diego, California, 1996) A páciensek kezelést kapnak. A kérdés az, hogy a k ezelésnek van-e mellékhatása a vizelet bilirubin-szintjére, vagyis hogy a
kezeléstől megváltozik-e a bilirubin-szint. A táblázatban a „nincs” azt jelenti, hogy nem magas a szint, a „van” azt jelenti, hogy magas. Kezelés előtt Σ nincs van Kezelés után nincs van 60 14 6 6 66 20 Σ 74 12 86 Véletlenszerűen kiválasztottak 86 pácienst. Mindenkinek megmérték a bilirubin-szintjét kezelés előtt és kezelés után is. Itt a két szempont, ami szerint a kategorizálást végezték, a kezelés előtti és utáni állapot. Ezt a feladatot a 23. példában a McNemar-próbával oldottuk meg: 74 b−c b−c u0 = 2 = b+c b+c 4 A folytonossági korrekcióval: u0 = b − c −1 b+c Mivel az u-eloszlású valószínűségi változó négyzete ν= 1 szabadsági fokú χ2- eloszlású, a következőt is írhatjuk: χ 2 0 2 ( b − c) = χ ill. b+c χ 02 = ( b − c − 1) = 2 (b − c )2 = (14 − 6)2 b+c 14 + 6 2 0 b+c = 3.197 Ha folytonossági korrekciót is alkalmazzuk: ( b − c − 1) = 2 χ 2 0 b+c = (14 − 6
− 1)2 14 + 6 = 2.45 p=0.118, természetesen ugyanakkora, mint az u-próbával talált érték 3.23 A sor- és oszlop-összegek sem rögzítettek (függetlenségvizsgálat) A 3.4 pontban bemutatandó képlet szerint a függetlenségvizsgálat próbastatisztikája a következő: χ 2 0 2 2 ( ( 60 ⋅ 6 − 14 ⋅ 6 ) ad − bc ) = 86 ⋅ =N (a + b )(c + d )(a + c )(b + d ) 74 ⋅12 ⋅ 66 ⋅ 20 = 5.58 A folytonossági korrekcióval: 2 2 86 N 60 ⋅ 6 − 14 ⋅ 6 − ad − bc − 2 2 χ 02 = N = 3.98 = 86 ⋅ (a + b )(c + d )(a + c )(b + d ) 74 ⋅ 12 ⋅ 66 ⋅ 20 χ 02.025 (1) = 5024 3.24 A sor- és oszlop-összegek is rögzítettek 33. példa A 27. példa adatai a következők voltak: tényleges sorrend tej előbb vélt sorrend tej előbb tea előbb 3 1 4 tea előbb 1 4 3 75 4 4 8 A feladatot Fisher egzakt próbájával oldottuk meg, melyre a nagymintás próbastatisztika (az illusztráció kedvéért
eltekintve attól, hogy a minta itt nem biztos, hogy eléggé „nagy”): u0 = c1r1 N c1r1 ( N − r1 )( N − c1 ) N 2 ( N − 1) a− Mivel az u-eloszlású valószínűségi változó négyzete ν= 1 szabadsági fokú χ2- eloszlású, a következőt is írhatjuk: 2 2 cr cr a − 1 1 a − 1 1 N N χ 02 = = c1r1 ( N − r1 )( N − c1 ) c1c2 r1r2 2 N ( N − 1) N 2 ( N − 1) Behelyettesítve: 2 4⋅4 3 − 8 2 χ0 = = 1.75 4⋅4⋅4⋅4 8 2 (8 − 1) p=0.186, ez jelentősen eltér a pontos számítással kapott 024-tól, de nyilvánvalóan nem volt elég nagy a minta a nagymintás számításhoz. 3.3 Cochran, Mantel és Haenszel módszere több táblázat együttes kezelésére Előfordul, hogy a kísérletsorozatot több kisebb részben végzik el, különböző helyszíneken, időpontokban vagy különböző körülmények között. Ilyenkor a nullhipotézis szerinti valószínűségek különbözők
lehetnek az egyes rész-kísérletekre, tehát nem vonhatjuk össze az adatokat egyetlen 2x2-es táblázatban. A módszer alkalmazásakor kihasználjuk, hogy a normális eloszlású valószínűségi változók összege is normális eloszlást követ, vagy azt, hogy a χ2 eloszlású valószínűségi változók összegezhetők. Utóbbi esetben a szabadsági fokszámok összegződnek A sor- és oszlop-összegek is rögzítettek (Ez volt az eredeti Mantel-Haenszel-próba) A próbastatisztika két alakja: k u0 = ill. c1k r1k (N k − r1k )( N k − c1k ) ∑k N k2 (N k − 1) ∑ a k − c1k r1k Nk 76 2 c1k r1k ∑ ak − N k k 2 χ0 = c r ( N − r )(N − c ) ∑k 1k 1k Nk 2 (N1k − 1)k 1k k k A szabadsági fokszám a k-val indexelt rész-táblázatok száma. A sorösszegek rögzítettek (Ez Cochran javaslata) A próbastatisztika két alakja: k u0 = ill.
c1k r1k (N k − r1k )( N k − c1k ) ∑k N k3 ∑ a k − c1k r1k Nk 2 c1k r1k ∑ a k − N k k χ 02 = c1k r1k ( N k − r1k )(N k − c1k ) ∑k N k3 Sem a sor- sem az oszlop-összegek nem rögzítettek A McNemar próba figyelembe veszi, hogy a vizsgált egyedek egy rész-kísérletnél is különbözőek, ehhez képest nem jelent különbséget, hogy több rész-kísérletet együtt dolgozunk föl, Az egyesített táblázatban b (n 12 , tehát pl. a nem volt-lett kombinációjú egyedek száma) helyett ∑ bk (a részk kísérletekben együtt a nem volt-lett kombinációjú egyedek száma) áll. A próbastatisztika két alakja: u0 = ∑ (b ∑ (b k k χ 02 − ck ) k k + ck ) ∑ (b − c ) = ∑ (b + c ) k k k k k 2 k A szabadsági fokszám a k-val indexelt rész-táblázatok száma. 3.4 χ2-próba az rxc táblázatok elemzésére A χ2-próba alkalmazása az u-próba helyett a 2x2-es táblázatok
elemzésére nem jár látható előnnyel. Sokszor azonban a kísérletek eredményeit összefoglaló táblázatoknál nemcsak két sor és két oszlop értelmezhető, hanem általánosan r sor és c oszlop, az ilyen táblázatokat általánosan rxc táblázatoknak nevezzük. 77 Ezek kiértékelésére általánosan a χ 2 = ∑ (Oi − Ei )2 formulára épülő χ2-próbát használjuk, ennek Ei i r c i j kétdimenziós táblázatokra használatos alakja: χ = ∑∑ 2 (O ij − Eij ) 2 Eij . 3.41 χ2-próba a homogenitás vizsgálatára az rxc táblázatokban Leggyakoribb az az eset, amelynél a sorösszegek rögzítettek. Ilyenkor r csoportot (pl kezelést vagy gyógyszert) hasonlítunk össze, és a k imenetel c-féle lehet (pl. teljesen meggyógyult, javult, nem változott, romlott). A csoportok (sorok) független multinomiális eloszlásokat alkotnak, ami azt jelenti, hogy az egyes csoportokra külön-külön multinomiális eloszlás vonatkozik. O ij az
i-edik csoportból a j kimenetelű esetek talált száma, E ij pedig e szám várható értéke. A nullhipotézis E ij –re vonatkozik. Tipikusan ilyenkor a nullhipotézis az, hogy a multinomiális eloszlások paraméterei megegyeznek (pl. a többféle gyógyszernél egyforma az esélye annak, hogy valaki teljesen meggyógyuljon), vagyis hogy valamely kimenetel előfordulásának π j valószínűsége azonos minden i csoportra: H 0 : π j i = π j , minden i-re és j-re. A nullhipotézis érvényessége esetén πˆ j = pedig Eij = riπˆ j = ri c j ∑n i N ij = cj N , az előfordulások várható számának becslése N Mivel a szummának rc tagja van, de a c számú π j paramétert az adatokból kell becsülnünk (csak c1 független), és adottak a sor-összegek, ezért a szabadsági fokszám (r − 1)(c − 1) . 34. példa (G.EP Box, WG Hunter, JS Hunter: Statistics for experimenters, J Wiley, 1978, p 145) Öt kórházban hasonlították össze egy bizonyos
betegség-típusban szenvedők gyógyulási statisztikáit: nincs javulás részleges javulás teljes gyógyulás Σ kórház A 13 B 5 C 8 D 21 E 43 Σ 90 18 10 36 56 29 149 16 16 35 51 10 128 47 31 79 128 82 367 Kezeljük egyelőre a javulási fokozatokat névleges skálán mért értékeknek. E11 = r1c1 90 ⋅ 47 = = 11.53 N 367 78 χ 02 = (13 − 11.53)2 + = 019 + 089 + = 567 11.53 ν = (r − 1)(c − 1) = (3 − 1)(5 − 1) = 8 χ 02.05 (8) = 15507 Elutasítjuk a nullhipotézist, szignifikáns a különbség a kórházak között. A nem-gyógyulás es élye az „E” kórházban a l egnagyobb. Az összes kórházat nézve átlagosan 90/367=0.2452 a becsült valószínűsége, hogy nem gyógyul meg a beteg Az „E” kórházban 43/82= 0.52 az esélye a nem-gyógyulásnak Az „E” kórház klinika, tehát ott kezelik a súlyos eseteket. Következő kérdés: Az „E” kórház szignifikánsan különbözik-e a többi kórháztól? H 0 : nincs
különbség Aggregált táblázat: nincs javulás részleges javulás teljes gyógyulás Σ E11 = χ 2 0 A+B+C+D 47 120 118 285 E 43 29 10 82 Σ 90 149 128 367 90 ⋅ 285 = 68.89 367 2 ( 47 − 68.89 ) = + . = 499 68.89 ν = (r − 1)(c − 1) = (3 − 1)(2 − 1) = 2 χ 02.05 (2) = 5991 Szignifikáns különbség van az „E” és a többi kórház között. A χ2-próba alkalmazásának feltétele, hogy az E ij várható előfordulási számok elég nagyok legyenek. Az irodalomban legtöbbször hivatkozott Cochran-féle kritérium az, hogy E ij nem lehet kisebb 1-nél, és a cellák legföljebb 20%-ában lehet kisebb 5-nél. Conover szerint ez a korlátozás túlságosan szigorú, ha néhány E ij érték 0.5 kör ül van, de a többség nagyobb 1-nél, az eljárás alkalmazható. Ha túlságosan kicsinyek a várható előfordulási számok, a cellákat összevonhatjuk 3.42 χ2-próba a változók függetlenségének vizsgálatára az rxc táblázatokban A kísérlet abban
áll, hogy véletlenszerűen kiválasztanak N egyedet, és azokat két szempont szerint kategóriákba sorolják. Itt is használható elvileg a McNemar-próbához hasonló eljárás, amellyel azt vizsgálnánk, hogy a két szempont szerinti besorolás azonos-e, nyilván ennek csak akkor van 79 értelme, ha a két osztályozási szempont analóg (és azonos számú kategóriát használ). Gyakrabban teszik föl a másik típusú kérdést, hogy a két szempont szerinti besorolás független-e egymástól. A nullhipotézis: H 0 : π ij = π i +π + j ahol c r π i + = ∑ π ij π + j = ∑ π ij j i A hipotézisben szereplő valószínűségeket becsülnünk kell, ez csökkenti a szabadsági fokok számát. c πˆ i + = r ∑n ij j πˆ + j = N ∑n i ij N A π i + sor-összegekből r van (ahány sor), a π + j oszlop-összegekből c (ahány oszlop), de ezek nem mind függetlenek, közöttük egy összefüggés van, az egész táblázatra a valószínűségek
összege 1. Így a szabadsági fokok száma: ν = (r − 1)(c − 1) A χ2 próbastatisztika kifejezésébe helyettesítendő nullhipotézis szerint számított előfordulási szám: Eij = Nπˆ ij = ri c j N 35. példa (A. Agresti: Categorical data analysis, J Wiley, 2002, p 80) végzettség nem érettségizett érettségizett egyetem-főiskola Σ vallási szigorúság szigorú mérsékelt liberális 178 138 108 570 648 442 138 252 252 886 1038 802 πˆ1+ = 424 = 0.156 2726 E11 = 424 ⋅ 886 = 137.8 sit 2726 πˆ +1 = Σ 424 1660 642 2726 886 = 0.325 2726 ν = (r − 1)(c − 1) = 2 ⋅ 2 = 4 A próbastatisztika talált értéke: χ 2 0 2 ( 178 − 137.8) = 137.8 + ⋅ ⋅ ⋅ = 69.2 A kritikus érték a táblázatból: χ 02.05 (4) = 948 80 A függetlenség hipotézisét elutasítjuk. Megjegyzendő, hogy a példában mindkét kategorizálási szempont sorrendi skálaként is értelmezhető, itt pedig ezt nem vettük figyelembe. 81 3.5 Az asszociáció
mértékének vizsgálata A χ2-próbával döntést hozunk arról, hogy két változót függetlennek tekinthetünk-e, de ha nem fogadjuk el őket függetlennek, jogosan kérdezzük az összefüggésük mértékét. A χ 02 próbastatisztika nagysága függ a minta-elemszámtól: ha kétszeresére növeljük mindegyik cellában az előfordulások számát, megváltozik χ 02 értéke. Hogy a statisztikai szignifikancia változzék az esetek számával, rendjénvaló, de az összefüggés mértékének jellemzésére emiatt nem alkalmas. Kézenfekvő a χ 02 olyan módosítása, aminek következtében kevésbé függ a szabadsági foktól, így kapjuk az ún. kontingencia-együtthatókat A φ 2 definíciója: χ 02 φ2 = N A Cramér-féle kontingencia-együttható a következő: χ 02 V= N (q − 1) , ahol q = min{r , c} , pl. 2x2-es táblázatra q=2 A Pearson-féle kontingencia-együttható: χ 02 N + χ 02 C= Ennek érdekes tulajdonsága, hogy ha a két kategóriát
számokkal kódoljuk (pl. 1 és 0), akkor a két változó közötti korrelációs együttható éppen a Pearson-féle kontingencia-együttható lesz. Szokás a φ 2 négyzetgyökét használni, különösen 2x2-es táblázatra, asszociációs együttható néven. Ennek előjele alapján beszélhetünk pozitív vagy negatív asszociációról Gyakran használt mutató a Cohen-féle κ (kappa), melynek definíciója: κ= p0 − pe 1 − pe ahol p 0 azon esetek aránya, amelyek között megegyezés van a két változóban, p0 = ∑n i ii N pe = ∑ i ni + n + i N2 p e pedig ennek az aránynak a várható értéke, ha a két változó független. A κ varianciája: σ κ2 = 1 2 N (1 − pe ) ni + n+i ni + + n+i 2 pe + pe − ∑ 2 N i N 82 35. példa (B. Rosner: Fundamentals of Biostatistics, Duxbury Press, 5th ed 2000, p 407) Egy vizsgálatnál ellenőrzik, hogy két felmérés koherens volt-e. Két különböző időpontban
kérdőívet küldenek ki, amelyekben az étkezési szokásokról érdeklődnek. Az egyik (ellenőrző) kérdés azt firtatja, hogy hetente hányszor esznek marhahúst. Az eredmények: 1. kérdőív χ 02 = N N V2 = p0 = i κ= = 77.42 ii N = = 77.42 = ?????? 537 ⋅ (2 − 1) 136 + 240 = 0.700 537 ni + n+i 228 ⋅ 205 309 ⋅ 332 = + = 0.518 537 2 537 2 N2 p0 − pe 0.7 − 0518 = 0.378 = 1 − pe 1 − 0.518 σ κ2 = = χ 02 ∑n pe = ∑ Σ 228 309 537 = 0.144 N (q − 1) i 2. kérdőív >1 92 240 332 (ad − bc )2 (136 ⋅ 240 − 92 ⋅ 69)2 = 537 ⋅ (a + b )(c + d )(a + c )(b + d ) 228 ⋅ 309 ⋅ 205 ⋅ 332 χ 02 φ2 = ≤1 >1 Σ ≤1 136 69 205 1 n n n + n+i p + pe2 − ∑ i + 2+i i + 2 e N N (1 − pe ) i N = 1 228 ⋅ 205 ⋅ (228 + 205) + 309 ⋅ 332 ⋅ (309 + 332) 0.518 + 0518 2 − = 0.00185 2 537 3 537 ⋅ (1 − 0.518) σ κ = 0.043 A κ szignifikanciájára
statisztikai próbát végezhetünk: u0 = κ 0.378 = = 8.8 σ κ 0.043 Ugyan a próba szerint κ szignifikánsan különbözik zérustól, de mégsem túlságosan nagy. A következő döntési táblázatot ajánlják: κ > 0.75 0.4 ≤ κ ≤ 075 0 ≤ κ < 0.4 kiváló reprodukálhatóság jó reprodukálhatóság gyenge reprodukálhatóság 83 3.6 Vizsgálatok sorrendi skálán mért változókkal A kontingencia-táblázatoknál névleges skálán mért változók közötti összefüggéseket tanulmányozzuk. Egyes vizsgálat-típusoknál jogos megkülönböztetnünk független és függő változókat. Már a k órház-példánál is fölmerülhet, hogy a javulási fokozatok tulajdonképpen nem névleges, hanem sorrendi skálán mért értékek. Itt a kimenetelt (a függő változót) értelmezzük sorrendi skálán A kérdés az, hogy a csoportok (az egyes kórházakban ápolt betegek) között van-e különbség a kimenetelt illetően. Ha két csoportunk van, a
Wilcoxon-Mann-Whitney-próbát alkalmazhatjuk, több csoportra a később ismertetendő Kruskal-Wallis-próbát használhatjuk. E rang-alapú próbáknál az okoz nehézséget, hogy mivel a kimenetelnek csak néhány kategóriáját különböztetjük meg (pl. nincs javulás, részleges javulás, teljes gyógyulás), nagyon sok kapcsolt rang lesz. Más esetekben a független változót mérjük sorrendi skálán, a függő változót névleges skálán. Ez utóbbi esetre alkalmazható a Cochran-Armitage-próba. 36. példa (D.G Altman: Practical Statistics for medical research Chapman and Hall 1991, p 261) Azt vizsgálták, hogy a császármetszés szükségessége a szülésnél összefüggésbe hozható-e a szülő nő cipő-méretével (angolszász egységekben/hüvelykben). cipőméret <4 4 4.5 5 5.5 6+ Σ császármetszés igen 5 7 6 7 8 10 43 nem 17 28 36 41 46 140 308 Σ 22 35 42 48 54 150 351 A következő ábra az előfordulás relatív gyakoriságának a cipőmérettől
való függéséről készült, a pontokon látható számok az abba a cipőméret-kategóriába eső szülő nők számát mutatják)! 84 Scatterplot (caesar.sta 8v*6c) 0,24 22 0,22 35 0,20 0,18 0,16 48 42 54 0,14 rfreq 0,12 0,10 0,08 150 0,06 0,04 <4 4 4.5 5 5.5 6+ shoesize Úgy tűnik, van összefüggés (természetesen nem a cipő miatt, hanem a cipő méretében megnyilvánuló testméretnek tulajdoníthatóan). Amit vizsgálni kell, hogy a különbségek nem tulajdoníthatók-e a véletlen ingadozásnak, ami egyébként szintén látszik az ábrán. A hipotézis úgy is megfogalmazható, hogy a cipőmérettel nem változik lineárisan a császármetszés előfordulásának valószínűsége, ill. hogy a császármetszés előfordulásának relatív gyakoriságaira illesztett egyenes meredeksége zérus. Az illesztésnél figyelembe kell venni, hogy az egyes kategóriákban a szülő nők száma nem azonos. S regr Levezethető, hogy a próbastatisztika , ahol
π a császármetszés előfordulás valószínűsége, π (1 − π ) ami a nullhipotézis szerint egyforma az összes kategóriára, becslése az összes előfordulások száma 43 2 osztva az esetek összes számával, itt πˆ = = 0.1225 , S regr pedig az ∑ ( y i − y ) eltérés351 négyzetösszeg felbontásakor kapható regresszióhoz tartozó négyzetösszeg, értéke megtalálható az egyenes illesztésnél szokásos ANOVA táblázatban. Ha igaz a nullhipotézis, a fenti próbastatisztika χ2-eloszlású. Analysis of Variance; DV: rfreq (caesar.sta) Sums of df Mean F p-level Effect Squares Squares Regress. 0,862539 1 0,862539 2215,921 0,00 Residual 0,135847 349 0,000389 Total 0,998385 A Regress. sorban a Sums of Squares oszlopban lévő regressziós négyzetösszeget (08625) kell a képlet szerint p (1 − p ) = 0.1225 ⋅ (1 − 01225) = 01075 -del elosztani, a χ2 próbastatisztika értéke így 0.862539 χ 02 = = 8.023 Az 1 szabadsági fokhoz tartozó p=00046 0.1075 Az
eltérés a nullhipotézistől (a cipőmérettel nem változik lineárisan a császármetszés előfordulásának valószínűsége, ill. a császármetszés előfordulásának relatív gyakoriságaira illesztett egyenes meredeksége zérus) szignifikáns, méghozzá nagyon meggyőzően. A függést csak korlátozott értelemben számszerűsíthetjük, tehát például az illesztett egyenesből nem számolhatjuk ki, hogy mi lenne a valószínűsége, hogy egy 3-as cipőt viselő nőnél 85 császármetszéshez kell folyamodni. Azért nem, mert a l egalsó és legfölső cipőméret-kategóriát önkényesen kódoltuk 3.5-nek ill 6-nak, ha másképp kódoljuk, más meredekséget kapunk p i : i-edik oszlopban a császármetszés előfordulásának valószínűsége ki pi = 5 22 = ηi π i = α ′ + βxi = α + β (xi − x ) Ilyen egyenest súlyozva kell illeszteni Binomiális eloszlás varianciája: ki π i (1 − π i ) = ni ni Var (ϕ i ) = Var (ki ) = ni ⋅ π i (1 −
π i ) βˆ = ∑ ω ⋅ p (x − x ) ∑ ω (x − x ) i i i i i i 2 i ∑ ω [ p − a − b(x − x )] i i i 2 i = min a = αˆ , b = βˆ Var ( pi ) = ωi = ni ni π i (1 − π i ) () Var βˆ = n= π i (1 − π i ) ∑ω (x 2 i i i = 1 ωi − x ) ⋅ Var ( pi ) 2 2 ∑ ω i ( xi − x ) i 2 βˆ − β () Var βˆ pi ⋅ ni ( xi − x )2 ∑ π i (1 − π i ) i βˆ 2 2 λ0 = = 2 ni ( xi − x ) Var βˆ ∑i π (1 − π ) i i 2 () H 0 : A császármetszés szükségességének valószínűsége egyenlő mindegyik cipőméret esetében. χ 2 0 [ p ⋅ n (x (π = π ) = ∑ i i i i ] − x) 2 π (1 − π )∑ ni (xi − x )2 i 86 ∑k π≈ ∑n i i χ 02 = i i = 43 = 0.1225 351 0,8625 = 8.023 0.1225 ⋅ (1 − 01225) 0.01-ig elutasítjuk a H 0 -t, de 0001-es szinten elfogadjuk (10827) A példa más megközelítésű megoldását a logit-regressziónál a 4.3 pontban
ismertetjük 87