Tartalmi kivonat
1 1. ALAPFOGALMAK Az üzleti statisztika nem más, mint a matematikai statisztika (továbbiakban statisztika) módszereinek alkalmazása az üzleti, gazdasági életben felmerülő problémák megoldására. A statisztikai módszerek a valószínűségszámítás fogalmait, eredményeit használják. A statisztikai módszerek alkalmazása segítheti az alkalmazót a különböző döntések meghozatalánál. E módszerekkel kapcsolatban azt is mondhatjuk, hogy a rendelkezésünkre álló adatokból előállítjuk a döntéshozáshoz szükséges információt. Mindenekelőtt meg kell ismerkednünk a statisztika két alapvető fogalmával a populációval, illetve a mintával. 1.1 MÉRÉS FOGALMA, MÉRÉSI SKÁLÁK Általánosan mérésnek nevezzük azt a folyamatot, amelynek során megállapítjuk, hogy a vizsgált egyed a tekintett tulajdonság(ismérv) milyen mértékével rendelkezik. A mérés végeredménye egy számérték, amit adatnak is szokás nevezni. Ahhoz, hogy egy
mérést elvégezhessünk szükségünk van egy pontos mérési utasításra, amit mérési skálának nevezünk. Az adatok elemzésének mindig az a célja, hogy a döntéshozáshoz hasznos információt nyerjünk belőlük. Az adatok információtartalma függ attól, hogy milyen mérési skálát alkalmaztunk . A mérési skáláknak négy típusát különböztetjük meg Magát a kapott adatot is ugyanolyan típusúnak nevezzük, mint amilyen típusú mérési skála alkalmazásával nyertük az illető adatot. A továbbiakban x A , illetve x B jelentse valamely mérés eredményét az A és B egyedek esetén. 1.11 Nominális mérési skálák Nominális mérési skála alkalmazása esetén az egyedeket tulajdonképpen osztályokba, kategóriákba soroljuk. Például, amikor bizonyos katalógusokban adatokat közölnek szállodákról, közöttük szerepel általában azt is, hogy szobákban van-e televízió vagy nincs. Ez egy nominális adat, amelynek két megfigyelt értéke
lehetséges: VAN, NINCS A populációt ebben az esetben pl. a tekintetbe vett ország(ok) szállodái alkotják Ezen nominális adat alapján a szállodák két csoportra oszthatók. Természetesen lehetőség van ilyen esetben a két lehetséges értékhez ténylegesen számokat is hozzárendelni. (kódoljuk az értékeket) pl: 0 jelentheti azt, hogy nincs és 1 jelentheti, hogy van. Ez a hódolás természetesen teljesen önkényes lehet, ez semmilyen mértékben nem befolyásolja az adatok információ tartalmát. 2 Nominális mérési skála esetén a mérés eredményeként kapott számértékek között fennálló x A = x B , illetve x A ≠ x B relációknak van csak információ tartalmuk. Nevezetesen, ha x A = xB , akkor az A és B egyedek a vizsgált ismérv szerint ugyanabba az osztályba tartoznak, és ha x A ≠ x B akkor az A és B egyedek a vizsgált ismérv szerint különböző osztályokba tartoznak. Az utóbbi esetben annak, hogy a két szám közül melyik a
kisebb, hogy mennyivel kisebb stb. semmilyen információt nem szolgáltat a két egyedről a vizsgált tulajdonság szempontjából. A nominális adatokat az irodalomban szokás kategorikus adatoknak is nevezni. 1.12 Ordinális mérési skálák Ordinális mérési skáláról beszélünk akkor, ha az egyedek bizonyos dolgokat összehasonlítanak, rangsorolnak. Például egy utazó ügynököt, aki mostanában három szállodában is lakott, A, B, és Cben megkérdeztek, hogy az általános benyomásai alapján minősítse ezeket. Az ügynök a következőt válaszolta: az A szálloda jobb, mint a B, a C szálloda ugyanolyan, mint B. Az állításai lehetővé teszik a szállodáknak egy rangsorolását. A rangsort un rangszámokkal írjuk le: az A szálloda az 1-es rangszámot, a B és C viszont egyaránt 2es rangszámot kapnak, ezek a numerikus értékek a sorrendiséget jelentik. Az ügynök a "jóság" szerinti sorrendben az 1. helyre helyezte az A szállodát, a B-t
és C-t egyaránt a 2.-ra Ezek a rangszámok azonban semmit nem mondanak arról, hogy A mennyivel volt jobb, mint a másik kettő, illetve, hogy B és C mennyiben voltak egyformák. A marketingben alkalmazott kérdőíves felmérésekben nagyon gyakoriak az ordinális adatok, amikor a fogyasztóktól azt kérik, hogy rangsoroljanak két vagy több terméket. Ordinális mérési skála esetén a mérés eredményeként kapott számértékek között fennálló x A = x B , illetve x A ≠ x B relációkon kívül x A ≠ x B esetén még annak is van információ tartalma, hogy milyen nagyság szerinti relációban vannak a mérési eredmények. Ha x A = x B , akkor az A és B egyedek a vizsgált tulajdonság megegyező mértékével rendelkeznek. Ha x A < x B , akkor az A a vizsgált tulajdonság kedvezőtlenebb(kisebb) mértékével rendelkezik, mint B. 3 Az x B − x A különbség viszont nem jelenti azt, hogy ennyivel kevesebbel, az x B / x A pedig nem jelenti azt, hogy
ennyiszer kevesebbel rendelkezik. 1.13 Intervallum skálák Intervallum skálán való mérés esetén a mérési eredmények különbsége is információt szolgáltat az egyedekre vonatkozóan. A nemzetközi gyakorlatban a szállodák minősítése az ötfokozatú un. "*"-os rendszerben történik. Szigorú szabályok írják elő, hogy milyen szolgáltatások szükségesek az egyes osztályokba való besoroláshoz. Tegyük fel, hogy az előző példában szereplő három szálloda besorolása ebben a rendszerben a következő: A: *, x A = 4 B: * , xB = 2 C: *. xC = 1 Ezen adat, nemcsak rangsorolja a szállodákat, hanem a szolgáltatások hasonlóságára vonatkozó információt is nyújt. Ezek az adatok azt mondják számunkra, hogy A és B kevésbé hasonlók (nagyobb köztük a különbség), mint B és C (kisebb köztük a különbség), ezt az információt hordozza a mérési eredmények különbségeinek nagyság szerinti összehasonlítása: x A − x
B = 2 > 1 = x B − xC Ezekre a skálákra az általában az jellemző, hogy a 0-pontjuk önkényes, ezért ha egy tulajdonságot(ismérvet) intervallum skálán mérve 0 adódik, az nem jelenti azt, hogy az illető egyed a tekintett tulajdonság semmilyen mértékével nem rendelkezik. arányt kifejező adatok. Tipikusan ilyen skála a Celsius-féle hőmérsékleti skála: a 0-pontaja önkényes, azt a hőmérsékletet tekintjük 0 hőmérsékletnek, ahol a víz megfagy. Hasonlóan intervallum típusú adatot szolgáltatnak a különböző index számok: itt a viszonyítási alap megválasztása önkényes. 1.14 Arány skálák Arány skálák azok, amelyek esetén a mérési eredmények hányadosának is információtartalma van: x A / x B azt adja meg, hogy az A egyed a vizsgált tulajdonságból hányszor annyival rendelkezik, mint a B egyed. Az arányskálák 0-pontja nem önkényes. Amilyen sorrendben definiáltuk az egyes mérési skálákat az egy bizonyos hierarchiát is
jelent a skálák között. A legalacsonyabb hierarchiájú a nominális skála, a legmagasabb hierarchiájú az arány skála. 4 Egyrészt az, hogy egy adott jellemzőt milyen skálán mérhetünk egyáltalán az függ magától a jellemzőtől. Például egy régió lakosainak, ha a nemét vizsgáljuk, akkor ezt a jellemzőt csak nominális skálán lehet mérni. Ha valamely jellemző mérhetünk egy bizonyos típusú skálán, akkor azt minden nála alacsonyabb hierarchiájú skálán is lehet mérni. Például, ha egy jellemzőt intervallum skálán lehet mérni, akkor ordinális és nominális skálán is lehet stb. Az egyes skálákról adattípusokról tanultakat tömören az alábbi táblázatban foglaljuk össze: Skála Nominális Ordinális Intervallum Arány Alkalmazható alapvető műveletek egyenlőség megállapítás Tipikus statisztikai módszerek* Tipikus esetek Leíró Próbák 2 Osztályozások: modus próbák κ demográfiai gyakorisági relatív adatok
táblázatok gyakoriság egy termékből tesztelése milyen márkát fogyaszt valaki kisebb, Rangsorolások: medián, nemnagyobb preferenciák kvartilisek paraméteres relációk meghatározása módszerek, megállapítás rang-korreláció különbségek különböző terjedelem, minden, amit képzése, és index számok, átlag, egyébként a ezek attitűd skálák, szórás populáció összehasonlítás márkák eloszlása a ismertségi foka megenged hányadosok képzése és ezek összehasonlítás a eladások nagysága, termelés volumene költségek, fogyasztók száma *Minden statisztikai módszer, amelyek egy adott típusú skála esetén megengedett, az alkalmazható az összes nála magasabb hierarchiájú skála esetén is. 1.2 POPULÁCIÓ ÉS MINTA FOGALMA Statisztikai vizsgálatot mindig bizonyos egyedek meghatározott összességében végzünk, miközben ezen egyedeknek bizonyos jellemző adatairól (kvantitatív, vagy kvalitatív) akarunk információt szerezni.
Ekkor tehát adott számunkra egy halmaz, az egyedek összessége és a vizsgált jellemzők összessége. A statisztikai vizsgálat tárgyát képező egyedek összességét a tekintett jellemzőkkel együtt populációnak(vagy statisztikai sokaságnak) nevezzük. A populáció mindig igen nagy számú egyedből áll 5 Példák a populációra 1. példa Tekintsünk egy város, például Szeged lakosait, és vegyük az életkorukat A fenti értelemben Szeged lakosai, az életkorukkal egy populációt alkotnak. Egy másik populációt kapunk, ha Szeged lakosait és éves jövedelmüket tekintjük. A fenti példában a populáció elképzelése különösebb nehézséget nem okozott, az egyedek a "nemünk előtt" vannak, fizikailag léteznek. Lehetségesek azonban más természetű populációk is, amelyeknél az "egyedeket" csupán képzeletben gyűjtjük össze. Ezekre az jellemző, hogy vizsgálataink során közülük elvileg bármelyik realizálódhat. Ha pl
egy részvénytársaság részvényeinek mondjuk július havi árfolyamát vizsgájuk, akkor a szóba jöhető árfolyamok, vagyis egy alsó és felső határ közötti valós számok összessége alkotja a sokaságot. A populáció egyedszáma lehet véges, vagy végtelen. Ha véges, akkor is minden esetben nagyon sok egyedből áll. A dolog lényege éppen ez Ugyanis, ha relatíve kevés egyedből állna, akkor egyszerűen megtehetnénk azt, hogy a bennünket érdeklő mennyiséget, tulajdonságot minden, a populációt alkotó egyed esetén megfigyeljük. Statisztikai sokaságok esetén ez a nagyon nagy egyedszám miatt roppant költséges és időigényes lenne, más esetekben, amikor az egyedek megvizsgálása a megszűnésüket eredményezi ( pl. a minőségellenőrzésben) ez egyszerűen lehetetlen is Ezért statisztikai módszerek alkalmazására van szükség. Statisztikai minta: A populációból véletlenszerűen kiválasztott egyedek (megfigyelések) összességét jelenti.
A statisztikai mintába tartozó egyedek száma már lényegesen kisebb a populáció egyedszámánál. A minta minden egyednél már el tudjuk végezni a kérdéses megfigyeléseket (méréseket). A statisztikai módszerek lényege éppen abban áll, hogy a mintába tartozó értékek törvényszerűségeiből következtetünk magában a populációban meglévő törvényszerűségekre. 2. példa Az amerikai Fortune magazin minden évben közli annak az 500 amerikai vállalatnak a listáját, amely a leggyorsabb volt az elmúlt évben a bevétel növekedése. Ezzel a listával kapcsolatban több populációt definiálhatunk: éves eladások, az egy részvényre jutó oktatók, milyen iparhoz tartozik az illető vállalat stb. Tegyük fel, hogy kiválasztunk (véletlenszerűen) 25 céget a listából. Ezen 25 vállalat éves eladásai egy mintát képeznek az illető populációra vonatkozóan. Tekintsük azt a legegyszerűbb esetet, amikor a populációt alkotó egyedek egy
tulajdonságát vizsgáljuk. Szeretnénk meghatározni ennek a tulajdonságnak az eloszlását a populációban. Ezt az eloszlást nevezzük a populáció eloszlásának vagy elméleti eloszlásnak. A X valószínűségi változót definiáljuk a következőképpen: válasszunk ki véletlenszerűen egy egyedet a populációból úgy, hogy bármely egyed egyenlő valószínűséggel kerülhet kiválasztásra, és X jelentse az illető tulajdonságot a kiválasztott egyed esetén valamely skálán mérve. A X valószínűségi változó eloszlása megegyezik a populáció eloszlásával. 1.1Példa Tegyük fel, hogy egy főiskolán 1000 hallgató van és vizsgáljuk a betöltött években mért életkorukat. Tegyük fel, hogy 350 18 éves, 450 19 éves és 200 20 éves van közöttük. 6 A populáció= a főiskola hallgatói + életkoruk A vizsgált jellemző(életkor) eloszlása a populációban: Életkor 18 19 20 Arány 0.35 0.45 0.20 Az általunk értelmezett
valószínűségi változó nyilván diszkrét, lehetséges értékei: 18, 19, 20. P ( X = 18) = 350 = 0.35 1000 P ( X = 19 ) = 450 = 0.45 1000 P( X = 20 ) = 200 = 0.20 1000 Ennek megfelelően a továbbiakban a vizsgát jellemző számunkra egy X valószínűségi változó, amelynek eloszlása a jellemző populációbeli eloszlása A statisztikai vizsgálatok célja általában az, hogy egy minta alapján a lehető legtöbb információt szerezzünk az X eloszlásáról. Amikor n elemű mintát veszünk, akkor n-szer ismételjük azt, hogy véletlenszerűen kiválasztjuk (visszatevéssel, vagy visszatevés nélkül) a populáció egy egyedét. A X i valószínűségi változó jelentse a vizsgált jellemző mért értékét az i-edik egyed esetén (i = 1,K n ) . Mivel a statisztikai vizsgálatok esetén a populációt alkotó egyedek száma mindig igen nagy, akár visszatevéssel, akár visszatevés nélkül történik az egyedek kiválasztása feltehető, hogy az X 1 , K , X n
valószínűségi változók függetlenek és eloszlásuk megegyezik a X valószínűségi változó eloszlásával. Statisztikai minta n elemű statisztikai mintának nevezzük az X 1 , K , X n , független, azonos eloszlású valószínűségi változókat, amelyek közös eloszlása megegyezik a tekintett X jellemző eloszlásával. X i -t i-edik mintaelemnek nevezzük (i = 1,K n ) . 7 2. LEÍRÓ MÓDSZEREK Amikor a populációból véletlenszerűen kiválasztjuk a mintába tartozó egyedeket, és az esetükben elvégezzük a szükséges méréseket a vizsgálataink tárgyát képező tulajdonságokat illetően, akkor ennek a folyamatnak a végeredménye általában egy nagy adategyüttes. Ha ezeket az adatokat egyszerűen csak egy táblázatban felsoroljuk például a mérések sorrendjében, akkor kapjuk az u.n nyers adatokat A nyers adatokban rejlő információ azonban nem szembetűnő. Nem látjuk rögtön, hogy az adatok milyen információt nyújtnak az egyes
populációk eloszlásáról, nem tudjuk észrevenni az egyes populációk közötti esetleges különbségeket, nem tűnik ki, hogy milyen kapcsolatok vannak az egyes vizsgált jellemzők között stb. A statisztikai elemzések első lépése ezért az úgynevezett leíró módszerek alkalmazása. Ezek a módszerek arra szolgálnak, hogy tömörítsük a nyers adatokban rejlő információt, amit úgy érünk el, hogy megfelelő módon szervezzük a nyers adatokat, szemléletesen megjelenítjük őket és esetleg néhány numerikus értékbe tömörítsük az általuk hordozott információt. 2.1 MINTA NUMERIKUS JELLEMZŐI 2.11 .A minta lokalizációjának jellemzése A továbbiakban tegyük fel, hogy a vizsgált X jellemzőre(változóra) vonatkozóan rendelkezésünkre áll az X 1 , X 2 K , X n n-elemű minta. n-et, a mintaelemek számát szokás mintanagyságnak is nevezni. 2.111 A minta átlaga. n x= ∑X i =1 n i , ami nem más, mint a mintaelemek számtani átlaga.
2.112 Legyen adott az A minta mediánja X 1 , X 2 K , X n n-elemű minta. Rendezzük ezeket nagyság szerint növekvő sorrendbe: X *1 , X 2 K , X n . Ezt az adott mintához tartozó rendezett mintának nevezzük. A minta mediánját me -vel fogjuk jelölni, és a következőképpen értelmezzük: 8 ⎧ X * k + X k +1 ⎪ me = ⎨ 2 ⎪ * X k +1 ⎩ 2.1Példa ha n = 2k ha n = 2k + 1 a) Legyen n=6 és X1 = 10, X 2 = 8 , X 3 = 12, X 4 = 5, X 5 = 9, X 6 = 11. A megfelelő rendezett minta: X *1 = 5, X 2 = 8 , X 3 = 9, X 4 = 10, X 5 = 11, X 6 = 12 , és me = 9 + 10 = 9.5, 2 azaz a nagyság szerint rendezett értékek közül a két középső számtani közepe. b) Legyen n=7 és X1 = 10, X 2 = 8 , X 3 = 12, X 4 = 5, X 5 = 9, X 6 = 11, X 7 = 4 . A megfelelő rendezett minta: X *1 = 4, X 2 = 5, X 3 = 8 , X 4 = 9, X 5 = 10, X 6 = 11, X 7 = 12 , és most me = 9. a nagyság szerint rendezett értékek közül a középső. Mindkét esetben az jellemző hogy a mediánnál
kisebb, illetve nagyobb mintaelemek száma megegyezik. Röviden azt is szoktuk mondani, hogy a medián felezi a mintát ( az előbbi értelemben). Ha a X jellemzőt ordinális skálán mértjük, akkor a minta elhelyezkedését jellemző paraméterek közül csak a mediánnak van értelme ( Ordinális adat esetén csak a mért értékek nagyság szerinti relációinak van információtartalma az egyedekre vonatkozóan!) 2.113 A minta módusa Nominális skálán mért jellemzők esetén sem a minta átlaga, sem a minta mediánja nem használható a mintában meglévő általános tendencia leírására.( Az ilyen típusú adatokkal nem számolhatunk, hiszen csak annak van igazi jelentése ilyen esetben, hogy két mérési érték egyenlő-e vagy nem.) A változónak azt az értékét, amelyiknek a legnagyobb a mintabeli gyakorisága nevezzük a minta módusának. Nominális adatok esetén ez az egyetlen értelmes numerikus jellemzője a mintának. Ha a változónak két olyan értéke
is van, amelyek gyakorisága egyenlő, és ez a maximális mintabeli gyakoriság, akkor a mintánkat bimodálisnak nevezzük, stb. 9 Természetesen a módust egyéb típusú adatok esetén is használhatjuk. Ha a változónk értékkészlete folytonos(azaz a vizsgált jellemző tulajdonság olyan, hogy akármilyen kis egységekben is mérhető), akkor a mintánkat csoportosítani kell, osztályokat kell képeznünk, és az egyes osztályok gyakoriságát kell meghatározni. Ilyenkor a maximális gyakoriságú osztályt modális osztálynak nevezzük. Ilyen esetben bimodális mintáról beszélünk abban az esetben is, ha van két olyan, nem szomszédos osztály, amelyeknek a gyakoriságai lényegesen nagyobbak, mint a többi osztály gyakoriságai (még akkor is ha ez a két gyakoriság nem egyezik meg egymással). 2.12 A mintaelemek szóródásának jellemzése A minta elhelyezkedését jellemző paraméterek csak részleges információt szolgáltatnak a mintáról. Az is
lényeges lenne, hogy a mintában megnyilvánuló centrális tendencián túl a mintaelemeknek a szóródását is jellemezzük valami módon. Az alábbi ábra három olyan mintát szemléltet, amelyek mindegyikének az átlaga és a mediánja egyaránt 45. Az azonban látható, hogy az elsőben a legnagyobb a mintaelemek változatossága, ezek szóródnak legjobban, a második minta esetén a mintaelemek már sokkal inkább az átlag köré koncentrálódnak, míg a harmadik minta esetén a szóródás a legkisebb mértékű. A mintaelemek szóródásának legegyszerűbb mérőszáma a minta terjedelme, ami nem más, mint a maximális és a minimális mintaelem különbsége. Általában a nagyobb mintabeli változatosság, szóródás a nagyobb terjedelemben tükröződik. A mintaelemek szóródásának mértéke azonban a terjedelmen kívül több dologtól is függ. A fenti ábrán az első és a második minta terjedelme azonos, mégis a laikus is azt mondaná az ábra alapján,
hogy a második esetben a mintaelemek változatossága nagyobb. Tekinthetnénk az egyes mintaelemek átlagtól való eltérését: 10 X i − x ,i = 1,K, n . Általában minél nagyobbak az eltérések abszolút értékei, annál nagyobb a mintaelemek szóródása. Azt fogjuk megvizsgálni, hogy ezeket az eltéréseket miként lehet egyetlen mérőszámba kombinálni. Természetesnek adódik az az ötlet, hogy vegyük az átlagtól való eltérések számtani átlagát: 1 n ∑ ( X i − x ) . Könnyen meggyőződhetünk róla, hogy ez egyáltalán n i =1 nem megfelelő mérő szám lenne, mert az átlagtól való pozitív és negatív irányú eltérések mindig kiegyenlítik egymást. Pontosan n n n n n n 1 ∑ ( X i − x ) = ∑ X i − ∑ x = ∑ X i − nx = ∑ X i − n ∑ X i i =1 2.121 i =1 i =1 i =1 i =1 n i =1 =0 A minta varianciája Mivel a mintaelemek szóródásának jellemzésekor igazából csak az átlagtól való eltérések nagysága
érdekel bennünket és nem az eltérés iránya, ezért úgy járunk el, hogy az átlagtól való eltérésnek vesszük a négyzetét: négyzetes eltéréseknek nevezzük. ( X i − x )2 . Ezeket röviden A minta varianciája: s2 = 1 n ( X i − x )2 , ∑ n − 1 i =1 ahol x a minta átlaga. A minta varianciája azt méri, hogy átlagosan mekkora a mintaelemeknek a minta átlagától vett négyzetes eltérése. ( Hogy a négyzetes eltérések összegét nem n-nel, hanem n-1-gyel osztjuk, annak technikai okai vannak. Nagy minták esetén ez nem okoz számottevő eltérést.) A mintában meglévő nagyfokú változatosság abban tükröződik, hogy nagy lesz a minta varianciája. 2.122 A minta szórása A minta s-sel jelölt szórása nem más, mint a minta varianciájának négyzetgyöke: s= 1 n ( X i − x )2 . ∑ n − 1 i =1 Ugyanazt az információt szolgáltatja tulajdonképpen, mint a minta varianciája, nevezetesen azt mutatja, hogy átlagosan milyen mértékben
szóródnak a mintaelemek a minta átlaga körül. A szóródás jellemzésére azért használjuk inkább az utóbbit, mert 11 ennek mértékegysége megegyezik a mintaelemek mértékegységével. A minta szórását szokás még a minta standard deviációjának is nevezni. 2.123 A minta kvartilisei A minta alsó- és felső kvarilisét k a -val, illetve k f -fel fogunk jelölni. Mindkettőt a mintához tartozó X *1 , X 2 K , X n rendezett mintából határozzuk meg. A minta alsó kvartilise olyan érték, amelyik a rendezett minta alsó 25%-át választja el a felső 75%-ától. A minta felső kvartilise olyan érték, amelyik a rendezett minta alsó 75%-át választja el az alsó 25%-ától A kvartilisek meghatározása a következő módon történhet. Osszuk a rendezett mintát két részre: vegyük az alsó 50%-ot, illetve a felső 50%-ot. Ha a minta elemszáma páratlan, akkor a mediánt - a rendezett minta középső elemét- vegyük hozzá mindkét részhez. A minta
alsó kvartilise az így kapott alsó 50% mediánja lesz, a felső kvartilise pedig a felső 50% mediánja. Ennek megfelelően például az alsó kvartilis minden esetben vagy a rendezett minta valamelyik elemével egyenlő, vagy a rendezett minta két szomszédos elemének a számtani átlagával. Hasonló igaz a felső kvartilisre is Megjegyezzük, hogy a minta kvartiliseinek meghatározása tekintetében az irodalom nem egységes. Vannak olyan módszerek is, amelyek esetén a kvartilisek a rendezett mintában 1-1 hellyel eltérő pozícióra eshetnek. Röviden szólva a kvartilisek és a medián negyedelik a mintát: ahol min és max a legkisebb, illetve a legnagyobb mintaelemet jelentik. 2.13 A minta ferdeségének jellemzése. A mintaelemek eloszlásának ferdeségét a 12 n n ∑ ( X i − x )3 f = i =1 (n − 1)(n − 2)s 3 u.n ferdeségi együtthatóval mérjük Ha ⎧= 0 a minta eloszlása szimmetrikus ⎪ f ⎨< 0 negatívan ferde a minta eloszlása ⎪> 0
pozitívan ferde a minta eloszlása ⎩ Az f = 0 eset a gyakorlatban szinte sohasem fordul elő. Ha a populáció eloszlása szimmetrikus, akkor is praktikusan nulla annak a valószínűsége, hogy ebből a szimmetrikus eloszlású populációból éppen olyan mintát választunk ki, amelyik maga is szimmetrikus. A kiválasztott mintánkban több kevesebb ferdeség mindig jelen van Itt az a kérdés merül fel, hogy milyen az a mintában meglévő ferdeség, a mi már arra utal, hogy azért ferde eloszlású a minta, mert már magának a populációnak is ferde volt az eloszlása, és nem csupán egy szimmetrikus eloszlású populációból vett minta véletlenszerűsége okozta ezt . Általában elfogadható az a szabály, hogy ha f < 1, akkor ezt nem tekintjük jelentős mintabeli ferdeségnek. Ez még nem utal arra, hogy a populáció eloszlása nem szimmetrikus f >1 jelentős mintabeli ferdeséget jelez és arra utal, hogy a populáció eloszlása is ferde. Azt már a módus
értelmezésénél említettük, hogy a mintában szereplő adatok típusától függ, hogy milyen numerikus jellemzők használatának van értelme. Intervallum és arány típusú adatok esetén az adat típusa nem jelent semmilyen korlátozást. Azonban ilyenkor is körültekintéssel kell eljárnunk A minta numerikus jellemzőit használjuk a populáció ismeretlen jellemzőinek a becslésére. Véletlenszerűen kiválasztott mintából számítjuk ezeket a jellemzőket, tehát maguk is véletlenszerűek, azaz valószínűségi változók. Ha a mintavételezést többször megismételjük, akkor például az egyes minták átlagai többé-kevésbe különbözni fognak. Nyilván azokat a jellemzőket preferáljuk, amik stabilabbak, azaz kevésbé befolyásolja őket a mintavételezés véletlenszerűsége. A fenti meggondolások alapján, ha a mintánk ferde eloszlású populációra utal, intervallum és arány típusú adatok esetén is a minta lokalizációjának jellemzésére a
mediánt, a mintaelemek szóródásának jellemzésére pedig a kvartiliseket használjuk. Ferde eloszlások esetén ugyanis a minta mediánját sokkal kevésbé befolyásolják a mintába esetleg bekerülő kiugró értékek, mint a minta átlagát. A medián nem annyira függ ilyen esetekben a mintavételezés véletlenségétől. Az elmondottakat a következő példával szemléltetjük. Példa. Tekintsük a következő két "populációt": 13 P1 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. P2 9 9 11 11 7 7 7 7 13 13 9 9 11 11 7 7 7 7 13 13 P1 13 13 2 18 3 3 17 17 10 10 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. P2 18 18 20 20 28 28 32 38 8 10 A populációk numerikus jellemzői: P1 P2 Átlag Medián Szórás 10 15.7 10 12 4.5883 9.3364 Ferdeségi együttható 0 1.09 A P1 populáció szimmetrikus eloszlású, a P2 pedig pozitívan ferde, amit az alábbi hisztogramok is mutatnak: 0.4 0.3 0.25 0.3 0.2 0.2 0.15 0.1 0.1 0.05 0 0 me 0 4 8 12 P1 16 20 0 10
m 20 30 40 P2 A szimmetrikus eloszlású populáció esetén a várhatóértéktől való ugyanolyan nagyságú pozitív, illetve negatív irányú eltérések egyforma valószínűségűek. A pozitívan ferde eloszlású P2 populáció esetén a várhatóértéktől való nagy pozitív irányú eltérésnek nagyobb a valószínűsége, mint a negatív irányúnak. Így számottevő lehet annak a valószínűsége, hogy egy véletlen 14 mintába nagy kiugró érték kerül és ugyanakkor nem fog kis kiugró értéket tartalmazni. Ez a tény a minta mediánját nem fogja lényegesen befolyásolni, ugyanakkor jelentősen növelheti a minta átlagát. Végezzük el azt a kísérletet, hogy mindkét populációból 10-szer veszünk 5 elemű mintát. Az alábbi táblázat a mintavételi terveket tartalmazza, azt mutatja, hogy az egyes mintavételeknél a populációk hányas sorszámú elemei kerültek be a mintába: M1 17. 15. 20. 14. 9. M2 3. 17. 7. 16. 15. M3 19. 13. 14. 18.
11. M4 7. 3. 14. 16. 5. M5 13. 9. 10. 15. 3. M6 2. 19. 1. 12. 9. M7 9. 11. 12. 7. 8. M8 8. 11. 1. 4. 20. M9 14. 3. 10. 8. 15. M10 2. 14. 1. 8. 13. Ezen mintavételi tervnek megfelelően vettünk 10-10 mintát mindkét populációból. Minden mintának meghatároztuk az átlagát és a médiáját A mitaátlagok és a mediánok eloszlását láthatjuk az alábbi ábrákon: 0.5 0.5 0.4 0.4 0.3 0.3 0.2 0.2 0.1 0.1 0 0 5 7 9 11 13 15 P1-ből vett minták átlagainak eloszlása 5 7 9 11 13 15 P1-bőll vett minták mediánjainak eloszlása 15 0.5 0.5 0.4 0.4 0.3 0.3 0.2 0.2 0.1 0.1 0 0 8 12 16 20 24 28 8 P2-ből vett minták átlagainak eloszlása 12 16 20 24 28 P2-ből vett minták mediánjainak eloszlása Az ábrákon a vastag függőleges vonalak az egyes populációk átlagait, illetve mediánjait jelölik. A P1 populációból vett minták esetén az átlagra és a mediánra is érvényes, hogy a populációbeli
értékeket tartalmazó osztályok a legnagyobb gyakoriságúk. A P2-ből származó minták esetén hasonló igaz a minták médiájára, míg a minták átlagainál láthatjuk, hogy számottevő gyakorisággal fordultak elő a populáció átlagától jóval nagyobb mintaátlagok is. Ezt az okozta, hogy a pozitívan ferde eloszlású populáció miatt nagy volt a valószínűsége a nagy kiugró értékek mintába kerülésének, és ezek a kiugró értékek pozitív irányba "elvitték" a minta átlagát. A minták mediánjai sokkal stabilabban viselkedtek. Végezetül a következő táblázatban összefoglaljuk, hogy mikor, melyik mintajellemzőt lehet használni: Adat típusa Nominális(kategorikus) Lokalizáció jellemzése modus Ordinális medián Intervallum és arány , és nincs számottevő átlag ferdeség a mintában (-1< f < 1) Intervallum és arány , és számottevő medián ferdeség van a mintában ( f < -1, f >1)) Szóródás jellemzése
kvartilisek szórás kvartilisek 16 2.2 GYAKORISÁGI TÁBLÁZATOK A nyers adatok szervezésének egy nagyon hasznos módja, még igen nagy adategyüttesek esetén is a gyakorisági táblázatok készítése. A gyakorisági táblázat elkészítésének módja függ az adatok típusától. 2.21 Gyakorisági táblázatok kvalitatív adatok esetén Kvalitatív adatok esetén gyakorisági táblázatnak nevezünk egy olyan táblázatot, amelyik tartalmazza legalább az egyes kategóriákat , ezek mintabeli abszolút gyakoriságait és relatív gyakoriságait. Részletesebb gyakorisági táblázatok esetén még a kumulált abszolút és relatív gyakoriságok is feltüntetésre kerülnek. 2.22 Diszkrét értékkészletű intervallum/arány skálán mért változók esete. Olyan esetekben, amikor az adatok arány( intervallum) típusúak, és a lehetséges értékek egymás után következő egész számok, azaz a mért értékek általában valamilyen számlálás eredményei,
és a mintában előforduló különböző értékek száma nem túl nagy a gyakorisági táblázat tartalmazza a a mintában előforduló különböző értékeket, ezek mintabeli abszolút gyakoriságait és relatív gyakoriságait. 2.23 Gyakorisági táblázatok folytonos értékkészletű változók esetén Folytonos értékkészletű változók esetén a fő probléma az, hogy a mintában általában sok különböző, kis gyakoriságú érték szerepel. Ha a fent megismert módon járnánk el a gyakorisági táblázat készítését illetően, a gyakorisági táblázatnak az esetek nagy részében majdnem annyi sora lenne, mint ahány elemű a minta. Itt nyilván az adatok egy más fajta szervezésére van szükség, nevezetesen az adatok csoportosítására. Egy csoportba fogjuk sorolni azokat a mintaelemeket, amelyek közel esnek egymáshoz. Így a sok különböző mintaelem helyett kis számú osztályt, intervallumot fogunk tekinteni, amelyek mindegyikébe viszont
jelentős számú mintaelem esik. A csoportok képzése tulajdonképpen azt jelenti, hogy például a legkisebb és a legnagyobb mintaelem által meghatározott intervallumot páronként diszjunkt (közös résszel nem rendelkező) részintervallumokra osztjuk. 17 Ezeket a részintervallumokat nevezzük osztályoknak. Az osztályokat jelentő intervallumok végpontjait osztályhatároknak nevezzük. Mindig meg kell mondanunk, hogy az osztályok melyik végpontjai tartoznak hozzá az osztályokhoz. A következőkben mi alkalmazkodunk a használt szoftver konvencióihoz: az osztály alsó határa nem tartozik az osztályhoz, a felső határa pedig az osztályhoz tartozik. Az osztályok kialakításánál a következőkre kell tekintettel lennünk: a) Egyrészt nem akarunk túl sok osztályt létrehozni. Általában célszerű betartani azt a szabályt az osztályok számának meghatározásánál, hogy az egy osztályra jutó átlagos mintaelemszám semmiképpen se legyen 5-nél
kisebb. b) Az osztályok egyenlő szélességűek legyenek- habár ettől bizonyos körülmények esetén eltérhetünk. Minél nagyobb mintánk van, általában annál több osztállyal dolgozhatunk. c) Ha már megvan az osztályok hozzávetőleges száma, akkor az egyenlő közű osztályozás esetén az osztályok szélessége és az osztópontok már kiszámíthatók. Célszerű olyan osztályokat képezni, hogy az osztópontok legyenek összhangban a mérési pontossággal. Az osztályok számának megfelelő megválasztása példája. a statisztika művészetének egy Egy osztály abszolút gyakorisága megadja, hogy hány mintaelem esik az adott osztályba. Egy osztály relatív gyakorisága megadja, hogy a mintaelemek hányad része esik az adott osztályba. Csoportosított adatok esetén a gyakorisági táblázat tartalmazza az osztályok határait, az egyes osztályok abszolút, illetve relatív gyakoriságait. 2.3 GYAKORISÁGI HISZTOGRAMOK A gyakorisági hisztogram nem
más, mint a gyakorisági táblázatban rejlő információ egy grafikus megjelenítése. Az általános elv az, hogy minden a táblázatban szereplő gyakoriságot egy téglalappal reprezentálunk oly módon, hogy a téglalap területe arányos a megfelelő relatív gyakorisággal. 18 2.31 Kategorikus adatok esete Minden kategóriának megfeleltetünk egy-egy téglalapot, amelyek alaplapja azonos(egységnyi) hosszúságú, és magasságuk pedig az egyes kategóriák relatív gyakoriságaival egyezik meg. 2.32 Ordinális adatok esete Ilyen esetben a változó értékkészlete rendszerint egymást követő egész számokból áll. A hisztogramot olyan téglalapok alkotják, amelyek alaplapjai egységnyi hosszúságúak és középpontjaik az adott egész számok, magasságaik pedig az adott értékek mintabeli relatív gyakoriságaival egyenlők. 2.33 Diszkrét értékkészletű intervallum/arány skálán mért változók esete. Ha az értékkészlet nem túl sok egymást
követő egész számból áll, akkor ugyanúgy járunk el, mint az ordinális adatok esetén. Ha az értékkészlet sok elemet tartalmaz, akkor a hisztogramot a folytonos értékkészletű változókhoz hasonlóan készítjük el. 2.34 Folytonos értékkészletű változók esete A minta terjedelmét osztályokra bontjuk. Ha egyenlő szélességű osztályokat alkalmazunk, akkor a hisztogramot a következő módon szerkesztjük. Egy számegyenesen feltüntetjük az osztályok határait. Az így kapott szakaszok lesznek az egyes téglalapok azonos hosszúságú alaplapjai. A téglalapok magasságai pedig az egyes osztályok relatív gyakoriságaival lesznek egyenlők. Vannak olyan mintabeli eloszlások, amikor a gyakorisági táblázatok, illetve a gyakorisági hisztogramok készítésénél az egyenlő szélességű osztályok nem szerencsések. Az alábbi ábrán olyan mintát ábrázoltunk egy számegyenesen, amelyre az jellemző, hogy a mintaelemek túlnyomó többsége egy
viszonylag szűk intervallumban helyezkedik el, és ezen kívül csak néhány érték található. 19 Ha kis szélességű egyenlőközű osztályozást végzünk - (a) eset - akkor sok osztály fogja lefedni a teljes mintát, és ezek közül sok egy, vagy egyetlen mintaelemet sem tartalmaz. Ha kevesebb és szélesebb osztályt képezünk- (b) eset - akkor csökken ugyan a nulla gyakoriságú osztályok száma, ugyanakkor azon a részen, ahol a mintaelemek többsége helyezkedik el elmosónak a részletek, ugyanis a közép tájon nagyjából azonos gyakoriságú osztályokat kapunk. A jó megoldást a (c) jelenti, amikor különböző szélességű osztályokat képezünk: kevés, nagyobb szélességű osztályt a széleken, és több kisebb szélességű osztály a középső, a mintaelemek többségét tartalmazó részen. Az ilyen nem egyenlő szélességű osztályok esetén a hisztogramot a következő módon szerkesztjük meg. Egy számegyenesen feltüntetjük az
osztályok határait. Az így kapott szakaszok lesznek az egyes téglalapok nem azonos hosszúságú alaplapjai. Az egyes téglalapok magasságát pedig úgy határozzuk meg, hogy az adott osztály mintabeli relatív gyakoriságát elosztjuk az adott osztály szélességével. Ekkor olyan téglalapokat kapunk, amelyek területei megegyeznek az osztályok relatív gyakoriságaival. Ugyanis ha az i. osztály szélessége d i és relatív gyakorisága ri , akkor az i téglalap területe r d i ⋅ i = ri di 20 2.4 MINTA BOX-BAJUSZ ÁBRÁZOLÁSA A medián és a kvartilisek a minta minimális és maximális elemeivel elég jól jellemzik az eloszlást. E numerikus jellemzőknek egy nagyon szemléletes ábrázolási módja az u.n box-bajusz ábra, amelyet Tukey vezetett be 1977-benEzt az ábrát akár vízszintes, akár függőleges elrendezésben is készíthetjük. 1) Ha vízszintes elrendezésről van szó, akkor egy vízszintes tengellyel párhuzamosan rajzolunk egy
téglalapot(box), a tengelytől tetszőleges távolságra. A téglalap tengellyel párhuzamos oldalát a minta alsó kvartilisének megfelelő értéktől a felső kvartilisnek megfelelő értékig rajzoljuk. A téglalap függőleged oldalának hossza tetszőleges 2) A téglalap belsejében a mediánnak megfelelő értéknél egy függőleges vonalat rajzolunk. 3) A téglalaptól balra és jobbra vízszintes vonalakat rajzolunk (bajuszok). A bajuszok végpontjait a következőképpen határozzuk meg. a) A baloldali bajusz végpontja a minimális mintaelemnek felel meg, ha a mintában nincs kiugróan kicsi érték, ha a mintában van kis kiugró érték, akkor a baloldali bajusz végpontja azt jelzi, hogy mitől kezdve számít egy mintaelem kiugróan kicsinek. Ez a határ k a − 1.5 k f − k a ( ) a) A jobboldali bajusz végpontja a maximális mintaelemnek felel meg, ha a mintában nincs kiugróan nagy érték, ha a mintában van nagy kiugró érték, akkor a jobboldali bajusz
végpontja azt jelzi, hogy mitől kezdve számít egy mintaelem kiugróan nagynak. Ez a határ k f + 1.5 k f − k a ( ) 21 2.42 Példa Az üdítőitalos felmérés alapján az életkorra vonatkozó minta box-bajusz ábrája Box-and-Whisker Plot nagy kiugró értékek 5 12 3 4 18 28 38 kor 1 = legkisebb mintaelem 2 = ka 3 = med 4 = kf ( 5= k f + 1.5 k f − k a + = a minta átlaga ) 48 58 22 3. STATISZTIKÁK Tekintsük azt a problémát, hogy miként tudnunk arra a kérdésre válaszolni, hogy, egy bizonyos márkájú cigaretta esetén mi a szálankénti nikotintartalom. Nyilván az egyes cigarettaszálakat tekintve véletlenszerűen változó értékről van szó. A vizsgált populációt ebben az esetben az adott márkából eddig gyártott, és ugyanazzal a technológiával ezután gyártandó cigaretták és a szálankénti nikotintartalmuk alkotják. Ha X jelöli a szálankénti nikotintartalmat, akkor a felvetett kérdésre a legkielégítőbb válasz az,
ha meg tudjuk mondani, hogy mi az X változó eloszlása. Elsődleges kérdés ebben a tekintetben, hogy mik az X eloszlásának numerikus jellemzői. Nézzük példaként, hogy mit tudunk mondani az X változó E ( X ) = m várhatóértékéről, azaz a szálankénti nikotintartalom populációbeli átlagáról. Nyilván véletlenszerűen kiválasztott cigarettaszálak esetén méréseket kell végeznünk . Tegyük fel, hogy vettünk egy n = 4 elemű mintát, és a nikotintartalmat mg-bán kifejezve a mérések eredményeként az adódott, hogy X1 = 1. 68 , X 2 = 189 , X 3 = 1 73 és X 4 = 195 A mintánk átlaga x = 1.813 Mit mondhatunk ez alapján m-re, a populációbeli átlagra vonatkozóan? A kapott mintaátlag mennyire tér el m valódi értékétől? Ha újból vennénk egy 4 elemű mintát, és azokból számítanánk átlagot, akkor nyilván más értéket kapnánk. Ez lehetne esetleg az előző 1.813-as értéktő teljesen különböző? Sok vizsgálatnak az előbb
felvetetthez hasonló a célja: véletlen minta alapján milyen következtetéseket tudunk levonni valamely vizsgált jellemző populációbeli eloszlására vonatkozóan. Legyen X a vizsgált jellemző tulajdonság, amelynek eloszlására vonatkozóan szeretnénk következtetéseket levonni. Tegyük fel, hogy X-re vonatkozóan rendelkezésünkre áll egy n-elemű X 1 , K , X n statisztikai minta. A statisztikai minta elemei független X-ével azonos eloszlású valószínűségi változók. A mintaelemek bármely t = t ( X 1 ,K, X n ) függvényét statisztikának nevezzük. A különböző statisztikák maguk is valószínűségi változók, amelyeknek eloszlása nyilván függ a mintaelemek közös eloszlásától. A statisztikák nem mások, mint a mintaelemekből számított mennyiségek. Ebben az értelemben valamely minta előzőekben megismert numerikus jellemzői mind statiszikák, mivel ezeket a mintaelemekből számoljuk. Például a minta átlaga egy statisztika, ami
esetén a t függvény definíciója az ,hogy "adjuk össze a mintaelemeket és a kapott összeget osszuk el a mintaelemek számával". Hasonlóan végiggondolhatjuk, hogy a minta többi numerikus jellemzői, a terjedelem, a medián a kvartilisek a szórás, a 23 legkisebb és a legnagyobb mintaelem is mind egy-egy statisztika. Továbbá statisztikák a mintabeli abszolút, illetve relatív gyakoriságok is. Nagyon fontos, hogy különbséget tudjunk tenni a X változó numerikus jellemzői ( populációbeli értékek) és a statisztikák között. Tekintsük a következő példát Tegyük fel, hogy egy "sokaság " 4 egyedből áll, amelyek esetén valamely jellemző értéke 2, 2, 3 és 4. Tekintsük azt a kísérletet, hogy a sokaságból véletlenszerűen kiválasztunk egy egyedet, és a X valószínűségi változó jelentse a vizsgált jellemző értékét, a kiválasztott egyed esetén. A X változó eloszlása tulajdonképpen a vizsgált jellemző
populációbeli eloszlása: xi pi 2 0.5 3 0.25 4 0.25 Ebből m = E ( X ) = 2 * 0.5 + 3 * 0.25 + 4 * 0.25 = 275 , ami nyilván nem más, mint a vizsgált jellemző 2 + 2 + 3 + 4 11 = = 2. 75 4 4 populációbeli átlaga. Vegyünk az X-re vonatkozóan visszatevés nélkül 3 elemű mintát úgy, hogy bármely 3 egyed kiválasztásának ugyanaz legyen a valószínűsége, és a minta átlagát nézzük. Mivel a minta átlaga szempontjából a kiválasztás sorrendje nem lényeges, a kiválasztott egyedek sorrendjére nem leszünk tekintettel. Egy ilyen mintavételezésnél elvileg a ⎛ 4⎞ következő ⎜⎜ ⎟⎟ = 4 féle módon választhatunk ki 3 elemű mintát, és ezek a következők (a ⎝ 3⎠ sokaságban a két 2-eset úgy különböztetjük meg, hogy az egyik mellé *-ot írunk): (2,2*,3), (2,2,4), (2,3,4) és (2,3,4). Ezen minták valószínűsége egyaránt 0.25 Az egyes lehetséges minták átlagai: 7 8 9 , , 3 3 3 9 és . Vagyis a tekintett statisztika a minta
átlaga- eloszlása a következő: 3 lehetséges értékek 7 = 2.33 3 8 9 = 2. 66 =3 3 3 valószínűségek 0.25 0.25 0.5 Láthatjuk, hogy jóllehet a minta átlaga maga is véletlenszerű, azaz függ attól, hogy a sokaságból éppen mely egyedek kerülnek be a mintába, de a minta átlaga és a populációbeli átlag között azért van valami kapcsolat: a vizsgált esetben a lehetséges mintaátlagok közül a 3 a legvalószínűbb, és ez az ,amelyik a mintaátlag lehetséges értékei közül a legkevésbé tér el a populációbeli átlagtól. Számítsuk ki továbbá a mintaátlagnak, mint valószínűségi változónak a várhatóértékét: 24 E (x ) = 7 1 8 1 9 1 7 8 18 33 + + = = 2.75 , * + + = 3 4 3 4 3 2 12 12 12 12 ami megegyezik a X változó várhatóértékével(a vizsgált jellemző populációbeli átlagával). Látható tehát , hogy a tekintett statisztika, a minta átlaga bizonyos kapcsolatban van a megfelelő populációbeli jellemzővel. A
fentihez hasonló törvényszerűségek jogosítanak fel bennünket arra, hogy különböző statisztikákat használhassunk a populációbeli jellemzők becslésére. Nyilván a következő kérdések merülnek fel: a) egy adott populációbeli numerikus jellemző becslésre milyen statisztikát használjunk, b) mit mondhatunk a tekintett becslés hibájáról. 3.1 MINTA ÁTLAGÁNAK ELOSZLÁSA Legyen az X valószínűségi változó várhatóértéke az m = E ( X ) és szórása σ = D( X ) . Tekintsük az X valószínűségi változóra vonatkozó n-elemű X 1 , K , X n statisztikai mintát, és x legyen a minta átlaga. Először meg fogjuk határozni az x átlagát és szórását: A várhatóérték tulajdonságait felhasználva adódik, hogy 1 ⎛1 ⎞ 1 E ( x ) = E ⎜ ( X 1 + L + X n )⎟ = (E ( X 1 ) + L + E ( X n )) = nm = m , n ⎝n ⎠ n és tekintettel arra, hogy a minta elemei függetlenek ( ) 1 2 σ2 ⎛1 ⎞ 1 σ = D 2 ( x ) = D 2 ⎜ ( X 1 + L + X n )⎟ = D 2 (X1
) + L + D 2 (X n ) = , n ⎝n ⎠ n2 n2 amiből D( x ) = σ n . Kaptuk tehát, hogy a minta átlaga olyan statisztika, amelynek várhatóértéke a minta nagyságától függetlenül egyenlő a vizsgált változó m várhatóértékével, szórása, pedig σ / n , ami oly módon függ a minta nagyságától, hogy ha a minta nagyságát minden határon túl növeljük (n ∞ ) , akkor 25 D(x ) = σ n 0. Látható, hogy a minta átlaga a vizsgált változó numerikus jellemzői közül a várhatóértékkel van kapcsolatban: a minta átlaga noha függ a mintavételezés véletlenszerűségétől, az egyes mintákból számított értékek az X változó várhatóértéke körül fognak ingadozni, és az eltérések annál kisebbek lesznek, minél nagyobbak a minták. Ha az X változónk normális eloszlású, akkor a minta átlagának nem csak a várhatóértéke és a szórása ismert, hanem az eloszlását is meg tudjuk mondani. Legyen X∼ N (m, σ ) , akkor a minta átlaga
x= 1 (X1 + L + X n ) n független normális eloszlású változók lineáris kombinációja , tehát maga is normális eloszlású, amelynek az előző általános eredményünkből adódóan m a várhatóértéke és ⎛ σ ⎞ ⎟⎟ . σ / n a szórása, azaz x ∼ N ⎜⎜ m, n⎠ ⎝ Általában, ha a az X változónk nem normális eloszlású nem tudjuk tetszőleges mintanagyság esetén megmondani az x mintaátlag eloszlását. Igaz azonban az, hogy ha n ∞ , akkor az x eloszlásfüggvénye egyre jobban és jobban közelít a normális eloszláshoz. A gyakorlatban ez azt jelenti, hogy elegendően nagy minták esetén a minta átlaga jó közelítéssel normális eloszlásúnak tekinthető. Kérdés az, hogy mi tekinthető elegendően nagy mintának. Az a gyakorlati szabály, amit a legtöbb statisztikus elfogad az, hogy ha n ≥ 20 , illetve erősen ferde eloszlású X változó esetén, ha n ≥ 30 , akkor a ⎛ σ ⎞ ⎟⎟ eloszlásúnak tekinthető. mintánk átlaga
már igen jó közelítéssel N ⎜⎜ m, n⎠ ⎝ 26 Minta átlagának eloszlása Legyen az X valószínűségi változó várhatóértéke m és szórása σ, továbbá x jelölje az X-re vonatkozó n-elemű statisztikai minta átlagát. Ekkor érvényesek a következők: 1. E ( x ) = m 2. D( x ) = σ n 3.Ha X∼ N (m, σ ) , akkor tetszőleges n mintanagyság esetén x ∼ ⎛ σ ⎞ ⎟⎟ N ⎜⎜ m, n⎠ ⎝ 4. Ha X eloszlása nem normális, akkor elegendően nagy minták esetén ( n ≥ 20 , illetve erősen ferde eloszlású X esetén n ≥ 30 ) x jó közelítéssel ⎛ σ ⎞ ⎟⎟ eloszlású. N ⎜⎜ m, n⎠ ⎝ A fentieknek egy fontos, a statisztikában gyakran használt következménye, hogy a minta átlagának standardizáltja z= x−m σ/ n standard normális eloszlású(közelítőleg standard normális eloszlású). Megjegyzés: normális eloszlású változó standardizáltját az irodalomban napjainkban zvel jelölik, régebben pedig az u jelölés
volt használatos. 3.2 MINTABELI RELATÍV GYAKORISÁG ELOSZLÁSA Sok esetben a statisztikai vizsgálatoknak az a célja, hogy következtessünk a vizsgált populációban valamely S tulajdonsággal rendelkező egyedek arányára. Ez a populációbeli arány tulajdonképpen nem más, mint egy esemény valószínűsége. Legyen ugyanis a N egyedből álló populáció esetén s azon egyedeknek a száma, amelyek az adott S tulajdonsággal rendelkeznek. Válasszunk ki a sokaságból egy egyedet véletlenszerűen, és A jelentse azt az eseményt, hogy a kiválasztott egyed rendelkezik az S tulajdonsággal. Ekkor az A esemény valószínűség p= P( A) = s N 27 éppen az S tulajdonságú egyedek populációbeli aránya. Ha ebből a sokaságból veszünk egy n elemű mintát, akkor az S tulajdonságú egyedek mintabeli relatív gyakorisága r= nS , n ahol nS az S tulajdonságú egyedek mintabeli abszolút gyakorisága. Vizsgáljuk meg, hogy mit mondhatunk a mintabeli relatív
gyakoriság eloszlásáról. Először is tudjuk, hogy a mintabeli abszolút gyakoriság binomiális eloszlású: nS ∼ B(n, p ) , tehát E (n S ) = np , és D(ns ) = np(1 − p ) . Ebből következik, hogy 1 ⎛n ⎞ 1 E (r ) = E ⎜ S ⎟ = E (n S ) = np = p , n ⎝ n ⎠ n és p(1 − p ) 1 ⎛n ⎞ 1 2 D 2 (r ) = D 2 ⎜ S ⎟ = D (n S ) = np(1 − p ) = , n ⎝ n ⎠ n2 n2 amiből D(r ) = p(1 − p ) . n A mintabeli relatív gyakoriság eloszlására vonatkozóan csak nagy minták esetén tudunk mondani valamit. Ismeretes, hogy nagy n-ek esetén a B(n, p ) binomiális eloszlás jó közelítéssel normális eloszlásnak tekinthető, melynek várhatóértéke np és szórása np(1 − p ) . Ebben a vonatkozásban n elegendően nagynak tekinthető, ha np ≥ 5 és n(1 − p ) ≥ 5 teljesülnek. Ezek szerint elegendően nagy minták esetén a mintabeli nS abszolút gyakoriság jó közelítéssel ( ) N np, np(1 − p ) eloszlású. A mintabeli r relatív gyakoriság az nS
abszolút 28 gyakoriság konstansszorosa, ⎛ p(1 − p ) ⎞ ⎟ eloszlású. N ⎜⎜ p, ⎟ n ⎝ ⎠ tehát nagy minták esetén jó közelítéssel Mintabeli relatív gyakoriság eloszlása Legyen p a vizsgált populációban valamely S tulajdonsággal rendelkező egyedek aránya, és r jelölje a populációból vett n-elemű mintában az S tulajdonságú egyedek relatív gyakoriságát. Az r mintabeli relatív gyakoriságra a következők teljesülnek: 1. E (r ) = p p(1 − p ) n 3. Nagy minták esetén ( np ≥ 5 és n(1 − p ) ≥ 5 ) r jó közelítéssel normális eloszlású 2. D(r ) = 29 4. STATISZTIKAI BECSLÉSEK A statisztikai vizsgálatok célja általában az, hogy statisztikai minta alapján minél több információt szerezzünk a vizsgált populációról. Gyakran a mintában szereplő adatok olyanok, hogy lehetővé teszik, hogy ha nem is pontosan meghatározhassuk, de legalább valamilyen hibával becsülhessük a vizsgált változó(k)
numerikus jellemzőit, például a várhatóértékét (populációbeli átlagot), a szórást, stb. 4.1 PONTBECSLÉSEK A legegyszerűbb becslési eljárás az, amikor a mintaelemekből egyetlen számot határozunk meg, és azt úgy tekintjük, mint a kérdéses numerikus jellemző egy lehetséges értékét, amit az illető numerikus jellemző becslésének is nevezünk. Pontbecslés A vizsgált X változó valamely numerikus jellemzője pontbecslésének nevezünk a mintaelemekből számított olyan számértéket, amit úgy tekinthetünk, mint a jellemző egy lehetséges értékét. A pontbecslés elnevezés onnan ered, hogy, ha a becslést a számegyenesen ábrázoljuk, akkor egyetlen pontot kapunk. Pontbecslést úgy kapunk, hogy ki kell választanunk egy megfelelő statisztikát, és ennek értékét kiszámítjuk az adott mintánk esetén. Nyilván csak olyan statisztika minősülhet megfelelőnek, amelyik valamilyen kapcsolatban van a becsülendő numerikus jellemzővel. Az
előző szakaszban tárgyaltaknak megfelelően például valamely változó várhatóértékének(a jellemző populációbeli átlagának) (pont)becsléshez megfelelő statisztika lehet a minta átlaga. A becsléselméletben szokás a változó szóban forgó (ismeretlen) numerikus jellemzőének az értékét valódi értéknek nevezni . Tegyük fel, hogy valamely numerikus jellemző pontbecslésénél három folytonos eloszlású statisztika közül kell választanunk. Az alábbi ábrán a három különböző statisztika sűrűségfüggvényét ábrázoltuk, és a vízszintes tengelyen feltüntettük a becsülni kívánt jellemző valódi értékét. 30 Az (a) ábrán szemléltetett esetben a választott statisztika nem valószínű, hogy a valódi értékhez közel eső becslést szolgáltat, mivel a valódi érték távol esik a statisztika várhatóértékétől (ami most egybeesik a statisztika eloszlásának modusával, mert szimmetrikus eloszlású a statisztika). Egy
ilyen statisztika alapján számított becslés mondhatni szisztematikusan nagyobb lesz, mint a valódi érték (rendszeresen felülbecsli a valódi értéket). A (b) ábrán látható esetben olyan statisztikáról van szó, amelynek várhatóértéke egyenlő a becsülni kívánt numerikus jellemző valódi értékével, de a statisztika szórása meglehetősen nagy (nem elég "karcsú" a sűrűségfüggvény). Egy ilyen statisztika által szolgáltatott becslés nem fogja a paramétert szisztematikusan sem alul-, sem felülbecsülni, de a minták egy része esetén kaphatunk a valódi értéknél jóval kisebb, vagy jóval nagyobb becslést is. Végül a (c) ábrán szintén egy olyan statisztika sűrűségfüggvénye látható, amelynek várhatóértéke megegyezik a becsülni kívánt numerikus jellemző valódi értékével, de a szórása lényegesen kisebb, mint a (b) esetben. Ilyenkor ha több mintából kiszámítjuk a statisztika által szolgáltatott becsléseket,
ezek kisebb mértékben szóródnak a valódi érték körül. Ekkor a (c) statisztika jobb tulajdonságú becslést szolgáltat, mint a (b) Torzítatlan becslések Ha valamely statisztika olyan, hogy a várhatóértéke megegyezik a becsülni kívánt numerikus jellemző valódi értékével, akkor az általa szolgáltatott becslést torzítatlannak nevezzük. Ellenkező esetben a becslét torzítottnak nevezzük. Ha egy numerikus jellemző becslése esetén több olyan statisztika is rendelkezésünkre áll, amelyek mindegyike torzítatlan becslést szolgáltat, akkor közülük azt kell választanunk, amelyiknek a szórása a legkisebb. A 3.1 és a 32 szakasz eredményei alapján a következőket mondhatjuk: 31 1)A várhatóértéknek a minta átlaga torzítatlan becslése. 2) Populációbeli aránynak (esemény valószínűségének) a mintabeli relatív gyakoriság torzítatlan becslése. 3) Megmutatható, hogy a minta varianciája a változó varianciájának torzítatlan
becslése.( Azért van az, hogy a minta varianciájának definíciójában a négyzetes eltéréseknek nem a számtani közepét vettük, hanem csak a mintanagyság-1- gyel osztottunk, mert csak így igaz, hogy a statisztika torzítatlan becslést szolgáltat.) 4.11 Lokalizációs jellemzők becslése 1) Az X valószínűségi változó(populáció) mediánját a minta mediánjával becsüljük. 2) Az X valószínűségi változó várhatóértékét(populáció átlagát) a minta átlagával becsüljük. A minta átlaga a várhatóértéknek (populáció átlagának ) torzítatlan becslése Ha az X változó normális eloszlású, akkor a várhatóérték torzítatlan becslését eredményező statisztikák közül a minta átlagának a legkisebb a szórása. Természetesen az, hogy a lokalizációs jellemzők közül az adott esetben melyiket célszerű használni, az függ attól, hogy a változót milyen mérési skálán mérjük, és hogy szimmetrikus-e az eloszlása. A minta
mediánja és átlaga tehát nem csak arra szolgál, hogy a mintaelemek elhelyezkedését jellemezzük velük, hanem arra is, hogy az ismeretlen populációbeli értékeket ( a jellemzők valódi értékeit) becsüljük. 4.12 Szóródást jellemző paraméterek becslése 1) Az X valószínűségi változó kvartilisei a változó szóródását olyan értelemben jellemzik, hogy megadnak a medián körül egy olyan intervallumot, hogy 0.5 a valószínűsége annak, hogy a változó értéke ebbe az intervallumba esik. Az X valószínűségi változó(populáció) kvartiliseit a minta kvartiliseivel becsüljük. 2) Az X valószínűségi változó varianciájának (szórásnégyzetének) becslésére a minta szórását használjuk. Megmutatható, hogy ⎛ n ⎞ ⎜ ∑ ( X i − x )2 ⎟ ⎜ ⎟ 2 E ⎜ i =1 ⎟ =σ , n −1 ⎜ ⎟ ⎜ ⎟ ⎝ ⎠ ahol σ 2 = D 2 ( X ) , és X 1 , K , X n az X-re vonatkozó n-elemű minta, x pedig a minta átlaga. Tehát a minta varianciája a
változó varianciájának torzítatlan becslése 32 Az X valószínűségi változó szórásának becslésére a minta n ∑ ( X i − x )2 s= szórását használjuk. i =1 n −1 33 5. KONFIDENCIAINTERVALLUMOK Az előzőekben láttuk, hogy a vizsgált változóra vonatkozó minta alapján hogyan tudjuk az eloszlás numerikus jellemzőit becsülni: választunk egy jó tulajdonságokkal rendelkező statisztikát, és ennek az értékét meghatározzuk az adott minta esetén. A statisztika jó tulajdonságai miatt kicsi annak a valószínűsége, hogy a becsült érték nagyon eltér a valódi értéktől. Ez azonban csak azt jelenti, hogy ha sok mintából elvégezzük a becslést, akkor ezek általában különböző értékek lesznek, de közöttük ritkán fordul elő olyan, amelyiknek nagyon eltér a valódi értéktől, azaz amelyiknek nagy a hibája. Ha azonban csak egy becslést végzünk, akkor csak bízhatunk abban, hogy most éppen nem az a kicsi
valószínűségű esemény következett be, hogy a becslés nagyon eltér a valódi értéktől. Nyilván kívánatos lenne, hogy az egyetlen minta alapján kiszámított becsült érték hibájáról is tudjunk valamit mondani. A pontbecslések önmagukban ezt nem teszik lehetővé. Tegyük fel, hogy a pontbecslés , egyetlen szám helyett egy egész intervallumot határozunk meg, amelyik olyan tulajdonságú, hogy nagy valószínűséggel tartalmazza a becsülni kívánt numerikus jellemző valódi értékét. Tegyük fel, hogy az X változó várhatóértékére a minta átlagát használva a156.6 érték adódott Ekkor semmilyen információnk nincs arról, hogy ez a becslés ténylegesen mennyivel tér el a valódi értéktől. Azonban ha a 156. 4,1568 intervallumról tudjuk azt, hogy 09-es valószínűséggel tartalmazza az m = E ( X ) értéket, azaz hogy P(m ∈ [156.4,1568]) = 09 , akkor már ez előbbi pontbecslés pontosságáról is tudunk valamit. Ugyanis a 1566 ennek az
intervallumnak a felezőpontja, és ha ez az intervallum tartalmazza m-et, akkor a 156.6-nek az m-től való abszolút eltérése -a becslés hibája nem lehet nagyobb, mint az intervallum hosszának a fele (ld. az alábbi ábrát) Tehát m ∈ 156. 4,1568 ⊆ 156 6 − m ≤ 0 2 , ezért 0.9 = P(m ∈ [1564,1568]) ≤ P(1566 − m ≤ 02) , 34 azaz P(156.6 − m ≤ 02) ≥ 09 Tehát az ilyen tulajdonságú intervallum birtokában a 156.6 pontbecslésről azt tudjuk mondani, hogy az m-nek legalább 0.9-es valószínűséggel 02-nél kisebb hibájú becslése A 156. 4,1568 intervallumot az m-re vonatkozó 90%-os megbízhatósági szintű konfidenciaintervallumnak szokás nevezni. A későbbiekben látni fogjuk, hogy ha ismerjük a pontbecslést szolgáltató statisztika eloszlását, akkor ilyen intervallum meghatározására van lehetőségünk. Konfidenciaintervallum Az X valószínűségi változó eloszlásának valamely numerikus jellemzőjére vonatkozó p.100%-os
megbízhatósági szintű konfidenciaintervallumnak nevezünk egy olyan véletlen helyzetű intervallumot, amelyik előre adott p valószínűséggel tartalmazza a jellemző valódi értékét. A gyakorlatban szokásos p értékek: 0.9, 095 és099, azaz általában a vizsgált jellemzőre vonatkozóan 90, 95, vagy 99%-os megbízhatósági szintű konfidenciaintervallumokat szoktunk konstruálni, bár elvileg tetszőleges p érték lehetséges. A következőkben azt fogjuk vizsgálni, konfidenciaintervallumokat konstruálni. hogy hogyan lehet ilyen 5.1 KONFIDENCIAINTERVALLUM ISMERT SZÓRÁSÚ NORMÁLIS ELOSZLÁSÚ VÁLTOZÓ VÁRHATÓÉRTÉKÉRE Legyen X∼ N (m, σ ) , ahol a σ szórás ismert, és a m várhatóérték ismeretlen. Legyen α ∈ (0,1) egy előre adott érték. Az ismeretlen m-re vonatkozóan akarunk (1 − α )100% os megbízhatósági szintű a, b konfidenciaintervallumot konstruálni Legyen adott az X-re vonatkozóan egy n-elemű X 1 , K , X n statisztikai minta
Az m pontbecslésére szolgáló statisztika a minta x átlaga. Az eljárás során olyan a, b intervallumot keresünk, amelynek x lesz a középpontja, és amelyre teljesül, hogy P(m ∈ [a,b]) = 1 − α 35 Ha az intervallumnak x a középpontja, akkor a, b x − l , x + l alakú, ahol még az l-et kell meghatároznunk. Az ilyen intervallum nyilván véletlen helyzetű lesz, ugyanis a középpontja valószínűségi változó, a minta átlagának értéke függ attól, hogy éppen milyen elemek kerültek a mintába. A kívánt intervallum végpontjait azért tudjuk meghatározni, mert z= x−m σ ∼ N (0,1) , n és ha a mintánk adott, akkor a z statisztikában (a minta átlagának standardizáltjában) csak egyetlen ismeretlen mennyiség, a becsülni kívánt m várhatóérték szerepel. Megmutatható, hogy az m várhatóértékre vonatkozó (1 − α )100% -os megbízhatósági szintű konfidenciaintervallum: ⎡ ⎤ ⎢ x − st ⋅ σ , x + st ⋅ σ ⎥ , K 1− α n
K 1− α n ⎥ ⎢ ⎢⎣ ⎥⎦ 2 2 ahol st K 1−α adott 1 − α 2 az a valós szám, ahol a standard normáls eloszlás Φ eloszlásfüggvénye az 2 értéket veszi fel: ⎛ ⎞ ⎜ st ⎟ α Φ⎜ K α ⎟ = 1 − . 2 ⎜ 1− ⎟ 2⎠ ⎝ Ez egy olyan intervallum, aminek a végpontjai véletlenszerűek, ugyanis függnek a mintánk átlagától, de azt tudjuk, hogy 1− α a valószínűsége annak, hogy tartalmazza az m várhatóérték valódi értékét. A bevezetőben elmondottak szerint a gyakorlatban az α = 0.1, 05, 0 01 értékeket szokás választani. 36 Várhatóértékre vonatkozó konfidenciaintervallum normális eloszlás és ismert szórás esetén Legyen X∼ N (m, σ ) , és σ ismert, x pedig jelölje az X-re vonatkozó n-elemű minta átlagát. Ekkor az eloszlás m várhatóértékére vonatkozó (1 − α )100% os megbízhatósági szintű konfidenciaintervallum ⎡ ⎤ ⎢ x − st ⋅ σ , x + st ⋅ σ ⎥ , K 1− α n K 1− α n ⎥ ⎢
⎢⎣ ⎥⎦ 2 2 ⎛ ⎞ ⎜ st ⎟ α ahol 0< α <1 előre adott érték, és Φ⎜ K α ⎟ = 1 − , 2 ⎜ 1− ⎟ 2⎠ ⎝ ahol Φ a standard normális eloszlás eloszlásfüggvénye. E konfidenciaintervallum alapján az x pontbecslés hibájára vonatkozóan azt tudjuk állítani, hogy ⎛ ⎜ P⎜ x − m ≤ ⎜ ⎝ ⎞ st K 1− α ⋅ 2 σ ⎟ ⎟ ≥ 1−α , n⎟ ⎠ vagyis x az m-nek legalább 1− α valószínűséggel st K 1− α 2 σ n -nél kisebb hibájú becslése. A becslés annál pontosabb, minél rövidebb a konfidenciaintervallum. A konfidenciaintervallum hosszát pedig három tényező befolyásolja: 1. Adott szórás és mintanagyság esetén a konfidenciaintervallum hossza már csak a választott megbízhatósági szinttől függ. Mégpedig minél nagyobb megbízhatóságra törekszünk annál hosszabb lesz a konfidenciaintervallum. Ha 2. Adott mintanagyság és megbízhatósági szint esetén a konfidenciaintervallum annál hosszabb,
minél nagyobb a változó szórása. Ez azt jelenti, hogy a nagyobb szórású változó várhatóértékét egy adott nagyságú mintából pontatlanabbul tudjuk becsülni, mint a kisebb szórású változóét. 3. Adott megbízhatósági szint és szórás esetén a konfidenciaintervallum annál rövidebb minél nagyobb a minta elemszáma. Természetesen a fenti három tényező közül a szórást nem tudjuk befolyásolni. Tehát, ha például 90%-os megbízhatósági szint esetén biztosítani akarunk egy adott 37 pontosságot is (azaz a konfidenciaintervallum hosszát is előírom) , akkor ezt csak úgy tudjuk elérni, ha meghatározzuk, hogy ehhez legalább mekkora nagyságú mintára van szükség. Ezzel a kérdéssel majd a későbbiekben foglalkozunk 5.2 KONFIDENCIAINTERVALLUM VÁLTOZÓ VÁRHATÓÉRTÉKÉRE NAGY MINTÁK ÉS ISMERT SZÓRÁS ESETÉN A most tárgyalt esetben nem tételezzük fel, hogy X normális eloszlású. Legyen a változó σ-val jelölt szórása
ismert, és a várhatóértékére vonatkozóan szeretnénk konfidenciaintervallumot szerkeszteni. Ha x jelöli az X-re vonatkozó n-elemű minta átlagát, akkor nagy minták ( n ≥ 20 , illetve ⎛ σ ⎞ ⎟⎟ eloszlású, tehát a minta ferde eloszlás esetén n ≥ 30 ) x jó közelítéssel N ⎜⎜ m, n⎠ ⎝ átlagának standardizáltja jó közelítéssel standard normális eloszlású. Tehát most is van egy ismert eloszlású statisztikánk, amiben, ha adott a minta csak egyetlen ismeretlen mennyiség van, a becsülni kívánt m várhatóérték, azaz a konfidenciaintervallum végpontjai meghatározhatók. Ismert szórású változó várhatóértékre vonatkozó konfidenciaintervallum nagy minták esetén Legyen X σ szórása ismert, x pedig jelölje az X-re vonatkozó n-elemű minta átlagát( n ≥ 20 , illetve ferde eloszlás esetén n ≥ 30 ). Ekkor az eloszlás m várhatóértékére vonatkozó (1 − α )100% -os megbízhatósági szintű konfidenciaintervallum
⎡ ⎤ ⎢ x − st ⋅ σ , x + st ⋅ σ ⎥ , K 1− α n K 1− α n ⎥ ⎢ ⎢⎣ ⎥⎦ 2 2 ⎛ ⎞ ⎜ st ⎟ α ahol 0< α <1 előre adott érték, és Φ⎜ K α ⎟ = 1 − ,. 2 ⎜ 1− ⎟ 2⎠ ⎝ 38 5.3 KONFIDENCIAINTERVALLUM NORMÁLIS ELOSZLÁSÚ VÁLTOZÓ VÁRHATÓÉRTÉKÉRE ISMERETLEN SZÓRÁS ESETÉN Legyen X∼ N (m, σ ) , ahol sem a σ szórás , sem az m várhatóérték nem ismert. Legyen α ∈ (0,1) egy előre adott érték. Most nem járhatunk el ugyanúgy, mit ahogyan azt ismeret szórás esetén tettük, mivel az ott ismertetett konstrukció azon alapult, hogy z= x−m σ ∼ N (0,1) , n és a z statisztikában csak a becsülni kívánt m várhatóérték az egyetlen ismeretlen mennyiség. A most tárgyalt esetben a z statisztikában egy másik ismeretlen mennyiség is szerepel, nevezetesen a változó(populáció) σ szórása. Természeten adódik az az ötlet, hogy a z statisztika helyett vegyük azt a statisztikát, amelyet úgy
kapunk, benne a szórást helyettesítsük a minta szórásával: t n−1 = x −m . s n Erről a t n−1 -gyel jelölt statisztikáról már nem állíthatjuk azt, hogy standard normális eloszlású, mivel a nevezőben szereplő s nem konstans, hanem valószínűségi változó. Bebizonyítható, hogy tetszőleges mintanagyság esetén a fenti statisztika folytonos, szimmetrikus eloszlású, és ha n-1 ≥ 2, akkor E (t n −1 ) = 0 . Az n-elemű mintából számított t n−1 statisztika eloszlását n-1 szabadsági fokú Student-féle t-eloszlásnak ( vagy röviden t-eloszlásnak) nevezzük. Különböző szabadsági fokú t-eloszlások sűrűségfüggvényei láthatók az alábbi ábrán. 39 Student-féle t-eloszlások sűrűségfüggvényei 0.4 0.3 0.2 0.1 sz.f=30 sz.f=100 0 -7 -4 -1 2 5 8 X Adott minta esetén a t-statisztikában már csak a becsülni kívánt m paraméter az egyetlen ismeretlen mennyiség, és így alkalmas arra, hogy segítségével a
kívánt konfidenciaintervallum végpontjai meghatározhatók ⎡ ⎤ ⎢ x − t ⋅ s ,x + t ⋅ s ⎥ , K 1 − α n K 1− α n ⎥ ⎢ ⎢⎣ ⎥⎦ 2 2 ahol a t K 1− α konstans a következő módon határozható meg. Legyen t F n −1 az n-1 2 szabadsági fokú t-eloszlás eloszlásfüggvénye. Ekkor erre a konstansra annak kell teljesülnie, hogy ⎛ F ⎞ ⎟ α = 1− , K α⎟ 2 ⎜ 1− ⎟ 2⎠ ⎝ t ⎜ n −1 ⎜ vagyis azt a valós számot jelöli, ahol az veszi fel. t t α F n −1 eloszlásfüggvény az adott 1 − 2 értéket 40 Várhatóértékre vonatkozó konfidenciaintervallum normális eloszlás és ismeretlen szórás esetén Legyen X∼ N (m, σ ) , és σ nem ismert, x jelölje az X-re vonatkozó nelemű minta átlagát, s pedig a szórását Ekkor az eloszlás m várhatóértékére vonatkozó (1 − α )100% -os megbízhatósági szintű konfidenciaintervallum ⎡ ⎤ ⎢ x − t ⋅ s ,x + t ⋅ s ⎥ , K 1 − α n K 1− α n
⎥ ⎢ ⎢⎣ ⎥⎦ 2 2 ⎛ ⎞ ⎟ α F ⎜ K 1− α ⎟⎟ = 1 − 2 , ahol 2⎠ ⎝ 1 szabadsági fokú t-eloszlás eloszlásfüggvénye. ahol 0< α <1 előre adott érték, és t ⎜ n −1 ⎜ t t F n −1 az n- E konfidenciaintervallum alapján az x pontbecslés hibájára vonatkozóan azt tudjuk állítani, hogy ⎛ ⎜ P⎜ x − m ≤ ⎜ ⎝ ⎞ s ⎟ K 1− α n ⎟⎟ ≥ 1 − α , 2 ⎠ t vagyis x az m-nek legalább 1− α valószínűséggel t K 1−α 2 s -nél kisebb hibájú n becslése. 5.4 KONFIDENCIAINTERVALLUM POPULÁCIÓBELI ARÁNYRA A pontbecslések tárgyalásánál láttuk, hogy a populációbeli p arány pontbecslése a mintabeli r relatív gyakoriság, amelynek z= r−p np(1 − p ) 41 standardizáltja nagy minták esetén közelítőleg standard normális eloszlású. Ha az (1 − α )100% -os megbízhatósági szintű konfidenciaintervallum meghatározásánál a szokásos módon járunk el, akkor a p populációbeli
arányra vonatkozó konfidenciaintervallum: ⎡ ⎢r − st ⋅ 1 , ⎢ K 1− α 4 n ⎢⎣ 2 (1 − α )100% -os megbízhatósági szintű ⎤ 1 ⎥ , r+K α⋅ 4n ⎥ 1− ⎥⎦ 2 st ahol ⎛ ⎞ ⎜ st ⎟ α Φ⎜ K α ⎟ = 1 − . 2 ⎜ 1− ⎟ 2⎠ ⎝ 5.5 ELŐÍRT PONTOSSÁGÚ BECSLÉSÉHEZ SZÜKSÉGES MINTANAGYSÁG MEGHATÁROZÁSA 5.51 A várhatóérték előírt pontosságú becsléséhez szükséges mintanagyság meghatározása Az X valószínűségi változó m várhatóértékének a minta x átlaga legalább 1- α valószínűséggel ε -nál kisebb hibájú becslése, ha P( x − m ≤ ε ) ≥ 1 − α teljesül. Most azt az esetet vizsgáljuk, amikor az 1- α valószínűséget és az ε hibahatárt is mi adjuk meg, és az a kérdés, hogy mekkora mintára van szükségünk ahhoz, hogy ez teljesüljön. a) X normális eloszlású, és σ szórása ismert. A legkisebb mintanagyság, amelynek átlagára a fenti egyenlőtlenség teljesül: 42 ⎡⎛ st
⎢⎜ K α ⋅ σ ⎢⎜ 1− 2 nmin = ⎢⎜ ε ⎢⎜ ⎢⎜ ⎣⎢⎝ ahol ⎞ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠ 2⎤ ⎥ ⎥ ⎥+ 1 , ⎥ ⎥ ⎦⎥ ⎞ ⎛ ⎜ st ⎟ α az illető szám egész részét jelenti, és Φ⎜ K α ⎟ = 1 − . 2 ⎜ 1− ⎟ 2⎠ ⎝ b) X nem normális eloszlású , és σ szórása ismert. Ekkor nagy minták esetén a minta átlaga közelítőleg normális eloszlású, és ilyen nagy mintákból a várhatóértékre vonatkozó konfidenciaintervallumot ugyanúgy határozzuk meg, mint normális eloszlás esetén, tehát a várhatóérték előírt pontosságú becsléséhez szükséges minimális mintanagyság szintén ⎡⎛ st ⎢⎜ K α ⋅ σ ⎢⎜ 1− 2 nmin = ⎢⎜ ε ⎢⎜ ⎢⎜ ⎢⎣⎝ ⎞ ⎟ ⎟ ⎟ ⎟ ⎟ ⎠ 2⎤ ⎥ ⎥ ⎥+ 1 , ⎥ ⎥ ⎥⎦ ⎛ ⎞ ⎜ st ⎟ α ahol Φ⎜ K α ⎟ = 1 − . 2 ⎜ 1− ⎟ 2⎠ ⎝ A gyakorlatban előforduló esetekben a fenti képlet által adott szükséges mintanagyság nagyobb, mint 30,
tehát a minimális szükséges minta mindenképpen nagy mintának fog minősülni. 5.52 A populációbeli arány előírt pontosságú becsléshez szükséges mintanagyság meghatározása A populációbeli p aránynak a mintabeli r relatív gyakoriság legalább 1- α valószínűséggel ε -nál kisebb hibájú becslése, ha P( r − p ≤ ε ) ≥ 1 − α teljesül. Itt az 1- α valószínűséget és az ε hibahatárt mi állapítjuk meg, és az a kérdés, hogy mekkora mintára van szükségünk ahhoz, hogy ez teljesüljön. Az a legkisebb mintaelemszám, amire a fenti egyenlőtlenség teljesül, 43 ⎡⎛ st ⎞ 2 ⎤ ⎢⎜ K α ⎟ ⎥ ⎢⎜ 1− 2 ⎟ ⎥ nmin = ⎢⎜ ⎟ ⎥+ 1 , ⎢⎜ 2ε ⎟ ⎥ ⎢⎜ ⎟ ⎥ ⎠ ⎦⎥ ⎣⎢⎝ ahol a szögletes zárójel a szám egészrészét jelenti, és ⎛ ⎞ ⎜ st ⎟ α Φ⎜ K α ⎟ = 1 − . 2 ⎜ 1− ⎟ 2⎠ ⎝ 44 6. STATISZTIKAI HIPOTÉZISVIZSGÁLAT Az előző fejezetben azt vizsgáltuk, hogy valamely X
valószínűségi változó eloszlásának numerikus jellemzőit hogyan becsülhetjük a változóra vonatkozó minta alapján, és mit mondhatunk a becslések hibájáról. A statisztikai vizsgálatoknak az is lehet a célja, hogy a rá vonatkozó minta alapján eldöntsük, hogy valamely numerikus jellemzőjére vonatkozó sejtésünk igaz-e vagy sem. Tegyük fel például, hogy egy márkamenedzsernek az a sejtése, hogy az adott márka heti eladásait növelni lehetne azzal, hogy az üzletekben elkülönítve, figyelemfelhívó polcokon helyeznék el a termékeket. Valami módon meg kellene győződnie arról, hogy igaz-e a sejtése. Nyilván nem csinálhatja azt, hogy a területén lévő összes üzletbe (az egész populáció) telepíti a bemutató polcokat, és megnézi, hogy mi történik, mert ez jelentős költséggel jár, és lehet, hogy nem is lesz hatásuk az eladásuk alakulására. Ehelyett úgy kell eljárnia, hogy megfelelő módon kiválaszt néhány üzletet
(mintát vesz a populációból), ezekben elvégzi a kísérletet: figyeli egy bizonyos idő eltelte után a heti eladásokat, és ezeket összehasonlítja a régi állapottal. Ha azt tapasztalja, hogy a mintában a heti eladások átlaga nem nagyobb, mint a kísérlet megkezdése előtti heti átlag, akkor a mintája semmi olyan információt nem nyújtott, ami a sejtése igazát bizonyítaná. Ha viszont a kísérletben tapasztalt heti átlagos eladások nagyobbak, mint az azt megelőző heti átlagos eladások voltak, akkor minden további nélkül bevezethetőe a módszer az összes üzletben ? Ekkor egy olyan információt kapott a mintából, hogy lehet, hogy a sejtése igaz, tehát hasonló hatás mutatkozna az egész populációban, de az is előfordulhat, hogy nem, mert amit tapasztalt az csak a mintavételezés véletlenségének a következménye: lehet, hogy voltak a kiválasztott üzletek között olyanok, amelyeknek vásárlóközönsége különösen érzékeny az ilyen
marketing-tevékenységre, és ez más üzletek esetén nem lesz így stb. Valami módon meg kell győződnie arról, hogy amit a mintában tapasztalt, az nagy valószínűséggel ugyanúgy érvényesül az egész populációban is, és kicsi a valószínűsége annak, hogy az csak a véletlen mintavételezés következménye. Az ilyen kérdések megválaszolására szolgálnak a statisztikai hipotézisvizsgálatok. Hipotézisnek nevezünk valamely, a vizsgált X valószínűségi változó numerikus jellemzőjére vonatkozó sejtést, állítást. Az alábbi állítások mindegyike egy-egy hipotézis: Egy főiskolán a matematika kollokviumi jegyek átlaga 4.10 Ez a hipotézis a következőképpen is megfogalmazható. A főiskola hallgatói közül válasszunk ki véletlenszerűen egyet, és X jelentse a kiválasztott hallgató matematika kollokviumi jegyét. m E ( X ) =410 Tehát a populáció átlagára vonatkozó hipotézisünk nem más, mint egy megfelelően definiált
valószínűségi változó várhatóértékére vonatkozó hipotézis. Ennek a hipotézisnek az igazságáról teljes bizonyossággal csak úgy tudunk meggyőződni, ha minden főiskolai hallgatónak ismerjük a kollokviumon szerzett jegyét. 45 Egy bizonyos márkájú televíziókészülékek 0.1 része szorul javításra a garanciális idő alatt (p=0.1) A fentiekkel szemben nem minősülnek hipotézisnek a következők: Az adott főiskola hallgatói közül véletlenszerűen kiválasztott 30 hallgató matematika kollokviumi jegyének átlaga 4.17 ( x = 417 ), mert ez az állítás nem a populációnak (egy valószínűségi változónak) egy numerikus jellemzőjére, hanem egy 30 elemű mintának a numerikus jellemzőjére vonatkozik, és ez bizonyos minták esetén lehet igaz, míg más minták esetén pedig hamis. A tekintett márkájú televíziókészülékek közül kiválasztott 100 készülék 0.15 részét kellett a garanciális időn belül javítani (r=015) (Gondoljuk
meg, hogy miért!) Bármely hipotézisvizsgálatban két sejtés, állítás áll szemben egymással. Az egyik állítás lehet például, hogy m=100, a másik pedig, hogy m ≠ 100, vagy p = 0.1 , és a másik p>0.1, stb Ha a populációk minden egyes egyedéről lenne információnk, akkor teljes biztonsággal el tudnánk dönteni, hogy az állítások közül melyik igaz. Erre azonban a statisztikai elemzések esetén nincs lehetőségünk, hanem csak arra szorítkozhatunk, hogy a vizsgált változóra vonatkozó(az adott populációból vett) minta alapján döntsünk. A statisztikai hipotézisvizsgálatok (statisztikai próbák) azok a módszerek, amelyek segítségével ez elvégezhető. Ezek során kiindulásként mindig feltesszük, hogy a két sejtés közül az egyik igaz. A hipotézisvizsgálat során ezt csak akkor utasítjuk el a másik állítással szemben, ha a mintában tapasztaltak nem egyeztethetők össze a kiindulási feltevésünkkel. Nullhipotézisnek ( H 0 )
nevezzük azt az állítását, amelyet a kiinduláskor igaznak tételezünk fel. Az ezzel szemben állított másik feltételezést alternatív hipotézisnek ( H A ) nevezzük. A statisztikai hipotézisvizsgálat végeredményeként két fajta döntést hozhatunk: elutasítjuk H 0 -t, ha a mintánk nagyon erősen azt bizonyítja, hogy az alternatív hipotézis igaz, vagy elfogadjuk H 0 -t, ha a mintánk nem szolgáltat kellő bizonyítékot a H A mellett. 5.11 Példa Tegyük fel, hogy egy tejüzemben a 100 gr-os vajcsomagokat akarunk készíteni. A gépsor helyes beállítása esetén a vajcsomagok tömege normális eloszlású, amelynek várhatóértéke 100 gr. Az üzemelés folyamán azonban a gépsor "elállítódhat", aminek az a következménye, hogy már átlagosan nem 100 gr tömegű csomagokat fog készíteni. Ennek megfelelően az üzemelés folyamán rendszeresen ellenőrizni kell, hogy a gép még a helyes beállításnak megfelelően működik vagy sem. A
kiindulási sejtésünk az, hogy igen. H 0 : m=100 46 Ez az állítás csak akkor igaz, ha az m várhatóérték tényleg egyenlő a nullhipotézisben szereplő 100-as értékkel. Ezzel szembe állítjuk azt a feltételezést, hogy a gépünk már nem a helyes beállításnak megfelelően működik. Nem helyes a beállítás, ha az átlagos tömeg kisebb, mint 100 gr, vagy, ha nagyobb, mint 100 gr. Azaz ilyenkor az alternatív hipotézis H A : m ≠ 100 Ez az állítás az m várhatóérték minden 100-tól különböző értéke esetén igaz. 5.12 Példa Egy bizonyos márkájú cigaretta dobozán az szerepel, hogy a szálankénti nikotintartalom 0.3 mg Ez azt jelenti, hogy a gyártó cég arról biztosítja a fogyasztókat, hogy az ezzel a technológiával eddig gyártott, és ezután gyártott cigaretták szálankénti nikotintartalmának várhatóértéke 0.3 mg A fogyasztókat, akik ezt a márkát vásárolják az kevéssé zavarná, ha az derülne ki, hogy ez a
várhatóérték kisebb, mint 0.3 mg, őket nyilván csak az érdekli, hogy ne legyen 0.3 mg -nál nagyobb az átlagos nikotintartalom Ezért, ha ellenőrzik a cigaretta nikotintartalmát egy minta alapján akkor a H 0 : m=0.3 nullhipotézissel szemben a H A : m >0.3 alternatív hipotézist fogják állítani. A nullhipotézis most is olyan ,hogy csak egyetlen esetben igaz, nevezetesen, amikor a várhatóérték 100. Az alternatív hipotézis viszont igaz, ha az m várhatóérték bármely 0.3-nél nagyobb értékkel egyenlő. A nullhipotézisek általában olyan alakúak, hogy a tekintett numerikus jellemzőről azt állítjuk, hogy az egy bizonyos értékkel egyenlő. Ezt az értéket a továbbiakban feltételezett értéknek fogjuk nevezni. Ahogyan a fenti példákban is látható, a nullhipotézisek olyanok, hogy csak akkor igazak, ha a numerikus jellemző tényleg egyenlő a feltételezett értékkel. Egyszerû hipotézis Valamely hipotézist egyszerû hipotézisnek
nevezünk, ha a benne szereplõ numerikus jellemzõ egyetlen értéke esetén igaz. 47 Összetett hipotézis Összetett hipotézisrõl beszélünk akkor, ha a hipotézis a benne szereplõ paraméter több értéke esetén is igaz. A statisztikai hipotézisvizsgálatok során H 0 egyszerű hipotézis, és ezzel szemben áll a H A összetett hipotézis. Tehát a nullhipotézis mindig a következő alakú: H 0 : a tekintet numerikus jellemző= feltételezett érték Ezzel szemben, a vizsgált problémától függően a következő alakú alternatív hipotézisek valamelyike áll: H A : a tekintett numerikus jellemző ≠ feltételezett érték, H A : a tekintett numerikus jellemző < feltételezett érték, H A : a tekintett numerikus jellemző > feltételezett érték. Alternatív hipotézisek fajtái Az olyan alternatív hipotézist, amelyik a numerikus jellemzõ minden, a feltételezettõl különbözõ értéke esetén igaz kétoldali alternatív hipotézisnek nevezzük.
Az olyan alternatív hipotézist, amelyik a numerikus jellemzõ minden, a feltételezettnél nagyobb értéke esetén igaz jobboldali alternatív hipotézisnek nevezzük Az olyan alternatív hipotézist, amelyik a numerikus jellemzõ minden, a feltételezettnél kisebb értéke esetén igaz baloldali alternatív hipotézisnek nevezzük Nagyon körültekintően kell eljárnunk egy statisztikai próba alkalmazásánál a hipotézisek megfogalmazását illetően. A statisztikai próbák alkalmával, a nullhipotézist akkor vetjük el, ha a mintánk nagyon erősen az alternatív hipotézis mellett érvel. Ha nullhipotézist elfogadjuk, akkor az nem azt jelenti, hogy a mintánk nagyon erősen alátámasztja azt, hanem csak az a helyzet, hogy nincs elég bizonyítékunk az alternatív hipotézis mellett. 48 Ha a tesztelendő hipotéziseinket megfogalmaztuk, akkor szükségünk van egy megfelelő eljárásra, amellyel egy minta alapján a döntésünket meg tudjuk hozni. Ezt az
eljárást statisztikai próbának (teszt) nevezzük. 6.1 STATISZTIKAI PRÓBÁK SORÁN FELLÉPŐ HIBÁK A statisztikai próbák során egy minta alapján hozzuk meg a döntésünket, ezért nyilván fennáll a hibás döntés lehetősége. A hiba lehetőségét csak úgy lehetne kiküszöbölni, ha a populáció minden egyes egyedéről lenne információnk. Kétféle módon is hibázhatunk : egyrészt amikor elutasítjuk a nullhipotézist amikor az valójában igaz, másrészt amikor elfogadjuk a nullhipotézist, holott az hamis: VALÓSÁG DÖNTÉS H 0 igaz H A igaz Elvetjük H 0 -t I. fajú hiba helyes döntés Elfogadjuk H 0 -t helyes döntés II. fajú hiba Az elsőfajú hiba valószínűségét α -val, a másodfajú hiba valószínűségét β -val fogjuk jelöni. A hipotézisvizsgálatok során fellépő hibák Az elsőfajú hiba akkor fordul elő, amikor az igaz nullhipotézist elvetjük. A másodfajú hibát akkor követjük el amikor a nullhipotézist elfogadjuk,
holott az alternatív hipotézis az igaz. Egy ideális eljárás az lenne amikor α = 0 és β = 0 . Ilyen azonban csak akkor lehetséges, ha a populáció minden egyedéről van információnk. Ha a döntésünket csak egy minta alapján hozzuk meg, akkor a hibák valószínűsége természetesen pozitív, de arra kell törekednünk, hogy lehetőleg kicsik legyenek. Mint majd az egyes próbák részletes tárgyalásánál látni fogjuk, azt tudjuk közvetlenül megadni, hogy mekkora elsőfajú hibavalószínűséget engedünk meg, és ez már egy adott mintanagyság esetén 49 meghatározza, a másodfajú hiba elkövetésének valószínűségét, és az igaz, hogy az adott mintanagyság esetén minél kisebb az elsőfajú hiba elkövetésének valószínűsége, annál nagyobb a másodfajú hiba valószínűsége. Ha adott α esetén a β értékét is elő akarjuk írni, az csak úgy lehetséges, hogy megfelelően nagy mintát kell vennünk. Mivel α annak a valószínűsége,
hogy egy igaz nullhipotézist elutasítunk az α=0.05 választás azt jelenteni, hogy ha ilyen alapon hozunk sokszor döntést különböző minták alapján, akkor azon eseteknek, amikor a nullhipotézis teljesül közelítőleg 5%-ában fogjuk ezt az igaz nullhipotézist elvetni. Ha az α értékét kicsinek választjuk, akkor kicsire akarjuk csökkenteni ennek a hibának kockázatát. Természetesen az α csökkentésénél mindig szem előtt kell tartanunk azt, amit ennek a másodfajú hibavalószínűségre gyakorolt hatásáról az előzőekben mondtunk. Ha a másodfajú hiba elkövetésének súlyos következményei vannak, és nincs módunk a minta nagyságának megfelelő megválasztásával a kívánatos másodfajú hibavalószínűséget is biztosítani, akkor inkább az elsőfajú hibavalószínűséget kell egy kicsit nagyobbnak választani. 6.2 EGYMINTÁS PRÓBÁK Az egymintás próbák olyan statisztikai eljárások, amikor egy változó valamely numerikus
jellemzőjére vonatkozó hipotéziseket vizsgálunk, és a változóra vonatkozó egyetlen minta alapján hozzuk meg a döntésünket. 6.21 Normális eloszlású változó várhatóértékére vonatkozó próba ismert szórás esetén. Ezt az irodalomban sokszor u-próbának nevezett statisztikai próbát igen részletesen tárgyaljuk, mert az ennek során tett megállapításaink, általában minden próba esetén érvényesek. Ami csak az u-próba esetén teljesül, arra külön utalni fogunk Először tekintsük a következő példát. Egy cigaretta márka esetén a gyártó azt állítja, hogy a szálankénti kátránytartalom 6 mg. Az egészségügyi hatóságok ellenőrizni akarják, hogy a gyártónak ez az állítása igaz-e. Az ismeretes, hogy a szálankénti kátránytartalom normális eloszlású, és a változó szórása 1 mg. Legyen X a szálankénti kátránytartalom, amiről most azt tudjuk, hogy X∼ N (m,1) , és a gyártónak az m várhatóértékre vonatkozóan
van egy állítása, amelyet ellenőrizni akarunk. A hipotéziseinket a következőképpen fogalmazzuk meg: kiinduláskor feltételezzük, hogy a gyártónak igaza van: H 0 : m=6, és ezzel szembe a következő jobboldali alternatív hipotézist állítjuk H A : m>6. 50 Jobboldali alternatív hipotézis választását a következő indokolja. Emlékeztetünk rá, hogy a nullhipotézist akkor fogjuk az eljárás során elvetni, ha a mintánk erősen az alternatív hipotézis mellett fog érvelni. A fogyasztóknak az az érdeke, hogy akkor vessük el a nullhipotézist (a gyártó állítását), ha az átlagos kátránytartalom meghaladja a feltüntetett értéket, és nem különösebben szüksége elvetnünk a nullhipotézist, ha a mintánk a mellett érvelne, hogy az átlagos kátránytartalom kisebb, mint amit a gyártó megadott, mert ez csak azt jelentené, hogy igazából jobb minőségű a cigaretta, mint amilyennek gondolják. Tegyük fel, hogy véletlenszerűen
kiválasztott 100 szál cigaretta esetén elvégezték a kátránytartalom meghatározását. Vagyis az X változóra vonatkozóan van egy 100 elemű mintánk. Mi legyen az a statisztika, aminek alapján meghozzuk a döntésünket? Mivel a változó várhatóértékére vonatkoznak a hipotéziseink, kézenfekvő a minta x átlagát használni. Azt a statisztikát, amely alapján egy statisztikai hipotézisvizsgálatban a döntésünket meghozzuk próbastatisztikának nevezzük Természetesen nem bármely statisztika alkalmas a szóban forgó hipotéziseink tesztelésére. Próbastatisztika Próbastatisztika egy olyan statisztika, amelynek a nullhipotézis teljesülése estén ismerjük az eloszlását. Tegyük fel, hogy a 100 kátránytartalom átlaga x = 6.1 mg-nak adódott Ez a mintaátlag nagyobb, mint amit a populációbeli átlagos értékről a gyártó állít. Tudjuk, hogy egy minta átlaga valószínűségi változó, az adott körülmények esetén x ∼ N (m,0.1) Két
lehetséges eset közül kell döntenünk. a) A gyártó állítása ( a nullhipotézisünk) igaz. Ekkor x ∼ N (6,01) ) , és csak az x valószínűségi változó természetes szóródásának következményeként adódott a 6.1es mintaátlag b) Azért kaptunk 6.1-es mintaátlagot, mert a valóságban nem a nullhipotézis, hanem az alternatív hipotézis igaz, és így a mintaátlag várhatóértéke is nagyobb mint 6. Kérdés az, hogy a mintából kapott 6.1-es átlag már elegendő bizonyítéknak tekinthető az m>6 alternatív hipotézis mellett. Ugyanis igaz nullhipotézis esetén, amikor m=6, is előfordulhat olyan 100 elemű minta, amelynek átlaga 6.1, mivel a minta átlaga maga is valószínűségi változó. Azt kell eldöntenünk, hogy a minta átlagának 6-tól való tapasztalt eltérése még "belefér-e" az m=6 esetén meglévő természetes ingadozásba, 51 vagy ez már olyan jelentős eltérés a nullhipotézisben feltételezett értéktől ,amely
igaz nullhipotézis esetén csak nagyon kicsi valószínűségű. Meg kell adnunk, egy olyan, nyilván 6- nál nagyobb, K értéket, amelyre az teljesül, hogy igaz nullhipotézis esetén ennél nagyobb mintaátlagnak kicsi a valószínűsége. a) Ha ennél a K értéknél nagyobb mintaátlagot kapunk, ez már olyan nagy eltérésnek minősül, ami igaz nullhipotézis esetén kevéssé valószínű. Egy ilyen, mintaátlagot már az alternatív hipotézis melletti bizonyítéknak kell tekinteni, tehát ilyenkor a nullhipotézist el fogjuk vetni. b)Ha viszont a mintánk átlaga noha nagyobb, mint 6, a nullhipotézisben feltételezett érték, de K-nál kisebb, akkor ez még nem elegendően erős bizonyíték az alternatív hipotézis mellett, mert ilyen mintaátlag, a természetes szóródás következtében viszonylag nagy valószínűséggel akkor is adódhat, ha a nullhipotézis igaz, tehát ilyenkor a nullhipotézist elfogadjuk. Kérdés, hogy K-t hogyan határozzuk meg. Legyen adott
α , az elsőfajú hibának a valószínűsége. Az elsőfajú hibát akkor követjük el, ha az igaz nullhipotézist elvetjük, tehát P(elvetjük H 0 − t H 0 igaz) = α . A fent vázolt eljárásban pedig akkor vetjük el a nullhipotézist, ha x > K , tehát K-nak olyannak kell lennie, amelyre P(x > K H 0 igaz ) = α teljesül. Tegyük fel, hogy α=0.05-os elsőfajú hibavalószínűséget engedünk meg a döntési eljárásban Ekkor annak kell teljesülnie, hogy: P(x > K m = 6) = 0.05 Ezt a K értéket a próba kritikus értékének, a [K , ∞ ) halmazt pedig a próba kritikus tartományának nevezzük. (Az elnevezés onnan adódik, hogy ha az x ≥ K , azaz az x ∈ [K , ∞ ) esemény bekövetkezik, akkor kritikával élünk a nullhipotézist illetően.) Ha a nullhipotézis igaz(m=6), akkor x ∼ N (6,0.1) Legyen ennek a nomális eloszlásnak az eloszlásfüggvénye F ( x ) . Rajzoljuk fel ennek a normális eloszlásnak a sűrűségfüggvényét: 52 Az ábrán
satírozott terület nagysága nem más, mint igaz nullhipotézis esetén az x > K esemény valószínűsége, vagyis az elsőfajú hiba valószínűsége. Tehát a próba kritikus értékére annak kell teljesülnie, hogy F (K ) = 0.95 , amiből K = 6.165 adódik Ennek alapján esetünkben a döntést a következőképpen hozzuk meg: mivel x = 6.1<6165, azaz 61 ∉ [6165, ∞ ) ezért az m=6 nullhipotézist elfogadjuk, és azt mondjuk, hogy (1-0.05)100%=95%-os szinten nincs szignifikáns eltérés (különbség), tudniillik a nullhipotézistől. A mintánk nem szolgáltatott elegendő bizonyítékot az m>6 alternatív hipotézis mellett. Ha nincsen számítógépünk, amelyen megtalálható valamely általános célú statisztikai programcsomag, akkor a következőképpen járunk el. F (x ) legyen az N (6,01) eloszlás eloszlásfüggvénye. Ekkor azt a K értéket az ⎛ K −6⎞ F (K ) = Φ ⎜ ⎟ = 0.95 ⎝ 0 .1 ⎠ alapján határozzuk meg. Mivel Φ(1.65) = 095 ,
tehát K −6 = 1.65 , 0 .1 53 azaz K = 6 + 0.1 ⋅ 165 = 6165 A fenti konkrét példa alapján általánosan is megfogalmazhatjuk a problémát. Az u-próba általánosan Legyen X ismert σ szórású normális eloszlású változó. Az m = m0 akarjuk tesztelni az nullhipotézist a) m > m0 alternatív hipotézissel szemben. b) m < m0 alternatív hipotézissel szemben c) m ≠ m0 alternatív hipotézissel szemben A próbastatisztikánk az n elemű minta x átlaga, amelyik a nullhipotézis teljesülése ⎛ σ ⎞ ⎟⎟ eloszlású. Ennek az eloszlásnak az eloszlásfüggvénye legyen F (x ) , esetén N ⎜⎜ m0 , n⎠ ⎝ a sűrűségfüggvénye f (x ) . a) Ha α a megengedett elsőfajú hibavalószínűség, akkor a próba K kritikus értékét úgy kell meghatároznunk, hogy a nullhipotézis teljesülése esetén az x ≥ K esemény valószínűsége α legyen. Az ábrából látható, hogy a próba K kritikus értéke nem más, mint az a K1−α valós szám,
amelyre F ( K1 − α ) = 1 − α 54 teljesül. A próba kritikus tartománya pedig [K1−α , ∞ ) Ha csak a standard normális eloszlás eloszlásfüggvényére vonatkozó függvénytáblázatunk van, akkor K meghatározása a következőképpen történik: − m0 ⎞ ⎛K F (K1−α ) = Φ⎜⎜ 1−α ⎟⎟ = 1 − α . ⎝ σ/ n ⎠ Legyen st K 1− α az a valós szám, ahol a standard normális eloszlás eloszlásfüggvénye az 1 − α értéket veszi fel: ( st ) Φ K 1−α = 1 − α . Ekkor K1 − α − m 0 σ/ n = st K 1−α , amiből K1−α = m0 + σ n st ⋅ K 1 −α . b) Az m<m0 baloldali alternatív hipotézis esetén meg kell határoznunk azt, hogy a legalább mennyivel legyen kisebb a minta átlaga, mint m0 ahhoz, hogy az már a nullhipotézis elvetése mellet érveljen. A próba K kritikus értékére annak kell teljesülnie, hogy P(x < K m = m0 ) = α . 55 A próba K kritikus értéke nem más, mint az Kα a valós szám,
amelyre F ( Kα ) = α teljesül. c) Az m ≠ m0 kétoldali alternatív hipotézis esetén meg kell határoznunk, hogy legalább mennyivel legyen a mintánk átlaga kisebb, vagy nagyobb, mint m0 ahhoz, hogy az már a nullhipotézis elvetése mellet érveljen. A próbának ilyen esetben két, az m0 –ra nézve szimmetrikusan elhelyezkedő kritikus értéke lesz, K1 és K 2 , amelyekre P (x < K1 m = m0 ) = teljesül. α 2 , és P (x > K 2 m = m0 ) = α 2 56 A próba K1 kritikus értéke az a K α valós szám, amelyre 2 ⎛ F⎜ Kα ⎜ ⎝ 2 ⎞ α ⎟= ⎟ 2 ⎠ teljesül. Szimmetria okból nyilvánvaló, hogy K 2 = m0 + (m0 − K1 ) . 6.22 Statisztikai próbák általános menete A hipotézisvizsgálatnak az a menete, amit az előzőekben az u-próbával kapcsolatban megismertünk, az általában is érvényes. 1. Megfogalmazzuk a hipotéziseket 2. Megválasztjuk a próbastatisztikát Ez egy olyan statisztika, amelyiknek az eloszlása ismert, ha a nullhipotézis
igaz. 3. Megállapítjuk, hogy mi a megengedett elsőfajú hibavalószínűség: megadjuk α-t. 4. Meghatározzuk a próba TK kritikus tartományát 5. A rendelkezésre álló minta alapján kiszámítjuk a 57 próbastatisztika értékét. 6. Döntünk: a) Ha a próbastatisztika érétke beleesik a TK kritikus tartományba, akkor a nullhipotézist elvetjük, és azt mondjuk, hogy (1-α)100%-os szinten szignifikáns eltérés van (a nullhipotézistől). b) Ha a próbastatisztika érétke nem esik bele a TK kritikus tartományba, akkor a nullhipotézist elfogadjuk, és azt mondjuk, hogy (1-α)100%-os szinten nincs szignifikáns eltérés (a nullhipotézistől). 6.23 Elsőfajú hibavalószínűség hatása a próba kritikus értékére X ismert σ szórású normális eloszlású változó. Az m = m0 nullhipotézist teszteljük az m > m0 alternatív hipotézissel szemben. A próbastatisztikánk az n elemű minta x átlaga, amelyik a nullhipotézis teljesülése ⎛ σ ⎞ ⎟⎟
eloszlású. Ennek az eloszlásnak az eloszlásfüggvénye legyen F (x ) , esetén N ⎜⎜ m0 , n⎠ ⎝ sűrűségfüggvénye pedig f (x ) . α elsőfajú hibavalószínűség mellett a próba kritikus értéke az a K1− α ,,amire F ( K1 − α ) = 1 − α teljesül. A kérdést csak jobboldali alternatív hipotézis esetén nézzük meg, de a megállapításaink más típusú alternatív hipotézis esetén is igazak. Legyen α1 < α 2 . Az alábbi ábrából látható, hogy K1−α1 > K1−α 2 58 Vagyis ha x > K α1 akkor x > Kα2 is teljesül, tehát ha valamely α1 hibavalószínűség mellet a próbastatisztikánk értéke a nullhipotézis elvetését eredményezi, akkor minden nála nagyobb α 2 hibavalószínűség mellett is azt fogja eredményezni. Mindaz, amit a fentiekben az u-próbával kapcsolatosan megállapítottunk más statisztikai hipotézisvizsgálatok esetén is igazak. 6.24 Próba szignifikancia szintje Próba szignifikancia szintje
Valamely próba szignifikancia szintjének(P-értékének) nevezzük azt a legkisebb elsőfajú hibavalószínűséget, amely esetén a próbastatisztikánk még a nullhipotézis elvetését eredményezi. Az u-próba bevezetőjében tárgyalt példában a 100 elemű minta 6.15-os értéke 005 elsőfajú hibavalószínűség mellett nem eredményezte a nullhipotézis elvetését. Mi lenne a helyzet, ha például 0.2-es elsőfajú hibavalószínűséget engednénk meg? Ekkor a próba kritikus értéke: K 0.8 = 6 085 Ekkor viszont a próbastatisztikánk értéke beleesik a kritikus tartományba, 6.15>6085, 615 ∈ [6085, ∞) , tehát 02-es elsőfajú hibavalószínűség mellet a próbastatisztikánk 6.15-os értéke a nullhipotézis elvetését eredményezi . (Gondoljuk meg azonban, hogy a 02-es elsőfajú hibavalószínűség azt jelenti, hogy ha sok 100 elemű minta alapján hoznánk meg úgy a döntésünket, hogy a minták átlagát a 6.085-ös értékhez hasonlítjuk, akkor
átlagosan az igaz nullhipotézisek 20%-át el fogjuk vetni.) Kérdés: melyik az a legkisebb α, amely mellet még a 6.15-os érték ilyen döntést eredményezik. Erre az α-ra nyilván az teljesül, hogy a hozzá tartozó kritikus 59 tartományba a 6.15 még éppen beleesik, azaz ehhez az α-hoz tartozó kritikus tartomány TK = [K1−α , ∞ ) = [6.15, ∞ ) A kérdés tehát az, hogy melyik az az α, amelyhez tartozó kritikus tartomány a [6.15, ∞ ) Ha F ( x ) jelenti az adott normális eloszlás eloszlásfüggvényét, akkor α az F( 6.15) = 1 − α feltételből határozható meg. Az adott eloszlásfüggvényre vonatkozó függvénytáblázat alapján megállapítható, hogy F (6.15) = 09332 Tehát 1-α=09332, vagyis a próba szignifikancia szintje(P-értéke) α=1-0.9332= 00668, tehát 0.0668 az a legkisebb elsőfajú hibavalószínűség, amely mellett a 100 elemű minta 6.15-os átlaga még az m=6 nullhipotézis elvetését eredményezi Ha az adott
eloszlásfüggvényre vonatkozó függvénytáblázat nem áll rendelkezésünkre, akkor a standard normális eloszlás Φ( x ) eloszlásfüggvényének függvénytáblázatát használva a következőképpen járhatunk el. ⎛ 6.15 − 6 ⎞ F (6.15) = Φ⎜ ⎟ = Φ (1.5) = 09332 = 1 − α , ⎝ 0 .1 ⎠ amiből α=0.0668, vagyis a próba szignifikancia szintje P=00668 A próba szignifikancia szintjének meghatározása. A kérdést részletesen az u-próba esetén tárgyaljuk, de teljesen hasonlóan kell eljárnunk más próbák esetén is. Legyen X normális eloszlású, amelynek σ szórása ismert. A próbastatisztika n elemű minta x átlaga. H0: m = m0 A nullhipotézis teljesülése esetén eloszlásfüggvénye legyen F ( x ) . ⎛ σ ⎞ ⎟⎟ , ennek az eloszlásnak az x ~ N ⎜⎜ m0 , n⎠ ⎝ A próba P szignifikancia szintjét, abból a feltételből határozhatjuk meg, hogy P az a legkisebb elsőfajú hibavalószínűség, amely esetén a minta átlaga még
éppen beleesik a próba kritikus tartományába. a) HA: m > m0 . TK = [K1− P , ∞ ) = [x , ∞ ) , 60 tehát K1− P = x , F (x ) = 1 − P , amiből P = 1 − F (x ) . b) HA: m < m0 . TK = (− ∞, K P ] = (− ∞, x ] , tehát KP = x , F (x ) = P . c) HA: m ≠ m0 . ⎞ ⎤ ⎡ ⎛ TK = ⎜ − ∞, K P ⎥U ⎢ K P , ∞ ⎟⎟ ⎜ ⎥ ⎢ 1− 2⎦ ⎣ 2 ⎠ ⎝ Most két eset lehetséges. 1. A rendelkezésre álló minta átlaga kisebb, mint m0 Ekkor KP = x, 2 F (x ) = P , 2 amiből P = 2F (x ) . 2. A rendelkezésre álló minta átlaga nagyobb, mint m0 Ekkor K 1− P 2 = x, F (x ) = 1 − amiből P , 2 61 P = 2(1 − F (x )) . Döntési szabály a próba szignifikancia szintjének ismeretében Legyen α a megengedett elsőfajú hibavalószínűség. A hipotézisek és a próbastatisztika ismeretében meghatározzuk a próba P szignifikancia szintjét. a) Ha P>α, akkor a nullhipotézist elfogadjuk, mivel P az a legkisebb elsőfajú
hibavalószínűség, amely mellett a mintánk alapján a nullhipotézis el kellene vetnünk. b) Ha P ≤ α , akkor a nullhipotézist elvetjük. 62 6.25 Változó várhatóértékére vonatkozó próba ismert szórás és nagy minták esetén. Legyen a vizsgált változó X, amelynek σ szórása ismert, de az eloszlását nem ismerjük. Jelölje m a változó várhatóértékét, és x az X-re vonatkozó n elemű minta átlagát. Az m = m0 nullhipotézist teszteljük az m >m0, m < m0, m ≠ m0 alternatív hipotézisek valamelyikével szemben. ⎛ σ ⎞ ⎟⎟ Mivel nagy minták esetén a nullhipotézis teljesülésekor x jó közelítéssel N ⎜⎜ m0 , n⎠ ⎝ eloszlású ebben az esetben is az u-próba alkalmazható. 6.26 Populációbeli arányra vonatkozó próba nagy minták esetén. Tegyük fel, hogy a vizsgált populáció p-ed része rendelkezik valamely S tulajdonsággal A populációból vett n elemű véletlen mintában az S tulajdonságú egyedek relatív
gyakorisága legyen r. A H0: p = p0 nullhipotézist teszteljük a p > p0 , p < p0 , p ≠ p0 alternatív hipotézisek valamelyikével szemben. Nagy minták esetén az r relatív gyakoriság a nullhipotézis teljesülése esetén jó ⎛ p 0 (1 − p 0 ) ⎞ ⎟ eloszlású, tehát az u-próba alkalmazható. közelítéssel N ⎜ p 0 , ⎜ ⎟ n ⎝ ⎠ 6.27 Normális eloszlású változó ismeretlen szórás esetén. várhatóértékére vonatkozó próba Legyen X N (m, σ ) eloszlású , ahol a σ szórás most ismeretlen, és a várhatóértékre vonatkozó H0: m = m0 nullhipotézist akarjuk tesztelni az m > m0 , m < m0 , m ≠ m0 alternatív hipotézisek valamelyikével szemben. Legyen az X-re vonatkozó n elemű minta átlaga x , a szórása pedig s. Ha H0 nullhipotézis igaz, akkor a t= x − m0 s n statisztika eloszlása ismert, nevezetesen n-1 szabadsági fokú t-eloszlású, tehát alkalmas próbastatisztikának. Ezt a statisztikát t-statisztikának nevezzük
63 Ha megadjuk az α elsőfajú hibavalószínűséget, akkor a próba kritikus értékét, illetve a kritikus tartományát az u-próbánál megismert módon határozzuk meg, csak most az n-1 szabadsági fokú t-eloszlás f n −1 ( x ) sűrűségfüggvényét és Fn −1 ( x ) eloszlásfüggvényét kell alapul vennünk. Először nézzük részletesen a jobboldali alternatív hipotézis esetét. H0 : m = m0 HA :m > m0 . A próba kritikus értékét abból a meggondolásból kiindulva határozzuk meg, hogy ha a nullhipotézis igaz, akkor x várhatóérték m0 , tehát nagy valószínűséggel a t-statisztika értéke kicsi lesz, mert a számlálóban egy nullához közel eső mennyiség szerepel. Természetesen, mivel valószínűségi változóról van szó, a természetes szóródás következtében időnként előfordulhatnak a nullától való, bármely irányú aránylag nagy eltérések is. Meg kell állapítanunk azt a határt, amelynél ha a t-statisztika értéke
nagyobb, akkor annak már kicsi a valószínűsége, hogy ez igaz nullhipotézis melletti természetes szóródás következménye, hanem annak tudható be, hogy a változónk várhatóértéke nagyobb, mint a nullhipotézisben feltételezett m0 érték. Ezt a határt abból a letételből állapítjuk meg, hogy igaz nullhipotézis esetén, annak a valószínűsége, hogy ennél nagyobb t-statisztika adódjon α -val legyen egyenlő, vagyis meg kell keresnünk azt az értéket, amelytő a f n −1 (x ) sűrűségfüggvény alatti terület jobbra eső része éppen α -val egyenlő: Az ábrából látható, hogy a keresett érték, nem más, mint az K t 1−α -val jelölt szám, amelyre Fn −1 (K α ) = 1 − α t 1− 64 teljesül. A kritikus érték ismeretében a próbát úgy kell végrehajtani, hogy az adott mintából kiszámítjuk a t-statisztika értékét, és ezt összehasonlítjuk a próba kritikus értékével. Ha t ≥ K t1−α , akkor a nullhipotézist elvetjük,
ellenkező esetben pedig elfogadjuk. Hasonlóan értékek. adódnak a másik két típusú alternatív hipotézisek esetén is a kritikus H0 : m = m0 HA jobboldali baloldali kétoldali m > m0 m < m0 m ≠ m0 K t1−α K tα K t α2 A próba kritikus értékei Kritikus tartományok K t 1− α2 [K t 1−α , ∞ ) (− ∞, K t α ] ⎛ − ∞, K t α ⎤ ⎡ K t α , ∞ ⎞ ⎜ U 1− 2 ⎟⎠ 2 ⎥⎦ ⎢⎣ ⎝ Ezt a próbát egymintás t-próbának nevezzük. 6.3 KÉTMINTÁS PRÓBÁK A következőkben olyan problémákat fogunk tárgyalni, amikor két populáció átlagát (két valószínűségi változó várhatóértékét kell összehasonlítanunk két minta alapján. Az alkalmazandó módszer attól függ, hogy a két minta független-e vagy sem. Két mintát függetlennek nevezünk, hogy ha az egyik mintába tartozó egyedek kiválasztása semmilyen hatással nincs arra, hogy a másik mintába milyen egyedeket választunk. A független minták nem
feltétlenül azonos elemszámúak Ilyen eset leggyakrabban a következő esetekben fordul elő. Két olyan populációnk van, amelyekben az egyedek halmaza különböző, a tekintett jellemző viszont ugyanaz., és azt a nullhipotézist kell vizsgálnunk, hogy a két populáció átlaga egyenlő-e a lehetséges alternatív hipotézisek valamelyikével szemben. Ekkor úgy járunk el, hogy az egyik halmazból véletlenszerűen kiválasztunk n egyedet, és a másik halmazból ettől függetlenül véletlenszerűen kiválasztunk m egyedet. 65 Az n egyed esetén a jellemző értékei X 1 , K , X n ,(egyik minta), az m egyed esetén a jellemző értékei Y1 ,K , Ym (másik minta). Ezek a minták függetlenek, és ilyenkor az X 1 ,K , X n .Y1 ,K , Ym valószínűségi változók függetlenek. Ha az egyik minta elemei valamilyen értelemben párosíthatók a másik minta elemeivel, akkor a minták nem tekinthetők függetleneknek. Ennek tipikus esete, amikor a két mintában ugyanazok az
egyedek vannak. Az ilyen mintákat párosított mintáknak nevezzük. Ilyen párosított (tehát függő)mintákról van szó akkor ha két olyan populációról van szó, amelyekben az egyedek halmaza ugyanaz és valamilyen jellemzőt tekintünk, de két különböző időpontban, és a két időpont között az egyedeket valamilyen hatás érte, Azt akarjuk vizsgálni, hogy ez a hatás megváltoztatja-e a populáció átlagát. Az egyedek közül véletlenszerűen kiválasztunk n egyedet, és valamely időpontban ezen egyedek esetén a jellemző értékei X 1 , K , X n (egyik minta). Ezeket az egyedeket kitesszük a vizsgált hatásnak, és ezután ugyanezeknél az egyedeknél egy ezt követő időpontban is megmérjük a jellemző értékét. Legyenek ezek Y1 ,K, Yn (másik minta). Ezek a minták párosított minták: az X i mintaelem párja a másik mintából Yi (i = 1,K, n ) : X i a jellemző értéke az i. egyednél a hatás előtt, és Yi a jellemző értéke az i. egyednél a
hatás után Ezek a minták nem függetlenek, mert noha az X 1 , K , X n valószínűségi változók függetlenek, és az Y1 ,K, Yn valószínűségi változók is függetlenek, a 2n darab X 1 ,K, X n , Y1 ,KYn valószínűségi változó nem független, mert X 1 és Y1 , X 2 és Y2 , K , X n és Yn nem függetlenek. 6.31 Két normális eloszlású változó függő minták alapján várhatóértékének összehasonlítása Azt szeretnénk vizsgálni, hogy egyedek egy adott halmazában valamely X jellemző, átlagos értékét egy bizonyos tevékenység(beavatkozás, hatás) megváltoztatja-e vagy sem. 66 Egy véletlenszerűen kiválasztott egyed esetén X e -vel jelöljük a jellemzőt az adott tevékenység előtt, és X u -val pedig a tevékenység után. Legyen me = E ( X e ) és mu = E ( X u ) A fentiek szerint a H0: me = mu ullhipotézist kell tesztelnünk a HA: mu > me , mu < me , mu ≠ me alternatív hipotézisek valamelyikével szemben. Legyen D = X u − X e,
ami nem más, mint a jellemző megváltozása a kiválasztott egyed esetén. Mivel ( ) ( ) ( ) m = E (D ) = E X u − X e = E X u − E X e = mu − me . a fenti hipotézisek a D különbségváltozó ekvivalensek: várhatóértékére nézve a következőkkel H0: m = 0, HA: m > 0, m < 0, m ≠ 0 . Ha D a normális eloszlású, akkor ezeknek tesztelésére a már megismert egymintás tpróba alkalmazható. Legyenek X 1e , K , X n e , és X 1u , K , X n u az párosított minták. Ekkor X e és X u változókra vonatkozó Di = X i u − X i e ,i = 1,K n 67 a különbségek nem mások, mint a D változóra vonatkozó n elemű minta.(A két párosított minta alapján minden egyednél meg tudjuk határozni, hogy a beavatkozás hatására mennyivel változott a jellemző értéke.) Legyen d és sD D változóra vonatkozó minta átlaga, illetve szórása, azaz 1 n d = ∑ Di n i =1 és sD = 1 n 2 ( Di − d ) . ∑ n − 1 i =1 Ekkor t= d sD n n-1 szabadsági fokú
t-eloszlású, ha a H0: m = 0 nullhipotézis igaz, és az egymintás tprőba a szokásos módon elvégezhető. 6.32 Két normális eloszlású, azonos szórású változó várhatóértékének összehasonlítása független minták alapján Legyen a két vizsgált változónk X és Y. Tegyük fel, hogy X ∼ N ( m1 , σ ) , és Y∼ N ( m2 , σ ) . A két váltózóra vonatkozóan rendelkezünk egy-egy mintával, amelyek függetlenek 68 JELÖLÉSEK várhatóérték variancia szórás 1. változó X m1 σ2 σ 2. változó Y m2 σ2 σ minta nagysága minta minta átlaga varianciája 1. minta X 1,K, X n n x s1 2. minta Y1 , K , Ym m y s2 minta szórása 2 s1 2 s2 A következőkben az m1 = m2 nullhipotézist fogjuk tesztelni az m1 > m2 m1 < m2 m1 ≠ m2 alternatív hipotézisek valamelyikével szemben. A fenti hipotézisek megfogalmazhatók a várhatóértékek m1 − m2 különbségére vonatkozó hipotézisekként: m1 = m2 ⇔ m1 − m2 = 0
. Hasonlóan m1 > m2 ⇔ m1 − m2 > 0 , m1 < m2 ⇔ m1 − m2 < 0 , és m1 ≠ m2 ⇔ m1 − m2 ≠ 0 Az eredeti probléma tehát úgy fogalmazható át, hogy a nullhipotézisben a várhatóértékek különbségének feltételezett értéke mindig 0. Mivel E ( X − Y ) = E ( X ) − E (Y ) = m1 − m2 , és 69 E ( x − y ) = E (x ) − E ( y ) = m1 − m2 , a mintaátlagok x − y különbsége olyan statisztika, amelyik az X-Y változó várhatóértékének torzítatlan becslése. Nézzük meg, hogy mi lesz x − y statisztika varianciája (szórásnégyzete) Mivel független mintákról van szó, a mintaátlagok függetlenek, tehát D 2 ( x − y ) = D 2 ( x ) + (− 1)2 D 2 ( y ) = D 2 ( x ) + D 2 ( y ) . Az egyes minták elemei is függetlenek, tehát D 2 (x ) + D 2 ( y ) = 1 n 2 = (D 2 ( X 1 ) + L + D 2 ( X n ))+ 12 (D 2 (Y1 ) + L + D 2 (Yn ))= m 1 n 2 nσ 2 + ⎛1 1 ⎞ mσ 2 = σ 2 ⎜ + ⎟ ⎝n m⎠ m 1 2 Nyilván x − y maga is
normális eloszlású, mert független normális eloszlású valószínűségi változók lineáris kombinációja. Az előző eredmények alapján a nullhipotézis teljesülése esetén ( m1 − m2 = 0 ) ⎛ 1 1⎞ + ⎟ x − y ∼ N ⎜⎜ 0, σ n m ⎟⎠ ⎝ Ha a szórást ismernénk, akkor a mintaátlagok különbsége megfelelő lenne próbastatisztikának és a már ismert u-próbát alkalmazhatnánk. Mivel azonban most a változók megegyező ο szórása ismeretlen , ugyanúgy járhatunk el, ment az egymintás t-próbánál, azaz vesszük a mintaátlagok különbségének standardizáltját, és benne az ismeretlen szórást valamilyen ο̂ becslésével helyettesítjük: x−y 1 1 σˆ + n m . A két változó egyenlő de ismeretlen ο 2 varianciáját most kétféle módon is tudjuk becsülni. Az X-re vonatkozó n elemű mintából σ 2 becslése a minta varianciája s12 = 1 n ∑ ( X i − x )2 , n − 1 i =1 Az Y-ra vonatkozó m elemű mintából σ 2 becslése a
minta varianciája 70 s2 2 = 1 n ∑ (Yi − y )2 . m − 1 i =1 Felmerül az ötlet, hogy a variancia becsléséhez használjuk fel mindkét mintából származó információt és a közös variancia becslésére tekintsük az egyes minták varianciájának súlyozott átlagát: s2 = n −1 m −1 2 2 s1 + s2 . n + m− 2 n + m− 2 A szórás becslése a két minta alapján a fenti kifejezés négyzetgyöke. Bebizonyítható, hogy a x−y t= s 1 1 + n m statisztika a nullhipotézis teljesülése esetén n+m-2 szabadsági fokú t-eloszlású, továbbá olyan, hogy a minták ismeretében az értéke kiszámítható, tehát alkalmas próbastatisztikának. Ezt a próbát kétmintás t-próbának nevezzük A próba kritikus értékei és kritikus tartományai a szokásos módon határozhatók meg. H0 : m1 − m2 = 0 (m1 = m2 ) HA jobboldali baloldali kétoldali m1 − m2 >0 m1 − m2 < 0 m1 − m2 ≠ 0 (m1 > m2 ) (m1 < m2 ) (m1 ≠ m2 ) K t 1−α K
tα A próba kritikus értékei K t α , K t 1− α 2 [K Kritikus tartományok t 1−α , ∞ A táblázatban most K t 1−α , (− ∞, K t α ] ) K t α , K t α2 és K t 1− α2 2 ⎛ − ∞, K t α ⎤ ⎡ K t α , ∞ ⎞ ⎜ U 1− 2 ⎟⎠ 2 ⎥⎦ ⎢⎣ ⎝ azokat a valós számokat jelentik, amelyekre F (K ) t = 1−α, 1−α ⎛ ⎞ ⎛ ⎞ ⎜ t ⎟ α ⎜ t ⎟ α F K α = α, F⎜ K α ⎟ = , F⎜ K α ⎟ = 1− , 2 ⎜ ⎟ 2 ⎜ 1− ⎟ 2⎠ 2⎠ ⎝ ⎝ ( ) t ahol F (x ) az n+m-2 szabadsági fokú t-eloszlás eloszlásfüggvénye. 71 72 7. VÁLTOZÓK KÖZÖTTI KAPCSOLAT VIZSGÁLATA 7.1 KORRELÁCIÓS EGYÜTTHATÓ Tekintsünk két valószínűségi változót, X-et és Y-t. A két változó ρ -val jelölt korrelációs együtthatóját a következőképpen definiáljuk: ρ = ρ (X ,Y ) = ( ( )) E (X − mx )⋅ Y − m y , σ x ⋅σ y ahol m x = E ( X ), m y = E (Y ) , és σ x = D( X ), σ y = D(Y ) . A korrelációs
együttható értéke nem függ attól, hogy a) a két mennyiség közül melyiket jelöljük X-szel és melyiket Y-nal, b) a két mennyiséget milyen mértékegységben mérjük. A következőkben azt fogjuk megvizsgálni, hogy ez a jellemző milyen információt szolgáltat a két változóra vonatkozóan. 1.Tegyük fel, hogy a két változó független Ebben az esetben E ( X ⋅ Y ) = m x ⋅ m y ( ( )) ( ) E ( X − m x ) ⋅ Y − m y = E XY − m xY − m y X + m x m y = E ( XY ) − m x m y − m x m y + m x m y = = E ( XY ) − m x m y = m x m y − m x m y = 0 , tehát ρ = 0 . 2. A két változó között determinisztikus, lineáris kapcsolat van, azaz Y = αX + β ,ahol α és β valós számok, és α ≠ 0 . Ekkor m y = E (αX + β ) = αm x + β , σ y = D(αX + β ) = α ⋅ σ y , tehát 73 ( ( )) ( ) E ( X − m x ) ⋅ Y − m y = E ( XY ) − m x m y = E ( X (αX + β )) − m x (α m x + β ) = α E X 2 + β m x − α (m x )2 − β m (( ) ) =
α E X 2 − (m x )2 + β (m x − m x ) = α (σ x )2 , és így a korrelációs együttható α ⋅ (σ x )2 α ⎧ 1, ha α > 0 . = =⎨ ρ= σ x ⋅ α ⋅ σ x α ⎩− 1, ha α < 0 3. Ha ρ ≠ 0 , akkor véletlen hibától eltekintve lineáris kapcsolat van a két változó között, azaz léteznek olyan α és β valós számok, hogy Y = αX + β + ε , ahol az ε véletlen hiba az X-től független és E (ε ) = 0 , D(ε ) = σ ε . Megmutatható, hogy ρ= α ⋅ (σ x )2 σ x ⋅ α ⋅ (σ x ) + (σ ε ) 2 2 2 = A fentiekből következik, hogy ρ = α ⋅ (σ x )2 α ⋅ (σ x )2 1 + (σ ε ) α 2 ⋅ (σ x )2 1 ⎛ σ 1 + ⎜⎜ ε ⎝ a ⋅ο x ⎞ ⎟⎟ ⎠ 2 2 = α ⎞ ⎛ σ α ⋅ 1 + ⎜⎜ ε ⎟⎟ ⎝ α ⋅ο x ⎠ 2 . < 1. Látható, hogy ρ akkor van közel az 1-hez, ha σ ε kicsi az a ⋅ σ x -hez képest, tehát ha a véletlen hiba szórása kicsi, azaz ha szoros a lineáris kapcsolat a két változó között. Ha ρ > 0 ,
akkor azt mondjuk, hogy pozitív korreláció van a két változó között (pozitívan korrelálnak), ami azt jelenti, hogy (véletlen hibától eltekintve) ha az egyik változó értéke növekszik, akkor a másiké is növekszik. Ha ρ < 0 ρ > 0 , akkor azt mondjuk, hogy negatív korreláció van a két változó között (negatívan korrelálnak), ami azt jelenti, hogy (véletlen hibától eltekintve) ha az egyik változó értéke növekszik, akkor a másiké csökken. Az y = αx + β egyenest regressziós egyenesnek, és az egyenes α meredekségét pedig regressziós együtthatónak nevezzük Mi a jelentése a regressziós egyenes valamely x0 helyen felvett értékének? Tekintsük a sokaságnak azokat az egyedeit, amelyeknél az X változó értéke x0 . Ezen egyedek esetén az Y változó populációbeli átlaga αx0 + β , ugyanis 74 E (Y X = x0 ) = E (αx0 + β + ε ) = αx0 + β + E (ε ) = αx0 + β . Ha szoros a korreláció a két változó között, és
ismerjük a regressziós egyenest( az α és β ismertek), akkor a regressziós egyenest a következő becslésre használhatjuk A sokaságból kiválasztunk egy egyedet, és megmérjük az X változó értékét. Tegyük fel, hogy ez x0 -nak adódott. Ekkor az egyednél nincs szükség az Y változó mérésére, hanem azt az Yˆ = αx0 + β lineáris kifejezéssel becsülhetjük A becslés hibáját az várhatóértékével jellemezzük: ( ) ( (Y − Ŷ )2 négyzetes eltérés ) ( ) 2 E ⎛⎜ Y − Yˆ ⎞⎟ = E (αx0 + β + ε − (αx0 + β ))2 = E ε 2 = (σ ε )2 , ⎝ ⎠ vagyis a lineáris becslés annál pontosabb, minél kisebb a véletlen hiba szórása, azaz minél nagyobb a korrelációs együttható abszolút értéke. Ha ρ = 0 , akkor X és Y között vagy nincs semmilyen kapcsolat, vagy pedig nem lineáris kapcsolat van közöttük. Ezért ezt a korrelációs együtthatót szokás lineáris korrelációs együtthatónak is nevezni. Például meg lehet
mutatni, hogy ha X∼ N (0 ,1) és Y = X 2 , akkor ρ ( X , Y ) = 0 . (Determinisztikus kapcsolat van közöttük, de ez a kapcsolat nem lineáris: ha X-et ismerem, akkor a hozzá tartozó Y-t mindig úgy kapom meg, hogy X-et négyzetre emelem) Nézzük a következő példákat. Tekintsünk egy sokaságot Adott az egyedek valamely összessége, és két jellemzőjüket vizsgáljuk, X-et és Y-t. Legyen X∼ N (5 ,1.8) , és Y = 2X + 3 + ε , azaz véletlen hibától eltekintve lineáris függvénykapcsolat van közöttük. A sokaságból veszünk egy 50-elemű mintát, és mindegyik egyednél megmérjük mindkét változó értékét. Így kapunk a két változóra egy-egy mintát: X 1 ,K, X 50 és Y1 ,K , Y50 . Az ( X i , Yi ) (i = 1,K,50) pontokat egy koordinátarendszerben ábrázoljuk. 75 a) D(ε ) = 0.2 Ekkor ρ = 0.998 24 22 20 18 y 16 14 12 10 8 6 4 0 1 2 3 4 5 6 7 8 9 10 x Szoros a kapcsolat (korreláció) a két változó között (a hiba szórása kicsi).
b) D(ε ) = 1.8 ρ = 0,894 22 20 18 16 y 14 12 10 8 6 4 0 1 2 3 4 5 x 6 7 8 9 76 c) D(ε ) = 4 ρ = 0,669 24 22 20 18 y 16 14 12 10 8 6 4 2 3 4 5 6 7 8 9 x d) D(ε ) = 12 ρ = 0,287 28 26 24 22 20 18 y 16 14 12 10 8 6 4 2 1 2 3 4 5 6 x 7 8 9 10 11 77 d) X∼ N (5 ,1.8) , Y∼ N ( 2 ,1) és függetlenek ρ =0. 6 5 4 yy 3 2 1 0 -1 -1 0 1 2 3 4 x 5 6 7 8 9 7.2 A KORRELÁCIÓS EGYÜTTHATÓ BECSLÉSE Egy kétváltozós sokaság esetén általában az a helyzet, hogy a ρ = ρ ( X , Y ) korrelációs együtthatót nem ismerjük, hanem azt egy, az ( X , Y ) változókra vonatkozó ( X 1 , Y1 ), ( X 2 , Y2 ),K, ( X n , Yn ) minta alapján becsülnünk kell. A ρ korrelációs együttható becslésére az n ∑ ( X i − x )(Yi − y ) i =1 r= n n i =1 i =1 ∑ ( X i − x )2 ∑ (Yi − y )2 statisztikát használjuk, ahol x= 1 n ∑ Xi, n i =1 y= 1 n ∑ Yi . n i =1 Az r-et a minta (Pearson-féle) korrelációs
együtthatójának , vagy empirikus korrelációs együtthatónak nevezzük. A minta korrelációs együtthatójára is érvényes, hogy a) r ≤ 1, b) a két mennyiség közül melyiket jelöljük X-szel és melyiket Y-nal, c) a két mennyiséget milyen mértékegységben mérjük. A következőkben az alábbi jelöléseket fogjuk használni. n n i =1 i =1 S x = ∑ X i , S y = ∑ Yi , n n n i =1 i =1 i =1 S xx = ∑ X i2 , S yy = ∑ Yi2 , S xy = ∑ X i Yi . Megmutatható, hogy r a következő, a numerikus számolások szempontjából egyszerűbb alakra hozható: 1 SxS y n r= . 1 2⎞ ⎛ 1 2⎞ ⎛ ⎜ S xx − S x ⎟ ⋅ ⎜ S yy − S y ⎟ n n ⎠ ⎝ ⎠ ⎝ S xy − Ha egy mintából az r-et kiszámítjuk, akkor egy 0-tól különböző értéket kapunk még akkor is, ha ρ = 0 . Fontos kérdés azonban azt eldönteni, a minta korrelációs együtthatója alapján, hogy ρ = 0 , vagy ρ ≠ 0 . 7.21 A korrelációs együttható t-próbája. Az X, Y
változók eloszlására vonatkozó bizonyos feltétel esetén van olyan statisztikai próba, amellyel el tudjuk dönteni, hogy a korrelációs együttható (a populációbeli érték) 0-tól különbözik-e. Sajnos a szükséges feltétel ellenőrzése – különösen kis minták esetén – meglehetősen nehéz. Ezért a gyakorlatban azt javasolják, hogy legalább annak kell teljesülnie, hogy mindkét változó normális eloszlású. Ezt pedig a rendelkezésre álló minták alapján például grafikus normalitásvizsgálattal ellenőrizni tudjuk. Ha mindkét változó normális eloszlású, akkor alkalmazható az alábbi próba. A H0 : ρ =0, HA: ρ ≠0 hipotézisek vizsgálatára alkalmas próbastatisztika t= r 2 1− r n−2 , ami a nullhipotézis teljesülése esetén n-2 szabadsági fokú t-eloszlású, aminek alapján a próba a szokásos módon lefolytatható. Ha a próba végrehajtása során az a döntés születik, hogy a nullhipotézist elvetjük, akkor a két
változó nem korrelálatlan ( ρ ≠ 0 ), tehát a két változó között véletlen hibától eltekintve lineáris kapcsolat van. Ha r ≥ 0,8 , akkor ez a lineáris kapcsolat szoros, a véletlen eltérések szórása kicsi. Ha r ≤ 0,2 , akkor noha a változók korrelálnak (nem függetlenek) a köztük lévő kapcsolat gyenge, a regressziós egyenes nem alkalmas arra, hogy az egyik változó megfigyelt értéke alapján a másikat becsülni tudjuk, mert a véletlen hibák szórása nagy. 7.3 A REGRESSZIÓANALÍZIS Ha a korrelációanalízisből az adódott, hogy az X,Y változók ρ korrelációs együtthatója nem nulla, és a minta r korrelációs együtthatója szoros összefüggést jelez, akkor a két változó között viszonylag kis szórású véletlen hibától eltekintve lineáris összefüggés van. Ezen a ponton azonban el kell döntenünk, hogy a két változó közül melyik a független, és melyik a függő változó. Ennek eldöntése azonban nem matematikai
kérdést, ezt egyéb meggondolások alapján kell tisztáznunk. A vizsgált változók természetéből kiindulva meg kell gondolnunk azt, hogy melyik mennyiség változása az oka a másik változásának. A továbbiakban a független változónak tekinthető mennyiség lesz X, amit a regresszióanalízisben szokás prediktor változónak is nevezni. Tehát a fent említett esetben Y = αX + β + ε , ahol α , β valós számok, és ε az X-től független véletlen hiba. Az y = αx + β egyenest regressziós egyenesnek nevezzük, az egyenes α meredekségét pedig regressziós együtthatónak. A probléma most is az, hogy a regressziós egyenes α , , β paramétereit( a populációbeli értékeket) nem ismerjük, azokat csak e rendelkezésünkre álló minta alapján tudjuk becsülni. 7.31 A regressziós egyenes becslése Legyen a rendelkezésünkre álló két minta X 1 ,K, X n és Y1 ,K, Yn . Tekintsük a síkon az ( X 1 , Y1 ),K , ( X n , Yn ) pontokat, és határozzuk meg
az y = ax + b egyenesek közül azt, amelyik legjobban illeszkedik ezekre a pontokra. Először is meg kell mondanunk, hogy mivel mérjük azt, hogy egy egyenes mennyire illeszkedik az adott pontokra. Tekintsük az (X í ,Yi ) (1 ≤ i ≤ n ) pontot. Az Xi helyen az egyenesen felvett függvényérték Yˆi = aX i + b , ami általában különbözik az i-edik egyednél megfigyelt Yi értéktől. Az eltérés ( ) 2 nagyságát az Yi − Yˆi úgynevezett négyzetes eltéréssel jellemezzük. Az egyenes illeszkedésének mértékét pedig azzal adjuk meg, hogy a négyzetes eltérést minden mintaelem esetén kiszámítjuk, és összeadjuk őket: ( ) n 2 S = ∑ Yi − Yˆi . i =1 Ezt a S mennyiséget a négyzetes eltérések összegének nevezzük. Egy egyenes annál jobban illeszkedik az adott pontokra, minél kisebb a négyzetes eltérések összege. A regressziós egyenest pedig azzal az egyenessel fogjuk becsülni, amelyik esetén a négyzetes eltérések a összege
a legkisebb. Egyszerű számolásokkal a négyzetes eltérések összege a következő alakra hozható. 2 ∑ (Yi − Yˆi ) = ∑ (Yi − (aX i + b ))2 = ∑ ((Yi − aX i ) − b )2 = n n n i =1 i =1 i =1 n ( ) n n i =1 i =1 = ∑ (Yi − aX i )2 − 2b(Yi − aX i ) + b 2 = ∑ (Yi − aX i )2 − 2b ∑ (Yi − aX i ) + nb 2 = i =1 = S yy − 2aS xy + a 2 S xx − 2bS y + 2abS x + nb 2 = S (a, b ) . Egy adott minta esetén az S összeg csak az egyenes a, b paramétereitől függ. Meg kell határozni tehát azt az egyenest ( azokat az a, b valós számokat), amely esetén az S (a, b ) minimális. Egy kétváltozós függvénynek ott lehet minimuma, ahol az elsőrendű parciális deriváltjai nullával egyenlők, vagyis venni kell az S a (a, b ) = 0, S b (a, b ) = 0 egyenletrendszer megoldását. S a = −2 S xy + 2S xx a + 2bS x , S b = −2 S y + 2aS x + 2nb, tehát az S xx a + S x b = S xy , S x a + nb = S y lineáris egyenletrendszert kell megoldanunk. A
második egyenletből ( ) 1 S y − S x a = y − ax . n b= Ezt behelyettesítve az első egyenletbe adódik, hogy 1 SxS y n a= . 2 1 S xx − S x n S xy − ( ) Megmutatható, hogy ezen a helyen az S függvénynek van minimuma. Az így meghatározott értékekkel becsüljük a regressziós egyenes paramétereit: 1 SxS y n αˆ = , 2 1 S xx − S x n S xy − ( ) βˆ = ( ) 1 S y − S xαˆ = y − αˆx . n Az y = αˆx + βˆ egyenest a minta regressziós egyenesének, vagy tapasztalati regressziós egyenesnek nevezzük, az α̂ meredekségét pedig a minta regressziós együtthatójának, vagy tapasztalati regressziós együtthatónak. 1) A minta regressziós egyenese átmegy az (x, y ) ponton, ugyanis αˆ x + βˆ = αˆ x + ( y − αˆ x ) = y . 2) A függő változóra vonatkozó minta 1 n (Yi − y )2 ∑ n − 1 i =1 varianciája két részre bontható, ugyanis 2 2 ∑ (Yi − y )2 = ∑ (Yˆi − y ) + ∑ (Yi − Yˆi ) , n n n i =1 i =1 i =1 ami azt
jelenti, hogy a függő változó teljes varianciája a regresszióból adódó varianciából(1. tag) és a hibák(reziduálok) négyzetösszegeiből tevődik össze (2 tag) Röviden a fenti felbontást a következőképpen szokás írni: SSTO= SSREG +SSRES SSTO Sum of Squares TOtal SSREG Sum of Squares due to REGression SSRES Sum of Squares due to RESiduals Az utolsó helyett szokás SSER-t is írni: Sum of Squares due to ERRor. Nyilván a független változó szóródása annál jobban magyarázható a lineáris összefüggéssel, minél nagyobb az SSREG/SSTO hányados. SSREG ⋅ 100 azt mutatja, hogy a független változó teljes varianciájának hány százaléka SSTO magyarázható a lineáris regresszióval. Elemi, bár kissé hosszadalmas számolásokkal igazolható, hogy n SSTO = ∑ (Yi − y )2 = S yy − i =1 ( ) 1 Sy 2, n 2 1 ⎛ ⎞ ⎜ S xy − S x S y ⎟ n 2 n ⎠ , tehát SSREG = ∑ Yˆi − y = ⎝ 1 i =1 S xx − (S x )2 n ( ) 1 ⎛ ⎞ ⎜ S xy − S
x S y ⎟ n ⎝ ⎠ 1 S xx − (S x )2 SSREG n = 1 SSTO S yy − S y 2 n ( ) 2 2 1 ⎛ ⎞ ⎜ S xy − S x S y ⎟ n ⎝ ⎠ = = r2. 1 1 ⎛ 2 ⎞⎛ 2⎞ ⎜ S xx − (S x ) ⎟⎜ S yy − S y ⎟ n n ⎝ ⎠⎝ ⎠ ( ) Ezért a minta korrelációs együtthatójának négyzete azzal a jelentéssel bír, hogy a független változó teljes varianciájának r 2 ⋅ 100% -a magyarázható a lineáris regresszióval, a többi pedig a véletlen hibákból adódik. A fentiek illusztrálására tekintsük a következő példákat. Tekintsünk egy sokaságot Adott az egyedek valamely összessége, és két jellemzőjüket vizsgáljuk, X-et és Y-t. Legyen X∼ N (5 ,1.8) , és Y = 2X + 3 + ε , ahol ε az X-től független, nulla várhatóértékű, normális eloszlású., azaz a véletlen hibától eltekintve lineáris függvénykapcsolat van közöttük. A regressziós egyenes y = 2 x + 3 , ami ha ismeretlen egy minta alapján becsülendő. A sokaságból veszünk egy 50-elemű
mintát, és mindegyik egyednél megmérjük mindkét változó értékét. Így kapunk a két változóra egy-egy mintát: X 1 ,K, X 50 és Y1 ,K , Y50 . a) Y = 2 X + 3 + ε , σ ε = 0,2 és így ρ = 0,998 24 22 20 18 Y 16 14 12 mintaelemek y=1,9857x+3,1363 a minta regressziós egyenese r=0,9986 a minta korrelációs együtthatója 10 8 6 1 2 3 4 5 6 X 7 8 9 10 11 b) Y = 2 X + 3 + ε , σ ε = 1,8 ρ = 0,894 24 mintaelemek y=2,0819x+3,0365 a minta regressziós egyenese r=0,9113 a minta korrelációs együtthatója 22 20 18 Y 16 14 12 10 8 6 4 1 2 3 4 5 6 7 8 9 10 X c) X∼ N (5 ,1.8) , Y∼ N ( 2 ,1) és függetlenek ρ =0. 4,5 4,0 3,5 3,0 Y 2,5 2,0 1,5 1,0 0,5 mintaelemek y=0,0107x+2,0557 r=0,021 0,0 -0,5 0 1 2 3 4 5 6 X 7 8 9 10 11 t= 0,021 2 = 0,1455 , a 48 szabadsági fokú t-eloszlás alapján számolva a 1 − 0,021 48 korrelációs együttható t-próbájának szignifikanciaszintje p = 0,884926 > 0.05 , tehát ρ =0.
Az X változó mintában megfigyelt értékei 1 és 10 közé esnek. Az Y-ra vonatkozó minta átlaga 2,1096 A minta alapján a legjobban illeszkedő y = 0,0107 x + 2,0557 egyenest persze meg lehet határozni. Ebben az esetben azonban nem lesz alkalmas arra, hogy X megfigyelt értéke esetén vele becsüljük az Y változó megfelelő értékét Ugyanis ha 1 ≤ x ≤ 10 , akkor a fenti lineáris függvény értékeire a következő teljesül 2,0664 ≤ 0,0107 x + 2,0557 ≤ 2,1627 , tehát ha bármely 1 és 10 közé eső X esetén a hozzá tartozó Y értékét a lineáris függvényértékével becsülnénk, akkor közelítőleg mindig az Y-ra vonatkozó minta átlagát kapnánk. Ebben az esetben r 2 = 0,000441 , tehát az y = 0,0107 x + 2,0557 lineáris összefüggés (modell) az Y-ra vonatkozó minta teljes varianciájának mindössze 0,0441%-át magyarázza. TARTALOMJEGYZÉK 1. ALAPFOGALMAK. 1 1.1 MÉRÉS FOGALMA, MÉRÉSI SKÁLÁK 1 1.11 Nominális mérési skálák
1 1.12 Ordinális mérési skálák 2 1.13 Intervallum skálák 3 1.14 Arány skálák 3 1.2 POPULÁCIÓ ÉS MINTA FOGALMA 4 2. LEÍRÓ MÓDSZEREK . 7 2.1 MINTA NUMERIKUS JELLEMZŐI 7 2.11 A minta lokalizációjának jellemzése 7 2.12 A mintaelemek szóródásának jellemzése 9 2.13 A minta ferdeségének jellemzése 11 2.2 GYAKORISÁGI TÁBLÁZATOK 16 2.21 Gyakorisági táblázatok kvalitatív adatok esetén 16 2.22 Diszkrét értékkészletű intervallum/arány skálán mért változók esete 16 2.23 Gyakorisági táblázatok folytonos értékkészletű változók esetén 16 2.3 GYAKORISÁGI HISZTOGRAMOK 17 2.31 Kategorikus adatok esete 18 2.32 Ordinális adatok esete 18 2.33 Diszkrét értékkészletű intervallum/arány skálán mért változók esete 18 2.34 Folytonos értékkészletű változók esete 18 2.4 MINTA BOX-BAJUSZ ÁBRÁZOLÁSA 20 3. STATISZTIKÁK. 22 3.1 MINTA ÁTLAGÁNAK ELOSZLÁSA 24 3.2 MINTABELI RELATÍV GYAKORISÁG ELOSZLÁSA 26 4.
STATISZTIKAI BECSLÉSEK. 29 4.1 PONTBECSLÉSEK 29 4.11 Lokalizációs jellemzők becslése 31 4.12 Szóródást jellemző paraméterek becslése 31 5. KONFIDENCIAINTERVALLUMOK . 33 5.1 KONFIDENCIAINTERVALLUM ISMERT SZÓRÁSÚ NORMÁLIS ELOSZLÁSÚ VÁLTOZÓ VÁRHATÓÉRTÉKÉRE . 34 5.2 KONFIDENCIAINTERVALLUM VÁLTOZÓ VÁRHATÓÉR-TÉKÉRE NAGY MINTÁK ÉS ISMERT SZÓRÁS ESETÉN. 37 5.3 KONFIDENCIAINTERVALLUM NORMÁLIS ELOSZLÁSÚ VÁLTOZÓ VÁRHATÓÉRTÉKÉRE ISMERETLEN SZÓRÁS ESETÉN . 38 5.4 KONFIDENCIAINTERVALLUM POPULÁCIÓBELI ARÁNYRA 40 5.5 ELŐÍRT PONTOSSÁGÚ BECSLÉSÉHEZ SZÜKSÉGES MINTANAGYSÁG MEGHATÁROZÁSA 41 1.11 A várhatóérték előírt pontosságú becsléséhez szükséges mintanagyság meghatározása 41 5.52 A populációbeli arány előírt pontosságú becsléshez szükséges mintanagyság meghatározása . 42 6. STATISZTIKAI HIPOTÉZISVIZSGÁLAT. 44 6.1 STATISZTIKAI PRÓBÁK SORÁN FELLÉPŐ HIBÁK 48 6.2 EGYMINTÁS PRÓBÁK 49 6.21
Normális eloszlású változó várhatóértékére vonatkozó próba ismert szórás esetén 49 6.22 Statisztikai próbák általános menete 56 6.23 Elsőfajú hibavalószínűség hatása a próba kritikus értékére 57 6.24 Próba szignifikancia szintje 58 6.25 Változó várhatóértékére vonatkozó próba ismert szórás és nagy minták esetén 62 6.26 Populációbeli arányra vonatkozó próba nagy minták esetén 62 6.27 Normális eloszlású változó várhatóértékére vonatkozó próba ismeretlen szórás esetén 62 6.3 KÉTMINTÁS PRÓBÁK 64 6.31 Két normális eloszlású változó várhatóértékének összehasonlítása függő minták alapján 65 6.32 Két normális eloszlású, azonos szórású változó várhatóértékének összehasonlítása független minták alapján . 67 7. VÁLTOZÓK KÖZÖTTI KAPCSOLAT VIZSGÁLATA . 72 7.1 KORRELÁCIÓS EGYÜTTHATÓ 72 7.2 A KORRELÁCIÓS EGYÜTTHATÓ BECSLÉSE 78 7.21 A korrelációs együttható
t-próbája 79 7.3 A REGRESSZIÓANALÍZIS 80 7.31 A regressziós egyenes becslése 80