Tartalmi kivonat
Módszertan szigorlat tételjegyzéke (2003/2004 tanév) Gazdasági statisztika 1. Leíró statisztika és statisztikai következtetés Statisztikai sokaságok típusai Az adatgyűjtés módszerei Viszonyszámok. MegoszIási, koordinációs és intenzitási viszonyszám Mérés, mérési skálák Mérési hibák elemzése. Csoportosító sor Statisztikai tábla és dimenziószáma összehasonlító és leíró sor 2. Abszolút és relatív gyakoriság Kumulált és lefelé kumulált gyakoriság Gyakorisági sor Osztályközök kiszámítása. Gyakorisági sorok grafikus ábrázolása Értékösszegsor A koncentráció elemzése Lorenz-görbe. 3. Helyzetmutatók Számított és helyzeti középértékek Számtani, geometriai, harmonikus és négyzetes átlag Súlyozott átlagok. A számtani átlag tulajdonságai Módusz, medián és kvantilis fogalma, kiszámítása rangsorból és gyakorisági sorból. 4. Szóródási mutatók Szóródás terjedelme, szórás, átlagos eltérés és
különbség, relativ szórás A szórás tulajdonságai. Az aszimmetria elemzése Egy- és több móduszú eloszlások Pearson-féle mutatószám F-mutatószám. 5. Időbeli ismérv szerinti elemzés Állapot- és tartam-idősorok, Bázis- és láncviszonyszámok Áttérés új bázisra. Idősorok grafikus ábrázolása Az idősor átlagértékének és átlagos változásának vizsgálata 6. Kombinációs táblák Függvénykapcsolat, sztochasztikus kapcsolat és függetlenség Az asszociáció szorossága; a Yule-, Csuprov- és Cramer-együttható. 7. Vegyes kapcsolat elemzése Rész- és főátlagok A főátlagok és a szórásnégyzet felbontása: Szórás- és szórásnégyzet-hányados. Korrelációs kapcsolat Tapasztalati regresszió-függvény Determinációs és korrelációs hányados. 8. Háromdimenziós statisztikai táblák Főátlagok összehasonlítása Standardizálás Főátlagok különbségének és hányadosának felbontása. 9. Aggregálás Érték-, ár- és
volumenindex Az indexek aggregátum- és átlagformái Az indexszámok közötti összefüggések. Defláció Az aggregátumok közötti összefüggések Csoportosított sokaságra vonatkozó indexek. Indexpróbák Területi indexek 10. ldősorok elemzése mozgóátlaggal Simítás Előrejelzés Idősorok elemzése analitikus trendszámítással A lineáris trend meghatározása a normáI egyenletek alapján. A szezonális ingadozások kiértékelése 1. Leíró statisztika és statisztikai következtetés Statisztikai sokaságok típusai Az adatgyűjtés módszerei. Viszonyszámok Megoszlási, koordinációs és intenzitási viszonyszám Mérés, mérési skálák. Mérési hibák elemzése Csoportosító sor Statisztikai tábla és dimenziószáma Összehasonlító és leíró sor. A statisztika a lényegkiemelés tudománya. Feladata az, hogy egy adattömeget, a benne rejlő fontos információk elvesztése nélkül, áttekinthető és kezelhető méretűre csökkentse. A
statisztikai munka lebonyolítása két alapvető módon történhet: leíró statisztika: adatgyűjtés a teljes sokaságra adatfeldolgozás a teljes sokaságra eredményelemzés a teljes sokaságra statisztikai következtetés: adatgyűjtés egy részsokaságra adatfeldolgozás egy részsokaságra eredményelemzés a teljes sokaságra Az eltérés abban áll, hogy a leíró statisztika eredményeit kizárólag a vizsgált sokaságra vonatkoztatjuk, a statisztikai következtetés eredményeit azonban a vizsgáltnál bővebb sokaságra. A leíró statisztika mintegy “értelmezi” a birtokunkban levő tényadatokat, a statisztikai következtetés viszont “megjósol” birtokunkban nem levő tényadatokat. Statisztikai sokaság csoportosítása: Annak függvényében, hogy az adatok mire vonatkoznak: álló sokaság - időpontra vonatkozik mozgó sokaság - időtartamra vonatkozik Annak függvényében, hogy a sokaság elemei megszámlálhatóak-e? véges sokaság -
megszámlálható végtelen sokaság - megszámlálhatatlan Megadásuk módja szerint: diszkrét sokaság - egy-egy konkrét számértékkel adjuk meg az elemeket folytonos sokaság - értékközzel kerül megadásra a sokaság Adatgyűjtés. Annak figyelembevételével, hogy az adatgyűjtés milyen körre terjed ki: teljes körű - a sokaság minden egységére kiterjed részleges- a sokaság egy részére terjed ki, lehet: reprezentatív - az elemek kiválasztása meghatározott elvek szerint történik. Eredménye a minta vagy mintasokaság. Viszonyszámok: két egymással valamilyen kapcsolatban álló statisztikai adat hányadosa Számítható: Azonos fajta adatokból: kifejezési formák együtthatós kifejezési forma (pl. 1,2-szorosára nőtt a termelés) %-os kifejezési forma (pl. 112 %-ra (12 %-kal) nőtt a termelés) ‰-es kifejezési forma (pl. 1120 ‰-re (120 ‰-kal) nőtt a termelés) Különbözőfajta adatokból: kettős mértékegységű (Ft/fő, fő/km2, t/ha)
Fajtái: Megoszlási viszonyszám Vm (relatív gyakoriság gi): a sokaság egyes részeinek a sokaság egészéhez mért aránya Jellemzői: csak csoportosítható statisztikai sorból számítható. a sor egészére számított megoszlási viszonyszám összege 100 % egy-egy megoszlási viszonyszám értéke kisebb 100 %-nál, kivéve, ha az adatok között negatív előjelű is szerepel Koordinációs viszonyszám: két statisztikai részadat egymáshoz való aránya (pl. 100 fizikai foglalkoztatottra jutó nem fizikai) Dinamikus viszonyszám Vd: idősorokból számítjuk, az idősor két adatának egymáshoz való aránya. Akkor dolgozunk vele, ha két adatunk van!!! (tárgy időszak: hozzánk közelebbi, bázis időszak: tőlünk távolabbi) Intenzitási viszonyszám: két különbözőfajta, általában különböző mértékegységű statisztikai adat hányadosa, leíró sorokból számítjuk. Mérés, mérési skála: számok meghatározott szabályok szerinti hozzárendelése
jelenségekhez, dolgokhoz Névleges (nominális) mérési skála: közvetlen hozzárendelés történik (pl. irányítószám, rendszám) Sorrendi (ordinális) mérési skála: valamilyen közös tulajdonság alapján rendezik sorba (pl. osztályzat alapján, 1 főre jutó GDP) az egyes elemek között nincs feltétlenül azonosa távolság, ezért nem végezhetők ezekkel az adatokkal akármilyen műveletek Intervallum (különbségi) skála: mért adatókból állítják össze, kezdőpontja, mértékegysége önkényes számításokra korlátozottan használható Arány skála: legmagasabb szintű mérést jelent ez nyújtja a legtöbb információt valódi nulla pontja van adataival bármilyen számítási művelet elvégezhető Mérési hibák elemzése: a mérés pontatlansággal jár. A hibák elemzése során azt akarjuk eldönteni, hogy a mérési eljárás elfogadható-e. Fogalmak: abszolút hiba: a valóságos és a mért adat eltérése abszolút hibakorlát: az
abszolút hiba maximumának becsült értéke relatív hiba: az abszolút hiba és a valóságos adat hányadosa relatív hibakorlát: az abszolút hibakorlát és a mért kerekített adat hányadosa A mérési eljárást akkor tekinthetjük elfogadhatónak, ha a relatív hiba kisebb a relatív hibakorlátnál. Csoportosító sor: a vizsgált sokaságnak valamilyen megkülönböztető ismérv alapján történő csoportosítása. Jellemzői: tartalmaz összesen rovatot, általában mennyiségi vagy minőségi sor, adatai összegezhetők Statisztikai tábla: statisztikai sorok logikailag összefüggő, táblázatba foglalt rendszere. Vannak fejrovatai (a tábla felső részén) oldalrovatai (a tábla bal oldalán pl. a sorok megnevezései) és összesen rovatai dimenziószáma: az a szám amelyik azt jelzi, hogy a tábla egy-egy adata hány statisztikai sorhoz tartozik. A statisztikai táblák legalább kétdimenziósak Összehasonlító sor: ugyanazon jelenségre vonatkozó megfigyelt
értékek a megkülönböztető ismérv többféle változata esetén. Jellemzői: nem tartalmaz összesen sort, általában időbeli vagy területi sor, adatai nem összegezhetők Leíró sor: egyetlen egyedre vonatkozó, több ismérv szerinti értékek Jellemzői: nem tartalmaz összesen sort, általában logikai kapcsolatok vannak az adatok között, azok a sorok, ahol egy jelenség különböző tulajdonságát soroljuk fel. 2. Abszolút és relatív gyakoriság Kumulált és lefelé kumulált gyakoriság Gyakorisági sor Osztályközök kiszámítása. Gyakorisági sorok grafikus ábrázolása Értékösszegsor A koncentráció elemzése. Lorenz-görbe A gyakoriság (f i ) a mennyiségi ismérv szerinti osztályba (osztályközbe) tartozó egyedek száma. A relatív gyakoriság (g i ) a gyakoriságnak és a sokaság összlétszámának hányadosa, tulajdonképpen a szóbanforgó gyakoriság megoszlási viszonyszáma. A kumulált gyakoriság ( ) az osztályköz felső
határánál nem nagyobb ismérvértékek előfordulási száma. A lefelé kumulált gyakoriság ( ) az osztályköz alsó határánál nem kisebb ismérvértékek előfordulási száma. A gyakorisági sor a mennyiségi ismérv szerint végzett osztályozás alapján kapott csoportosító sor. Osztályközök száma: 2k >N pl. N=25, akkor 25=32>25 , tehát k=5 Osztályközök hossza: h = (x max - x min ) / k Gyakorisági sorok grafikus ábrázolása: A leggyakrabban használt ábrázolási módok: Bot-ábra: egy diszkrét ismérv értékeire felmérjük a gyakoriságokat. Gyakorisági hisztogram: egy osztályközös gyakorisági sor intervallumaira hézagmentesen olyan téglalapokat mérünk fel, amelyeknek magassága az egységnyi osztályközhosszra jutó gyakoriság, f i / h i . Sűrűségi hisztogram: egy osztályközös gyakorisági sor intervallumaira hézagmentesen olyan téglalapokat mérünk fel, amelyeknek magassága az egységnyi osztályközhosszra jutó relatív
gyakoriság, g i / h i . Kördiagram: a gyakoriságokat vagy relatív gyakoriságokat úgy ábrázoljuk, hogy azok egy kör körcikkeinek a középponti szögeivel arányosak, vagyis a teljes 360 fok középponti szöget az adott eloszlás szerint osztjuk fel Tortadiagram: lényegében a kördiagram térbeli szemléltetése; a gyakorisági sort egy kördiagramon ábrázoljuk, és ez a kördiagram egy henger (“torta”) alapköre, a gyakoriságok vagy relatív gyakoriságok a “tortaszeletek” középponti szögeivel arányosak. Gyakorisági poligon: egy osztályközös gyakorisági sor intervallumain az osztályközepeknél felmérjük az egységnyi osztályközhosszra jutó gyakoriságot, f i / h i . Értékét, majd az így kapott síkbeli pontokat egyenes szakaszokkal összekötjük. Értékösszeg: a vizsgált mennyiségi ismérv értékeinek egyes osztályokon belüli összegeit nevezzük. Értékösszeg sor: a mennyiségi ismérv alapján kialakított osztályokhoz tartozó
egységek ismérvértékeinek összegét rendeli. Értékösszegsor (Si) Gyakoriság szorozva az ismérvértékkel. Si = fi × Xi ( pl.: árbevétel = mennyiség × egységár) Osztályközös mennyiségi sor esetén az osztályközéppel kell számolni. Koncentráció elemzése Koncentráció: az a jelenség, hogy a sokasághoz tartozó teljes értékösszeg jelentős része a sokaság kevés egységére összpontosul. A koncentráció erőssége kimutatható a Lorenz-görbe készítésével. Jellemzői: - négyzetben történő ábrázolás - a gi’ függvényben ábrázoljuk a zj’ értéket gi’ = kumulált relatív gyakoriság zj’ = kumulált relatív értékösszeg - átlót meghúzni kötelező - két tengelyen 100 %, x = gi’; y = zj’ Koncentrációs terület: az átló és a Lorenz-görbe által bezárt terület. Minél nagyobb ez a terület, annál nagyobb a koncentráció. A koncentráció fokát mérhetjük koncentrációs együtthatóval: K = koncentrációs
terület / háromszög területe 3. Helyzetmutatók Számított és helyzeti középértékek Számtani, geometriai, harmonikus és négyzetes átlag. Súlyozott átlagok A számtani átlag tulajdonságai Módusz, medián, kvantilis fogalma, kiszámítása rangsorból és gyakorisági sorból. Helyzetmutatók: az eloszlás helyzetéről (az x tengelyen való elhelyezkedésükről) tájékoztatnak. Ide tartoznak: az átlagok, helyzeti középértékek (módusz, medián) és a kvantilisek. ÁTLAGOK: Számított középértékek (átlagok): a megfigyelt értékekből valamilyen képlettel számítjuk ki. Ha a megfigyelt érték helyébe visszahelyettesítjük a kiszámított átlagot, akkor ismét az átlagot kell kapnunk. Számtani (aritmetikai) átlag: az a szám, amelyet az egyes átlagolandó értékek helyébe téve azok összege változatlan marad. Geometriai (mértani) átlag: az a szám, amelyet az egyes átlagolandó értékek helyébe téve azok szorzata változatlan marad.
Harmonikus átlag: az a szám, amelyet az egyes átlagolandó értékek helyébe téve azok reciprokainak összege változatlan marad. Négyzetes átlag: az a szám, amelyet az egyes átlagolandó értékek helyébe téve azok négyzetösszege változatlan marad. Viszonyuk egymáshoz: harmonikus átlag < mértani átlag < számtani átlag < négyzetes átlag. Súlyozott átlag: Ha az adatok gyakorisága különböző, akkor mindegyik átlagnál súlyozott átlagot kell számolni. Az értékek előfordulási számával f i -vel kell súlyozni A Számtani átlag tulajdonságai: a) mindig a legkisebb és legnagyobb átlagolandó érték közé esik, b) ha az átlagolandó értékeket átlaggal helyettesítjük az eredeti adatok összegét kapjuk, c) nem változik, ha az átlagolandók gyakoriságát ua. a konstanssal szorozzuk vagy osztjuk, d) az átlagtól mért eltérések előjeles összege mindig 0. HELYZETI KÖZÉPÉRTÉKEK: (Módusz és Medián) többnyire nem
számítással kapjuk, a statisztikai sorban elfoglalt helyük alapján állapítjuk meg. Módusz (Mo): a statisztikai sor leggyakrabban előforduló, legnagyobb gyakoriságú tagja. Egy statisztikai sornak több módusza is lehet. Jobban kifejezi a rögzített jelenség természetét, mint az átlag és a medián A móduszt a gyakorisági táblázat (vagy hisztogram) alapján állapítjuk meg. Az osztályközbe sorolt gyakorisági sor azon osztályköze, melynek gyakorisága a legnagyobb, a modális köz, ennek osztályközepe a nyers módusz, amit interpolációval még pontosítani kell. Medián (Me): nagyság szerint a statisztikai sor közepén helyezkedik el, ugyanannyi kisebb és nagyobb érték található a sorban. A mediánt az ismérvértékek rangsorából kétféle módon határozhatjuk meg: - Ha a megfigyelt sokaság elemszáma (N) páratlan, akkor a medián a rangsor (N + 1) / 2 - edik (azaz a középső) ismérvértékével azonos. - Ha a sokaság elemszáma páros,
akkor a medián a két középső, azaz az N / 2 - edik és az (N / 2) +1 - edik ismérvérték számtani átlaga. KVANTILISEK: azok az értékek, amelyek különböző adott arányokban bontják fel az adathalmazt. A p rendű kvantilis az adatokat p ; 1-p arányban osztja ketté. Vannak centilisek (p=1/100), decilisek (p=1/10) és kvartilisek (p=1/4). Kvartilisek [Q1, Q3]: A kvartilisek nem középértékek, de azokkal rokon tulajdonságúak. Míg a medián a nagyságrendbe rendezett statisztikai sort felezi, a kvartilisek negyedelik, pontosabban az alsó kvartilis (Q1) a medián előtti félsor mediánja, a felső kvartilis (Q3) a medián utáni félsor mediánja. Módusz, medián, kvantilis kiszámítása rangsorból és gyakorisági sorból: A helyzeti középértékeket és a kvantiliseket rangsor esetén (növekvő sorba rendezett adatok) a definiciójuk alapján egyszerűen ki tudjuk számolni. Más a helyzet, amikor az adatok gyakorisági sorral (osztályközökbe sorolt
gyakorisági táblázattal) vannak megadva. Annak a meghatározása, hogy a helyzeti középértékek (módusz, medián), valamint a keresett kvantilis melyik osztályközbe esik, egyszerűen meghatározható, ugyanis az osztályközök ugyanúgy sorrendbe vannak rendezve, mint a rangsornál. A megtalált osztályközön belüli pontosított értéket becsléssel kell meghatároznunk. A becslést lineáris interpolációval (arányos osztással ) végezzük A matematikai táblázatoknál (pl. szögfüggvények, logaritmus) már megismert módszer szerint interpolálunk becsült érték = előző osztályköz felső határa + arányossági tényező * osztályköz hossza Az arányossági tényező értéke 0 és 1 közötti szám. 4. Szóródási mutatók Szóródás terjedelme, szórás, átlagos eltérés és különbség, relatív szórás A szórás tulajdonságai. Az aszimmetria elemzése Egy- és többmóduszú eloszlások Pearson-féle mutatószám. F-mutatószám
Szóródáson értjük egy mennyiségi ismérv azonos fajta számszerű értékeinek különbözőségét, egymástól vagy a sokaság egészét jellemző átlagos értéktől való eltérést. Ugyanazt az átlagos értéket tehát különböző képpen ítélhetjük meg a szóródás nagyságától függően. Ezért szükség van szóródás nagyságának megmérésére is. E célt szolgálják a szóródási mutatók A szóródás mérése: az ismérvértékek valamely középértéktől (általában a számtani átlagtól) vett eltérései, vagy egymás közötti különbségei alapján történik. Valamennyi mérőszám közös tulajdonsága, hogy a szóródás hiányát ( ha minden ismérvérték egyenlő ) nullával, meglétét pedig valamilyen nullától különböző pozitív értékkel jelzi. A leggyakrabban használt mérőszámok: A szóródás terjedelme: az előforduló legnagyobb és legkisebb adat különbsége R= Xmax-Xmin A szórás: A legfontosabb és egyben a
leggyakrabban használt szóródási mérőszám. Számítása szintén az ismérvértékek átlagtól vett eltérésein alapul. Az eltérések pozitív és negatív előjele okozta problémától úgy is megszabadulhatunk, hogy az eltéréseket négyzetre emeljük. Az ismérvértékekből tehát négyzetes átlagot számítunk. A szórás tehát az egyes értékek számtani átlagtól vett eltéréseinek négyzetes átlaga Megmutatja, hogy az egyes ismérvértékek átlagosan mennyivel térnek el az átlagtól Az átlagos eltérés: Az ismérvértékek számtani átlagtól vett eltérései abszolút értékeinek számtani átlaga, ami azt fejezi ki, hogy az egyes ismérvek átlagosan mennyivel térnek el a számtani átlagtól. Az átlagos különbség: Az ismérvértékek (adatok) páronkénti eltéréseinek átlaga. A relatív szórás: Megmutatja, hogy a szórás az átlagnak hányad része. A relatív szórást százalékban szoktuk kifejezni és viszonyszámként értelmezzük. A
szórás tulajdonságai: Ha az ismérvértékekhez hozzá adunk egy állandót (ugyanazt a számot), a szórás nem változik. Ha az ismérvértékeket megszorozzuk egy állandóval, a szórás a szám abszolút értékével szorzódik. A szórás az eredeti értékek négyzetes és számtani átlaga alapján is meghatározható. Az aszimetria elemzése: Arra ad választ, hogy a módusz (a legnagyobb gyakorisággal előforduló adat) a mediánhoz (adat, amelynél ugyanannyi kisebb és nagyobb van) képest hol helyezkedik el. Ha középen, akkor szimmetrikus az eloszlás, ha nem, akkor aszimetrikus. Az aszimetriát olyan oldalinak mondjuk, amelyik oldalra a csúcs (módusz) az eloszláson belül eltolódik. Egy- és többmóduszú eloszlások: Az eloszlásoknak a következő típusai vannak: - egymóduszú eloszlás: az egymodúszú gyakorisági sorok poligonjának egy helyi maximuma, egy csúcsa van. - többmóduszú eloszlás: több helyi maximum (csúcs van) Pearson-féle
mutatószám: Az aszimetria egyik mutatószáma. Az aszimetria egyik következménye, hogy a medián és a számtani átlag eltávolodnak a modustól, a medián mindig a modus és a számtani átlag közé esik. Csak egymóduszú eloszlás esetén használható. Ha a számtani átlag és módusz különbségét elosztjuk a szórással, olyan mérő számot kapunk, amelynek értékéből következtetni lehet az aszimetria mértékére. A mérőszám előjele az aszimmetria irányát mutatja Bal oldali aszimmetria A>0 (pozitív) Jobb oldali aszimmetria A<0 (negatív) A=0 Szimmetrikus eloszlás Erős aszimetria IAI>1 F- mutatószám: Az aszimetria egy másik mutatószáma. Többmóduszú eloszlás esetén isalkalmazható Az alsó és felső kvartilis mediántól való eltérésének egymáshoz viszonyított nagyságán alapul. Bal oldali aszimmetria esetén a medián az alsó, jobb oldali aszimmetria esetén a felső kvartilishez esik közelebb. Az F- mutató lényegesen kisebb
értékkel jelzi a már nagyfokúnak tekinthető aszimmetriát. Ez a mutatószám is, ugyan olyan feltételek mellett ad nulla, pozitív vagy negatív eredményt, mint az A a Pearson-féle mutatószámnál. Az F-mutatót nemcsak a kvartilisek, hanem a többi kvantilis, pld. decilisek alapján is számíthatjuk Bal oldali aszimmetria F>0 (pozitív) Jobb oldali aszimmetria F<0 (negatív) Szimmetrikus eloszlás F=0 Erős kapcsolat 1 felé tart Közepes kapcsolat 0.5 körül | F | <= 1 mindig teljesül. 5. Időbeli ismérv szerinti elemzés Állapot és tartam idősorok Bázis és lánc viszonyszámok Áttérés új bázisra. Idősorok grafikus ábrázolása Az idősor átlagértékének és átlagos változásának vizsgálata Időbeli ismérv szerinti elemzés: A statisztikai elemzések során fontos szerepük van az időbeli összehasonlításoknak, az időbeli változások vizsgálatának. Segítik az elmúlt időszak tendenciáinak, összefüggéseinek feltárását és
egyben támpontot is adnak a jövő várható folyamatainak előrejelzéséhez. A jelenségek egymástól egyenlő távolságra levő időpontokban, illetve időszakokban megfigyelt értékei idősorokat alkotnak, amelyek a vizsgált jelenség természetétől függően állapot- és tartamidősorok lehetnek. Állapot idősorok: az álló sokaságok időbeli változását mutatják, az egyes időpontokra vonatkozó állapotfelvételek eredményeit rögzítik. Az állapotidősorok adatai egy - egy időpontra vonatkoznak, összegüknek nincs tárgyi értelme. Ebben az esetben az idősor átlaga az átlagos állomány ( készlet-) nagyságot mutatja. Két időpont esetén ez a nyitó- és záróállomány számtani átlaga, több időpont esetén pedig a két-két időpont közötti időszakokra számított átlagos állományok számtani átlaga. Ezt az átlagot kronologikus átlagnak nevezzük és kizárólag állapotidősorok adatainak átlagolására használjuk. A kronologikus átlag
tehát olyan súlyozott számtani átlag, amelynél az első és utolsó adat súlya 1/2 ; 1/2 a közbeeső adatok súlya pedig 1. Tartam idősorok: a mozgó sokaságok időbeli alakulását mutatják. A sor elemei egy-egy időtartam folyamán bekövetkező események adatait tükrözik. A tartamidősorok adatai összegezhetők, ezért átlagolásukra a számtani átlagot használjuk. Az így kiszámított átlag a megfigyelt jelenség egy időszakra jutó átlagos értékét mutatja. Dinamikus viszonyszám: : Az összehasonlítás tárgyát képező tárgyidőszak (időpont) és az összehasonlítás alapjául szolgáló bázisidőszak (időpont) adatának hányadosa. Kettőnél több adatból álló idősor esetén az alábbi kétfajta dinamikus viszonyszám számítható: Bázis és lánc viszonyszámok: Idősorok elemzése: ha az idősor tagjainak száma kettőnél több, akkor kétféleképpen történhet: - bázisviszonyszámmal - láncviszonyszámmal Bázisviszonyszám: az
idősor minden tagját, adatát a bázisul választott adathoz hasonlítjuk. Láncviszonyszám: az idősor egyes adatait a közvetlenül megelőzőhöz hasonlítjuk, tehát csak egyetlen időszak alatti változást vizsgálunk. Összefüggés a bázis és láncviszonyszámok között: Bázisviszonyszámból láncviszonyszámokat ugyanúgy számítunk, mint az idősor eredeti adataiból. Láncviszonyszámból bázisviszonyszám számítása a megfelelő láncviszonyszámok szorzatával történik. Áttérés új bázisra: Új bázisra áttérés egy bázisviszonyszám sorban – a bázisviszony számsor minden tagját osztjuk az új bázisul választott bázisviszonyszámmal. Idősorok grafikus ábrázolása: Vonaldiagram - koordinátarendszerben, a vízszintes tengelyen az időt, a függőleges tengelyen az adatot ábrázoljuk. Oszlopdiagram – hisztogram Az idősor átlagértékének és átlagos változásának vizsgálata: Az idősor átlagos változásának vizsgálatára a
fejlődés átlagos mértékét és átlagos ütemét használjuk. A fejlődés átlagos mértéke: időszakról időszakra bekövetkező átlagos abszolút változást fejezi ki. Akkor alkalmazzuk, ha a változás mértéke keveset ingadozik (vagyis az idősor megközelítően számtani sorozat). Számítása úgy történik hogy az egymást követő időszakokra kiszámítjuk a növekedés mértékét, majd azokat számtani átlaggal átlagoljuk. A fejlődés átlagos üteme: időszakról időszakra bekövetkező átlagos relatív változást fejezi ki. Közel azonos ütemű fejlődés esetén használjuk. A mutató a láncviszonyszámok mértani átlaga Akkor használható, ha a változás üteme keveset ingadozik (az idősor megközelítően mértani sorozat). 6. Kombinációs táblák Függvénykapcsolat, sztochasztikus kapcsolat és függetlenség Az asszociáció szorossága; Yule-, Csuprov-, Cramer-együttható. Kombinációs táblák: sorai és oszlopai egyaránt
csoportosító statisztikai sorok. A csoportosítás általában mennyiségi, minőségi vagy területi. A kombinációs táblának mind a sorai, mind az oszlopai tartalmaznak összesen rovatot. A kombinációs táblák sorai az egyik, oszlopai a másik ismérv osztályainak felelnek meg A kombinációs táblát gyakorisági táblának, más néven kontingencia-táblának nevezzük, ha minden adatrovatában gyakoriságot találunk. Az ismérvek közötti kapcsolat lehet: Függvénykapcsolat: az egyik ismérv szerinti hovatartozás egyértelműen meghatározza a másik ismérv szerinti hovatartozást. Függetlenség: az egyik ismérv szerinti hovatartozás semmilyen hatással nincs a másik ismérv szerinti hovatartozásra Sztochasztikus kapcsolat: átmenetet jelent a függvényszerű és a függetlenség között; az egyik ismérv szerinti hovatartozás a másik ismérv szerinti hovatartozás tendenciáját (valószínűségét) határozza meg. A statisztika a sztochasztikus
kapcsolatok vizsgálatával foglalkozik. A sztochasztikus kapcsolatok annál lazábbak, gyengébbnek nevezzük, minél közelebb van a függetlenséghez és annál erősebbnek, minél közelebb áll a függvényszerű kapcsolathoz. A vizsgálatba bevont ismérvek fajtája szerint a sztochasztikus kapcsolatnak 3 féle típusát különböztetjük meg: asszociációs kapcsolat – minőségi és/vagy területi ismérvek közötti kapcsolat; mindig szöveges változattal fejezzük ki. korrelációs kapcsolat – mennyiségi ismérvek közötti kapcsolatot vizsgál vegyes kapcsolat – minőségi vagy területi és mennyiségi ismérvek közötti kapcsolatot vizsgál; az egyik ismérvet számadattal, a másik ismérvet szöveggel fejezem ki. Az asszociáció szorossága: akkor vizsgáljuk, ha olyan gyakorisági táblából dolgozunk, ahol mindkét csoportosító ismérv kategória jellegű (minőségi pl. férfi, nő; vagy területi) Először el kell dönteni, hogy az ismérvek
függetlenek-e. Ha nem függetlenek, a kapcsolat szorosságát számszerűen kívánjuk jellemezni Yule- féle együttható: Y ,akkor alkalmazzuk amikor mindkét ismérv (sor, oszlop) alternatív (szöveges). Tulajdonságai: -1 Y 1 Függetlenség esetén Y=0 Függvényszerű kapcsolat esetén |Y|=1 de megfordítva nem biztos, hogy igaz Sztochasztikus kapcsolat esetén 0<|Y|<1 Csuprov-féle együttható: T m, n = jelenti a kontingencia tábla sorainak ill. oszlopainak számát A Σ nem tartozik bele Tulajdonságai, illetve értékei lehetnek: 0 T 1 T=0 függetlenség esetén T=1 függvényszerű kapcsolatnál, ha m=n A Csuprov- féle asszociációs együttható maximális értéke függ a két ismérv osztályainak számától, de mindenképpen 0 és 1 között van. Cramer-féle együttható: C Értékei, tulajdonságai: 0 C 1 sztohasztikus kapcsolat esetén C=0 függetlenség C=1 függvénykapcsolat A Cramer- féle együttható értéke 0 és 1 között
van, és csakis a két ismérv közötti sztochasztikus kapcsolat szorosságától függ. Képlete alapján nyilvánvalóan legalább akkora, mint a Csuprov- mérőszáma, így annak konkrét értékeit kissé jobban széthúzza 0 és 1 között. Ha az oszlop és sorszám azonos (m=n), akkor C=T ( Csuprov=Cramer) Összevetve az asszociáció szorosságát jellemző mérőszámokat: a Yule-féle mérőszám csak alternatív ismérvek esetén használható, de megmutatja az egymást “vonzó” ismérvosztály-párokat;A Csuprov és Cramer együtthatók tetszőleges számú ismérv esetén használható, de az ismérvek közötti kapcsolatról nem ad információt. (hogy melyik ismérv melyikhez „vonzódik”) 7. Vegyes kapcsolat elemzése Rész- és főátlagok A főátlagok és a szórásnégyzet felbontása Szórásés szórásnégyzet-hányados Korrelációs kapcsolat Tapasztalati regressziófüggvény Determinációs és korrelációs hányados. Vegyes kapcsolat elemzése:
Tegyük fel, hogy a megfigyelt sokaság egyedeit egy mennyiségi és egy kategória-jellegű (minőségi vagy területi) ismérvvel jellemezzük. Két kombinációs táblát készítünk el, ahol az egyik csoportosító ismérv kategória-jellegű (minőségi vagy területi), a másik pedig mennyiségi. Oszlopok a menyiségi, sorai pedig a kategória ismérvek. A vegyes kapcsolat elemzése során azt keressük, hogy milyen mértékben befolyásolja a kategória-ismérv (mint független változó) a sokaságban a mennyiségi ismérv értékeinek szóródását. Rész- és főátlagok: ha az ismérvek függetlenek egymástól, akkor a részátlagok megegyeznek a főátlaggal (fordítva nem igaz!) A rész- és főátlagok tehát kellenek az elemzéshez. Részátlagok: X j a j. részsokasághoz (vagyis a j kategória-ismérvértékhez) tartozó átlag Xj Sj Nj Főátlag: X a teljes sokaságra vonatkozó átlag ( S j a részösszeg, N a gyakoriság) n X S j 1 j N A
főátlagok és a szórásnégyzet felbontása: A főátlagtól való eltérés felbontása Teljes eltérés: a megfigyelt mennyiségi ismérvértéknek a teljes sokaság átlagától való eltérése k = 1,2,.N j , j = 1,2,n Belső eltérés: a megfigyelt mennyiségi ismérvértéknek a saját részsokaság átlagától való eltérése k = 1,2,.N j , j = 1,2,n A számtani átlag általános tulajdonsága, hogy a sokaság átlagától való eltérések összege 0. Külső eltérés: a részsokaság átlagának a teljes sokaság átlagától való eltérése j = 1,2,.n Az eltérések között az alábbi nyilvánvaló összefüggés áll fenn: D kj = B kj + K j (teljes eltérés=belső+külső) Az eltérés felbontásának értelmezése: - az ismérvértékeknek a teljes sokaság átlagától való eltérése két részből áll; (B kj + K j ) - B kj a részsokaságon belüli eltérés, aminek oka a részsokaságon belüli véletlen ingadozás; - K j az osztályátlag eltérése a
teljes sokaság átlagától, melynek oka a csoportosító minőségi ismérv hatása a vizsgált mennyiségi ismérvre. A szórásnégyzet felbontása Teljes szórás: a megfigyelt mennyiségi ismérveknek a teljes sokaság átlagától való átlagos négyzetes eltérése Belső szórás: az összes megfigyelt mennyiségi ismérveknek a saját részsokaság átlagától való átlagos négyzetes eltérése Külső szórás: a részsokaságok átlagainak a teljes sokaság átlagától való súlyozott átlagos négyzetes eltérése A szórásnégyzetek közötti összefüggés: 2 B K 2 2 Szórás- és szórásnégyzet-hányados: Szóráshányados: az ismérvek kapcsolatának szorosságát méri. (H=1 igen erős kapcsolat) Szórásnégyzet-hányados: megoszlási viszonyszám, ahol a teljes sokaság a mennyiségi ismérv szóródása, a részsokaság pedig a teljes szóródásnak a kategória-ismérv által okozott része; azt mutatja meg, hogy a mennyiségi
ismérv teljes szóródásának mekkora része magyarázható a kategória-ismérvértékek különbözőségével. H2 = 0 akkor és csak akkor, ha K 0 ha H2 = 0, akkor azt mondjuk, hogy nincs kapcsolat az ismérvek között, de nem feltétlenül áll fenn az általunk felírt formulában definiált függetlenség. ha H2 = 1, függvényszerű kapcsolat van az ismérvek között ha 0 < H2 < 1, sztochasztikus kapcsolat van az ismérvek között 2 Korrelációs kapcsolat: Tegyük fel, hogy a megfigyelt sokaság egyedeit két mennyiségi ismérvvel (X és Y) jellemezzük. Két kombinációs táblát készítünk, ahol mindkét csoportosító ismérv mennyiségi Ehhez a kettős csoportosításhoz egyaránt ismerjük a gyakoriságokat és az értékösszegeket tartalmazó táblát. A két mennyiségi ismérv kapcsolatában az egyiket független változónak tekintjük, és azt kérdezzük, milyen mértékben befolyásolja ez a másik mennyiségi ismérv értékeinek
szóródását. Tapasztalati regressziófüggvény: X ismérv szerinti i-ediksorhoz Y ismérv Yi részátlagát rendeljük. Fontos megjegyezni, hogy a tapasztalati regressziófüggvény nem képletszerűen adott, és csak hozzávetőlegesen közelíti az elméletit. A tapasztalati regressziófüggvény ábrázolása általában úgy történik, hogy az egyedi adatokat pontdiagramon, a regressziós értékeket vonaldiagramon mutatjuk be. Determinációs és korrelációs hányados: Determinációs hányados: azt írja le, hogy az Y ismérv szórásnégyzetének mekkora hányadát magyarázza meg az X ismérv; Megegyezik a vegyes kapcsolatot jellemző szórásnégyzet-hányadossal. Korrelációs hányados: ez a kapcsolat szorosságának mérőszáma; Megegyezik a vegyes kapcsolatot jellemző szóráshányadossal. 0 <= H (Y|X) <= 1 ha H (Y|X) és H (X|Y) közül az egyik 1, akkor a másik is, ebben az esetben függvényszerű kapcsolat van X és Y ismérvek között ha H (Y|X) és
H (X|Y) közül az egyik 0, akkor a másik is; ha X és Y függetlenek, akkor H (Y|X) és H (X|Y) közül az egyik 0 (ekkor a másik is), de fordítva nem igaz: ha a szóráshányadosok 0 értékűek, ebből még nem következik a függetlenség; ha 0 < H (Y|X) < 1, akkor sztochasztikus kapcsolat van a két ismérv között. 8. Háromdimenziós statisztikai táblák Főátlagok összehasonlítása Standardizálás Főátlagok különbségének és hányadosának felbontása. A statisztikai tábla: statisztikai sorok logikailag összefüggő, táblázatba foglalt rendszere. A sorok és oszlopok mindegyike többféle statisztikai sort is tartalmazhat. A tábla fejrovatai tartalmazzák az oszlopok megnevezéseit, oldalrovatai a sorok megnevezéseit, összes rovatai a sorok és oszlopok rész-és teljes összegeit valamint a táblázat teljes összegét. A statisztikai tábla dimenzióját több lépésben értelmezhetjük: Egydimenziós: olyan statisztikai sor, amely nem
tartalmaz ismétlődő belső struktúrát Kétdimenziós. Sorai és oszlopai egyaránt egydimenziós táblák Háromdimenziós: a sorok és oszlopok közül az egyik csoport egydimenziós táblákból áll, a másik csoport pedig tartalmaz egydimenziós ismétlődő belső struktúrát. Az általunk vizsgálandó sokaságoknak három ismérve van: - egy csoportosító sor - egy időbeli vagy területi sor (legtöbbször kételemű) - egy leíró sor (legtöbbször kételemű) A kiinduló adattábla a következőképpen épül fel: Idő vagy terület Csoport 1. 1. leíró adat . 2.leíró adat . n. . 1.leíró adat 2. leíró adat 1. . m. Összesen Mindegyik időszakhoz, időponthoz vagy területhez tartozik kétféle leíró adat, mindkettő egy-egy oszlopot jelöl. Mindegyik leíró adat oszlopában egy-egy csoportosító sor található, a csoportosító ismérv osztályai a táblázat sorainak felelnek meg, az oszlop alján összesen rovat van. Főátlagok
összehasonlítása: A táblázatban van időbeli (területi) ismérv, 0 vagy 1 indexként jelölve (vagyis két időpont, vagy terület), és két mennyiségi ismérv (A és B). A 10 , A 20 , A M0 illetve A 11 , A 21 , A M1 B 10 , B 20 , . B M0 illetve B 11 , B 21 , B M1 A mennyiségi ismérvek összehasonlítását a következő viszonyszámokkal végezhetjük el. Részviszonyszám (V i ) A részviszonyszám egy homogén részsokaságra számított viszonyszám j = 1, 2, .M Összetett viszonyszám (V ) Az összetett viszonyszám a teljes sokaságra számított viszonyszám. Súlyozott átlagként is felírhatjuk, mégpedig mind számtani átlag, mint harmonikus átlag formájában: Hogy melyik felírási formát választjuk, attól függ, hogy az összesen három értékrendszer (két mennyiségi ismérv és az egyedi viszonyszámok) közül melyik két értékek vannak megadva. Könnyen belátható, hogy a részviszonyszámot a részátlagok, az összetett viszonyszámot pedig a
főátlagok hányadosaként is megkaphatnánk, ugyanis ez azt jelentené, hogy mind a számlálót, mind pedig a nevezőt el kellene osztani N-nel (az adatok darabszámával). Ebben az estben a tört egyszerűsíthető lenne N-nel, ami az eredeti törtet (viszonyszámot) eredményezné. Standardizálás: A standardizálás olyan statisztikai módszer, amellyel egy összetett viszonyszám időbeli (térbeli) változásában az összetétel és a részviszonyszámok változásának hatását szétválasztjuk. A leggyakoribb eset, hogy a térbeli adatoknál különbségfelbontást, időbeli adatoknál hányadosfelbontást alkalmazunk. A standardizálás alkalmazása a következőképpen történik: Két, földrajzilag vagy időbelileg egymástól elhatárolt szituációt hasonlítunk össze ugyanazzal a mutatószámmal. Észrevesszük, hogy két szituáció egyetlen mutatószám alapján történő összehasonlítása azért értelmetlen, mert az adott mutatószámra nemcsak a
vizsgálni kívánt jelenség hat, hanem egy másik is, ami az első jelenség hatását mennyiségileg befolyásolja. Ekkor nem két valóságos szituáció mutatószámait hasonlítjuk össze, hanem az egyik helyett olyan fiktív, fizikailag nem létező szituáció adatait vezetjük be, ahol az eredeti adatok egy részét a másik szituációból vett adatokkal helyettesítjük. Főátlagok (összetett intenzitási viszonyszámok) különbségének és hányadosának felbontása: A standardizálás elvét alkalmazzuk két különböző módon az összetett intenzitási viszonyszámok különbségének és hányadosának felbontásakor. Vagyis a részsokaságok megoszlásának és az egyes részviszonyszámok nagyságának a hatását próbáljuk meg szétválasztani. Részhatás-különbség: Vagyis a 0 azonosítójú időbeli (vagy területi) sokaság megoszlási viszonyszámait használva számítjuk ki a részviszonyszámok átlagos különbségét.
Összetételhatás-különbség: Vagyis az 1 azonosítójú időbeli (vagy területi) sokaság részviszonyszámainak súlyozott átlagát számítjuk ki, a két sokaság megoszlási viszonyszámainak különbségével súlyozva. Felbontás: vagyis az összetett viszonyszámok különbségét felbontottuk a csoporthatások változásait és a csoportmegoszlás változásait leíró fiktív mennyiségek összegére. Az összetett viszonyszámok különbsége tehát nem más, mint a részhatás-különbség és az összetételhatás-különbség összege. [Összetett intenzitási viszonyszámok indexének felbontása: Összetételhatás-index I Részhatás-index I Felbontás: vagyis az összetett viszonyszámok indexét felbontottuk a csoporthatások változásait és a csoportmegoszlás változásait leíró fiktív mennyiségek szorzatára. Az összetett viszonyszámok indexe tehát nem más, mint a részhatás-index és az összetételhatás-index szorzata.] 9. Aggregálás
Érték-, ár- és volumenindex Az indexek aggregátum- és átlagformái Az indexszámok közötti összefüggések. Defláció Az aggregátumok közötti összefüggések Csoportosított sokaságra vonatkozó indexek. Indexpróbák Területi indexek Aggregálás: az aggregálás különböző természetes mértékegységekben rendelkezésre álló adatok (mennyiségek) értékben való összesítését jelenti, gyakorlatilag a (mennyiség * egységár) összegzése minden termékre. Az aggregátum az aggregálással létrehozott összesített értékadat Index közvetlenül nem összesíthető, de összetartozó adatok átlagos változását leíró intenzitási viszonyszám. Az értéken alapuló indexek az aggregátum-formát használó viszonyszámok: - értékindex: az összérték változásának indexe - árindex: az árak változásának indexe - volumenindex: a mennyiségek változásának indexe. Egyedi indexek: Homogén sokaságokkal (pl. azonos típusú áruk) kapcsolatos
időbeli összehasonlító viszonyszámok. Jelölések: 0 - bázisidőszak ; 1 - tárgyidőszak ; q - mennyiség; p - egységár Egyedi értékindex: 1.időszakbeli pénzben kifejezett értéket osztjuk 0 időszakbelivel Egyedi árindex: 1.időszakbeli egységárat elosztjuk a 0 időszakbelivel Egyedi volumenindex: 1.időszakbeli mennyiséget elosztjuk a 0 időszakbelivel Indexek aggregátum formái: az aggregátum matematikai jelölésében nem tüntetjük fel a homogén részsokaságok azonosítóit sem az összegzőjelnél, sem a mennyiségeknél sem az egységáraknál. Az árindex és volumenindex esetében feltüntetjük, hogy melyik időszak adatait használjuk a standardizáláshoz szükséges egységes súlyozásnál, súlyozás lehet bázisidőszaki /Laspeyres-féle/ és tárgyidőszaki /Paasche-féle/. Értékindex: tárgyidőszaki aggregátumot elosztjuk a bázisidőszakival. (pl idei osztva a tavalyival) Árindex: Bázisidőszaki súlyozású (Laspeyres-féle):
vagyis a bázisidőszaki mennyiségekből és tárgyidőszaki egységárakból képzett fiktív aggregátumot elosztjuk a bázisidőszaki valós aggregátummal. Tárgyidőszaki súlyozású (Paasche-féle): vagyis a tárgyidőszaki valós aggregátumot elosztjuk a tárgyidőszaki mennyiségekből és bázisidőszaki egységárakból képzett fiktív aggregátummal. Volumenindex: Bázisidőszaki súlyozású (Laspeyres-féle): vagyis a tárgyidőszaki mennyiségekből és bázisidőszaki egységárakból képzett fiktív aggregátumot elosztjuk a bázisidőszaki valós aggregátummal. Tárgyidőszaki súlyozású (Paasche-féle): vagyis a tárgyidőszaki valós aggregátumot elosztjuk a bázisidőszaki mennyiségekből és tárgyidőszaki egységárakból képzett fiktív aggregátummal. A Paasche és Laspeyres súlyozás hatásának összehasonlítására szolgál a Bortkiewicz-tétel: I p(1) I p( 0 ) I q(1) I q( 0) Indexek számtani átlag formái: Értékindex:
Súlyozás a bázisidőszaki valós aggregátummal: Árindex: Súlyozás a bázisidőszaki valós aggregátummal (Laspeyres-súlyozás): Súlyozás a tárgyidőszaki mennyiségekből és bázisidőszaki képzett fiktív aggregátummal (Paasche-súlyozás): Volumenindex: Súlyozás a bázisidőszaki valós aggregátummal (Laspeyres-súlyozás): Súlyozás a bázisidőszaki mennyiségekből és tárgyidőszaki képzett fiktív aggregátummal (Paasche-súlyozás): Az indexeknek vanak harmonikus átlag formái is, amiknél a súlyozás a tárgyidőszakhoz kapcsolódik. Pl. Értékindex: Súlyozás a tárgyidőszaki valós aggregátummal: Az indexszámok közötti összefüggések: Indexeket többféle különböző eredményekre vezető formulával is meg lehet adni. Helyességüket az indexpróbákkal (idő-, átlag-, láncpróba) vizsgáljuk Az eddigi indexek nem elégítik ki teljesen a próbákat. Ezért jobb indexformulákra van szükség, mint például a Fisher-féle indexek A
Fisher-féle indexek a bázisidőszaki és tárgyidőszaki súlyozású indexek mértani átlagaként számíthatók ki. Az összes próbát kielégítik, bár a láncpróbát csak közelítően. Fisher-féle árindexek Fisher-féle volumenindexek Indexek szorzatösszefüggése: értékindex=árindex * volumenindex Defláció: a defláció a volumenindex kiszámítása az értékindex és az árindex hányadosaként. Azért van szükség erre a módszerre, mert a volumenindex egyszerre sok termékre nehezen számítható ki, viszont az értékindexet a számvitel során mindenképpen kiszámítandó, valós aggregátumokból, az árindexet pedig becsléssel, reprezentatív egyedi indexek súlyozott átlagaként könnyen származtathatjuk. Az aggregátumok közötti összefüggések: Aggregátum különbségek: Aggregált értékkülönbség: mennyivel változott az érték. Aggregált volumenkülönbség bázisidőszaki( tárgyidőszaki) súlyozással Aggregált árkülönbség
Laspeyres (Paasche) súlyozással Értékkülönbség felbontása: indexek az aggregátumok hányadosai. Használatukkal a célunk, hogy az érték változását felbontsuk mennyiség és ár változására. Csoportosított sokaságra vonatkozó indexek: Indexsor: kettőnél több időszakra vonatkozó indexek sorozata. Indexsor súlyozása: árindex-sor és volumenindex-sor bármelyik időszak szerint súlyozható. A láncviszonyszám-soroknál a súlyozás vonatkozhat állandó és változó időszakra is. Területi indexek: Területi volumenindex: azt fejezi ki, hogy a viszonyítás tárgyának területén a termelés vagy értékesítés hányszoros a viszonyítás alapjához képest. Két ország esetében az össztermelés vagy összfogyasztás hányadosa a lakosság számarányával korrigálva a gazdasági fejletséget mutatja. Területi árindex: azt fejezi ki, hogy a viszonyítás tárgyának árszínvonala hányszoros a viszonyítás alapjához képest. Két ország
esetében a területi árindex a két valuta vásárlóerejének arányát mutatja 10.ldősorok elemzése mozgóátlaggal Simítás Előrejelzés Idősorok elemzése analitikus trendszámítással. A lineáris trend meghatározása a normáIegyenletek alapján A szezonális ingadozások kiértékelése. ldősorok elemzése mozgóátlaggal: A gazdasági, társadalmi jelenségeket leíró idősorok több összetevőből állnak: Tartós irányzat (trend) Periodikus hullámzás Véletlen ingadozás Olyan Y 1 , Y 2 , Y n idősorunk van, amelynél az idősor bármely két szomszédos tagja között ugyanakkora az időköz. A mozgóátlagok számítása az idősorok hosszabb távú elemzésének legegyszerűbb módja. Átlagoslással kiszűrjük a durva, egészen rövid távú ingadozásokat. Ez azt jelenti, hogy nem kapunk képletben megadott trendvonalat (csak táblázatban). Simítás: az ingadozások részleges kiszűrésével utólag jobban leírhatjuk az idősor addigi mozgását,
mintegy "kisímítjuk" az idősort. Símítás esetén az átlagolást a következő módon végezzük: vesszük az idősor egy adott tagját, továbbá az előtte és mögötte levő egyenlő számú további tagot, és kiszámítjuk a sor jellegének megfelelően a számtani vagy kronológikus átlagot. Az eredményt ahhoz az időponthoz (illetve időszakhoz, de ezt a megkülönböztetést a továbbiakban nem hangsúlyozzuk) írjuk, amelyikből kiindultunk. Ezt ismételjük ugyanilyen hosszú előre- és visszatekintéssel a sor minden olyan tagjára, ahol egyáltalán elvégezhető. (Nyilván az ablak hosszától függően a sor első és utolsó néhány tagjára nem végezhető el, mert az ablak a sor első tagjánál előrébb illetve az utolsó tagjánál hátrább fekvő tagokat tartalmazna.) A leírtakból következik, hogy az ablak mindig páratlan számú tagot tartalmaz, hiszen az adott ablakban a kiinduló tagon kívül előre és hátra ugyanannyi tagot
használunk fel. Példa: Simítás Előrejelzés Előrejelzés: A tapasztalati trendvonal számított értékei ugyanazok, mint a simítás értékei, csak máshova helyezzük azokat (a táblázatban pár sorral lejjebb kerülnek). Az egyes időpontokat megelőző néhány időpont adataiból előrejelzést számíthatunk az idősor következő értékére, vagyis tapasztalati trendvonalat készítünk. A mozgóátlagos előrejelzést a viszonylag stabil idősorokra kell korlátozni. Az eljárás előnyei: végrehajtása matematikailag igen egyszerű; értelmezése nem igényel különösebb elméleti apparátust; jól alkalmazkodik az idősor jellegéhez. Hátrányai: az idősor valamelyest megrövidül; balszerencsés esetben, ha rosszul választjuk meg az átlagolandó idősor-tagok számát, az eredmény erősen torzíthat. Mint tudjuk, az idősor lehet állapot- vagy tartam-idősor Az alkalmazható átlagolási módszer: állapot-idősor esetén kronológikus átlag:
tartam-idősor esetén számtani átlag: Előrejelzés esetén úgy számítjuk ki a tapasztalati trendvonalat, hogy az idősor tagjaitól kiindulva visszafelé mindig ugyanannyi számú tagot átlagolunk, és a kapott értéket a kiinduló időpontot követő időponthoz írjuk. Itt már nem törvényszerű a páratlan hosszúságú ablak, de a gyakorlatban mégis többnyire ez fordul elő A símítással analóg módon az átlag az első néhány időpontra nem számítható ki. Idősorok elemzése analitikus trendszámítással: Olyan Y 1 , Y 2 , Y n idősorunk van, amelynek értékei a t 1 , t 2 , t n időpontokhoz tartoznak. Célunk az, hogy meghatározzuk az idősor analitikus (tehát képletszerűen megadott) trendvonalát és amennyiben van, a szezonális hatást. Az analitikus trend kiszámításának algoritmusa ugyanaz, mint a matematikai statisztikából ismert regressziószámításnak. Tehát megpróbáljuk az idősort az időnek egy olyan lineáris függvényével
megközelíteni, amelynek az eltérése az idősortól a lehető legkisebb. (A legkisebb négyzetek módszerével) A lineáris trend meghatározása a normáIegyenletek alapján: A keresett lineáris függvény: A képletben: t az időváltozó; az idősor analitikus trendvonalának értéke; az idősor analitikus trendvonalának értéke; Yˆ a bt Az a és b paraméterek kiszámításához szükséges úgynevezett normálegyenletek: Mivel az egyenletekben szereplő mennyiségek közül az Y 1 , Y 2 , Y n idősor-értékeket, a t 1 , t 2 , t n időpontértékeket és természetesen n-et, vagyis darabszámukat is ismerjük, a fenti egyenletrendszer egy közönséges kétismeretlenes elsőfokú egyenletrendszer, ahol az ismeretlenek az a és b paraméterek. A megoldás a következő módon még egyszerűbbé tehető: Például ha 1999, 2000, 2001, 2002, 2003, az eredeti időpontok, akkor átalakíthatjuk időpontokat: -2, -1, 0, 1, 2 értékekre, az eredmény nem fog változni.
A normálegyenletekben az időpontok helyébe tehát az eltéréseket írjuk. a és b értéke így közvetlenül is ~ könnyen megadható: t helyett most t lesz (pl. 2002 helyett 1, 2005 helyett 3) ~ A feladat, hogy a meghatározott az a és b értékét és azokat a Yˆ a b t egyenletbe beírjuk és ezáltal már meg is kaptuk az analitikus trendvonal egyenletét. Ha ki akarjuk számítani az Y 2005 értékét, akkor ~ t helyére 3-at írunk és máris ki tudjuk számolni, hogy mi lesz a jövőben Y értéke. A szezonális ingadozások kiértékelése: azt keressük hogy, ha van szezonális (pl. évszakonkénti) eltérés, akkor az hogyan fogja befolyásolni a lineáris trend értékét. A következő modell alapján végezzük a számításokat: ahol: a szezonális becslés, amely figyelembe veszi a szezonális ingadozást; a lineáris trend értéke, amelyet a fejezetben eddig tárgyalt módszerrel határozunk meg; s a szezonális eltérések becslése. A következő
módon járunk el: először a most megismert eljárással meghatározzuk a lineáris trendvonalat; az idősornak a trendvonallal számított becsült értékeit levonjuk az idősor tényleges értékeiből; a különbségeket a feltételezett szezononként csoportokra osztjuk; minden csoportnak meghatározzuk az átlagát, ez lesz a szezonális eltérés becslése