Matematika | Statisztika » Statisztika jegyzet, 2000

Alapadatok

Év, oldalszám:2000, 27 oldal

Nyelv:magyar

Letöltések száma:395

Feltöltve:2009. február 28.

Méret:355 KB

Intézmény:
-

Megjegyzés:

Csatolmány:-

Letöltés PDF-ben:Kérlek jelentkezz be!



Értékelések

Nincs még értékelés. Legyél Te az első!


Tartalmi kivonat

Statisztika Statisztika jegyzet, 2000 A gazdaságban minden döntéshozatal információt feltételez. Az információ lehet: - verbális - írásbeli - képi a számszerű információknak kitüntetett szerepe van, ezt állítja elő a statisztika. A statisztika fogalma A valóság tényeinek tömegét tömören, a számok nyelvén jellemző gyakorlati tevékenység illetve tudományos módszertan. - tömegesen előforduló jelenséget vizsgál (pl. népszámlálás) - gyakorlati tevékenység: - adatgyűjtés (pl. kérdőívvel) - adatfeldolgozás - adattárolás - következtetések levonása, elemzés - tudományos módszertan: a tömegesen előforduló jelenségekre koncentrál, de egzakt előírások szabják meg, hogy kell adatot gyűjteni, értékelni Gyakran az adatot is statisztikának nevezik A statisztika története - egyidős az írásos történelemmel: - az első feljegyzések a Kínai Birodalomból származnak i.e II ezerből - Egyiptomban a statisztika kérdései: -

mennyi gyerekből lehet katona - mennyi adót lehet beszedni. - XVIII. századi Poroszországban már komoly statisztikai összeírásokat tartottak, melyek céljai ugyanazok, mint Egyiptomban. - a XIX. századi Magyarországon Fényes Elek a statisztika kiemelkedő alakja - 1871-ben megalakul a Magyar Statisztikai hivatal - a XIX. század vége felé egész Európában kialakul az állami statisztikai szolgálat, állami szerv, ami adatokat gyűjt, feljegyez, közöl - ma adatot gyűjtenek: - KSH, minisztériumok, országos főhatóságok - közvéleménykutató cégek (pl. Sonda Lipsos, Médiacentrum) - magánszemélyek (engedéllyel) Az adatvédelem kérdése - természetes személyek: alapvető személyiségi jog rendelkezni a saját adataival, csak akkor kell rá vonatkozó adatokat kiadnia, ha törvény kötelezi rá - jogi személyek: kormányrendelettel kötelezhetők adatszolgáltatásra, az egyedi adatszolgáltatóra nézve soha nem lehet adatot publikálni, az egyedi

adatszolgáltatót védeni kell. A statisztikai munka etikája 1. oldal Statisztika Az adatgyűjtő és az adatközlő között bizalmi kapcsolat van, az adatgyűjtőnek el kell mondania: - az önre vonatkozó adat soha nem kerül publikálásra - az adatközlő személyét nem lehet visszakeresni (egyedi azonosítóját letörlik) - adatok felhasználása nem magáncélú - korrekt adatközlés - ismertetnie kell a pontos adatközlés körülményeit Alapfogalmak Adat A vizsgált egységek bizonyos körét összességében jellemző számszerű információ. Felépítése: számszerű érték + szöveges jellemző Követelmények: - a lehető legpontosabb legyen, tükrözze a jelenséget - kellő időben álljon rendelkezésre - az előállítás a lehető legolcsóbb legyen Mutatószám Szabványosított tartalmú egy-egy jelenség tömör jellemzésére rendszeresen használt számszerű információk megjelölésére szolgál. pl. 10000 főre jutó élve születések száma

Sokaság A megfigyelés tárgyát képező statisztikai egységek összessége - álló sokaság: adott időpontra nézve mondom meg az adatot - mozgó (tartam) sokaság: az adatok adott időszakra vonatkoznak pl. 1999-ben kitermelt földgáz mennyisége - aggregált (összesített) sokaság: különböző fajta, de valamilyen célból együtt vizsgált javak tömege. Nagyságát leggyakrabban értékben (Ft, $, Ł) fejezzük ki. pl. fogyasztói árindex Ismérv A statisztikai sokaságot különböző fajta ismérvek alapján csoportokra bontjuk. Segítségével a sokaságot egymástól elkülöníthető részekre bontom. - időbeli ismérv: a statisztikai sokaságot időpont vagy időszak szerint tagolom - területi ismérv: a statisztikai sokaságot terület szerint tagolom (pl. megyénként) - minőségi ismérv: pl. hajszín, iskolai végzettség alapján csoportosítás - mennyiségi ismérv: pl. a sokaságot testmagasság szerint tagolom ( alternatív ismérv: a sokaság két

nagy csoportba sorolható) Adatszerzési módok lehetőségek - Teljes körű adatfelvétel: a vizsgálat tárgyát képező sokaság minden egyedéről gyűjt adatokat, pl. népszámlálás - Részleges adatgyűjtés: a sokaság egy részéről gyűjt adatokat - reprezentatív: meghatározott mintavételi szabályok szerint történő kiválasztás, alkalmazhat véletlenen alapuló (a mintába kerülés szabályát meg tudja adni), illetve nem véletlenen alapuló mintakiválasztási módot (közvetlenül minden szembe jövőt meg kérdez) 2. oldal Statisztika - fontos, hogy a mintában az egyes csoportok olyan arányban legyenek, mint a sokaságban - monografikus: néhány egyed kiválasztása és annak alapos bemutatása - egyéb: vásárlási kérdőívek Statisztikai sor A statisztikai adatoknak valamilyen meghatározott összefüggés alapján történő felsorolása, fajtái: - csoportosító sor: egy egészet különböző részekre osztok (minőségi, mennyiségi,

időbeni, területi) - osztályközös gyakorisági sor: a különböző osztályokban az egyedek gyakorisága - összehasonlító statisztikai sor: sokaság nagyságát időben összehasonlítom - leíró sorok: egyazon jelenséghez tartozó többféle sokaságot sorakoztatok fel Statisztikai tábla A statisztikai sorok összefüggő rendszere, fajtái: - egyszerű tábla: csak leíró és összehasonlító sorokat tartalmaz - csoportosító tábla: legalább egy csoportosító sora van - kombinációs tábla: csak csoportosító sorokból áll Lehet: munkatábla és közlőtábla A táblakészítés szabályai - minden statisztikai táblának van címe - egyes oszlopokba, egyes sorokba nem lehet mértékegység, csak a fejlécben vagy az oldalsorban - sorok megnevezése: oldalrovat, függőleges statisztikai sor: fejrovat - minden cellában legyen adat - ha lehet összegezzük az adatokat - mindig tüntessük fel a forrást Attól függően, hogy a tábla hány sort tartalmaz a

tábla különböző dimenzióiról beszélünk 3. oldal Statisztika A kérdőívek összeállításának szabályai A mintavétel többnyire kérdőívekkel történik. Csoportjai: - egyéni: egy ívet egy személy tölt ki - lajstromos: valamilyen szempont szerint kiválasztott személyek töltenek ki egy kérdőívet - egyéni kitöltésű (a kérdőívet a megkérdezett személy vagy gazdálkodó szervezet tölti ki) - kérdezőbiztos tölti ki Általános szabályok Egyéni kérdőívek - kitöltő személyt azonosítani kell (sorszám), (feldolgozás után törölni kell) - terjedelme 2-3 oldal, 15-30 perc alatt kitölthető legyen - kérdezés: ne presszionálja a megkérdezettet - kérdések: - nyitott (nincs megadott válasz lehetőség: ., rengetegféle adatkódolási problémák) - zárt (4-5-6 válaszlehetőség X , a kérdezőnek előismeretekkel kell rendelkezni, ezért van „egyéb” lehetőség a végén, ami megint kódolási problémákat eredményez) -

skáláztatás (osztályozás (az emberek szeretnek középre zárni 0-5-os skálán 3 köré esnek a válaszok, ezért minimum 0-10-es skálát használnak) - világos kérdések - ellenőrzés: felteszik ugyanazt a kérdés másképp Vállalati kérdőívek - azonosítani kell a vállalatot: statisztikai számjel (17 vagy 18 számjegy), egyéni adatot itt sem lehet kiadni - terjedelem - kontroll lehetősége: adatnak meg kell egyezni a mérlegbeszámoló megfelelő sorával - standard fogalmakkal kell dolgozni: a kategóriák egyértelműen meghatározottak (így a kérdések egyértelműek ezért a válaszok is egyértelműek) egységes fogalomgyűjtemények pl.: FEOR, BNO 4. oldal Statisztika Adatok csoportosítása - megfelelő tagoltságot hozzanak létre - a csoportok teljes rendszert képezzenek, a teljes sokaságot fedjék le, a csoportok egymást kizárják (a megkérdezettek csak egy csoportba kerülhessenek) - segédeszközök: FEOR, TEÁOR, BNO Adatok osztályozása

(összehasonlíthatóvá tétele) - homogenizálás: egyértelműen összehasonlíthatóvá tétel (pl. Magyarország lakossága 1900-tól) Adatok elemzési eszközei Viszonyszámok Két egymással kapcsolatban álló adat hányadosa. - százalékos vagy más formában fejezhető ki Fajtái: - Megoszlási viszonyszám rész-egész viszonyát fejezi ki (100%-nak ki kell jönni) - Intenzitási viszonyszám két egymással kapcsolatban álló, különböző fajta adat hányadosa - nyers intenzitási viszonyszám a viszonyszám tárgya és alapja között indirekt kapcsolat van (pl. 10000 nőre jutó élveszületések száma) - tisztított intenzitási viszonyszám a viszonyszám tárgya és alapja között direkt kapcsolat van (pl. 15-49 éves nőkre jutó élveszületések száma) - Koordinációs viszonyszám ugyanazon sokaságon belül két részadat viszonya (pl. 100 férfire jutó nők száma) - Dinamikus viszonyszám két összehasonlítható időszakra vonatkozó adat hányadosa

- Bázisviszonyszám egy kitüntetett értékhez (bázis) viszonyít (bázisnak olyan értéket kell választani, ami illeszkedik az idősorba, jellemző, nem kiugró, extrém érték) - Láncviszonyszám előző évi adathoz viszonyít Összefüggés lánc- és bázisvizsonyszámok között - bázisból úgy számolok láncviszonyszámot, mint a kiinduló abszolút számokból ( /előző évi bázisviszonyszám) - ha az állandó bázis után számított k db láncviszonyszámot összeszorozzuk megkapjuk a k. bázisviszonyszámot - áttérés másik bázisra: a bázisviszonyszámokat elosztom a két bázis hányadosával: Y b Y c : Y b /Y c 5. oldal Statisztika Jelentősége: szemléltetésnél Grafikus ábrázolás 10 8 6 4 2 0 1 Kördiagramm 2 3 4 5 Oszlopdiagramm 19 5 16 4 13 3 10 2 7 4 1 1 0 20 40 60 80 -600 -400 -200 Szalagdiagramm 0 Korfa 30 25 20 15 10 5 0 1 2 Vonaldiagramm 6. oldal 200 400 600 Statisztika Középértékek és

szóródási mutatószámok Gyakorisági sor Mennyiségi ismérvek diszkrét ismérv folytonos ismérv Az egyes ismérvekhez tartozó előfordulási szám. Relatív gyakoriság - adott ismérvhez tartozás előfordulása viszonyítva a teljes sokasághoz Rangsor - mennyiségi ismérvértékek szerint monoton nem növekvő sorba állítom a sokaságot - egyedi értékekből képzett - egyenlőség megengedett Osztályközös gyakorisági sor (intervallumonkénti rendezés) - osztályköz sűrűségének kialakítása: - sokaság áttekinthető legyen, ezért az osztályközök egyenlő hosszúságúak legyenek (de nem örökérvényű szabály, a sokaság eloszlása mást is indokolttá tehet) - sokaság szerkezetét fedje le, tükrözze a sokaságra jellemző szerkezetet Kumulálás - összegzés Értékösszeg - az adott ismérvérték nagysága szorozva a gakorisággal Kvantilisek (osztópontok) - decilis eloszlás: medián: quartilis quantilis percentilis a sokaságot 10

egyenlő részre osztó pontok a sokaságot 2 egyenlő részre osztó pont a sokaságot 4 egyenlő részre osztó pontok a sokaságot 5 egyenlő részre osztó pontok a sokaságot 100 egyenlő részre osztó pontok Középértékek - azonos fajtájú, számszerű adatok tömegének közös jellemzőjét középértéknek nevezzük. Követelmények a középértékekkel szemben - pontosan definiált, egyértelműen számolható legyen - a középérték a legkisebb és a legnagyobb egyedi érték közé essen: x min ≤ K ≤ x max - körülötte sűrűsödjön az egyedi értékek jelentős hányada - jól lehessen értelmezni, szemléletes legyen A középértékek csoportosítása - helyzeti középértékek - módusz (leggyakrabban, legsűrűbben előforduló, tipikus, jellegzetes érték; nem feltétlenül egyenlő a mediánnal) - medián (az ismérvértékek közül a középső, páratlan számú ismérvérték esetén a középső, páros esetén a két középső számtani

átlaga) - számított középértékek - számtani átlag - mértani átlag - harmonikus átlag - négyzetes átlag 7. oldal Statisztika Számtani átlag Az a szám, amelyet az egyes átlagolandó értékek helyébe írva azok összege nem változik. Előnyei: Hátrányai: - jól értelmezhető - csalhat (0, 2 átlaga 1) - egyszerűen kiszámítható Képlete: Súlyozott formában = N ∑ i=1 n Xi = ∑ i=1 ƒi Xi n ƒi Tulajdonságai: - az egyedi értékek számtani átlagtól vett különbségeinek algebrai összege nulla ∑d i = ∑(X i )= 0 - az átlagolandó értékek additív transzformációjával az új átlag az additív transzformációnak megfelelően változik (minden X i ± konstans) - az átlagolandó értékek multiplikatív transzformációja esetén az átlag a multiplikatív transzformációnak megfelelően változik Mértani átlag Az a szám, amelyet az egyes átlagolandó értékek helyébe írva azok szorzata nem változik. Képlete: X G =

n√(x 1 ∙x 2 ∙∙x n ) Használata: - akkor alkalmazzuk, ha az értékek növekedése vagy csökkenése exponenciális jelleggel rendelkezik. (pl. növekvő ütem átlagolása) Harmonikus átlag Az a szám, amelyet az átlagolandó értékek helyébe írva azok reciprokainak összege nem változik. Indexszámításnál, fordított intenzitási viszonyszámnál használjuk. Képlete: XH = n 1 Σ x n i=1 Négyzetes átlag - az a szám, amelyet az átlagolandó értékek helyébe írva azok négyzetösszege nem változik. Képlete: n XQ = Σ (x i ) i=1 n - mindegyik átlagnak van súlyozott és súlyozatlan formája 8. oldal Statisztika Szóródás Azt a jelenséget, hogy a sokaságot alkotó egyedi értékek különböznek egymástól és valamely számított középértéktől szóródásnak nevezzük. A szóródás mutatószámai Szóródás terjedelme - a legnagyobb és a legkisebb egyedi értékek különbsége: R = X max -X min - osztályközös gyakorisági

sor esetén az utolsó osztályköz felső határénak és az első osztályköz alsó határának különbsége vagy az utolsó és az első osztályközép különbsége - előnye: könnyen kiszámítható - hátránya: ha az értékek középen helyezkednek el és csak egy-egy kiugró érték van, akkor is nagy szórást mutat Interquartilis terjedelem mutatója - A harmadik és az első kvartilis különbsége: Q 3 -Q 1 Átlagos eltérés vagy szóródás átlagos terjedelme δ = Σ|X i – X| n n = a sokaság tagjainak száma X i = az egyedi ismérvértékek - gyorsan kiszámítható, szélsőségre kevésbé reagál - értelmezése: az egyedi értékek átlagosan -tal térnek el az átlagtól Szórás σ = Σ(X L – X)2 Súlyozott forma σ = Σƒ i (X L – X)2 n Σƒ i 0≤σ≤ n-1 X - az egyes értékek számtani átlagtól vett eltérésének négyzetes átlaga - értelmezése: az egyedi értékek átlagosan -tal térnek el az átlagtól - ha mintavételnél a minta

tagszáma kisebb harmincnál, a nevezőben (n-1) áll - pontosabb az átlagos eltérésnél Relatív szórás V=σ/X - különböző sokaságok összehasonlításánál használják. Szórásnégyzet összetevőkre bontása Létszám (fő) Havi bér (E Ft) Bérek szórása (E Ft) 120 39,0 5,9 1 180 26,0 4,3 2 150 20,5 2,4 3 50 15,3 1,7 4 - Milyen tényezők hozzák létre a szórást: sokaságra bontás: részeken belül, részek között létrejövő szórás Belső szórásnégyzet - részsokaságok szórásnégyzetének átlaga. Gyöke megmutatja, hogy az egyes értékek átlagosan mennyivel térnek el saját részátlaguktól, a sokaság egészét tekintve. Külső szórásnégyzet - az eltérésnégyzetek egész sokaságra vonatkozó átlaga σ2 B = 120∙5,92+180∙4,32+150∙2,42+50∙1,72 = 17 028 500 σ2 K = 120 (39,0-26,4)2+180 (26,0-26,4)2+150 (20,5-26,4)2+50 (15,3-26,4)2 = 60 924 500 σ2= σ2 B +σ2 K σ2 = 77 952 H (szórás hányados) = σ K / σ = 0,78 A bérek

szóródását 78%-ban magyarázza meg az az ismérv, ami szerint a létszám felosztását elvégeztem. (ez a mutató már nemcsak leír egy jelenséget, hanem magyarázatot is ad 9. oldal Statisztika A szórás tulajdonságai - ha additív (összegző vagy különbségképző) transzformációt hajtok végre a szórás értéke nem változik x i +C; x i -C  σ - ha multiplikatív transzformációt hajtok végre a szórás értéke ennek megfelelően változik x i ∙C; x i /C  Cσ; σ/C Standardizálás - két átlag közötti különbséget magyarázza - Körösi József dolgozta ki és alkalmazta először ezt a módszert - főátlag: az egész sokaság átlaga - részátlag: valamely részsokaság átlaga Példa Bányászatban dolgozók Villamosiparban dolgozók Létszám (%) Havi átlagbér (Ft) Létszám (%) Havi átlagbér (Ft) Fizikai dolgozók 82,4 23271 67,9 20168 Szellemi dolgozók 17,6 38068 32,1 32374 Összesen/átlagos 100,0 25875 100,0 24086 K = 25875 –

24086 = 1789 Mi okozza az átlagbér eltérését: K = K’ + K” - megfelelő részátlagok különbözősége (K’) - a létszám összetétel különbözősége (K”) Standard: bányászatban dolgozók összetétele K’ 0,824∙20168+0,176∙32374 = 22 316 25 875 – 22 316 = 3 559 K’ = 3 559 K” 1789-3559 = -1770 (22316-24086) K” = - 1770 A két sokaság között átlagosan 1789 Ft-os eltérés volt, ezt két tényező magyarázza. A fizikai foglalkozásúak átlagosan 5694 Ft-tal keresnek többet. Az egész sokaságot tekintve 3559 Ft-tal keresnek többet. A létszám összetétel miatt 1770 Ft-tal kisebb a bányászatban foglalkoztatottak átlagkeresete, mivel nagyobb arányt képviselnek az alacsonyabb bérért dolgozók. Indexszámítás Index fogalma - valamilyen szempontból összetartozó változók összességének időbeli vagy térbeli összehasonlítását szolgáló mutatószám Árindex Laspeyres (bázissal súlyoz) Paasche (bázissal súlyoz) Fischer I P L

= ∑q 0 p 1 I P P = ∑q 1 p 1 ∑q 0 p 0 ∑q 1 p 0 I P F = I P P∙ I P L Volumenindex Laspeyres (bázissal súlyoz) Paasche (bázissal súlyoz) Fischer I q L = ∑q 1 p 0 I q P = ∑q 1 p 1 ∑q 0 p 0 ∑q 0 p 1 I q F = I q P∙ I q L Értékindex I V = ∑q 1 p 1 Általában a Paasche féle kisebb, mint a Laspeyres ∑q 0 p 0 A volimenindexnél kisebb az eltérés, mint az árindexnél v = p∙q  I V = I p ∙I q (csak ellentétes súlyozású indexekkel igaz!) Indexek formái - aggregált, számtani átlagforma, harmonikus átlagforma Egyedi index - egyedi termékek egyedi indexe pl. egyedi árindex megmutatja, hogy az egyedi termék ára mennyivel változott, lehet hó/hó, év/év összehasonlítás 10. oldal Statisztika Anyagfelhasználás Termelés Javítás Karbanta rtás ∑ Árbevétel A0 185670 24410 1820 A1 177200 23300 2180 B0 288750 61650 72700 100 Ft árbevételre jutó V 1 /V 0 (%) anyagfelhasználás B1 V 0 (%) V 1 (%) 272300 64,3 65,1 101,2% 57100 39,6

40,8 103,1% 83600 2,5 2,6 104,2% 211900 202680 423100 413000 50,1 49,1 98,0% I = I’ ∙ I” Főindex = részátlagok hatását tükröző index ∙ sokaság összetételének hatását tükröző index - ha a főindex kívül esik a részindexeken, akkor ez az összetétel változás hatása ∑B 1 1 I = ∑A ∑A 0 : ∑B 0 ∑B 1 V 1 : ∑B 1 V 0 ∑A 1 ∑A 0 I’ = ∑B 1 ∑B 1 I = ∑B : ∑B A részátlag-index mindig tárggyal súlyoz 1 0 I= ∑B 1 V 0 ∑B 1 : ∑B 0 V 0 ∑B 0 I = 98,0 I’ = 101,5 I” = 96,6 A vállalkozás egészére nézve a tárgy időszakban a 100 Ft-árbevételre jutó anyagfelhasználás 2 %-kal csökkent, ez két tényező hatását tükrözi: - az egyes tevékenységekre számított anyaghányadok rendre nőttek átlagosan 1,5%-kal - a szerkezet változásnak ezzel szemben ellentétes a hatása a karbantartás aránya az árbevételen belül megnőtt, ezért a vállalkozás egészére nézve 3,4%-kal csökkent az anyaghányad

Kapcsolatvizsgálati módszerek - a függő változók (tényezőváltozó)és független változók (eredményváltozó kapcsolatát vizsgálják a kapcsolatvizsgálat kereső módszerek Vizsgálati módszerek - egy tényezős: egy függő változó hatását nézem meg az eredményváltozóra - több tényezős: több függő változó hatását nézem meg az eredményváltozóra - a megfigyelt változó, változók közötti kapcsolat fajtái: - függvényszerű – egyértelmű kapcsolat - nincs kapcsolat – semmilyen kapcsolat - sztochasztikus – valószínűségi kapcsolat Sztochasztikus – valószínűségi kapcsolat fajtái: - mennyiségi ismérvek között: korrelációs kapcsolat - minőségi ismérvek között: asszociációs kapcsolat - mennyiségi és minőségi ismérvek között: vegyes kapcsolat Korrelációs kapcsolat A kapcsolat szorosságát és irányát akarom mérni Regresszió: a kapcsolat jellegét valamilyen függvénnyel akarom leírni; hogy lehet az adott

pontokra függvényt helyezni y y y x x Pozitív irányú korrelációs kapcsolat negatív irányú korrelációs kapcsolat 11. oldal x nincs korrelációs kapcsolat Statisztika A korreláció mérőszámai (kétváltozós) - a mutatók értéke: -1 és 1 közötti, jelentésük: - -1 és 1 függvényszerű kapcsolat - 0 független - (±)0,6-0,7 közepesen erős szorosság - ±0,7-től erős-szoros kapcsolat C (kovariancia mutatója) - nem igazi mutató, csak segédfogalom, az együttes szóródás nagyságrendjét mutatja - az átlagtól való eltérések szorzatának számtani átlaga Σ(x i -x)(y i -y) Σdxdy = n n - független a sokaság tagszámától, nincs korlátja r (lineáris korrelációs együttható) - a korreláció szorosságát méri a –1 és 1 intervallumban, (ez az első mérőszám) (0,4: közepesnél gyengébb, 0,6: közepesen szoros kapcsolat) C xy Σdxdy r= σ σ = Σdx2Σdy2 x y c (előjel korrelációs együttható) u-v u+v - megmutatja, hogy az

átlagtól hány értékpár esik pozitív, negatív irányba - u: egyező előjelű párok száma (++;--) ha az egyik érték 0 u-hoz és v-hez - v: különböző előjelű párok száma (+-;-+) is hozzáadunk 0,5-t - +1: ha v = 0 tökéletes függvényszerű kapcsolat - 0: u=v ugyanannyi értékpár van átlag fölött, mint átlag alatt -1: ha u = 0 rangkorrelációs együttható 6Σdi2 1 - n(n2-1) - di: rangsorból a helyezési számok különbsége: x 1 2 3 4 y 4 1 2 7 3 1 1 -3 C= Van 10 db egyforma nagyságú földterületem, a termésátlag és a munkaerő ráfordítás kapcsolatát vizsgáljuk (minden más feltétel változatlan) Számítsa ki a lineáris korrelációs együtthatót, a lineáris regresszió függvény paramétereit és értelmezze őket 1 hektárra jutó kukorica termelés y(tonna) x(óra) y i -y x i -x dxdy dx2 dy2 1 6,1 67 -0,9 -13 +11,7 169 0,81 2 6,4 76 -0,6 -4 +2,4 5,76 0,36 3 6,7 81 -0,3 +1 -0,3 1 0,9 4 10 7,6 +0,6 +8 +4,8 23,04 0,36 Σ 29,8 486 2,5 y

= 7,0 x = 80 Regresszió függvény Olyan függvénytípust keres ami hozzáillesztve az eredeti adatokhoz a lehető legjobban simul az eredeti adatok által kijelölt vonalhoz. Fajtái: lineáris, hatványkitevős, exponenciális, parabolisztikus, hiperbolikus regresszió függvény 12. oldal Statisztika Lineáris regresszió függvény számítása Két paramétert kell megkeresni: - ha egy egységgel változtatom a tényezőváltozót, az eredményváltozó mennyivel változik - x=0 helyhez tartozó függvényértéket (y = mx + b) A tapasztalati értékek egy egyenes körül viszonylag keveset szóródnak - megmérjük a távolságokat a pontok és az egyenes között, az a görbe illeszkedik a legjobban, ahol a D 1 2+D 2 2+D 3 2+D n 2 a legkisebb (m) (b) A becsült regressziós függvény: ˆ = βˆ 0 +βˆ 1 x Y ˆ 2 = (Y- βˆ 0 +βˆ 1 x) minimumát keressük, feltételes szélsőértéke ott van, ahol az első deriváltja nulla (Y-Y) dx = x i - x dy = y i - y ˆ 1

Σdx Σdy = βˆ0 n+β Σdxdy = βˆ0 Σdx +βˆ 1 Σdx2 Σdxdy βˆ 1 = Σdx2 βˆ 0 = Y - βˆ 1 x ˆ = 2,09+0,061x βˆ 1 = 0,061 βˆ 0 = 2,09 Y Ha az egy hektárra jutó munkaráfordítást egységgel növelem, ez átlagosan 0,061 tonnával növeli a termésmennyiséget. (Ha egyáltalán nem lenne munkaráfordítás, az átlagos termésmennyiség 2,09 tonna lenne) 13. oldal Statisztika Lineáris korreláció A hiba lehet: Standard hiba Becsült értékek szóródnak az elméleti értékek körül. Jelölése: S b0 , S b1 X és Y között valószínűségi kapcsolat van. b0 S b0 Hibák mérése: Standard hiba: ∑ xi = Sb1 n i=1 n = Se n ∑ dx2 ∑ ei2 i=1 n-2 i=1 1 n b1 dx = x i - x n Sb0 S b1 e = yi - ŷ i 2 ∑ dx i=1 Relatív hiba: Ve = Se / Y 10% alatt: jó volt a becslés Nem lineáris regresszió - exponenciális - logaritmikus - hatványkitevős - parabolikus Exponenciális regresszió Ŷ = β 0 ∙β 1 x A független változónak az

egységgel történő változásának hatására a függő változó nem abszolút, hanem %-os értékben relatív módon ugyanannyival változik. log Ŷ = log β 0 + x∙log β 1 log β 0 = β 0 * log β 1 = β 1 * log Ŷ = β 0 * + β 1 x ∑ log Y = n∙β 0 * + β 1 ∑x ∑ x∙log Y = β 0 *∑x + β 1 ∑x2 β 0 = 10 β0* β 1 = 10 β1 Korrelációs index 14. oldal Statisztika A nem lineáris korreláció esetében megmutatja a görbétől való eltérést (a kapcsolat szorosságát) ∑(Y – Ŷ)2 I= 1∑(Y – Y)2a 0<I<1 A kapcsolat irányát nem méri. Ha közel van az 1-hez a kapcsolat szoros Ha közel van 0-hoz a kapcsolat gyenge. (0,6-0,7 közepesen szoros, 0,4-0,5 közepesen gyenge a kapcsolat). β 1 > 1: + 0 < β 1 < 1: - Többváltozós korrelációszámítás Y = β0 + β1 x1 + β2 x2 + ε ∑d 1 dy = β 1 ∙∑d 1 2 + β 2 ∙∑d 1 d 2 ∑d 2 dy = β 1 ∙∑d 1 d 2 + β 2 ∙∑d 2 2 ε: hiba tényező β0 = Y - β1X1 - β2X2 Ha az x 2

értéke állandó, akkor x 1 egységnyi változása pontosan β 1 -gyel változtatja a függő változó értékét. A háromváltozós lineáris korreláció szorosságának mérése Y x1 x2 Y 1 r y1 r y2 x1 r y1 1 r 12 x2 r y2 r 12 1 Többváltozós korrelációs együttható Két változó együttesen milyen szoros kapcsolatban van a függő változóval. Jelölése: R y.12 r y1 2 + r y2 2 - 2∙r y1 ∙r y2 ∙r 12 Ry.12 = 1-r 12 2 Értéke: 0 < R y.12 < 1 Csak a kapcsolat szorossága mérhető. 0-hoz közel a kapcsolat gyenge, 1-hez közel a kapcsolat szoros. ∑d 2 dy ry2 = ∑d 2 dy ry1 = r12 = ∑d21 d 2 2 2 2 2 2 √∑d 2 ∑dy √∑d 1 ∑dy √∑d 1 ∑d 2 Parciális korrelációs együttható Olyan mutatószám, ami megmutatja, hogy egyes magyarázó változók (x 1 ,x 2 ,x 3 ) milyen kapcsolatban állnak az eredményváltozóval, úgy, hogy közben a másik változó hatását állandónak tekintjük. Parciális determinációs együttható Az adott

változó hány százalékban magyarázza meg a függő változó (eredményváltozó) szórását. A parciális korrelációs együttható négyzete ry1.2 = ry2.1 = r y1 -r y2 r 12 r y2 -r y1 r 12 (1 − r y2 )(1 − r 12 ) (1 − r y1 )(1 − r 12 ) r 12.y két magyarázó változó hatása egymásra, nem értelmezhető -1≤r≤1 2 2 2 15. oldal 2 Statisztika r2 = egy változó hatása hány százalékban határozza meg az Y változását. Multikolinearitás A többváltozós lineáris korreláció egyes magyarázó változói korrelálnak. A β 1 becslését változtatja meg. Elaszticitás (rugalmasság) Megmutatja, hogy az egyik mennyiségi ismérv 1%-os változása a másik tényezőnek hány százalékos változását idézi elő. (százalékos változást állít szembe százalékos változással). Lehet mindkét irányban, pozitív és negatív is - azonos irányú változás: az egyik nő, a másik is vagy fordítva - ellentétes irányú változás: az egyik

csökken, a másik nő vagy fordítva Esetei: |E| = 1 mindkét mennyiségi ismérv 1%-kal változik |E| < 1 egyik ismérv 1%-os változása kisebb, mint 1%-os változást idéz elő (rugalmatlan termékek) |E| > 1 egyik ismérv 1%-kal változik, ennek hatására a másik több, mint egy százalékkal változik 16. oldal Statisztika Fajtái: Kereslet jövedelemrugalmassága: a jövedelem 6%-kal nő, az eladott mennyiség 8%-kal:E =8/6=1,3 Kereslet árrugalmassága: Direkt árrugalmasság: Forgalo Egységá m r Bázis 100 10 időszak Tárgy 70 11 időszak 70-100 11-10 = E= : 100 10 0 3 1%-kal növelve az árat 0,3%-kal csökken a forgalom, ha minden más tényező változatlan. Kereszt-árrugalmasság: - egy termék árváltozásának, egy másik termék forgalmára gyakorolt hatását vizsgálja Bor ára Sör forgalma Bázis 80 100 időszak Tárgy 100 140 időszak 140-100 100-80 E= : = 1,6 100 80 Idősorok vizsgálata Idősor létrejötte, és fajtái Időbeli ismérv

szerinti csoportosítással jön létre. Például a Magyar népesség adott év január 1-én. Állapot idősor: az adatot adott időponthoz rendeli hozzá, az értékek nem összeadhatóak Tartam idősor: időszakra vonatkoznak az adatai, amik összeadhatóak (pl. Magyarország kőolaj termelése 1999-ben) A független változó szerepét az idő tölti be (t – tempus) Idősor alapirányzatának (TREND) meghatározása (Ŷ) - idősorban megnyilvánuló tartós tendencia Periodikus ingadozás (s) - rendszeresen ismétlődő hullámzás, okai szerint lehet: - szezonális ingadozás (évszakváltozással összefüggő, állandó periódushossz jellemzi) - konjunkturális ciklus (nem állandó a hossza) Véletlen tényező (E) - nem tudatos emberi cselekedetek következményeként jön létre Természeti csapások 17. oldal Statisztika Additív és multiplikatív hatások az idősorban Additív hatás: Y = Ŷ+s+E Multiplikatív hatás: y= Ŷ∙s∙E Idősorok vizsgálatának

eszközei: - viszonyszám (lánc-, és bázis) - ha egy mozgó sokaságra flow típusú mutatót akarunk konstruálni: számtani átlag - kronologikus átlag akkor alkalmazzuk, ha időponti (stock) adatokból időszaki (flow) adatokat akarunk kiszámítani: x x1 + x2 + x3 + . + n x 1 +x 2 x 2 +x 3 x 3 +x 4 x n-1 +x n 2 2 = n −1 2 2 2 2 n-1 Átlagos abszolút változás mutatója x - x1 D= n n-1 Csak akkor alkalmazható, ha az idősorban a változás körülbelül ugyanakkora. β 1 hasonló tartalommal bír, mint D 18. oldal Statisztika Átlagos relatív változás mutatója l = n −1 xn = x1 x2 x3 x4 x + + + . + n x1 x 2 x 3 x n −1 Akkor alkalmazható, ha a változás üteme nagyjából egyforma. A változás exponenciális lesz. Trend számítás - az idősor egészében megnyilvánuló tendencia, alapirányzatok - módszerei: - mozgóátlagolás - analitikus trendszámítás - félátlagok módszere (USA: az idősort elfelezik, a fél idősorokból egy átlagot

számítanak, ezeket a pontokat összekötik, így kapják meg a trendegyenest, problémái: - önkényes az elosztás, miért középen, miért nem negyedelik, hatodolják; adatvesztés: a trendegyenes két pontjából feltételezik, hogy az idősor feleiben megnyilávánuló tendencia ugyanolyan) Mozgóátlagolás - a trend értékeit az eredeti adatok dinamikus átlagaként határozzuk meg - lépései: - mozgótrendek tagszámának meghatározása (egyet elhagyunk, egyet hozzáveszünk) – egyszerű és gyors - hátránya: nincsen olyan analitikus képlet, melynek segítségével az idősor egészéről lehetne valamit mondani, adatelhagyás is történik, az első értékhez nem kerül semmi - ha a mozgóátlag tagszáma páros annyi adat veszik el, amennyi a periódus száma (centrírozás: kiszámoljuk az átlagot, elhagyjuk az első adatot, bevesszük a következőt, kiszámoljuk az átlagát, a két átlagot átlagoljuk, és a kapott értéket a harmadik értékhez írjuk be),

ha a mozgóátlag tagszáma páratlan k-1 adatot vesztünk el - a tagszám megválasztása: egyezzen meg az idősorból következtethető hullámzással (pl. év: 3-as tagszám) - ha jól választjuk meg a periódus hosszát a periódikus ingadozás kiszűrhető - ha az idősor hosszú kilöki a véletlen hatást, de rövid idősorban bennmarad Analitikus trendszámítás - célja a trend meghatározása olyan módon, hogy matematikai törvényszerűséget keres az adatok között (a regressziószámítás speciális esete, t-t használunk x helyett), fajtái: - lineáris trend - exponenciális trend Lineáris trend - egy idősorban nagyjából ugyanakkora a változás, vagy nagyjából ugyanannyival csökkennek, vagy nőnek az idősor adatai - a trend alapegyenlete: Ŷ t =β 0 +β 1 t β0: t=0 időszakhoz tartozó függvényérték β 1 : meredekség, a cél, hogy (Y t -Ŷ t )2 a lehető legkisebb legyen: ΣY=Σβ 0 n+β 1 Σt 19. oldal Statisztika ΣtY= β 0 Σt+β 1 Σt2 - β

0 és β 1 meghatározása: - normál egyenlettbe való behelyettesítéssel - kinullázással: legyen Σt=0: - ha páratlan az idősor hossza: középre 0-t írunk, mint kódot - ha páros az idősor hossza: a középső két érték –1 és 1, és 2-vel változnak a kódok; de a β 1 -re kapott értéket kettővel meg kell szorozni 20. oldal Statisztika Például: ΣY t =539506 Évek 1975 1976 1977 1984 1994 Y t 20465 -19 22049 -17 23401 -15 -1 19 Σt=0 β0= ΣtY t =6044715 ∑Y n β1= ∑ tY ∑ t2 Exponenciális trend - ha az idősorban ugyanakkora %-kal történik a változás, ugyanannyival nő, vagy csökken - a trend alapegyenlete: Ŷ t =β 0 ∙β 1 t logŶ=logβ 0 +logβ 1 logβ 0 =B 0 logβ 1 =B 1 logY= B 0 ∙n+ B 1 ∙Σt t∙logY= B 0 ∙Σt + B 1 ∙Σt2 β 0 = 10 B0 β1 = 10 B1 Megmutatja, hogy átlagosan hány százalékkal változik a függő változó az β1: idősorban. Szezonális eltérés Szezonális hatás kimutatása Ŷt - Yt -

átlagos szezonális eltérés: Sj = - korrigált szezonális eltérés: ( ˆ ∑ Yij − Y ij ) 2 t ~ Sj = S j − S Szezonindex - egyedi szezonindex: Egyes értékek Trendérték - az egyedi szezonindexek mértani átlaga kiszűri a véletlen hatást Például: Forgalom E 4 tagú Centírozá db mozgóátlag s (trendérté k) 272,875 1990 1 982 21. oldal Statisztika 2 3 4 1991 1 2 3 4 100 173 527 301 108 258 606 1993 1 249 2 94 3 268 4 908 Éve k 1990 276,250 1 2 - - 3 4 99,875 250,75 1991 +13,12 5 1992 -16,875 1993 -51,375 ∑ -55,125 808,0 627,75 177,31 269,33 Nyer -18,375 209,04 59,292 s 2 Korrekciós tényező = Jelentése: − 18,375 − 209,042 − 59,292 + 269,33 =-4,34 4 az adott időszakban átlagosan mennyivel tért el a forgalom a trend alapján elvárhatótól, a szezonális ingadozás miatt Szezonindex jelentése: az adott időszakban átlagosan hány százalékkal tért el a forgalom a trend alapján elvárhatótól, a szezonális

ingadozás miatt Reziduális variancia - megmutatja, hogy a trend értékei átlagosan mennyivel térnek el az eredeti értéktől n 2 e S = ∑ (y t =1 t − yˆt ) n A közbülső értékek megbecsülésének módjai: - behelyettesítés az egyenletbe - függvénygörbéből megbecsül - interpoláció extrapolációval alapvető tendencia megbecsülhető, előrejelzés készíthető, de meg kell vizsgálni, hogy a tendencia, ami a meglévő adatokra érvényes, érvényesülnek-e Kisimító eljárások 22. oldal Statisztika - az idősor végének adatai jobban befolyásolják a tendenciát, nagyobb súllyal kell szerepelni, mint az idősor végén lévő adatoknak 1975 20465 ∑t=210 20βˆ0 + 210βˆ1 = 539506 1976 22049 ∑t2=2870 210βˆ0 + 2870βˆ1 = 6044715 1977 23401 tyt =644715 βˆ0 = 20976,8 1974-hez tartozó trendérték 1978 25554 ∑yt =539506 βˆ1 = 571,3 éves átlagos növekedés 1993 36368 1994 33364 1995-re előrejelzés: Yˆt = 20976,8 + 571,3 ⋅

t ˆ = 32947,1 Y 1995 Asszociációs kapcsolatok vizsgálata - minőségi ismérvek közötti kapcsolat lehet: - függvényszerű (egyik változóhoz tartozás egyértelműen meghatározza a másik változóhoz tartozást) - teljes függetlenség - sztochasztikus, valószínűségi kapcsolat van (egyik változóhoz tartozás nagy mértékben meghatározza a másik változóhoz tartozást) Kontingencia tábla függvényszerű esetben I. gyilkosság, gyilkossági kísérlet I II ∑ II. egyéb bűncselekmény 20 20 A A. férfi B - 30 30 B. nő ∑ 20 30 50 Belső gyakoriság peremgyakoriság 23. oldal Statisztika Kontingenciatábla sztochasztikus esetben I. gyilkosság, gyilkossági kísérlet I II ∑ II. egyéb bűncselekmény 18 2 20 A A. férfi B 5 25 30 B. nő ∑ 23 27 50 Kontingenciatábla függetlenség esetében I. gyilkosság, gyilkossági kísérlet I II ∑ II. egyéb bűncselekmény A 16 4 20 A. férfi B 24 6 30 B. nő ∑ 40 10 50 A nemhez való tartozás nem

befolyásolja a bűncselekmény típuság Kontingenciatábla feltöltése y1 y2 yj yc Elméleti gyakoriság (mikor függetlenség): x1 f 11 f 12 f 1j f 1c f 1• f i• ⋅ f • j x2 f 21 f 22 f 2j f 2c f 2• f ij* = xi f i1 f i2 f ij f ic f i• N xb f b1 f b2 f bj f bc f b• f •1 f •2 f •j f •c ∑∑ (f b χ2 = c i =1 i =1 ij − f ij* lenne ) 2 f ij* χ2 teljes függetlenség esetén nulla, minél nagyobb, annál szorosabb az összefüggés. Például: 20 ⋅ 23 I II ∑ I II ∑ = 9,2 9,2 10,8 A 18 2 20 20 50 A 20 ⋅ 27 B 5 25 30 B 13,8 16,2 30 = 10,8 ∑ 23 27 50 50 ∑ 23 27 50 C (Crammer)-mutató 30 ⋅ 23 = 13,8 50 C= 27 ⋅ 30 = 16,2 50 χ2 N min{(b − 1), (c − 1) 0,6 fölött viszonylag szoros az asszociációs kapcsolat. T (Csuprov)-mutató T= χ2 N (b − 1) ⋅ (c − 1) Mintavétel a statisztikában - teljeskörű adatgyűjtés (népszámlálás, állatszámlálás) - részleges adatgyűjtés - reprezentatív adatgyűjtés (valamilyen

módon mintát vesz a sokaságból, ez alapján von le következtetéseket az egész sokaságról) 24. oldal Statisztika Alapsokaság: amire nézve végső következtetést vonunk le, amiből kiválasztjuk a reprezentatív mintát - véges sokaság: megszámlálható mennyiség - végtelen (pl. Duna vízmennyisége) n: mintasokaság elemszáma N: az alapsokaság elemszáma Mintavétel okai - olcsóság, költségeket takarít meg - sokszor nincs lehetőség teljeskörű adatfelvételre Követelmények a mintavétellel szemben - pontos legyen - olcsó legyen - Lesley Kish-féle Kish mintás mintavétel megfelel a követelményeknek A minta kiválasztása - visszatevéssel független a minta - visszatevés nélkül nem független a minta Kis minta: 100 alatt Nagy minta: 100 fölött (N-től függ) Hiba - mintavételi: abból adódik, hogy nem az egész sokaságot vizsgálja, ha valamilyen paramétert becsülünk standard hiba - nem mintavételi: nem volt jó a keret, mértékére

nézve nem mindig lehet következtetésre jutni, nagyságának becslésére nincs egzakt módszer Mintavételi módok - véletlen mintavétel - egyszerű véletlen mintavétel (homogén, véges elemszámú sokaságból visszatevés nélküli kiválasztást végzek el, hogy minden elem egyforma valószínűséggel kerüljön be a mintába - szisztematikus kiválasztás (a sokaság sorba rendezése után k=N/n, az első k elemből kiválaszt egyet, majd minden k-adik kerül be a mintába) - rétegzett mintavétel (ha az alapsokaság eléggé strukturált sokféle ismérv alapján csoportosítható: - rétegzés kérdései: - hogyan jeleníthetem meg az egyes csoportokat a listában, lehetőség szerint homogén, minél kisebb szórású csoportokat alkossunk - csoportok a teljes sokaságot kiadják - minden elem csak egy csoportba tartozhat - réteg megjelenése a mintában (milyen súllyal jelenjen meg a mintában) - arányos rétegzés: minden csoport ugyanolyan arányban jelenik meg a

mintában, mint az alapsokaságban - nem arányos rétegzés - csoportos mintavétel - csoportokat, rétegeket képez az alapsokaságban véletlen kiválasztással kivesz egy csoportot, majd a csoport minden tagját megfigyeli 25. oldal Statisztika - többlépcsős mintavétel - kombinált mintavétel (különböző módokat keverik egymással, a gyakorlatban általában ezt alkalmazzák - nem véletlen mintavétel - szisztematikus kiválasztás: a sokaságnak időben és térben egyenlő távolságra lévő egyedei kerülnek a mintába (pl. minden 20) - kvóta szerinti kiválasztás (az alapsokaságot kiválasztják, a mintavevőnek a minta elemszámát megadják, és rábízzák, hogy szedi össze) - koncentrált kiválasztás (a legjellemzőbb egyedet választják ki) 26. oldal Statisztika Gazdaságstatisztikai ismeretek A statisztika csoportjai - általános statisztika: alaptételek, melyeket a gyakorlati statisztikában alkalmazni lehet - szakstatisztika: területei

gazdasági, társadalmi statisztika Társadalmi statisztika - a társadalmi rétegződést, mobilitást vizsgálja (mobilitási mátrix) - szülők hovatartozása hogy befolyásolja a gyerek életét - demográfia (népesség száma, összetétel, vándorlás, migráció), az egyik legrégebbi szakstatisztika fajta - oktatás, műveltség vizsgálata (tanulók, tanulók száma) - egészségügyi statisztika - szegénység vizsgálat Gazdasági statisztika - nemzetközi standardok, hogy össze lehessen hasonlítani az országokat (ENSZ irányadó) 1. Nemzeti elszámolások, számlák SNA mutatók, a gazdaság teljesítményét ezzel mérjük (GDP, GNP, GNI) 2. Árak vizsgálata (termelői árak vizsgálata is) 3. Foglalkoztatottság (munkabérek, munkaerő költségek) 4. Gazdasági szervezetek megfigyelése 5. Háztartások jövedelme és fogyasztása 6. Pénzügyi statisztika (államháztartás teljes statisztikai rendszere, társadalombiztosítási alapok, elkülönített alapok

(nukleáris, munkaügyi), központi költségvetés, helyi önkormányzatok) A gazdasági statisztika szereplői - regisztrált szervezetek, cégbíróságon be vannak jelentve, jogilag létezik, adószámmal rendelkezik, akik ellen csődeljárás, végelszámolás, felszámolás van folyamatban - működésükről a tárgy évben, vagy az ezt megelőző évben adóbevallást nyújtottak be - külföldi érdekeltségű szervezetek: akinek a jegyzett tőkéjében 10% fölött van a külföldi tőke - jogi szempontok szerint is szokták osztályozni - gazdasági szervezetek még: - költségvetési intézmények, államháztartás - háztartások - statisztikai számjel célja, hogy a statisztikai nyilvántartásban mindenki egyszer szerepeljen Nemzeti számlák rendszere - a gazdaság teljesítményét méri - Feller Frigyes próbálta először megmérni, hogy mekkora az ország gazdasági teljesítménye, potenciája, a nemzeti vagyont - a nemzeti vagyon: legszélesebb körű:

természeti erőforrások, ingó és ingatlanvagyon, népesség, munkaerő, gazdasági potenciál 27. oldal