Informatika | Gazdasági Informatika » Pekárdy Milán - Üzleti döntéstámogatás, adatbányászati módszertanok és esettanulmányok bemutatása az üzleti életben

Alapadatok

Év, oldalszám:2008, 15 oldal

Nyelv:magyar

Letöltések száma:147

Feltöltve:2010. augusztus 10.

Méret:360 KB

Intézmény:
-

Megjegyzés:

Csatolmány:-

Letöltés PDF-ben:Kérlek jelentkezz be!



Értékelések

Nincs még értékelés. Legyél Te az első!

Tartalmi kivonat

Üzleti döntéstámogatás Adatbányászati módszertanok és esettanulmányok bemutatása az üzleti életben Pekárdy Milán 2008. Tartalomjegyzék 1. Bevezetés 2 2. Adatbányászati módszertanok 3 2.1 CRISP-DM módszertan 4 2.2SEMMA módszertan 5 2.3 Clementine adatbányászati eszköz5 3. Alkalmazások az üzleti életben 6 3.1 Adatbányászati alkalmazások 6 3.2 Adatbányászati esettanulmányok 8 3.21 HSBC Bank Plc hitelkártya-tranzakciós problémái 8 3.22 SOFMAP Company Ltd online vásárlásokat támogató rendszere 9 3.23 Standard Life Group célzott ajánlási rendszere 11 4. Összegzés 12 5. Forrásjegyzék 13 -1- 1. Bevezetés Az adatbányászat (data mining) a kilencvenes években robbant be az üzleti köztudatba. Az adatbányászat, mint önálló szakterület úgy jöhetett létre, hogy könnyen használható, az elvárt eredményeket biztosító elemzési eszközöket tudott biztosítani az üzleti szakértőknek, a piackutatóknak, valamint a

gazdasági és a stratégiai tervezésben érdekelteknek a döntéshozatal elősegítésében és egyéb elemzések elvégzésében. Az adatbányászat lényege, hogy a rendelkezésre álló nagy mennyiségű nyers adatokból előzetesen nem ismert, érdekes, potenciálisan hasznos és a külső szemlélő számára nem-triviális információkat, összefüggéseket nyerjünk ki. Az adatbányászat egyszerű menete: a szükséges adatok összegyűjtése, adatbányászati módszer alkalmazása, a kinyert információk reprezentálása és a megszerzett tudás felhasználása. Az üzleti élet szereplői is hamar felismerték ezen technikák előnyeit. Egy vállalkozás megfelelő működéséhez elengedhetetlen a döntések meghozatalát elősegítő információk megszerzése. Nézzünk meg egy általános, egyszerű vállalati környezetet, hogy miként teszi szükségessé ez a piaci helyzet az adatbányászat megjelenését. Egy profitorientált vállalat általában

versenyhelyzetben áll más hasonló tevékenységet folytató cégekkel. A piac változásaira és a többi vállalat tevékenységeire lehetőség szerint reagál figyelembe véve a saját célkitűzéseiket. Ezeket a reakciókat, döntéseket a vállalat vezetése, döntéshozói hozzák meg, és ezen döntések sorozataként modellezhető a vállalat vezetésének folyamata. A vállalat eredményessége azon múlik főleg, hogy minél gyorsabban minőségi döntések keletkezzenek, amik a leghatékonyabban mozdítják előre a vállalatot a versenyző piacon. Az adatbányászat a döntések minőségének javítását célozza meg, ugyanis minél jobban ki vannak elégítve a döntéshozók információigénye, azaz minél pontosabb, átfogóbb, a helyzetet pontosan leíró információk állnak rendelkezésre annál pontosabb döntések hozhatók, ilyen szemszögből vizsgálva a piaci verseny részben felfogható az adatbányászat minél jobb kihasználásának versenyeként is.

Ennek eredményeként a profitorientált vállalatok nagy része egyre több anyagi és más erőforrást fordít az ilyen döntéstámogatást elősegítő technikák fejlesztésére, használatára. A vállalatoknál rendelkezésre álló hatalmas adatbázisok egyszerű technikákkal történő vizsgálata nem alkalmas a szükséges információk kinyerésére, erre használatosak a különböző adatbányászati technikák, amelyek közül a fontosabbak bemutatásra fognak kerülni. A döntéshozatalban érdekeltek az általuk meghozandó döntések előkészítésének illetve meghozatalának alapjának tekintették a különböző adatbányászati technikákat. Fontos, hogy a rendelkezésre álló adattömeg ne csak gyűljön és gyűljön, hanem törekedni kell, hogy minél jobban kihasználjuk őket, feltárjuk a bennük rejlő tudást és ezeket konkrét előnyökként realizálni tudjuk. Az adatbányászati technikákkal készült elemzések eredményeit, a feltárt

ismereteket, stb. mind a jövőbeli döntések meghozatalánál, eredményességük javításánál használják fel főleg. A technika prediktív mivoltából kifolyólag a döntések várható hatásai előjelezhetők ezzel is támogatva a vállalat hatékonyságát, piaci helyzetét. Ez a rövid tanulmány bemutatja a legáltalánosabban használt technikákat, módszertanokat, valamint konkrét példákkal reprezentálja az adatbányászat szerepét és fontosságát a különböző üzleti területeken. -2- 2. Adatbányászati módszertanok Az alkalmazott adatbányászat meglehetősen komplex tevékenység. Egyszerre több területről igényel ismereteket: informatikai, matematikai, üzleti illetve modellalkotási tudás szükséges. Ebből is látszik, hogy ez egy viszonylag széttagolt terület ezért szükséges valamilyen egységes eszköz bevezetése, amellyel sikeresen oldhatók meg a különböző üzleti problémák. Ennek eredményeként alkották meg a

különböző adatbányászati módszertanokat, technikákat, amelyek vállalati struktúrától, céloktól függetlenül általánosan alkalmazhatók a különböző problémák megoldására. Természetesen ezek a módszertanok egy alap modellt adnak az adatbányászoknak, a munka egy részét nekik kell elvégezni, tehát az emberi tényezőktől is függ a döntéstámogatás eredményessége, hogy milyen minőségű „tudást” tudnak feltárni illetve, hogy mennyire hatékonyan tudják ezt felhasználni a döntési folyamatokban. Az adatbányászaton alapuló döntéshozatali folyamatot egy vállalat folytathatja cégen belül saját erre a célra foglalkoztatott munkaerővel, illetve külsős cég bevonásával, akik célzottan ilyen szolgáltatásokat nyújtanak más cégeknek (adatbányászat, adattárház fejlesztés, adattisztítás, alkalmazásfejlesztés, intelligens alkalmazások). Ebből is látszik, hogy milyen fontos területről van szó, hogy külön cégek

nyújtanak ilyen jellegű szolgáltatásokat, ráadásul komoly jövedelmet jelent az adatbányászat. Magyarországon a jelentősebb adatbányászati cégek: DSS Consulting, Data Explorer, SPSS Hungary, Microsegment Kft. A következőkben a felmérések szerinti két legelterjedtebb adatbányászati módszertan: a CRISP-DM és a SEMMA kerül rövid bemutatásra illetve a legtöbbet alkalmazott adatbányászati eszköz, az SPSS Clementine. Milyen adatbányászati módszertant használ? [KDNuggets 2004-es felmérése 170 szavazat] CRISP-DM (72) SEMMA (17) A cég saját módszertana (11) Saját módszertant (48) Egyéb (10) Semmilyen (12) 42% 10% 6% 28% 6% 7% -3- Milyen adatbányász eszközt használt 2005-ben [KDNuggets 2005, 376 szavazó, 860 szavazat] említés SPSS Clementine 135 SPSS 96 Excel 78 CART/MARS/TreeNet/RF 69 SAS 53 SAS Enterprise Miner 49 Saját program/kód 39 Egyéb ingyenes eszköz 34 Insightful Miner/ S-Plus 32 Statsoft Statistica 30 Weka 30 ThinkAnalytics 26

C4.5/C50/See5 25 R 25 Microsoft SQL Server 23 Other commercial tools 23 MATLAB 16 Mineset (PurpleInsight) 16 Xelopes 16 Oracle Data Mining 10 Gornik 8 KXEN 7 IBM Iminer 5 Angoss 3 Equbits 3 Fair Isaac 3 GhostMiner 3 Megaputer 3 CRISP-DM SEMMA ♦ SPSS technológia ♦ hat szakaszt különböztet meg ♦ alkalmazási helytől és eszköztől független ♦ CRoss-Industry Standard Process for Data Mining ♦ SAS technológia ♦ öt lépésből áll ♦ a cég adattárház alapú információszolgáltató rendszerébe épül be ♦ az elemzési szakasz módszertana ♦ a lépések kezdőbetűiből áll össze az elnevezés 2.1 CRISP-DM módszertan Ez egy nemzetközi szinten elismert és kipróbált módszertan. Minden típusú adatbányászati project esetében alkalmazható, lépései egyszerűek, de hatékonyak. A project folyamata a következő: Üzleti célok és környezet megismerése: az első lépés a projecthez kapcsolódó célok és követelmények megfogalmazása,

megismerése. Ezek alapján az adatbányászati probléma leírása és ezek megvalósíthatóságának kiértékelése következik. A szakasz végén pedig egy előzetes terv megfogalmazása az elérendő célokról. elemzésen, ahol elsődleges összefüggéseket tárnak fel és alapstatisztikákat készítenek, illetve az adatokat minőségi szempontból is vizsgálják és a felmerülő problémákat kezelik. Adatok megismerése: ebben a fázisban összegyűjtik, leírják és megismerik a kiindulási adatokat, amik szerepelhetnek a projectben. Az adatok már itt átesnek egy általános -4- 1. ábra CRISP-DM folyamatábrája Adatkezelés: az elemzéshez szükséges adatok kiválogatása, tisztítása és formázása történik itt. A megkövetelt adatminőség biztosítása illetve az adatok egységesítése (pl. egységes jelölésrendszer) is fontos előkészítő folyamat. Egy adatbányászati feladathoz rendelkezésre álló adatok általában több, különböző

típusú adatforrásból származnak, éppen ezért sokszor szükséges adat-transzformációk elvégzése is. Modellek alkotása: első lépés a modellezési technika kiválasztása (regresszió, osztályozás, neurális hálók, stb.), aztán a szükséges tesztminta generálása az adatokból, amellyel legeneráljuk a modellt A folyamat végén pedig kiértékelik a modellt, ha szükséges adatpótlás céljából visszatérhetnek az előző lépéshez, hogy növelni tudják a modell hatékonyságát. -1- Eredmények kiértékelése: az előző pontban felépített modellek által generált eredmények használhatóságát és hasznosságát vizsgálják, ha elégedettek, akkor kiválasztják a legmegfelelőbb modellt és előrelépnek az eredmények alkalmazása felé. Nem elégséges eredményesség esetén újragondolják az elemzési folyamatot, visszatérnek az üzleti célokhoz és a szükséges módosításokat elvégzik és új modelleket generálnak. Eredmények

alkalmazása: a kapott eredmények alkalmazásának megtervezése. A legjobb modellt bemutatják a vállalati döntéshozóknak (a cél az ő munkájuk segítése volt). Az eredmények reprezentálásnak több féle módja van, célszerű olyan megjelenítési formákat kidolgozni, amelyek a legjobban tükrözik a számítás eredményeit, a vállalati vezetés is könnyen megérti és valóban ők is látják a modell által elérhető lehetőségeket, hogy miként mozdítja előre a vállalatot. 2.2 SEMMA módszertan A SEMMA egy adatbányászati elemzés folyamatát írja le. Lépései: mintavételezés, vizsgálat, módosítás, modellezés és értékelés. Az elnevezés ezen lépések angol megfelelőinek kezdőbetűiből áll össze: Sampling, Exploration, Modification, Modelling, Assessment. Nem tekinthető egy teljes adatbányászati projekt megvalósítását leíró módszertannak, hiszen annál szűkebb: csak az elemzés és a modell építés fázisaira szűkül. A

módszertan lépései a következők:  Mintavételezés: külső és belső rendszerekből gyűjtött adatok leválogatása. Ha nagy mennyiségű adatunk van, úgy vegyünk mintát, hogy elég kicsi legyen ahhoz, hogy kezelhető legyen, de elég nagy, hogy minden lényeges információt tartalmazzon, amit az egész adatsokaság is.  Vizsgálat: az adatok megértését elősegítendő összefüggéseket, kiugró (extrém) értékeket keresünk, esetleg hiányzó elemeket szűrünk ki.  Módosítás: pótoljuk a hiányzó adatokat, elhagyjuk a fölöslegeseket illetve a változók összevonásával újakat hozhatunk létre a jobb modellalkotás elősegítéséhez.  Modellezés: alkossunk modelleket különféle számítási módszerekkel, amelyek automatikusan megtalálják a szignifikáns változókat, amelyek jó becsléseket, előrejelzéseket képesek adni.  Értékelés: modellek összehasonlítása, működési pontosságok vizsgálata. Az eredményeinket

értékeljük hasznosság és megbízhatóság szerint, végül a felmerülő üzleti problémákra adjuk meg a válaszokat a modell segítségével (ez volt a célunk). 2.3 Clementine adatbányászati eszköz A CRISP-DM módszertant követő eszköz az egyik leghatékonyabb a piacon, az adatbányászati elemzés folyamatának minden fázisát támogatja. A Clemnetine grafikus, interaktív folyamatmodellező felhasználói felülete lehetővé teszi az értékes modellek gyorsabb átültetését az üzleti alkalmazásba - ezzel fejlesztve a döntéshozatal folyamatát. Az adatbányászat eredményei akkor térülnek meg maximálisan, ha a kapott modellek beépülnek a meglévő rendszerekbe és folyamatokba. A Clementine adatbányászati eszközcsalád költséghatékony alkalmazási lehetőségeket kínál majdnem minden operációs környezetben. A Clementine adatbányászati eszköz nyitott dizájnja lehetővé teszi, hogy a piac vezető relációs adatbázis-kezelőit egy komplett

adatbányászati elemző platformmá alakítsa. Ez az integrációs képesség az egész adatbányászati folyamat során lehetővé -5- teszi a jelenlegi adatbázis eszközök maximális kihasználását - beleértve az adatbázis elérést, a szöveges adatok és web tartalom elemzések előtti előkészítését, és a kész modellek menedzselését. 2. ábra Clementine kezelőfelülete 3. Alkalmazások az üzleti életben Az eddigiekben elméleti oldalról közelítettük meg az üzleti adatbányászati megoldásokat, leglényegesebb megoldásaikat. A következő részben következik az érdemi dolog: konkrét példákon és esettanulmányokon keresztül szemléltetjük, hogy valójában hogyan is segíthetik ezek a módszerek a vállalat vezetőit döntéseik meghozatalában, illetve milyen más módokon tudják megkönnyíteni a szervezet munkáját. Az esetek bemutatásánál nem az a cél, hogy a bonyolult adatbányászati technikákat feltárjuk, amik a megoldások

hátterében húzódnak hanem, hogy a bemutatott probléma megoldásában miként segített az alkalmazott technika. A fejezet első felében rövidebb, egyszerűbb problémák kerülnek leírásra pár mondatban (amolyan felvezetés gyanánt), a második részben pedig már komolyabb üzleti alkalmazásokat vizsgálunk adatbányászati szempontból a probléma bemutatásán keresztül a megoldáson át az értékelésig. 3.1 Adatbányászati alkalmazások Ezekkel a rövid leírásokkal bemutatjuk, hogy milyen széles körben alkalmazhatóak a különböző technikák. Az alkalmazott adatbányászati eszközök és módszerek is le lesznek írva röviden Zárójelben a projecthez kapcsolódó cég neve szerepel. Gazdasági adatok tisztítása (Lockhead): az alkalmazás célja egy pénzügyi adatállomány megtisztítása volt; az adatbázis több mint 2200 kötvényről tartalmazott adatot. Az egyes kötvények adatait és azokhoz kapcsolódó háttér-információkat 10 tábla és 150

mező felhasználásával tárolták. A probléma -6- az volt, hogy az adatbázis nem tartalmazott szigorú adatellenőrzési mechanizmust, így az adatok integritása kétséges volt, mivel az adatok több forrásból érkezhetnek az integritás fontos szempont. A megoldásnál a Recon 1 adatbányászati eszközt alkalmazták, az elemzők különböző adatbázisokból a Recon segítségével információkat nyertek ki az egyes kötvényekkel kapcsolatban, amelyeket beleépítve a Recon-ba, futatták azt a kötvényeket tartalmazó adatbázisra. Ezt az eljárást alkalmazva sikeresen megtalálták a kirívó eseteket és növelték az adatbázis konzisztenciáját, kiszűrve a hibás bejegyzéseket és a lejárt kötvényeket. Ebben az esetben az adatbányászati módszer alkalmazása valójában egy előkészítő folyamat volt, amivel az adatokat minőségileg javítottuk, tisztítottuk. A későbbi ezen adatokra alapuló döntések meghozatalánál viszont ez fontos szempont,

hogy így már minőségileg megfelelő adatbázis áll rendelkezésünkre a különböző adatbányászati feladatok megoldására. Végeredményben ha közvetetten is de a későbbi döntéseket elősegítendő folyamatot végeztek el a szakemberek. Tőzsdei árfolyamok ellenőrzése (Reuters): ez egy olyan, tőzsde-adatokban hibát kereső alkalmazás, amely a kurrens árfolyam alakulás alapján durva előrejelzést is szolgáltat. Nagy előnye, hogy a rendelkezésére bocsátott adatokból automatikusan, szakértő alkalmazása nélkül képes dolgozni – változó árfolyam-alakulás feltételei mellett. Az eljárás során a Clementine adatbányászati eszközt alkalmazták és neurális hálózatokat használtak. Az eljárás során feltárt hibák, információk alapján és a prediktív jellegből adódóan jól használható a későbbi komolyabb döntéseket segítő alkalmazásoknál. Hátralék problémák előrejelzése (The Leeds): a cél az volt, hogy feltárják,

milyen hátralék problémák léphetnek fel az általuk kezelt szervezetek jelzálog számláján. Kifejlesztettek több adatprofilmeghatározó szabályt: egészséges számla, hátralékban lévő számla, teljesíthetetlen kintlévőség, regionális hátralékok, és a hátralékokban lévő számlák egyéb karakterisztikájának a kiszűrésére. A Leeds ugyancsak adatbányászó algoritmust alkalmazott a hitelképesség kiértékelésére, illetve célorientált marketing-terv elkészítésére. Az XpertRule Analyzer nevű eszközt alkalmazták a művelet során, ez az eszköz grafikus tudásreprezentáció, igazság táblák, indukciós szabálygenerálások segítségével fedezi fel az adatok közötti szabályokat, mintázatokat. Vásárlási trendek feltérképezése (Dickinson Direct): az Information Harvester adatbányászó szoftvert alkalmazzák a projectek során, arra használják, hogy – a rendelkezésére álló történeti vásárlási adatok alapján –

kimutassák ügyfeleinek főbb vásárlási trendjeit, és szabályszerűségeket mutassanak ki a korábbi marketing tevékenység alapján. Adatbányászati módszerekkel meg tudják többek között állapítani a tipikus vásárló profilját, melynek alapján célorientált marketing stratégiát tudnak kidolgozni. Az ilyen módszerek eredményeit felhasználva jelentős költségmegtakarítások és profit növekedés érhető el a célzott marketing stratégia megfelelő alkalmazásával, így az esetleges többlet kiadások is megérik az ilyen projectek esetében. Ezen módszereknek köszönhetően a vásárlók igényei is jobban ki lesznek elégítve így nagyobb bizalmi szintre kerülhetnek az adott boltokkal szemben, így teremtve potenciális piacot a vállalatoknak és ezzel erősíteni tudják piaci versenyhelyzetüket is. Lottógépek felállítási helyének kijelölése (Automated Wagering Inc.): egy kisvállalkozás megnyitásakor nagyon fontos a megfelelő helyszín

kijelölése; ez olykor eldöntheti, hogy az adott 1 Komplett adatbányászati megoldásokat szolgáltató rendszer. Az eljárás tartalmaz: deduktív adatbázis kezelés, induktív szabálygenerálás, csoportosítás, vizualizáció, neurális hálózatok és „legközelebbi szomszédok” módszere. Kombinálja a top-down (elemzők próbálnak az adatok között összefüggéseket, szabályokat találni, a Recon ellenőrzi ezek helyességét és segít a hibák kiszűrésében) és a bottom-top (a rendszer automatikusan feltárja az adatok közötti kapcsolatokat és ezeket használják fel az elemzők a modellek megalkotásához) eljárásokat. -7- vállalkozás sikeres lesz-e. A kisebb vállalkozások általában nem vehetik fel a versenyt a nagyobb regionális esetleg országos multikkal, sem kiterjedésben sem árszínvonalban. A vállalat beindítása előtt nagyon fontos lépés a piackutatás, a régió felmérése és a vásárlók igényeinek feltérképezése. A

különböző adatbányászati módszerek megfelelő alkalmazása kielégítő információkkal szolgálhatnak az előzetes felmérésekből származó adatokból, ezzel is növelve a vállalat sikeres piaci elhelyezkedésének esélyét. Ebben a pontban tárgyalt esetnél a cég a ModelMax 2 prediktív modellezését és a földrajzi elemzés módszereit együttesen alkalmazva sikeres előrejelzéshez jutott a lottógépek felállítási helyének meghatározásában. A project eredményességét pedig említeni se szükséges, a megfelelően elhelyezett gépeket többen fogják használni így komoly többletprofitra lehet szert tenni az amúgy sem kis vállalkozásnak számító lottó bizniszben. Pénzmosás kiszűrése (US Department of Treasury): az alkalmazást abból a célból fejlesztették ki, hogy kiszűrje a gyanús pénzügyi tranzakciókat, a lehetséges pénzmosásokat. Nem csak egy hagyományos szakértő rendszer, amely automatizálja a döntési folyamatot, hanem a

fejlett adat vizualizációs eszközeivel erősen támogatja azt. Adatbányászó technikákat arra használták, hogy a legkülönbözőbb perspektívákból összefüggéseket találjanak, és hatékony formában jelenítsék meg a feltárt relációkat a felhasználó előtt, megkönnyítve a hatalmas adattömegben való tájékozódását. 3.2 Adatbányászati esettanulmányok A következőkben néhány hosszabb lélegzetvételű esettanulmány részletesebb taglalása következik. Bemutatásra kerülnek a különböző kiindulási szituációk, a felmerülő problémák és azok kezelése illetve az eredmények értékelése. A leírásoknál a hangsúly azon lesz, hogy az adatbányászati alkalmazások miként segítettek a problémák megoldásában illetve látni fogjuk néhány esetben, hogy miként épültek be a további vállalati rendszerbe. 3.21 HSBC Bank Plc hitelkártya-tranzakciós problémái A londoni székhelyű HSBC a világ egyik legnagyobb banki és pénzügyi

szolgáltatásokat nyújtó szervezete, 77 országban több mint 2900 irodával. Az egyes bankokban lévő bankkártyaszolgáltatásokért felelős részlegek menedzselik a kártyák kiadását illetve az azokkal kapcsolatos tranzakciókat, feladatokat. Az itt dolgozó elemzők az SPSS szoftver megoldásait alkalmazzák a különféle marketing kampányok kiértékelésére és a vevőszegmentálási stratégiák kialakítására. A HSBC Bank ügyfelei körülbelül 125 millió hitelkártya tranzakciót bonyolítanak le évente. Minden tranzakció magában foglal egy tranzakciós díjat, amit a tranzakciót kezelő banknak kell kifizetni a kártyatulajdonos bankjának. Az ilyen tranzakciós díjak kezelésére alkalmazott szabályok meglehetősen komplexek, amit tovább bonyolít, hogy az egyes bankok a tranzakciók feldolgozásánál eltérő módszereket alkalmazhatnak. A hitelkártya piac az egyik legváltozékonyabb területnek számít a banki szolgáltatások közül az Egyesült

Királyságban, köszönhető ez részben az elmúlt öt évben a piacra újonnan belépni szándékozók beáramlásának. Ezen új résztvevők célja a kezdeti egyszerű szolgáltatásoktól kijutni a nagyobb piacokra és változatossá tenni a termékpalettájukat. Mivel a piacra lépés akadályai 2 Automata adatbányászati alkalmazás, prediktív és leíró jellegű modellek készítését támogatja. Automatikusan kezel minden adatbányászathoz szükséges statisztikai és matematikai eszközt. Az eredmények optimalizálásának érdekében statisztikai és neurális hálózati eljárások különleges kombinációját alkalmazza. Egy termékben kezeli a prediktív modelleket és a csoportosítási eljárásokat -8- viszonylag alacsonyak így a kínálat egyre csak nő, ami fokozza a versenyhelyzetet és a profitok csökkenését. Ezek az események szükségessé tették a HSBC-nek, hogy megfelelő profitnövelő és a piacra lépőket visszaszorító stratégiákat

dolgozzanak ki. Az elemzők abban látták a megoldandó problémát, hogy sok tranzakció után a bevezetőben említett tranzakciós díjfizetésekben mutatkozó eltérések miatt nem a megfelelő díjat kapják. A feladatuk az volt, hogy ezt igazolják, és azután beállítsanak egy olyan eljárást, ami biztosítja, hogy minden tranzakció után a megfelelő összeget kapják. A szakemberek az SPSS adatbányászati szolgáltatást vették igénybe, miután a saját szoftvereik és adatbázis-kezelő rendszerük hatástalannak bizonyult a probléma megoldásában. A rendelkezésre álló hatalmas adatmennyiség feldolgozása nem okozott gondot az SPSS rendszernek és az eredmény sem maradt el. A naponta betáplált tranzakciók adatait rendszerezték és elemezték ennek eredményeként két héten belül azonosítani tudták a bevétel hiány eredetét. Az adatokon végzett további vizsgálatok és manipulációk kimutatták, hogy a ténylegesen kapott jövedelmek és azon

jövedelmek között, amit eredetileg kapniuk kellett volna lényeges különbség mutatkozott. Az így feltárt ismeretek alapján a HSBC Bank vezetése joggal számított a hiány eltüntetésére, ami több millió font többletbevételhez fogja juttatni őket. Az SPSS adatbányászati alkalmazások használatával az elemzők hatékonyan tudták a hatalmas adattömeget vizsgálni, ami lehetővé tette az elveszett jövedelem visszaszerzését. Az új megoldásoknak köszönhetően az ügyfél szintű adatbázisokat elemző emberek hatékonyan tudták rendszerezni és vizsgálni az egyéni tranzakciókat akár nagyobb mennyiségben is, a szükséges információkat pedig könnyedén elő tudták állítani. 3.22 SOFMAP Company Ltd online vásárlásokat támogató rendszere A SOFMAP Japán egyik vezető PC és szoftver kereskedelmi cége, 40 kiskereskedelmi egységgel az egész országban. A vállalat menedzserei úgy gondolták, hogy a vásárlóik zömének nehézséget okoz a

különböző hardver és szoftver komponensek vásárlása, a döntéseiket csak nehezen hozzák meg, és ez megmutatkozik az online vásárlások volumenének visszaesésében is. Az online vásárlások előrelendítésének érdekében a Clementine adatbányászati eszköz megoldásait használták fel egy olyan motor megalkotásához, amit az online vásárlásokat kezelő webalkalmazásba építették be és a vásárlók személyes profilja alapján javasolja a motor által megfelelőnek tartott termékeket. A vásárlók profiljai az online regisztrációs folyamat során szolgáltatott adatok és a korábbi tranzakciók adatai alapján állnak össze. A vállalat 1995 óta árulja a számítástechnikai termékeket az interneten is, azóta az évek alatt az elektronikus kereskedésből származó eladások drámaian megnőttek. A növekedés és a stabil gazdasági helyzet ellenére a SOFMAP vezetősége úgy gondolta, hogy az online eladások csökkeni fognak akkor, ha nem

szolgálják ki megfelelően azokat a vásárlókat, akiknek nincs megfelelő számítástechnikai szaktudása a személyes igényeiket kielégítő termékekkel szemben. A SOFMAP a probléma megoldását a korábban említett személyre szabott ajánlásokat szolgáltató motorban vélte felfedezni, ami segít az online vásárlóknak az elképzeléseik megvalósításában. A motor alapjául szolgáló hatalmas adatbázis természetesen rendelkezésre állt több mint két millió vásárló adataival. Az adatsokaság alapján a személyeket vizsgálni akarták demográfiai, egyéni jellemvonások és vásárlási szokások szempontjából és ezek alapján látnák el -9- információkkal az ügyfeleket döntéseiket megkönnyítendő. A Japán piacon egyedülállónak számító eljárás a felhasználók között nagy népszerűségre tett szert. A SOFMAP-nak olyan adatbányászati megoldásra volt szüksége, ami gyorsan és könnyen tárja fel a vásárlói és tranzakciós

adatbázisokban rejlő információkat. A vállalat egy olyan szoftver csomagot akart ehhez biztosítani a marketingeseiknek, amit könnyen használhatnának a saját elemzéseik elvégzéséhez, mivel ők rendelkeznek átfogó ismeretekkel a vásárlók viselkedéséről. Ezzel azt is elérték, hogy nem kellett külön programozókat elvonni a motor fejlesztése mellől, mert a szoftvert a marketingesek maguk is hatékonyan tudták kezelni, így pénzt és időt is megtakarítottak. A Clementine használatával egyszerűen tudták elemezni az adatokat és megalkotni a motorban használatos üzleti szabályokat. A Clementine tökéletes választás volt a feladat elvégzésére, mivel programozói tudás nélkül tudták használni a gazdasági elemzők a megfelelő modellek megalkotásában. Ezzel kiküszöbölték azt is, hogy a programozóknak kelljen konzultálni a marketing osztály munkatársaival, így az egész folyamatot önmaguk végezhették el, ami egyértelműen a

hatékonyságot növelte. A rendelkezésre álló hatalmas információtömeget sikeresen használták fel a vásárlói viselkedések modellezésére. A feltárt információkat a Clementine rendszerrel elemezve az elemzők csoportokba sorolták a vásárlókat, ezt „digital lifestyle modell”-nek nevezték el. A modellt ezek után felhasználták az üzleti szabályok és a személyre szabott vásárlást támogató motor megalkotásánál, illetve a rendszeres vásárlók számára az oldal személyre szabhatóságát is ezzel segítik. Az online vásárlásokat támogató motor működése a regisztrált felhasználók profiljainak összehasonlításán alapul és felállít egy előzetes „digital lifestyle modellt”, a személyre szabott vásárlást támogató információk az alapján jelennek meg, hogy melyik csoportba tartozik az adott felhasználó az előzetesen megalkotott modellek alapján. Következik néhány példa, hogy a motor milyen többlet információkkal

segíti a vásárlási folyamatot:  a vásárló személyes SOFMAP oldalán híreket, cikkeket illetve termékeket hangsúlyoz ki, amik a motor alapján a vásárló igényeihez kapcsolhatók  bizonyos termékekre jobban ráfokuszál, amikor a vásárló meglátogat egy termék szekciót  vásárláskor kiegészítő termékeket is felajánl Az adatok alapján az elemzők számon tartják a (vásárlási hajlandóság és volumen szerint) legjövedelmezőbb ügyfeleket. Ez új lehetőségeket nyit meg a vállalat számára, mivel külön erre a vásárlói csoportra is fókuszálhatnak egy direkt erre a célra bevezetett támogató motorral, ami tovább növelné a vásárlási kedvet és ezzel arányosan a profitot is természetesen. Az új, adatbányászati eljárásokra épülő, személyre szabott vásárlásokat támogató motor bevezetésének hamar meglett az eredménye: az üzembeállítás után az oldalra látogatások száma 67%-os növekedést mutatott havonta,

2001-ben a profit a háromszorosára nőtt az előző év ugyanilyen időszakához képest köszönhetően az online eladások 18%-os növekedésének. A rendszer bevezetése utáni első hónapban az addigi 18 milliós havi oldallátogatás 30 millióra emelkedett, a cég szakemberei ezt a növekedést szinte teljes bizonyossággal az új támogató motornak tulajdonították, mint ahogy azt is, hogy az weboldal különböző szekcióira körülbelül kétszer annyi „ránézés” volt, mint korábban köszönhetően annak is, hogy az új rendszer, szolgáltatások és felhasználói felület „ott tartotta” az oldalon a látogatókat. A támogató rendszer bevezetése után az eladások is egyértelműen nőttek, a vásárlók egyre több terméket vásároltak. Az eladások növekedési rátája a korábbi kb 270%ról 320%-ra ugrott A SOFMAP elemzői szerint a modellnek köszönhető nagymértékű növekedés az - 10 - eladásokban megháromszorozta az online eladásokból

származó bevételeket bármilyen más többlet kiadás nélkül, így az adatbányászati módszerekre alapuló újítások egyértelműen pozitívan hatottak a vállalat működésére. 3.23 Standard Life Group célzott ajánlási rendszere A Standard Life a világ egyik vezető átfogó pénzügyi szolgáltatásokat nyújtó vállalatcsoportja. Sikerének egyik fő kulcsa abban rejlik, hogy mindenre kiterjedő szolgáltatásokat tud nyújtani az adott területen belül. Ez a helyzet sok haszonnal jár és mivel részvényeseik nincsenek, így csak az ügyfeleik igényeinek a kielégítésére kell koncentrálniuk, ami a cég viselkedésében, döntéseiben meg is mutatkozik. A Standard Life csoportba tartozik a SL Assurance Company, a SL Bank, a SL Healthcare és a SL Investments. A SL Bank 1999-ben indította el a „Freestyle Mortgage” 3 nevű termékét kiterjedt TV- és sajtó reklámkampány kíséretében. Az elkövetkező időszakban a piacon megnőtt a hasonló

szolgáltatásokat nyújtó versenytársak száma, ezért lényeges volt a SL Bank számára, hogy szilárd piaci helyzetet teremtsen magának és folytassa a jelzálogkölcsönök piacán realizált részesedésének kiterjesztését. Ezen célok megvalósításához a vállalatnak a következőket kellett tennie: azonosítani a kulcs attribútumokat azon ügyfeleknél, akik érdeklődnek a jelzálog ajánlatok iránt kereszt értékesítések bevezetése, hogy a SL Bank termékeit más az SL csoportba tartozó cégek ügyfelei számára is elérhetővé tudják tenni egy a jelzálogkölcsönökhöz kapcsolódó modell (ami az ügyfeleket támogatná) kifejlesztése, ami beépíthető lenne a cégcsoport weboldalába a SL Bank által kezelt jelzálogügyletek jövedelmezőségének vizsgálata A project nagyobbik része az volt, hogy olyan modelleket fejlesszenek ki, amelyek azonosítani tudták a vásárlói jellemvonásokat azoknál, akik a jelzálog szolgáltatásokban

érdekeltek voltak. Az elemzők célja az volt, hogy az általuk épített modellek sebességét és kifinomultságát is növeljék más modellekhez képest, ami jobb kommunikációhoz vezetett a vásárlókkal. Az SPSS adatbányászati szoftver által szolgáltatott megoldásokkal a SL Bank könnyen vállalni tudta vállalni tudta a növekvő számú tranzakciókat, projecteket. A szoftver segítségével képesek voltak egy olyan hajlandósági (ügyfelek vásárlási hajlandóságainak vizsgálatát elősegítendő) modell megalkotására, amivel meg tudták mutatni a kliensek különböző típusait, akik érdeklődtek adott termékek, szolgáltatások iránt. A modell fő előnye az volt, hogy könnyen beépíthető és alkalmazható volt más SL csoportba tartozó cégek ügyfél adatbázisaiba. A siker másik fontos kulcsa az ajánlatok pontosabb célzása volt. A hajlandósági modell segítségével a vásárlók adatait elemző csapat a SL Bank-al együttműködve

megterveztek és végrehajtottak egy levélküldési kampányt (célzott ajánlásokat küldtek). A levelek tartalmaztak egy véletlenszerűen kiválasztott ellenőrző cellát is. A reakciók, válaszok és az ellenőrző adatok alapján a bankoknak lehetősége volt az erőforrásaikat a rendelkezésre álló információk szerint kiemelt termékeikre fokuszálni, illetve a vásárlókat is ellátták egy besoroló számmal, ami a célzott ajánlásokat 3 Egyfajta jelzálogkölcsön - 11 - segíti: ezek alapján a vállalat nagyobb hatékonysággal tudta elvégezni ezeket a feladatokat, illetve a hasonló jellemvonásokkal rendelkező esetleges későbbi ügyfeleket is könnyebben tudták besorolni. Mindezek következtében a SL adatbányászati megoldásainak köszönhetően elérhetővé vált számukra az ügyfelek jellemvonásainak jobb megismerése és megértése, így a hajlandósági modellt és a célzott ajánlásokat felhasználva sokkal eredményesebben keresték a

potenciális ügyfeleket. Ezen kívül már képesek voltak a bejövő tranzakciós kérések gyors jellemzésére, feldolgozására és elemzésére, illetve a webes felhasználói felület személyre szabhatósága is segítette az ügyfelek üzleti stratégiai szempontú elemzését. Az alkalmazott adatbányászati szolgáltatások eredményeként a Standard Life: Ω kiépített egy olyan hajlandósági modellt, ami azonosította a vásárlói típusokat és ezt az egész cégcsoportra alkalmazni tudták Ω felfedezte a jelzálog termékek értékesítését fellendítő kulcsmozzanatokat Ω ellenőrző csoportja sikerrel dolgozta és használta fel a modell segítségével kilencszeresére nőtt felhasználói visszajelzéseket, adatokat Ω a célzott ajánlások segítségével közel 50 millió dolláros plusz profitra tett szert Az elemzők a project kiugró sikerét az adatbányászati megoldások megfelelő felhasználásával érték el, az ügyfelek felé irányuló

hatásos célzott ajánlások és az új kommunikációs megoldások eredményeként jelentős költségmegtakarítás realizálódott a cég számára. A Clementine rendszer alkalmazása többszörösen megtérült befektetésnek bizonyult, ami még hosszú ideig fogja kifejteni jótékony hatását. 4. Összegzés A tanulmány célja az üzleti élet különböző területein alkalmazott adatbányászati megoldásokon alapuló döntések és megoldások bemutatása volt. A fentebb taglalt hosszabb és rövidebb esetek világosan rávilágítottak az adatbányászat jelentőségére a vállalati vezetés körében. A bevezetőben is említettük, hogy az üzleti életben a döntések általában a felhalmozódott hatalmas adattömeg és az azokat elemző, felhasználó emberek szakértelmére alapozódva születnek meg. Az adatbányászat megfelelő eszközöket biztosít a cégeknek, elemzőknek, hogy ezeket az adatokat hatékonyan tudják vizsgálni. A vizsgálatokból kinyert

információk alapján a cég számára kedvező döntéseket tudnak meghozni így a vezetők. A bemutatott esetek rávilágítottak arra, hogy a különböző adatbányászati technikák nem csak a konkrét döntések meghozatalát segítik, hanem az új megoldások erősíthetik a vállalatok piaci helyzetét a konkurens cégekkel szemben, növelhetik a vásárlók, ügyfelek bizalmi szintjét a cégekkel és szolgáltatásaikkal szemben, jelentős költségmegtakarítás, illetve bevétel növekedés érhető el a feltárt tudás megfelelő alkalmazásaival. Mai folyamatosan fejlődő, változó, rohanó, az informatikai megoldásokra nagyban támaszkodó üzleti világunkban, ahol a verseny folyamatos az adatbányászat egy nagyon fontos színfolt a megoldások palettáján, amit ha megfelelően alkalmaznak, komoly előnyökre tehetnek szert az üzleti szereplők, ahogy ez a bemutatott példákból egyértelműen kiderült, így a tanulmány is teljesítette célját, igaz ezúttal

komolyabb adatbányászati technika alkalmazása nélkül. - 12 - Forrásjegyzék [1.] Dr Abonyi János - Adattárházak és kiaknázásuk előadás sorozat 2007 [2.] Pásztor Márta Zsuzsanna - Üzleti intelligencia megoldások, avagy vezetői döntéstámogatás előadás 2004 [3.] Sántáné-Tóth Edit - Adatbányászat, automatikus ismeretfeltárás tanulmány 2001 [4.] Ismeretlen szerző - Adattárházak, Oracle és a SAP tanulmány [5.] SPSS Hungary - Adatbányászat, Text Mining, Web Mining 2008 http://wwwspsshu/data mining [6.] DSS Consulting - Szolgáltatások, adatbányászati módszertanok 2008 http://wwwdsshu/modszertanok - 13 -