Dr. Mucsi László - Képfeldolgozás a geoinformatikában

2005 · 63 oldal (439 KB)

magyar

135

2008. október 01.

Értékelések

Nincs még értékelés. Legyél Te az első!

Mit olvastak a többiek, ha ezzel végeztek?

Tartalmi kivonat

Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás Képfeldolgozás Dr. Mucsi László SZTE Természeti Földrajzi és Geoinformatikai Tanszék A jegyzet megismertet a digitális képfeldolgozás fogalmaival, legfontosabb műveleteivel, többek között a képi állományok importjával, korrekciójával, a korrigált képek mozaikolásával, a képfinomítás módszereivel, a többsávú képek osztályozásával, stb. A tananyag az ERDAS programra épül, ezért további kiegészítéseket talál az angol nyelvű Field Guide-ban. Az ismeretek további bővítéséhez ajánlott irodalomként használható a szerző Műholdas távérzékelés és digitális képfeldolgozás c. egyetemi jegyzete Tartalom Fogalmak Transzformáció Képfinomítás Főkomponens analízis Osztályozás 2 5 27 41 44 1 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás Fogalmak A digitális képfeldolgozás során használt képek alatt olyan

digitális állományokat értünk, melyek valamilyen képkezelő, képfeldolgozó szoftver segítségével bemutatnak egy tárgyat, vagy a földfelszín egy részét. A digitális képek adatállományokban, más néven képfile-okban találhatók, s valamilyen adathordozón, mágnesszalagon, CD-n, mágneslemezen, stb. tárolják őket A háló alapú képfeldolgozó rendszerekben a kép legkisebb önálló eleme a pixel, vagy raszter, melynek helye és értéke van. A helyet az oszlop és sor koordináták, descartesi x, y koordináták, vagy földrajzi koordináták is meghatározhatják, míg a pixel értéke egy szám, mely valamilyen módon reprezentálja az adott terület egy tulajdonságát, vagy a mérés eredményét (pl. reflektancia, tengerszint feletti magasság, stb.) A különböző tulajdonságok mérési eredményeit önálló sávokban tároljuk, így pl. a különböző spektrális tartományokban mért reflektancia értékek általában 1 egy képfileban, de

más-más sávban találhatók. A képfeldolgozó rendszerekben gyakran párhuzamosan használják a sáv és a réteg fogalmát. Mindkét fogalom használható azzal a megjegyzéssel, hogy a digitális kép egy sávja és egy űrfelvétel egy adott spektrális tartományra (sávra) vonatkozó adatai közötti kapcsolatot pontosan meg kell határozni 2 , másrészt ha a digitális, többsávú képek sávjait egy térinformatikai rendszerben (GIS) használjuk fel, akkor ott már csak rétegekről beszélhetünk. A képfeldolgozás során új képek készülnek, melyek lehetnek raszter vagy vektor alapúak, ezért érdemes az eredeti kép sávjaitól megkülönböztetve ezeket már csak rétegeknek nevezni, pl. annotációs réteg A numerikus adatok feldolgozása során nem közömbös, hogy a pixelértékek milyen típusúak, valamint milyen formátumban tároljuk azokat. A pixelértékek egy raszterfileban lehetnek nominális, rend, intervallum és arány típusúak. Az első két

típust tartalmazó rétegeket tematikus állományoknak nevezik. Az intervallum vagy arány típusú változókkal többnyire folyamatosan változó jelenségeket írunk le, pl. domborzat magassága, hőmérséklet, stb., ezért az ilyen adattípusokat tartalmazó rétegeket folyamatos rétegeknek nevezzük Koordináta rendszerek A raszter alapú rendszerekben a pixel helyét többféleképpen megadhatjuk. Természetesen alapkövetelmény, hogy egy adott képelem helyzetét egy meghatározott koordináta rendszerben egy és csak egy módon adhatjuk meg, egy képelemhez csak egy koordináta pár tartozhat. A képelem helyét megadhatjuk file, térképi, és földrajzi koordinátákkal. A file koordináták leírják a pixel adatfileban elfoglalt helyét az oszlop és a sor koordináták megadásával. A legismertebb képfeldolgozó rendszerekben a file koordináták számozása a bal felső sarokban kezdődik a 0. oszlop 0 sorában lévő pixellel 1 Az ERDAS IMAGINE egy képfileban

tárolja az összes sávot, míg az IDRISI minden sávot egy-egy önálló fileban tárolja. Egy nem teljes (nem mind a 7 sávot tartalmazó) Landsat TM felvétel képfilejának első sávjában lehet, hogy a 2. spektrális tartomány (látható fény zöld sávja) adatai helyezkednek el. Ez gondokat okozhat a beépített függvények, pl NDVI alkalmazásánál. 2 2 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás 1.ábra Tipikus file koordináták A térképi koordináták egy jól definiált koordináta rendszer (pl. Descartes-féle) szerint adják meg az adott hely pozícióját a koordináta rendszer mértékegységében (általában m, vagy km). Az origó (kezdőpont) a kép bal alsó sarkában helyezkedik el A pixelt a középpontjának koordinátái reprezentálják. A térképi koordináták megadhatók valamilyen vetületi rendszer szerint is, pl. a geometriai korrekció során, emiatt a képelemek koordinátái lehetnek földrajzi

(szélesség - ϕ, hosszúság - λ) koordináták is. Lehetséges, hogy a térképi és a földrajzi koordináták átszámíthatók egymásba (pl. EOV koordináták UTM-be), valamint két földrajzi koordináta rendszer között is létezhet átszámítási mód (pl. UTM-WGS84) Adattárolás A digitális képek, űrfelvételek sokfajta adathordozón, médián – mágnesszalagon, CDROM-on, mágneslemezen – tárolhatók. Legtöbbször nem is az a kérdés, hogy min tárolják az adatokat, hanem az, hogy hogyan, milyen szerkezetet szerint rendezték el az adatokat a tárolón. A digitális adatokat bináris formátumban tárolják. A bináris adat alapegysége a bit, melynek két lehetséges értéke van: 0 vagy 1. Az adatfile méretét byte-okban adják meg (1 byte 8 bit). A tároló médián a képi adatokat különböző módon tárolhatják A legtöbbször használt formátumok: BIL - sávok soronkénti összefésülése, BSQ - sávok egymás utáni, szekvenciális

összefűzése, BIP - sávok pixelenkénti összefésülése. Ha a kép egyetlen sávot tartalmaz, akkor a három tárolási mód között nincs különbség. BIL - sávok soronkénti összefésülése Az adatfile háromféle rekordtípusból állhat: elő (header), adat, utó (trailer) rekordból. Az elő, és az utó rekord nem létezik, általában csak az eredeti adatfileokban találjuk meg ezeket, míg a pixelértékeket az adatrekordok tartalmazzák. A soronként összefésült tárolási mód (BIL) esetén az adatrekordok egy sáv egy sorát tartalmazzák, oly módon, hogy ha m számú sorból és n számú oszlopból áll egy kép, akkor az első n byte hosszúságú adatrekord hordozza az első sáv első sorának adatértékeit, majd a következő rekordban a második sáv első sorát találjuk. Az m+1 rekordban van az első sáv 2 sora, stb. (ábra A része) 3 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás 2.ábra BIL (balra)és a BSQ

(jobbra) tárolási módszer BSQ - sávok egymás utáni, szekvenciális összefűzése, A sávszekvenciális tárolás (ábra B) minden sáv önállóan, a többi filetól elválasztva kerül az adatfileba. Emiatt e tárolási módnak számos előnye van: a, egy sávot könnyen lehet olvasni és megjeleníteni, b, több sávot különböző sorrendben is beolvashatunk. A Landsat TM sávokat BSQ formátumban tárolják, minden sávot EOF (end of file) jel választ el. Szalagos tárolás esetén a szalag végét három EOF jel jelzi, minden szalag elején van egy elő file, az adatrekordok elején nincsen elő rekord. BIP - sávok pixelenkénti összefésülése A sávok pixelenkénti összefésülése esetén a pixelek a sávok szerinti rendben követik egymást, vagyis az első sáv első sorának első pixelének az értékét a második sáv első sorának első pixelének az értéke követi 4 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás

Rectification - Képtranszformálás A képtranszformálás a digitális műholdfelvételek vagy a légifotók a szabálytalan földfelszín leképezései egy síkfelületre. Még a látszólag sík területekről készített felvételek is torzulnak a Föld görbülete és a szenzor fizikai tulajdonságai miatt. Ebben a fejezetben bemutatásra kerülnek azok a műveletek, melyekkel elvégezhető a kép geometriai korrekciója, a különböző időpontokban készített felvételek összevetése és a képek térképi tartalommal való feltöltése. A térképi vetületek a gömb, ill. szferoid (pl a Föld) felszínének síkvetületei A gömb síkba fejtése mindig valamilyen torzulást eredményez. Ezért minden térképi vetületi rendszert a vetület torzulási sajátosságai szerint csoportosítva beszélhetünk távolságtartó, szögtartó és területtartó vetületről. Például a területtartó vetületeken adott területű körök mindig azonos területű felszíni

területeket jelölnek. Bár a területek itt egyenlők, a területek alakjai, a szögek torzulhatnak. A vetületeken az adott hely pozícióját koordinátákkal adjuk meg. Minden vetületi koordináta rendszer átalakítható olyan hálózattá, amelyben a helyet X,Y (oszlop, sor) koordináták fejezik ki. A rektifikáció, vagy képtranszformáció olyan folyamat, melyben az egyik hálózat adatát, elemét áttranszformáljuk egy másik hálózatba, valamilyen n-ed fokú polinom segítségével. Az átalakítás során legtöbbször az új képelem (pixel) nem illeszkedik tökéletesen az eredeti hálózatra, az új pixelértéket egy egyértelmű hozzárendelési szabály alapján kell kiszámítani. Ezt a folyamatot átmintázásnak (resampling) nevezik. Gyakran előfordul, hogy egy területről több különböző műszerrel készített kép áll rendelkezésünkre. A pixelenkénti összehasonlításhoz a képeket azonos hálózatba kell vinni A képek átfedetéséhez nem

mindig szükséges a térképi koordináta rendszer. Ezt a kép a képhez (image to image) átalakítást hozzáillesztésnek (registration) nevezzük. Ha a képi adatokat vetületi rendszerhez illesztjük, és vetületi koordinátákkal látjuk el, akkor a folyamatot geokódolásnak (georeferencing) nevezzük. A képtranszformáció definíció szerint tartalmazza a geokódolást is. A kép a képhez átalakítás csak akkor lesz geokódolás, ha az a kép rendelkezik térképi koordinátákkal, amelyhez a többi képet illesztjük. Mikor alkalmazzuk a képtranszformációt? A képtranszformáció elkerülhetetlen azokban az esetekben, amelyekben a kép pixelhálózatát egy térképi vetületi rendszerhez, avagy egy másik képhez akarjuk illeszteni. A képillesztésnek több oka is lehet: * pixelenkénti változás vizsgálat * GIS adatbázis-fejlesztés * tanulóterületek kijelölése térképi koordináták alapján * méretarányos fotótérkép készítés * vektoradatok (pl.

ARC/INFO) alkalmazása * különböző méretarányú képek összehasonlítása 5 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás * távolság és területmérés * képek összeillesztése (mozaikolás) Az adatok transzformációja előtt ki kell választani az optimális vetületi és térképi koordináta rendszert az adatbázis elsődleges felhasználási céljának megfelelően. A választás előtt vegyük figyelembe a következőket: * Mekkora a térképezendő terület nagysága? * Hol helyezkedik el a földgömbön? * Milyen a kiterjedése a területnek? Más és más vetületi rendszert kell alkalmazni eltérő nagyságú, alakú területek esetén, valamint lényeges figyelembe venni, hogy pl. poláris, vagy ekvatoriális régióval dolgozunk-e? Mikor elégséges csak a geokódolás? A képtranszformációt nem szükséges elvégezni, ha a felvételen nincs torzulás, pl. ha a img file olyan térképlapról készült (letapogatóval,

vagy digitalizálással), amelynek a vetületi rendszere megfelelő. Ebben az esetben csak a megfelelő térképi koordinátákat kell a felvétel header-én (Image info) feltüntetni. A képtranszformáció hátrányai A képtranszformálás folyamán a transzformált pixel-értékeket át kell mintázni, hogy illeszteni tudjuk az új pixel-hálózatra. Bár az új értékeket kiszámító algoritmusok megbízhatóak, a transzformálás folyamán elveszhetnek bizonyos spektrális adatok. Ha az alkalmazás során nincs szükség a térképi koordinátákra és egységekre, akkor helyesebb elkerülni a képtranszformációt. Klasszifikáció és a transzformáció Egyes szerzők szerint érdemesebb a klasszifikációt a transzformálás előtt elvégezni, hiszen ebben az esetben az eredeti értékeken alapul a klasszifikáció. Másrészről ha GPS adatokat használunk illesztőpontoknak (GCP-nak), először elvégezhetjük a képtranszformálást, mivel ezek az adatok nagyon pontosak.

Tematikus térképek transzformálásakor csak a "legközelebbi szomszéd" eljárás alkalmas az átmintázására, és ez problémát jelenthet néhány alkalmazásnál. A képtranszformálás lépései Általában vonatkoztatási rendszer-nek nevezzük azt a hálózati- ill. koordináta-rendszert, amelyhez illesztjük az eredeti adatfile koordinátáit a képtranszformáció során. A képtranszformáció és a hozzáillesztés eljárásának általános lépései a következők: 1. A GCP-ok kiválasztása 2. A transzformáció mátrixának kiszámítása és tesztelése 3. Az output img file létrehozása A pixeleket át kell mintázni az új hálózathoz való illesztéshez. 6 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás Felszíni illesztési pontok (GCP) A felszíni illesztési pontok (GCP) egy olyan felvétel meghatározott pixelei, amelyhez a megfelelő térképi koordináták - és egyéb output koordináták - ismertek. A GCP

két (X,Y) koordináta párból állnak: * forrás koordináták - a transzformált felvétel adat file koordinátái * vonatkoztatási koordináták - azon térkép, vagy felvétel koordinátái, amelyhez a forrás felvételt hozzáillesztettük. A GCP megadása A helyes képtranszformáláshoz elengedhetetlen a GCP pontos megadása, mivel a transzformált kép összes többi pontja a GCP-ből extrapolálással áll elő. A képtranszformáció annál megbízhatóbb lesz, minél több szétszórt helyzetű pontot választunk a teljes felületről. A nagy méretarányú felvételeken választhatjuk GCP-nak pl. az útkereszteződéseket, repülőterek kifutópályáit, tornyokat, épületeket. Kis méretarányú képeken a nagyobb objektumok használhatók, mint pl. lakott területek, vagy geológiai formák, tereptárgyak Ne használjunk fel olyan felszíni jegyeket, amelyek idővel megváltozhatnak, mint pl. tavak partvonalát, egyéb vízfelszíneket, növényzetet, stb. A

következő lehetőségek állnak rendelkezésre a forrás és a vonatkoztatási GCP megadásához: * Ha a priori ismerjük a GCP-kat, akkor begépelhetjük a billentyűzetről. * Használhatjuk az egeret a kép a képhez illesztés során a forrás és a vonatkoztatási koordináták megadásához. * A digitalizáló tábla is felhasználható egy felvétel és a megfelelő eredeti térkép illesztéséhez. Digitalizáló tábla Amennyiben a GCP-at eredeti térképlapról digitalizáljuk pontos alaptérképeket kell használnunk. Különböző felbontású felvételekhez különböző méretarányú és vetítési rendszerű térképeket használunk. Pl 1:25000 térképek megfelelő alaptérképek a Landsat TM és a SPOT felvételek transzformálásához. Az 1:250000-nél kisebb méretarányú térképek használatát lehetőség szerint kerüljük el, ezek a durvább térképek a kevésbé finom felbontású felvételekhez használhatók (pl. AVHRR) Egér Az egérrel megadott GCP

esetén finomabb felbontású felvételeket illeszthetünk egymáshoz, mint pl. Landsat TM-et SPOT-hoz, viszont elkerülendő a Landsat MSS SPOT-hoz, illetve a Landsat TM légifelvételhez való illesztése. 7 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás A transzformáció szabályai A forrás file koordinátáinak transzformációjához polinomokat használunk. A felvétel torzultságától, a GCP számától és egymáshoz viszonyított elhelyezkedésétől függően összetett polinomok szükségesek a kellő transzformáció végrehajtásához. A kifejezések bonyolultságát a polinomok foka mutatja. A többtagú kifejezés legmagasabb kitevője adja meg a polinom fokát és a transzformáció fokát, pedig a polinom foka. Általában első- és másodfokú transzformációkat alkalmazunk. A transzformáció mátrixa A transzformáció mátrixát a GCP-ból számítjuk ki. A mátrix a koordináták konvertálásához használt polinom

együtthatóiból áll. A mátrix mérete a transzformáció fokától függ A transzformációs mátrix elemeinek - azaz a polinom együtthatóinak - kiszámításánál az a célunk, hogy a lehető legkisebb legyen a hiba a GCP vonatkoztatási koordinátáinak a forrás koordinátákba való transzformációjakor. Nem mindig lehetséges az együtthatókat úgy származtatni, hogy a hiba zérus legyen. Pl az 1 ábra szerint a GCP-at derékszögű koordinátarendszerben ábrázolva összehasonlíthatjuk a polinom alapján rajzolt görbe pontjaival 1. ábra Polinomiális görbe a forrás és a referencia koordinátarendszerben (X koordinátákra) Az összes GCP befolyásolja az együtthatókat, még ha nem is illeszkedik minden egyes GCP a polinom-görbére. A GCP vonatkoztatási koordináta és a görbe távolságát RMS hibának nevezzük. A transzformációs mátrix kiszámításához a legkisebb négyzetek regressziós módszert használják, amely ismert statisztikai eljárás.

Lineáris transzformációk Az első fokú transzformációt nevezzük lineáris transzformációnak. A lineáris transzformáció megváltoztathatja: * X és/vagy Y koordináta helyét * X és/vagy Y tengely mentén a méretarányt * eltolást X,Y * rotációt 8 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás Az elsőfokú transzformációkat a következő esetekben használjuk: nyers felvételek vet1tése térképi vetületre; térképi síkvetület konvertálása más síkvetületbe és amikor viszonylag kis méretű képterületet transzformálunk. A lineáris transzformációt még a GCP kijelölése előtt végezzük el. A Landsat TM felvételt újratájolhatjuk, a deklináció szögének megfelelően elforgathatjuk a letapogatott négyzet alakú területet és beállíthatjuk a felvételt úgy, hogy az északi irány függőlegesen felfelé mutasson. A elsőfokú transzformációt síkra vetített adatok transzformálására is használhatjuk.

Pl a SPOT és a Landsat Level 1B adatai már síkba transzformáltak, de még nem a kívánt vetületi rendszerbe. Amikor ezt a fajta transzformációt végezzük, és elsőre magas az RMS hiba, akkor nem tanácsos a transzformáció fokát növelni. Ilyen esetben először vizsgáljuk meg a GCP-et és ezek eloszlását, majd szisztematikusan küszöböljük ki a hibát. A 2. ábrán tanulmányozhatjuk, hogy miként változtatja meg a lineáris transzformáció az adatainkat. 2. ábra Lineáris transzformációk eredményei Az elsőfokú transzformáció mátrixa hat együtthatót tartalmaz - mindkét (X,Y) koordinátához három tartozik: a1 a2 a3 b1 b2 b3 amelyekkel az elsőfokú polinom a következőképpen áll elő: x0=b1+b2xi+b3yi y0=a1+a2xi+a3yi 9 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás ahol: xi és yi a forrás koordináták (input) x0 és y0 a transzformált koordináták (output) Nemlineáris transzformációk A másod- vagy

magasabb fokú transzformációk nemlineáris transzformációk. Ezekkel a transzformációkkal korrigálhatjuk a nemlineáris torzulásokat. A 3 ábra néhány nemlineáris transzformáció hatását mutatja. 3. ábra Nem-lineáris transzformációk eredményei A másodfokú transzformációkkal lehet nagy kiterjedésű területek szélességi/hosszúsági adatait síkvetülethez konvertálni (a kamera lencséjének torzítása eredményezi a torzult adatokat). Harmadfokú transzformációval torzult légifényképeket, radarfelvételeket korrigálnak. Negyedfokú transzformációk erősen torzult légifényképek esetén használatosak. A t-ed-fokú transzformáció mátrixa elemeinek számát a következő összefüggés adja meg: t+1 2Σ i i=1 Egyszerűbben kifejezve: (t+1) x (t+2) Magasabb fokú polinomok A t-ed-fokú transzformációt általánosan a következő egyenlet adja meg: 10 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás ahol: ak

és bk együtthatók t a polinom foka i és j kitevők, k értékét pedig a következőképpen számíthatjuk ki: Az egyenlet y0-ra ugyanilyen alakú, csak az együtthatók különböznek. A következő példa egy harmadfokú transzformáció egyenleteit adja meg: x0=5+4x-6y+10x2-5xy+1y2+3x3+7x2y-11xy2+4y3 y0=13+12x+4y+1x2-21xy+11y2-1x3+2x2y+5xy2+12y3 E két egyenlet összesen 20 együtthatót használ, azaz (3+1) x (3+2)=20 A transzformáció fokának következményei A magasabb fokú polinomokkal bonyolultabb képtranszformációkat hajthatunk végre. A különböző fokú transzformációk hatásának jobb megértése érdekében vizsgáljuk meg néhány eltérő fokú egyenlet eredményét. Az alábbi példákban csak az egyik koordinátát (X) számoljuk ki, és kevesebb GCP-t használunk, mint a gyakorlati alkalmazásoknál! A példában szereplő együtthatók a legkisebb négyzetek módszerével számíthatók. Feltételezzük, hogy a GCP X koordinátái a következők: 11

Phare HU0008-02 SZTE – Térinformatika Forrás X (input) Dr. Mucsi László: Képfeldolgozás Ref. X(output) 1 17 2 9 3 1 Ezen GCP X koordinátájára az elsőfokú transzformáció egyenlete: xr=(25)+(-8)xi ahol: xr = ref. koordináta xi = forrás koordináta A 4. ábrán látható e lineáris kapcsolat grafikus ábrázolása 4. ábra 1-fokú transzformáció, a forrás és a referencia koordináták kapcsolata 1-fokú Mi történik, ha a második értéket a következőképpen változtatjuk meg? Forrás X (input) Ref. X(output) 1 17 2 7 3 1 12 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás 5. ábra 1-fokú transzformáció, a forrás és a referencia koordináták kapcsolata 1-fokú, a 2 GCP megváltozott Ez a pont nem illeszkedik az egyenesre, a kapcsolat nem fejezhető ki elsőfokú polinommal. Másodfokú polinomra van szükség: xr=(31)+(-16)xi+(2)xi2 A 6. ábrán látható a kapott görbe grafikonja 6. ábra 2-fokú

transzformáció, a forrás és a referencia koordináták kapcsolata 2-fokú Vegyünk számításba még egy GCP-t: Forrás X (input) Ref. X(output) 1 17 2 7 3 1 4 5 13 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás Látható, hogy a negyedik GCP nem illeszkedik a másodfokú görbe grafikonjára. Ahhoz, hogy minden a négy pont illeszkedjen egy grafikonra, a transzformáció harmadfokú kell legyen (7. ábra) 7. ábra 2-fokú transzformáció, a forrás és a referencia koordináták kapcsolata 2-fokú, 4 GCP-t adtunk hozzá Ez a harmadfokú transzformáció már szükségtelen bonyodalmakat okozhat. Elvégezve a koordináta transzformációkat, az összes GCP tökéletes illeszkedése érdekében megkövetelt nagy pontosság viszont váratlan torzulásokat eredményezhet az output felvételen. Ebben a példában a harmadfokú transzformáció túl magas lenne, mert az X irányú output pixelek átrendeződnének az input pixelekhez

képest. 8. ábra 3-fokú transzformáció, a forrás és a referencia koordináták kapcsolata 3-fokú Forrás X (input) Ref. X(output) 1 x0(1)=17 2 x0(2)=7 3 x0(3)=1 4 x0(4)=5 x0(1)>x0(2)>x0(4)>x0(3) 14 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás 17 > 7 > 5 > 1 Ebben az esetben a magasabb fokú transzformáció nem a kívánt eredményt adná. 9. ábra 3-ad fokú transzformáció hatása a képelemekre Hány GCP-re van legalább szükség? A magasabb fokú transzformációkkal bonyolultabb torzulási problémák küszöbölhetők ki. Magasabb fokú transzformációkhoz azonban több GCP-re van szükség. Pl három pont határoz meg egy síkot, ezért egy elsőfokú transzformációhoz - amelyet egy sík egyenletével fejezünk ki - legalább három GCP-re van szükség. Ugyanígy, egy harmadfokú transzformációt a paraboloid egyenlete ad meg, tehát legalább hat GCP-t kell kiválasztanunk. A t-ed-fokú

transzformációhoz szükséges legkevesebb pont számát a következő formula adja meg: ((t+1)(t+2)) 2 Amennyiben lehetséges több, jól szétszórt GCP-t használjunk, mint ez a minimum érték! Az alábbi táblázat a minimálisan szükséges GCP-ok számát mutatja: Transzformáció foka Minimum GCP száma 1 3 2 6 3 10 4 15 5 21 6 28 7 36 8 45 9 55 10 66 15 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás GCP előrejelzés és illesztés Az automatikus GCP előrejelzéssel bármely koordináta rendszerben GCP-kat jelölhetünk ki, és automatikusan elhelyezhetjük őket egy másik rendszerben a kívánt transzformációs paraméterek alapján. Az automatikus GCP illesztés a kép a képhez transzformációt segíti. Az adatok spektrális karakterisztikáját és a transzformációs mátrixot felhasználva a felvételen kiválasztott GCP-t precízen illeszthetjük a transzformált képéhez egy másik felvételen. Az RMS

hiba A legtöbb esetben az összes GCP nagyon pontos illesztése szükségtelenül magas fokú transzformációt követelne. A fokszám növelése helyett megengedhetünk egy bizonyos nagyságú hibát. A kiszámolt transzformációs mátrix inverze visszatranszformálja a GCP referencia koordinátáit a forrás koordináta rendszerbe. Amennyiben a transzformáció fokát nem növeltük addig, hogy tökéletes legyen a pontok illeszkedése, a visszatranszformálás során kapott koordináták és a forrás koordináták között eltérés lesz tapasztalható. Az RMS hiba (root mean square) a GCP input helyének és a visszatranszformálás utáni helyének távolságát fejezi ki: RMS - hiba= ( xr - xi )2 +( yr - yi )2 ahol: xi és yi az input forrás koordináták xr és yr a visszatranszformált koordináták Amennyiben a forrás koordináták az adat file koordinátái, akkor az RMS hiba pixel szélességben mért távolságot jelent. Pl 2 RMS hiba azt jelenti, hogy a referencia

pixel 2 pixel távolságra van a visszatranszformált pixeltől. Maradékok és RMS hiba GCP-kre A maradékok a forrás és az visszatranszformált koordináták közötti távolságokat jelentik valamely (X vagy Y) irányban. Minden GCP-re kiszámítandók RMS hiba GCP-onként A pontonként kiszámolt RMS hiba a GCP-ok értékelését segíti. Kiszámítása ugyancsak egy távolság összefüggéssel történik: 16 Phare HU0008-02 SZTE – Térinformatika Ri = Dr. Mucsi László: Képfeldolgozás 2 2 XRi + YRi ahol: Ri = a GCPi RMS hibája XRi= a GCPi X reziduuma YRi= a GCPi Y reziduuma A 10. ábra az RMS hiba és a maradék közötti kapcsolatot mutatja 10. ábra Maradékok és az RMS pontonként Az összesített RMS hiba A következő formulák adják meg az összesített RMS hibát, az X RMS, és az Y RMS hibát: ahol: Rx = X irányú RMS hiba Ry = Y irányú RMS hiba T = összesített RMS hiba n = GCP-ok száma XRi = GCPi X irányú maradék YRi = GCPi Yirányú

maradék 17 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás Az RMS hiba toleranciája A legtöbb esetben a magasabb fokú transzformáció helyett egy bizonyos nagyságú hibát még a tűréshatáron belülinek veszünk. A tolerált RMS hiba nagysága egy a forrás koordináta körüli tartományként képzelhető el, amelyen belül a visszatranszformált koordinátát még jónak fogadjuk el. A 11 ábra 2 toleranciájú RMS hiba-tartományt mutat be 11. ábra RMS hiba toleranciájának vizsgálata Az eltűrhető RMS hibát meghatározza, hogy milyen célra használjuk fel az adatállományunkat, a felhasznált adatok típusától, a GCP-ok pontosságától, és a kiegészítő adatok pontosságától. Pl a GPS 10 m-es pontosságú adatot szolgáltat a GCP-ok kijelöléséhez, míg a 1:25000-es térkép-ről csak 20 m-es pontossággal vehetjük le a GCP-kat. Lényeges, hogy az RMS hiba pixelben van kifejezve, így ha egy Landsat TM felvétel

képtranszformációjának pontosságát 30 m-re választjuk, akkor az RMS hiba nem haladhatja meg a 0.50 értéket AVHRR adatok transzformációjánál 150 lehet a hiba Az RMS hiba kiértékelése A felvétel ill. térkép torzulása alapján a szükséges transzformáció foka meghatározható Általában elsőfokú transzformációval érdemes kezdeni, és a transzformációs mátrixot addig kell újra és újra kiszámolni, amíg az RMS tűrési hibahatáron belülre nem kerülünk. A legtöbb képtranszformációs eljárás első- vagy másodfokú. Minél magasabb fokú a transzformáció, annál komplikáltabb az egyenletünk, és annál kevésbé szabályszerű és megjósolható az eljárás végeredménye! A transzformációs mátrix és az RMS hiba kiszámítása után minden esetben négy lehetőségünk van a továbblépésre: * A legnagyobb RMS hibával bíró GCP-ot - feltételezve, hogy ez a legkevésbé pontos - iktassuk ki, és a maradék GCP-okból számoljuk újra a

transzformációs mátrixot. Az illeszkedés pontosabb lehet, kivéve ha ez a kimaradó GCP a felvétel egy speciális részterületének csak egyetlen GCP-ja, mert egy ilyen pontnak a kihagyása akár nagyobb hibát is eredményezhet. * Vegyük nagyobbra a hibahatárt, ha még lehetséges. 18 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás * Növeljük a transzformáció fokát, amellyel összetettebb geometriai átalakítást végzünk a felvételen. * Csak azokat a pontokat választjuk ki, amelyek a legmegbízhatóbbak. Átmintázási (újramintavételezési) módszerek A képtranszformációs/hozzáillesztési folyamat következő lépése az output file létrehozása. Mivel az input felvétel pixel-hálózata ritkán illeszkedik a referencia kép hálózatára, így ki kell számolni, hogy milyen intenzitás értéket kapjon az output felvétel megfelelő pixele. Ezt az eljárást nevezzük átmintázásnak. 12. ábra Átmintázás lépései

Általában a következő átmintázási módszerek használatosak: * Legközelebbi szomszéd (nearest neighbor) - Az output pixel értékének a legközelebbi pixel intenzitás értékét választjuk. * Bilineáris interpoláció - a környező négy pixel intenzitás értékeiből bilineáris interpolációval számítjuk az output értéket. * Köbös konvolúció (cubic convolution) - kétváltozós, harmadfokú polinomot illesztünk a pont 4x4-es környezetére. 19 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás Legközelebbi szomszéd (nearest neighbor) Egy output pixel legközelebbi szomszédjának meghatározásához a pixel transzformált (x0,y0) koordinátáit a transzformációs mátrix inverzének felhasználásával visszatranszformáljuk az eredeti (forrás) koordináta rendszerbe (xr,yr).Az a pixel lesz a legközelebbi szomszéd, amelynek a távolsága a legkisebb a visszatranszformált (xr,yr) koordinátától. E pixel intenzitás

értéke lesz az output felvétel képpontjának keresett értéke. 13. ábra A Legközelebbi szomszéd hozzárendelés Legközelebbi szomszéd átmintázás Előnyök Hátrányok Az eredeti értékek átlagolása nélkül történik az átvitel, így nem vesznek el az extrém és finom értékek. Ez lényeges pl.a vegetációtípusok elkülönítésénél; határok, élek kijelölésénél; vagy egy tó eltérő hőmérsékletű ill. átlátszóságú területeinek meghatározásánál. Amennyiben ezt a módszert alkalmazzuk nagyobb hálózat kisebbre történő átmintázásához, a ferde vonalak és a görbék általában kissé lépcsősen eltolódva jelennek meg. A klasszifikáció előtt használható. Bizonyos adatok elveszhetnek, ill. mások megduplázódhatnak. A legkönnyebben és leggyorsabban Folyamatos lineáris objektumok kiszámolható a három módszer (utak, vízfolyások) töredezetten, közül. szakaszosan jelenhetnek meg. A legközelebbi szomszéd módszer

további előnye, hogy alkalmazható kvalitatív (nominális, ordinális) adatokra is a kvantitatív (intervallum, hányados) típusúakon túl, míg a másik két módszer átlagoló eljárása csak kvalitatív értékekre működik. 20 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás Bilineáris interpoláció A bilineáris interpoláció végrehajtásánál a transzformált pixel intenzitás értéke a visszatranszformált koordinátához legközelebb eső négy input pixelértékből számítható ki. A 14. ábrán látható példában a szomszéd pixeleket az 1,2,3 és 4 számok jelzik, amelyek értékei az adatfile-ben adottak, kiszámolandó az r koordináta intenzitás értéke (Vr). 14. ábra A bilineáris interpoláció hozzárendelési elve Vr kiszámításához először határozzuk meg lineáris interpolációval Vm-et és Vn-et (14. ábra) Az m pontban a Vm intenzitás érték függvénye a 3 és 1 pixelek intenzitás értéke

megváltozásának, azaz (V3-V1)-nek. 15. ábra Lineáris interpoláció 21 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás A Vm kiszámolható a következő összefüggésből: Vm= [ ahol: Yi = Vi = dy = D = V 3 -V1 ]xdy + V 1 D az i-edik pixel Y koordinátája az i-edik pixel intenzitás értéke az input koordináta rendszer Y1 és Ym koordinátáinak távolsága az input koordináta rendszer Y1 és Y3 koordinátáinak távolsága Vegyük észre, hogy a (V3-V1/D) az ábra egyenesének meredeksége, azaz a fenti egyenlőség y=mx+b alakú (az egyenes általános egyenlete). Hasonlóan Vn-re: Vn= [ V 4 -V 2 ]xdy + V 2 D A visszatranszformált koordináta r(xr,yr) intenzitás értéke a Vn és Vm értékekből ugyanígy meghatározható: Vr= [ V n -V m ]xdx + V m D A legtöbb esetben D=1, mivel az adat file koordinátáinak növekménye 1. A bilineáris interpoláció kifejezésére gyakran használják az alábbi egyenletet: V r = ∑

wi V i ahol: wi = súlyfaktor A fenti egyenlőség kifejezhető a következő formában is, ahol a wi kifejtve látható: 4 (D - ∆ x i )(D - ∆ y i ) 1 D Vr= ∑ 2 xV i ahol: Dxi = az i-edik pixel (xr,yr) koordinátáinak X irányú változása Dyi = az i-edik pixel (xr,yr) koordinátáinak Y irányú változása Vi = az i-edik pixel értéke D = az input koordináta rendszer pixeleinek távolsága A négy pixel közül az szerepel nagyobb súllyal, amelyik közelebb van (xr,yr)-hez. 22 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás Bilineáris interpoláció átmintázás Előnyök Az output képen simítást eredményez a módszer, a vonalak nem törnek meg. Hátrányok Mivel a pixel értékeket átlagolja az algoritmus, az élek és határok kevésbé kivehetőek, néhány extrém érték elveszhet, s így a kontrasztjából veszíthet a kép. Térbeli hatásában pontosabb, mint a legközelebbi szomszéd. Gyakorta használatos ez a

módszer, amikor a cellák méretét változtatjuk, pl. SPOT/TM egyesítésnél, 2x2-es átmintázási határon belül. Köbös konvolúció A köbös konvolúció hasonló a bilineáris interpolációs módszerhez, az eltérés csak annyi, hogy: * 16 pixelt 4x4-es elrendezésben használ az output intenzitás érték meghatározásához, és * harmadfokú polinomot illeszt a visszatranszformált pont 4x4-es környezetére. A visszatranszformált (xr,yr) koordináta környező 16 pixelének (16. ábra) kijelöléséhez a (i,j) pixelt használjuk: i=int(xr) j=int(yr) 23 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás 16. ábra A köbös konvolúció Mivel harmadfokú függvényt illesztünk a 16 input pixelre, az (xr,yr) ponttól távolabb eső pixeleknek exponenciálisan kisebb a súlyuk az output érték kialakításában, mint a közelebb eső pixeleknek. Az alkalmazott függvény megtalálható: Atkinson 1985 Köbös konvolúció átmintázás

Előnyök Hátrányok Az output pixel értékek átlaga és szórása közelebb van az input pixel értékek átlagához és szórásához, mint a másik két módszernél. Az értékek módosulhatnak. Az eljárás egyszerre képes élesíteni a felvételt és kiszűrni a zavaró értékeket. az aktuális hatás mindig az adott értékektől függ. A leginkább számításigényes átmintázási módszer, s így a leglassabb is. A módszer főként akkor ajánlott, ha az elemi cellák méretét lényegesen meg kell változtatnunk, pl. TM/légifénykép illesztésnél (4x4-es ablakkal pontosabb az illesztés, mint egy 2x2-es ablakkal). 24 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás Koordináta transzformáció térkép a térképhez illesztés esetén *A térképek síkvetületi rendszerének megváltoztatása többféle ok miatt szükségessé válhat: * Ha két különböző vetületi rendszerű térképet fedetünk egymásra. * Ha az

alapadat file vetítése nem a kívánt tulajdonságú térképet eredményezi. * Ha egynél több vetületi zónából származó adatokkal kell dolgoznunk. Pl UTM, vagy State Plane. A vetület megváltoztatása geometriai átalakítás - távolság, terület, méretarány különböző lehet -, ezért a konverziós eljárásnál a pixelek átmintázása elkerülhetetlen. Az átmintázással azonban az adatok spektrális integritása sérülhet. Így nem mindig célravezető a már átmintázott adatokat újramintázni, ha az alkalmazásnál az intenzitás értékek pontossága elengedhetetlen. Ha az eredeti transzformálatlan adatokkal dolgozunk, általában jobban tesszük, ha már eleve a kívánt (másodlagos) térképi vetülethez transzformáljuk az adatainkat, minthogy a transzformált adatok újabb (második) átmintázásával az adatok egy "generációját" elveszítsük. Vektor adatok A vektoros térképi koordináták transzformációja lényegesen egyszerűbb,

mint a raszteres adatoké, mivel a vektoradatok pontkoordinátáit a megfelelő formula segítségével egyszerűen transzformálhatjuk. Mozaik Az azonos vetületi rendszerbe korrigált képeket összeilleszthetjük. A tetszőlegesen kiválasztott referenciaképhez viszonyítva elhelyezkedik el a többi kép. A képek összeillesztésénél az alábbi problémákra kell megoldást találni: a, az új hálózatban a pixelértékek kiszámítási módjának megadása, b, a közös, átfedett területek pixelértékeinek számítása a korábbi értékekből, c, kontraszt kiegyenlítés a teljes képre, vagy csak a közös területekre 25 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás 3.ábra 3 db összemozaikolt kép egy ERDAS Viewer-ben a, Az új képen, az egyedi kép korrekciójához hasonlóan, a korábbitól eltérő négyzethálót kell kialakítani, hiszen az összeillesztéskor felhasznált képek oszlop-sor hálórendszerei nagyon ritkán

illeszkednek pontosan egymáshoz, és új képen viszont csak egyfajta, egységes háló létezhet. Az új pixelérték kiszámítási módja lehet (1) a legközelebbi szomszéd módszere, (2) bilineáris interpoláció, és (3) köbös konvolúció. Ezek részletes ismertetésére a geometriai korrekció c. fejezetben került sor b, A közös, átfedett területek pixelértékeinek számítása a korábbi értékekből többféleképpen történhet. Két vagy több kép közös, átfedett területén belül az új pixelérték lehet a pixelértékek maximuma, minimuma, átlaga. Az egymást fedő képek esetén választhatjuk az utoljára sorra kerülő, - legfelső - , kép pixelértékét. Az új pixelértéket úgy is kiszámíthatjuk, hogy figyelembe vesszük azt, hogy az eredeti pixelek milyen területi arányban képviseltetik magukat az új pixel kialakításakor, és ezekkel a súlyokkal számított súlyozott átlagból képezzük az új pixelértéket. c, A kapcsolódó

képek eltérő kontrasztúak lehetnek. A kontrasztkülönbségek jelentősek lehetnek légifelvételek esetén a sugárzás eltérő visszaverődése miatt a képek szélein vagy a teljes képen. Ezért az éles határok kiküszöbölése érdekében alkalmazhatjuk a hisztogramok illesztésének módszerét a teljes képre vagy csak az átfedett területekre. 26 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás Képfinomítás Amíg a radiometrikus finomítás minden pixelt önállóan kezelt, addig a térbeli finomítás a pixel értékét aszerint változtatja meg, hogy milyen értéket vesznek fel a szomszédos pixelek. A térbeli finomítás során nagy szerepet kap az un térbeli gyakoriság, mely kifejezi, hogy mekkora a különbség a legkisebb és a legnagyobb pixelérték között a pixelek egy halmazára vonatkoztatva. Jensen (1986) szerint a térbeli gyakoriság a „fényességi értékek adott távolságon belüli különbségét jelenti

a kép bármely részletére kiszámítva”. Eszerint a, nulla térbeli gyakoriság- olyan kép, amelyben minden pixelérték egyforma, b, alacsony térbeli gyakoriság - a pixelértékek folyamatosan változnak, c, nagy térbeli gyakoriság - a kép sakktáblaszerűen tartalmaz alacsony és magas értékű pixeleket. Konvolúciós szűrő A konvolúciós szűrés a pixelek általában kis halmazára értelmezett kép-átalakítási folyamat, mely megváltoztatja a térbeli gyakorisági tulajdonságait. A konvolúciós szűrést egy konvolúciós kernel, mátrix végzi. Az általában páratlan számú oszlopot és sort tartalmazó (2k+1 * 2k+1) mátrix elemeit koefficienseknek, együtthatóknak nevezzük. A konvolúciós kernelt úgy használjuk a szűrés során, hogy a kép minden egyes pixele egyszer a kernel közepére kerül és ennek a pixelnek az új értéke az önmaga és a szomszédos pixelek értékeiből a mátrix együtthatóival képzett súlyozott átlaga lesz. A

konvolúciós formula A következő formula határozza meg általános értelemben a kimenő adatfile értékét a szűrés után a bemenő, a kernel közepén elhelyezkedő pixelre vonatkozóan: ahol fij = a konvolúciós kernel i sorának j oszlopában lévő együttható dij = a pixel értéke q = a kernel mérete, négyzet alakú kernelt feltételezve F = vagy az együtthatók összege, vagy 1, ha az összeg 0 V = a kimenő pixel érték Amennyiben a kimenő pixelérték nullánál kisebb, akkor a V értéke 0 definíció szerint. 27 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás Nulla-összegű kernelek Nulla-összegűnek nevezünk egy kernelt, ha a benne lévő együtthatók összege nulla. Amennyiben nulla összegű kernelt használunk az együtthatók összegét nem használhatjuk a konvolúciós formulában. A nullával való osztás miatt az F értéke ebben az esetben 1 lesz Emiatt a kimenő érték: • 0 olyan területen, ahol minden

bemenő érték azonos, • kicsi, ha a térbeli gyakoriság alacsony, • nagy, ha a térbeli gyakoriság magas. Ezért a nulla-összegű kerneleket élkiemelőknek nevezzük. Alacsony térbeli gyakoriságú területeken a pixelértékeket kisimítja vagy nullává változtatja, és éles határt jelöl ki ott, ahol a térbeli gyakoriság magas, vagyis két homogén pixelhalmaz közé. A nulla-összegű kerneleket megadhatjuk úgy, hogy bizonyos irányú határokat jelöljenek ki. A következő 3x3-as kernel a déli határt jelzi: -1 1 1 -1 -2 1 -1 1 1 High frequency kernelek A high frequency kernelek, vagy a high pass kernelek hatására megnő a térbeli gyakoriság. A high frequency kernelek mint edge enhancer megerősítik a homogén területek közötti határokat. Amíg az élkiemelő (mint a nulla-összegű) kernelek úgy emelik ki a határt, hogy a többi formát eltüntetik, addig a high pass kernelek meghagyják azokat. Pl. -1 -1 -1 -1 16 -1 -1 -1 -1 Ez a kernel a

környezetéhez képest alacsony értékű pixelt tovább csökkenti, illetve a környezetéhez képest magas pixelértékű pixel még nagyobb lesz, vagyis a térbeli gyakoriság tovább nő. 204 201 198 200 100 200 197 209 210 204 201 198 200 9 200 197 209 210 28 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás előtte 64 61 58 60 125 60 előtte utána 57 69 70 64 61 58 60 57 187 69 60 70 utána Low-frequency kernelek A low-frequency kernelek, vagy low-pass kernelek csökkentik a térbeli gyakoriságot. 1 1 1 1 1 1 1 1 1 A fenti kernel átlagolja a pixelértékeket, így a térbeli különbségek csökkennek, a térbeli homogenitás nő. A kép finomabb lesz A folyamatos rétegek konvolúciós szűréséhez hasonló a tematikus rétegek filterezése. A szűrés itt is a középen elhelyezkedő pixelt körülvevő szomszédos pixelek értékei alapján történik, ezért nevezik szomszédsági elemzésnek is. A szomszédos pixelek

halmazát egy pásztázó ablak alapján adhatjuk meg, mely lehet kör, ellipszis, négyzet vagy akár szabálytalan alakú is. A pixelértékeken végrehajtott műveletet focal operationnak nevezzük A tematikus rétegből új tematikus réteg jön létre az alábbi műveletek szerint: a, határ - kijelöli az osztályok közötti határokat. A kimenő réteg csak a határon lévő pixeleket tartalmazza. b, sűrűség - a kimenő pixelérték jelzi, hogy a középen elhelyezkedő pixel értéke hányszor fordul elő a pásztázó ablakon belül. Méri a homogenitást az elemzett pixel szerint Gyakran használják a vegetáció korona zártságának becslésére. c, diverzitás - a kimenő pixelérték megadja a pásztázó ablakon belüli különböző osztályok számát. A diverzitás méri a heterogenitást d, majoritás - a kimenő pixelérték megadja a pásztázó ablakon belül legtöbbször jelenlévő osztály értékét. A művelet valójában egy low-frequency filter, amely

kiszűri a „sószórás” szerű foltokat a képről. e, maximum - a kimenő pixelérték a pásztázó ablakon belüli legnagyobb osztály értéke lesz. Ezzel a módszerrel lehet emphasize classes with the higher class values, vagy a lineáris alakzatokat és a határokat el lehet tüntetni. 29 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás f, átlag - átlagolja a pixelértékeket. Amennyiben a pixelértékek mennyiségi adatokat jelentenek, akkor ez a szűrő egy konvolúciós szűrő. Minőségi adatokra (nominális és rang típusokra) nem alkalmazható. g, médián - az ablakon belüli pixelek statisztikus e rendeli a középső pixelhez. Használható kvantitatív és kvalitatív adatokra is. h, minoritás - a kimenő pixelérték megadja a pásztázó ablakon belül legkisebb számban jelenlévő osztály értékét. Ez a módszer alkalmas a legritkábban előforduló osztályok azonosítására, valamint a különálló lineáris

alakzatok kijelölésére. i, rang - megadja a középső pixel értékénél kisebb pixelértékű pixelek számát. j, szórás - az ablakon belüli pixelek értékeinek a szórását határozza meg és rendeli a középső pixelhez. k, összeg - a középső elem értéke az ablakon belüli pixelek értékeinek összege lesz. Amennyiben az osztályok közötti sorrend megállapítható, akkor az összegzés a pixelek további rangsorolását teszi lehetővé. Vonal felismerés Lineáris vonalfelismerés Vonalszerű alakzatok, mint pl. folyók vagy utak a műholdfelvételeken két éles határvonallal lehatárolhatók, ha egy pixelnél szélesebben, de egy pixel széles alakzatok is felismerhetők a következő kernelek segítségével: -1 2 -1 -1 2 -1 -1 2 -1 -1 -1 -1 2 2 2 -1 -1 -1 -1 -1 2 -1 2 -1 2 -1 -1 2 -1 -1 -1 2 -1 -1 -1 2 függőleges vízszintes átlós átlós A megfelelő vonalfelismerő kernel választásához szükséges tudnunk, hogy milyen típusú vonalak

vannak a képen és általában ismerni kell ezen típusok sajátosságait. A digitális képeken megkülönböztetünk: lejtős határvonalat, éles (lépcsős) határt, széles vonalat, keskeny vonalat. 30 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás lejtős határvonal - a két homogén, de különböző értékű terület között fokozatos az átmenet, alacsony értékű terület felől a pixelértékek fokozatosan nőnek a nagyobb pixelértékű terület irányában. A lejtőszerű alakzat leírásakor megadható a „lejtő magassága” - a pixelértékek változásának mértéke, a lejtő szélessége pixelekben, és a lejtő középpontja. éles (lépcsős) határ - olyan lejtős határ, ahol a lejtő meredeksége 90°. széles vonal - a vonal mindkét oldalán enyhe vagy meredekebb lejtővel rendelkezik, a vonal szélessége kisebb mint a kernel oldalhossza. keskeny (tetőszerű) vonal - a vonal egy-két pixel szélességű. A

modellek az elméleti, ideális határvonalakat mutatják be. A valós adatok esetében a határátmenetek nem ilyen finomak, ill. élesek, a pixelértékek kisebb-nagyobb ingadozásokkal érik el a másik területre jellemző értéket. 31 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás Az élfelismerő algoritmusok között vannak első- és másodrendű derivált műveletek. A következő ábra mutatja a lejtős határvonal és a keskeny vonal intenzitásgörbéit, valamint a hozzájuk rendelhető első- és második deriváltakat. Az elsőrendű derivált kernel az egyszerű Prewitt kernelből származik: A másodrendű derivált kernel a Laplace operátorból származik: Nem-lineáris és szemilineáris vonalfelismerés A fenti vonalfelismerő kerneleket lineárisnak neveztük, mert lineáris matematikai operációval végezte a képi adatok konvolúcióját. Számos nemlineáris felismerő kernel készíthető. 3x3-as kernelben az

általános leírásuk: A1 B1 C1 A2 B2 C2 A3 B3 C3 32 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás Egy nemlineáris vonalfelismerő algoritmus (Rosenfeld-Thurston, 1971) felismeri a B2 pixelt, mint egy függőleges, sötét vonal részét, ha A i, C i > B i. Hasonló definíciókkal megadhatunk más irányú vonalfelismerőket, amelyek környezetükhöz képest nagyobb pixelértékű vonalakat ismerik fel. Vandenburg (1976) definiálta az általa szemilineárisnak nevezett felismerőket. B2 egy függőleges sötét vonal része, ha 3 ΣA i=1 3 i és 3 ΣC > ΣB i i=1 i i=1 Gurney (1980) megjegyezte, hogy a szemilineáris felismerők hatékonyabbak, mint a nemlineáris felismerők. További feltételek adásával a szemilineáris felismerők hiányosságai (vonalelvékonyítás, hosszabb számolás) megszüntethetők: A2 > B2 és C2 > B2 . Általános konvolúciós szűrők A simító, az él és a vonal kiemelő szűrők

együttes alkalmazásával további általános térbeli szűrőt tudunk definiálni. A kernel méretének a növelésével nemcsak a 4 fő irány szerinti vonalas alakzatokat ismerhetjük fel hanem egyéb irányúakat is. Térképi műveletek - térképi algebrák Térképi algebráknak nevezzük általános értelemben a két vagy több bemenő kép megfelelő pixeleivel végrehajtható matematikai műveleteket, melyek eredménye egy újabb kép lesz. Pl (infravörös sáv) - (vörös sáv), másképpen DNir(x,y) - DNr(x,y) művelet alkalmas a vegetáció jelenlétének kimutatására. Bonyolultabb kifejezéseket is értelmezhetünk, mint pl. a Tasseled Cap számítás, mely a Landsat TM 6 sávját is felhasználja a számításban. Hányados is képezhető, pl. TM5/TM7 (agyagásvány index) A normalizált vegetációs index (NDVI) kivonás, összeadás, és osztás után jön létre: 33 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás

(IR-R)/(IR+R) Egyszerű trigonometrikus függvények is használhatók, pl. a következő számítással a pixelértékeket egy 0-255 intervallumba transzformálhatjuk: DN out : 162.34(atan(DN1xy)/(DN2xy)) Tasseled Cap számítás A multispektrális űr- és légifelvételek különböző sávjait megjeleníthetjük, ha definiálunk egy N-dimenziós teret, ahol N a sávok száma. Az N-dimenziós teret, ha a sávok a különböző spektrális tartományokat jelentik, N-dimenziós spektrális (adat)térnek nevezzük. Minden pixelt a sávok szerinti pixelérték alapján (N db koordináta) pozícionálhatunk ebben a térben. A pixelek spektrális térbeli pozícióját a pixel által reprezentált földrajzi területegység reflektancia, abszorpciós tulajdonságai határozzák meg. Az adatok ebben az N-dimenziós térben elemezhetők, struktúrájuk vizsgálható (lásd a Klasszifikáció c. fejezetben) Az adatstruktúra térbeli határait többféleképpen meghatározhatjuk, a

befoglaló test lehet téglatest, gömb, ellipszoid, mind természetesen ebben az N-dimenziós térben értelmezve (pl. hiperellipszoid) Ezen testek főátlói nem szükségszerűen illeszkednek az adattér tengelyeire. E sajátosság jobb megjelenítése érdekében előnyösebb, ha az N-dimenziós teret kifeszítő tengelyeket forgatjuk úgy, hogy egy vagy két adatstruktúra tengely illeszkedjen a képi megjelenítő X és Y tengelyére. Így láthatóvá válhat az a tengely, ahol az abszorpciós csúcsok legjobban kifejezik a speciális vizsgálat szempontjából fontos tulajdonságokat. Pl geológiai, növénytani szempontból érdekesek lehetnek a különböző abszorpciós tulajdonságok. Tasseled Cap transzformáció megadja a lehetőséget az adatok jobb megjelenítésére, pl. a vegetáció vizsgálata érdekében Az első ilyen transzformációt Landsat MSS négysávú képekre alkalmazták (Kauth-Thomas, 1976). A négydimenziós spektrális térben az általuk vizsgált

terület „talajait” reprezentáló pixelek egy hosszan elnyújtott ellipszoidban helyezkedtek el. Ha kiválasztottak két sávot, akkor az ellipszoid képe a sávok által kifeszített síkra vetült és az ellipszoid tengelyei a vetítés miatt jelentősen lerövidültek. Az alkalmazott transzformációval (elforgatás, skálázás) az adatszerkezetről sokkal jobb képet kaptak. Ők nevezték el a transzformációt Tasseled Cap transzformációnak, ami magyarul bojtos sapkát jelent, mert a vegetációt reprezentáló pixelek által meghatározott adatstruktúra formája a növekedési fázis különböző szakaszaiban egy bojtos sapkához volt hasonló. A kutatások során (Kauth-Thomas, 1976,Crist et al 1986, Crist et Kauth 1986) három adatstruktúra tengelyt határoztak meg, melyek háromféle vegetációval kapcsolatos tulajdonságot adnak meg. Brigthness (visszaverő, fényességi index) - a hat TM sáv súlyozott összege, a talajreflektancia változását mutatja 34

Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás Greenness (zöld index) - merőleges a brightness tengelyre, a közeli infravörös és a vörös sávok közötti kontrasztot mutatja. Szoros kapcsolatban van a képen található zöldfelületek összterületével. Wetness (nedvességi) - kapcsolatban van a lombkorona és a talaj nedvességtartalmával (Lillesand and Kiefer 1987). Az eredeti tengelyelnevezések (Kauth-Thomas, 1976) a Brightness, Greenness, Yellowness, és a Nonesuch voltak. Az MSS képeknél használt brightness index nem korrelált a TM szenzorra bevezetett brightness értékkel, míg a greenness index jól korrelált az új szenzor greenness index értékével. Ezek a tengelyelforgatások mind szenzorfüggők, de a legtöbb szenzorra már meghatározták korábban, pl. Landsat 4 TM, 5 TM Ugyanazokat a forgatásokat alkalmazhatjuk ugyanazzal a szenzorral készített különböző képek esetén. A Landsat MSS 4 sávjára kidolgozott

módszert a TM 7 sávja miatt ki lehetett egészíteni (nőtt a dimenzió száma) újabb tengelyekkel. Ezek sorrendben Haze (homályosság), Ötödik, Hatodik tengely. Laurin (1986) a homályossági paramétert alkalmazta egy algoritmusban a Landsat felvételek homályosságának csökkentésére. A Landsat MSS, TM4 és TM5 szenzorokra alkalmazott együtthatók és műveletek rendszere: Brightness = 0.3037(TM1) + 02793(TM2) + 04743(TM3) + 05585(TM4) + 05082(TM5) + 0.1863(TM7) az érték lehet, hogy 04343???? Greenness = -0.2848(TM1) - 02435(TM2) - 05436(TM3) + 07243(TM4) + 00840(TM5) 01800(TM7) Wetness = 0.1509(TM1) + 01973(TM2) + 03279(TM3) + 03406(TM4) - 07112(TM5) 04572(TM7) az érték lehet, hogy 01793 és 03299 Haze = 0.8832(TM1) - 08190(TM2) - 04580(TM3) - 00032(TM4) - 00563(TM5) + 0.0130(TM7) A brightness érték a hat sáv súlyozott értékeinek függvénye, a greenness érték a látható vörös és az infravörös kontrasztjától és egy kissé a 5. és a 7 sáv

értékétől függ A wetness értékét legjobban a közepes infravörös sávok közötti kontraszt befolyásolja, valamint kevésbé a vörös és a közeli infravörös sáv értéke. A három első Tassalled Cap paraméter alapján definiálhatunk egy 3-dimenziós teret, amelyben a térbeli pozíciót a megfelelő együtthatók segítségével kiszámított Br, Gr, We értékek, mint koordináták határozzák meg. A Br és a Gr értékekkel meghatározott síkot Crist és Cicone (1984) után a „vegetáció síkjának”, míg a Br és a We értékekkel meghatározott síkot a „talajok síkjának” nevezzük. A Tassalled Cap alkalmazásakor nem szabad megfeledkezni néhány problémáról. Bár a transzformáció együtthatói a priori értékek, ellentétben a főkomponens analízis együtthatóival, az értékek kívül esnek a 0-255 intervallumon. A probléma olyan módszer 35 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás találása,

amely elvégzi az értékek ezen intervallumba való transzformálását anélkül, hogy a képek összehasonlításának a lehetőségét elveszítenénk. Crist szerint mezőgazdasági területeken a Br értéke 0-350, a Gr -100,125, a We -150, 75 között változik. Ha képek közötti összehasonlítás fontos, akkor az értékeket skálázhatjuk ezen határokkal. A másik probléma a különböző időpontban készített felvételek TC képeinek az összehasonlításának a korlátja a változó besugárzási feltételek és az atmoszféra összetételének változása miatt. A harmadik probléma, hogy a TC transzformációban a Br tengely (talaj tengely a PVI terminológiában) meghatározásakor szükséges együtthatókat empirikus adatok szerint adták meg. Ezek az adatok az MSS képek esetén kis számú mintából származnak egy Illinois állambeli megye területéről (Fayette County), míg a TM-re megadott TC együtthatókat szintén észak-amerikai talajok reflektancia

tulajdonsága alapján adták meg. Ezért a TC együtthatók alkalmazása a Föld más területén lévő talajtípusokra vonatkozóan nem biztos, hogy sikeres lesz, mert az együtthatókkal meghatározott Br tengely pozíciója nem biztos, hogy illeszkedik a vizsgált terület talajainak reflektancia-tulajdonságai alapján számítható Br tengellyel. Perpendicular Vegetation Index A Tassalled Cap transzformációhoz hasonló elvet követ a PVI-nek nevezett transzformáció, melyet szintén a Landsat MSS képek vizsgálatakor alakítottak ki. A négydimenziós spektrális térben a talajokat reprezentáló pixelek egy határozott vonal mentén helyezkednek el. A tengelyen megtalálhatjuk az alacsony és a magas reflektanciájú talajokat is. A látható fény vörös sávja és az infravörös sáv által kifeszített síkban a pixeleket e két sávban felvett értékeik alapján helyezhetjük el. A növényzet nélküli, csupasz talajok az S1S2 tengely mentén helyezkednek el, a

nagyobb nedvességtartalmú talajok az S1 pont közelében (a víz magas infravörös abszorbanciája miatt a pixelértékek kisebbek), míg a szárazabb talajok az S2 pont közelében találhatók. A vegetációt reprezentáló pixelek a talaj tengely alatt, attól jobbra helyezkednek el, és a tengelytől való távolság (pontból a tengelyre merőleges szakasz hossza) Richardson és Wiegand (1977) szerint arányos a levélborítottsági index-szel (green leaf index) és a biomassza tömeggel. Az általuk használt Perpendikuláris (merőleges) Vegetációs Index (PVI) meghatározható a Landsat MSS 7. és a 6 sávja alapján (itt a sávsorrendbe beleszámították a Landsat RBV szenzorának sávjait is) a következő képletekkel: PVI 7 = SQRT((0.355 MSS7 - 0149 MSS5)2 + (0355 MSS5 - 0852 MSS7)2) PVI 6 = SQRT((0.498 MSS6 - 0457 MSS5 - 2507)2 + (2734 + 0498 MSS5 - 0543 MSS6)2) Ez a formula egy olyan talajtengelyre érvényes, amelyet Richardson és Wiegand 16 pont alapján

határozott meg, amely nem túlságosan sok egy univerzális képlet megadására. Ezért érdemes a gondolatot mindig a saját területünkön meglévő talajokra vonatkoztatni. Másrészről figyelembe kell venni, hogy ebben a képletben az MSS 7 bites (4, 5, 6 sávja), valamint 6 bites (7.sáv) radiometrikus felbontással szerepel, és sok MSS adatot átskáláztak a 0-255-ös intervallumra. Jackson és munkatársai (1983) a PVI alkalmas a csapadék hatásának 36 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás kimutatására ott, ahol a vegetáció-borítás nem összefüggő, de nem igazán eredményes a növényzetet károsító hatások elemzésekor. Az atmoszféra nedvességtartalma, a légáramlások is kedvezőtlenül befolyásolják a PVI értékét. RGB - IHS kapcsolat A képfeldolgozó rendszerekben a színes monitorokkal megjelenített színes képeket három szín keverésével állíthatjuk elő. Ezek a vörös, zöld, és a kék

(angol rövidítéssel R,G,B), a három additív főszín. Ha egy multispektrális felvétel 3 sávját kiválasztjuk, és együtt megjelenítjük egy színes monitoron, akkor úgymond elhelyeztük a képet az R,G,B térbe. A „színtér” modellje abból az elméletből származtatható, amely leírja a színek kialakulását a vörös, zöld és kék színek különböző mértékű összeadásával. A koordináta rendszer origójában van a fekete szín, és a tengelyek a fekete-vörös, a fekete-zöld és a fekete-kék tengely. Egy szint a három tengelyen megadott koordináta hármassal definiálhatunk. A fehér szín maximális vörös, zöld és kék szín keverésével jön létre. A kocka fekete és fehér csúcsait összekötő átlón vannak azok a színek, amelyekben a három fő szín egyenlő mértékben van jelen, ezek a szürke különböző árnyalatai. A színes televíziók ezt a modellt használják a színek előállításakor. Másféleképpen is meg lehet

határozni ehhez hasonló színteret, amely az Intenzitást (I), a Hue (H), és a Telítettség (S-saturation) alkalmazza, mint három pozícionált paramétert az R,G,B helyett. Ez a rendszer előnyösebb a tekintetben, hogy az így létrehozott színek közelebb vannak az emberi szem által felismert, a természetben létező színekhez. Intenzitás (I) - egy szín fényességének a mértéke, a képernyő teljes fényességi tartománya (hasonló a PC-1-hez) és 0-tól (fekete) 1-ig (fehér) terjed. Saturation (S) (telítettség) - a szín telítettségét reprezentálja és értéke szintén 0-tól 1-ig terjed. a Hue (H) - Értéke a 0-tól (vörös középső értékétől) a zöldön és a kéken keresztül vissza a vörösig, 360-ig terjed. 37 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás A fenti ábra a IHS modell egy-egy geometriai modelljét mutatja. A következő algoritmusokat használhatjuk az RGB színek IHS-be való

átalakításakor (Conrac, 1980): R=(M-R)/(M-m), G=(M-G)/(M-m), B=(M-B)/(M-m), ahol R,G,B= mindegyike 0 és 1 közé esik M = a legnagyobb érték m = a legkisebb érték Az intenzitás (0-1) számítása: I = (M+m)/2 a telítettség számítására: ha M=m, akkor S=0, ha 0.5 ≥ I, akkor S = (M-m)/(2-M-m), ha I > 0.5, akkor S = (M-m)/(2-M-m) A hue értékének kiszámítása a 0-360 tartományban: ha M = m, akkor H = 0 ha R = M, akkor H = 60(2+b-g), ha G = M, akkor H = 60(4+r-b), ha B = M, akkor H = 60(6+g-r), ahol 38 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás R,G,B= mindegyike 0 és 1 közé esik M = a legnagyobb érték m = a legkisebb érték IHS átalakítása RGB-vé Az IHS értékek átalakítása RGB értékekké komplementere az előbb tárgyalt RGBIHS átalakításnak. Az IHS-RGS algoritmusban egy minimum-maximum széthúzás történik mind az Intenzitás, mind a telítettség értékeire, vagy mindkettőre. A széthúzás

után a teljes IHS képet visszaalakítjuk az eredeti RGB térbe. Ha a Hue értéke nem módosult, az eredménykép nagyon hasonló lesz, mint a bemenő kép. Nem szükségszerű, hogy ebben a transzformációban a bemenő (IHS) paraméterek egy RGB-IHS átalakításból származzanak. Az I és/vagy az S értékek lehetnek más paraméterek, csak be kell állítani a H értékét 0-360-as intervallumra, és utána végre lehet hajtani a transzformálást. Ezt a módszert más adatállományok színkódolásának nevezzük A H és az I értékeit helyettesítették (Daily, 1983) alacsony és magas frekvenciájú radarképekkel. Szintén helyettesíthető az I értéke a radarintezitási értékekkel az IHS-RGB átalakítás előtt (Holcomb, 1993). A módszer alkalmazható Landsat és SPOT pankromatikus képek felbontási összefésülésekor (Chavez, 1991). Az ERDAS IMAGINE a következő algoritmust használja az IHS-RGB átalakításkor: Adott H (0-360 intervallum), I és S a 0-1

intervallumon. Ha 0.5 ≥ I, akkor M = I (1+S) Ha 0.5 < I, akkor M = I +S-I(S) m = 21 - M Az R értékeinek számítására alkalmazott módszer: Ha H < 60, akkor R = m + (M-m)(H/60) Ha H < 180, akkor R = M Ha H < 240, akkor R = m + (M-m)((240-H)/60) Ha H < 360, akkor R = m A G értékeinek számítására alkalmazott módszer: Ha H < 120, akkor G = m Ha H < 180, akkor G = M Ha H < 240, akkor G = m + (M-m)((H-120)/60) Ha H < 300, akkor G = M Ha H < 360, akkor R = m + (M-m)((360-H)/60) A B értékeinek számítására alkalmazott módszer: Ha H < 60, akkor B = M 39 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás Ha H < 120, akkor B = m + (M-m)((H-120)/60) Ha H < 240, akkor B = m Ha H < 300, akkor B = m + (M-m)((H-240)/60) Ha H < 360, akkor B = M Indexek Az indexek olyan matematikai képlettel megadható térképi műveletek, amelyeket különböző bemenő sávokra értelmezünk, s eredménye a vizsgált

terület jellemző tulajdonságát fejezi ki. Ilyenek pl. sáv1 - sáv2, a (sáv1-sáv2)/(sáv1+sáv2), vagy a sáv1/sáv2 A különböző spektrális tartományokban mért reflektancia értéke összefüggésben van tárgy vagy a felszín molekuláris összetevőivel, ezért ezek az indexek gyakran információval szolgálnak a tárgyak kémiai összetételéről. Alkalmazások a, Különböző indexeket alkalmaznak az ásványi előfordulások, valamint a vegetáció elemzésekor, a vegetációs osztályok és a kőzettípusok közötti kis differenciák kijelölésére. Az indexértékek megfelelő színkódolása esetén olyan különbségeket is kimutathatunk, melyek az eredeti színes képen nem voltak láthatók. b, Az indexek csökkenthetik a légi- és űrfelvételeken jelentkező árnyék hatását. c, Bizonyos TM sávokból képzett hányadosok kombinációit már rutinszerűen alkalmazzák a geológiai térképek készítésekor: R-TM5/7, G-TM5/4, B-TM3/1. A kimenő

értékek a hányados-képzés miatt többnyire nem egész racionális számok, melyeket lebegőpontos tárolással tudunk nagy pontossággal tárolni. Ez nagyobb tárhelyet igényel és a tematikus térképeknél alkalmazott műveleteket sem lehet végrehajtani. Ezért felmerül az igény az eredmény egész számokkal való reprezentálására. Ezzel az lehet a probléma, ha a számlálóban lévő szám sokkal nagyobb, mint a nevező, akkor az egész típusú változó lehetséges tartományán (-32000, 32000) túlcsordul az érték, vagy ha nincs nagy különbség a két sáv értékei között, akkor a kimenő értékek a 0,2, vagy a 0,3 intervallumba esnek. Ebben az esetben az egész intervallumokra bontás nagyon kicsi különbséget (kontrasztot) ad. A kerekítés alkalmazása veszélyes lehet, mert szűk intervallum esetén elveszítjük a különbségeket hordozó törtrészeket. A szorzás sem segít, hiszen a 0,1 közé eső pixelértékek továbbra is törtek maradnak. Egy

módszer van a teljes racionális intervallum kezelésére: ratio = arctg(A/B) Ez adja a legjobb reprezentációt mind a A/B < 1, mind a A/B > 1 számokra (Faust, 1992). 40 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás Néhány indexet gyakori használatuk miatt beépítettek a képfeldolgozó programokba. Az ERDAS Imagine-ben szereplő indexek a következők: IR/R - biomassza produkció SQRT(IR/R) IR-R - vegetációs index (IR-R)/(IR+R) - normalizált vegetációs index (NDVI) SQRT(NDVI+0.5) - transzformált NDVI (TNDVI) TM 5/7 - agyagásvány index TM 5/4 - vastartalmú ásványok TM 5/7, 5/4, 3/1 - ásványi összetétel TM 5/7, 3/1, 4/3 - hidrotermális összetétel Néhány szenzor infravörös (IR) és vörös ( R ) sávja a sávok sorrendje szerint: Landsat MSS SPOT XS Landsat TM NOAA AVHRR 7 3 4 2 5 2 3 1 Főkomponens analízis (Principal Component Analysis) A főkomponens analízist gyakran használják, mint az adattömörítés

módszerét. Ezzel lehetővé válik a redundáns adatok összetömörítése kevesebb sávba, amely azt jelenti, hogy az adatok dimenzionalitása csökken. A PCA sávok nem-korrelálnak, függetlenek, és gyakran könnyebb azokat ábrázolni, mint az eredeti forrásadatokat. A módszer lényege grafikusan, két sávra alkalmazott példán keresztül könnyen elmagyarázható. Egy descartesi koordináta rendszerben ábrázoljuk azt a síkot, amelyet a két sáv feszit ki, benne a pixelek a két sávban felvett pixelértékek alapján, mint megfelelő koordináták szerint helyezkednek el. Ha mindkét sávban a pixelértékek normális eloszlásúak, akkor a kialakuló eloszlási kép (scatterplot) ellipszis alakú. 41 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás Ellipszis diagram 2-dimenzióban ellipszis, 3-dimenzióban ellipszoid, n-dimenzióban (n>3) hiperellipszoid jön létre, ha minden bemenő sáv normális, vagy közel normális

eloszlású. A főkomponens analízis során a spektrális tér tengelyeit elforgatjuk, minden pixel spektrális térbeli koordinátáját, és az adatfile értékeit is megváltoztatjuk. Az új tengelyek párhuzamosak lesznek az ellipszis tengelyeivel. Az első főkomponens Az ellipszis leghosszabb átmérőjének (tengelyének) a hosszát és az irányát számítjuk ki először mátrix algebrai fogalmakat, definíciókat alkalmazva. Az átmérőt, amely megfelel az ellipszis főtengelyének (leghosszabb) az adatok első főkomponensének nevezzük. Az első főkomponens iránya az első sajátvektor, a vektor hossza az első sajátérték (Taylor, 1977). A spektrális tér új tengelyét az első főkomponens határozza meg. A kétdimenziós hisztogramban ábrázolt pontoknak most új koordináta lesz, amely ezen új tengelyhez illeszkedik. Miután a spektrális térben a pontkoordináták az adatfile értékei voltak, az új adatfile értékeit ezen művelet alapján kell

meghatározni. Ezek az értékeket az ún első főkomponens sávban tároljuk. Miután az első főkomponens mutatja az ellipszis tengelyének a hosszát és irányát, a spektrális térbeli tengelyként ez mutatja az adatok legnagyobb varianciáját. Az alábbi ábrán jól látható, hogy az első sajátérték mindig nagyobb, mint a bemenő sávok adatértékeinek intervallumhossza, ahogyan a Pitagorasz-tétel szerint a derékszögű háromszög átmérője mindig hosszabb, mint a háromszög befogói. 42 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás A további főkomponensek A második főkomponens az ellipszis második leghosszabb tengelye, amely merőleges az első főkomponensre. Ezért a második főkomponens megadja az adatoknak azt a legnagyobb varianciáját, amelyet még nem irtunk le az első főkomponenssel. Kétdimenziós elemzés során a második főkomponens az ellipszis kistengelye. N-dimenzióban n főkomponens van.

Mindegyik további főkomponens: a, a leghosszabb ellipszoid átmérő, mely merőleges az előző komponensre az ndimenziós térben (Faust, 1989), b, az adatok varianciája csökken (Taylor, 1977). Bár a főkomponens analízis eredményeként n kimenő sáv jön létre, az első néhány sáv tartalmazza a teljes adatfile információtartalmának 100 %-át az adatok nagy varianciája miatt. Ezért a főkomponens analízis alkalmas az adatok néhány sávba való összetömörítésére Másrészről a főkomponensek elemzése után megtalálhatjuk azt a képsávot, amely a legnagyobb kontrasztú azt eredeti képben, és ennek oka lehet a szenzor hibájából származó zaj, pl. régi MSS adatoknál a fekete csíkok jelenléte A főkomponensek számítása A főkomponens transzformáció megadása annyit jelent, hogy egy lineáris transzformációval (lineáris egyenletrendszerrel) a spektrális térbeli pixelkoordinátákat átszámítjuk egy új koordinátarendszerbeli

koordinátákká. A transzformáció eredménye, hogy az n-dimenziós spektrális tér tengelyeit elmozgatjuk és elforgatjuk az ellipszoid tengelyeinek megfelelően. A lineáris transzformációhoz meg kell adni az n főkomponens sajátvektorait és sajátértékeit a kovariancia mátrixból a következő egyenlettel: 43 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás v1 > v2 > v3 . > vn ahol Cov = a kovariancia mátrix, E = a sajátvektorok mátrixa, T = a transzpozíció függvény V = a sajátértékek diagonális mátrixa, minden nem-diagonális elem 0. Osztályozás Unsupervised training Az ún. unsupervised classification, nem irányított osztályozás csak minimális beavatkozást igényel a felhasználó részéről, de az osztályozás eredményét, az osztályokat megjelenítő térképet a felhasználónak kell értelmeznie, és az osztályoknak nevet adni, összevonni ha szükséges, stb. A nem irányított osztályozást,

klaszterezésnek (clustering) is nevezik, mert a módszer a spektrális térben lehatárolható pixelcsoportok kialakítására törekszik. Ezeket a pixelcsoportokat, amelyek a statisztikai értelemben hasonló pixeleket tartalmazzák, klasztereknek hívják. Az osztályozás után kialakuló csoportokat térképi műveletekkel, GIS funkciókkal összevonhatjuk, elemezhetjük, illetve felhasználhatjuk a supervised osztályozásban mint a tanulóterületek. Klaszterek A klasztereket a klaszterező algoritmus határozza meg, amely vagy az összes, vagy majdnem az összes pixelt felhasználja az elemzéskor. Az algoritmust az alábbi tulajdonságok jellemzik: a, az ISODATA klaszterezési módszer a spektrális távolságot használja a csoportok elkülönítésekor, de iteratív módon osztályozza a pixeleket, vagyis újraértelmezi a kritériumokat minden osztályra és eszerint osztályozza újra a pixelek, így a spektrális távolságon alapuló csoportok egyre finomodnak. b, az RGB

klaszterezési módszer sokkal speciálisabb, mint az ISODATA módszer. Az RGB módszer 3 sáv 8 bites adatait használja fel az osztályokra bontásnál, úgy hogy a 3dimenziós spektrális térben meghatározza a pixeleket befoglaló térrészleteket, s ezek lesznek az osztályok. 44 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás Ebben a fejezetben mindkét módszer részletes elemzésre kerül, bemutatva előnyeiket és hátrányaikat. ISODATA klaszterezés Az ISODATA osztályozás neve a Iterative Self-Organizing Data Analysis Technique (Gonzalez és Tou, 1974) kifejezés rövidítése, jelentése: Ismétlődő önszervező adatelemző módszer. Ismétlődő (iteratív), mert a teljes klasszifikációt megismétli, amíg az eredmény meg nem felel a követelményeknek, és létrehozza a tematikus raszterréteget, s újraszámítja annak statisztikáját. Önszervező, mert minimális felhasználói segédlet szükséges a klaszterek

kijelöléséhez. Az ISODATA módszer a minimális spektrális távolságok módszerét alkalmazza a pixelek osztályba sorolásakor. Az osztályozás meghatározott számú klaszter átlagértékének a megadásával kezdődik (beleértve a már létező tanulóterületek alapján számított osztályközepeket is), és ez ismétlődik, úgy hogy a klaszterközepek folyamatosan módosulnak egy új pixel osztályba sorolása után. ISODATA klaszterezés paraméterei N a klaszterek maximális száma. Minden klaszter a későbbi osztályt fogja meghatározni, így a klaszterek száma megadja az osztályok maximális számát is. Minden ISODATA osztályozási folyamat N klaszterközép meghatározásával kezdődik. Kevés pixelt tartalmazó klaszterek megszűnhetnek, ezért kevesebb mint N klaszter marad. T - konvergencia küszöb, amely megadja, hogy maximálisan a pixelek hány százaléka maradhat változatlan az iterációk között. M - az iterációk maximális száma.

Kezdő osztályközepek Az ISODATA algoritmus első iterációban az N klaszter átlagértékét határozza meg. Minden egyes iteráció után, az új klaszterközepeket határozza meg az aktuális klaszterbeli pixelek szerint. Ezeket a klaszterközepeket használja a következő iterációban a klaszterek meghatározásához. Ez a folyamat addig folytatódik, amíg az iterációk között nagyon kicsi különbség nincs (Swain, 1973). A kezdő klaszterközepek a spektrális térben egy vektor mentén helyezkednek el, mely két végpontjának spektrális térbeli koordinátái az N-dimenziós térben: (µ1-s1, µ2-s2, . , µn-sn), ill (µ1+s1, µ2+s2, , µn+sn) Kétdimenzióban a kezdő klaszterközepek az A(µ1-s1, µ2-s2) és B(µ1+s1, µ2+s2) pontok között helyezkednek el. 45 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás Pixel elemzés A pixeleket egyenként soroljuk valamelyik osztályba a bal-felső sarokban lévő pixellel kezdve, majd

soronként sorra kerül minden pixel. A pixel és a klaszterközepek térbeli távolságait kiszámítja az algoritmus és a pixelt ahhoz a klaszterhez rendeli, mely közepéhez a pixel legközelebb van a spektrális térben. Az ISODATA osztályozás eredménye egy tematikus raszterréteg és/vagy egy tanulóterület file. Az első iteráció eredménye hasonló a következő képhez. A második iteráció során minden klaszter átlagértékét újraszámítja az algoritmus. Minden pixel összemért az új klaszterközepekkel és hozzárendeli a legközelebbihez. Mindegyik iteráció után az ugyanabban a klaszterben maradó pixel százalékos aránya alapján indul el az újabb iteráció vagy, ha ez az arány eléri a konvergencia küszöböt, az algoritmus befejeződik. 46 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás Lehetséges, hogy a változatlan pixelek százalékos aránya sohasem éri el ezt a küszöbértéket, ezért az iterációk

számának (M) rögzítésével megakadályozható, hogy a program a végtelenségig fusson. ISODATA klaszterezés előnyök hátrányok A klaszterezés sokszor ismételhető ezért időigényes művelet. Ez az algoritmus nagyon alkalmas az egynemű Nem veszi figyelembe a pixel térbeli adatokat tartalmazó spektrális klaszterek homogenitást. megtalálására. Nincs jelentősége, hogy a kezdő klaszterközepek hol helyezkednek el, ha elég sok iteráció engedélyezett A kimenő tematikus raszterréteg hasonló a tanulóterületek alapján, a minimális távolságok módszerét alkalmazó osztályozás eredményéhez. Ezt a tematikus raszterréteget elemezhetjük és kezelhetjük a tanulóterületek szerint mielőtt az aktuális klasszifikációt végrehajtanánk. Iteratív Döntéshozási módszer Bár az ISODATA algoritmus legjobban a minimális távolságok módszerét alkalmazó döntéshozási módszerre hasonlít, a kialakuló tanulóterületek jó eredménnyel

használhatók bármely döntéshozási típusban. Az iteratív optimalizáló, vagy más néven (vándorló közepek) klaszterező algoritmus – lényegében az ISODATA algoritmus – Ball és Hall (1965) munkájában jelent meg először. A klaszterezés során a multispektrális térben alakítunk ki pixelcsoportokat, klasztereket. Pixelek akkor tartoznak egy csoportba, ha spektrálisan hasonlók Ehhez szükség van arra, hogy a hasonlóság fogalmát definiáljuk és mérhetővé tegyük. Bár sokfajta hasonlóság mérési módot kifejlesztettek, de mindegyik hasonlít egymásra abban a tekintetben, hogy mindegyik a spektrális térben való távolságmérésen alapul. A 47 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás leggyakrabban használt távolságfogalom az Euklideszi-távolság és az L1 (interpoint pontközi) távolság. Ha x1 és x2 két pixel a multispektrális térben, akkor a közöttük mérhető Euklideszi-távolság a

következőképpen számítható: d(x1,x2) =  x1 - x2  = {(x1 - x2)t (x1 - x2)}1/2 = { ∑ (x1i - x2i) 2 }1/2 , ahol i megy 1-től N-ig, N a spektrális összetevők száma. Szavakkal kifejezve, két N-dimenziós térbeli pont Euklideszi-távolságát megadhatjuk a megfelelő koordináták különbségének négyzetösszegének a négyzetgyökével. Az L1-távolság két pixel között az alábbi képlet szerint számítható: d(x1,x2) = ∑  x1i - x2i  , ahol i megy 1-től N-ig, N a spektrális összetevők száma. Általános klaszterezési kritérium vagy minőségi mutató a négyzetes hiba összege (sum of squarred error - SSE), melynek definíciója: SSE = ∑ ∑ (x - mi)t (x - mi) = ∑ ∑  x - mi  2 , ahol x ∈Ci és mi az i-dik klaszter közepe. A külső szumma az összes klaszterre vonatkozó összegzést jelzi. Vagyis az SSE megadja az összegzett távolságot minden képelemre vonatkozóan az ő klaszterközepétől mérve minden egyedi

klaszterre, majd összegzi ezeket a részösszegeket az összes klaszterre. Ha az SSE értéke elég kicsi, akkor a klaszterezés eredménye elfogadható. Más klaszterezési minőségvizsgálatok is léteznek, pl. a „klaszteren belüli eloszlás mérése”, mely a klaszterek átlagos kovariancia mátrixát határozza meg, vagy a „klaszter eloszlás vizsgálata”, mely a klaszterek átlagát hasonlítja össze a teljes adathalmaz átlagával. Mindkét módszer (Duda és Hart, 1973, Coleman és Andrews, 1979) alapvetően ugyanaz mint a SSE feltétel. Elméletben lehetséges, hogy az SSE értéke nulla legyen, de ez azt jelenti, hogy minden klaszter egyetlen pixelt tartalmaz. Az SSE számítása egyébként elég időigényes feladat, mert P pixel elhelyezése C klaszterbe CP/C! (Duda és Hart, 1973) módon lehetséges, és az SSE értékét ennyiszer ki kell számítani a klaszterezés minden egyes stádiumában a minimális érték megadásához. Ezért ennél a szigorú és

számításigényes módszernél egyszerűbbeket alkalmaznak a gyakorlatban. 48 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás RGB klaszterezés Az RGB klaszterezés egy egyszerű osztályozási és adattömörítési technika 3 sávra vonatkoztatva, 8 bites adatokon. Egyszerű és gyors algoritmus, amelyet akkor használunk, ha gyors osztályozási eredményre van szükség, de nem lényeges minden részlet teljes körű osztályozása. Alkalmas továbbá a 24 bites színes képek 8 bites színes képpé tömörítésére Az algoritmus minden pixelt a 3 dimenziós spektrális térben helyez el, és utána egy térbeli háló szerint hozza létre a klasztereket. Minden klaszter egy osztály lesz a kimenő tematikus raszterrétegen.3 dimenziós tengely mentén a bemenő adatok szerinti hisztogramokat skálázza, majd a hisztogram alapján szétdarabolja az intervallumot, pl. a az átlaghoz képest valamilyen szórástávolságon belüli pixeleket,

vagy a minimum és maximum értékek között. A sávonkénti osztályok száma alapértelmezésben: Vörös (Red) - 7 db, Zöld (Green) - 6 db, Kék (Blue) - 6 db, Definiálható, hogy a három sávot egyenként mennyi részre bontsa az algoritmus aszerint, hogy milyenek a sávok szerinti hisztogramok. A szélesebb hisztogram több szeletre, a keskenyebb hisztogram kevesebb szeletre bontható. Az IDRISI Composit parancsa a 3 bemenő sávot felbontja 6-6 intervallumra és a kimenő színes kép pixelértéke a következő képlettel számítható ki: pixelérték= B + 6*G + 36R 49 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás RGB klaszterezés előnyök A leggyorsabb osztályozási módszer. A tervezésekor arra törekedtek, hogy gyors és egyszerű osztályozást adjon olyan alkalmazásokhoz, melyek nem igényelnek speciális osztályokat. Nem biased a felső vagy az alsó részét az adatfilenek. A pixelek vizsgálati sorrendje nem

befolyásolja a kimenő adatokat. Erősen interaktív funkció, iteratív módon változtathatjuk a paramétereket, amíg a klaszterek száma és a küszöb megfelel az analízis szempontjából. hátrányok Pontosan három sávot használ az algoritmus, így nem lehetséges mindenféle alkalmazás. Nem mindig hoz létre olyan tematikus filet, amely alkalmas a későbbi elemzésre. Irányított osztályozás Bevezetés A multispektrális klasszifikáció során a képalkotó elemeket, a pixeleket, a pixelértékek alapján besoroljuk a véges számú osztályok egyikébe. Ha a pixel megfelel bizonyos kritériumoknak, akkor abba a tematikus osztályba fog tartozni, melyet a kritériumok szerint határoztunk meg. A fenti folyamatot a kép szegmentációjának is nevezik A klasszifikáció folyamata Mintázat felismerés Az emberi szem felismer bizonyos szerkezeteket és a színeket kategóriákba csoportosítja a színes képeken. A multispektrális, digitális képek esetén a

számítástechnika és a matematika eszközeivel lehetőség van a spektrális mintázatok tudományos elven történő felismerésére. Statisztikák készíthetők a pixelek spektrális tulajdonságai szerint, és a pixelek osztályozhatók matematikai feltételek alapján. Ezt a folyamatot két jól elkülönülő részre, a betanításra (tréning) és a döntéshozási módszereket használó osztályozásra bontjuk. Tréning A számítógépet fel kell készíteni, be kell tanítani arra, hogy felismerje az adatokon belüli csoportokat. A tréning az a folyamat, melyben meghatározunk feltételeket, amelyekkel ezek a csoportok felismerhetők. A tréning vagy a felhasználó által irányított, un supervised, vagy minimálisan irányított, un. unsupervised módszer lehet 50 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás Irányított betanítás Ezt a módszert az jellemzi, hogy végig a felhasználó irányítása alatt áll. Először a

felhasználó kiválasztja azokat a pixeleket, amelyek reprezentálni fogják az adott osztályt. A pixelek kiválasztásakor használhatunk különböző forrásokat, légifelvételeket, térképeket, helyszíni megfigyelési adatokat, stb. A pixelértékek elemzése és a tematikus térkép osztályainak előzetes ismerete szükséges ehhez a módszerhez. A pattern azonosítása készíti fel a számítógépet a hasonló tulajdonságú pixelek azonosítására. Nem irányított betanítás A nem irányított betanítás sokkal inkább automatizált folyamat. A képfeldolgozó program felismeri a hasonló tulajdonságú pixeleket, de ezek nem szükségszerűen illeszkednek a kép folyamatos, könnyen felismerhető területeihez, mint pl. a talajtípusokhoz, vagy területhasznosítási osztályokhoz. Ezek csak egyszerű pixel klaszterek, melyek a hasonló spektrális tulajdonságú pixeleket gyűjtik össze. Ezt a módszert általában akkor alkalmazzuk, ha kevés információnk van a

klasszifikáció előtt a területről. A klasszifikáció után a felhasználónak kell értelmeznie a létrejött osztályokat. Tanulók - signatures A tréning eredménye a tanulók egy halmaza, amely tartalmazza a tanulóterületeket, vagy a klasztereket. Minden tanuló egy osztályt ír le, és a döntéshozási szabállyal együtt a képfile minden egyes pixele egy osztályhoz rendelhető. A tanulók aszerint csoportosíthatók, hogy hogyan és hol jelöltük ki azokat. A statisztikai paramétereken (pl. középértéke, szórás, kovariancia mátrix, stb) alapuló pixelhalmazt parametrikus tanulónak nevezi az ERDAS. A parametrikus pixelhalmazt kijelölhetjük a földrajzi térben egy terület lehatárolásával, mely a benne lévő pixelek értékei szerint jellemezhető statisztikus paraméterekkel. A tanulóterület kijelölése többféle módon is történhet. Parametrikus adatokkal jelölhetünk ki egy klasztert a spektrális térben, ha kijelölünk egy n-dimenziós

pontot 3 , mint klaszterközepet és meghatározzuk a klaszterbe tartozó, pl. egy bizonyos szórástartományon belül lévő pixeleket4 A parametrikus tanulók a statisztikus osztályozási módszereknél, pl. a maximum likelihood, használhatók az osztályok meghatározására. A nem-parametrikus tanulókat nem statisztikai módszerekkel jelöljük ki. Ilyen lehet egy spektrális térben megadott diszkrét alakzat5. Ezekkel az alakzatokkal az osztályok térbeli határait adjuk meg. A nem-parametrikus osztályozások fogják használni a nem-parametrikus tanulókat. Az osztályba soroláskor azt vizsgáljuk, hogy az adott pixel kívül vagy belül van a spektrális térben lokalizált osztályokon. A supervised tréning során hozhatunk létre nemparametrikus tanulókat (Kloer, 1994) 3 a megfelelő koordináták a sávonkénti pixelértékek xi = (x1, x2, ., xn) n-dimenzióban ez egy hiperellipszoid lesz 5 két-dimenzióban valamilyen szabályos vagy szabálytalan síkidom, pl. a

(min xi, max xi) és a (min xj, max xj) határokkal adott, téglalap alakú spektrális térben lévő pixelek adnak egy klasztert 4 51 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás A tanulók értékelése Alarm réteg Az alarm értékelés lehetővé teszi, hogy összehasonlítsuk egy vagy több tanulóra a tervezett osztályozás eredményét az eredeti adatokkal. A parallelepipedon döntési szabály alapján azok a pixelek kapnak új színt a megjelenített űrfelvétel feletti rétegben, amelyek megfelelnek az osztályozás kritériumának. Ellipszis vizsgálat a spektrális térben Az ellipszisek a tanulókban lévő pixelek osztályközepei, a szórás alapján rajzolhatók ki, de lehetséges parallelepipedon határokat, az osztályközepet és a osztály nevét is megjeleníteni a 2-dimenziós spektrális térben. Ha jelentős az ellipszisek átlapolása, akkor a megjelenített két sávban (a spektrális tér 2 dimenziójában) a

pixeleket nem lehet teljesen elkülöníteni a tanulók alapján. A legjobb, ha nincs átlapolás, de átlapolás a legtöbb esetben várható. ábra Ellipszis vizsgálat a spektrális térben Kontingencia mátrix A tanulóterület pixelei nem mindig homogének, ami azt jelenti, hogy az osztályozáskor nem minden pixel kerül abba az osztályba, amit az a tanulóterületen belüli többi pixellel együtt reprezentál. Minden pixel csak súly abban a statisztikában, amely meghatározza az osztályt Ha a tanuló statisztikája jelentősen eltér a többi tanuló statisztikáitól, akkor a tanulón belüli pixelek jelentős része úgy osztályozódik, ahogy azt várjuk. Ez a kiértékelés, gyors osztályozás használja a minimum távolság, a maximum likelihood vagy a Mahalanobis távolság döntési szabályt. A kontingencia mátrix mutatja százalékosan vagy számszerűen, hogy a tanulók pixelei hogyan osztályozódtak. 52 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi

László: Képfeldolgozás Szeparabilitás vizsgálat A tanulók szeparabilitása a tanuló között mért statisztikus távolság. A szeparabilitást bármely két tanuló között megmérhetjük bármely sávokban, ezáltal kizárhatók azok a sávok, amelyek nem segítik az osztályozást (a tanulók nem különíthetők el egymástól megfelelően). Ha távolság, spektrális euklideszi távolság, két tanuló osztályközepe között nem elég nagy akkor az osztályozás sem lesz sikeres. Döntési szabály A tanulók meghatározása után a kép pixeleit egyenként elemezve osztályozzuk és soroljuk be egy-egy osztályba (vagy marad osztályozatlan) a döntési szabály szerint. A döntési szabály egy matematikai algoritmus, mely a tanulók adatai alapján végzi el a pixelek osztályba sorolását. Parametrikus döntési szabály A parametrikus döntési szabály parametrikus tanulókat használ, melyek legfontosabb statisztikai paramétere az átlagvektor és a kovariancia

mátrix. Amikor parametrikus döntési szabály szerint osztályozzuk a pixeleket, akkor minden pixelt besorolunk valamilyen osztályba, mert a parametrikus döntési tér folyamatos. Nem-parametrikus döntési szabály A nem-parametrikus döntési szabály nem statisztikákon alapul, így független az adatok tulajdonságaitól. Ha egy pixel egy nem-parametrikus tanuló határán belül van, akkor ez a döntési szabály a tanuló által meghatározott osztályhoz rendeli. Vagyis a nem-parametrikus döntési szabály azt vizsgálja, hogy a pixel a tanuló határán belül vagy kívül helyezkedik-e el. Az iteratív klasszifikáció A klasszifikáció részlépéseit és a végeredmény is értékelni kell, s az esetleges hibákat javítani lehet, majd megismételhetjük vagy a részfolyamatot vagy az egész osztályozást. A megismételhető folyamatokat iteratívnak nevezzük. Supervised klasszifikáció A supervised tréning a priori (már ismert) információkon alapul. Ehhez

ismerni kell pl a területhasznosítási típusok bizonyos tulajdonságait, melyeket felszíni mérések biztosítanak. E méréseket legjobb, ha a kép felvételezés időpontjában végzünk el. 53 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás A tanulók kijelölése A tanuló reprezentál egy osztályt vektorréteg alapján poligon definiálásával a képen hasonló spektrális tulajdonságú szomszédos pixelek kijelölésével adott területen belüli pixelek kijelölésével, melyek nem szükségszerűen hasonló spektrális tulajdonságúak tematikus raszterréteg egy osztályát felhasználva A tanulók attribútumai A tanulókat többféle attribútummal látjuk el, amelyek egyrészt befolyásolják a döntéshozás eredményét, pl. a rang értéke, másrészt a kimenő tematikus raszterréteg paramétereit határozzák meg, pl. az osztályok színei, értékei, nevei, stb A következő attribútumok minden tanulóra

(parametrikus és nem-parametrikus) általánosan érvényesek: név - azonosítja a tanulót, és az osztály neve lesz a kimenő tematikus raszterrétegen szín - a tanuló színe és az osztály színe a kimenő tematikus raszterrétegen érték - a kimenő osztály értéke és a tanuló értéke nem szükségszerű, hogy megegyező legyen, legjobb, ha pozitív egész. rang - a rang értéke a rangfüggő műveletekben játszik szerepet, mint pl. a tanuló gyorsértékelése (alarm) vagy a parallelepipedon osztályozás 6 parallelepipedon határok - a határokat a parallelepipedon osztályozásban használjuk. A parametrikus tanuló további attribútumai lehetnek: sávok száma - a bemenő kép sávjainak a száma szélsőértékek - a klaszter vagy a tanuló minimum és maximum vektora átlagértek - a klaszter vagy a tanuló átlagvektora a klaszter vagy a tanuló kovariancia mátrixa a klaszter vagy a tanuló pixeleinek a száma A nem-

parametrikus tanuló spektrális térben, nem statisztikai paraméterek alapján, kijelölt térrészletbe eső pixelek értékeit rögzíti. A tanulók vizsgálata, értékelése tanuló gyorsértékelése (alarm) ellipszis - 6 a parallelepipedon határok a sávonkénti minimális és maximális pixelértékek 54 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás kontingencia mátrix divergencia statisztikák és hisztogramok - A klasszifikáció döntési szabályai Ha a tanulókat összegyűjtöttük és értékeltük, a következő lépés a döntéshozáson alapuló osztályozás elindítása. Az osztályozáskor minden egyes pixelt önállóan értékelünk A döntési szabályban vagy algoritmusban meghatározó szerepe van a pixel helyét az ndimenziós vektortérben kijelölő vektornak. Az alábbi ábra az ERDAS döntéshozási mechanizmusának folyamatábráját ábrázolja Eszerint, ha nem-parametrikus tanulók nem

szerepelnek, akkor a pixeleket csak parametrikus szabályok szerint osztályozzuk. Ha nem-parametrikus tanulók is vannak a tanulók között, akkor minden pixelt úgy osztályozunk, hogy minden tanulót nem-parametrikusnak tekintünk. Ekkor a következők szerint járunk el: 55 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás ha a nem-parametrikus teszt eredménye egy egyedi osztály, akkor a pixelt besoroljuk ebbe az osztályba ha a nem-parametrikus teszt eredménye egy üres osztály (pl. a pixel kívül esik minden nem-parametrikus döntési határon), akkor az osztályozatlansági szabályt alkalmazzuk. Ezzel a szabállyal a pixelt vagy tovább osztályozzuk a parametrikus szabállyal vagy marad osztályozatlan. ha a pixel több mint egy osztályhoz is tartozhat, akkor az átlapolási szabályt alkalmazzuk. Eszerint a pixelt vagy tovább osztályozzuk a parametrikus szabállyal, vagy figyelembe vesszük a rangot, vagy marad

osztályozatlan. A nem-parametrikus szabályok közül a parallelepipedon és a térbeli alakzat szabályt, a parametrikus szabályok közül a minimális távolságok, a Mahalanobis távolság, és a maximum likelihood módszert elemezzük részletesen. Parallelepipedon szabály (nem-parametrikus) A parallelepipedon döntési szabályban a vizsgált pixel értékeit összehasonlítjuk az alsó és a felső határokkal. Az alsó és a felső határok lehetnek: a tanulón belüli pixelek értékeinek minimális és maximális értéke minden sávban, minden sáv szerint az átlag és annak valamilyen skalárral szorzott szórású környezete, bármilyen határ, amit a felhasználó definiál az adatok, vagy a tanuló ismerete szerint. Ezek az ismeretek származhatnak a korábban tárgyalt tanulóértékelési technikák alapján. Az alábbi ábra egy kétdimenziós példát ad a parallelepipedon osztályozásra. 56 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi

László: Képfeldolgozás A sávpáronként értelmezett és a sávonként vett minimális és maximális értékekkel lehatárolható téglalapok adják a 3-dimenziós térben értelmezett téglatest határoló felületeit, míg n-dimenzióban egy n-dimenziós parallelepipedont definiálhatunk. Az osztályozás lépései Ha a pixel egyetlen tanulóhoz tartozó parallelepipedonba esik, akkor a tanuló által kijelölt osztályba soroljuk. Ha kettő vagy több parallelepipedon közös térrészébe, átlapoló területébe helyezhető el a vizsgált pixel, akkor osztályozhatjuk a tanulók rangja, vagy parametrikus szabály szerint. A pixelt a magasabb rangú (alacsonyabb értékű) tanuló által reprezentált osztályba soroljuk. Ha rangot nem vehetjük figyelembe, akkor a pixelt csak az átlapoló tanulókra alkalmazott parametrikus szabály szerint osztályozzuk. Ha egyik tanuló sem parametrikus, akkor a pixel osztályozatlan marad, ha csak az egyik tanuló

parametrikus, akkor a pixelt automatikusan ehhez az tanulóhoz, ill. az általa reprezentált osztályhoz soroljuk a pixel osztályozatlan marad Ha a pixel nem esik egyik parallelepipedonba sem, akkor definiálni kell az osztályozást a pixelt az összes tanulóra alkalmazott parametrikus szabály szerint osztályozzuk. Ha egyik tanuló sem parametrikus, akkor a pixel osztályozatlan marad. a pixel osztályozatlan marad PARALLELEPIPEDON döntési szabály előnyök hátrányok Gyors és egyszerű, miután a pixelértékeket Miután a parallelepipedonoknak sarkai olyan határokhoz hasonlítjuk, amelyek vannak, olyan pixel is osztályozható, változatlanok maradnak az osztályozás során amely távol van az átlagértéktől. mindegyik tanulóra vonatkozóan. Gyakran használható egy első szintű, kiterjedt osztályozás elvégzésére. A döntési szabállyal gyorsan csökkenthető a lehetséges osztályok száma, mielőtt valamilyen időigényes (minimális

távolság, Mahalanobis távolság, maximum likelihood) módszert alkalmaznánk. Nem függ az adatok normális eloszlásától. 57 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás Feature space Ugyanaz, mint a parallelepipedon, csak a spektrális térben kijelölt pixelhalmaz határai tetszőlegesek lehetnek. Minimális távolság döntési szabály A minimális távolság döntéshozási módszere, vagy más néven a spektrális távolság módszere az osztályozni kívánt pixel és mindegyik tanuló átlagos értéke közötti n darab lehetséges spektrális távolság mérésén alapul. A fenti ábrán a spektrális távolságokat a kétdimenziós vektortérben vastag szakaszok jelzik a pixel és a tanulók átlagértékei között. A pixelt ahhoz az osztályhoz rendeljük, melyet reprezentáló tanuló átlagértékéhez a legközelebb van, vagyis amelyre az alábbi kifejezés minimális 58 Phare HU0008-02 SZTE – Térinformatika Dr.

Mucsi László: Képfeldolgozás ahol n = a sávok száma (dimenzió) i = az adott sáv indexe c = az adott osztály index Xxyi =az i sáv x,y pixelének az értéke SD xyc = az x,y pixel és a c osztály közötti távolság MINIMUM TÁVOLSÁG döntési szabály előnyök hátrányok A véges számú távolság között Azok a pixelek, amelyek más feltételek esetén mindig van legalább egy osztályozatlanok maradnának, osztályozottak lesznek. A legkisebb, így nem lesz küszöbérték térképen, amely megmutatja a pixel és az osztályközép távolságát, a túl távol lévő pixelek osztályozatlan pixel7. kiszűrhetők. A parallelepipedon módszer a, Nem veszi figyelembe az osztály variabilitását. után a leggyorsabb döntéshozó Például egy városi területet reprezentáló osztály esetén, módszer. melynek nagy a varianciája, a középtől távol lévő pixelek, más osztályközepek közelsége miatt, más osztályhoz sorolódnak, vagyis az osztály

alulreprezentált lesz. b, Fordítva, a kis varianciájú, homogén osztályok esetén, mint pl. egy vízfelület, a nem az osztályhoz tartozó pixelek, más osztályközepek relatíve nagyobb távolsága miatt a vízfelületként osztályozódnak. A vízfelület túlreprezentált lesz. Ha a nagy varianciájú tanuló jól elkülöníthető résztanulókra bontható, akkor ezek egy tanulóként való kezelése azt eredményezi, hogy az átlagvektor a két tanulórész közé mutat, ahol lehet, hogy nincs is pixel, vagy egy másik tanuló van. Ez különösen a minimális távolság módszerénél okoz látványos hibát. Ezt úgy javíthatjuk ki, hogy a tanulót felbontjuk alkotó részeire. Ez viszont azt eredményezi, hogy megszűnhetnek olyan osztályok, mint a városi beépítés, mert felbomlik útfelületre, zöldfelületre, vízfelületre, stb. Nagy varianciájú tanulókat a fentiek szerint csak akkor alkalmazhatunk osztályok reprezentálására, ha nem bontható homogén,

elkülönülő résztanulókra, 7 a minimum távolság módszerénél, ha két vagy több osztálytól mért távolság egyenlő és minimális, akkor az osztályok rangja alapján döntünk, ha a rangot nem definiáltuk, akkor a felvétel sorrendjében első osztályhoz rendeljük a pixelt. Egyes szoftverekben definiálható egy küszöbérték, vagy maximális távolság, amelynél nagyobb minimális távolság esetén a pixel osztályozatlan marad. 59 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás a legközelebbi tanuló átlagvektora és a nagy varianciájú tanuló átlagvektorának a távolsága legalább kétszerese az utóbbi a tanulón belül mérhető legnagyobb spektrális távolságnak. Mahalanobis távolság A Mahalanobis távolság hasonló a minimális spektrális távolsághoz, csak a kovariancia mátrixot használja az egyenletben. A mátrixban szereplő varianciák és kovarianciák értékei továbbviszik a tanulóban

lévő nagy változékonyságú pixelek tulajdonságait az osztályra. Például, ha városi területet osztályozunk, amely tipikusan nagy varianciájú pixeleket tartalmazhat, a jól osztályozott pixel messzebb lehet az osztályközéptől, mint esetleg egy nem nagy varianciájú osztály, pl. a vízfelület esetén ahol D = Mahalanobis távolság c = adott osztály X = pixel vektora Mc = osztály tanulójának átlagvektora Cov c = a c osztály tanulójában lévő pixelek alapján számított kovariancia mátrix Cov c -1 = Cov c inverze T = transzponált függvény MAHALANOBIS TÁVOLSÁG döntési szabály Előnyök hátrányok A tanulók variabilitását is figyelembe A kovariancia mátrixban szereplő nagy veszi, nem úgy mint a minimális távolság értékek szereplése esetén túlosztályozott vagy a parallelepipedon módszer. lehetnek egyes osztályok. Ez akkor fordul elő, ha a klaszterben vagy a tanulón belül a pixelek nagyon elszórva helyezkednek el (a spektrális

térben). Sokkal használhatóbb lehet mint a Lassabb, mint a parallelepipedon vagy a minimális távolság módszere, ha a minimális távolság módszere. statisztikai paramétereket (amelyeket A Mahalanobis távolság módszere kifejezünk a kovariancia mátrixban) parametrikus, ami azt jelenti, hogy szükséges figyelembe kell venni, de a maximum minden sáv adatainak normális eloszlása. likelihood módszernél alkalmazható súlyfaktorok nem álnak rendelkezésre. 60 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás Maximum likelihood módszer A Maximum likelihood módszer alkalmazhatóságához szükséges, hogy a sávonkénti adatok normális eloszlásúak legyenek. Ha ez nem áll fenn jobb eredményt kapunk a parallelepipedon vagy a minimális távolság módszerrel. A Maximum likelihood módszer azon alapul, hogy egy pixel milyen valószínűséggel tartozik egy adott osztályba. Az alapegyenlet feltételezi, hogy ezen valószínűségek

egyenlők minden osztályra vonatkozóan és hogy a bemenő sávoknak normális az eloszlása. Bayes osztályozó Ha van előzetes, a priori információnk arról, hogy a valószínűségek nem egyenlők minden osztályra, akkor súlyokat adhatunk az egyes osztályoknak. A Maximum likelihood módszer ezt a változatát Bayes-féle döntési módszernek nevezik (Hord, 1982). Ha nincs előzetes információ a valószínűségekről, akkor a súlyok értéke 1.0 az egyenletben A Maximum likelihood és a Bayes-féle döntési módszer egyenlete: MAXIMUM LIKELIHOOD/BAYES döntési szabály előnyök Hátrányok A legpontosabb osztályozási módszer, ha a A bonyolult egyenlet miatt a számítás sok időt bemenő sávok adatai normális eloszlásúak, vesz igénybe. Az idő a sávok számának mert ez veszi figyelembe a legtöbb változót. növekedésével egyenesen arányos A Mahalanobis távolság módszerhez A Maximum likelihood parametrikus módszer. hasonlóan a Maximum likelihood is

a amely azt jelenti, hogy erősen függ az egyes kovariancia mátrixot használja az osztályok sávok adatainak normális eloszlásától. variabilitásának jellemzésére. A kovariancia mátrixban szereplő nagy értékek szereplése esetén túlosztályozott lehetnek egyes osztályok. Ez akkor fordul elő, ha a klaszterben vagy a tanulón belül a pixelek nagyon elszórva helyezkednek el a spektrális térben. Az osztályozás eredményének értékelése Az osztályozás pontosságának, eredményének az értékelésére több módszer is létezik: küszöbérték vizsgálat - a túlosztályozott osztályokban lévő kritikus pixelek kiszűrésére alkalmazott módszer pontosság becslés - a klasszifikáció eredményének és földi vagy más meglévő adatok összehasonlításának módszere. 61 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás Küszöbérték vizsgálat A küszöbérték vizsgálattal azonosíthatjuk azokat a

pixeleket, amelyeket valószínűleg (most likely) rosszul osztályoztunk. Ezeket a pixeleket egy másik osztályba, általában az nulla osztályba, a nem osztályozottak közé sorolunk át. Ezeket a pixeleket a döntési szabályban használt távolságmérés alapján azonosítjuk. Távolság file Ha minimális távolság, a Mahalanobis távolság, a Maximum likelihood osztályozási módszert alkalmazzuk, mindannyiszor létrehozható egy-egy távolság file a kimenő raszterréteg mellett. A távolság file egy egysávos file, az adatok 32 bites tárolásban folyamatos raszterréteget alkotnak, amelyben minden pixelérték az alkalmazott távolságmérés eredményét mutatja. A minimum távolság osztályozásnál minden távolságérték Euklideszi spektrális távolság a pixel és az osztály átlagértéke között. Mahalanobis távolság, vagy a Maximum likelihood osztályozási módszert alkalmazva a távolságérték a pixel vektora és az osztály átlagvektora

közötti Mahalanobis távolság. .ábra A távolság file hisztogramja Ez az eloszlási görbe a Chi2 eloszlási függvényéhez hasonló. A valószínűleg rosszul osztályozott pixelek távolságértékeik szerint a grafikon jobb oldalán helyezkednek el, melyek matematikai módszerekkel pontosan definiálhatók és levághatók a hisztogramról. A levágás helye a küszöbérték A küszöbérték meghatározható: interaktív módon a hisztogramon, 2 bemenő adatként, chi paraméterként. 62 Phare HU0008-02 SZTE – Térinformatika Dr. Mucsi László: Képfeldolgozás Mindként esetben az eredmény az lesz, hogy a legnagyobb távolságértékű pixelek egy tematikus osztályba kerülnek, amely maszkként használható az osztályozás eredményeként létrejött tematikus raszterrétegen. Pontosság becslés - Accuracy assessement A pontosság becslése véletlenszerűen kiválasztott referencia pixelek és a tematikus raszterréteg összehasonlítását jelenti. A

kiválasztott pixelek számának 250-nél nagyobbnak kell lenni ahhoz, hogy egy osztály átlagos pontosságát 5 %-kon belül megadhassuk. A referencia pixelek véletlenszerű kiválasztása történhet: random módon - semmilyen szabályt nem használva, stratégiai random módon - a referencia pixelek a tematikus osztályok területi arányának megfelelően oszlanak el véletlenszerűen az osztályokban, kiegyenlített random módon - a referencia pixelek a tematikus osztályokban egyenlő számban oszlanak el véletlenszerűen. A pontosság mérésének az eredménye vagy egy c x c méretű hibamátrixban jelenik meg, ahol c az osztályok száma, vagy egy egyszerű pontosság fileban, mely egy ASCII-file, tartalma a pontosság százalékos statisztikája a hibamátrix alapján. 63

Informatika | Térinformatika » Dr. Mucsi László - Képfeldolgozás a geoinformatikában

Mit olvastak a többiek, ha ezzel végeztek?

Kidolgozott egészségügy tételsor

Ssangyong Tivoli kezelési útmutató

Babits Mihály élete, pályája és főbb műveinek elemzése

Splinter Cell végigjátszás

Tartalmi kivonat

Cikkajánló

Hogyan tanuljunk angolul?

Doksiajánló

Tartalmak

Navigáció

Informatika | Térinformatika » Dr. Mucsi László - Képfeldolgozás a geoinformatikában

Doksi olvasó beágyazása

Mit olvastak a többiek, ha ezzel végeztek?

Kidolgozott egészségügy tételsor

Ssangyong Tivoli kezelési útmutató

Babits Mihály élete, pályája és főbb műveinek elemzése

Splinter Cell végigjátszás

Tartalmi kivonat

Cikkajánló

Hogyan tanuljunk angolul?

Doksiajánló

Tartalmak

Navigáció