Information Technology | Graphics » Dr. Székely Vladimír - A képtechnika alapjai

Datasheet

Year, pagecount:2000, 22 page(s)

Language:Hungarian

Downloads:354

Uploaded:January 23, 2015

Size:676 KB

Institution:
[BME] Budapest University of Technology and Economics

Comments:

Attachment:-

Download in PDF:Please log in!



Comments

No comments yet. You can be the first!

Content extract

A képtechnika alapjai Segédanyag, I. rész készítette: Dr. Székely Vladimír Kizárólag belső használatra! BME Elektronikus Eszközök Tanszéke 2000. tavasz 1 A KÉPTECHNIKA ALAPJAI Bevezetés Először arról: mit is nevezünk "kép"-nek, mi az előadás tárgya? ♦ A kép a művészi kifejezés eszköze. Időben nagyon messzire mehetünk vissza: Altamira bölényeihez, a Sixtus-i kápolnához. ♦ A kép az információközlés eszköze. A könyvnyomtatásban megjelent első ábrázolások, a műszaki rajz, a fényképezés, a képeslapok, a híradófilm, a zártláncú TV-s figyelő rendszer. Műszaki ábrázolás (az Exacta Varex fényképezőgép metszete) Egy "hír-értékű" kép: a Marsra szállt JÖVEVÉNY küldte a Földre ♦ A kép 2D kiterjedéssel rendelkező dolog. Kétdimenziós intenzitás (vagy intenzitás + szín) függvény: f ( x, y ) . Egy síkban fekvő, geometriai jellemzőkkel rendelkező valami. (Mondhatunk itt 2+1

dimenziót is: mozgókép.): f ( x, y , t ) . ♦ A kép emberi felhasználásra rendeltetett. Illeszkedik az emberi látáshoz, mint bemeneti csatornához: annak tulajdonságai, korlátai meghatározóak. E korlátokat részben szenvedjük, részben kihasználjuk Most nézzük, milyen értelemben beszélünk "techniká"-ról? 2 Ahhoz, hogy a kép betölthesse fenti funkcióit, képeket létrehozni, tárolni, továbbítani, sokszorosítni, visszaadni szükséges. Ennek vannak manufaktúrális módjai (pl egy festő tevékenysége), ami essék kívül a témakörünkön (együtt pl. a festék előállítás kétségtelenül technikai feladatával). Vannak művészeti vonatkozásai, amikkel − lévén csak fogyasztói szinten kompetensek − igencsak érintőleg foglalkozunk. Vannak viszont a technikai eszközök, eljárások, amelyek ilyen célokat szolgálnak: ezek képezik a tárgyunkat. Több rétegét, több eszközkészletét különíthetjük el a képtechnikának

(melyek bár önállóak, mégis szoros csatolásban vannak): ♦ Nyomdai képtechnika: fametszet, rézmetszet, FF és színes reprodukció (+ a tipográfia, könyvtervezés.) Fametszet a könyvnyomtatás első évtizedeiből F.Villon: Le Grand Testament, Paris, PLevet, 1489 Műtermi fénykép az 1890-es évekből ♦ A fényképezés (kémiai) technikája, a dagerrotípiától a mai színes fényképezésig, a mozgófényképpel mint külön alfejezettel, ♦ A kép elektronikus technikája (televízió, elektronikus fényképezés, képfeldolgozás, algoritmikus képgenerálás, fac-simile átvitel). 3 Televíziós kép az elektronikus képtovábbítás korai időszakából (Ikonoszkóp, 60-as évek) Mindhárom felsoroltban jelentős szerepet játszik ♦ Az optikai leképezések technikája, a laterna magicától a fényképezés optikai kérdésein át a mikroszkópig. Mi elsődlegesen az elektronikus megoldásokkal fogunk foglalkozni, de érintjük a többi vonatkozást

is. 4 1. Az emberi látás 1.1 A szem felépítése A szem metszeti rajzát az alábbi ábrán látjuk. Átmérője kb 2,4 cm, cca golyó Részei: kívülről az átlátszatlan, fehér ínhártya (7) burkolja, ez elöl az átlátszó szaruhártyában (3) folytatódik. A szaruhártya kb. 0,5 mm vastag A szaruhártya mögött a csarnok (4), folyamatosan cserélődő víztiszta folyadékkal (csarnokvíz). Ez után a szivárványhártya (6), rajta a lyuk a pupilla Mögötte a hátsó csarnok. Ezt követi a szemlencse (5), amit gyűrű alakban egy izomköteg vesz körül: a sugártest (2). A szemlencse mögötti teret a kocsonyás üvegtest (1) tölti ki A szemgolyó belső falán az ideghártya (retina) (9) található, közte és az inhártya között a vérellátást biztosító érhártya (8). 1.1 ábra A szem metszete További megkülönböztetendő részek: a szemidegek kilépő kötege (11), a központi mélyedés (10), a vakfolt (12) (utóbbiakat lásd később). A szemgolyón

2×2 izom tapad, amelyek a jobbrabalra ill a fel-le mozgatást szolgálják 1.2 A szem mint optikai rendszer Látható, hogy a szem belső optikai felépítése nagyon hasonlít egy fényképezőgéphez. Megtaláljuk az optika, a blende, a fényérzékeny film megfelelőjét. A szaruhártya görbületi sugara kb. 7 mm A szaruhártya, a csarnokvíz és az üvegtest törésmutatója majdnem teljesen azonos: n=1,376 a szaruhártyára, n=1,336 a csarnokvízre. Ha a szemlencse nem lenne a helyén, ez így 2,3 cm fókusztávolságnak (43 dioptria) felelne meg. A szemlencse törésmutatója nagyobb( n=1,45. Ez, mivel 2×domború, tovább csökkenti a fókusztávolságot, kb. 1,7 cm-re (58 dioptria) A lencse kb 4 mm vastag, 9-10 mm átmérőjű A sugártest izmai a szemlencsét kifeszítik/elengedik, ezzel a görbületi sugarát változtatják. Ezzel a kép élességet az agy hozzáállíthatja a tárgytávolsághoz. Ez az akkomodáció Mint a fényképezőgép élesre állítása − de ott a

képtávolságot állítjuk. A korral a szemlencse egyre merevebbé válik: az akkomodáció képessége csökken, majd megszűnik. 5 A pupilla átmérője 1,6 és 8 mm között változik, a fény intenzitásától függően, egy automatikus idegi szabályozás hatására (pupillareflex). A szem tehát egy olyan fényképező optikának felel meg, amelynek "rekesz-száma" (l. később) 2 és 10 között állítható 1.3 Az idegsejtekről általában Egy idegsejt felépítését az alábbi ábrán látjuk. 1.2 ábra Egy idegsejt felépítése A sejttesthez hosszú nyúlványok csatlakoznak. A dendritek, amelyek az ingerületet fogadják, sokfelé ágazó, bokros struktúrák lehetnek (sok megelőző "fokozattól" fogadhatnak információt). Az axonok az ingerület továbbadására szolgálnak, lehetnek elágazásaik. A "hosszútávú" átvitel az axonokon át történik, ezek lehetnek 10-20 cm hosszúak is (idegszálak). Az axon egy következő

idegsejt dendritjéhez kapcsolódva, annak továbbadhatja az ingerületet. Ez a kapcsolódási pont a szinapszis. Az axonon egy csatolt kémiai/elektromos hullám szalad végig. Az akciós potenciál egy kb 100 mV amplitúdójú hullám. Ez a szinapszisban tisztán kémiai úton hat a következő ideg dendritjére. A csatolás lehet "serkentő" vagy "gátló", tehát a mi szóhasználatunkban egy előjelváltás beiktatódhat. 1.4 Az ideghártya (retina) Először a fényérzékelés mechanizmusáról. Az érzékelő idegsejtekből kétféle van: csapok ill pálcikák. Mindkettőnél fotokémiai kölcsönhatás a mechanizmus A látóbíbor (rodopszin) nevű anyag elnyeli a fénykvantumokat, és minden egyes foton az anyag egy molekulájának lebomlását okozza. A bomlás termékei kémiailag ingerlik az idegsejtet A látóbíbor közben folyamatosan újra szintetizálódik. Megjegyzendó, hogy a rodopszinon túl a csapokban más opszinok is vannak: egyesekben

jodopszin, másokban cianopszin. Ezek működési mechanizmusa ugyanaz, de a fény abszorpciós görbéjük eltérő. Lásd majd a színlátás témáját A pálcikák az érzékenyebbek, sötétben ezek dolgoznak, de csak egyféle látóbíboruk van. Sötétben nincs színlátás. Nézzük a retina szerkezetét. Tulajdonképpen 3 sejtsorból áll: receptorsejtek, közbenső (bipoláris) sejtek, ganglionsejtek. 6 1.3 ábra A retina felépítése A ganglionsejtek axonjai az "output": ezek összessége adja a látóideget. A retina vastagsága 0,3 mm körüli. Érdekes megfigyelni, hogy a fény a receptorsejtekkel átellenes oldalról éri a retinát. A fénynek tehát az egész retinán át kell haladnia ahhoz, hogy az érzékelő réteghez jusson. Egy "leltár": a retinán összesen kb. 120 millió pálcika és hasonló nagyságrendű csap található A látóideg (átmérője 2-3 mm) kb. egymillió idegszálat tartalmaz Valahol tehát információ

tömörítésnek kell történnie. Ez úgy jön létre, hogy több receptorsejt csatlakozik egy bipoláris sejthez, és több bipoláris sejt egy ganglionsejthez. A centrális látás (éleslátás). A receptorok messze nem egyenletes eloszlást mutatnak Van egy, a szem optikai tengelyébe eső terület, a sárga folt, ahol sűrűségük nagy, ettől kifelé haladva egyre csökken. A sárga folton belül is van egy pici terület, ahol a receptor sűrűség maximális Ez a központi mélyedés, amelyben maximális a receptor sűrűség. Adatok: a központi mélyedés átmérője 0,5-1 mm, benne kb.100000 csap, pálcika nincs Itt csak csapok és ganglionsejtek vannak, a bipoláris sejtek oldalra szorultak. A sejtek között itt a leképezés 1:1, tehát nincsen információ tömörítés, minden receptornak külön kimenő idegsejtje van. A retina vastagsága itt csak 0,1 mm, a receptorokat közvetlenül éri a fény. A sárga folt átmérője 2-3 mm, ebben már pálcikák is vannak. A

csapsűrűség max 150000/mm2, fokozatosan csökken a periferiális 5000/mm2-ig. A pálcikák a centrumtól kb 0,15 mm-re jelennek meg. Max sűrűségük 160000/mm2, a centrumtól 5-6 mm-re, azután csökken Ahogyan kifelé haladunk, a receptor-bipoláris-ganglion leképezés egyre nagyobb információ tömörítést ad. A felbontás tehát két okból is csökken kifelé haladva 7 Ismert, hogy az idegszálak kilépési pontján nincsenek receptorok. Ez a vakfolt A centrumtól 4-5 mm-re helyezkedik el, az orr felé eső oldalon. 1.5 A retina kapcsolata az aggyal Az 1.4 ábrán látjuk a látóidegek további pályáját az agyban Az axonok a közbenső állomásként szereplő ú.n térdestestig futnak, ott újabb idegsejtek dendritjeihez kapcsolódnak Utóbbiak axonjai a tarkótáji agykéreg V1 mezejéhez futnak be. Érdekes átkapcsolás, hogy mindkét szem jobboldalról jövő információja a baloldali agykéreghez csatlakozik és viszont. Az azonos pixelek idegsejtjei már a

térdestestben egymás mellé vannak rendezve, és a V1 mezőben is. 1.4 ábra A látóidegek pályája az agyban Jelenlegi ismereteink szerint a szemtől a V1 mezőig nagyjából "pixel to pixel" kapcsolat van, az érdemi feldolgozás a látókéregben történik. Előfeldolgozás csak a tömörítés (több receptor egy pixel), valamint lehet, hogy a bipoláris sejtek gátlás típusú különbségképzésével szomszédos receptorok különbségi, súlyozott összeg jelei képződnek (deriváltképzés? early processing a képfeldolgozásban.) Az idegszálak pixel-to-pixel bekötődése az embrionális ill. a csecsemőkorban következik be Érthető, ha van külső inger: ezek szinkronba hozása segíti a helyes bekötést. Mi van az anyaméhben? Egyes állatkísérletek azt mutatják, hogy az embrionális, sötétben lévő retina "monoszkóp ábrát" sugároz: kb. 1/2 percenként lassan végigsöprő, változó irányú ingerület hullámfrontokat. A

látókéregben "szakosodott" továbbfeldolgozás folyik. Külön a színlátás, külön a formák felismerése, külön a kép dinamizmusára vonatkozóan. Hogy ebből hogyan áll össze a látás − ez még hosszas kutatást igényel. 8 1.6 Az emberi szem látótere A probléma: "hogyan látunk ki a fejünkből". Mert a látóteret a fejformánk adottságai határolják Jellegzetesen megjelenik az orrunk, a szemöldökcsontunk vonala, stb. A két szemünknek természetesen eltérő a látótere. A látóteret a vízszintes és a függőleges szögkoordinátákban adott diagram szgitségével ábrázolhatjuk. Egy ilyen diagramot látunk alább, a bal- és a jobbszem látótér határait közös mezőben ábrázolva 1 . 1.5 ábra Látótér diagram A bal- és a jobbszem látóterének láthatóan van közös területe. Ez az alapja a térlátásunknak Ez nem minden élőlénynél van így: a madaraknál általában diszjunkt a bal- és a jobbszem látótere.

Tyúkokat hiába viszünk a sztereó moziba. 1.7 A szem felbontóképessége Az emberi szem felbontóképessége átlagos körülmények között durván 1 szögperc, igen jó megvilágításnál 0,5 szögperc körüli. Ez természetesen a központi látásra vonatkozó adat A retina éleslátásnak megfelelő, kb. 1 mm átmérőjű körzetében (központi mélyedés, foveola) gyakorlatilag csak csapok vannak. A csapok középpontjai közötti távolság 2-2,5 μm Mivel a szem ekvivalens fókusztávolsága kb. 1/58 m=1,72 cm, a 2,5 μm csap-távolság pontosan 0,5 szögperc látószög különbséget ad. Ez azt jelenti, hogy a látásélességet valóban a receptorok geometriai kiterjedése határozza meg. Hogyan mérik (az orvosok) a látásélességet? Jellegzetes ábrák segítségével: függőleges rácsminta, SNELLEN-villa (E betű), LANDOLT-gyűrű (C betű), melyek kritikus részlete névleges 1 Megjegyzendő, hogy ez a diagram és minden további, az emberi látásra

vonatkozó görbe és adat nagyszámú kísérleti személyen végzett mérés átlagolásából adódik, így az emberi szem átlagos tulajdonságait adja. 9 esetben 5 m-ről 1 szögperc alatt látszik. Ha a vizsgált személy csak x-szer nagyobb változatban ismeri fel a részletet, akkor a látásélessége 1/x. Vagyis végülis: látásélesség=1/legfinomabb részlet látószöge [szögperc]. 1.6ábra Snellen-villa és Landolt-gyűrű Nézzük a látásélesség függését a megvilágítástól! (1.7 ábra) 1.7 ábra A látásélesség a megvilágítás függvényében A diagram nagyon Gauss-integrálnak tűnik. Az orvosok szerint is az! Arról van szó, hogy a fényintenzitás növekedtével egyre több receptor kapcsolódik be, és az éppen bekapcsolódott receptorok száma Gauss eloszlást követ. Nézzük, mit jelent ez felbontás követelményben a képközvetítés számára. A két szem közös látóterében az 1.8 ábra szerint helyezkedhet el egy képernyő,

vetítővászon: vagyis kb 30o vízszintes szögben kényelmesen. Ehhez a vízszintes irányban 2×30×60=3600 képpont szükséges (az átlagos fényerő melletti látásélességgel számolva). Ezzel szemben a mai TV szabvány 800 képpont vízszintes felbontást tesz lehetővé, az átlagos készülék ennek a kétharmadát hozza. 10 1.8 ábra A két szemmel kényelmesen nézhető képfelület Tény, hogy az elektronikus képközvetítés (jelenlegi fejlettségi fokán) sokkal rosszabb minőségű képet produkál, mint a fényképezés és a film. Ez a helyzet fájdalmas visszaesés okozója a képi igényesség dolgában. A kép (TV kép) minősége iránti igény tulajdonképpen lehetetlenül alacsony fokon áll. Csináljunk egy összehasonlítást! 1. Táblázat Egyes képhordozók képpont számának összehasonlítása FIZIKAI HORDOZÓ pixelszám vízszintes függőleges összes TV szabvány 800 600 0,48 M átlag camcorder 400 300 0,12 M Workstation 1400

1000 1,4 M Digitális fényképezőgép (2000-ben) 1800 1200 2,16 M Super-8 film (4,3×6mm) 1200 850 1,0 M 16 mm film (7,5×10,36mm) 2000 1500 3,0 M 35 mm film (16×22mm) 4400 3200 14,08 M Fényképezés (24×36mm) 7200 4800 34,56 M Profi fényképezés (60×60mm) 12000 12000 144 M A látás igénye ~3600 ~2800 10,0 M (a foto felbontóképességet 100 vonal/mm=200 képpont/mm számolva) Látható, hogy a normál mozifilmet a szem igényéhez "lőtték be". Ehhez képest a TV szabvány kb. 30× gyengébb, a camcorder 120× gyengébb A jelenlegi legjobb TV (stúdió minőség) kb 2× rosszabb, mint a szuper 8-as amatőrfilm. Az arányokat az 19 ábra is jól szemlélteti 11 1.9 ábra Egyes képközvetítő eszközök felbontásának összehasonlítása (mindkét tengely pixel számban skálázva) Azt is látjuk, hogy az elektronikus fényképezés terjedésének mi a fő akadálya: az, hogy egy tekercs kisfilm 36×34=1224 Mbyte

információt tárol! A versenyképességhez tehát Gbyte körüli kapacitású floppy kellene. Jelenleg már vannak működő megoldások, de az igényekből engedményeket kell tenni (kisebb pixelszám, a minőséget, későbbi nagyíthatóságot rontó képtömörítési eljárások). A mágneses információ-tárolás teljesítőképességének évről-évre növekedését tekintve viszont azt jósolhatjuk, hogy néhány év múlva a kémiai képrögzítés reális alternatívája lesz az elektronikus fényképezés. Érdekesség a szem felbontása dolgában, hogy igen gyenge fénynél, amikor csak a pálcikák dolgoznak, a sárga folt és különösen annak közepe nem működik jól, hiszen ott kevés pálcika van. Láttuk, hogy a pálcikák a legsűrűbben kb a centrumtól 5 mm-re vannak, ezért igen gyenge fényben a centrumtól eltérő helyen látunk a leginkább élesen. 1.8 Villódzásérzet, fúziós frekvencia Az idegingerületek csak egy bizonyos időállandóval tudják

követni a fényintenzitás változásait. Ha a kép fényessége időben periódikusan változik, kis frekvencián (<20 Hz) vibrálást, villódzást tapasztalunk. Ha a frekvencia nagy (>100 Hz), ezt a szemünk nem követi, egyenletes fényességet észlelünk. A frekvencia határt, ami felett a villódzás már nem észlelhető, fúziós frekvenciának nevezzük. Ennek értéke több körülménytől függ, elsődlegesen a megvilágítás erősségétől. Nézzük a dolgot a mérési adatok tükrében. Szinuszosan modulált fénnyel végeztek vizsgálatokat, különböző m modulációs mélységgel és különböző átlag intenzitás mellett. Az eredmények az 1.10 ábrán láthatók 12 1.10 ábra. A villódzási modulációs érzékenység (a jobb oldalon az m modulációs mélység definíciója) Érdekes, hogy van egy 10-20 Hz közötti frekvencia sáv, amelyre a leginkább érzékenyek vagyunk. 2 Hz alatt a 10 % modulációt már nemigen vesszük észre A fúziós

frekvenciát az m=1 vonal adja. Láthatóan egyre nő a megvilágítás erősségével Közepes megvilágításnál 50 Hz körüli, erős megvilágításnál 70-80 Hz. Következtetések: ♦ A hálózati frekvencia (többek között) azért 50 Hz, mert így a villamos fényforrások 2×50=100 Hz villódzása már nem zavar. ♦ A képközvetítésnél legalább 50 Hz-es képfrissítés kell ahhoz, hogy ne érezzünk villódzást. Utóbbit eltérő módon oldották meg a film és a TV esetében. ♦ Film: képváltás 24/sec, takarás 2 vagy 3 ágú pillával (48 vagy 72 Hz, utóbbi a minőségi kivitel.) Amatőrfilm: 16-18 kocka/sec, 3 ágú pilla ♦ TV: váltottsoros letapogatás, abból a korábbi kényszerből, hogy átvitel és megjelenítés szoros kapcsolatban történhetett csak. 25 kép/sec=50 félkép/sec A TV képen, nagy fényerőnél a fehér felületek bizony villódznak. A váltottsoros rendszer nagyon szükségmegoldás! Tulajdonképpen a felére csökkenti a

függőleges felbontást. Mert, ha pl a kép egy vízszintes fehér csíkja egyetlen vízszintes sorra esik, akkor az 25 Hz-cel villog, ami rendkívül zavaró! Ha rajta van egy páros és egy páratlan soron is, a villogás 50 Hz, nem vesszük észre. De akkor a felbontás a felére esik A dolog a számítógépi grafikus perifériáknál vált kirívóvá. Először normál TV monitorokat használtak grafikus display-nak, lehangoló eredménnyel. Ezért át kellett térni az 50 kép/sec (vagy még nagyobb képfrekvenciás), non-interlacing rendszerekre. Mióta az egy képnyi, 0,51 Mbyte memória beépítése egy TV készülékbe nem probléma, az átvitel és a megjelenítés a TV közvetítésnél is szétválasztható, és nagyobb képfrekvenciájú non-interlacing készülék építhető a régi szabványhoz is. 13 Megjegyzendő, hogy a fúziós frekvencia attól is függ, hogy a retina melyik területét használjuk. A fenti mérések a központi látásra vonatkoznak. A

periferikus látás eltérő tulajdonságú lehet A tapasztalat szerint például az ember "a szeme sarkából" nagyobb frekvenciás villódzást is észrevesz, mint az éles látás területén. 1.9 Az adaptáció Az embert érő fényingerek intenzitása igen széles határok között változik: a napsütéses tengerparttól a csaknem sötét szobában való tájékozódásig. Ez kb 8 nagyságrend változást jelenthet! Az emberi szem több mechanizmussal veszi fel e változásokat: ♦ A pupilla méretének változtatásával "leblendézi" a beeső fényt. Ennek időállandója néhány tized s, az átfogott tartomány viszont csak kb. 25-szörös intenzitás változás ♦ A látóbíbor (rodopszin) mennyisége csökken a megvilágítás hatására (éppen ez a fotokémiai reakció indítja az ideg ingerületet). A rodopszin mennyiség esése csökkenti a retina érzékenységét. Sötétben a rodopszin szint visszaáll, regenerálódik Méghozzá: ♦ a

csapokban 6-8 perc alatt, kb. 2 nagyságrend érzékenység átfogással, ♦ a pálcikákban 30-45 perc alatt, igen nagy érzékenység átfogással. ♦ igen kis fénynél a pálcikák csoportokat képeznek, ami az érzékenységet tovább javítja, a felbontás romlása mellett. Az 1.11 ábrán adaptációs görbét látunk A vizsgált személy erős fény után teljes sötétségbe kerül, és kétpercenként megmérik, hogy mi az a fényintenzitás, amit éppen észrevesz. Jól megfigyelhető a pálcikák és a csapok eltérő időállandója. Látható, hogy gyenge fénynél csak a pálcikák működnek. Mivel hozzájuk nem kapcsolódik színlátás, szürke képet látunk 1.11 ábra Az emberi szem adaptációs görbéje Figyelemre méltó a szem igen nagy érzékenysége. Teljes adaptáció esetén a pálcikák 1 fénykvantumra képesek reagálni (egy gyufa fénye 11 km-ről). 1.10 Spektrális érzékenység, színlátás HELMHOLTZ elmélete szerint a szem három alapszínre

érzékeny, ezekből keverhető ki minden szín. A gyakorlat igazolta a három alapszínre támaszkodó színkeverést: a színes nyomtatástól a színes TV-ig. De vajon a szem valóban így működik-e? 14 Jelen ismereteink szerint igen. A csap típusú receptorok három különböző látóbíbort használnak, és ezek spektrális abszorpciós görbéje, tehát színérzékenysége eltérő. A háromféle látóbíbor kísérleti vizsgálata a 12. ábra szerinti abszorpciós diagramokat adja Egyik görbe sem éles vonal, hanem eléggé szétterülő függvények. Az első főleg kékre érzékeny, 445 nm maximummal, a második zöldre, 535 nm maximummal, a harmadik (zöldes)sárgára, 570 nm. Látható, hogy az alapszínek nem pont a megszokott RGB, a vörös helyett a sárga van. De: mivel a bipoláris sejtek síkján oldalkötések, különbségképzések vannak, lehet, hogy ezek a spektrumok transzformálódnak, és végülis a sárga helyett egy a vörös felé tolódott

maximum érvényesül az agy felé továbbított ingerületben. A pálcikák csak egyféle látóbíborral rendelkeznek, amelynek a spektrális érzékenység görbéje kb. 500 nm-nél mutat maximumot (kék) A háromféle csap görbéjét átlagolva viszont 560 nm körüli maximumra jutunk. Ezért gyenge fényben jobban látjuk a kékes tárgyakat, erősebb fényben a sárga-zöld tárgyakat. Gyenge fényben a vörös fekete 1.12 ábra A háromféle látóbíbor abszorpciós görbéje 2. Színlátás, színmérés A színlátás elméletét a XIX. században YOUNG majd HELMHOLTZ alkották meg Helyesen ismerték fel a dolog lényegét: hogy tehát háromféle receptor (csap) van a szemben, három különféle spektrális érzékenységgel. Megállapították, hogy három alapszínre támaszkodva a természetes színek nagyja "kikeverhető". Az ún additiv színkeverésnél a 21 ábra szerinti, MAXWELL háromszög adja a színkeverés tapasztalati ábráját. 2.1 ábra A

Maxwell háromszög 15 A színes fényképezés, majd a TV technikája a szem tulajdonságainak ennél pontosabb, kvantitatív feltárását tette szükségessé. Sok kísérleti személyen végzett vizsgálatokkal megállapították, hogy az átlagos szem számára hogyan utánozható (úgyszólván) bármely szín három alapszín megfelelő keverésével. Itt az "utánzás" azonos színérzet keltését, azonos idegi ingerület keltését jelenti − hogy ez miért lehetséges, arról később. 2.1 Az R,G,B alapszínek Nézzük először az alapszínek választását. Itt a választás a látható spektrum elején − közepén − végén lévő három színre esett: vörös, zöld, kék Red, Green, Blue R,G,B. Így lehet majd az előforduló színek legtöbbjét lefedni. Megjegyzendő, hogy ez a választás azért lehet bizonyos mértékig önkényes, mert ezzel csupám a színmérés vonatkoztatási koordinátarendszerét határozzuk meg. Az alapszínek

válsztásánál a könnyű előállíthatóság is szempont volt. Higanygőzlámpa spektrumvonalaiból szűrőkkel elkülöníthető az alábbi három szín: R G B Hullámhossz [nm] 700,0 546,1 435,8 Intenzitás 1 4,59 0,06 [rel] Ezeket az alapszíneket a CIE (Commission Internationale dÉclairage) 1931-ben szabványosította. Az intenzitás azt a relatív intenzitás arányt adja, amely mellett a három alapszín összege azonos színűnek látszik a látható tartományban egyenletes spektrumú, fehér fénnyel. (Az arányok talán meglepőek; érdemes nagyítóval megnézni a színes monitoron egy fehér területet.) Nézzük most az emberi színérzékelés mérésének módszerét. Ez összehasonlítással megy A 22 ábrán látható ék jobboldalára a minősítendő fény (szín) esik, míg a baloldalra a három alapszín (R,G,B). Utóbbiak intenzitását a szemlélő addig állítja, amíg az ék két oldala között már nem tud különbséget tenni. Ezek után a

kérdéses fény alapszín összetevőit a kapott R,G,B értékek adják (ezek az intenzitással már normálva − tehát a fehér az R=G=B=1). 2.2 ábra Az alapszín-összetevő függvények mérése Végezzük most el ezt a mérést a látható spektrum összes színére, tehát a λ=400÷700 nm tartományra. Közben a mérendő spektrumszínek energiája állandó A 23 ábrán látható diagramokat kapjuk. Ezek a spektrális alapszínösszetevő függvények (CIE 1931 szabvány) 16 2.3ábra A CIE spektrális alapszín-összetevő függvények Látható, hogy r(λ) negatívba megy. Ez a mérésnél a vörös összetevő túloldalra átvitelével oldható meg. Az adott spektrum tartomány tehát a valóságban nem keverhető ki (tökéletesen) a három alapszínből. Ha a kikeverendő szín nem spektrumszín (tehát egyetlen vonal), hanem egy folytonos ϕ(λ) hullámhosszeloszlású fény, úgy tekinthetjük, hogy annak egyes dλ szeletei egy-egy spektrumszínt jelentenek, és

fölöttük szummázunk/integrálunk: ∞ R = ∫ ϕ(λ ) r (λ ) dλ −∞ ∞ G= ∫ ϕ(λ) g (λ) dλ −∞ ∞ B= ∫ ϕ(λ) b (λ) dλ −∞ (Miért tekinthetjük úgy? Mert a háromféle látóbíbor külön-külön összegzi a különböző frekvencián kapott gerjesztéseket, a hatás tehát additiv, lineáris. Ugyan a rendszerben van egy nemlinearitás, a látóbíbor lebomlása folytán (lásd adaptáció) − de ez az összegződés utáni folyamat!) Tanulság: ugyanazt a színérzetet (vagyis ugyanazon RGB mérőszámokat) a legkülönbözőbb ϕ(λ) hullámhossz-eloszlású színek kelthetik. Ez a GRASSMANN törvény Ezek a színek fizikailag eltérőek, de az emberi szem számára nem megkülönböztethetők. Ilyenkor metamer színekről beszélünk. 2.2 Kapcsolat a szem fizikailag mérhető tulajdonságaival Nézzük, levezethető-e ez a szem megismert tulajdonságaiból. Vegyük elő a háromféle látóbíbor fényelnyelési görbéjét: 17 2.4ábra A

három látóbíbor fényelnyelése és az RGB alapszínek helye Jelöljük ezeket ar(λ), ag(λ), ab(λ)-val (a=abszorpció). Az ábrán bejelöltük a három alapszínt: λR, λG, λB . Kérdés: ha az emberi retinára esik egy tetszőleges λX hullámhosszúságú spektrumszín, mely R,G,B intenzitásokkal volna ez helyettesíthető, úgy, hogy a retina mindhárom csapja továbbra is az előbbivel azonos stimulust kapjon? Mindhárom csap abszorpciós spektrumára külön-külön igaz kell legyen az alábbi összefüggés: ar (λ X ) = R ⋅ ar (λ R ) + G ⋅ ag (λ G ) + B ⋅ ab(λ B ) ag (λ X ) = R ⋅ ag (λ R ) + G ⋅ ag (λ G ) + B ⋅ ag (λ B ) ab(λ X ) = R ⋅ ab(λ R ) + G ⋅ ab(λ G ) + B ⋅ ab(λ B ) ami egy 3-ismeretlenes egyenletrendszer R,G és B-re. Mátrixosan írva ⎡ ar (λ x ) ⎤ ⎡ ar (λ R ) ar (λG ) ar (λ B ) ⎤ ⎢ag (λ )⎥ = ⎢ag (λ ) ag (λ ) ag (λ )⎥ x ⎥ R G B ⎥ ⎢ ⎢ ⎣⎢ ab(λ x ) ⎦⎥ ⎣⎢ ab(λ R ) ab(λG ) ab(λ B )

⎦⎥ ⎡R⎤ ⎢G ⎥ ⎢ ⎥ ⎣⎢ B ⎦⎥ A mátrix elemei leolvashatók. Behelyettesítve (relatív egységekben, 2 jegy pontossággal) ⎡ ar (λ x ) ⎤ ⎡1,2 35 4 ⎤ ⎡ R ⎤ ⎢ag (λ )⎥ = ⎢ 0 35 6 ⎥ ⎢G ⎥ x ⎥ ⎥ ⎢ ⎥ ⎢ ⎢ ⎢⎣ ab(λ x ) ⎥⎦ ⎢⎣ 0 0 41⎥⎦ ⎢⎣ B ⎥⎦ Invertálás után a spektrális alapszínösszetevő függvényeket kell megkapjuk: ⎡0,8 − 0,8 0,04 ⎤ ⎡ R = r (λ ) ⎤ ⎢G = g (λ )⎥ = 0,01⋅ ⎢ 0 2,86 − 0,42⎥ ⎥ ⎢ ⎥ ⎢ ⎢⎣ 0 ⎢⎣ B = b (λ ) ⎥⎦ 0 2,44 ⎦⎥ ⎡ ar (λ x ) ⎤ ⎢ag (λ )⎥ x ⎥ ⎢ ⎣⎢ ab(λ x ) ⎦⎥ A számítás eredményét az alábbi ábrán látjuk. Kvalitatíve szépen egyezik a pszichofizikai mérésből származó CIE 1951 diagrammal. (Normálásban az egyenlő integrál szerint jártunk el) 18 2.5ábra Spektrális alapszín összetevők, a látóbíbor abszorpcióból visszaszámolva 2.3 Az additív színkeverés; r,g koordináták Az előbbi

integrálos R= stb. formulákból következik, hogy két ismert spektrumú fény összege ϕ(λ)=ϕ1(λ)+ϕ2(λ) RGB összetevői a ϕ1(λ) és ϕ2(λ) összetevőinek ismeretében komponensenként összegezhetők. Vektoriális összegzés A színérzetek tehát egy 3D vektortérben ábrázolhatók; ennek bármely pontja más színérzetnek (pontosabban intenzitás, szín, telítettség érzetnek) felel meg. A 3D ábrázolás kellemetlen; egyszerűsítsünk. Hagyjuk el az intenzitás információt! r= R R+G+ B g= G R+G+ B b= B R+G+ B Nyilván r + g + b =1. Vagyis az új színkoordináták a régi koordináták origó centrumú vetületei az r+g+b=1 síkra (ami a mindhárom tengelyt 1-nél metsző sík). Az új koordináták redundánsak. Az egyik elhagyható Maradjunk az r,g koordinátáknál Vagyis az r,g,b síkot a b tengellyel párhuzamosan az r,g síkra vetítjük. 2.6ábra Színdiagram az r,g koordinátákban A 2.6 ábrán látható diagram nem túl szerencsés, a több

térnegyedet elfoglaló volta miatt Nézzük a színek összegzését. Az R,G,B térben vektoriálisan Két szín összege a két vektor által kifeszített síkon van. E sík metszése az r+g+b=1 síkkal egyenest ad, utóbbi egyenes vetülete az r,g koordinátarendszerben egyenes. Tehát a fenti diagramon két szín keveréséből adódó eredő az illető két ponton átmenő egyenesen, a két pont között fekszik. Hogy pontosan hol, az a két szín intenzitásától függ. Kiszámolásának biztosan járható útja a színkoordináták visszaszámolása az RGB rendszerbe és összegzés ott. A valóságos színek tartományát a diagramon árnyalás jelzi. Figyeljük meg: az R=G=B=1 fehérnek r=g=0,33 felel meg. 2.4 A CIE x-y koordinátarendszer Csináljunk egy affin transzformációt: az R,G,B koordináta- rendszert képezzük le egy újabb, szintén lineáris X,Y,Z koordinátarendszerre, úgy, hogy 19 ♦ minden valós színingernek pozitív színösszetevők feleljenek meg,

♦ az R=G=B fehérnek X=Y=Z feleljen meg, ♦ az Y összetevő egyúttal adja ki a fénysűrűséget. Az alábbi transzformáció mellett döntöttek: ⎡ X ⎤ ⎡2,769 1,752 1,130 ⎤ ⎡ R ⎤ ⎢ Y ⎥ = ⎢1,000 4,590 0,060⎥ ⎢G ⎥ ⎥ ⎢ ⎥ ⎢ ⎥ ⎢ ⎢⎣ Z ⎥⎦ ⎢⎣ 0 0,057 5,599 ⎥⎦ ⎢⎣ B ⎥⎦ A középső sor az intenzitásokat adja, a sorösszegek egyenlőek. Tehát Y=intenzitás, X=Y=Z fehér. Megint redukálunk az X+Y+Z összeggel: x= X X +Y + Z y= Y X +Y + Z z= Z X +Y + Z Nyilván x + y + z =1. Megint két dimenzióban ábrázolunk, így kapjuk a CIE színháromszöget, színdiagramot, patkódiagramot. 2.7 ábra A patkódiagram A patkó a spektrumszínek vonala, az x=y=0,333 pont a fehér. Azok a színek a fizikailag valóságosak, amelyek a patkón, vagy két patkó-pont közötti egyenes szakaszon feküsznek. Mert ezek lehetnek spektrálszínek keverékei. 20 Az X,Y,Z koordinátákra is meghatározhatjuk, hogy azok milyen arányban

szükségesek egy-egy spektrálszín kikeveréséhez. Mivel ezt az R,G,B koordinátákra vonatkozóan már tudjuk: r (λ ) stb, azokból átszámolhatunk. ⎡ x (λ ) ⎤ ⎡2,769 1,752 1,130 ⎤ ⎡ r (λ ) ⎤ ⎢ y (λ )⎥ = ⎢1,000 4,590 0,060⎥ ⎢ g (λ )⎥ ⎥ ⎥ ⎢ ⎥ ⎢ ⎢ ⎢⎣ z (λ ) ⎥⎦ ⎢⎣ 0 0,057 5,599⎥⎦ ⎢⎣b (λ ) ⎥⎦ Ennek alapján a három új függvény felrajzolható: pl. x (λ ) = 2,769 ⋅ r (λ ) + 1,752 ⋅ g (λ ) + 1,130 ⋅ b (λ ) . Rajzban ábrázolva ezek a CIE x,y,z spektrális színösszetevő függvények: 2.8ábra A CIE x,y,z spektrális színösszetevő függvényei Figyeljük meg, hogy ezek nem-negatívok, tehát valós szűrőkkel megvalósíthatók! Egy tetszőleges spektrumú fényre megint írhatjuk: ∞ X = ∫ ϕ (λ ) ⋅ x (λ ) dλ − stb. 0 Leggyakoribb fényforrásunk, az izzólámpa hőmérsékleti sugárzó. Ebből egy adott hőmérséklethez adódik az ő ϕ(λ) spektruma. Ennek alapján X,Y,Z x,y a

patkódiagramba berajzolhatjuk a hőmérsékleti sugárzó színét. Látható, mennyiféle "fehér" van Ezért szükséges például a fényképészeti nyersanyagoknál a megkülönböztetés: napfényfilm/műfényfilm. Középen van a fehér szín; ezt bármely spektrumszín ponttal összekötve az egyenes mentén ugyanazon szín egyre telítettebb változatait kapjuk. 2.5 Színekre bontás a képfelvételkor Nyilván három képet veszünk fel, különböző szűrőkön át. Állóképnél lehet ugyanazon kamera előtt váltani a szűrőt. Mozgóképnél féligáteresztő tükrökkel, prizmákkal a sugármenet háromfelé hasítandó; 3 szűrő, 3 kamera. Esetleg forgó hármas-szűrő Milyenek legyenek a szűrők? ♦ Lehetnek az x (λ ) stb. karakterisztikával rendelkezők Ekkor előbb-utóbb vissza kell alakítani őket R, G, B-vé. És akkor kiderül, hogy egyes esetekben R negatív Amitől továbbítani még lehet, de megjeleníteni nem. 21 ♦ Lehetnek az r (λ

) stb. karakterisztikával rendelkezők Ekkor közvetlenül juthatunk az R, G, B összetevőkhöz. De: negatív szűrőegyüttható nincs, az R csonka lesz Szín mérésként ez így pontatlan, de a visszaadáshoz jó lehet, hiszen azzal csonka, amit úgysem tudunk visszaadni. Mit jelent ez a csonka? Legyen R1, G1, B1 a tényleges három szönísszetevő, és legyen R1 negatív. A csonkolás megfelel az |R1| hozzáadásának. Ezek után B R = R1 + |R1| G = G1 − |R1| + |R1| B = B1 − |R1| + |R1| B Vagyis: hozzáadódott a színhez egy kis fehér, de torzult is a szín, hiszen |R1| -nyi fehér és egy valamelyest módosult szín összegét kaptuk. A torzulás a gyakorlatban nem túl erőteljes Tulajdonképpen egy olyan csonkolás is elképzelhető, ahol a szín információ nem torzul, csak a telítettség. Ehhez R1 negatív részét nemcsak vágni, hanem pozitív előjellel G és B-hez adni kellene. 2.6 A színvisszaadás problémái Szép, hogy van 3 alapszínünk, ezek nagyon

jók a mérés céljára, de a visszaadáshoz nem feltétlenül. Mert nincs olyan fénypor Ezért a létező, használható fényporokhoz újabb három alapszínt definiáltak (FCC, Federal Communications Commission, USA, 1953). Ezek az FCC alapszínek. A mai TV technikában egyöntetűen ezeket az alapszíneket használják R 0,67 0,33 0,00 G 0,21 0,71 0,08 B 0,14 0,08 0,78 Ha ezeket ábrázoljuk a CIE színdiagramban, kiderül, hogy a lefedett tartomány még kisebb. Beletörődünk. A TV technikában az FCC értelmezésű RGB komponenseket használják. Ha tehát másban adottak az összetevőink, azokat át kell transzformálni, Erre szolgálnak az ún. mátrix áramkörök Ezek analóg áramkörök, amelyek három bemeneti feszültség lineáris kombinációjával (súlyozásával) állítanak elő három kimeneti feszültséget. Ha egy újabb képcső-típus jobb (más) alapszínekkel rendelkezik, a vevőkészülék oldalán korrigálnak mátrix áramkörrel. Az adás

oldalárol a feltételezett (referencia) alapszín rendszer az FCC. Irodalom: Dr. Ferenczy Pál: Video- és hangrendszerek, Műszaki Könyvkiadó, Budapest, 1986 22