Tartalmi kivonat
BME VIK MÉDIAINFORMATIKA SZAKIRÁNY Médiainformációs rendszerek Dr Magyar Gábor BME Távközlési és Médiainformatikai Tanszék alapfogalmak 1 Adat, információ, tudás • Adat: a valóság nem értelmezett (de értelmezhető) tükörképe Az adat nyers (feldolgozatlan) tény, ami valakinek vagy valaminek a jellemzéséhez hozzásegít. • Információ: értelmezett adat • Tudás: az ember által kontextusba helyezett információ Adat Adat + értelmezés Információ Információ + kontextus Tudás Tudás 2 Adat és információ négy dimenzió: ismerni kell a tárgyat illetve jelenséget amelyre az adat vonatkozik általában és konkrétan; + a tárgy bizonyos tulajdonságát, jellemzőjét - általában és konkrétan. Példa: „X autótípus az NCAP biztonsági teszten * minősítést ért el, általában tudni kell, hogy mi az autó, konkrétan tudni kell, hogy mi a mondatban említett autótípus; általában tudni kell, hogy mit értsünk az autók
biztonságán, és konkrétan ismernünk szükséges az NCAP tesztet Adatkezelés • Adatkezelés: a nyers adatok tárolásának, lekérdezésének és manipulálásának feladatai. [adatmodellek, adatbázis-lekérdező és adatmanipulációs nyelvek,stb.] 3 Információmenedzsment • Információmenedzsment: az információk előállításának, rendszerezésének, értékelésének és visszakeresésének feladatai. tudásmenedzsment • Tudásmenedzsment: a szervezeti tudástőke növelését célzó törekvések összessége. (A tudástőke a vállalati vagyon része. Három összetevője: piaci kapcsolatok tőkéje, strukturális tőke, emberi tőke. Az információmenedzsment megoldható kizárólag IT eszközökkel, a tudásmenedzsmentben kritikus az emberi szerep. A gyakorlatban a tudásmenedzsment egyik fontos eszköze az információmenedzsment. 4 5 Tartalom menedzsment (content management) 6 Tartalomjegyzék 1) Mi is az a tartalom? 2) Tartalom
menedzsment 3) Tartalom menedzsment projekt 4) Tartalom menedzsment rendszer (CMS) tervezése 5) Tartalom menedzsment rendszer (CMS) megvalósítása 6) A médiainformációs rendszerek tartalom-szervezési problémája 7) Esettanulmányok, példák 1) Tartalom (content) Adat Adat + értelmezés Információ Információ + kontextus Tudás Tudás 7 Definíciók • Adat: a valóság nem értelmezett (de értelmezhető) tükörképe • Információ: értelmezett adat • Tartalom: egy vagy több célra felhasználható formátumban adott információ ≈ elnevezett információ • Metaadat: „adat az adatról” a jelentés szűkített kifejezési térben A tartalom menedzsment lényege: adattechnológiák segítségével tárolni, kezelni és megjeleníteni a tartalmat „A tartalom menedzsment feladata nevet adni az információknak” A tartalom formátumai Formátum-kategóriák • Az adatok kódolása szerint. Pl: • Bináris, Unicode, stb. • Belső szerkezet
szerint • bekezdés, oldal, alpublikáció, publikáció, szuprapublikáció • Megjelenítési formátum (megjelenítőre leképzés) szerint • Konzisztens formátum egy publikáción belül • Formátum és tartalom elkülönítése • Tipográfiai hatások, Pozícionálási (layout) hatások, Háttér hatások, • Érzelmi hatás alapján • Kiemelés, fontosság, olvashatóság, érdekesség, környezet normái • Alkalmazás típusa szerint 8 A tartalom struktúrája 1 Struktúra: a tartalom egyes egyedi részei között definiált kapcsolatok halmaza • A struktúra elemei: – Kategória (komponens osztály) – Komponens példány – Elem – Reláció A jól struktúrált tartalom jól szervezhető. A tartalom struktúrája 2 A struktúrakészítés nehézségei • • • • • A teljes tartalmat át kell látni Többféle tartalom kezelése Rugalmas megoldás szükséges Saját szabályok érvényesítése, ellenállók meggyőzése A struktúra
működésének megértése (metator – metaadat struktúra alapján módosíthatja a tartalmat) • Többféle egymást átfedő struktúra készítése különféle felhasználóknak 9 A tartalom struktúrája 3 Kategóriák • Cél szerint – Egyetlen publikációra specializált struktúra – Több publikációra specializált struktúra • Típus szerint – Osztott struktúra (tartalom felosztása): szegmensek, elemek – Hozzáférési struktúra: hierarchiák, indexek, kereszthivatkozások, sorozatok – Menedzsment struktúra: követhetőségi és kezelhetőségi attribútumokat tartalmaz – Tartalmazási struktúra: mely komponens tartalmaz másokat • Hatókör szerint – Keresési: csak lényeges elemeket emel ki – Belső: komponensen belüli struktúra – Külső: komponensek közötti struktúra 2) Tartalom menedzsment (content management) A tartalom menedzsment a tartalomgyűjtés, -kezelés és -megjelenítés folyamatát foglalja magába. • Gyűjtés
– Meglévő forrásból információ megszerzése – Konvertálás a fő formátumra (pl. XML) – Darabolás, beépítés a rendszerbe, metaadat hozzáadása • Kezelés: – Repository előállítása (adatbázis és/vagy fájlok) – Tartalom komponensek és adminisztratív információk tárolása • Megjelenítés – Komponensek kinyerése a repository-ból – Publikáció előállítása a komponensekből és funkciókból 10 A tartalomkezelés funkciói Funkció: számítógép interakciós képessége arra, hogy egy adott feladatot elvégezzünk • Monolitikus programok objektumok – Funkció darabokban – Könnyen megtalálható és használható a funkció – Nem kell ismerni a belső működést, csak az interfészt • A tartalom tartalmazza a funkciót is • Hol válik el az információ és a funkció? – Gyűjtés során: információ ill. kód – Kezelés során: tartalom metaadat kapcsolat ill. működés – Megjelenítés során: releváns
tartalom elemek, navigáció ill. kódrészletek közötti integráció Gyakorlati szempontból a tartalom: Képek, videók, hang Irodai dokumentumok Weboldalak Elektronikus Formok Nyomtatási kimenetek Fax Email Papír alapú dokumentumok, mappák 11 A problémák forrásai: tárolás. hozzáférés. verziókezelés. terjesztés riportok, auditok Spagetti effektus 12 Tartalom menedzsment rendszer CMS: Content Management System Három fő részből áll: Gyűjtő rendszer 1 Gyűjtő rendszer: a tartalom bejuttatása a rendszerbe, továbbá tartalom előállítás Lehetséges fő folyamatai: • Írás • Beszerzés – Forrásfájlok: meglévő mmédia-információk, melyeket számítógép tárol (képek, videók, stb) – Újrafelhasználásra tervezett források • Általános szállítható bináris formátum • Metaadattal bővített információ • Átalakítás – Kibontás: lényeges információ kinyerése – Formátum átalakítás: CMS által
támogatott formátumra – Struktúra átalakítás 13 Gyűjtő rendszer 2 • Csoportosítás: különálló média tartalmak struktúrába szervezése – Szerkesztői folyamat: helyesség, kommunikációs szabályok, CMS-nek való megfelelés vizsgálata – Tartalom komponensekbe szervezése (komponenshatárok jelölése) – Metatorial folyamat: metaadat és információ összerendelésének ellenőrzése • Kiegészítő szolgáltatások: tartalom repository-ba töltése – Kész komponensek betöltése egyenként vagy csoportosan Példa: eLearning CMS rendszer --- GYŰJTŐ alRENDSZER • • • • Tanulási objektum előállítása és szerkesztése (Szerzői funkció) Tanulási objektum export/import (szabványos formátum) Tanulási objektum formátum-átalakítása Tanulási objektum metázása Menedzsment rendszer 1 A Repository feladata: hosszú távú tárolás és erőforrások kezelése • Tartalom komponensek tárolása • Konfigurációs és vezérlő
fájlok tárolása – Minták – Hozzáférési információ – Metaadat lista – Szabályok – Napló – Szkriptek és karbantartó rutinok 14 Menedzsment rendszer 2 Adminisztrációs rendszer: CMS struktúra és paraméterek kezelése • Gyűjtő rendszer adminisztrálása – Munkatársak hozzáférése, metaadat és rendszerkonfiguráció kezelése • Menedzsment rendszer adminisztrálása – Felhasználó kezelés, biztonsági másolat, munkafolyamatok kezelése, metaadat ellenőrzés • Megjelenítő rendszer adminisztrálása – Hardver és szoftver eszközök kezelése, amelyek a megjelenítéshez kapcsolódnak Menedzsment rendszer 3 Munkafolyamatkezelő rendszer: Koordináció, ütemezés, munkatársak feladatainak kezelése • Gyűjtő rendszer munkafolyamatai – Tartalom gyűjtés készítés és csoportosítás - workflow, feladatlebontás, ütemezés, kivételkezelés, stb. • Menedzsment rendszer munkafolyamatai – Archiválás, tartalom ellenőrzés,
adatbányászat - workflow, feladatlebontás, ütemezés, kivételkezelés, stb. • Megjelenítő rendszer munkafolyamatai – Kimeneti formátumra alakítás, tartalom-egyesítés/jelölés, kimeneti eljárások - workflow, feladatlebontás, ütemezés, kivételkezelés, stb. (különös tekintettel a kimeneti időzítésekre, menetrendekre, szinkron/aszinkron megoldásra, push/pull megoldásra; forgalom-naplózás, eseménykezelés, stb.) 15 Menedzsment rendszer 4 A Repository feladata: hosszú távú tárolás és erőforrások kezelése Az adminisztrációs rendszer feladata: CMS struktúra és paraméterek kezelése A munkafolyamatkezelő rendszer feladata: Koordináció, ütemezés, munkatársak feladatainak kezelése Menedzsment rendszer 5 A menedzsment rendszer kapcsolatai • • • • Szervezet LAN, WAN környezetével Felhasználók kezeléséért felelős rendszerrel („HR”) Metaadat rendszerekkel Vállalati adatbázisokkal Példa: eLearning CMS rendszer ---
MENEDZSMENT alRENDSZER • • • • Tanulási objektumok tárolása, hozzáférése; sablon-kezelés eLearning workflow menedzsment (szerző, designer, szerkesztő, tanár, stb.) Konfiguráció-kezelés (rendszer és tananyagok) Külső kapcsolatok (HR, külső forrás, ) 16 Megjelenítő rendszer Feladata: Tartalom komponensekből publikáció készítése (automatikusan/félautomatikusan/) Részei: •Publikációs minta (publikációt építő logika) – Statikus elemek – Szolgáltatások hívása – CMS-en kívüli szolgáltatások hívása •Publikációs szolgáltatás (tartalomból és metaadatból építi fel a publikációt) – Minta letöltés és végrehajtás – Publikáció specifikus szolgáltatások biztosítása – Kapcsolatot biztosít a nem CMS-hez kapcsolódó szolgáltatásokkal Megjelenítő rendszer Példa: eLearning CMS rendszer --- MEGJELENÍTŐ alRENDSZER • • • • Publikációs sablonok kezelése Megjelenítő alkalmazás(ok)
illesztése Interaktivitás biztosítása (pl. hallgatói tesztek) Portál funkció 17 Pl.: Webes publikáció • • • • Minta letöltés Paraméterek átadása Minta kódjának végrehajtása Kész oldal visszaadása A CMS szükségessége 1 Sok tartalom Sok szerző - Tartalom elemek -Tartalom típusok - Különféle szerzők - Komplex források Sok változás Sok megjelenítési forma - Tartalom átvitel - Terv ellenőrzés - Tartalom csatornák - Testreszabás • Tartalom mennyiségének mérése (sok, sokféle tartalom) • Tartalom előállító források menedzselése (szabályok betartatása) • Változások mennyiségének becslése – Komponens áteresztőképesség (változtatott komponensek száma/idő) – Kostrukció változtatásának gyakorisága • Publikációk száma (publikáció típusok, testreszabhatóság) 18 A CMS szükségessége 2 A tartalomkezelési feladat komplexitásának becslése:
szerzők*forrásokkomponensektípusokáteresztőképességpublikációtestreszabhatóságújratervezés • • • • • • • Szerzők: 1-20 1 amúgy x/20 Források: 0-1 1 amúgy x/2 Komponensek: 1-500 0.5 501-1000 1 utána x/1000 Típusok: 1-3 0.5 4-5 1 utána x/5 Áteresztőképesség: 1-25 0.5 26-50 1 utána x/50 Publikáció száma Testreszabhatóság: – 1 nem szabható testre – 2 kevés nagy felhasználócsoport – 3 sok kis felhasználócsoport – 4 minden felhasználóhoz külön • Újratervezés: 1-2 1 utána x/2 A CMS szükségessége 3 Komplexitás kiértékelése: • • • • • • • - 0.25: nincs igazi igény CMS-re 0.25 – 05: növekedés esetén lehet igény CMS-re 0.5 – 075: növekedés esetén kell CMS 0.75 – 1: növekedés esetén fel kell készülni a bevezetésre 1 – 1.5: ha nincs növekedés kis rendszer szükséges 1.5 – 10: ajánlott a CMS bevezetése 10 - : CMS mindenképpen szükséges 19 A CMS gyökerei 1 • A
kiadók tudásbázisa – Publikáció – Tartalom gyűjtés – Folyamatok általánosítása • Dokumentum kezelés szabályai – Fájlokban van a tartalom – Fájlokban bináris objektumok vannak • Publikáció egy fájl • Dokumentum és tartalom kezelés különbségei – Fájlokkal – tartalom komponensekkel dolgozik – Más alkalmazásokkal készített fájlokkal dolgozik – vezérli a készítést is – Fájlokhoz való hozzáférés – több komponenshez való hozzáférés A CMS gyökerei 2 • (Multi)média ipar hagyatéka – Elektronikus publikáció – Első tartalom menedzsment rendszerek • Könyvtárak hagyatéka és információs tudomány – Kategorizálás és információ keresés – Információ struktúrája • Szoftverfejlesztés – – – – Gyűjtési technikák Menedzsment technikák Megjelenítési technikák Funkciók az elektronikus publikációkban 20 A CMS gyökerei 3 Dokumentálási feladatok nehézségei – Hatalmas
információs bázis – Párhuzamos publikációk Marketing előfeltételek – – – – Cél meghatározása Érték meghatározása Üzenet Célközönség analízis A CM fő területei képkezelés rekordkezelés dokumentumkezelés tartalom tároló Web-tartalom kezelés 21 A CM ágazatai • Weboldalak (bonyolult webhelyek készítése, karbantartása) • Sokféle publikáció kezelése – Információ feldarabolása publikációs igényektől függetlenül – Terv elkülönítése a tartalomtól – Publikációkhoz a megfelelő tartalom kiválasztásához szabályok • Elektronikus kereskedelem (katalógusok) • Tudás menedzsment – Szintézis és információ megtalálása – Kategorizálás – Tudás portálok • Online közösségek • Testreszabás CM ágazatai – Online közösségek • CMS szerepe: – – – – Tagok aktívan hozzáférhessenek a tudáshoz Repository növekedésének biztosítása Finom kategorizálás, nagyfokú
testreszabhatóság Munkafolyamatokat támogat 22 Testreszabás • Típusai: – Profil alapú: jellegzetességek csoportba foglalása – Viselkedés alapú: korábbi viselkedés alapján – Hosszútávú: tervezett tartalom a tervezett közönségnek • Feladata: – Információ gyűjtése a felhasználóról – Adatok és tartalom összeegyeztetése – Normál környezetben szállítjuk a tartalmat CMS típusok • Web CMS (pl. portál, wiki) • Tranzakciós CMS (e-business) • Digitális vagyonkezelő rendszer (DAM) • Kiadványkezelő rendszer Integráltan: ECMS (vállalati információs rendszer) 23 Web CMS • • • • Web szerveren közzétett tartalom kezelésére Laikus tartalom-kezelés (feltöltés, formázás is!) Üzemeltetés, fenntartás – nem kifejlesztés Gyakran DB alapú, de lehet dokumentum alapú is Tranzakciós CMS • Zárt, vállalati CMS • DB alapú • Üzleti folyamatok támogatására 24 DAM • Digitális vagyonkezelő
(Digital Asset Management) • Szervezeti/üzleti környezetben a digitális formájú tartalom kezelése a szervezeti célok szolgálatában (a szervezeti munkafolyamatok támogatására). DMS • Dokumentumkezelő (document management system) • Elektronikus dokumentumok kezelése • • (e-dokumentum: szövegfájl, multimédia fájl, e-levél, hangfájl, videófájl, eLearning tananyag; papír dokumentum képe, ) Dokumentum kezelési munkafolyamat támogatása („iktatórendszer”) Bemenet, tárolás, keresés, indexelés, metázás, verziókezelés, biztonság, archiválás, stb. 25 ECM Szervezeti folyamatokkal kapcsolatos tartalom leképzésére, kezelésére, felhasználására, tárolására, megőrzésére és terjesztésére Strukturált és félig-strukturált tartalmak Lehet DB vagy dokumentum alapú újabban wiki architektúra kísérletek - Digitális vagyon kezelése (DAM) - Dokumentumkezelés (DMS) - Rekordkezelés - Webtartalom kezelése (WCM) -
Együttműködés kezelés (csoportmunka, wiki, blog, ) Tudás-portál Web alkalmazások virtuális FTP Portál Szerver Alkalmazás szerver Web szolgálat CRM Üzleti folyamat kezelés (BPM) Tartalom-tár fájlrendszer CIFS WebDAV Indexelés, katalogizálás tároló Metaadat DBMS 26 Egyszerű szemléltető példa Felhasználói interfész Szerzői sablonok Alkalmazás szerver publikációs sablonok HTML oldalak adatbázis Az egyszerű szemléltető példa folyamatai Felhasználók elemzése Üzleti stratégia Kiadói folyamatok elemzése Inf. architektúra tervezése munkafolymat tartalom/metaadat modell Szerzői sablonok Megjelenítési sablonok tartalom Tartaom audit megjelenítés Web oldalak 27 eRekordkezelés szabványosan Például: ISO 15489:2001 • Rekordkezelési politika és szabályok • Felelősségek és feladatkörök • Eljárások • Rekordkezelési alapszolgáltatások • Adminisztrációs feladatok és eljárások • A
rekordkezelés integrálása üzleti folyamatokba Néhány példa: Name Platform Supported databases Documentum J2EE SQL Server, Oracle FatWire Java Oracle, Microsoft SQL Server, IBM DB2, Sybase, MySQL I-ON Content Server4 Java/J2EE Oracle, MS-SQL Interwoven Windows, Solaris Oracle, Microsoft SQL Server, IBM DB2, Sybase, Informix, MySQL Jadu PHP SQL Microsoft Sharepoint Portal Server .NET SQL Server Vignette Java/J2EE, Solaris, Linux, AIX, Windows 2003 Oracle, SQL Server, DB2 28 3) Tartalommenedzsment projekt A tartalom menedzsment projekt alapja szabályok definiálása a következők között: – Környezet elemei – Tartalom elemek – Hozzáférés típusok • Szabályok szintjei: – Szöveges („szabad” – primer igényből) – Specifikációs (formális) – Algoritmikus („programozás”) Feladatok osztályozása • Menedzser • Üzleti folyamat elemző • Információ építő • Infrastruktúra tagok • Szoftver fejlesztők •
Megjelenítéssel foglalkozó csapat • Tartalom feldolgozó csapat • Tartalom előállító csapat (ezek tipikus feladatkörök, egy konkrét CMS-ben nem feltétlenül van mindegyik, nem pont ezek, illetve mások is lehetnek) 29 Feladatok - Menedzser • Tartalom menedzser – Teljesen átlátja a CM lényegét – Megtervezi és vezeti a CM bevezetését – A CMS igényeit vázolja cégen belül és kívül • Projekt menedzser – A projekt résztvevőit és erőforrásait kezeli – Elkészíti és betartatja a projekt tervet • Termelés menedzser – – – – A termelés résztvevőit kezeli Megtervezi a termelési folyamatot Betartatja az ütemezést Minőségi és gyorsasági paraméterek készítése és betartatása Feladatok – Folyamat elemző • Kigondolja hogyan illeszkedik a CM projekt a szervezet stratégiájához • Megállapítja a határidőt • Támogatási és együttműködési stratégiát készít a szervezeten belül • Felügyeli az
üzleti folyamatot • Projekt követelményeit meghatározza és kihírdeti • Kigondolja a stratégiát • Együttműködik a projekt csapatával 30 Feladatok – Információ építő • Megtervezi a struktúrálás folyamatát, az információ megjelenítését és a hozzáférést és ezeket meg is valósítja • Tartalom elemző – Összegyűjti a tartalmi követelményeket – Logikai tervet alkot – Fizikai tervet készít az implementációs előírásokhoz – Megbecsüli a ráfordítást – Megtervezi a rendszert • Metator – – – – Ellenőrzi a komponensek metaadat mezőinek helyességét Ellenőrzi a tartalom átalakítás helyességét Kitölti a metaadat mezőket Elkészíti és frissíti a metatorial kézikönyvet Feladatok – Infrastruktúra tagok • CMS adminisztrátor – CMS beállítása – Input tartalom ellenőrzése – Felhasználók és folyamatok karbantartása – Hibák felismerése, javítás – Adatkezelés optimalizálása •
Telepítés elemző – – – – – Szoftver, hardver, konfigurációs és platform igények felmérése Intergráció kigondolása más rendszerekhez Telepítés és bevezetés megtervezése Szükséges munkatársak becslése Szükséges tanulás és támogatás meghatározása 31 Feladatok – Szoftver fejlesztők 1 • Szoftver elemző – Fejlesztői környezet megválasztása – Specifikáció írás – Eldönti mit kell egyedileg megírni – Munkatársak számának becslése • Minta (template) és CMS fejlesztő – Publikációs és bemeneti minták írása – Kisebb programozási feladatok • Egyedi alkalmazás fejlesztő – Gyűjtési, menedzsment és megjelenítési feladatokhoz programok írása Feladatok – Szoftver fejlesztők 2 • Szoftver integrátor – Összeköti a gyűjtő rendszert és a CMS-t más erőforrásokkal – Összeköti a CMS publikációkat más külső erőforrásokkal – Összeköti a megjelenítést a kiszolgálóval • Teszt
elemző és mérnök – – – – Tesztek kifejlesztése és végrehajtása Különféle felhasználói beállítások mellett dolgozik Lazán összefüggő gyűjteményeken is tesztel Publikációk minőségét biztosítja 32 Feladatok – Megjelenítő csapat 1 • Megjelenítés elemző • – Tervező eszköz és környezet kiválasztása – Általános megjelenítési specifikáció készítése – Tartalom megjelenítésére terv kidolgozása – Munkatársak számának becslése Megjelenítés tervező – Megjelenítés specifikáció elkészítés – Oldal fejlesztővel és minta programozóval együttműködik – Tartalom elemzővel is kapcsolatot tart Feladatok – Megjelenítő csapat 2 • Oldal fejlesztő – Megjelenítés tervező specifikációiból kódot készít – Megjelenítés tervezőnek többféle prototípus készítés – Minta fejlesztővel együtt terv és kód összefűzése • Felhasználói felület specialista – – – – Webes
űrlapok tervezése Webes alkalmazás tervezés Oldal használhatóság és olvashatóság biztosítása Szöveg és egyéb médiák beágyazása az alkalmazásba 33 Feladatok – Tartalom feldolgozó csapat • Átalakítás elemző – Tervező eszköz kiválasztása, infrastruktúra tervezése – Specifikáció írás az átalakítást végző programokoz – Eljárás kidolgozása, amelyet a csapat használ majd – Csapat megtervezése, erősségeik megbecslése • Eszköz fejlesztő – Átalakító és komponens előállító modul programozása – Tartalom feldolgozókhoz többféle automatikus feldolgozási lehetőség készítése • Tartalom feldolgozó – Ellenőrzi az automatikus feldolgozás jóságát – Kézzel elvégzendő feladatok, metaadat hozzárendelés • Tartalom QA specialista – Minőségi követelmények ellenőrzése Feladatok – Tartalom előállító csapat • Beszerző menedzser – Egyezkedik és megállapodást köt a forrásokkal –
Lépést tart a beszállítókkal • Forgalom ellenőr – Felügyeli a beszállítást – Lépést tart a CMS munkafolyamatokkal – Torlódások megoldása – Vita feloldása • Írók és más tartalom előállítók • Szerkesztő – Írók helyes útra terelése 34 CMS illesztése a szervezethez 1 • CM és a szervezet kapcsolata – Részlegek és feladattípusok egységes rendszerbe szervezése – Információ összegyűjtése a szervezetről – Kommunikáció a szervezeten belül és kívül – Illeszkedés a meglévő információ kezelő infrastruktúrához • Szervezeti egységek – Üzleti részleg (tartalom és funkciók eljuttatása a közönséghez) – Kommunikációs vagy szerkesztői csapat (tartalom előállítás és szállítás) – IT csoport (kérések egyszerű rendszeren keresztüli feldolgozása) – Marketing csoport CMS illesztése a szervezethez 2 • Információfolyam követése a szervezeten belül – Felfelé irányuló – Lefelé
irányuló – Adott szinten terjedő • Információ értelmezése • Funkciók értelmezése 35 Szervezeti modellek – Gyűjtési mód Szervezeti modellek – Megjelenítési mód 36 Szervezeti modellek – Kezelés módja Minden adatforrásra és tartalomra: – Egységes tartalom struktúra – Egységes szervezés – Egységes hozzáférés Gyűjtés és megjelenítés a gyakorlatban 1 Gyűjtő rendszerek és megjelenítések szervezése típus szerint 37 Gyűjtés és megjelenítés a gyakorlatban 2 Csapatok szervezése Csapatok szervezése 1 • CMS irányító bizottság – CMS szabványok kiválasztása – Együttműködik az új csapatokkal – Tartalom megosztási problémák kezelése és megoldása – CMS felügyelet • CMS csapat – – – – – – Készültség becslése Megbízások kezelése Logikai tervezés Segitségnyújtás az implementálás során Telepítés segítése Karbantartás segítése 38 Csapatok szervezése 2 •
Repository csapat – CMS rendszer kezelése – Tréningek és CMS frissítés (komponens osztályok és elemek) – Gyűjtő és megjelenítési interfészek • Gyűjtő csapat – Gyűjtési igények logikai analízise – Konverziós folyamatok megtervezése – Implementálja, telepíti és karbantartja a hozzá tartozó rendszereket • Megjelenítő csapat – Megjelenítési igények logikai analízise – Megjelenítés megtervezése – Implementálja, telepíti és karbantartja a hozzá tartozó rendszereket A CMS projekt áttekintése „CMS folyamat” 39 Felkészülés a CMS-re - Teendők • Szervezet analizálása • Problémák felderítése – Kategorizálás, összegyűjtés – Központi témák megkeresése • Jelenlegi állapot felmérése • Szervezeti követelmények felmérése • Közönség felmérése • Publikációs követelmények felmérése • Tartalom követelmények felmérése • Rendszer követelmények felmérése Felkészülés a
CMS-re - Dokumentumok • Készenléti állapot becslése • Dokumentum könyvtár és analízise • Rendszer állapotjelentés • Oktatási terv • Projekt terv egyes előzetes elemei – Készültség – Költség és idő – Feladatok osztályozása, elosztása • Kockázatelemzés 40 Követelmények és logikai terv • Követelmények – Tartalomra vonatkozó (milyen tartalmakat, hogyan gyűjtjük és szervezzük) – Megjelenítésre vonatkozó (milyen kimeneti struktúrát akarunk előállítani, hogyan célozzuk meg a közönséget) – CMS-re vonatkozó (szoftver, hardver követelmények) • Logikai terv : hogyan találkozik a CMS a célokkal és követelményekkel – Folyamatok megtervezése – Megfelelő kapcsolatokkal dolgozni – Tartalom struktúra kitalálása Tippek 1 • Követelmények összegyűjtése • Követelmények feldolgozása • Széleskörű közvéleménykutatás • Mindent kategorizálni kell • Tartalomra vonatkozó igények –
Milyen tartalmat akarunk szállítani – Hogyan lehet előállítani a tartalmat – Hogyan lehet összegyűjteni az információt 41 Tippek 2 • Rendszer igények – Integráció más rendszerekkel – Hardver, szoftver – Fejlesztői környezet – Telepítési környezet, telepítés – Hatékonyság – Karbantartás • Logikai terv készítés – Közönség, szerzők és források analízise – Megjelenítés és komponens tervezés – Hozzáférési struktúra tervezés – Munkafolyamatok és feladatok tervezése A követelményektől a rendszerig 42 Követelmények és logikai terv elemei • Gyűjtési terv – Szerzők és források felmérése – Milyen komponensekre lesz szükség – Milyen konverziókra lesz szükség • Kezelési terv • Megjelenítési terv • Elhelyezési terv • Kockázatelemzés és projekt terv – Lehetséges kockázatok – Rendszer követelmények – Tartalom komponensek – Hozzáférések, munkafolyamatok és szerepek
megtervezése Kezelési terv • Komponens séma • Hozzáférési struktúrák – Kereszthivatkozások – Indexelés • Komponensek kezelése – Szerkesztői ellenőrzés – Metatorial ellenőrzés – Archiválás – Verziókezelés – Törlés 43 Megjelenítési terv • Publikációs stratégia – Megjelenítés elemzése – Minta tervek • Oldal tervek – Prototípusok – Makettek • Testreszabási stratégia – Üzenetek – Testreszabás • Megjelenítés adminisztráció – Publikációs menetrend – Szerepek és folyamatok terve Elhelyezési terv • Közönség típusok • Publikációs típusok • Szerző csoportok • Munkafolyamatok és szerepek • Hozzáférés máshonnan (egyszerű fordítás?) • Telepítés • Támogatás 44 CMS kiválasztása (1) • Magas szintű áttekintés (követelmények, logikai analízis) • Piac áttekintése – Ajánlások, vélemények áttekintése – Speciális igények figyelembevétele –
Kérdések írása minden termékhez • Bemutatók megtekintése – Megértés a cél – Követelményekről és igényekről lehet beszélni – Kapcsolattartó emberek keresése • Választási kritériumok elkészítése CMS kiválasztása (2) • Technikai elemzés – Üzletemberek (szerződés) – Szerkesztők, információ építész (gyűjtés, metaadat eszköz) – Programozók (rendszer fejlesztés) – IT (architektúra és telepítés) – Publikációs csoport (kimeneti, megjelenítési képességek) • Projekt igények – Külön fejlesztési igény? – Fontosabb integrációk • Referenciák áttekintése (konferenciák, folyóiratok) 45 CMS kiválasztása (3) • Szállítók (forgalmazók) bemutatója – Megválaszolatlan kérdések feloldása – Szerződés feltételeinek megbeszélése – Költségbecslés • Jelentés a végső döntésről • Kockázatelemzés frissítése • Projektterv frissítés CMS választási kritériumok • Üzleti
érdekek • Fejlesztési környezet • Környezetfüggőség kezelése • Képzési igények • Technikai segítségnyújtás minősége • Telepítési folyamat • Gyűjtési, menedzsment és megjelenítési igények támogatása 46 Implementálás előzményei • Áttekintés – Logikai terv újragondolása – Követelmények újragondolása – Célok áttekintése • Több alprojektre bontás előnye – – – – – Komplexitás kezelése Külső erőforrások bevonása lehetséges Izolálja a problémákat Hatékonyabb megbeszélések Felkészít a későbbiekre Implementálási folyamat részei (1) • Specifikáció készítése – Gyűjtő, menedzsment, megjelenítő rendszerhez • Rendszer installálása – Dokumentálás – Összes lehetőség kipróbálása – Tesztekre is fel kell készülni • Konfigurálás – – – – Rendszer regiszter Eszközök XML fájlok Saját programok segítségével 47 Implementálási folyamat részei (2)
• Tartalom feldolgozás – Bemeneti adatáramlás figyelembevétele – Kimenet ellenőrzése • Minta (template) kódolás – Input minta – Megjelenítési minta • Egyedi alkalmazás fejlesztés – – – – Ha a CMS nem tudja a funkciót A CMS interfészeit kell használni Külön projektben kell csinálni Saját programok segítségével Implementálási folyamat részei (3) • Integráció – Egyedi objektumok – Minták – Tároló rendszeren változtatni kell 48 Rendszertelepítés lépései • Tervezés • Dokumentumok készítése • Kezdeti és folyamatos oktatás • Rendszer beindítása és tesztelés • Folyamatos tartalom készítés • Hibák javítása • A CMS konfiguráció felülvizsgálata • A megjelenítő minták átnézése • Új komponens osztályok és elemek hozzáadása • Új szerző típusok és források hozzáadása Tesztelés • Tesztelés – Tranzakciók növelése – Adatbázisba új oldalak elhelyezése menet
közben • Publikációs teszt – Mi van ha valami adat hiányzik? – Szöveg ellenőrzés – Komponensek • Használhatósági teszt (mennyire érthető és használható a felhasználói felület) • Béta teszt – Belső csopotnak kell végeznie – Először üres futás – Határidők tartása fontos 49 Oktatás • Tréning típusok – Tartalom menedzsment – Szerzői – Tartalom feldolgozás – Adminisztrátor – Weboldal fejlesztő – Minta fejlesztő – Helyfüggő elem kezelő – Telepítés • Formái – Dokumentáció olvasás – Öntanulás – CMS szállító/gyártó oktatása – Gyakorlás – Gyors intenzív tanfolyam Rendszer beindítása • Fokozatai – Egyszerű, különálló környezet, egyszerű csomagokkal – Egyszerű csomaggal valós környezet – Progresszív tartalom hozzáadás és megjelenítés különálló közegben – Progresszív tartalom hozzáadás és megjelenítés valós közegben – Béta teszt – Végső
megbízható rendszer • Általános install – – – – – Egy-két gép használata Szervezetbe illesztés Példa adatbázis struktúra felépítése Nem csatlakozik más külső rendszerekhez CMS minden funkciója installálva van 50 Fontos dokumentumok 1 • Gyűjtési specifikációk – Komponens források – Felelősségek és munkafolyamatok – Gyűjtőeszközök listája – Tartalom konverziós specifikációk – Integrációs paraméterek részletei • Menedzsment specifikációk – – – – – – Közönség analízis Minta analízis Szerzők és más munkatársak Gyűjtés forrásai Menedzsment munkafolyamatok Tartalom hozzáférés struktúrája Fontos dokumentumok 2 • Megjelenítési specifikációk – Publikációs terv – Minták terve – Testreszabhatósági terv • Projekt terv • Kockázat elemzés – – – – – Kockázat felismerése Előzmények Valószínűség Hatás Enyhítés 51 Fontos dokumentumok 3 • Telepítési
specifikáció – CMS rendszer architektúra – Integrációs terv – Gyűjtő rendszer elindítási terv – Publikációs rendszer elindítási terv – Béta teszt terv – Várható és elérhető méretek – Elosztott rendszer terve – Installálási és konfigurációs adat • Csapat terv • Oktatási terv • Dokumentációs terv • Karbantartási terv Dokumentálási tippek 1 • CMS áttekintő (minden résztvevő elolvassa) – Projekt jelenlegi állapota, követelmények – CMS magas szintű diagrammja – Csapat felépítése, felelősségek – Komponensekről és megjelenítésről áttekintő • Termék dokumentáció • Szerzői ismertetők – – – – Eszköz használat Munkafolyamat leírása Szerkesztői és metaadat leírások Használati útmutató 52 Dokumentálási tippek 2 • Gyűjtési útmutató – – – – – – – – – Megállapodás a forrásokkal kapcsolatban Munkafolyamatok Feldolgozási utasítások Eszközök a
feldolgozáshoz Metaadat követelmények Szerkesztői követelmények Kimeneti és bemeneti minták Feldolgozó csapat felépítése Szükséges minőségi és teljesítmény mértékek Dokumentálási tippek 3 • Metaadat útmutató (Részetezi a folyamatos tartalom készítés és visszavonás folyamatát) • Szerkesztői útmutató – Elemek, komponensek és típusok szerint szervezve – Minden információ hozzáférhető legyen – Helyfüggő elemek tervezése • Adminisztrátori útmutató – Rendszer diagramm – Hozzá tartozó szoftverek dokumentációja – Megállapodások – Teljes dokumentáció • Minta útmutató 53 4) Tartalom menedzsment rendszer tervezése (CMS tervezés) CMS kör 54 CMS entitások • • • • • • • • Célok és követelmények Közönség Kiadványok Tartalom komponens osztályok Szerzők Gyűjtő források Munkafolyamatok és emberek Hozzáférési struktúrák CMS entitások - Célok • Szoros az összefüggés:
– – – – Követelményekkel Közönséggel Tartalom komponens osztályokkal Publikációs oldallal • Felmerülő fontos kérdések: – Kinek szól? – Konzisztensek az egyes elemek? – Hogyan lesz a követés és a mérés? 55 CMS entitások - Közönség • Szoros kapcsolat: – Követelményekkel •Kinek szól? Követhetőség, mérhetőség kérdései – Publikációval •Mire számít? Mire figyel fel? Testreszabhatóság – Tartalom komponens osztályokkal •Mire számít? Hogyan osztályoz? Testreszabhatóság – Szerzőkkel •Megértik őket? Hitelesen írnak? – Forrásokkal •Értékes? Hiteles? Közel áll a közönséghez? CMS entitások - Kiadványok • Szoros kapcsolat: – Követelményekkel •Kinek szól? Követhetőség, mérhetőség kérdései – Munkafolyamatokkal, munkatársakkal •Milyen feladatok, események és munkák? – Tartalom komponens osztályokkal •Melyik mintában melyik? Milyen formátum? Mely elemek? –
Közönséggel •Mire számít? Mire figyel fel? Testreszabhatóság – Hozzáférési struktúrákkal •Melyik struktúra? Hogyan tároljuk? Hogyan jelenítjük meg? 56 CMS entitások – Komponens osztályok • Szoros kapcsolat: – Követelményekkel •Kinek szól? Követhetőség, mérhetőség kérdései – Publikációval •Melyik mintában melyik? Milyen formátum? Mely elemek? – Közönséggel •Mire számít? Mire figyel fel? Testreszabhatóság – Szerzőkkel •Milyen eszközzel? Mely metaadatokat? Melyikeket, milyen arányban? – Forrásokkal •Metatorial és szerkesztői lehetőségek? – Hozzáférési struktúrával •Melyik struktúra? Hogyan tároljuk? Hogyan jelenítjük meg? – Munkafolyamatokkal és munkatársakkal •Milyen feladatok, események és munkák? CMS entitások – Szerzők • Szoros kapcsolat: – Közönséggel •Megértik őket? Hitelesen írnak? – Tartalom komponens osztályokkal •Melyeket, milyen gyakran, milyen
eszközökkel használják? Mely metaadatokkal? – Munkafolyamatokkal és munkatársakkal •Milyen feladatok, események és munkák? 57 CMS entitások – Gyűjtő források • Szoros kapcsolat: – Közönséggel •Megértik őket? Hitelesen írnak? – Tartalom komponens osztályokkal •Melyeket, milyen gyakran, milyen eszközökkel használják? Mely metaadatokkal? – Munkafolyamatokkal és munkatársakkal •Milyen feladatok, események és munkák? CMS entitások – Hozzáférési struktúrák • Szoros kapcsolat: – Tartalom komponens osztályokkal •Melyeket, milyen gyakran, milyen eszközökkel használják? Mely metaadatokkal? – Publikációval •Melyik struktúrában? Hogyan tároljuk? Hogyan jelenítjük meg? 58 CMS entitások – Munkafolyamat • Szoros kapcsolat: – – – – Publikációval Tartalom komponens osztályokkal Szerzőkkel Forrásokkal • Felmerülő fontos kérdések: – Milyen feladat? – Milyen munka? – Milyen események?
Munkafolyamat (workflow) Feladatok sorozata, amit munkatársak végeznek el, s amit esemény(ek) triggerelnek. Minden feladatra (task-ra): - a CMS mely részét érinti? - változást hoz-e tartalomban, kiadványban, CMS struktúrában vagy konfigurációban? - ki végzi el? - mely esemény(ek) hatására? - mikor, milyen hosszan tart? 59 Gondolkodj, tervezz, integrálj! Van ebben a megközelítésben – bizony – „tyúk és tojás” probléma. A nagy egymásra hatásban melyiket vegyük elsődlegesnek? A közönség elemzése (időben) korán szükséges. A további sorrend többféle lehet. Célszerű a komponensekkel kezdeni (A hagyományos szemléletű emberek számára inkább az kézenfekvő, hogy a kiadványból indulnak ki.) Mi a CMS? • Szoftverek együttese, amelyek számítógépeken futnak? • Entitások dinamikus egyensúlya a szervezetben? • A rendszer célja(i) • Az eredeti tartalom forrás(ok - szerzők, gyűjtők • A kiadvány(ok), amit készíteni
akarunk • Emberek és munkafolyamatok • Hozzáférési struktúrák Intézkedés, amikkel a célok elérhetők Tartalom-komponensek Rendelkezésre álló komponensek vs. a közönség érdeklődése Munka és feldolgozási igény Hozzáférhetőség, navigáció 60 • Reális intézkedések, • A rendszer célja(i) amelyekkel • Az eredeti tartalom • A célok elérhetők forrás(ok - szerzők, gyűjtők • A kiadvány(ok), amit készíteni akarunk Metaadat kezelése (1) • Metaadat típusok – – – – Struktúra alapján csoportosítjuk (karakter, bekezdés .) Formátum (megjelenítés) Hozzáférés (hierarchiák, hozzáférési struktúrák) Menedzsment (nyomonkövetéshez, adminisztráláshoz szükséges adatok) – Beillesztő (jelöli hogy hová illesztünk adott tartalmat) • Metatorial keretrendszer elemei – Metaadat rendszer – Meta metaadat rendszer – Program kód • Metaadat behatárolása – Egyszerűen kezelhető – Nevek egyértelműek
legyenek – Útmutatóban elmagyarázni a metaadat nevét és értékét 61 Metaadat kezelése (2) • Meta metaadat szabályok (hogyan változtassuk és formáljuk a metaadatot) – Összefűzés és szétdarabolás (hogyan, milyen metódusokkal) – Fentről le vagy lentről fel (tartalomból metaadat vagy fordítva) – Mit tölthet ki a szerző és mit a metator? – Teljes szabadság vagy megszorítások – Opcionális vagy ajánlott • Metaadat és kollekció – – – – – – Komponens osztályok Komponens elemek Elem típusok Elem értékek Használat szabályai Változási szabályok Metaadat kezelése (3) • Metaadat és menedzsment – Ellenőrzési folyamatok – Komponensek archiválása, visszavonása – Növekedés • Metaadat és megjelenítés – Komponensek (melyeket használja minden megjelenítés?) – Minták – Választás (melyik komponenst használjuk választásra? pl. dátum) – Testreszabási elemek 62 Közönség felmérése •
Fontos kérdések – Tartalmat differenciáljuk a különböző személyeknek? – Felhasználói profilokat akarunk készíteni, karbantartani? • Helyfüggő elemek – Kultúra – Folyamat • Mit kell helyhez igazítani? – Kifejezések, metafórák – Többletjelentés – Referenciák • Helyfüggő elemek és CM – Kollekciók (helyfüggő és helyfüggetlen tartalom) – Menedzsment – Megjelenítés (megfelelő tartalom a megfelelő helyen) Közönség analizálás szempontjai • Azonosítás (viselkedés alapján) • Népesség • Magatartás • Összevetés másokkal • Értékítélet • Használat • Profilok • Helyfüggő elemek • Integráció 63 Megjelenítés tulajdonságai • Cél • Publikáció előállító csapat – Menedzsment – Szerkesztő – Technikai – Alkotó (kinézet kialakítása) – Architektúra (rendszer struktúra és tartalom) • Közönség • Üzenetek • Tartalom • Struktúra • Frissítés gyakorisága
Minták szerepe (1) • Általában – Összeköti a publikációt a CMS-el – Statikus és dinamikus részek összerakása – Publikációs részeket készít (oldal, szekció) – Többféle megjelenítés ugyanabból a tartalomból – Logikát használ (tartalom kiválasztás, feldolgozás, hozzáadás) – Más minta is beilleszthető • Repository szempontjából – – – – – Lekérdezés Használja a tartalom sémáját Hozzáférési struktúrákat is használ Adatot tárol a felhasználóról CMS szolgáltatásokat használ 64 Minták szerepe (2) • Publikáció szempontjából – Tartalom környezetét állítja elő – Formázza a tartalmat – Struktúrát alakít ki – Testreszabás alapján a publikáció közönségét célozza meg • Külső rendszerek szempontjából – Csatlakozás – Lekérdezés – Adat küldés Testreszabás • Típusai – Profil alapú – Viselkedés alapú – Hosszú távra tervezett • Testreszabás a mintában –
Eltérés az alapértelmezettől – Más a minta • Megjelenés helye szerint – Oldalon belüli minta – Navigációs minta – Komponensen belüli minta 65 Megjelenítés analízis szempontjai • Alaptulajdonságok • Használati esetek • Üzenetek • Formátumok • Struktúra • Frissítési közök • Helyfüggő elemek • Feladatok • Integráció Minta analízis szempontjai • Oldal/szekció elemzés • Minta felmérés • Navigációs minta felmérés • Komponens minta elemzés • Helyfüggő elemek • Feladatok • Integráció 66 Testreszabás analízis szempontjai • Profilok • Viselkedés • Jelölésrendszer kidolgozása • Szabályok • Egyszerű nyelvi szabályok • Minták • Extra adat • Helyfüggő elemek • Feladatok • Integráció Komponensek tervezése • Komponens vagy oldal – Tartalom és kinézet külön változik – Elosztott tartalom (több oldalon ugyanaz a tartalom) – Oldal készítés gyakran automatikus
– Nemcsak web oldalakat kell előállítani • Komponens és objektum – Osztályai és példányai vannak – Elemei vannak (típusuk és értékük van) • Tárolás – – – – Egyszerű fájlok Struktúrált fájlok Relációs adatbázis Objektum orientált adatbázis 67 Komponens és funkció kapcsolata • Funkciók céljai – Csatlakozás más rendszerekhez – Navigáció segítése – Kommunikáció • Osztályok és példányok – Egy példány/osztály – Néhány általános osztály – Osztály több példánnyal Komponens elemzés szempontjai • Információ komponensekre osztása • Azonosítás • Megvalósítás • Életciklus • Elemek • Helyfüggő elemek • Feladatok • Integráció 68 Szerzők kezelése • Szerző: információt, funkciót állít elő • Tartalom megváltoztatása: hogyan kell az eredeti tartalmat a CMShez igazítani • Szerzők megváltoztatása – – – – – – Tudniuk kell, hogy mit kell
elkészíteniük Tudniuk kell ki a megcélzott közönség Visszacsatolás szükséges a saját csoportjától Visszacsatolás szükséges a közönségtől Érdeklődési körének megfelelő téma Jutalom az extra teljesítményért Szerzők csoportosítása • Metaadat szerint • Technikai hozzáállás (ismeretek, eszközök) • Befolyásolhatóság szerint – Csapaton belül – Szervezeten belül – Szervezeten kívül – Beosztott – Önkéntes • Serkentés szempontjából – Haszon – Érdeklődés – Önzetlenség 69 Szerzők elemzési szempontjai • Tartalom források • Azonosítás • Szerzők értékelése • Helyi szerzők (helyfüggő és helyfüggetlen tartalom ellenőrzése, készítése) • Komponensek és szerzők • Feladatok • Integráció Hozzáférés meglévő forrásokhoz • Források keresése – Dokumentumok – Táblázatok, bemutatók – Képek, nemszöveges média – Adatbázisok • Újrafelhasználásra készített
források – – – – – Folyamatos utánpótlás Letöltés Szállítás Összefésülés Feltöltés 70 Funkciók tervezése • Közönség igényei • Hogyan kombinálod és osztod fel? • Teljesítmény és méretezhetőség • Kiterjeszthetőség • Sikeresség mérőszámai • Tervezésnél figyelembe kell venni: – Milyen folyamatot akarunk használni – Milyen változtatásokat kell a funkción csinálni – Hogyan jelöljük a funkciót Forrás analízis szempontjai • Azonosítás és áttekintés • Viszony a forrásokkal • Tulajdonságok és jogok • Átalakítás, konverzió • Funkció • Lokális források • Kapcsolódás más forrásokhoz • Feladatok • Integráció 71 Hozzáférési struktúra tervezése • Hozzáférési struktúra (nehéz karbantartani és drága) – – – – Hierarchiák Indexek Kereszthivatkozások Sorozatok Hierarchiák • TOC • Vázlat • Osztályozás • Egymásba ágyazás • Osztály
struktúra és objektum modell • Figyelembe kell venni: – – – – – Természetes felosztást Általánosan érthető legyen Max. 7 kategória/szint Erős megkülönböztetés A legegyszerűbb a legjobb 72 Indexek és kereszthivatkozások • Index – Kulcsszó – Nagyszótár • Figyelembe kell venni: – A megjelenítési technikák előnyeit ki kell használni – Belső vagy külső szótár • Kereszthivatkozás (link) • Figyelembe kell venni: – – – – Következetes szabályok Egyértelmű elnevezés Közelség Ne duplikáld a hierarchiát Hozzáférési struktúra elemzés szempontjai • Tartalom tárgyköre • Közönség hozzáférés • Hierarchia • Indexek • Kereszthivatkozások • Sorozatok • Szöveges keresés • Publikációs navigáció • Tartalom modell 73 Munkafolyamat diagram • Elemei – – – – – Trigger Objektum Lépés Aktor Feladat (egyetlen személy, egységnyi idő alatt végzi el) • Feladat típusai
– Push (mi adjuk ki a feladatot) – Pull (betesszük a tárolóba a feladatot típus és prioritás szerint, aki akarja kiveszi) Munkafolyamat elemzés szempontjai • Munkafolyamat elemzés – – – – Feladatok előkészítése Feladatokból munkafolyamat Lépések szabályozása Integráció • Szerepkör elemzés – – – – Jártasságok és idő felmérése Jártasságok és feladatok munkákra osztása Szerepkörök becslése Integráció 74 5) Tartalom menedzsment rendszer megvalósítása XML és tartalom menedzsment (1) • XML – Adatcsere formátum – Tag-ek (elemek), alelemek, attribútumok • DTD (Document type definition): struktúra betartatása – Tag nevek – Engedélyezett alelemek – Megengedett attribútumok • Kinézet hozzáadása – Kinézetre utaló tag-ek az XML-be – Transzformáló program írás – XSLT (Extensible Stylesheet Language Transformation) használata 75 XML és tartalom menedzsment (2) • Gyűjtési folyamat
– Szerzők közvetlen hozzáférése a CMS-hez XML-el – Átalakítás más formátumról és DTD ellenőrzés – Szabályok betartatása (DTD) – XML gyűjtés és konvertálás komponenssé • Menedzsment – Objektum repository – Relációs adatbázis repository (XML egy rekord mező) – Fájl rendszer • Megjelenítés – XSLT • Integráció – Parancs és adatcsere formátum Tartalom feldolgozása • Hosszú távú előnyökre optimalizálás – – – – – – Automatizálás Kevesebb kézimunka Kisebb emberi erőforrás szükséglet Széleskörű felhasználói mintára tervezni Jó felhasználói felület Mindenféle kivétel lekezelése • Rövid-távú előnyökre optimalizálás – Kamikaze mód (mindig csak azt kell kifejleszteni, amire feltétlenül szükség van) 76 Tartalom feldolgozás kezelése • Célok meghatározása • Könyvtár létrehozása tartalommal • Specifikációk elkészítése • Végleges projektterv • Fejlesztés
megkezdése (alap algoritmusok, folyamatok) • Szimuláció • Fejlesztés befejezése • Munkatárs felkészítés előkészítése (dokumentumok) • Munkatársak felvétele, képzése, folyamat elindítása • Folyamatok ellenőrzése, eszközök Feldolgozási folyamat • Feldolgozási folyamat dokumentálása – – – – – – Forrás specifikáció Cél specifikáció Folyamat specifikáció Minőség ellenőrzési megoldás kidolgozása Munkatársak specifikálása Üzleti szempontok • Tartalom összekapcsolása komponensekkel – – – – – Direkt (egyező elemek) Indirekt (valamilyen szabály alapján) Többértelmű (1 elemhez több célelem) Célelemek között nincs megfelelő Forrásban nincs jelölve, vagy rosszul van jelölve 77 Gyűjtő rendszer szolgáltatásai • Web alapú űrlapok – – – – – – – Egyszerű szöveg beírás Nyelvhelyesség ellenőrzés Fájl feltöltés Hivatkozás mezők (meglévő komponensekre)
Kereszthivatkozás Hierarchikus viszonyok kezelése DTD alapú űrlapok • Fájl alapú • Több komponens egyidejű betöltése Gyűjtő eszközök kiválasztása • Szerző eszköz – Szöveg, kép, animáció, hang • Gyűjtő eszköz – Begyűjtött fájlok prioritizálása – Formátum megfelelőség vizsgálata – Szűrés – Transzformálás • Konverziós eszköz • Összefűző eszköz (tartalom és repository szinkronizálása) 78 Szerzői rendszer fizikai terve • Integráció a szerző környezetbe – CMS indítja a szerző eszközt – Eszköz közvetlenül a CMS-ből nyílik meg – Bemeneti minta az eszközbe – Check in és Check out (verizókezelés) – Integrált munkafolyamat kezelés • Fájok beküldése • Visszacsatolás – Publikációs minták és nézetek – Munkafolyamat tervezéshez minták – Célközönség visszacsatolása Gyűjtő rendszer fizikai terve • Oldalak migrálása – Oldalak komponensekké alakítása –
Komponensek és környezetük szétválasztása – Elemek felderítése (komponensek szétbontása) • Jogosultság és használat kezelése – Extra metaadatok – Minta logika (publikációs) – Használati megszorítások, testreszabás – Jelentések • Automatikus tartalom gyűjtés – Kapcsolat, lekérdezés, leképezés, hibakezelés 79 Aggregációs rendszer fizikai terve • Metaadat gyűjtés és megosztás – Import és export metaadat lista – Metaadatok alkalmazása • Metaadat kezelés – – – – Összevonás Szétválasztás Ellenőrzés Opcionális és kötelező elemek Repository funkciói • Alapfunkciók – Tartalom betöltése, tárolása, törlése – Tartalom megtalálása – Tartalom visszaadása tetszőleges formátumban • Kiegészítő funkciók – – – – – – Tartalom követése (jelentések, statisztikák) Integráció a munkafolyamat kezelő modulhoz Keresés a repository-ban Egyszerre több komponens kezelését is
támogatja Minden fájltípust kezeljen Szervezeti szabványokhoz igazodjon 80 Tartalom tárolása • Relációs adatbázis – Tábla = komponens osztály – Sor = komponens példány – Előnye: könnyű megérteni, jó teljesítményű – Hátrány: nem flexibilis, nem szabályos infó kezelése nehéz • XML alapú repository • Fájl alapú repository • Keresési stratégiák – Komponens alapján – Elem alapján Menedzsment rendszer fizikai terve • Teljes repository DTD-je (document type definition) • Link vizsgálat – Szerző linkek komponensekre, elemekre, szövegekre – Struktúra (linkek kezelése, ID, típus) – Menedzsment (rossz linkek kezelése, javítása) – Megjelenítés (többféle link megjelenítési mód) • Média ellenőrzés – Referenciák ellenőrzése (ott van-e ahol kell) – Áthelyezésnél • Keresés és áthelyezés – Bizonyos helyeken keres vagy egész tartalomban – Reguláris kifejezéseket támogat –
Struktúrakövető – Programozható • Menedzsment integráció 81 Megjelenítő rendszer részei • Publikációs platform – Webes, nyomtatás, disztribúció, e-mail • Publikációs minták – Célformátum szintakszisa – Céloldali struktúra – Komponensek elhelyezése – Egyszerű szövegek támogatása – Funkciók hívása • Programkód – Hozzáférés repository-hoz, fájlokhoz, külső objektumokhoz – Dinamikus tartalom feldolgozás és kezelés – Fájl és könyvtár létrehozás Hozzáférési struktúrák és navigálás • Hierarchiák – Kategóriák használata (statikus, dinamikus) – Szűrés (alrészek) – Többszörös hierarchiák • Indexek • Kereszthivatkozások • Sorozatok 82 6) A médiainformációs rendszerek tartalom-szervezési problémája 1970s: ISIL Printed books Limited reuse Single purpose 1980s: BookMaster, IPF Printed and online books, online help 1990s: SGML, HTML Need for change in 1990s Online
information, webs, printable & printed books Alternatives to books One book-centered DTD Information architecture Shorter cycles, fewer people versus monolithic DTDs, long learning curves. Need for faster, cheaper. Reuse 2000+ XML-based semantics Components, multiplatform, open systems Web-deployed products and information Partner and OEMuse of information 83 A (gyakorlati) igény Egyszeres forrás XML topic 1 Többszörös kontextus Information web A: 1, 2, 3 XML topic 2 1 3 2 Print A: 1, 2 XML topic 3 2 XML topic 4 Information web B: 2, 3, 4 4 3 Az XML igérete • Igéret – A tartalom és a forma leírásának szétválasztása (a tartalom újrafelhasználhatósága különböző média összeállításokban) – Specifikus jelölő készletek a tartalom leírására – Standard megoldások a könnyű információ-cserére • A valóság – generikus XML – Egyszerű szintakszis – A generikus megoldás nem mindig gazdaságos a specifikus
igényekhez – A tudásreprezentáció a szervezeti kultúrán alapul (a fix sémák sokáig hordozzák a múltat) – Minél hasznosabb specifikus jelölő nyelvet alkalmazunk, annál többe kerül (kevesebben osztoznak a költségen) 84 Egy válasz a problémára: DITA • Darwin: öröklődési és specializációs elv • Information Typing: alaptípusok: fogalom, feladat, hivatkozás az információ architektúrához (műszaki dokumentumokhoz) • Architektúra: modell a tervezés és az eljárások kiterjesztésére Darwin Information Typing Architecture: DITA • DITA 1.0 specifikáció (OASIS szabvány) • – Vállalatok (BMC, Boeing, IBM, Intel, Lucent, Nokia, Sun, ) – Szervezetek (könyvtárak, stb.) – XML tool vendors (Arbortext, Blast Radius, Idiom, Rascal, Syntext) – Tanácsadók (Comtech, Innodata, Mulberrytech) Open Toolkit (DITA-OT): – http://dita-ot.sourceforgenet 85 Az OASIS • Organization for the Advancement of Structured Information
Standards • not-for-profit, nemzetközi konzorcium a strukturált információkezelési szabványok fejlesztésére és adaptálására • 1993-ban alakult • több, mint 5000 tagja van (>600 szervezet) Mi a nyílt szabvány? • Nyilvánosan elérhető, folytatólagos verziókkal • Átlátható folyamatban készült • Nyitott a külső véleményekre (észrevételek, köz-szervezetek, nincs kizárólagos jogosult alany) • Tekintettel van a szerzői jogra 86 OASIS műszaki szabványok ASAP, BTP, ebXML-BP, WSBPEL, WSCAF CIQ, CGM, DocBook, OpenDocument, UBL ORCHESTRATION & MANAGEMENT DATA CONTENT DCML (x3), WSDM, WSRF, WS-Notification SPML, XACML, (DSML) AVDL, eGOV, Election, eProc, Emergency, Legal XML, Materials, PLCS, PPS, TaxML, TransWs, WAS, XLIFF, (Auto Repair) ABCM, (Conformance), ebSOA, FWSI, SOA Blueprints, SOA-RM SECURITY & ACCESS SOA DESCRIPTION ebXML CPPA, HumanML, UIML, WSRP DSS, PKI, SAML, WS-Security, XCBF DITA, EntityRes, Topic Maps,
Pub. Subj, XDI, XRI MESSAGING ebXML MSG, ebXML IIC, WS-Reliability, WS-RX DISCOVERY COMMON MESSAGE (XML) COMMON TRANSPORT ebXML, RegRep, UDDI Relax NG, XSLT Conformance DITA • Szabványos keret XML dokumentumtípusok kezelésére és kiterjesztésére • XML menedzsment: – Interoperabilitás és eszközfüggetlenség – Újrafelhasználhatóság – Szerzői együttműködés (collaborative authoring) 87 DITA • Információ strukturálás XML alapon (jobb információ csere) • • • • • Téma orientáltság Szemantikus cimkézés (tagging) Újrafelhasználhatóság (tartalom, tervezés, eljárás) Feltételes feldolgozás, automatikus linkelés és link ellenőrzés A tervezés, feldolgozás, szótárak inkrementális specializációja A DITA tervezése elvei • Téma orientáltság • Téma granularitás • Típusok • Specializáció – Jelentéssel bíró információ-egység (a célnak megfelelő specifikus tárgy) – Self-contained
topics combine with other topics into information sets – DTD és séma: a DITA típusok specifikus információ struktúrákat követnek – Architectúra az alaptípusok kiterjesztésére, új típusok (akár adott információkészleten belüli specifikus felhasználásra) • Közös osztályok – A legfelső-szintű "generikus" alaptípusok alá csatlakoznak a specifikusak 88 Alapkoncepció Témák DITA térképek Termékek DITA információ típusok téma fogalom feladat hivatkozás 89 DITA dokumentum umentum típusok Other DITA for Software DITA for eLearning DITA for Hardware Base DITA DITA keret ` Other Other SGML XML Elements, attributes, entities, DTDs, schemas XHTML S1000D DocBook DITA Architecture Topics, Maps, Content Reuse, Specialization Hagyomá Hagyományos doc típusok Újra-felhasználhatóság • tartalom • tervezés • eljárások 90 A tartalom újrafelhasználhatósága • „téma-granularitás” elve
A könyv, mint „témagyűjtemény” Part II Part I Part III Chapter 1 overview Chapter 2 overview Chapter 3 overview Chapter 4 overview Chapter 5 overview Chapter 6 overview Topic A Topic A Topic A Topic A Topic A Topic A Topic B Topic C Topic B Topic C Topic B Topic C Topic B Topic C Topic B Topic C Topic B Topic C 91 A tartalom újrafelhasználhatósága • A téma alapúságból következik • Különböző kontextusokban • Több-komponensű témák integrált megoldásban Témák újrafelhasználása termékekben • Témák termékekhez egy készletből (pool). – „A” termék: 1. és 4 témákat – „B” termék: 2. és 4 témákat használja „A” termék „B” termék Téma 1 Téma 2 Téma 3 Téma 4 92 A DITA térképek szerepe • A DITA térkép kontextusba helyezi a témákat • Egy témacsoportot hierarchiába és sorrendbe szervez Különböző termékekhez különböző szervezés (nem csak a forma különbözik) Egy
téma különböző csoportokban szerepelhet Többféle nézet (multiple views) lehet ugyanarról: termék szerint, feladat szerint, • Témajellemzőket állít be a hierarchia pozícióihoz Jellemzők: cím, más metadatok A szülő témára hivatkozás Architect Build Write Eclipse help JavaHelp HTMLHelp Web pages Books & PDFs Learning Information Architecture Map Topics Build Maps Outputs 93 A tervezés újrafelhasználhatósága • A specializáció elve A tervezés újrafelhasználhatósága • Az általános típus ritkán elegendő – Alaposabb követelmény specifikáció indokolt • A követelményeknek való megfelelés új elemekkel – Az új elem specializálja a létező elemet – Az új tartalom az alap-tartalom subset-je • Különbséget kezel – az alap-tartalomhoz képest • Moduláris 94 Specializáció: témából feladat topic task title title prolog prolog metadata metadata body taskbody related-links related-links
Small DTD additions to enforce document structure. prereq result context taskxmp example steps postreq step May have no CSS or XSL process changes. cmd, cmd, (info (info | substeps | substeps | tutorialinfo | tutorialinfo | stepxmp | |xmp choices|choicetable)*, | choices)*, result? stepresult? Feladatból üzleti teendő task businesstask title title prolog prolog metadata Additional structure changes. metadata taskbody btaskbody related-links related-links prereq result prereq result context taskxmp example context example steps postreq bsteps postreq step cmd, cmd, (info (info | substeps | substeps | tutorialinfo | tutorialinfo | stepxmp | |xmp choices|choicetable)*, | choices)*, result? stepresult? step appstep appdesc 95 Topic Reference Task Concept minitask bctask manpages UI help APIs Messages A téma (topic) a gyökér. A tervezés különbség-alapú (inkrementális): különbség egy speciális feldolgozás is. Java APIs C++
APIs Eljárás újrafelhasználhatósága • A specializáció elve 96 Eljárás újrafelhasználhatósága • • Az alap-eljárás: XSLT Osztály-szerű eljárás-öröklődés (class-like inheritance of processes) – A standard eljárás testre szabható – Új elemek specifikus viselkedésűek lehetnek • Az alap-elemek eljárásait „alapból” alkalmazzák a specializált újakra – de új eljárás is írható azokra XSLT DITA Task Lehetséges kimenetek Lista, szeparátorral task title web prolog metadata taskbody PDF dokumentum related-links prereq result context taskxmp example steps postreq Varázsló (wizard) step cmd, cmd, (info (info | substeps | substeps | tutorialinfo | tutorialinfo | stepxmp | xmp | choices|choicetable)*, | choices)*, result? stepresult? Automatikus végrehajtás Automatikus validálás 97 Specializált eljárások A specializált eljárás a specializált téma típus különbségeit kezeli Alap és különbségi
DTDk Alap és különségi feldolgozók Alaptéma Alap feldolgozó Task bcTask fogalom Specializált feldogozó hivatkozás bcHivatkozás ESETTANULMÁNYOK, PÉLDÁK 98 Web tartalom menedzsment rendszer 1 Web tartalom menedzsment rendszer 2 A rendszer részei: • Content Management System: tartalom begyűjtése, munkafolyamat kezelés, adminisztráció • Repository: tartalom, adminisztrációs adat, erőforrások tárolása • HTML oldalak: a rendszer statikus kimenete • CMS által előállított adatbázis: dinamikus kimenethez szükséges publikus információk tárolása • Egyéb adatforrások • Minták (template): a kimenet dinamikus részeit illesztik a statikus részbe 99 esettanulmány Hosszú távú megőrzésre szolgáló dokumentum archiváló rendszer Mi a „digitális dokumentum”? • Nincs konvencionális definicíó • eredetileg: file, amit szövegszerkesztővel hoztunk létre a kifejezés textuális objektumra vonatkozott •
megváltozott: a digitális dokumentum tartalmazhat grafikát, képet, hangot, animációt, videót A „papír” rekord • Közvetlenül olvasható az ember számára A digitális rekord • egyes formái nem is fejezhetők ki a hagyományos „hard-copy” médiában – pl. interaktív web lapok, dinamikus web lapok, GIS alapú lapok, stb. • Egy alkalmazás kombinálhat sok komponenst 100 Gyűjtés • Gyűjtő alrendszer: dokumentumokat gyűjtünk azzal a céllal, hogy megőrizzük az utókornak - nem tudjuk mennyi ideig („akármeddig”) - nem tudjuk, kik lesznek a jövőbeli felhasználók (nem ismerjük a felhasználás módját) MS Word page layout nézet 101 Formázott text nézet •Key Technical Problems of Long-term Digital Archiving of Documents •Dr. Gabor Magyar •Budapest University of Technology and Economics •Dept. of Telecommunications and Media Informatics •Budapest, Hungary •email: magyar@tmit.bmehu •Abstract •The paper analysis the
technical aspects of long-term archiving of digital documents, based on functionality and fundamental categories. The long-term archiving of digital documents is a very challenging task, because of policy, legal, intellectual property rights, metadata, semantic support and other issues. The variety and complexity of digital documents as IT objects brings up a basic question: does it necessary to preserve the variety and complexity of the original objects? (What is äoriginalö in the space of digital documents?) The answer in general ĺnoĺ, essential attributes of a document are preserved when the document is transformed to different platforms. There are many reasons to change the format of a document, crossing technological boundaries (eg. platforms, operating systems, applications). •The paper uses the categories of physical, logical, and conceptual layers in order to define generic properties that are true of all digital documents. The paper overviews the basic requirements in
all three layers of categories, than describes the typical relationships among the properties of any object at these three layers. This approach gives an overall framework for general preserving strategy managing technical obsolescence and semantic mutations. Word file forrás •fs24lang1038langfe1038cgridlangnp1038langfenp1038 {fs32insrsid15163865charrsid15689867 Key Technical Problems of Long-term Digital Archiving of Documents •par }pard qc li0 i0sb240 owidctlparfaauto in0lin0itap0 {fs28insrsid15163865 Dr. Gabor Magyar •par }pard qc li0 i0 owidctlparfaauto in0lin0itap0 {fs28insrsid15163865 Budapest University of Technology and Economics •par Dept. of Telecommunications and Media Informatics •par Budapest, Hungary •par }{ifs28insrsid15163865 email: magyar@tmit.bmehu •par }pard qc li0 i0sb120sl360slmult1 owidctlparfaauto in0lin0itap0 {fs28insrsid15163865 •par }pard qj li0 i0sb120sl360slmult1 owidctlparfaauto in0lin0itap0 {fs28insrsid15163865charrsid2762722 Abstract
•par }{fs28insrsid15163865 The paper analysis the technical aspects of long-term archiving of digital documents, based on functionality and fundamental categories. The long-term •archiving of digital documents is a very challenging task, because of policy, legal, intellectual property rights, metadata, semantic support and other issues. The variety and complexity of digital documents as IT objects brings up a basic question: does •it necessary to preserve the variety and complexity of the original objects? (What is 84original94 in the space of digital documents?) The answer in general quote no quote •, essential attributes of a document are preserved when the document is transformed to different platforms. There are many reasons to change the format of a document, crossing technological boundaries (eg. platforms, operating systems, applications) 102 • Az „olvasás” összetett folyamattá válik: szöveg – megjelenés – forma jel – formátum – struktúra
tartalom – megjelenés - struktúra Mi az „eredetiség”? a digitális dokumentumok terében? Tökéletesen másolható – bit by bit. 103 Másolni kell a digitális dokumentumokat • mert – nem időtálló • és változik a formátuma Meg kell őrizni az eredeti objektum változatosságát? Az alkalmazási céltól függ. Általában autentikus dokumentumok megőrzése a cél. Kommunikációs csatorna, ami információt továbbít a jövőbe. 104 Hogy megőrizz fizikai doku-t Őrizd jól egy digitális dokumentumot Légy képes előállítani a tárolt adatokat, újraépíteni komponenseiből, interpretálni szintaktikáját Hogy megőrizz fizikai doku-t Őrizd jól egy digitális dokumentumot biztosítsd a képességet a reprodukcióra 105 A modell A digitális dokumentumok leírásának 3 szintű modellje • fizikai • logikai • fogalmi Conceptual layer Logical layer Physical layer 106 CVs CV1 CV2 -Word files or -PDF files or -scanned
pages - Embedded image R E P O S I T O R Y Output: - Printed (PDF, etc.) - Web - data 107 Construction info Prof. Will Good E-mail: will.good @goodwilleu URL: http://www.goodeu Positions: University of City 1990Dept. of Informatics Senior lecturer Education: PhD in Informatics 1990 Thesis: Emerging Digital Archiving Systems MSc. in Computer Science 1987 Thesis: Statistical Programming Experienced in: EIS, development methods and tools Recently focusing on: New Media Archives Positions, memberships Construction info Prof. Will Good E-mail: will.good @goodwilleu URL: http://www.goodeu Positions: University of City 1990Dept. of Informatics Senior lecturer Education: PhD in Informatics 1990 Thesis: Emerging Digital Archiving Systems MSc. in Computer Science 1987 Thesis: Statistical Programming Experienced in: EIS, development methods and tools Recently focusing on: New Media Archives Positions, memberships 108 esettanulmány Az Open Archives Initiative-től Nemzeti
Digitális Adattárig • A tartalom menedzsment rendszer részei: gyűjtő, tároló, megjelenítő --- az OAI ezt követi • Az OAI elvek és technikák alkalmazása a Nemzeti Digitális Adattár (NDA) projektben • Az Open Archive Initiative (OAI) elvei és ajánlásai a dokumentumok elosztott elérésére – Archívum modell – Elosztott architektúra – Protokoll 109 Esettanulmány: az NDA • A rendelkezésre álló hagyományos és elektronikus anyagok elérhetősége • Együttes kereshetőség biztosítása • Ennek érdekében – Szabványok, protokollok, ajánlások készítése – A digitalizálás támogatása, prioritások kidolgozása • Az NDA a nyílt archívumok modelljét követi (OAI) • Az NDA technológiai alapja az OAI-PMH Az NDA hármas szerepe • NDA, mint mozgalom: Önálló intézmények önkéntes kapcsolódási formája, melynek alapját a közösen elfogadott szabvány, szabály, ajánlás adja. • NDA, mint szervezet: Az NDA mozgalom
koordinálására, működtetésének technológiai, anyagi támogatására létrejött szervezet. • NDA, mint műszaki rendszer: Az NDA-ban definiált funkciók egy részét, vagy egészét megvalósító rendszer, mely mintául szolgál a csatlakozni kívánók számára. 110 NDA szolgáltatásgazda funkciók 1. • Adatgazdák regisztrációja – Kapcsolatfelvétel az adatgazda és az NDA között űrlapos támogatással, az adatgazda regisztrációja. Megegyezés az elérhetőségben (OAI-PMH szerver címe), sémában (XML séma), szótárak használatában (XML névtér). • Metaadatok begyűjtése/ellenőrzése • Metaadatok tárolása • Kereső felület biztosítása NDA szolgáltatásgazda funkciók 2. • Adatgazdák regisztrációja • Metaadatok begyűjtése/ellenőrzése – Az NDA alkalmazásszerverén fut egy háttérfolyamat, amely rendszeresen végiglátogatja a regisztrált adatgazdákat és az OAI-PMH szerint begyűjti az előző futtatás óta készült
rekordokat. • Metaadatok tárolása • Kereső felület biztosítása 111 NDA szolgáltatásgazda funkciók 3. • Adatgazdák regisztrációja • Metaadatok begyűjtése/ellenőrzése • Metaadatok tárolása – A jónak talált rekordok bekerülnek az NDA adatbázisba és kereshetővé válnak. • Kereső felület biztosítása NDA szolgáltatásgazda funkciók 4. • • • • Adatgazdák regisztrációja Metaadatok begyűjtése/ellenőrzése Metaadatok tárolása Kereső felület biztosítása – Az NDA feladata, hogy hatékony, egyre bővülő komplexitású visszakeresést biztosítson. Regisztrált felhasználók elmenthetik a keresőprofiljaikat, igényelhetnek ez alapján „push” szolgáltatást. Tárolhatók, szűkíthetők, állományba exportálhatók a találati listák. 112 NDA adatgazda funkciók 1. • Digitalizálás, média tárolás – Dokumentumok (képi, szöveges, esetleg hang) digitalizálása szabványos formátumokba, szabványos
eljárásokkal. – A digitalizálás során keletkezett dokumentumok biztonságos (redundáns, nagy rendelkezésre állást biztosító) tárolása. • Katalogizálás, metaadat tárolás • Metaadat szolgáltatás NDA adatgazda funkciók 2. • Digitalizálás, média tárolás • Katalogizálás, metaadat tárolás – A digitális dokumentumhoz rendelendő, a kiválasztott séma szerinti (lásd PP funkció) metaadatok felvitelére szolgáló felület biztosítása, a metaadatok ellenőrzése. – A keletkezett metaadatok biztonságos tárolása. • Metaadat szolgáltatás 113 NDA adatgazda funkciók 3. • Digitalizálás, média tárolás • Katalogizálás, metaadat tárolás • Metaadat szolgáltatás – A metaadatbázis rekordjainak OAI-PMH kompatibilis szolgáltatása a szolgáltatásgazdák (többek között az NDA-SP) felé. Mi hiányzik még? • Az OAI-PMH szemantikailag „csak” a Dublin Core követésére szólít fel • Az integrációhoz a modell
finomítására (Qualification), illetve a mezők kitöltési szabályainak megadására (Encoding scheme) is szükség van! • Szükség van még: – Névterekre (személy, testület, földrajzi) – Dokumentumtípus függő sémákra (film, kép, szöveg, weblap, tv/rádió műsor stb. 114 Új funkció: Protokollgazda (PP) • Séma gyűjtemény – Az NDA által regisztrált sémák katalogizált, letölthető gyűjteménye. A sémák tartalmazzák az egyes sémaelemek definícióját, kitöltési szabályait. • Névtér gyűjtemény – Az NDA által regisztrált tulajdonnév tárak, szótárak, tezauruszok, osztályozási rendszerek, esetleg szakontológiák katalogizált, letölthető gyűjteménye, mely a potenciális adatszolgáltatók számára rendelkezésre áll. NDA Architektúra PP SP DP DP PP SP Internet Internet DP SP DP DP SP 115 Tűzfal Protokollgazda architektúra Szöveges (XML) Séma (XML séma) Szótár (XML névtér) Protocol Provider
(PP) OAI előzmények • • • • • • • • 1945 Vannevar Bush – Memex (Hypertext) 1989 Tim Bernes Lee – HyperText and CERN 1994 WWW Consortium (w3c.org) 1994 ERCIM Technical Reference Digital Library (EU) 1998 Networked Computer Science Tech. Ref Library 1999 Universal Preprint Service 1999 Open Archives Initiative 2002 OAI Protocol for Metadata Harvesting 2.0 116 OAI elvek • Eleinte: Tudományos publikációk közzététele, szabad elérésének biztosítása (preprints - content) • Később: Dokumentumok elérhetőségének, megtalálhatóságának biztosítása (metadata harvesting) • Data Provider – Service Provider elkülönülés • Olcsó (low barrier), egyszerű technológia OAI archívum modell 117 OAI architektúra DP SP DP DP DP SP Internet Internet DP SP DP DP SP Adatgazda - Data Provider (DP) • Olyan intézmény, amely az általa őrzött valóságos vagy digitális objektumokat leíró adatbázissal (katalógussal)
rendelkezik, és azt az OAI-PMH protokoll előírásainak megfelelően azt szolgáltatni tudja és akarja. 118 Tűzfal Adatgazda architektúra OAI szerver Meta szerver URI Média szerver Backup Digitalizáló állomás Data provider (DP) Az adatgazdák feladatai • Nyílt, mindenki számára elérhető adatszolgáltatás (metaadatok) az az OAI-PMH protokoll szerint. • Hagyományos archívumi (repository) funkciók ellátása – Biztonságos tárolás – Szükség esetén migráció – Katalogizálás, feldolgozás – Jogkezelés 119 Szolgáltatásgazda - Service Provider • Olyan szolgáltató, amely az adatgazdáktól az OAI-PMH protokoll segítségével begyűjtött adatok alapján értéknövelt szolgáltatást, legegyszerűbb esetben közös kereshetőséget biztosít. Tűzfal Szolgáltatásgazda architektúra OAI kliens Alkalmazás Meta szerver Service provider (SP) 120 A szolgáltatásgazdák feladatai • Közös kereshetőség biztosítása,
azaz több DP adatainak összefésülése, esetleg valamilyen specifikus szempont szerinti szűrése, csoportosítása, keresőfelület biztosítása. • Tartalom kereskedelem/felhasználás elősegítése • OAI-PMH interfész biztosítása (pl. Z3950-ről) • További metaadatok biztosítása – Pl. Learning Object Metadata – Automatikus tartalomelemzés Protocol for Metadata Harvesting • Kommunikációs protokoll: HTTP – Egyszerű, támogatott, elterjedt, internet barát, tűzfal-tűrő kommunikációs protokoll • Szintaxis: XML – Elterjedt, a struktúra megadását, önleíró állomány készítését is biztosító szintaxis • Szemantika: DC – Elfogadott szabvány/ajánlás a változatos tartalom szemantikai egységességének biztosítására. 121 OAI-PMH Kommunikációs protokoll HTTP GET, POST – kérdések • HTTP / XML válaszok Kérdések • Identify • ListSets • ListMetadataFormats • ListRecords • ListIdentifiers • GetRecord OAI-PMH
adatcsere szintaxis • XML, XML séma 122 OAI-PMH adatcsere szemantika • Dublin Core, RDF, RDF séma Megjegyzések • Az OAI-PMH alkalmazása az adatgazdák érdekeit (látszólag) sértheti, lehetetlenné teszi a felhasználói szokások monitorozását (logging) • A DC meglehetősen primitív tartalmi leírást tesz lehetővé (ebből fakad az elfogadottsága), de az OAI lehetővé teszi más formátumok alkalmazását is (MARC, METS) • Az adatgazdáknak informatikai fejlesztést kell végeznie (OAI-PMH interfész, adatok leképezése) 123 esettanulmány NAVA: Nemzeti Audiovizuális Archívum NAVA folyamatmodell Digitalizáló Digitalizáló Átmeneti Átmenetitároló tároló TranszTranszkódoló kódoló Média Médiatároló tároló rendszer rendszer NAVA NAVA olvasóterem olvasóterem Darabolás Szelekció Feldolgozás Tűzfal Tűzfal Sugárzott műsorfolyam Zárt Zárt hálózat hálózat 6 5 4 Gyártói metaadatok 3 2 1 Internet
Metaadatbázis 124 Magyarázat a NAVA folyamatmodellhez A metaadatok keletkezésének menete 1. Műsorkészítőktől begyűjtött metaadatok (a NAVA törvény alapján) 2. A digitalizálás során automatikusan keletkező metaadatok (formátum, időkódok stb.) 3. Az előfeldolgozás, darabolás során keletkező metaadatok 4. A szelekció eredményei (igen/nem, feldolgozás szintje) 5. A transzkódolás során automatikusan keletkező metaadatok (kulcsképek, vágólisták) 6. A tartalmi feldolgozás során keletkező metaadatok Automatikus, és emberi folyamatok • A szaggatott vonalak az automatikus folyamatokat jelzik • A folytonos vonalak az emberi közreműködéssel vezérelt folyamatokat jelzik A hozzáférési szintek (a tűzfal, illetve az adatbázis biztosítja) • Az interneten csak a meta érhető el • A zárt hálózaton a meta és a böngésző minőségű videó (technológiai korlát) • A NAVA olvasóterem full extra (de
természetesen read only) Felhasználók Metaadat Metaadat hozzárendelés hozzárendelés Szolgáltatás Média Médiatárolás tárolás (lekérdezések, médiafolyam) Archívum Bemenet (digitalizálás, kódolás) Műsorszolgáltatók NAVA OAIS modell Munkafolyamat Munkafolyamatvezérlés vezérlés NAVA 125 Bemeneti alrendszer Televízió vevők Digitalizáló/kódoló munkaállomások Bemeneti átmeneti tár Transzkódoló munkaállomások Bemeneti fájlszerver Kábeltévé végpont, és/vagy DVB-T antenna Archívum alrendszer LAN Archívum alrendszer Háttértár + Mentés SDTV gyorsítótár Szalagos háttértár FC Adatbázis szerver LDTV médiaszerver SDTV médiaszerver Bemeneti alrendszer Szolgáltató alrendszer LAN 126 Szolgáltató alrendszer Feldolgozó munkahelyek Intenet proxy Olvasótermi munkaállomások Zárt Zárthálózat hálózat Internet (csak katalógus!) Alkalmazás szerver Proxy szerver OAI –PMH szerver LAN LAN
Tűzfal Router Archívum alrendszer 127