6. Harremanak eta egiturak deskribatzea
Robert J. Glushko, Matthew Mayernik, Alberto Pepe, Murray Maloney
6.8 Harremanak antolaketa-sistemetan
Aurreko ataletan, harremanak aztertzeko bost ikuspegiak aletu ahala, hainbat adibidetan esan dugu harremanek betekizun garrantzitsuak dituztela antolaketa-sistemetan. Bada, azken atal honetan, hiru antolaketa-sistema aztertuko ditugu, zeinetan harremanak bereziki funtsezkoak baitira; Web Semantikoa eta Datu Estekatuak, antolaketa-sistema bibliografikoak eta sistemen integrazioarekin eta inter-operazionaltasunarekin loturiko egoerak.
6.8.1 Web Semantikoa eta Datu Estekatuak
2001ean, idazlan klasiko batean, Tim Berners-Leek Web Semantikoari buruzko ikuspegi bat aurkeztu zuen, zeinean informazioa partekatu eta prozesatu baitzezaketen tresna automatizatuek, eta jendeak ere bai. Weba semantikoagoa izan dadin eta web baliabideen arteko harremanak argiagoak izan daitezen erabiltzen diren funtsezko teknologiak XMLren aplikazioak dira: RDF (ikus 5.2.2.4 atala: Baliabideak Deskribatzeko Markoa (RDF)) eta OWL (ikus 6.3.3 atala: Ontologiak). Tresna asko garatu dira kodetze semantikoagoak ahalbidetzeko, baina, tresna gehienen kasuan, teknologia semantikoetan eta web estandarretan aditua izan behar da horiek erabiltzeko.
Wikipediako informazio-kaxak
Wikipediak «informazio-kaxak» sortzen ditu: horietan, kasuan kasuko baliabide-motari orokorrean dagokion informazio egituratua biltzen du; modu horretan, Wikipediako egileek artikulu gehiago idaztea lortu nahi da. Hiru adibide hauetan, «Enpresa», «Abestia» eta «Hiria» informazio-kaxen zati batzuk ikus daitezke.
Arrakasta handiagoa izango dute, ziur aski, helburu apalagoak dituzten aplikazioek, hau da, dokumentu edo web orri bateko semantika sor guztiak kodetzen saiatzen ez direnak. Adibidez, wiki eta blog erako tresna batzuetan oharpen semantikoak egiteko txantiloiak biltzen dira, eta Wikipediak milaka txantiloi eta «informazio-kaxa» dauzka, hartara informazioa sortzeko eduki-kodeturiko formatutan.
Web Semantikoak webaren arkitekturaren oinarrizko printzipioak moldatu nahi ditu, semantikoagoak izan daitezen; bada, ideia horren luzapen bat da «Datu Estekatuak» deritzon mugimendua. HTML dokumentuei dagokienez, estekek betekizun mugatuak dituzte: dokumentuen arteko harreman sinpleak ezartzea, alegia; RDF bidez deskribaturiko baliabideen artean, ordea, estekek zubiak eraiki ditzakete datu semantikoen uharteen artean, eta Datu Estekatuen sare edo laino bat sortu.
6.8.2 Antolaketa-sistema bibliografikoak
Antolaketa-sistemetako harremanez pentsatzen dugunean, hausnarketa asko katalogatze bibliografikotik datoz, hots, liburutegietako baliabideen eremutik eta horrekin loturiko beste bi arlo hauetatik: sailkapen-sistemak eta thesaurus deskriptiboak. Harreman bibliografikoek bitarteko nabarmen bat eskaintzen dute liburu-katalogoak egituratzeko.
Harreman bibliografikoak ohikoak dira liburutegiko baliabideetan. Smiraglia eta Leazer autoreek egiaztatu zutenez, WorldCat deritzon mundu mailako katalogoan bildutako lanen % 30ek, gutxi gorabehera, lan eratorri edo asoziatiboak dituzte –OCLC elkarteak kudeatzen du katalogo hori–. Familia bibliografikoen baitan, era askotako harremanak dauden itemen artean, baina lan eratorriak dituzten lanei dagokienez, batez besteko familiak 3,45 itemez osaturiko daude. Bestalde, lan «kanonikoek», eragin eta esanahi kultural handia dutenek, hala nola «William Shakespeareren antzezlanak» edo Biblia, familia bibliografiko oso handi eta konplexuak osatzen dituzte.
6.8.2.1 Tillett-en taxonomia
Barbara Tillettek, ikerketa batean, XIX. eta XX. mendeko katalogoen arauak aztertu zituen, eta ohartu zen luzaroan existitu direla katalogatze-arau asko, harreman bibliografikoak deskribatzeko balio dutenak. Hala, harreman bibliografikoen taxonomia bat garatu zuen, honako harreman hauek bilduz: baliokidetasuna, eratorpena, deskribapena, zatia-osoa, osagarria, sekuentzia edo kronologia eta ezaugarri partekatuak. Harreman-mota horiek atal honetan aipaturiko ikuspegiekin egokitzen dira: baliokidetasuna, eratorpena eta deskribapena, adibidez, harreman-mota semantikoak dira; zatia-osoa eta osagarria, berriz, partez semantikoak eta partez estrukturalak; sekuentzia edo kronologiak, partez lexikoak eta partez estrukturalak, eta, azkenik, ezaugarri partekatuei dagozkien harremanak partez semantikoak eta partez lexikoak dira.
6.8.2.2 Baliabideen deskribapena eta sarbidea (RDA)
Katalogatzearen arloko ikertzaile askok onartu dutenez, online katalogoak ez dira oso ondo moldatzen itemen arteko harreman bibliografikoak kodetzeko garaian, bi arrazoi hauek tarteko: katalogoen aurkezpen-diseinua, batetik, eta katalogoen erregistroetan informazioa antolatzeko dauden mugak, bestetik. Autore-izenen datu-base egiaztatuek, adibidez, informazioa eskaintzen dute autore-izenen aldaerei buruz, eta hori funtsezkoa suerta daiteke autore baten lan guztiak aurkitzeko orduan; nolanahi ere, informazio hori ez da gordetzen katalogo-erregistroetan. Era berean, MARC erregistroak –formatu digitalen bilduma bat da, itemak deskribatzeko balio duena– formateatu eta erakutsi daitezke web liburutegietan, baina ikertzaileek, erabiltzaileek eta liburuzainek ezin dituzte erregistro horietako datuak berrerabili, beste xede baterako moldatu edo berrantolatu.
RDA sistemaren belaunaldi berriek ahalegina egiten dihardute baliabide-deskribapenak, beren artean loturarik ez dutenak, elkartzeko, eta, hala, datu osoagoak eta elkarri-lotuagoak emateko lanei, egileei, argitalpenei, argitaratzaileei eta gaiei buruz.
RDAk, material bibliografikoen arteko harremanak adierazteko, RDF erabiltzen du.
6.8.2.3 RDA eta Web Semantikoa
RDAren garatzaileek erabaki dute datu bibliografikoak RDF bidez kodetzea, hain zuzen ere liburutegi-katalogoetako datuak eskuragarriagoak izan daitezen webaren bidez. Webean oinarrituriko hainbat prozesu, hala nola datuen uztarketa, aplikazio-programazioaren interfazeak (API, ingelesezko sigletan) eta web bilaketa, gero eta nonahikoagoak dira, eta, gainera, erabiltzaileek horiek topatzea espero dute; ondorioz, liburutegietako datuak isolatuago daude egunetik egunera. RDAren garatzaileen arabera, RDF da liburutegietako datuak sarean eskuragarriago egon daitezen lortzeko bidea.
Xede horretaz gainera, hau da, liburutegietako datuak webaren bidea eskuragarriagoak izan daitezen lortu nahi izateaz gainera, RDAk zera bilatzen du: Web Semantikoaren izaera sakabanatua ustiatzea. Baliabideak eta baliabideen arteko harremanak deskribatzeko arauak RDF sintaxian adierazi ostean, eta jendearen eskura jarri ostean, arauak nahasteko eta uztartzeko aukera dago. Informazio-sistemen sortzaile batek RDF erabiltzen badu horretarako, edozein RDF eskematik hautatu ditzake beren osagaiak. Adibidez, bi eskema hauek har ditzakegu, Dublin Core metadatuen eskema (zeinak RDF ereduarekin bat egin baitu) eta Friend of a Friend eskema (FOAF, zeinak jendea eta jendearen arteko harremanak deskribatzeko balio baitu), eta, biak bateratuz, metadatu-elementuen sorta bat eratu egunkari bateko artikulu bati buruz, informazio bibliografiko estandarretik harago iristen dena. RDA RDFra eramateko prozesua ziztu bizian doa.
6.8.3 Integrazioa eta inter-operazionaltasuna
Integrazioa zera da: informazioa modu kontrolatuan partekatzea bi negozio-sistemaren, aplikazioren edo zerbitzuren edo gehiagoren artean, bai konpainia baten barruan bai beste konpainian batekin. Integrazioak esan nahi du alderdi batek informazioa erauzi edo lortu dezakeela beste batengandik; ez du esan nahi, ordea, hartzaileak informazioa erabil dezakeenik.
Inter-operazionaltasuna, berriz, integrazioa baino harago doa, esan nahi baitu ezen informazioa trukatzen duten sistemek, aplikazioek edo zerbitzuek jaso duten informazioaren zentzua balia dezaketela. Inter-operazionaltasunaren baitan bil daitezke honako jarduera hauek: sistema bakoitzari dagozkion osagaiak eta harremanak identifikatzea, eta horien ezaugarriak eraldatzea: sintaxia, denek formatu berdina izan dezaten; egitura, denek xehetasun-maila berdina izan dezaten, eta semantika, denek esanahi berdina izan dezaten.
Esaterako, Interneteko salmenta-gune batean, hainbat produktu erakutsiko dira, baina produktuak hainbat ekoizlerenak dira, eta nork bere erara deskribatzen ditu produktu berdinak. Halaber, erosketa- eta bidalketa-prozesua osorik gauzatzeko, beharrezkoa da bezeroari, produktuari eta ordainketari buruzko informazioa zenbait enpresaren informazio-sistemetatik igarotzea. Baldin eta osagaiak eta horien arteko harremanak ez badira formalki zehazten sistema bakoitzean, premiazko informazioa kokatzeko eta eraldatzeko lantegia oso nekeza gerta daiteke, baita ezinezkoa ere.
Kontrara, eredu horiek datu edo dokumentu-eskema gisa existitzen badira, edo programazio-hizkuntzetako klase gisa, modu ia guztiz automatikoan identifikatu eta ustiatu daitezke sistema ezberdinetako informazioaren arteko harremanak, inter-operazionaltasuna lortzeko edo sailkapen-sistema ezberdinak uztartzeko. Informazioaren integrazioa eta trukea eraginkorragoa baldin bada, horrek onura ekonomiko handiak ekartzen dizkie gobernuei, negozioei eta bezeroei; hori dela-eta, informazio-ereduak estandarizatzeko ahalegin nabarmenak egiten ari dira hainbat industriatan. 10. kapituluan –Elkarreragin-jarduerak baliabideekin– sakonago landuko ditugu inter-operazionaltasunari dagozkion kontuak, batez ere negozio-testuinguruetan azaleratzen direnak.
