5. Baliabideen deskribapena eta metadatuak

Robert J. Glushko, Kimra McPherson, Ryan Greenberg, Robyn Perry, Matthew Mayernik, Graham Freeman, Carl Lagoze

5.2 Baliabideen deskribapenaren laburpena

Honako helburu hauetarako deskribatzen ditugu baliabideak: haiek aipatzeko, haien artean bereizteko, haiek bilatzeko, haien berreskuratzea kudeatzeko, haiek gordetzeko eta aurreikuspenak egiteko haiei gertatuko zaienaz edo egin dezaketenaz. Baliteke, asmo bakoitzerako, baliabideen deskribapen ezberdinak erabili behar izatea. Baliabideen deskribapenak erabiltzen ditugu komunikazio eta elkarrizketa orotan; antolaketa sistemak ahalbidetzen dituzte.

5.2.1 Izendatzea (eta, edo, vs) deskribatzea

4. atalean aipagai izan dugu nola erabakitzen dugun zer gauza hartu baliabide gisa eta nola bereizten diren baliabideak izen eta identifikatzaileen bitartez. Izenek iradoki dezakete ea zer ezaugarri eta printzipio erabiltzen dituen Antolaketa Sistema batek bere baliabideak sailkatzeko. Adibidez, ingeles hizkuntzako abizen ohikoenei erreparatuz gero, ikus dezakegu gizarteetan nola antolatzen den jendea: lanbidearen arabera (Smith, Miller, Taylor), senidetza-harremanen deskribapena (Johnson, Wilson, Anderson) eta itxuraren deskribapena (Brown, White).

Kultura askotan, ezkontideetako batek izen berezi bat hartzen du, ezkon-harremana adierazten duena. Herrialde anglofono askotan, emakume ezkondu ugarik beren senarraren izena erabiltzen dute.

Era berean, beste baliabide batzuen izenetan ere agertzen dira beren ezaugarrien deskribapenak: eraikinetan (Pentagonoa, Etxe Zuria), kokapen geografikoetan (Ipar Amerika, Itsaso Gorria) eta baita hirietan ere (Grand Forks, Baton Rouge).

Baliabide orok har dezake izen bat edo identifikatzaile bat. Identifikatzaileak bereziki eraginkorrak suertatzen dira baliabideen deskribapen gisa, zeren, definizioz, identifikatzaileak bakarrak dira baliabideen sorta edo bildumetan. Izenek eta identifikatzaileek, normalean, ez dute baliabidea deskribatzen deskribapenaren zentzu arruntean; izan ere, baliabideari esleitu ohi zaizkio; ez dute haren ezaugarririk erregistratzen.

Nolanahi ere, izenak eta identifikatzaileak ausazkoak direnez, ez dute balio baliabideek bereizteko, non eta jendeak ez dituen aldez aurretik ezagutzen. Horregatik, batzuetan, bestelako egitura linguistiko bereziak erabiltzen ditugu izenen ordez: txakur bati buruz ari baldin bagara txakurra ezagutzen ez duen norbaitekin, «txakurtxo beltza» aipatuko dugu, eta ez haren izena, «Beltzi».

Era berean, liburutegiko katalogoan edo bilatzailean zerbait aurkitu nahi dugunean, zera horren izena baliatzen dugu, edo harekin lotutako datu zehatzen bat, errazago topatzeko. Kontrara, informazioa behar dugunean zerbaiti buruz, eta baliabideak bilatzen ditugunean premia hori asetzeko, baina zehazki zer baliabide nahi dugun jakin gabe, zera horren edukiari edo bestelako ezaugarriei buruzko deskribapenak baliatzen ditugu bilaketarako. Oro har, esan dezakegu informazioa lortzeko prozesua horrelako zerbait dela: erabiltzaileen premien deskribapenak konparatzea premia hori ase dezaketen baliabideen deskribapenekin.

5.2.2: «Deskribapena», termino inklusibo bat

Orain arte, «deskribapena»ren kontzeptua erabili dugu bere adiera arruntean: zerbait ezaugarritzen edo ordezkatzen duten ezaugarri ageriko edo garrantzitsuen izendapena edo azalpena. Dena den, batzuetan kontzeptu hori modu zehatzagoan erabiltzen da antolaketa-sistemen testuinguruan, non, sarritan, baliabideen deskribapena gauza formalagoa, sistematikoagoa eta instituzionalagoa baita. Bibliotekonomian, deskribapen bibliografikoari dagokionez, deskribatzaile esaten zaio tentu handiz diseinatutako hiztegi bateko terminoetako bati, zeina baliabide bati esleitu ahal baitzaio, haren tasunak, ezaugarriak edo esanahiak izendatzeko, baita beste baliabideekin dituen harremanak izendatzeko ere. Bestalde, modelo kontzeptualei eta informazio-zerbitzuen diseinuari dagokionean, baliabideen deskribapenei orobat deitzen zaie «hitz gakoak», «indize-terminoak», ezaugarriak, ezaugarrien balioak, elementuak, «datuen elementuak», «datuen balioak» edo «hiztegia». Enpresa-adimenean (business intelligence), analisi prediktiboan eta datuei lotutako beste zientzia batzuetan, berriz, «aldagai», «ezaugarri», tasun edo «neurketa» esaten zaie. Beste testuinguru batzuetan non deskribapenaren terminoak ez diren hain formalak, baizik eta pertsonalagoak, «etiketa» edo «tag» esan ohi zaie. Sinonimo edo ia-sinonimo horien artean bereizketa fin-finak ezarri ordez, «deskribapen» erabili dugu termino inklusibo gisa, salbu eta ohiko erabileran beste termino bat hobesten denean alde nabarmenarekin.

Termino horietako asko eremu semantiko mugatu batetik datoz, non hauxe baita deskribapenen helburua: baliabide baten muina (zeri buruzkoa den) identifikatzea eta zehaztea. Hala ere, ordenagailu bidez sortutako informazioaren eta baliabideen arteko lotura hutsala bihurtu ahala, informazio-mota ugari sortzen ari dira, baliabide bat «zeri buruzkoa den» adieraztetik harago doazenak, eta elkarreragin-jarduera gehigarriak ahalbidetzen dituzte. Xede horietako asko, bai eta horiek gauzatzeko behar diren informazio motak ere, azaldu ditugu 5.3.2 atalean Helburuak zehazten–. Baliabideen deskribapena modu hedakorrean baliatzen dugu, guzti-guztiak barnean hartzeko moduan.

4. atalean, bereizketa bat aurkeztu dugu, 4.2.4 azpi-atalean – Baliabideen gunea–, bi hauek alderatuz: baliabide primarioak eta horiek deskribatzen dituzten baliabideak –azken horiei, Deskribapen Baliabide deitu diegu–. Termino hori aukeratu dugu uste baitugu hobeto ulertzen dela eta inklusiboagoa dela informazio-baliabideen antolaketa-sistemetan ondo ezarririk dauden beste bi hauek baino: deskribapen bibliografikoa eta metadatuak. Gainera, orokorragoa dela iritzita, baliabideen deskribapenaren kontzeptua bereizi dugu beste hauetatik: deskribapen estatistikoa, online baliabideetako etiketak eta Baliabideak Deskribatzeko Markoa (RDF, ingelesezko sigletan), zeina erabiltzen baita baieztapenak egiteko online baliabideei eta sarean identifika daitezkeen baliabide fisikoei buruz.

5.2.2.1 Deskribapen bibliografikoa

Deskribapen bibliografikoaren xedeek eta izaerak osatzen dute bibliotekonomia eta informazio-zientzien oinarria; zientzia hori sistematizatu da, eta hartaz eztabaidatu dute, ia bi mendez. Deskribapen bibliografikoek ezaugarritzen dituzte informazio-baliabideak eta unibertso bibliografikoko entitateak: lana, edizioa, autorea eta gaia, besteak beste.

Informazio-baliabide baten deskribapen bibliografikoa, normalean, formatu estandar batean gauzatzen den erregistro egituratua da, eta baliabide jakin bat deskribatzen du.

5.2.2.2 Metadatuak

Sarritan, honela definitzen dira metadatuak: «datuei buruzko datuak»; definizio horrek, ordea, ia dena hartzen du bere baitan, eta ez da batere lagungarria. Badago beste definizio bat, edukiz beteagoa: horren arabera, edozein erako informazio-baliabide baten deskribapen egituratua lirateke metadatuak. Izan ere, metadatuak erabilgarriagoak dira baldin eta metadatuen eskema batek ahalbidetzen baditu, eta elementuak definitzen baditu deskribapen egituratuaren barruan.

Metadatuen kontzeptua informazio-sistemetan eta datu-baseen diseinuan sortu zen, 1970eko hamarkadan; hortaz, deskribapen bibliografikoa baino askoz berriagoa da. Metadatuen lehen eskemetan –datu-hiztegi esaten zitzaien–, datuei zegozkien eremuen antolamendua eta edukia erregistratzen zen ordenagailu zentraletako transakzio-aplikazioetan. Metadatu-mota sofistikatuagoak sortu ziren, hala nola datu-baseen kudeaketa-sistemetako datu-ereduak –datu-baseen eskemak deiturikoak–: erlazio taulen egitura, ezaugarrien izenak eta datu legalen motak eta balioak deskribatzen zituzten, edukia biltzeko.

Gaur egun, XML eskemak eta sarean edo ordenagailuan balia daitezkeen formatuak sortu dira baliabideak deskribatzeko, eta horiek zabaldu egin dute baliabideen deskribapenaren ideia, deskribapen bibliografikotik askoz harago joanez, eta beren baitan bilduz software osagaien deskribapenak, negozio edo zientziari loturiko datu-sortak, web zerbitzuak eta objektu konputazionalak –fisikoak zein digitalak–. Baliabideen deskribapenek, beren aldetik, bidea ematen dute beste baliabide batzuk deskubritzeko, berrerabiltzeko, kontrolatzeko edo dei egiteko, hartara, jendeak edo agente konputazionalek elkarreragin-jarduera eraginkorrak izan ditzaten metadatuek deskribatutako baliabide primarioekin.

5.2.2.3 Sarean oinarritutako baliabideak etiketatzea

Metadatuen kontzeptua hedatu egin da, eta, orain, bere baitan biltzen ditu etiketak, puntuazioak, laster-markak eta bestelako deskribapen motak; izan ere, banakoek halakoak eransten baitituzte argazkietan, blogetan, albisteetan edo sarean presente dagoen beste edozein baliabidetan. Etiketatzearen praktikak balio du etiketak ezartzeko edukiari, hura deskribatzeko eta identifikatzeko. Etiketa-sortak erabilgarriak dira norberaren bildumak kudeatzeko –webguneen edo baliabide digitalen bildumak, esaterako–, beste batzuekin partekatzeko edo elkarreragin- eta zerbitzu-mota berriak ahalbidetzeko. Adibidez, Last.fm webgunea erabiltzen dutenek, etiketak gehitzen dizkiote musikari, horren izaera, garaia, aldartea edo generoa deskribatuz; orduan, webguneak etiketa horiek erabiltzen ditu irrati-kateak sortzeko, etiketa horiekin edo antzekoekin lotura duen musika jarriz kate bakoitzean.

Last.fm webguneko etiketak

Baliabideen formatua x fokua

Last.fm webguneak etiketak eta bestelako metadatuak erabiltzen ditu «deskubrimendu» orrialde multimedia aberatsak sortzeko: halakoetan, artisten katalogoak, kantu berriak, doako deskargak eta musika-bideoak uztartzen dira, zeinak, webgunearen algoritmoak aurreikusitakoaren arabera, erabiltzailearen gozagarri izango baitira. Horri esker, erabiltzaileek musika berria aurki dezakete modu intuitiboago batean, bilaketak eginez artistaren edo generoaren arabera.

(Pantaila-argazkia: Ian MacFarland)

Nolanahi ere, etiketek badute desabantailarik. Erabiltzaileek intuizioari jarraituz eta modu espontaneoan sortzen dituzte etiketak, ondorioz, hiztegiaren arazoa berpizten da (4.4): argazkilari batek «zuhaitza» dio; besteak, berriz, «haritza». Era berean, hitzak ez badira modu sistematikoan hautatzen, ez da batasun morfologikorik izango (6.4.3 Hitz-formen arteko harremanak); argazki berean, batek «zuhaitzak» eta «erretzen» etiketak jarriko ditu, eta beste batek, aldiz, «zuhaitza» eta «erre». Jendeak era askotako deskribatzaileak erabiltzen dituenez baliabide berdina edo antzekoak kategorizatzeko, zera gerta daiteke: etiketak erabiltzen dituzten sistemak «etiketa zopa» bihurtzea, egiturarik gabe.

5.2.2.4 Baliabideak Deskribatzeko Markoa (RDF)

Baliabideak Deskribatzeko Markoa (RDF, ingelesezko sigletan) eredu estandar bat da, eta balio du ordenagailuek prozesatzeko moduko adierazpenak egiteko web baliabideei buruz; Web Semantikoa deritzon ikuspegiaren oinarria da. Orain arte, «baliabide» hitza erabili dugu antolatu beharra den edozer gauzari buruz aritzeko. RDF eta sarearen testuinguruan, ordea, «baliabidea»k esanahi zehatzagoa du: baliabide esaten zaio Baliabideen Identifikatzaile Uniforme bat jaso duen orori (URI, ingelesezko sigletan). URIak hainbat formatukoak izan daitezke, nolanahi ere, seguru asko webguneak identifikatzeko balio dutenak irudituko zaizkizu ezagunenak, adibidez, http://springfield-elementary.edu/. (Eta, ziur aski, halakoei URL deitzeko ohitura duzu, URIren ordez). RDF markoaren oinarrian dagoen ideia nagusia zera da: URIak erabil ditzakegu ez soilik sarean «dauden» gauzak identifikatzeko, ezpada saretik «kanpo» daudenak ere, hala nola pertsonak edo herrialdeak. Adibidez, http://springfield-elementary.edu/ erabil dezakegu Springfield Elementary eskolari buruz hitz egiteko, eta ez soilik haren weba aipatzeko.

RDF markoan, deskribapen guztiak «hirukoteak» dira, honako osagai hauekin: deskribatzen den baliabidea (URI baten bidez identifikatzen dena), ezaugarri bat eta balio bat. Ezaugarriak ere baliabideak dira: URIen bidez identifikatzen dira.

5.1. marrazkia: RDF hirukoteak, grafiko batean antolatuta

RDF hirukoteak, grafiko batean antolatuta

Bi RDF hirukote uztartu daitezke, eta horiekin grafiko bat osatu, baldin eta komunean baldin badute baliabide bat, ezaugarri bat edo balio bat. Adibide honetan, bi RDF hirukoteek baieztapen bat egiten dute Bart Simpson eta Lisa Simpson joaten diren eskolaren webguneari buruz, eta biak uztartu daitezke, hain zuzen ere, balio bera dutelako, hots, Springfield Elementary eskolaren URIa.

URIak erabiliz gero baliabideak eta ezaugarriak identifikatzeko, elkarren artean konektatu daitezke deskribapen-ereduak (hala nola RDF markoa), «estekatutako datuen» sare baten baitan: Internetek modu berean ahalbidetzen du informazioa elkarri lotzea «estekatutako dokumentuen» sare alimaleko batean. RDF markoaren zaleek aldarrikatzen dute horrek mesede egingo diola, nabarmen, jakintzaren deskubrimenduari eta inferentziari. Hala ere, RDF markoaren baitako deskribapen-eredu guztiz preskriptiboaren onurak alderatu behar lirateke marko horren kostuekin, izan ere, gaur egun existitzen diren deskribapenak RDF markora aldatzeak lan asko eskatzen baitu.

5.2.2.5 Informazio objektu agregatuak

Aro digitalaren aurretik, informazio-objektuek muga ukigai esplizituak zituzten. Liburuak, adibidez, orrialdez osaturik zeuden, eta azal baten barruan elkarri lotuak; binilo batek fisikoki lotzen zuen kantu-multzo bat (ikusi ere ikus zenezakeen kantuen arteko banaketaren lerroa), filmak, ostera, film-zerrendetan ematen ziren, biribilkietan, eta, bildumak (ohikoan) gela edo apal jakin batean ipintzen ziren liburutegian.

Eremu digitalean, informazio-objektuen arteko mugak ez dira ukigaiak, ezta agerikoak ere. Har dezagun, esate baterako, web-orriaren nozio sinplea. Nabigatzaileko leihoan agertzen denari buruz dugun nozio kognitiboak (hau da, testu formateatua eta horri lotutako irudi bat), egiaz, hiru osagai ditu, webaren arkitekturari dagokionean (Jacobs eta Walsh, 2004), hiru informazio-objektu (edo baliabide): HTML (testua kodetzen duena), CSS (formatuaren arauak zehazten dituena) eta JPEG (irudia kodetzen duena). Hirurek dute nor bere URLa eta modu independentean eskuratu eta estekatu daitezke. Egoera are anbiguoagoa bihurtzen da webguneen nozio arruntari dagokionean, izan ere, horren mugak ez daude teknikoki zehaztuta, eta zaila da horiek modu kognitiboan azaltzea.

Agregazioaren prozedura komenigarria suerta daiteke sakabanaketa edo antolaketa sinplifikatzeko, baina eraldatzeko ere balio dezake: baliabide batzuen balio ia osoa agregazioaren ondorioz sortzen da. Web-orrien kasuan, CSS artxiboak ez du ia ezertarako balio bere horretan, izan ere, HTML artxiboa janztea baita bere xedea. iTunes-en, pistak errepikatzeko eta antolatzeko funtzioak pop musikarako optimizatzen dira, non banakako kantuak beren kabuz entzun baitaitezke, diskoko gainerako abestiak alde batera utzita ere. Musika klasikoaren zaleek arazoak izaten dituzte horrekin, izan ere, grabaketa luzeetan, «pista»k banatu ohi dira, artxiboaren tamaina murrizteko eta nabigazioa errazteko, baina pista horiek, berez, banaezinak dira; piezak osorik entzun behar dira, eta zaila gerta daiteke ziurtatzea denak elkartuta daudela eta behar den moduko metadatuak gehitu zaizkiola agregazio horri. Beste modu batera esanda: sinfoniak ezin dira shuffle moduan entzun.

Kasu honetan, arazoa zera da: nola adierazi, modu tekniko eta arkitektonikoan, agregazioaren nozioa, hau da, informazio-objektuen multzo bat, zeinak, batera hartuz gero, beste informazio-objektu bat osatzen baitu. Agregazioak nagusi dira informazio digitalaren gure espazioan: badira web-orriak eta webguneak, lehen aipatu bezala; badira argitalpen akademikoak, testuz, marrazkiz eta datuz osatuak; badira datu-multzoak, hainbat datu-artxiboz osatuak. Nozioa errepikatu egiten da eta ez da esklusiboa, argiki. Objektu bat, berez agregazio bat dena, beste objektu bati gehi dakioke. Agregazio batean bildutako informazio-objektu bat beste agregazio batzuetan ere bil daiteke, hortaz, existitzen diren informazio-objektuak berrerabili eta birmoldatu daitezke. Arazo honen konponbideak zerikusia du informazio digitala antolatzearen alderdi guztiz garrantzitsu batekin, izan ere, ez baditugu mugak ondo zedarritzen, ezin ditugu informazio-objektuak modu determinantean identifikatu, erreferentzia egin edo deskribatu.

5.2.3 Baliabideak deskribatzeko markoak

Era askotako baliabideak deskribatu daitezke, eta hainbat komunitate jarduten dira horretan; horrek esan nahi du marko eta sailkapen ugari proposatu izan direla baliabideen deskribapenari zentzua emateko.

5.2 marrazkia: Baliabideak deskribatzeko arkitekturak

Baliabideak deskribatzeko arkitekturak

Baliabideen deskribapenerako bi arkitektura ezberdin dira hauek: deskribapen bereiziak eta deskribapen paketatuak, zeinak nagusi izan baitziren liburutegietako katalogoetako txarteletan, baliabide bati buruzko deskribapena biltzen zutenetan.

Ikuspegi historiko nagusian, baliabideen deskribapenak baieztapen-sortatzat jotzen dira; ikuspegi hori gorpuzten da liburutegietako txartelen katalogo inprimituan, bai eta horren baliokide konputazionalean ere (MARC21 formatua, liburutegien katalogoetako erregistroa gordetzeko formatua), zeinean eremu asko baitaude, objektuaren ezaugarri bibliografikoei lotuak (autorea, izenburua, argitalpen-urtea, argitaratzailea eta orrialde-kopurua). Badago baliabideak deskribatzeko beste arkitektura bat, zeinak erreparatzen baitio baliokide bati buruzko deskribapen edo baieztapen bakoitzari, RDF markoak eta estekatutako datuen hurbilketak egiten duten bezala. Bi alternatiba horiek konparatu ditugu 5.2 marrazkian: Baliabideak deskribatzeko arkitekturak.

Kasu batean zein bestean, baliabideen deskribapenari buruz pentsatzeko modu komunek inplementazioari dagozkion bi erabaki nabarmentzen dituzte –agian baita gehiegi nabarmendu ere–:

  • Lehenik, erabaki behar da baliabideen deskribapenak uztartuko diren egiturazko sorta batean edo aparte mantenduko diren baieztapen deskriptibo bereiz gisa.

  • Bigarrenik, erabaki behar da zer sintaxi erabiliko den deskribapenak kodetzeko.

Inplementazioari dagozkion bi erabaki horiek badituzte beren ondorioak, eta garrantzitsuak gainera, baina bigarren mailakoak dira beste kontu logiko edo diseinu-kontu batzuetarako: baliabideen deskribapena, baliabidearen zer ezaugarri hautatu deskribapenaren oinarritzat edo nola sortu deskribapenak modu egokienean. Antolatzearen diziplinaren ideia funtsezkoarekin bat eginez (1.6 atalean aurkeztu dugu, «Antolaketa printzipioa»ren kontzeptua), ezinbestekoa da bi hauek bereiztea: diseinuari dagozkion printzipioak eta inplementazioari dagozkion hautuak. Inplementazioari dagozkion hautuen multzoa –karaktereen notazioari, sintaxiari eta egiturari buruzkoak– baliabideen deskribapenaren forma gisa hartuko dugu, eta gerorako utziko ditugu ahalik eta gehien, 9. atalera iritsi arte (Baliabideen Deskribapenen Formak).

Baliabideen deskribapena ez da helburu bat bere horretan. Bere eginkizunen helburua beti da antolaketa-sistema bat ahalbidetu edo erabiltzea baliabideen bilduma batean. Ondorioz, baliabideen deskribapenerako dugun markoak bat egiten du antolaketa sistemetako jarduerekin (3. atalean azaldu ditugu): baliabideak hautatzea, antolatzea, horiekin elkarreraginen jardutea eta mantentzea.