5. Baliabideen deskribapena eta metadatuak
Robert J. Glushko, Kimra McPherson, Ryan Greenberg, Robyn Perry, Matthew Mayernik, Graham Freeman, Carl Lagoze
5.3 Baliabideak deskribatzeko prozesua
Baliabideen deskribapena, kontzeptu gisa, zabalagoa da deskribapen bibliografikoaren eta metadatuen kontzeptuak baino; eta horregatik dugu nahiago, argiago erakusten duelako zer auzi komunek gurutzatzen dituzten beste termino horiek nagusi diren eremuak. Gainera, kontzeptu horren bidez prozesu estandarrago bat proposatu dezakegu, eta hori aplikatu diezaiokegu, modu zabalean, antolaketa sistemetako baliabideen deskribapenei. Hiztegi komuna badaukagu, irakaspenak eta praktika onak partekatu ditzakegu.
Baliabideak deskribatzeko prozesuan zazpi urrats daude, interdependienteak eta iteratiboak. Hasteko, prozesuaren laburpen generiko bat egingo dugu, kokatzeko; ondoren, urratsez urrats aztertuko dugu.
Deskribatuko diren baliabideak identifikatzea; horra lehen urratsa. Gai hori xeheki aztertu da 4.3 atalean (Baliabideen identitatea). Baliabidearen eremuak eta helmenak zedarritzen dute ea zer ezaugarri diren deskribatzeko modukoak eta ea zer xedetarako balio dezaketen deskribapenek. Baliabidearen guneak zehazten du zeintzuk diren informazio-baliabide primarioak eta zeintzuk hartuko diren horiei dagozkien deskribapen gisa. Puntu honetan, garrantzitsuak dira honako bi erabaki hauek: deskribapenaren xehetasun-maila –zer deskribatzen ari gara, banakako baliabideak edo baliabideen bildumak?–, eta abstrakzio-maila –zer deskribatzen ari gara, baliabideen kasuak, horien zatiak edo baliabide-motak?–.
Orokorrean, baliabideen deskribapenaren helburua da antolaketa-sistema orotako jarduerak ahalbidetzea: baliabideak hautatzea, antolatzea, horiekin elkarreraginean jardutea eta mantentzea (3. atalean ikusi dugun moduan). Bestalde, baliabideak ahalbidetu ditzakeen xedeei dagokienez, baliabide horren eremuak eta deskribapenen sorrera- eta erabilera-testuinguruak baldintzapen eta muga zehatzagoak sortzen dituzte.
Behin zehaztu denean zeintzuk diren deskribapenaren helburuak jarduera eta elkarreraginei dagokienez, identifikatu daiteke ea baliabidearen zer ezaugarri konkretu behar diren helburu horiek gauzatzeko. Deskribapenaren asmoa ez da sakona izatea; arrazoiz deskribatu daitezkeenak baino ezaugarri posible gehiago egongo dira beti. Kontrara, honako erronka honi heldu behar zaio: desio diren elkarreraginak gauzatzeko sendoenak eta konfiantzazkoenak diren ezaugarriak erabiltzea.
Urrats honetan, logikari eta semantikari dagozkion hainbat erabaki hartu behar dira, baliabidearen ezaugarri deskribatzeari buruzkoak. Zer termino edo elementu-izen erabili beharko lirateke deskribatu nahi ditugun ezaugarriak identifikatzeko? Ba al dago araurik edo mugarik, ezaugarrien deskribapenetan ager daitezkeen datu- edo balio-motei dagokionik? Deskribapen numerikoak egitean, kontuan hartu behar dira horien datu-motak eta neurketa-mailak, izan ere, mugatu egin baititzakete prozesamenduak. Nominalak, ordinalak, interbaloak eta ratio-datuak kontuan hartuta, horietako bakoitzak eraldaketa jakin batzuk egin ditzake, ordezkatzen dutenaren arabera. Deskribapenetarako hiztegi on bat sortuz gero, erraza izango da bertako hitzak esleitzea baliabideen deskribapenei eta erraza izango da haiek ulertzea, erabiltzen direnean.
Deskribapenen hiztegiari lotutako erabaki logiko eta semantikoak honela gauzatzen dira: deskribapenaren notazioaz, sintaxiaz eta egituraz hartutako erabakien bitartez. Erabaki horiek, batera hartuta, baliabideen deskribapenaren forma edo kodetzea osatzen dute. Deskribapenak inplementatzeko, erabakiak hartu behar dira honako kontu hauei buruz: nola eta non gordeko diren eta zer teknologia erabiliko den horiek sortzeko, editatzeko, gordetzeko eta eskuratzeko.
Baliabideen deskribapenak sortzen dituzte banakoek, jende-multzo informal zein formalek edo baliabide automatiko edo konputazionalek. Deskribapen-mota batzuen kasuan, jendeak bakarrik sor ditzake horiek; beste batzuk, aldiz, teknika automatikoek edo algoritmoen bidezkoek; azkenik, badira biek ala biek sor ditzaketenak ere.
Baliabideen deskribapenak ebaluatzeko garaian, aintzat hartu behar da zer helburu bete nahi zuten. Ebaluazioaren emaitzei erreparatuz, aurreko urratsetik zein berregin behar den zehaztuko da.
Hurrengo zazpi azpi-ataletan xehe-xehe aztertuko dugu urrats bakoitza. Erreferentzia-gida azkar bat topatuko duzue 5.3 marrazkian, Baliabideak Deskribatzeko Prozesua.
5.3 marrazkia: Baliabideak Deskribatzeko Prozesua
Baliabideak deskribatzeko prozesuak zazpi urrats ditu: helmena eta gunea zehaztea; xedea zehaztea; baliabidearen ezaugarriak identifikatzea, deskribapenari dagokion hiztegia diseinatzea; deskribapenaren forma eta inplementazioa zehaztea; deskribapenak sortzea eta deskribapenak ebaluatzea.
Urrats bakoitzak zenbateraino zehatza eta sistematikoa izan behar duen erabakitzeko, kontuan hartu behar da baliabidearen eremua eta helmena, eta, bereziki, antolaketa sistema erabiliko duen balizko erabiltzailea. Arretaz begiratzen badugu, ikusiko dugu urrats horietako gehienak testuinguru oso informaletan gertatzen direla; horren erakusgarri da atal honen hasieran aipatu dugun adibidea: Legoekin jolasean dabiltzan haurrak. Umeek eraikuntzak egin nahi dituzte Lego-blokeekin; ondorioz, aztertu dute ea zer ezaugarri aztertzea komeni zaien gehien. Blokeen deskribapenak garatu dituzte, ezaugarri garrantzitsuen balio zehatzak islatuz. Azkenik, beren deskribapenak ebaluatu dituzte, elkarrekin jolasteko erabili baitituzte; argi geratzen da, berehala, deskribapen batek ez duela bere helburua bete, baldin eta haur batek bloke jakin bat eskatzen badu eta beste haur batek, berriz, beste bat ematen badio.
Kontrakarrean, argazkiak hartzeko testuinguruan, baliabideen deskribapenak prozesu esplizituagoa eta sistematikoagoa izan behar du derrigor. Kamera digitalak automatikoki erabiltzen ditu baliabidearen ezaugarri jakin batzuk, bai eta deskribapeneko hiztegia eta deskribapenaren forma ere; kontu horiek denak industria-elkarte batek hautatu ditu, eta zehaztapen tekniko gisa argitaratu: mundu osoan zehaztapen tekniko berdinak erabiltzen dituzte kameren eta telefono mugikorren ekoizleek.
Liburutegi, artxibo eta museoek erabiltzen dituzten baliabide-deskribapenen kasuan, normalean are modu esplizitu eta sistematikoagoan sortzen dira. Argazki digitalaren ezaugarriak bezalaxe, antolaketa-sistema horietako deskribapenetan erabiltzen diren ezaugarriak, hiztegia eta formak ere estandarren arabera kudeatzen dira. Nolanahi ere, antolaketa-sistema horiek ez dute kamera digitalaren pareko ahamenik, deskribapenak automatikoki sor ditzakeenik. Ostera, prestakuntza handiko langileek sortzen dituzte, zorrozki.
Baliabide ugari, eta horien deskribapenak, prozesu automatiko edo konputazionalen bidez eratzen dira negozioetako eta zientzia-arloko antolaketa-sistemetan; beraz, baliabideak deskribatzeko prozesua ez da, inolaz ere, liburutegietan eta bestelako instituzio historikoetan baliatzen denaren tankerakoa. Hala ere, eratuko diren baliabide-motak sailkatzeko datu-ereduak edo eskemak modu berean dira sistematikoak, eta, normalean, datu-analista eta datu-ereduen egile adituek gauzatzen dituzte.
5.3.1 Helmena eta gunea zehaztea
Zer baliabide deskribatu nahi dugu? 4. atalean ikusi dugun moduan, beti ez da erraza izaten baliabide bereizitzat joko dena zehaztea, batez ere hainbat osagaiz osatutako baliabideen kasuan edo informazio-baliabideen kasuan, zeinetan edukia baita beren ezaugarririk garrantzitsuena, eta hori ez da zuzenean hautemateko modukoa. Deskribatu nahi duzun gauza identifikatzea ahalik eta zehaztasun eta praktikotasun handienaz: horra deskribapen erabilgarri bat sortzeko lehen pausoa.
4.2.4 atalean, Baliabideen Gunea izenburu pean, baliabide primarioen eta deskribapen-baliabideen arteko bereizketa bat ezarri dugu, eta baliabideen gunea deituko diogu. Baliabideen gunea deskribatzea ezinbestekoa da zer baliabide deskribatu nahi dugun zehazteko; halako erabakiak arbitrarioak izaten dira sarritan, baina gero sekulako eragina izaten dute baliabideen deskribapenaren izaeran eta hedaduran. Pertsona baten metadatuak beste pertsona baten datuak dira.
Liburuzain batentzat liburuaren prezioa, seguru asko, liburuaren beste ezaugarri bat baino ez da, liburuaren erregistroan gordetzen dena.
Bestalde, liburu-denda bateko kontulariaren ikuspegitik, liburuaren prezioa –hala liburua erosteko kostua nola erosleei bideratutako salneurria– funtsezko informazioa da, negozioak iraun dezan.
Sendagile batek paziente baten historial medikoari begiratzen dionean, ez zaio asko axola izango pazienteak zer aseguru mediko daukan; aitzitik, fakturazioaz arduratzen den pertsonarentzat datu funtsezkoa da. Erizainari berebizikoak irudituko zaizkio pazienteak une horretan dituen bizi-zantzuak; medikuarentzat, ordea, beharbada garrantzitsuagoa izango da datu horien agregazioa ulertzea, ikuste aldera ea zer adierazten duten pazientearen osasunaz epe luzera.
Zientzialari batek, anatomia ikertu nahi badu, animalien aleak gordeko ditu eta haiei buruzko deskribapen fisiko xeheak osatuko ditu; ostera, beste zientzialari batek, ekologia edo migrazioa aztertzeko xedearekin, albo batera utziko ditu animaliak berak, eta animalia bizi zen testuingurua deskribatuko du.
5.3.1.1. Kasuak edo bildumak deskribatzea
Baliabide baten deskribapena beste banako baliabide batekin loturik dagoela pentsatzea da errazena. 4. atalean aipatu moduan, kontuan hartuta baliabideek berek osagaiak izan ditzaketela –baliabide batzuen zatiekin osatutako sistemak edo objektuak–, erronka bat da zehaztea ea zer hartuko den banako baliabidetzat eta zer ez. Adibidez, batzuetan, futbol-talde bat baliabide bakar bat balitz bezala hartzen dugu; beste batzuetan, ordea, jokalari zehatz batean zentratzen gara. Hala ere, baliabideen xehetasun-mailaz erabaki behar dugunean, honako galdera honi erantzun behar diogu: ea baliabide bakoitzak premiazkoa ote duen deskribapen bereizi bat.
Liburutegi eta museotan espezialistak dira baliabideen deskribapenak osatzen beren bildumetako aleen harira. Baliabideen deskribapenak orobat aplikatzen zaizkio baliabide-klaseei edo -bildumei, izan ere, bilduma bat baliabide bat baita neurri berean (1.4. atala, «Bilduma»ren kontzeptua). Artxiboei eta mapen bilduma bereziei, normalean, baliabideen deskribapenak esleitzen zaizkie, baina bildumaren baitako dokumentu edo mapa bakoitzak ez dute zertan izan bere deskribapen bibliografikoa. Era berean, negozioetako edo zientziako datu-sortak bildumak diren heinean deskribatzen dira, sarritan beren osotasunean aztertzen direlako.
5.3.1.2 Abstrakzioa baliabideen deskribapenean
Baliabideen deskribapenak, halaber, baliabide-eremu oso batekin lot ditzakegu (ikus 3.5.2.4 Baliabide Motak Zaintzea eta 4.2.1 Baliabideen Eremuak). Baliabide-deskribapenen bilduma bat puskaz erabilgarriagoa da baldin eta baliabide guztiak deskribatzeko orduan elementu edo termino komunak erabiltzen badira, baliabide guztiei aplika dakizkiekenak. Eskemak (edo ereduak, edo metadatuen estandarrak) zehazten du zer deskribapen-sortak eragiten dion baliabide-mota oso bati. Batzuetan, eskema, eredu edo estandar hori inferitu egiten da, edo inposatu egiten zaio, aldez aurretik existitzen diren baliabideen bilduma bati, definizio bateratuak lortze aldera; ordea, ohikoagoa da eskemak zehaztapen moduan baliatzea, baliabideak sortzen edo eratzen direnean (ikus 3.1 Sarrera ataleko Zer da baliabideak «sortzea»?).
Esate baterako, datu-base erlazional bat erraz asko kontzeptualizatu daiteke modu honetan: erregistroen bilduma bat, taula batean edo gehiagotan antolatua, non erregistro bakoitzak bere lerroa baitu; lerro horretan badago eremu- edo ezaugarri-kopuru jakin bat, aldez aurretik ezarritako eduki-mota batekin. Datu-baseko taulako erregistro edo lerro bakoitzak baliabide bat deskribatzen du –langile bat, produktu bat, edozer gauza–; hari lotutako ezaugarri indibidualak –taulako lerroen eta zutabeen bidez antolatuak– eta baliabide-ale zehatz baten deskribapena –hala nola 24. Langilea edo 8012C produktua– ez dira gauza bera.
Dokumentu deitu ohi ditugun informazio-baliabideak, berez, ez dira izaten datu-baseetan kudeatzen direnak bezain homogeneoak ez edukian ez egituran. Dokumentuen eskemek –SGML edo XML formatuetan antolatu ohi direnak– aukera ematen dute, normalean, datuak eta deskribapen-elementu testualak nahasteko.
5.3.1.3 Helmena, Eskala eta Baliabideen Deskribapena
Gauza bakar bat deskribatu behar bagenu, hitz bakar bat erabiliko genuke horretarako: «hori». Ez genuke beharrik izango hori beste ezerengandik bereizteko. Bigarren baliabide bat badago, ordea, gutxienez beste termino bat behar izango da deskribapenen hizkuntzan: «hori ez dena». Hala ere, bilduma hazi ahala, deskribapenak konplexuagoak bihurtu behar dira, ez bakarrik bi baliabide ezberdintzeko, ezpada hainbaten artean bereizteko.
Deskribapenen hizkuntzan erabiltzen den elementu edo termino bakoitzak dimentsio bat eratzen du, edo ardatz bat, zeinean barna bereizten baitira baliabideak; bestela, galdera-sorta bat zehazten du baliabideei buruz. Sarritan agertzen diren bereizketa eta galderek errazak izan behar dute, adibidez:
Zein da baliabidearen izena?
Zeinek sortu zuen?
Zer motako edukia edo gaia du?
Ondorioz, bilduma hazi ahala, baliabideak deskribatzeko hizkuntzak zorrotzagoa izan behar du; gainera, bilduma txikia zenean sortutako deskribapenak berrikusi beharra izaten da maiz, jada ez baitira egokiak beren xedeetarako.
Liburutegietako baliabideen deskribapenak estandarizatu egin dira maila nazionalean eta nazioartean; hori dela-eta, katalogatze-lana hainbat deskribatzaileren artean banatzen da, eta horren emaitzak elkarbanatu egiten dira gero. Estandarizazioaren printzipioa izan da, mende batez, deskribapen bibliografiko zentralizatuaren oinarria.
Baliabideen deskribapen zentralizatua, langile prestatuek egina, baliagarria da liburutegientzat; halere, liburutegi-zientzialari ugarik eta webeko autoretzaren futuristek sarearen hastapenetik beretik aitortu zuten ezen hurbilketa horrek ez zuela aski eskala izango web baliabideak deskribatzeko. 1995ean, Dublin Core (DC) zeritzon metadatu-elementu-sorta proposatu zen: 15 elementu baino ez zituen, eta deskribapenerako hiztegi askoz sinpleagoa zen, katalogatzaile profesional gisa jarduteko prestakuntzarik ez zutenek ere erabiltzeko modukoa. Geroztik, Dublin Core egitasmoak eragin handia izan du: haren arrastoari segika, hainbat komunitatek sortu dituzte deskribapenetarako hiztegi minimalistak; sarritan, profesionalek ez-profesionalentzat diseinatutako hiztegiak sinplifikatuz egin dute.
Jakina, deskribapenetarako hiztegi sinpleagoa erabiltzen denean bereizketa gutxiago egiten dira hiztegi konplexua erabiltzen denean baino: adibidez, baliabide baten eduki intelektualaren arduraduna izendatzeko orduan –pertsona bat zein baliabide ez-gizatiar bat izanik ere– ez da erabiliko «autore», «artista», «konposatzaile» edo antzeko kontzepturik, «sortzailea» baizik (hala egiten du Dublin Corek); ondorioz, zehaztasunaren puska bat galduko da deskribapena sortzean, eta baliteke gaizki-ulertuak ere eragitea deskribapenak berrerabiltzen direnean.
Helmena eta eskala handitzen direnean, horrek desabantailak ekar ditzake baliabideen deskribapenean; hala ere, posible da eragozpen horiek saihestea baldin eta, antolaketa-sistema sortzean, haren helmen eta eskala orokorra aintzat hartzen badira. Demagun negozio batek bezeroak dituela AEBko sei estatutan; bada, bezeroen datu-basea egitean, ez litzateke aukera adimentsua izango helbideari dagokion eremuan soilik sei estatu horietako bat hautatzeko aukera ematea; aitzitik, diseinu hedakorrago bat baliatuz gero, edozein estatu edo probintzia jar liteke, posta-kode bat gehituz. Dena dela, bildumaren helmena eta eskala hazi ahala arazoak izaten diren moduan hiztegi sinpleago bat egokitzeko, bilduma txikien kasuan gehiegizkoa izan daiteke baliabideen deskribapenak diseinatu eta aplikatzeko lana egitea, etengabe hazten diren bilduma zabaletan egiten den eran.
5.3.2 Xedeak zehaztea
Baliabideen deskribapenak xede ugari ditu: antolatuko diren baliabideen helmenaren eta eskalaren araberakoa izango da xedeen uztarketa eta horren ondorioz sortuko diren deskribapen-motak. Xede ohikoenak identifika eta sailka ditzakegu antolaketa-sistema orotan gertatzen diren lau jardueren bitartez: baliabideak hautatzea, antolatzea, horiekin elkarreraginean jardutea eta mantentzea (ikus 3. atala). Baliabideen deskribapenak, halaber, badu xede zabalago bat sensemaking (zentzungintza) deritzonean eta zientzian (5.3.2.5 atala): mundua behatzen eta deskribatzen dugu gure esperientziei zentzua emateko eta etorkizuneko kontuak aurreikusteko.
5.3.2.1 Baliabideak deskribatzea hautaketa ahalbidetzeko
Hautaketa definitzen badugu baliabideak identifikatu, ebaluatu eta ondoren antolaketa-sistema bateko bildumara eransten dituen prozesu gisa, honako kasu hau azpimarratzen dugu: baliabideen deskribapenak sortzen dituen pertsona ez denean horiek erabiliko dituen pertsona bera. Hainbat modu identifikatu ditzakegu, zeinen bidez baliabideen deskribapenak hautaketa ahalbidetzen baitu:
- Deskubritzea
Eskura dauden zer baliabide erants daitezke bildumara? Baliabide berriak, maiz, direktorio, erregistro eta katalogoetan zerrendatzen dira. Baliabide-mota batzuk automatikoki hautatu eta erosten dira harpidetza edo kontratuen bidez.
- Gaitasuna eta bateragarritasuna
Baliabideak beteko al ditu funtzioei eta inter-operazionaltasunari dagozkion baldintzak? Teknologia asko baliatzen duten baliabideek, sarritan, deskribapen-mota espezializatu ugari dauzkate, zeinen bidez zehazten baitira beren funtzioak, egitekoa, fidagarritasuna eta beste «gaitasun» batzuk, eta horrek baldintzatuko du ea ondo moldatuko diren antolaketa-sistemako beste baliabide batzuekin. Zerbitzu batzuetan, zerbitzu-maila, terminoak eta baldintzak edo interfazeak biltzen dituzte beren deskribapenetan, eta horrek eragina du beren bateragarritasunean eta inter-operazionaltasunean. Beste baliabide batzuek, ordea, lizentziari edo erabilerari lotutako mugak dituzte, zeinak eragotz baitezakete baliabideak modu eraginkorrean erabiltzea asmo diren helburuetarako. «Jendearen hautaketa»ri dagozkion erabakiak datuen arabera hartzen dira gero eta gehiago; kirol-taldeek, enpresaburuek eta hitzordu erromantikoetarako webguneek, orain, estatistiketara jotzen dute pertsona egokiena aurkitzeko.
- Egiaztatzea
Baliabidea benetan al da dioen hori? (4.5.3 Egiazkotasuna). Egiaztatzea ahalbidetzen duten baliabide-deskribapenen artean badira teknologikoak direnak, hala nola denbora-zigiluak, ur-markak, enkriptatzea, checksum delakoa (egiaztatze-batuketa) eta sinadura digitalak. Baliabide baten jabetzaren edo kustodiaren historia, jatorria esaten zaiona (4.5.4 Jatorria), salmenten edo zerga-erregistroen bitartez ezartzen da sarri.
- Ebaluazioa
Zein da baliabide honen balioa? Zein bere kostua? Zer ratiotan hasten da depreziatzen? Iraungipen-datarik du? Ba al dago hari lotutako puntuaziorik, rankingik edo kalitate-neurririk? Are gehiago, zein da puntuazio, ranking eta neurri horien izaera?
Aintzat hartzen dugu, halaber, baliabidearen deskribapena sortzen duen pertsonaren ikuspegia eta haren xede primarioa, zeina, maiz, beste pertsona batek baliabidea hautatu dezan hauspotzea baita. Produktuen marketingaren zeregina da izenak eta deskribapenak diseinatzea, baliabide bat berezia eta erakargarria izan dadin beste antzeko batzuekin alderatuta. Luzaroan, aranpasak elikagai osagarritzat jo izan ziren: premiazkoak omen ziren hesteen mugimendua «erregulatzeko», batez ere adineko jendearen kasuan. Halako batean, ordea, Kaliforniako Aranpasen Batzordeak (munduan aranpasa gehien ekoizten dituenak erakundeak) beste izen bat jarri zien fruitu haiei, «aran lehorrak», eta jatorduen artean jateko egokiak zirela jakinarazi zuen (bide batez, erakundearen beraren izena aldatu zuten: Kaliforniako Aran Lehorren Batzordea): hala, salmenta nabarmen hazi zen.
Herrialde askok zera eskatzen dute: inportatutako ondasunek jatorrizko herrialdeko etiketa izan dezatela. Kontsumitzaileek, maiz, baliabideen deskribapeneko ezaugarri hori hartzen dute produktuaren kalitate onaren bermetzat, hala nola gertatzen den suitzar erlojuekin, frantziar edo italiar modarekin edo kanadar hirugiharrarekin. Bestalde, kontsumitzaileek bertoko ondasunak erosi nahi izaten dituzte abertzaletasun ekonomikoarengatik edo erosketa-araudiekin bat egiteko. Ez da harritzekoa ezen, kontsumitzaileek produktuen jatorria begi onez ikusten duten kasuetan, informazio hori ageri-agerian eta erraz irakurtzeko moduan jarrita egotea. Ostera, kontsumitzaileek ez dutenean hain modu positiboan ikusten produktuaren jatorria, beharbada ondasunaren kalitate eskasaz ohartarazten duelako, hornitzaileak ahalik eta toki ezkutuenean ipiniko du datu hori –legearen mugen barruan–, edo, are, baliteke ondasunak tokikoak direla esatea, faltsua bada ere.
Halako faltsutzeak barra-barra gertatzen dira online hitzorduetan ere; dena dela, iruzurren neurria orekatu behar da harremanaren helburuekin eta iruzurra deskubritua izatearen aukerekin.
Geratu eta pentsatu: Higiezinen merkatuko iragarkiak
Ezagun da ezen higiezinen merkatuko iragarkietan irudimen handiko deskribapen positiboak agertu ohi direla; esate baterako, etxe bati buruz esaten baldin bada oso erraza dela bertara iristea, seguru asko, zirkulazio handiko autobide baten alboan edo autobus geltokiaren ondoan egongo da; «toki bakarti» batean kokatutako etxea, berriz, ziur hiriko punta urrun eta mortu batean dagoela.
Nola deskribatuko zenuke bizi zaren etxea, apartamentua edo gela, horren alde txarrak alde on bihurtuz?
5.3.2.2 Baliabideak deskribatzea antolaketa ahalbidetzeko
Antolatzea, esan dugunaren arabera, zera da: baliabideak deskribatzeko eta sailkatzeko printzipioak zehaztea, hartara elkarreragin-jardueren oinarrian dauden gaitasunak sortzeko. Definizio horretan, bi jarduera bereizi gertatzen dira, sekuentzialak: baliabideen deskribapenak sortzen dira lehenik, eta, ondoren, deskribapenok erabiltzen dira baliabideak antolatu eta elkarreragina ahalbidetzeko. Hori agerikoa da honako kasu hauetan: jendeak hitz-gakoak eta sailkapenak esleitzen dizkio dokumentuei, edo sentsoreek datuak sortzen dituzte, eta, ondoren, baliabideen deskribapen horiek erabiltzen dira dokumentuak berreskuratzeko edo datuak aztertzeko. Saltoki bateko langileak, soinekoak erakusmahai batean jartzean, etiketak jarriko dizkie, jantziaren marka, neurria eta bestelako ezaugarriak adieraziz. Era berean, bildumak, integrazioa eta informazio pertsonalaren analisia egituratzen duten arauak ere baliabideen deskribapenak dira, eta eragina dute informazio-baliabideen antolaketan.
Dena den, baliabideen deskribapena eta baliabideen antolaketa logikoki bereizi badaitezke ere, batzuetan elkarri lotuta daude. Norbere arropak antolatzean, ez dugu baliabideen deskribapen espliziturik erabiltzen, inplizituak baizik, kontuan hartuz erraz hautematen diren ezaugarriak, hala nola kolorea, forma eta osaera-materiala. Pertsonak ez baizik algoritmoak arduratzen direnean testuak aztertu eta ezaugarri deskriptiboak identifikatzeaz, ondoren hainbat aplikaziotan erabiltzeko –informazioa berreskuratzea, spama sailkatzea eta sentimenduen analisia–, baliabideen deskribapenak eta baliabideen antolaketa batera garatzen dira, eta batzuetan modu iraunkorrean egiten dute, izan ere, baliabide berriak deskribatu ahala, algoritmoa egokitu egiten baita eta gauzak ikasten baititu. Baliabideen deskribapenaren eta antolaketaren arteko lotura estu hori orobat erabiltzen da beste antolaketa-sistema batzuetan, zeinetan ohituren erregistroak gordetzen baitira erabilera-saioei, nabigazioari eta deskargei buruz, eta elkarreraginerako baliabide gisa erabiltzen: baliabideen erabilera kobratzeko edo, baliabideak modu jakin batean hautatuz eta antolatuz, etorkizunean elkarreragin-jarduera pertsonalizatuak egitea ahalbidetzeko (ikus 1.9 «Elkarreragin-baliabidea»ren kontzeptua).
5.3.2.3 Baliabideak deskribatzea elkarreragin-jarduerak ahalbidetzeko
Baliabideen deskribapenen eta metadatuen xedeei buruzko eztabaida gehientsuenetan, elkarreragin-jarduera jakin batzuk azpimarratzen dira, hain zuzen ere, nahita eta modu esplizituan esleitu diren baliabide-deskribapenetan oinarritutakoak. Bibliotekonomialariek sortu zituzten Erregistro Bibliografikoetarako Baldintza Funtzionalak (FRBR, ingelesezko sigletan); horien baitan, lau jarduera zehazten dira: baliabideak Aurkitzea, Identifikatzea, Hautatzea eta Berreskuratzea; nolanahi ere, horiek modu generikoan ezar dakizkioke antolaketa-sistemei, eta ez bakarrik liburutegiei.
- Aurkitzea
Zer baliabide daude eskura, zeinak «bat egiten baitute erabiltzaileak ezarritako bilaketa-irizpideekin», informazio-premia asetzeko moduan? Erabiltzaile modernoek onartzen dutenez, ordenagailu bidezko indizeei esker, bilaketak egin daitezke ez bakarrik deskribapen-baliabide osoan, ezpada baliabide primarioaren eduki osoan ere.
- Identifikatzea
Baliabideen deskribapenaren beste xede bat da erabiltzaileari aukera ematea baliabide jakin baten identitatea berresteko edo elkarri gainjartzen zaizkion deskribapenak dituzten hainbaten artean bereizteko. Baliabide fisikoak azkar identifikatu beharra dagoenean, kolorea erabili daiteke baliabideak deskribatzeko.
- Hautatzea
Testuinguru honetan, hautatzeak zera esan nahi du: erabiltzaileak baliabideen deskribapenak baliatzea bilduma batetik baliabide bat hautatzea ahalbidetzeko; ez du adierazi nahi, ostera, beste jarduera instituzional hori, zeinean baliabideak hautatzen baitira bilduma bat osatzeko. Bilatzaileetan, normalean, hautaketa ahalbidetze aldera, «testu pusketa» labur bat erabiltzen da baliabide-deskribapen gisa, bilaketa-terminoak azpimarratuz.
- Berreskuratzea
Sarritan, baliabide fisikoak hautatu ostean, ahalegin handia egin behar da horiek eskuratzeko. Autobus edo hegazkin bat hartu nahi baduzu, bi hauek koordinatu behar dituzu: batetik, oraintxe zauden kokalekua eta ordua; bestetik, baliabidea berreskura dezakezun kokalekua eta ordua. Forma fisikoa duten informazio-baliabideen dagokienean, hautatu duzun baliabidea berreskuratzeko, normalean, liburutegiko apalategietan barna ibili behar duzu. Informazio-baliabide digitalen kasuan, berriz, bilatzaileak baliabideen identifikatzaileen zerrenda bat itzuliko dizu, eta klik bakarrean sartu zaitezke haietan; hortaz, ez da ahalegin handirik egin behar bilaketaren emaitzen artean bat hautatzetik hari dagokion baliabide primariora joateko.
Elaine Svenoniusek proposatu zuen bosgarren ataza bat –Nabigazioa– gehitu zedila FRBR zerrendara, eta hala egin zen 2016an, beste izen batekin, ordea: «Esploratzea».
- Nabigazioa edo esploratzea
Erabiltzaileak ez baldin badira gai beren informazio-premiak zehaztasun jakin batekin adierazteko, eta, ondorioz, aurkitzearen funtzioarekin baliatzeko; gai izan behar lukete deskribapen erlazionalak eta egiturazkoak erabiltzeko baliabideen artean, baliabide batetik beste egokiago batera iristeko moduan. Orokortze-, agregazio- eta eratorpen-harremanak azpimarratu ditu Svenoniusek. Baina, printzipioz, edozein harreman edo ezaugarrik balio lezake baliabideen arteko «autobidean» barna ibiltzeko.
5.3.2.4 Baliabideak deskribatzea mantenua ahalbidetzeko
Hautaketa ahalbidetzen duten baliabide-deskribapenen mota asko (5.3.2.1 Baliabideak deskribatzea hautaketa ahalbidetzeko) orobat dira baliagarriak baliabide jakin baten edo baliabide-bildumaren mantenua ahalbidetzeko. Zehazki, mantenuaren eremuan, «kontserbaziorako metadatuak» esan ohi zaie bi informazio-mota hauei: batetik, baliabideen formatu eta teknologiaren (softwarea, ordenagailuak eta bestelakoak) informazio teknikoari, baliabideak erabiltzeko behar dena, eta, bestetik, baliabidearen osotasuna ziurtatzeko behar den informazioari.
Mantenu-jarduerekin modu esklusiboagoan loturik dauden baliabide-deskribapenen artean, badira bertsioaren informazioari eta eraginkortasunari buruzkoak, eta baliabidearen bizitzari buruzko informazio erabilgarria ere. Ekipamenduen mantenu-lanak egiteko egutegia, normalean, halakoekin lotzen da: ibilitako milia-kopurua (autoaren kontagailuak adierazten duena), lan egindako ordu-kopurua (motor askok gordetzen dute), inprimatutako orrialde kopurua edo baliabideen erabilerari edo elkarreragin-jarduerei lotutako bestelako informazioa, erregistratzeko erraza dena. Orain baditugu baliabide adimentsuak, zeinak gai baitira datu gehiago atzitzeko, aztertzeko eta komunikatzeko denbora errealean gauzatutako lanari buruz; horregatik, posible da aurreikuspen eta ordutegi sofistikatuagoak ezartzea mantenu-lanari dagokionean. Era berean, errazagoa suertatzen da espero bezain beste erabiltzen ez diren baliabideak identifikatzea; horrek adieraz dezake jada ez direla behar; ondorioz, lasai artxibatu edo ezabatu daitezke.
5.3.2.5 Baliabideak deskribatzea zentzugintzarako eta zientziarako
Orain arte, 5.3.2 atalean, aztertu dugu nola erabiltzen diren baliabideen deskribapenak ataza zehatzak gauzatzeko aldez aurretik existitzen den antolaketa-sistema batean. Nolanahi ere, baliabideen deskribapenek badute beste xede zabalago bat, ez hain zehatza, zeina zaharragoa eta funtsezkoagoa baita: baliabideen deskribapenak erabiltzen dira munduaren zentzua ulertzeko lehengai gisa.
Milaka urtez, baita idatzizko hizkuntza asmatu aurretik ere, jendeak modu sistematikoan bildu ditu gauzak, gauza horiei buruzko informazioa eta era guztietako iruzkinak beren munduaren funtzionamenduari buruz. Paleolitoan, gizakiek marrazkiak egin zituzten haitzuloetan, ehizaldien emaitzak eta animalien migrazioak islatzeko; antzinako Egipton, berriz, harrian zizelkatzen zituzten Nilo ibaiaren urteroko gainezkaldiak; azkenik, Babiloniako, Egiptoko, Txinako eta Mesoamerikako astronomoek, orain dela bost mila urtetik hasita, egutegi moduan antolatu zituzten ilargiari, eguzkiari eta planetei buruzko behaketak.
Behaketak erregistratuz, aztertuz, antolatuz eta berrantolatuz esperientziari esanahia emateko askotariko ahaleginei, batera hartuta, zentzugintza dei dakieke (Ikus taula gehigarria, Zentzugintza eta antolaketa).
Zentzugintzaren alderdi batzuk sakon-sakonean programaturik dauzkagu, eboluzioaren ondorioz: eboluzioak mekanismo boteretsuak eman dizkio gure garunari, modu automatikoan sinplifikatzen eta antolatzen dutenak mundutik eskuratzen ditugun datu kontzeptualak (ikus taula gehigarria: Gestalt printzipioak). Nolanahi ere, zentzugintza automatiko hori menderatzen eta zabaltzen du berariazko zentzugintzak.
Honako egoera hauetan gertatzen da berariazko zentzugintza: metodo estatistiko, esperimental eta zientifikoak jarraitzen direnean ohartuki, eta, horien bidez, jakintza erauzten eta antolatzen denean laginen, behaketen eta neurketen bildumetatik. Ezinbestean aitortu behar da bilduma horien edukiek hautuak islatzen dituztela –zer bilduko den hautatu da–, izan ere, era askotako deskribapenak eta ezaugarriak bildu daitezke gauza eta fenomeno gehienen inguruan.
Gauzak edo datuak bildu ondoren, metodo estatistikoek honako datu hauek laburbiltzen dituzte: bilduma edo datu-sorta batean dauden ezaugarrien balioak eta horien arteko harremanak. Bilduma edo datu-sorta bakar bati zentzua bilatu ostean –horren baitako kasuen ezaugarrien arteko ezberdintasunak eta sailkapenak zehaztuz–, xede garrantzitsuago bati hel dakioke: lagina hartu den multzo handiagoa edo biztanleria ulertzea. Horren harira, hauxe da adibide argiena: 1869an, elementuen taula periodikoa osatu zuen Mendeleev-ek; ezagutzen ziren elementuak antolatu zituen beren ezaugarri kimiko komunen arabera, eta, ondoren, oraindik deskubritu gabe zeudenen ezaugarri batzuk iragarri zituen, arrakastaz.
Hasierako datu-sortatik garatu diren eredu konputazionalek etorkizuneko behaketak iragar ditzakete. Sailkapen-ereduek kasu berri bat esleitzen diote kategoria bati (adibidez, mezu bat spam den edo ez, autorea Madison edo Hamilton den, eszena bat barrualdean edo aire zabalean gertatzen den); erregresio-ereduek, berriz, neurketa baten balio espezifikoa aurreikusten dute (adibidez, film berri baten deskribapena emanda: zenbat diru irabaziko du?); erregresio ordinaleko ereduek neurri ez-metrikoen balioak aurreikusten dituzte (zenbat gustatuko zaizu filma?). Hipotesiak saiatzeko metodo esperimentalei esker, edozein erako ereduak garatu eta findu daitezke: horretarako, behaketak egin diren baldintzak aldatzen dira, sistematikoki, eta hala deskubritzen da nola aldatzen diren emaitzak egoera bakoitzean.
Zentzugintza eta antolaketa
Jendeak gauzak antolatzen ditu, hartara input okerrei zentzua hartzeko eta zentzu hori berriro munduan gauzatzeko, ordenatuagoa izan dadin.
Zentzugintza eta antolaketa elkarri lotuta daude. Antzinako kulturetan, behaketak erregistratzen zituzten denborari buruz, eta aztertzen zuten ea zer joera zeuden uztaldi, produktuen prezio, eguraldiaren baldintza eta ikuskizun astronomikoetan. Astronomo goiztiarrek, esaterako, tenpluen eraikinak lerrokatzen zituzten gertakari astronomikoekin bat egiteko, eta zodiakoko iruditeriarekin apaintzen zituzten hormak.
Zer planeta eta izar behatu behar lirateke gaueko zeruan eta nola erregistratu behar lirateke behaketa horien xehetasunak?
Zer teknika matematiko eta estatistiko erabili behar lirateke behaketa horiek aztertzeko eta deskribatzeko?
Nilo ibaiko uholdeen hasiera iragartzeko –ibaitik hainbat miliara gertatu diren eta behatu ez diren euriteek eragindakoa–, behaketen zer azpi-sorta dira erabilgarrienak?
Zer behatu eta nola deskribatu hautatzean, hautu guztiek islatzen dute uste eta hipotesi potentzialen sail bat, zeinak inplizituak baitira sarri, eta ez dira esaten. Ulermena areagotzen duten hautuetan sakontzen da; informaziorik ematen ez dutenak, berriz, bazterrean uzten dira, baina ez dago bermerik ziurtatzen duenik ulermen egokia lortuko denik zer behatu hautatuz gero.
Datu-sorta zehatz eta oso bat hartzea ez da aski eredu egoki bat sortzeko; printzipio hori argi erakusten dute Tycho Brahe eta Johannes Kepler-en ahalegin elkarlotuek. Brahe XVI. mendeko astronomo daniar bat izan zen, noblea: hamarkadak igaro zituen ehunka izar eta planeten kokapenei buruzko datuak biltzen. Nolanahi ere, garaian nagusi ziren aurreiritzi erlijioso eta zientifikoen eraginez, Brahek ontzat jo zuen uste oker bat, hau da, planetak eta eguzkia biraka zebiltzala Lurraren inguruan, orbita zirkularretan. 1601ean hil zen Brahe, eta haren heriotzaren ostean, Kepler hamar urtez aritu zen haren datuak aztertzen: Lurra zentroan zegoela eta planetek orbita zirkularrak egiten zituztela zioen ideia ezeztatu zuen, eta, horren ordez, esan zuen orbitak eliptikoak zirela eta eguzkia zutela erdigunean. Braheren datuak antolatzeko printzipio berri horiek izugarri sinpletu zuten eguzki-sistemaren eredua, eta Kepler gai izan zen planeten mugimenduari buruzko legeak deskubritzeko, astronomia eta fisika garaikidearen oinarriak direnak.
Zentzugintza eta ereduak sortzeko garaian, erronka funtsezko bat da oreka aurkitzea elkarren lehian dauden bi xederen artean: bilduma edo datu-sorta jakin bat ulertzea, batetik, eta ulerkera hori kasu berriei aplikatzeko gaitasuna, bestetik. Ereduen artean bada alderik –adibidez, zenbat baliabide-deskribapen erabiltzen dituzten parametro moduan–, eta erraza eta tentagarria da eredu bat gain-egokitzea parametro gehiago erabiliz, modu horretan ausazko aldagaiak aurkitzeko behaketetan. Gain-egokitzearen eraginez, zehaztasun faltsuak sortzen diren behaketa originaletan, baina, modu horretan, ereduak ez dira hain orokorgarriak.
Eredu edo teoria zientifikoak sortu eta, horren bidez, behaketetan ikusitakoaren mekanismo kausalak eta interpretagarriak proposatzea; horra zentzugintzaren maila altuena. Zentzugintza automatikoak azalpen sinpleak ematen dituen bezala, zientzialariek ere nahiago izaten dituzte teoria sinpleagoak: heuristika horri Ockham-en labana edo parsimoniaren printzipioa esaten zaio. Gerta liteke teoria konplexuak zehatzagoak izatea; teoria sinpleagoek, halere, aurreikuspen egiaztagarriagoak ekoizten dituzte, beraz, errazagoa suertatzen da teoria egiaztatzea edo fintzea. Ockhamen printzipio famatuak, duela zortzi mende sortu zenak, hala dio: nahiago izan behar direla albait uste gutxien baliatzen dituzten ereduak (hori neurtzeko, sarritan, aurreikuspen bat egiteko behar diren parametro- eta aldagai-kopuruari erreparatzen zaio).
5.3.3 Ezaugarriak identifikatzea
Behin deskribapenaren xedeak zehaztu direnean, identifikatu behar dugu baliabideen zer ezaugarrik ase ditzaketen xede horiek. Ataza hori uste baino zailagoa da, lau arrazoi direla-medio:
Hasteko, edozein baliabideren kasuan, premiazkoa izan daiteke hainbat deskribapen egitea, baliabidearen ezaugarriei lotuak denak, kontuan hartuta zer elkarreragin ahalbidetu behar duten eta zer testuingurutan gertatuko diren. Saskibaloi-talde bateko jokalariak hautatu nahi baldin baditugu, aintzat hartuko ditugu haien ezaugarri fisikoak, hala nola altuera, indarra, salto egiteko gaitasuna eta koordinazioa. Ostera, eztabaida-talde bateko kideak hautatzeko, kontuan hartuko dira haien ahozko gaitasunak eta ezaugarri intelektualak.
Bigarrenik, baliabide-mota ezberdinek ezaugarri ezberdinak txertatu behar dituzte beren deskribapenetan. Museoko baliabideen artean, arte-piezen materialari eta neurriari buruzko ezaugarriak aipatuko dira; sarearen administratzaileak kudeatzen dituen dokumentu eta zerbitzuen kasuan, berriz, berreskuratzeko eta kontrolatzeko baimenak izango dira; liburu eta DVD elektronikoei dagokienez, eskubide digitalen kudeaketarako kodea egongo litzateke, zeinak adierazten baitu zer egin dezakezun, eta zer ez, baliabidearekin.
Hirugarrenik, 5.3.1.3 atalean laburki aipatu genuen bezala, deskribapena egiten duenaren arabera erabakiko da zer ezaugarri txertatuko diren deskribapenean. Antolatzearen diziplinan prestakuntzarik ez duen jendearen kasuan, ez du zentzurik haiengandik espero izatea ezberdintasun eta interpretazio fin-finak egin ditzaten ezaugarrien inguruan. Konpentsazio horri erreparatuko diogu 5.3.6 atalean eta 5.4.1 atalean.
Laugarrenik, maila kontzeptualean gauza bera dela iruditu arren, baliteke ezaugarri bat guztiz ezberdina izatea inplementazioan. Baliabide askoren deskribapenean baliabide primarioa ordezkatzen edo laburbiltzen da. Irudien, margolanen eta halako baliabideen kasuan, itxura da beren muina, horregatik, originalaren argazki txikiago bat eginez gero, erresoluzioa murriztuta, laburpen-baliabide egoki bat izan daiteke. Erraza da ordezko hori sortzea, eta erabiltzaileek aise lotuko dute baliabide primarioarekin. Bestalde, testu bat hartu eta horren laburpen motz bat egitea gaitasuna bat da bere horretan. Denboran oinarritzen diren baliabideak are erronka handiagoa dira laburpenak egiteko orduan. Film baten laburpenak zer izan behar luke: argumentuaren laburpen testual bat, filmeko pusketa esanguratsu bat, bideo-laburpen bat edo guztiz bestelako zerbait?
Inplementazioari buruzko hutsune hori, maiz, oso handia izaten da jendeari buruzko ezaugarrietan, izan ere, gainerako baliabide-motak neurtzea baino zailagoa da pertsonak neurtzea. Negozioek neurtu beharra dute ea pertsona batek zenbateko interesa duen bere produktuetan, horrela aurreikusiko baitute zer prezio ordaintzeko prest egongo diren erosleak; «interesa», ordea, ezin da zuzenean neurtu. Aitzitik, aurreikuspenak egiteko, «interesa» ordezkatzen duten neurketak baliatzen dira, adibidez, bezeroak zenbat denbora pasa duen produktuari begira webgunean eta ea antzeko produktu bat bilatu eta begiratu ote duen lehiakidearen webgunean.
Deskribapenetan eta antolaketa-printzipioetan erabiltzen diren baliabide-deskribapenak ulertzeko eta alderatzeko, badira bi dimentsio garrantzitsu: ezaugarrien funtsa –ea ezaugarriak modu intrintsekoan edo estrintsekoan loturik dauden baliabideekin– eta ezaugarrien iraunkortasuna –ea ezaugarriak estatikoak edo dinamikoak diren–. Bi dimentsio horiek aintzat hartuta, lau kategoria sortzen dira ezaugarrientzat, 5.4 marrazkian agertzen den moduan (Ezaugarrien muina x iraunkortasuna: ezaugarrien lau kategoria). Lau kategoria horiek marko erabilgarri bat eskaintzen dute baliabideen ezaugarriez pentsatzeko, nahiz eta, aldian-aldian, ezaugarrien sailkapena eztabaidarako gaia izan.
5.3.3.1 Ezaugarri estatiko intrintsekoak
Ezaugarri intrintseko eta inplizituak berezkoak zaizkio baliabideari eta, maiz, zuzenean hauteman edo jaso daitezke. Ezaugarri estatikoen balioak ez dira aldatzen denboran. Animalia-espezie bat, egurrezko aulki baten konposizio-materiala eta gurpil baten diametroa ezaugarri estatikoak dira guztiak, eta horien balioak ez dira aldatzen denbora pasa ahala. Ezaugarri estatikoak, hala nola kolorea edo forma, sarritan erabiltzen dira baliabide fisikoak deskribatu eta antolatzeko.
Ezaugarri fisiko intrintsekoak, normalean, baliabideen deskribapenaren parte izaten dira. Kasu askotan, ezaugarri fisikoek baliabidearen azaleko geruza baino ez dute deskribatzen, eta gutxi esaten dute honako kontu hauen inguruan: baliabidea zer den, zer helburu zuen, zer esan nahi duen edo noiz eta zergatik sortu zen. Kantu baten sortzailea eta kantua sortu zen testuingurua: horra beste bi ezaugarri estatiko eta intrintseko, zuzenean hauteman ezin direnak.
Maiz, prozesu konputazionalek erauzten edo kalkulatzen dituzte deskribapen intrintsekoak. Adibidez, ordenagailuko programa batek kalkula dezake zenbateko maiztasunarekin eta nola banatzen diren hitzak dokumentu jakin batean. Era berean, deskribapen intrintsekoak dira sinadura bisualak zein audio hatz-markak (5.4 Baliabide ez-testualak deskribatzea).
5.4 marrazkia: Ezaugarrien funtsa x iraunkortasuna: Ezaugarrien lau kategoria
Ezaugarrien funtsaren eta iraunkortasunaren arteko ezberdintasunak uztartuz, ezaugarrien lau kategoria bereizten dira: ezaugarri intrintseko estatikoak, estrintseko estatikoak, intrintseko dinamikoak eta estrintseko dinamikoak.
Baliabideen arteko harreman batzuk intrintsekoak eta estatikoak dira, hala nola guraso eta haurren arteko harremana edo haurrideen arteko harremana. Bestalde, hainbat zatiz osaturiko baliabideen kasuan, zatiaren eta osotasunaren arteko harremana edo harreman konposizionalak orobat dira baliabide estatiko intrintsekoak eta sarri erabiltzen dira baliabideak deskribatzeko. Hala ere, eragotzi egin beharko litzateke baliabideen arteko harremanak ezaugarritzat hartzea; ostera, erlazio gisa adierazi behar lirateke. 6. atalean –Harremanak eta egiturak deskribatzea–, xehetasun handiz aztertzen dira zatiaren eta osoaren arteko harremanak eta bestelako harreman semantiko batzuk.
Ezaugarri intrintseko estatikoak.
Definitu dalmaziar bat
Dalmaziar txakurraren tantoak ezaugarri intrintseko estatikoak dira; kumeak jaio eta berehala agertzen dira, eta hain dira bereizgarriak ezen ezinezkoa baita txakur-arraza hori deskribatzea tantoak aipatu gabe.
Dalmaziar jakin honek ongietorria ematen die Viader Ardotegira doazenei (Deep Park, Kalifornia). Txakur atsegina da, eta ardoak, berriz, itzelak.
(Argazkia: R. Glushko)
5.3.3.2 Ezaugarri estrintseko estatikoak
Ezaugarri estrintseko edo esplizituak ez datxezkio baliabideei; esleitu egiten zaizkie. Baliabide baten izena edo identifikatzailea ausazkoa izaten da, baina behin esleituta, normalean ez da aldatzen. Antolaketa-printzipio ohikoa izaten da baliabideak antolatzea beren identifikatzaile deskribatzaileen ordena alfabetikoaren edo numerikoaren arabera. Baliabide bibliografikoei esleitzen zaizkien sailkapen-zenbakiak edo goiburu tematikoak ezaugarri estrintseko estatikoak dira, eta halakoak dira, orobat, produktuei lotutako eta zigilatutako serie-zenbakiak.
Formatu digitala duten informazio-baliabideei dagokionez, baliteke haien bertsio inprimatuen ezaugarriak intrintsekoak ez izatea. Testu-formatu batzuetan erabat bereizten dira edukia eta aurkezpena; ondorioz, estilo-orriek errotik alda dezakete dokumentu inprimatu baten edo webgune baten itxura, baliabide primarioari batere eragin gabe. Adibidez, paragrafo honi beste estilo bat aplikatuko balitzaio, letra lodian azpimarratuz edo 24 puntuko letra-neurria emanez, edukia bere horretan mantenduko litzateke.
5.3.3.3 Ezaugarri intrintseko dinamikoak
Ezaugarri intrintseko dinamikoak aldatu egiten dira denboran. Adibidez, aldakorrak dira pertsonaren garapenezko ezaugarriak: altuera, pisua, trebeziak edo gaitasun intelektuala. Nolaz eta halako ezaugarriak ez diren estatikoak, bildumaren baitan tarte mugatu batez egongo diren baliabideak antolatzeko baino ez dira erabiltzen. Kirol-saioetan edo ligetan, non parte-hartzaileak bereizten baitira adinaren edo esperientzia-urteen arabera, ezaugarri intrintseko dinamikoak erabiltzen dira baliabideak deskribatu edo antolatzeko.
5.3.3.4 Ezaugarri estrintseko dinamikoak
Ezaugarri estrintseko dinamikoak ausazkoak dira hainbat zentzutan, eta aldakorrak dira, erabileran, portaeran eta testuinguruan oinarritzen baitira. Une honetan baliabide baten jabea zein den; baliabide bat non dagoen orain; zenbat aldiz erabiltzen den; zenbat aldiz erabiltzen den beste baliabide batzuekin batera; une honetan zenbateko ospea edo garrantzia kulturala duen edo zer abantaila duen beste baliabide alternatibo batzuekiko lehian: horra hor zenbait ezaugarri estrintseko eta dinamiko, baliabideen deskribapenetan erabiltzen direnak. Gaurkotasun handiko liburu bat deskribatu daiteke best-seller modura, eta baliteke handik urte batzuetara merkealdiko apalategian egotea. Ikasle baten batez besteko nota ere ezaugarri estrintseko dinamiko bat da.
Ezaugarri estrintseko dinamikoak erabilgarriak dira datu-zientzialarientzat, aurreikuspen- edo sailkapen-ereduak egiteko. Une honetan non zauden, zer erosi berri duzun eta non erosi duzun: horiek denak har daitezke zaletasun eta balio atzemanezinen adierazpen moduan. Krimen bat gertatu den tokian hatz-markak baldin badaude atearen heldulekuan, hatz-marka horiek ezaugarri estrintseko dinamikoak izango dira atearekiko, eta detektibe zoliek aztertu egingo dituzte, beste elkarreragin-baliabide batzuekin batera, deskubritze aldera ea zer pertsonaren ezaugarri intrintseko estatikoak diren.
Baliabideen arteko harreman ugari estrintsekoak eta dinamikoak dira, gure lagun minarekin dugun harremana bezalaxe.
Ezaugarri kontestualak dira baliabide bat deskribatzen den egoerari edo testuinguruari lotuak daudenak. Dey-ren hitzetan, testuingurua zera da: «egoera baten ezaugarri den informazio oro, honako kontu hauekin lotua: erabiltzaileen arteko elkarreraginak, aplikazioak eta ingurua». Definizio zabal honek berekin dakar deskribapenetan erabil daitezkeen ezaugarri kontestualen sail handi bat; testuinguruaren deskribapen estuagoak izan daitezke bi hauek: «kokapena + jarduera» edo «nor, noiz, non, zergatik». Testuingurua aldatu egiten denez, testuinguruan oinarritutako deskribatzaileak egokiak izan daitezke esleitzen direnean, baina baliteke iraunkortasun eta eraginkortasun mugatua izatea (4.5 Baliabideak denboran): dokumentu bat «duela gutxiko erosketa baten ordainagiria» dela esaten badugu, deskribapen hori ez da luzaz izango erabilgarria.
Maiz, baliabideak deskribatzeko ezaugarri kulturalak erabiltzen dira, hizkuntza edo kultura konbentzionaletik hartuak; analogia bidez egin ohi da, oso iradokitzaileak eta oroitzeko errazak izan daitezkeelako.
Batzuetan, deskribapen kultural batek bere garrantzia agortzen du, eta galdu egiten du ezer iradokitzeko ahalmena: ezer eragitekotan, harridura eragingo du, inork ez duelako deskribapenaren esanahia ulertzen.
Legoekin jolasean zebiltzan haurrek ezagutzen dituzte Star Wars saileko filmak; horregatik, «laser ezpata» izendapena aukerakoa iruditu zaie tubo luze eta neoizko bat, helduleku bat duena, deskribatzeko. Ostera, Star Wars frankizia ezagutzen ez duen batek, beharbada, ez du ulertuko zer den «ezpata laser» bat, eta pieza beste era batera deskribatuko du.
5.3.4 Deskribapenetarako hiztegia diseinatzea
Baliabide-deskribapenetan erabiliko ditugun ezaugarriak zehaztu ondoren, deskribapenetarako hiztegia diseinatu behar dugu, hots, ezaugarriak adierazteko erabiliko ditugun hitzak eta balioak. 4.4 atalean –Baliabideak izendatzea–aztergai izan ditugu izendatzearen arazoak, eta printzipioak proposatu ditugu izen onak sortzeko; gainera, izenak baliabide-deskribapen oso garrantzitsuak direnez, esandako gauza asko orokorrean aplikatu ahal zaizkio deskribapenetarako hiztegiaren diseinuari.
Nolanahi ere, deskribapenetarako hiztegia, bere osotasunean, baliabide baten izena baino askoz gehiago denez, beste printzipio edo gidalerro gehigarri batzuk proposatu behar ditugu urrats honetarako. Bestalde, kontuan hartzen badugu baliabideen deskribapenak sorta bat direla, eta, horren baitan, deskribapen bereiziak sortzen dituztela hainbat pertsonak denbora-tarte batean, bada, diseinuari dagozkion galdera berriak agertzen dira.
5.3.4.1 Deskribapen onaren printzipioak
The Intellectual Foundation of Information Organization liburuan, Svenoniusek printzipio edo «gidalerro»en sorta bat proposatzen du, deskribapenetako hiztegia diseinatzeko. Printzipio horiek deskribapen bibliografikoen testuinguru estuan kokatzen dira; hala ere, modu orokorrean ezarri ahal zaizkie liburu honetan aipagai dugun baliabide-tipologia zabalari.
Ezaugarri sorren sorkuntza eta Netflix-en gomendioak
Ordenagailuen teknologian eta datuen zientzian berriki egin diren aurrerakuntzak tarteko, posible da baliabideen ezaugarri «sorrak» sortzea edo deskribatzea: hala esaten zaie ez direlako behatzen, inferitzen baizik. Negozioek halako ezaugarriak erabiltzen dituzte barra-barra, bezeroak sailkatzeko edo haiei gomendioak egiteko beren azkenaldiko jarreraren arabera: hortaz, ezaugarri estrintseko eta dinamikoak dira.
Norberak ikus-entzunezkoen harira dituen gustuek argi erakusten dutenez, erraz hautemateko moduko ezaugarriak –adina eta sexua– ez dira aski filmen ikusleak bereizteko eta haiei gomendio onak egiteko, baita hainbat ezaugarri uztartzen badituzu ere, hala nola «ikasle gizon eta bikotekiderik gabeak, 18 eta 25 urteren artekoak». Netflix kateak ikusi zuen ezen, film-gomendio onak egiteko, premiazkoa zela hainbat gauza uztartzea: ezaugarri demografikoak, ikusitakoen historiala, bilaketetako portaera eta filmei dagozkien dozenaka ezaugarriren puntuazio oso zehatzak. Indar konputazional itzela behar da normalean ekintzazko filmak atsegin dituzten baina tarteka-marteka maitasun-filmak ere arakatzen dituzten Netflixeko erabiltzaileen kategoria bat sortzeko, eta, ondoren, ezaugarri sor hori kontuan hartuta, haiei western filmen azpi-genero bat gomendatzeko (100.000tik bat dira), «Akzio eta Abentura Film Erromantikoak» deitua.
- Erabiltzaileen komenientzia
Deskribapeneko terminoak hautatzean, gogoan izan erabiltzailea: xede-audientziak hitzetik hortzera erabiltzen dituen terminoak erabiltzea komeni da.
- Irudikapena
Baliabideek beren burua deskribatzen dute; bada, erabili hori islatzen duten deskribapenak; uste ezazu auto-deskribapenak zehatzak direla.
- Nahikotasuna eta premia
Deskribapenek nahikoa informazio eduki behar lukete beren xedeak betetzeko eta ez lukete informaziorik gehitu behar baldin eta ez badu xederen bat betetzeko balio; horren eraginez, agian bazterrean utzi beharko dira auto-deskribapenetako alderdi baliogabe batzuk.
- Estandarizazioa
Estandarizatu deskribapenak praktikoa den neurrian, baina erabili ezizenak ere, erabilera arrunteko terminoei bidea emateko.
- Integrazioa
Hobetsi itzazu ezaugarri eta termino berdinak baliabide-mota guztietarako.
Diseinu-printzipioen edozein sortak bi erronka ditu parez pare:
Lehenik, edozein printzipio inplementatzeko, hautu gehigarri eta espezifiko ugari egin behar dira, testuinguruari lotuta, baina, halako kasuetan, printzipio orokorrak ez du gidalerrorik eskaintzen. Adibidez, nola aplikatuko dugu estandarizazioaren printzipioa, baldin eta baliabide-eremu jakin batean jada hainbat estandar existitzen badira? Lehian dauden estandarrean artean, zein ezarri behar litzateke eta zergatik?
Bigarren erronka hauxe da: batzuetan, printzipio orokorrek elkarren kontrako aholkuak ekar ditzakete berekin. Erabiltzaileen komenientziari dagokion gomendioak –erabilera arrunteko terminoak erabiltzea deskribapenetan– huts egiten du baldin eta erabiltzaileen komunitatean biak badaude, jende arrunta eta zientzialariak, zeinek termino ezberdinak baliatzen baitituzte baliabide berdinei buruz jarduteko; kasu horretan, noren «erabilera arrunta» gailendu beharko litzateke?
5.3.4.2 Nork erabiltzen ditu deskribapenak?
Erreparatu deskribapenen erabiltzaileari. Behar adina aldiz azpimarratuko dugu funtsezko ideia hori, izan ere, baliabideen deskribapenaren prozesuko urrats guzti-guztiei datxekio-eta. Aurreko atalean azaldu ditugun diseinu-printzipio guztiek ideia bat dute komunean: hain zuzen, deskribapenetako hiztegiaren diseinuak deskribapenen erabiltzaileari erreparatu behar liokeela. Antolatu beharreko baliabideak pertsonalak al dira, eta xede pertsonal eta pribatuetarako erabiliko al dira gehienbat? Kasu horretan, deskribapeneko ezaugarriak eta terminoak oso pertsonalak eta idiosinkratikoak izan daitezke, eta, halere, diseinu-printzipioei jarraitu.
Era berean, baliabideen erabiltzaileek jakintza garrantzitsua elkar trukatzen dutenean, edo testuinguru batean daudenean non, beharrezkoa izanez gero, komunikatzeko eta negoziatzeko gai baitira, baliabideen deskribapenek ez dute zertan izan beste kasu batzuetan behar luketen bezain zehatz eta zorrotzak. Hori kontuan hartuta, hobeto ulertuko ditugu atal honen hasieran haurrek Lego piezez egindako deskribapen bitxiak. Blokeekin jolasean zebiltzan haurrak hizketan ari ziren, Legoak parean zituztela. Ez balira gai izan besteek hizpide zituzten piezak aurrez aurre ikusteko, edo jostailua deskribatu behar baliote inoiz Legoekin jolastu gabeko norbaiti, bestelako deskribapenak egingo lituzkete.
Ohikoan, halere, baliabideen deskribapenek ez dute testuingurua modu horretan partekatzeko aukerarik, eta erabiltzaile-kategorien arabera diseinatu behar dira, ezen ez erabiltzaile banakoen arabera: liburu bila diharduten liburutegiko erabiltzaileak, zatien eta produktuen katalogoak erabiltzen dituzten langileak eta bezeroak, esperimentu eta simulazioetako datu-sortak aztertzen dituzten zientzialariak. Egoera horietako bakoitzean, baliabideen deskribapenek ulergarriak izan behar dute haiek sortu ez zituzten pertsonentzat, beraz, deskribapeneko hiztegia xede jakin horrekin diseinatu behar da, era sistematikoan, ziurtatze aldera bertako terminoak ez direla anbiguoak eta nahikoa direla interpretazio fidagarriak bermatzeko, testuingurua edozein dela ere. Deskribapenerako hiztegi bat diseinatzeko, zeinak era askotako erabiltzaileak eta haien era askotako xedeak ase baititzake, sakonki ezagutu behar da eremua eta esperientzia izan behar da erabiltzaileekin, eta zaila da pertsona bakar bat halako gaitasunen jabe izatea. Horregatik, normalean hainbat pertsona jarduten dira elkarlanean premiazko deskribapen-hiztegia garatzeko. Horren emaitzari hiztegi instituzional deitzen diogu, hiztegi indibidual eta kulturaletatik bereizteko. (Ezberdintasun hori xeheago aztertuko dugu 7. atalean: Kategorizazioa: Baliabide-klaseak eta -motak).
Geratu eta pentsatu: Deskribapenak eta abilezia
Mundu guztiak daki zer edo zer zuhaitzez, baina batzuek gehiago dakite beste batzuek baino, eta beren esperientziak eta ikuspegiak eragina du zuhaitzak deskribatzeko duten eran. Nolako ezaugarriak eta deskribapenak erabiliko dituzte unibertsitateko ikasleek? Botanika-ikertzaileek? Paisaia-diseinatzaileek? Parke bateko lorazainek? Oihan tropikalean bizi diren indigenek?
Makinek erabil ditzaten diseinatzen dira baliabide-deskribapen batzuk; halako kasuetan, itxura batean behintzat, garrantzia gutxiago izango dute erabiltzaileen lehentasunek edo erabilera komunak aintzat hartzen dituzten diseinu-printzipioek. Dena den, baliabideak algoritmo bidez deskribatzen eta antolatzen badira ere, jendeak azalpenak eman behar dituenean algoritmoek sortutako sailkapen eta aurreikuspenez, komenigarriagoak izango dira erraz ulertzen eta komunikatzen dira baliabide-deskribapenak, estatistika aldetik optimoak direnak baino. Gainera, estandarizazioaren eta integrazioaren printzipioak garrantzitsuagoak bilakatzen dira makinen arteko komunikazioan, hauek ahalbidetzeko: prozesamendu eraginkorra, datuen eta softwarearen berrerabilera eta antolaketa sistemen arteko inter-operazionaltasun handiagoa.
5.3.4.3 Hiztegi kontrolatuak eta edukiari buruzko arauak
4.4.3.2 atalean zehaztu moduan, hiztegi kontrolatua esaten zaio deskribapen-terminoen sorta finko edo itxi bati, eremu bati dagokiona eta definizio zehatzak erabiltzen dituena, normalean eremu horretako jendeak erabiliko lukeen hiztegiaren ordez baliatzen dena. Adibidez, gaitz eta sintomak deskribatzeko erabili ohi diren termino ezagunen ordez, ikertzaile medikuek eta erietxe unibertsitarioek Izenburu Tematiko Medikuak erabil ditzakete, Medikuntzaren Liburutegi Nazionaleko hiztegi kontrolatua.
Hiztegi kontrolatuetan bilakaera bat izan dela ikus dezakegu: glosarioa, hasteko, baimendutako terminoen sorta bat da; thesaurusa, berriz, hierarkia baten arabera antolatutako terminoen multzo bat da, eta ohar bidez adierazten du zer termino lehenesten diren, beste termino batzuk baino zabalagoak edo estuagoak direlako; ontologia batek terminoen arteko harreman kontzeptualak adierazten ditu hizkuntza formal eta logikan oinarrituriko batean, ordenagailuek prozesatzeko eran. Gehiago hitz egingo dugu ontologiei buruz 6. atalean.
Eduki-arauak hiztegi kontrolatuen antzekoak dira, deskribapenetan erabil daitezkeen balio posibleak mugatzen dituztelako. Balioen sorta finko bat zehaztu ordez, eduki-arauek, normalean, deskribapenak mugatzen dituzte, datu-mota jakin batekoak izan daitezen eskatuz (datu-mota osoak, boolearrak, date motakoak, etab.). Balio posibleak adierazpen logikoen bidez mugatzen dira (adibidez, balio batek 0 eta 99 bitartekoa izan behar du), edo adierazpen erregularren bitartez (adibidez, 5 luzerako soka bat izan behar du eta zenbaki batekin hasi behar du). Jendeak online formularioak edo bestelako aplikazioak erabili behar dituenean, gisa horretako eduki-arauak baliatzen dira deskribapen egokiak ziurtatzeko.
5.3.4.4 Hiztegiaren kontrola, dimentsionaltasunaren murrizketa gisa
Hiztegi kontrolatua, kasu gehienetan, hiztegi natural edo ez-kontrolatuaren azpi-sorta bat izaten da; batzuetan, ordea, asmatutako terminoen sorta berri bat da. Horrek bitxia eman dezake, harik eta kontuan hartzen dugun arte hiztegi kontrolatuaren helburua zein den: baliabide bati eslei dakizkiokeen termino deskriptiboen kopurua murriztea. Horrela esanda, dimentsionaltasunaren murrizketari lotutako arazo bat dela ikusten dugu: espazio oso dimentsional bat eraldatu behar da, espazio ez hain dimentsional bat izan dadin. Hainbat dimentsiotako deskribapen bateko osagai-kopurua murrizteko, hainbat teknika estatistiko erabil daitezke, hala nola «ezaugarrien erauzketa», «printzipioaren osagaien analisia», «dekonposizio ortogonala», «analisi semantiko sorra», «hainbat dimentsioko eskalatzea» eta «faktoreen analisia».
Baliteke teknika horiek zaila iruditzea, eta, baiki, konplexuak dira konputazioaren aldetik, baina, kontzeptu berbera dago denen muinean: baliabide bat deskribatzen duten ezaugarri edo tasunek harreman handia dutela elkarrekiko. Adibidez, dokumentu batean «auto» hitza agertzen baldin bada, probableagoa da dokumentu horretan bertan «gidari» eta «trafiko» hitzak agertzea, «auto» agertzen ez den dokumentu batean baino. Antzeko harremanak existitzen dira irudiak deskribatzeko baliatzen diren ezaugarri bisualen artean eta musika deskribatzeko ezaugarri akustikoen artean. Dimentsionaltasuna murrizteko teknikek baliabide-deskribapenen arteko harremanak aztertzen dituzte, hartara deskribapenen sorta zabal bat eraldatzeko eta elkarren artean harremanik ez duten deskribapenen multzo txikiago bat sortzeko. Zentzu batean, Nahikotasun eta premiaren printzipioa gauzatzen da modu horretan (hemen aipatu dugu: 5.3.4.1 atala, Deskribapen onaren printzipioak), ezabatu egiten dituelako baliabideak ezberdintzeko garaian ekarpenik egiten ez duten dimentsioak edo ezaugarriak.
Hona hemen adibide guztiz sinplifikatu bat, ideia ulertze aldera. Demagun badugula baliabideen bilduma bat: baliabide bat «handi» gisa deskribatzen den aldiro, orobat esaten da «gorria» dela; baliabide «txiki» oro, aldiz, «berdea» da. Kolorearen eta tamainaren arteko harreman perfektu horrek esan nahi du nahikoa dela bi ezaugarri horietako edozein aipatzea gauza «handi gorria»k eta «txiki berdea»k bereizteko, eta ez dugu behar algoritmo adimentsurik horretarako. Aitzitik, milaka ezaugarri baldin baditugu eta harremanak partzialak badira, hurbilketa estatistiko sofistikatuak behar izango ditugu deskribapen-ezaugarri eta -terminoen sorta optimoa aukeratzeko; teknika horietako batzuetan, «sor» edo «sintetiko» esaten zaie mantentzen diren dimentsioei, estatistika aldetik optimoak direlako baina ez dituztelako zuzenean islatzen baliabidearen ezaugarriak.
5.3.5 Deskribapenaren forma diseinatzea
Baliabideak deskribatzeko prozesuaren urrats honetara iristerako, erabaki inportante ugari hartu ditugu honako kontu hauen harira: zer baliabide deskribatu, zer xedetarako, eta zer ezaugarri eta termino erabili deskribapenetan. Urratsak ahalik eta gehien deskribatu ditugu maila kontzeptual batean, eta gerorako utzi dugu inplementazioari buruzko eztabaida (notazioa, sintaxia eta ea baliabide-deskribapenak modu bereizian edo multzotan erabiliko diren). Diseinua eta inplementazioa banatzea baliabideen deskribapenaren prozesuaren idealizazio bat da, baina, hala egiten badugu, errazagoa da baliabideen deskribapenari eta antolaketa-sistemari buruz ikastea eta pentsatzea. Inplementazioari buruzko auziak 9. atalean landuko ditugu (Baliabideen deskribapenen formak).
Batzuetan, premiazkoa da halako gaiei heltzea: teknologiaren ondarea, negozio-harremanak (jada badirenak zein sor daitezkeenak), araudiak, estandarren osaketa, gauzapenerako baldintzak eta bestelako faktore batzuk, zeinak ondorioak baitituzte baliabideen deskribapenak inplementatzeko, biltzeko eta kudeatzeko moduetan. Ikuspegi pragmatikoago horri helduko diogu 11. atalean, (Antolaketa-sistemaren mapa), baina, ordura arte, diseinuari lotutako auzietan zentratuko gara eta geroko utziko ditugu inplementazio-hautuak.
5.3.6 Baliabideen deskribapenak sortzea
Hainbatek sor ditzakete baliabideen deskribapenak: profesionalek, baliabideen autore edo sortzaileek, erabiltzaileek edo baliabide konputazional edo automatikoek.
Profesionalek, autore edo erabiltzaileek zein baliabide konputazionalek sortuak izan, baliabideen deskribapenek badituzte beren alde onak eta mugak; horren ondorioz, konpentsazioak sortzen dira. Konponbide natural bat litzateke bakoitzak dituen alderdi desiragarriak uztartzea, hurbilketa hibridoak sortuz. Adibidez, baliabide-eremu berri baterako hiztegia sor daiteke xede-erabiltzaileen etiketen bidez, eta, gero, profesionalek findu dezatela; sailkatzaile hasiberriek, bestalde, deskribapenak sor ditzakete, termino posibleak iradokitzen dituzten softwareen laguntzaz; azkenik, deskribapenak sortzen dituen software bat hobetu daiteke gizakiek sortutako deskribapenen bidez. Azken hori Ikasketa ikuskatuaren modu bat litzateke (ikus 7.5.3.3).
Sarritan, jada existitzen diren baliabideen deskribapenak eraldatu edo hobetu daitezke antolaketa-sistema batean sortzen diren helburuak betetzeko; batzuetan, prozesu horiek modu automatikoan egin daitezke. Halako egoeren azterketa geroko utziko ditugu; 10. atalean helduko diegu –Elkarreraginak baliabideekin–. Jarraian, ordea, baliabideen deskribapen berriak hutsetik sortzeari erreparatuko diogu.
5.3.6.1 Profesionalek sortutako baliabide-deskribapenak
Interneti esker, ia edozeinek du aukera bere baliabideak sortu, argitaratu eta deskribatzeko zein bestek sortu eta argitaratutakoak deskribatzeko; horren aurretik, baina, profesionalek deskribatzen zituzten baliabideak oro har, eremu instituzionaletan. Indize-sortzaile eta katalogo-egile profesionalek hainbat gauza ikasten dituzte –kontzeptuak, hiztegi kontrolatu deskribatzaileak eta estandar garrantzitsuak– baliabide bibliografikoak eta musikalak deskribatu aurretik. Informazio-sistemetan, antzeko prestakuntza jasotzen dute datuen profesionalek, prozesuen analistek, idazle teknikoek eta gisakoek, ondoren deskribapen zorrotz-zorrotzak egiteko. Era horretako baliabide-deskribapenei deskribapen instituzionalak deitzen diegu, azpimarratu nahi dugulako alde handia dagoela estandar batzuen arabera sortzen diren deskribapenen eta ad hoc eta modu informalean sortzen direnen artean, batez ere azken horiek prestakuntzarik gabeko banakoek sortuak direnean.
5.3.6.2 Autore edo sortzaileen baliabide-deskribapenak
Uste izatekoa da baliabide baten autore edo sortzaileak ondo ulertuko dituela baliabide hori erabiltzeko arrazoiak eta horren xedeak. Eta uste izatekoa da, halaber, autore gehienek nahi dutela irakur ditzaten, beraz beren baliabideak deskribatzeko orduan, helburu dituzten erabiltzaileentzat erakargarriak eta erabilgarriak izan daitezen saiatuko direla. Dena den, halako deskribapenetan, ziur aski, ez da erabiliko katalogo-egile profesionalen moduko hiztegi kontrolaturik eta estandarrik.
5.3.6.3 Erabiltzaileek sortutako baliabide-deskribapenak
Sarean, gaur egun, baliabide-kopuru izugarria dago: horietako gehienak informazio-baliabide primarioak dira, webetako eduki gisa argitaratzen direnak; beste asko, aldiz, «munduan» dauden baliabide fisikoen ordezkoak dira, eta, halakoak erabiltzaileek deskribatu ohi dituzte, ezen ez profesionalek edo baliabideen autoreek. Erabiltzaile «orokor» horiek etiketak edo puntuazioak gehitzen dizkiotenean online baliabideei, gehienetan, beren mesedetan sortzen dituzte deskribapen horiek, eta ziur aski ez dute erabiliko deskribatzaile estandar edo kontrolaturik halakoak egitean. Ondorioz, aldakortasun handia izango da, eta horrek arazoak sor ditzake baldin eta deskribapena sortzeko etiketa-egileak bere iritzia eman behar badu. Musika-artxibo baten luzerari dagokionean, jende gehiena bat etor daiteke, baina zer musika-generokoa den zehazteko orduan, baliteke desadostasunak sortzea. Zorionez, webaren erabiltzaile gehienek modu inplizituan onartzen dute ezen «2.0» eta «sortzaileek sortutako edukia»ren aplikazio horien balio potentziala handiagoa izango dela baldin eta bazterrean uzten badira deskribapen egozentrikoak. Gainera, lagin handien estatistikek, ezinbestean, nolabaiteko adostasuna ekartzen dute aplikazio ezagunenetako deskribapenetan, izan ere, maiztasunaren banaketan, deskribapen konbentzionalak gailendu egiten baitzaizkie deskribapen idiosinkratikoei.
Metazaborra
Cory Doctorow-ek saiakera bat argitaratu zuen 2001ean, izenburu probokatzaile batekin: «Metacrap: Putting the torch to seven straw-men of the meta-utopia»; saiakera hori asko aipatzen da, eta autoreak zioen ezen gizakien sortutako metadatu asko kaskarra direla, honegatik guztiagatik: «jendeak gezurra esaten du, jendea alperra da, jendea ergela da; ezinezko misioa: ezagutu zure burua; eskemak ez dira neutralak, neurketa-moduak eragina du emaitzan, (eta) gauzak deskribatzeko modu bat baino gehiago dago».
Ez dugu iradoki nahi deskribapen profesionalak beti direnik kalitate eta erabilgarritasun handikoak, eta sozialki sortuak, aldiz, eskasak eta alferrekoak. Ostera, ulertu beharra dago zer muga eta abantaila dituzten modu bakoitzean sortutako deskribapenek. Etiketek beheratu egiten duten deskribapenak sartzeko hesia, hala, errazagoa bihurtzen da antolatzea eta sortutako deskribapenek ikuspegien sorta bat islatzen dute. Hala ere, baliabide bati etiketa asko esleitzen zaizkionean, estaldura handitzen da, eta doitasuna txikitzen (Ikus 5.3.6.3 Erabiltzaileek sortutako baliabide-deskribapenak)
5.3.6.4 Baliabideen deskribapen automatikoak eta konputazionalak
Irudi baten EXIF artxiboak –kamera digitalek sortzen dituzte halakoak– kamerarekin eta ezarpenekin lotutako ezaugarriak erregistratzen ditu, baita argazkia hartu den testuinguruari dagozkion baldintza batzuk ere (adibide baterako, ikus 5.6 marrazkia Artelan baten deskribapenen alderaketa). Ia ezinezkoa izango litzateke halako deskribapen xeherik sortzea eskuz. Nolanahi ere, bada desabantailarik: deskribapen automatikoak ez du atzitzen irudiaren esanahia; irudi baten deskribapen automatikoak denbora eta lekua atzitzen ditu, ez ordea eztei-bidaian egindako argazki bat denik. Hutsune semantikoa deitzen zaio deskribapen automatikoen eta giza deskribapenen arteko aldeari (ikus 4.4.2.5).
Bere egoerari edo inguruari buruz datuak biltzeko adinako adimena duen baliabide orok modu automatikoan sortzen ditu baliabide-deskribapenak (ikus 4.2.3.2). Gaitasun konputazionalak dituzten baliabideak gai dira sentsoreen datu gordinak prozesatzeko: modu horretan, gertakari garrantzitsuak identifikatu ditzakete, eta deskribapen interpretagarriagoak eratu.
Giza deskribatzaileek sortutako baliabide-deskribapenen antzeko deskribapenak sortzen dituzte hurbilketa konputazional batzuek. Bezeroek produktuei buruz emandako iruzkinetan, testuen meatzaritzako eta laburpenerako sistemak balia daitezke, eta, horien bidez, milaka iruzkin laburtu daitezke ezaugarri garrantzitsuenen zerrenda batean. Amazon.com atariak bere bilduman dituen liburu guztiak alderatzen ditu, antzeko esaldiak identifikatuz –estatistika inprobablea, bai–; horren arabera, liburu jakinen edukiari eta bereizgarritasunei buruzko iruzkinak eskaintzen dizkie bere bezeroei.
Deskribapen konputazionalek edozein aldagai erabil dezakete, hautemangarria zein sorra (ikus taula gehigarria; Ezaugarri sorren sorrera eta Netflix-eko gomendioak), salbu eta legez debekatuta daudenak, diskriminazioa eragin dezaketelakoan: arraza, erlijioa, jatorri nazionala eta egoera zibila. Praktikan, ordea, debeku hori aise saihestu daiteke, erraza baita ezaugarri horiek aurreikustea beste ezaugarri batzuk kontuan hartuta. Adibidez, erraz samarra izan daiteke arraza asmatzea bizitokiaren eta abizenaren arabera.
Informazioa eskuratzeko sistema guztiek, jakina, bi gauza hauek konparatzen dituzte: erabiltzaileen premien deskribapenak eta horiek ase ditzaketen baliabideen deskribapenak. Hala ere, sistema bakoitzak ezaugarri batzuk azpimarratzen ditu beste batzuen gainetik, eta ezaugarri horiek aldatu egiten dira sistema batetik bestera: liburutegi digitaletako dokumentuetan, hitzen maiztasuna eta banaketa lehenesten dira; web orrietan, nabigazioko joerak; musikan, ezaugarri akustikoak, eta abar. Ezaugarrien deskribapenen arabera zehazten dira konparaketa-algoritmoak eta orobat zehazten da nola ezartzen den deskribapen garrantzia edo antzekotasuna. Horri buruzko xehetasun askoz gehiago emango ditugu hemen: 5.4 atalean –Baliabide ez-testualak deskribatzea–eta 10. atalean.
5.3.7 Baliabideen deskribapenak ebaluatzea
Ebaluazioa modu inplizituan ageri da antolaketa sistemetako jarduera askotan (3. atalean deskribatu ditugu Antolaketa sistemetako jarduerak), eta esplizitua da, aldiz, baliabideen bilduma bat gordetzen dugunean denboran. Sekzio honetan, arazo estuago bati erreparatuko diogu: baliabideen deskribapenak ebaluatzea.
Zerbait ebaluatzen dugunean, haren kalitatea zehazten dugu, irizpide edo dimentsio batzuk aintzat hartuta. Irizpide-sorta ugari proposatu izan dira: baliabide digitalean biltegiei dagokienez, zehaztasuna, osotasuna eta batasuna. Irizpide ohikoak dira, halaber, puntualtasuna, inter-operazionaltasuna eta erabilgarritasuna. Argi samar dago irizpide horiek elkarren kontrakoak izan daitezkeela: esate baterako, zehaztasuna eta osotasuna lortu nahi badira, baliteke puntualtasuna kaltetzea; ordea, batasuna indartzen bada, kanpoan utz daitezke erabilgarritasuna hauspotuko luketen aldaketak eta pertsonalizazioak.
Geratu eta pentsatu: Kalitatea definitzea
Zer ezaugarri edo irizpide erabiliko zenuke auto baten kalitatea zehazteko? Eta janariarena? Eta jantziena? Eta bizitokiarena? Irizpide horien artean, zeintzuk dagozkio eremu zehatz bati, eta zeintzuk dira orokorragoak, baliabide-mota askori ezartzeko modukoak?
Atal honetan proposatu dugun hainbat urratsetako prozesuari erreparatzen badiogu, urrats bakoitzean sortu edo galdu den kalitateak osatuko du prozesu osoaren kalitatea. Ikuspegia xeheegia edo abstraktuegia baldin bada, xedeak anbizio handikoegiak edo lausoegiak badira, deskribapeneko hiztegia zailegia bada edo jendeari ez bazaio aski denbora ematen deskribapen onak sortzeko, horrek denak kalitateari lotutako arazoak sor ditzake, baina erabaki horien artean, bat bera ere ez da ikusgarria prozesuaren amaieran, hots, erabiltzaileak elkarreraginean jarduten direnean baliabide-deskribapenekin.
5.3.7.1 Baliabide-deskribapenen sorrera ebaluatzea
Profesionalek baliabide-deskribapenak sortzen dituztenean modu zentralizatuan –eta, hainbat urtez, horixe izan da ohikoena liburutegietako baliabide askoren kasuan–, kalitateari erreparatzen zaio era naturalean, ziurtatze aldera hiztegi kontrolatuak eta estandarrak erabili direla. Hala ere, baliabide-deskribapenen premia orokorra da kalitatea, baita eremu bibliografiko tradizionaletik kanpoko arloetan ere, eta, testuinguru horietan, kalitateari lotutako beste faktore batzuk azaleratzen dira.
Sektore pribatuko enpresentzat ezinbestekoak dira baliabide-deskribapenak negozioari eusteko eta elkarreraginean eraginkortasunez jarduteko hornitzaileekin, kideekin eta bezeroekin. Sektore publikoarekin alderatuz gero, garrantzia askoz handiagoa ematen zaio baliabide-deskribapenen ekonomiari eta estrategiari. Zein da baliabide-deskribapenen balioa? Zeinek ordainduko du horiek sortzearen kostua? Elkarren lehian dauden industria-estandarren artean, zeini jarraituko zaio? Erabaki horietako batzuk ez dira hautu libreak, izan ere, negoziotan jarduten bazara bazkide ekonomiko nagusi batekin, zeina gobernu-entitate bat izaten baita maiz, muga batzuk ezartzen baitira baldintza gisa.
Esate baterako, Wal-Mart enpresaren gisako batek, botere handia duenez merkatuan, bere baldintzak eta estandarrak ezar diezazkieke hornitzaileei: Wal-Martekin kontratu bat egiteak epe luzeko onurak dakartzanez, normalean merezi du hastapeneko moldaketa egitea. Era berean, gobernuek sarritan eskatzen diete beren hornitzaileei estandar irekiak osatzeko, ez dadin monopoliorik sortu patentatutako teknologietan.
Bai sektore publikoan bai pribatuan, gero eta gehiago erabiltzen dira teknika konputazionalak baliabide-deskribapenak sortzeko, deskribatu beharreko baliabide-kopurua handiegia delako eta ezinezkoa delako deskribapen profesionalak erabiltzea. Lan eskerga egiten da, jadanik, testuetako datuen meatzaritzan, web orrien sailkapenean, aberaste semantikoan eta antzeko ikerketa-eremuetan, eta horrek nabarmen murriztu du baliabide-deskribapen erabilgarriak ekoizteko kostua. Museo batzuek eraldatu egin dituzte beren bildumak kudeatzeko barne-sistemetako deskribapen profesionalak; horrela, ikuspegi berriak ezarri dituzte, zeinek automatikoki eratzen baitituzte erabiltzaileei bideratutako baliabide-deskribapenak eta gauzak bilatzeko eta nabigatzeko interfaze berriak erabiltzaileentzat. Googlek milioika liburu digitalizatzeko egitasmo handinahia abiatu du, eta askok kritikatu dute bertako baliabide-deskribapenen kalitatea –algoritmo bidez erauzten dira–; nolanahi ere, espero izatekoa da informatikariek ondo baino hobeto baliatuko dutela Googlen liburu-corpusa, beren teknikak saiatu eta hobetzeko.
5.3.7.2 Baliabide-deskribapenen erabilera ebaluatzea
Baliabide-deskribapenen sorreran edo hautapenean baliatutako kalitate-irizpideak gorabehera –edo, horiez gainera–, goiz edo berandu, baliabide-deskribapenak beren xede-erabiltzaileekin topatzen dira. Kalitate-irizpide esanguratsuena, une horretan, hauxe da: ea baliabide-deskribapenek beren xedeak asetzen dituzten modu erabilgarri batean. Hainbat zentzutan, erantzuna ezetz izaten da, etsigarriki.
Baliabide bati buruz zer esan daitekeen zedarritzen du deskribapenerako hiztegiaren diseinuak, hortaz, onartu beharra dago kontrakoa ere zedarritzen duela –zer ezin den esan baliabide bati buruz–, eta nahigabeko ondorio negatiboak ekartzen dizkiela erabiltzaileei. Sendagile batek pazienteak kudeatzeko darabilen sisteman, baliabideak deskribatzeko eskema bat inplementatzen da, zeinetan paziente baten hitzorduari buruzko datu erregistragarri batzuk biltzen baitira: hitzorduaren data, egin beharreko probak, diagnostikoa eta espezialista batengana bideratzea. Eskema horrek, eta horri lotutako lan-prozesuak, mugak inposatzen ditu, eta muga horiek eragina dute bi kontu hauetan: profesional medikuek erregistratu dezaketen informazioan eta deskribapen horiek egiteko erabil dezaketen espazioan. Are gehiago, paperezko erregistroek egituratu gabeko espazio bat eskain dezakete, sendagileek hor azal ditzaten diagnostikoa edo erabakia hartzeko izan dituzten arrazoiak, eremu jakin batera egokitu gabe; eskemetan, ordea, halako espazioak desagertu egin daitezke, funtsezkoak izan arren.
5.3.7.3 Ebaluazio iteratiboaren garrantzia
Kalitate-helburuen artean ezinbestean sortzen diren arazoek adierazten dute adostasunak lortu beharko direla kalitate-irizpideen harira. Gainera, antolaketa-sistema bateko eskala handitzeak eta baliabideak deskribatzeko teknika konputazionalen hobekuntza azkarrak erakusten dute ezen adostasunaren izaera aldatu egingo dela denborarekin. Ondorioz, ez da aski izango baliabide-deskribapenen ebaluazio bat egitea une jakin batean.
Horren eraginez, erabilera-erregistroak, nabigazio-historiala eta transakzioei dagozkion datuak baliabide-deskribapen izugarri garrantzitsuak dira, zeren, horien bidez, premia handieneko eremuetan zentratu baitaitezke kalitatea hobetzeko ahaleginak. Horretaz aparte, era askotako baliabideak eta erabiltzaile-komunitateak dituzten antolaketa-sistemetan, informazio horrek modua ematen du baliabide-deskribapenen izaera eta hedadura moldatzeko, hartara oreka egokia egon dadin bi ikuspegi hauen artean: «aberatsa eta orokorra» eta «sinplea eta eraginkorra». Baliabide-motaren eta erabiltzaile-komunitatearen arteko konbinazio bakoitzak bere konponbidea topa dezake.
Kalitatearen ezaugarria prozesu osoari dagokiola dioen ideia, berez, «kalitate mugimendua»ren kontzeptuan eta prozesu industrialetako kontrol-prozesu estatistikoan gauzatzen da; hala ere, ondo egokitzen zaio baliabideen deskribapenari ere. Hau da gakoa: kalitatea ezin dela neurtu soilik azken produktua aztertuz. Aitzitik, kalitatea lortzen da prozesua kontrolatuz: produktuak sortzeko behar diren prozesu guztietako aldakortasuna neurtuz eta hori kenduz. Diseinu-prozesua eta bertan hartutako erabakiak berrikusi ahala, beharrezkoa izango da feedback esplizitua jasotzea erabiltzaileen aldetik eta feedback inplizitua jasotzea, berriz, erabiltzaileek baliabideekin jarduteko dituzten beharren erregistroetatik.
