8. Sailkapena: Kategoriei baliabideak esleitzea

Robert J. Glushko, Jess Hemerly, Vivien Petras, Michael Manoochehri ,Longhao Wang ,Jordan Shedlock, Daniel Griffin

8.4 Alderdien araberako sailkapena

Hainbat aldiz esan dugun moduan, enumerazio-sailkapen hertsiek mugatu egiten dute baliabideak kategoriei esleitzeko manera eta sailkapenak denboran izan dezakeen garapena. Alderdien araberako sailkapenek, berriz, alternatiba bat eskaintzen dute, muga horietako batzuk gainditze aldera. Alderdien araberako sailkapen-sistemetan, hainbat alderdiri dagozkion ezaugarrien bidez deskribatzen dira baliabideak; nolanahi ere, baliabide bila dabilen pertsona batek ez ditu aintzat hartu behar propietate guztiak (eta, ondorioz, alderdi guztiak ere ez), eta ez die erreparatu behar ordena finko batean: enumerazio-sailkapen hierarkikoetan, ordea, halaxe egin behar da.

Alderdien araberako sailkapenak bereziki erabilgarriak dira erabiltzaileen web interfazeak antolatzeko online erosketetan edo museo-bilduma handi eta heterogeneoen bilaketetan. Alderdiei edozein ordenatan erreparatzeko eta axola ez zaizkizunak bazterrean uzteko prozesuak berekin dakar antolaketa-egitura dinamiko bat, zeinaren bidez hautaketa malgua eta efizientea baita aldi berean. Sistemaren abantailak zein diren erakusteko, 7.3.3 atalean aipatu dugun arlo batera joko dugu.

Saltoki handi batean era askotako alkandorak eskaintzen badira –hainbat estilo, kolore, neurri, marka eta preziokoak–, baliteke bezeroek bilaketak egin nahi izatea alderdi horiei dagozkien ezaugarrien arabera, edozein ordenatan. Edonola ere, denda fisiko batean ezin da halakorik egin, alkandora nahitaez antolatu behar baitira dendako kokapen fisiko zehatzetan: alkandora dotoreak alde batean, lanekoak beste batean, eta abar.

Demagun denda honetako lau alkandora-mota daudela: dotoreak, lanekoak, parrandara joatekoak eta kiroletako lastikoak. Alkandora dotoreak, koloreari dagokionez, zuriak edo urdinak izan daitezke; lanekoak, berriz, zuriak edo marroiak, eta parrandara joatekoak zein kiroletakoak, azkenik, zuriak, urdinak, marroiak edo gorriak. Alkandora zuri dotoreak bi neurritakoak izan daitezke: handiak edo ertainak.

Eman dezagun alkandora zuri dotore bat nahi duzula, handia. Bi modu baliokidetan pentsa dezakegu alkandora horretaz: «alkandora zuri dotore handiak» kategoriako kide bat izan daiteke, edo, bestela, «dotorea», «zuria» eta «handia» balioak dituen alkandora bat, estiloa, kolorea eta neurria alderdiei dagokienez, hurrenez hurren. Denda fisikoan, alkandorak modu jakin batean antolatzen dira; hori dela-eta, kategorien egitura hierarkiko bati jarraitu behar diogu gure bilaketan. Lehenik, alkandora dotoreen sailera joan behar dugu, zuriak aurkitu, eta, azkenik, handi bat bilatu. Prozesu hori bat dator 8.4 marrazkian erakusten dugun hierarkiarekin (Enumerazio-sailkapena; lehenik estiloaren alderdia eta segidan kolorearen alderdia).

8.4 marrazkia: Enumerazio-sailkapena; lehenik estiloaren alderdia eta segidan kolorearen alderdia

Enumerazio-sailkapena; lehenik estiloaren alderdia eta segidan kolorearen alderdia

Enumerazio-sailkapenari dagozkion sistemetan, alderdien ordenak zehazten du zein izango den sailkapenaren hierarkia. Adibidez, denda batean, alkandora sailkatzeko garaian, lehenik estiloaren alderdia erabiliko dute, ondoren kolorearena, eta, azkenik, neurriaren alderdia. Antolaketa horren ondorioz, alkandora dotoreen bi mordo sortuko dira, urdina bata eta zuria bestea, eta mordoetako bakoitzean neurri handiko eta ertaineko piezak egongo dira.

Ez da oso probablea, baina gerta liteke alkandorak kolorearen arabera antolatzea denda batean. Horrenbestez, «alkandora zuri dotore handi» baten bila ari garelarik, koloreari erreparatzen badiogu lehenik, eta kontuan hartuta lau koloretako alkandorak daudela, lau kolore-kategoriaren artean aukeratu behar dugu. Alkandora zuriak hautatu ostean, ez dago laneko alkandorei dagokien kategoriarik, ez baitago laneko alkandora zuririk. Beraz, alkandora dotoreak aukeratuko ditugu, eta, azkenik, handietako bat (Ikus 8.5 marrazkia: Enumerazio-sailkapena; lehenik kolorearen alderdia eta segidan estiloaren alderdia).

8.5 marrazkia: Enumerazio-sailkapena; lehenik kolorearen alderdia eta segidan estiloaren alderdia

EEnumerazio-sailkapena; lehenik kolorearen alderdia eta segidan estiloaren alderdia

Alkandora-alderdi berdinak beste modu batean ordenatuz gero, sailkapen-hierarkia aldatuko da. Lehenik eta behin, kolorearen alderdiari erreparatzen badiogu, ondoren estiloari eta azkenik neurriari, zera edukiko genuke: alkandora zurien bi multzo, batzuk dotoreak eta besteak kiroletako elastikoak, eta multzo horietako bakoitzean neurri handiko eta ertaineko alkandorak.

Saltokiko adibideak erakusten duenez, antolaketa fisikoetan, propietate-alderdi batek gidatzen du baliabideen kokapena; gainerako alderdi guztiak, berriz, antolaketa-ezaugarri nagusiaren mendekoak dira. Enumerazio-sailkapen hierarkikoetan, horrenbestez, antolaketa-alderdi nagusiak zehazten du zein izango den sarbide-modu nagusia. Alkandorak antolatzeko orduan, lehenik estiloa eta ondoren kolorea hartuko da aintzat, edo lehenik kolorea eta ondoren estiloa; ondorioz, bilaketa-estrategia zurrun bat gauzatzen da (estiloa lehenik edo kolorea lehenik).

Baliabideak egoki esleitzeko premiazkoak diren propietate guztien zerrenda egin dezakegu, baina kategoriak sortzeko garaian (alderdi ezberdinetako propietateen uztarketa), premiaren arabera egiten dugu, propietateen uztarketa jakin bat biltzen duten baliabideak antolatze aldera.

Alderdien araberako sailkapenaren malgutasunaren beste ezaugarri gehigarri bat da honakoa: posible da baliabide-deskribapen batean alderdi bat ez aipatzea, baldin eta ez bada beharrezkoa edo aproposa. Adibidez, parrandako alkandorak hainbat koloretakoak izaten dira sarritan, eta irudi exotikoak izaten dituzte; horregatik, zer koloretakoak diren zehaztea ez da erabilgarria. Era berean, kiroleko elastiko batzuk oso zabalak izan daitezke, eta, ondorioz, ez dago horien tamaina deskribatu beharrik; kolorea, ordea, garrantzitsua da, talde jakin bati lotuta egon ohi baita. 8.6 marrazkian (Alderdien araberako sailkapena) ikus dezakegu nola sailkatu daitezkeen bi baliabide-mota horiek Alkandoren alderdien araberako sailkapena erabiliz. 1. baliabidea parrandarako alkandora ertain bat da; 2. baliabidea, berriz, kiroletako elastiko bat, urdina, neurriari buruzko informaziorik gabea.

Gisa horretako sailkapen bat ikus dezakezue 8.6 marrazkian (Alderdien araberako sailkapena), zeinean ez baita aldez aurretik zehaztu behar zer modutan uztartuko eta ordenatuko diren alderdiak; zentzu horretan, ez da 8.4 (Enumerazio-sailkapena; lehenik estiloaren alderdia eta segidan kolorearen alderdia) eta 8.5 (Enumerazio-sailkapena; lehenik kolorearen alderdia eta segidan estiloaren alderdia) marrazkietako sailkapenak bezalakoa. Kontrara, demagun alkandora-denda batean zaudela non zeuk erabakitzen baituzu, erosketak egiten hasten zarenean, zer alderdi axola zaizkizun gehien («erakutsi parrandako alkandora ertain guztiak», edo «erakutsi kiroletako elastiko urdinak»); ez duzu zertan bat egin dendak aldez aurretik asmaturiko enumerazio-sailkapenarekin, edozein izanda ere. Antolaketa-sistema digitaletan, alderdien araberako sailkapenak sarbide oso malgua ahalbidetzen du, izan ere, alderdi desberdinak lehenesteak modu dinamikoan berrantolatu baitezake bildumaren aurkezpena.

8.6 marrazkia: Alderdien araberako sailkapena

Alderdien araberako sailkapena

Alderdien araberako sailkapen puru batean, baliabide bakoitzak ez ditu alderdi guzti-guztiak bildu behar, eta, alderdien ordenari dagokionez, ez zaio aurrez ezarritako ordena bati jarraitu behar.

8.4.1 Alderdien araberako sailkapenaren oinarriak

Bibliotekonomiako eta informazioaren zientziako testuetan, alderdien araberako sailkapenaren ideia S. R. Ranganathan-i zor zaiola esan ohi da: matematikari hindu bat zen, liburuzain gisa lan egiten zuena. Ranganathanek grina ia mistiko bat zeukan, unibertsoko gauza guztiak sailkapen- eta notazio-sistema bakar batean sailkatzeko, bere dharma zela uste baitzuen (alegia, bere «funtsezko betekizuna» edo «patua»). Dewey sistemak baditu bere mugak: lehenik itemaren funtsa identifikatu behar da, eta, ondoren, dena delako funtsaren arabera, item hori kategoria bati esleitu; Ranganathanek, ordea, sinesten zuen ezen baliabide bibliografiko guztiak alderdi-multzo abstraktuago baten inguruan antolatu zitezkeela.

1933. urtean, Ranganathanek proposatu zuen bost alderdi aplikatu behar zitzaizkiola jakintza guztiari:

Izaera
   Gauza-mota.

Materia
   Gauza osatzen duen materiala.

Energia
   Gauzaren ekintza edo jarduera.

Espazioa
   Gauza non gertatzen den.

Denbora
   Gauza noiz gertatzen den.

Sailkapen-sistema horri bi puntuen sailkapena deitzen zaio (edo PMEST), baliabide-identifikatzaileen notazioan bi puntu erabiltzen baitira alderdi bakoitzeko balioak banatzeko. Balio horien sorburua kategorien eta azpi-kategorien taulak dira; horregatik, zenbakiak oso trinkoak izaten dira. Bi puntuen sailkapena Indiako liburutegietan erabiltzen da batik bat.

Baiki, Ranganathanek inplementatu zuen alderdien araberako lehen sailkapena; baina liburuzainak ez diren pertsonek, orokorrean, alderdien araberako sailkapenaren ideia Nicolas de Condorcet matematikari eta filosofo frantsesari zor zaiola uste dute. Ranganathanen garaia baino 140 urte lehenago, Condorcetek bazuen kezka bat: «Naturaren gainean interpretazio jakin bat ezartzen duten sailkapen-sistemak… oztopo jasanezin bat zirela… aurrerakuntza zientifikoari zegokionez». Condorcetek, horrenbestez, sailkapen-eskema malgu bat proposatu zuen, «gaien kopuru handi bat antolatzeko sistema bakar batean, halako moduan non gaien arteko harremanak zuzen-zuzenean ulertuko baititugu, beren arteko konbinazioak berehala atzeman, eta konbinazio berriak aise sortu».

Alderdien araberako sailkapena arlo estuetan erabiltzen da batez ere, eta arlo bakoitzak baditu bere alderdi espezifikoak. Zentzuzkoa da, zeren, nahiz eta posible den baliabideak bereiztea sailkapen orokor baten arabera, notazio luzeak behar dira hori egiteko, eta askoz zailagoa da sailkapen orokor bati gauzak gehitzea, arlo jakin batentzat sorturiko sailkapenari gauza gehitzea baino. Alkandorak deskribatu nahi bagenitu, PMEST sailkapenaren alderdiak erabil genitzake ziur aski, baina naturalagoa ematen du estiloa, kolorea eta neurria aintzat hartzea.

8.4.2 Alderdien araberako sailkapena, deskribapenari dagokienean

Elaine Svenoniusen esanetan, alderdiak zera dira: «diziplina bat kategoria homogeneotan edo kohesio semantikoa duten kategoriatan banatu eta gero sortzen diren termino-multzoak». Alderdi horien arteko harremanek, halaber, hiztegi kontrolatuak eratzen dituzte (ikus 4.1.2 atala), antolatzen ari diren baliabideak gobernatzeko. Hiztegi kontrolatuen bitartez, deskribapen konplexuak baina egitura formalekoak sor ditzakegu; modu horretan, artean izendapen-terminorik ez duten gauzak deskribatu ahal ditugu.

Getty-ren Arte eta Arkitektura Thesaurusa (AAT) hiztegi kontrolatu sendo bat da, luze-zabal erabiltzen dena, eta bertan biltzen dira hainbat termino generiko, artefaktuak, objektuak, tokiak eta kontzeptuak deskribatzeko balio dutenak, «arteari, arkitekturari eta kultura materialari» dagokionean.

ATT thesaurusak alderdien araberako egitura hierarkiko bat du. AATren alderdiak «kontzeptualki antolatuta daude eskema batean, zeina kontzeptu abstraktuetatik abiatzen baita, artefaktu fisiko eta zehatzera iritsi arte»:

Loturiko Kontzeptuak

Kontzeptuak, teoria filosofikoa eta kritikoa, eta fenomenoak, hala nola «maitasuna» edo «nihilismoa».

Ezaugarri Fisikoak

Neurtu eta hauteman daitezkeen ezaugarri materialak, hala nola «garaiera» eta «malgutasuna».

Estiloak eta Garaiak

Garai artistiko eta arkitektonikoak, eta estilo jakin bateko taldeak, hala nola «Errenazimentua» eta «Dada».

Agenteak

Funtsean, nolabaiteko identifikazio bat sentitzen duten era askotako taldeak eta antolakundeak, zeinek ezaugarri fisikoak, adimena, ezaugarri sozioekonomikoak edo politikoak hartzen baitituzte aintzat: adibidez, «harginak» edo «sozialistak».

Jarduerak

Ekintzak, prozesuak eta gertaerak, hala nola «gorputz margolaritza» eta «marrazketa». Alderdi honetan bildutakoak ez dira «Objektuak» alderdikoak bezalakoxeak; baliteke beste alderdi horretan ere agertzea «gorputz margolaritza», baina lanari berari erreferentzia egingo dio, ezen ez sormen-prozesuari.

Materialak

Lana bera zer substantziarekin egiten den aztertzen du, hala nola «metala» edo «lixiba». «Materialak» eta «Ezaugarri fisikoak» ez dira gauza berdina: bigarrena abstraktuagoa da lehenengoa baino.

Objektuak

Hau da alderdirik handiena, eta lanak berak biltzen ditu, izan «hondarrezko gazteluak» zein «serigrafiak».

Alderdi bakoitzaren barruan, hierarkia-egitura zorrotz bat dago, termino orokorretik hasi eta kasu guztiz zehatzetara doana.

8.7 marrazkia: «Txarola», Arte eta Arkitektura Thesaurusean

«Txarola», Arte eta Arkitektura Thesaurusean

Arte eta Arkitektura Thesaurusak alderdien araberako hierarkia-egitura bat dauka.

8.7 marrazkiak erakusten du ezen kasu zehatz bat hainbat dimentsioren arabera deskribatu daitekeela, itema antolatzeko eta informazioa eskuratzeko hari buruz. Gainera, katalogatzaileek eta indexatzaileek hiztegi kontrolatu estandarrak erabiltzen dituztenez, erabiltzaileek errazago uler ditzakete, eta gauzen antolamendua moldatu, gauzak aurkitzeko helburuarekin.

8.4.3 Alderdien sailkapen posible bat

Lau alderdi-mota nagusi daude:

Enumerazio-alderdiak

Halako alderdien balioak elkarren baztertzaileak dira. Lehen aipatu dugun adibideari helduta, online alkandora-dendan, enumerazio-alderdi bat da «Estiloa», eta honako balio hauek dauzka: «dotorea», «lanekoa», «parrandarako» eta «kiroletako elastikoak».

Alderdi boolearrak

Bi balioren artean, bat hartzen dute: bai (egia) edo ez (gezurra), dimentsio edo propietateren bati dagokionez. Kirol-arropa saltzen duen webgunea batean, «Iragazgaitza» ezaugarria boolear alderdi bat izan liteke: arropa bat iragazgaitza izango da edo ez da iragazgaitza izango, ez dago beste aukerarik.

Alderdi hierarkikoak

Inklusio logikoaren bidez antolatzen dira baliabideak (ikus 6.3.1.1 atala). Williams-Sonoma dendaren webgunean, hauek dira alderdi nagusiak: «Sukaldeko tresnak», «Sukaldariaren erremintak» eta «Mahai-tresnak». Wine.com webgunean, berriz, «Lurraldea» deritzon alderdian honako balio hauek biltzen dira: «AEB», «Mundu zaharra» eta «Mundu berria»; horietako bakoitzak banaketa geografiko gehiago biltzen ditu. Ikus, halaber, alderdi taxonomikoak.

Espektro-alderdiak

Zenbaki-balioen sorta bat hartzen dute, minimo eta maximo zehatz batekin. Espektro-alderdi ohikoak dira prezioa eta data antolatzeko garaian. Sarritan, sorta horiek elkarren baztertzaile gisa diseinatzen dira. Hona hemen prezioari dagozkion alderdi-balioen balizko adibide batzuk: «0-49 $», «50-99 $» eta «100-149 $».

8.4.4 Alderdien araberako sailkapen-sistema bat diseinatzea

Alderdien araberako sailkapen bat diseinatu nahi bada, modu sistematikoan eta printzipio batzuei jarraituz jardun behar da. Hainbat zentzutan, halako sailkapenak diseinatzeko prozesua eta horri dagozkion auziak bat datoz baliabideak deskribatzeko prozesuarekin, eta 5.3 atalean –Baliabideak deskribatzeko prozesua aipatu ditugun gomendio asko erabilgarriak suertatuko zaizkigu hemen ere.

8.4.4.1 Alderdien araberako sailkapenaren diseinu-prozesua

Alderdien araberako sailkapen-sistema bat diseinatzeari dagokionez, bost urratseko prozesu bat proposatzen dugu:

  1. Zehaztu itzazu sailkapenaren xedeak (Ikus 5.3.2 atala: Xedeak zehaztea eta 8.2.1: Sailkapenek xederen bat dute beti), bai eta antolatu beharreko kontzeptu- edo baliabide-bilduma ere.
  2. Zehaztu alderdi bakoitzaren mota logikoa (ikus 8.4.3 atala: Alderdien sailkapen posible bat), eta balizko balioak. Zehaztu alderdi bakoitzeko balioen ordena, erabiltzaileei zentzuzkoa suertatzeko eran; ordena erabilgarriak honelakoak dira: alfabetikoak, kronologikoak, prozedurari dagozkionak, tamaina, ospetsuenetik ospe gutxien duenera, errazetik konplexura eta geografikoa edo topologikoa.
  3. Aztertu eta deskribatu ezazu baliabide-kasuen lagin esanguratsu bat, alderdi gisa erabil daitezkeen propietateak edo dimentsioak identifikatze aldera (Ikus 5.3.3 atala: Ezaugarriak identifikatzea).
  4. Azter ezazu zer harreman dagoen alderdien artean, eta, beharrezkoa bada, azpi-alderdiak sortu. Zehaztu nola uztartuko diren alderdiak, sailkapenak sortzeko.
  5. Probak egin, ea nola egokitzen diren kasu berriak sailkapenean, eta, berrikusi itzazu alderdiak, alderdien balioak eta alderdien gramatika, beharrezkoa den bezainbatean.

8.4.4.2 Diseinuaren printzipioak eta pragmatika

Hona hemen alderdiak eta alderdi-balioak hautatzeko zein diseinatzeko aholku zehatzago batzuk:

Ortogonaltasuna

Alderdiek dimentsio independenteak izan behar lukete, beraz, baliabide batek dimentsio guztietako balioak izan ditzake, eta, aldi berean, dimentsio bakoitzeko balio bakar bat. Sukaldaritza-tresnen online denda batean, alderdi bat «Produktua» izango da, eta, beste bat, berriz, «Marka». Item jakin bat «Eltze» gisa sailkatuko da «Produktua» alderdian, eta «Marka» alderdian, berriz, «Calphalon» gisa. Beste eltze batzuk beste marka batzuetakoak izango dira, eta Calphalon markako beste produktu batzuk ez dira eltzeak izango, Produktua eta Marka alderdi ortogonalak direlako.

Oreka semantikoa

Sailkapen-eremuaren baitan baliabideak elkarren artean bereizteko ezaugarri egokienak hautatu behar lirateke alderdi nagusi gisa. Balioek, era berean, helmen semantiko berdina eduki behar lukete, baliabideak azpi-kategorietan banatuta egon daitezen. «Sukaldeko tresnak» alderdiaren barruan, badaude zenbait azpi-alderdi, hala nola «eltzeak» eta «parrilarako azpilak»: bi horiek badute oreka semantikoa, sukalde-jardueraren arabera sailkatuta daudelako.

Estaldura

Posible izan behar luke xede-eremuaren baitako kasu guzti-guztiak sailkatzea alderdiko balioen bitartez.

Eskalagarritasuna

Kasuen sortari gehikuntzak egiten bazaizkio ere, alderdiaren balioek tokia egin behar diete. Esaterako, konponbide erraz bat da «Bestelakoak» balio bat gehitzea: horren bidez, alderdiak malgutasunez hartuko ditu kasu berriak; alabaina, ez da komeni kasu berri guztiei balio horixe esleitzea.

Objektibotasuna

Nahiz eta sailkapen orok daukan joera esplizitu edo inplizituren bat (ikus 8.2.3 atala: Sailkapenak partzialak dira), alderdiek eta alderdi-balioek ahalik zehatzenak izan behar lukete, ahalik anbiguotasun txikienarekin, kasuen sailkapen fidagarria ahalbidetzeko.

Normatibotasuna

Alderdien araberako sailkapen bat ahalik eta jende gehienak erabiltzeko modukoa izan dadin, alderdiei edo alderdi-balioei dagozkien terminoak ez lirateke idiosinkratikoak izan behar, ez eta metaforikoak ere, eta aise interpretatzeko modukoak izan behar lukete, aurretiazko jakintzarik izan ez arren.

8.6 atalean ikusiko dugun eran –Sailkapen konputazionala–, batzuetan ordenagailuek egiten dituzte sailkapenak, eta ez pertsonek. Ordenagailu-algoritmoak gai dira baliabide-ezaugarri eta -deskribapenak aztertzeko eta zera identifikatzeko: zer dimentsiotan diren desberdinak baliabideak eta zeintzuk diren deskribapen-termino ohikoenak; bi faktore horiek erabilgarriak dira alderdien araberako sailkapen-sistema bat diseinatzeko. Ondoren, baliabideak nor bere kategorian sailka daitezke, gizakien esku-hartze zuzenarekin edo algoritmoari egoki sailkaturiko kasuen adibideak ematen dizkion gizaki baten laguntzarekin.