7. Kategorizazioa: Baliabide-klaseak eta -motak deskribatzea

Robert J. Glushko, Rachelle Annechino, Jess Hemerly, Robyn Perry, Longhao Wang

7.3 Kategoriak sortzeko printzipioak

7.2 atalean –Kategoriak: zer eta zergatik– kategoriak zertan diren azaldu dugu, bai eta zertarako sortzen diren ere: zer testuinguru kultural, indibidual eta instituzionaletan, eta zer xederekin. Horretan ari ginela, kategoriak sortzeko printzipio batzuk aipatu ditugu, sakondu gabe.

Orain, modu sistematikoan begiratuko diogu kategoriak sortzeko printzipioei, besteak beste: enumerazioa, propietate bakarrak, hainbat propietate, hierarkia, probabilitatea, antzekotasuna eta teorian eta xedeetan oinarrituriko kategorizazioa. Kategoriak sortzeko modu horiei dagokionez, bakoitzak bere informazio-moldeak eta mekanismoak erabiltzen ditu kategorietako kidetza ezartzeko orduan.

7.3.1 Enumerazioa

Kategoriak sortzeko printzipio sinpleena enumerazioa da; sorta finitu edo zenbakarri bateko edozein baliabide bihur daiteke kategoria bateko kide, egitate horrengatik bakarrik. Printzipio horri hedapen-definizioa ere deitzen zaio, eta sorta bateko kideei hedapen esaten zaie. Kategoria instituzional asko enumerazioaren bidez zehazten dira, balio posibleen edo legalen sorta gisa; adibidez, AEBko 50 estatuak edo ISO moneta-kodeak.

Enumerazio-kategorien bidez, anbiguotasunik gabe ezar daitezke kategorietako kidetzak, izan ere, estatu bat edo moneta-kode bat kategoria bateko kidea izango da edo ez da izango; ez dago beste aukerarik. Dena dela, argitasun horrek baditu alde txarrak: zaila da argudiatzea ezen enumerazioan modu esplizituan aipatzen ez den zerbait kategoriako kidetzat hartu beharko litzatekeela; hori dela-eta, legeak eta araudiak zurrunak izan daitezke. Gainera, kategoria oso handia denean, enumerazioa ez da erabilgarria, ez eta efizientea ere; halako kasuetan, kategoria zatitu behar da, edo enumerazioa ez bezalako printzipioren batean oinarrituriko definizio bat eman.

Adibidez, hainbat milurtekotan, lurtarrok «planeta» deritzon kategoria kultural bat erabili izan dugu, zeruko objektu «alderraiak» definitzeko, eta gure eguzki-sistemako planetak bakarrik ezagutzen genituenez, enumerazio bidez definitzen genuen planetaren kategoria: Merkurio, Venus, Lurra, Marte, Jupiter eta Saturno ziren kategoria horretako kideak. XVIII. eta XX. mendeen bitartean, Urano, Neptuno eta Pluton planetak identifikatu ziren, eta planeten zerrendara gehitu, kategoria kulturala aldatu gabe. Baina, azken hamarkadetan, ordura arte ezezagunak ziren planeta mordo bat atzeman dira, gure eguzki-sistematik kanpo daudenak; ondorioz, planeta-kopurua mugagabea bihurtu denez, enumerazioak ez du jada balio planetak definitzeko.

Nazioarteko Astronomia Elkarteak (IAU, ingelesezko sigletan), kategorien krisia konpontze aldera, definizio hau eman zuen planetari buruz: «zeruko gorputz bat, zeinak a) izar baten inguruan orbitatzen baitu, b) aski masa baitu gorputz zurrunaren indarra gainditzeko eta oreka hidrostatikoa lortzeko, forma esferikoa edo ia esferikoa lortuz, eta c) bere orbitaren ingurua garbitu baitu». Zoritxarrez, Plutonek ez du hirugarren irizpidea betetzen, eta jada ez da planeten kategoriako kidetzat hartzen; orain, «planeta nano» deitzen zaio.

Kategoria kultural nabarmen baten definizioa aldatzeak polemika eta larritasun itzela sortu zuen jende xehearen artean. Lehen hezkuntzako ikasleak eta irakasleak kexu agertu ziren, Plutonen aurkako bidegabekeria eta curriculumean izango zen etena salatuz; garai hartan, halako goiburuak plazaratu ziren, besteak beste: «Plutonen gradu-beherapenak hankaz gora ipini du hezkuntza».

Planetak, zerrendatzeko gehiegi: Kepler-en arrastoari jarraitzea

Behatoki espazial bat da Kepler; Nasak jaurti zuen 2009. urtean, zera aztertzeko: ea ba ote zeuden Lurraren antzeko beste planeta batzuk, beste eguzki batzuen inguruan orbitatzen dutenak, Esne Bidea galaxian. Keplerrek planeta berri milaka batzuk deskubritu eta egiaztatu ditu jada, eta emaitza horiek kontuan hartuta, pentsa daiteke izarrak adina planeta egon daitezkeela gutxienez: hau da, ehunka bilioika batzuk, Esne Bideari bakarrik erreparatuta. Zenbatu azkar.

7.3.2 Propietate bakarrak

Kasuak identifikatzen eta deskribatzen ditugunean, senezkoa eta erabilgarria izan daiteke horien propietateez pentsatzea (horixe aztertu genuen bi atal hauetan: 4.3 atala, Baliabideen identitatea eta 5. kapitulua: Baliabideen deskribapena eta metadatuak). Horrenbestez, senezkoa eta erabilgarria izan behar luke propietateak aintzat hartzea kasu honetan ere: kasu bat baino gehiago aztertzen dugunean, konparazioak egiteko eta kategoriatzat edo baliokidetasun-klasetzat zer kasu hartuko diren erabakitzeko. Kategoria bateko kideak propietate edo arau baten edo gehiagoren bidez zehazten badira, kategoria horrek edukiera-definizioaren printzipioari jarraitzen dio, eta propietateei berei edukiera esaten zaie.

Pentsa zenezake ezen kategoria baten enumerazioa edo hedapen-definizioa propietateen azterketa bat dela; izan ere, «estatu bat izatea» ez al da, bada, Kaliforniaren propietate bat? Baina estatutasuna ez da propietate bat, hain justu ere «estatua» hedapenaren bidez definitzen delako: hau da, Kalifornia estatu bat den edo ez jakiteko modu bakarra da estatuen zerrendan ote dagoen egiaztatzea.

Baliabide baten propietate bakar oro erabil daiteke kategoriak sortzeko; zentzu horretan, propietate intrintseko estatikoak izaten dira errazenak. 5. kapituluan –Baliabideen deskribapena eta metadatuak– azaldu genuen eran, baliabide bati datxezkion eta inoiz aldatzen ez diren propietateak dira propietate intrintseko estatikoak. Objektu naturalen edo ekoitzien konposizio materiala, adibidez, propietate intrintseko estatiko bat da, baliabide fisikoak antolatzeko balio duena. Adibidez, musika-bilduma pertsonal bat antolatzeko sisteman, oinarritzat hartzen badira formatu fisikoari dagozkion propietate intrintseko estatikoak, honako kategoria hauek erabiliko dira: Cdak, DVDak, biniloak, 8 pistako kartutxoak eta kaseteak.

Propietate bakarrak erabiltzea logikoa da baldin eta propietateek balio-kopuru txiki samar bat badute, adibidez, musika-formatuen kasuan, eta bereziki erabilgarriak izango dira propietateek lotura estua badute baliabideen erabilera-moduarekin: musika-bildumaren kasuan, hain zuzen ere, formatu bakoitza entzuteko ekipamendu zehatz bat behar da. Hala, musika kategoriaren azpi-kategoria bilakatzen da balio bakoitza.

Baliabide intelektual baten egilea nor den, noiz sortu zen eta non dagoen ezin da zuzenean hauteman, baina propietate intrintseko estatikoak dira halere. Baliabidearen gaia edo xedea, «zeri buruzkoa da» eta «zertarako sortu zen hasieran» galderen erantzunak, propietate intrintseko estatikoak dira orobat, eta ezin dira zuzenean hauteman, informazio-baliabideen kasuan bereziki.

Baliabide baten izena edo identifikatzailea ausazkoa izaten da maiz, baina behin zehaztu denean, normalean ez da aldatzen: hortaz, propietate estrintseko estatiko bat da. Baliabideen bilduma batek identifikatzaile alfabetikoak edo numerikoak baditu, ordenaren printzipioaren arabera antola daitezke baliabide horiek –espeziak, liburuak, langileei buruzko erregistroak eta beste hainbat gauza–, modu guztiz fidagarrian. Horren harira, batzuei zalantza sortzen zaie, ea antolaketa-printzipio horrek kategoria-sistema bat sortzen duen benetan, ala, kontrara, identifikatzaileei datxekien ordena ustiatu besterik ez duen egiten. Adibidez, identifikatzaile alfabetikoei dagokienez, pentsa dezakegu ezen ordena alfabetikoak kategoria-sistema errepikakor bat sortzen duela, 26 kategoria nagusirekin (A-Z); gero, kategoria nagusia bakoitzean beste hogeita seina azpi-kategoria egongo dira, eta abar eta abar, harik eta kasu bakoitza dagokion tokian ipini arte.

Baliabide-propietate batzuk estrintsekoak eta dinamikoak dira, erabileran edo jarreretan oinarritzen direlako, eta erabilerak zein jarrerak testuinguruaren mendekoak izaten direlako neurri handi batean. Baliabide baten gaur egungo jabea edo kokapena, erabilera-maiztasuna, beste baliabide batzuekin batera erabilia izatearen maiztasuna edo beste baliabide antzeko batzuen aldean duen puntuazioa: horra hor propietate estrintseko eta dinamiko ohiko batzuk, baliabideak antolatzeko eta kategoriak zehazteko oinarri gisa erabiltzen direnak.

Halako propietateek balio-kopuru handia izan dezakete, edo neurketa jarraikorrak izan ditzakete; hala ere, baldin eta arau argiak baldin badaude, kategoriak propietate-balioen arabera nola zehaztu ezartzen dutenak, kategoriek ulerterrazak eta erabilerrazak izaten segituko dute. Adibidez, ezagutzen ditugun pertsonak natural-natural kategorizatzen ditugu zenbait ezaugarriren arabera: lanbidea, zer hiritan bizi diren, zaletasunak edo adina. Alderdi numeriko bat duten propietateak, adibidez «erabilera-maiztasuna», kategoria-sorta txikiagoetan zatitzen dira sarri, propietate-balio numerikoak aintzat hartuta: «sarri erabiltzen direnak», «noizean behin erabiltzen direnak» eta «oso gutxitan erabiltzen direnak».

Baliabide bakoitzak baditu ezin konta ahal propietate, logikoki adierazi litezkeenak; hala ere, gehienek ez dute balio kategoria interpretagarriak eta erabilgarriak, jendeak baliatzeko modukoak, sortzeko. Jendeak kategoriak erabiliko baditu, garrantzitsua da gisa honetako propietateak hartzea oinarritzat: kategorizatu nahi den baliabide-arloan nabarmenak direnak, psikologikoaren edo pragmatikaren aldetik. Esate baterako, gauza fisikoak antolatu nahi badira, irizpide kaskarra izango da 2.000 kilo baino gehiago edo gutxiago pisatzen duten kontuan hartzea, izan ere, propietate horri erreparatuz gero, katuak eta aulkiak kategoria batean egongo bailirateke, eta autobusak eta elefanteak, berriz, beste kategoria batean.

Laburbilduz: kategoriak sortu nahi badira jendeak erabiltzen dituen antolaketa-sistemetarako, hauek dira propietate bakar erabilgarrienak: formalki esleitzen direnak, objektibotasunez neurtu eta ordenatu daitezkeenak eta kategoria kultural ezarriei loturik daudenak; hala errazagoa izango baita kategoria horiek ulertzea eta deskribatzea.

Propietate bakar bat erabiltzen bada sorta bateko baliabideak bereizteko edo antolaketa-sistema bateko kategoriak eratzeko, propietatearen hautaketak berebiziko garrantzia du, izan ere, propietate bakoitzak bere kategoriak sortuko baititu. Adinaren propietateari helduz gero, Bill Gates eta Mark Zuckerberg ez dira jende-kategoria berdinean egongo. Aitzitik, aberastasunaren propietateari erreparatzen bazaio, kategoria berdinean egongo dira, baiki. Gainera, propietate bakar bat erabiltzen bada kategoria-sistema bat sortzeko, item kopuru handia biltzen duten kategoriek ez dute koherentziarik izango, zeren beste propietate batzuei dagozkien ezberdintasunak nabarmenegiak suertatuko baitira, eta kategoriako kide batzuk ez dira beste batzuk bezain ondo egokituko.

7.3.3 Hainbat propietate

Antolaketa-sistemetan hainbat propietate erabiltzen dira, sarri, kategoriak zehazteko. Hori egiteko hiru modu daude, zeinak ezberdinak baitira bi faktore hauei dagokionez: propietateen helmena, batetik, eta propietateak zer neurritan diren funtsezkoak kategoriak definitzeko garaian, bestetik.

7.3.3.1 Hainbat mailatako kategoriak edo kategoria hierarkikoak

Alkandora mordo bat badauzkazu (eta joera konpultsiboak badituzu edo «txukunzale» porrokatua bazara), ez duzu propietate bakar bat aintzat hartuko armairua antolatzeko orduan (adibidez, zer gorputz-atali dagozkion armairuko arropak), eta alkandorak eta prakak aparte ipintzeaz gain, alkandorak ere bereiziko dituzu, lehenik estiloaren arabera, ondoren mahuka-luzeraren arabera eta azkenik kolorea aintzat hartuz. Antolaketa-sistema bateko baliabide guztiak antolatzeko baliabide-propietateen sekuentzia berdina erabiltzen bada, hierarkia logiko bat sortzen da, hots, hainbat mailatako kategoria-sistema bat.

Demagun alkandorak baliabide-bilduma bat direla eta hori antolatu nahi dugula: bada, antolaketa-sistema horretan, lehenik eta behin, alkandoren kategoria zabala zatituko dugu, estiloaren arabera, eta honelako azpi-kategoriak sortu: «alkandora dotoreak», «laneko alkandorak» eta «parrandarako alkandorak». Ondoren, estiloaren araberako kategoria bakoitza beste hainbat aldiz zatituko da, kategoria oso zehatzak sortuz: adibidez «mahuka luzeko alkandora zuri dotoreak». Alkandora jakin batek azken kategoria horretan amaituko du, bidean zenbait galbahe pasa ostean: alkandora dotore bat da, mahuka luzeak ditu, eta zuria da. Galbahe bakoitzarekin kategoria zehatzagoak sortuko dira, aurreko galbaheak gainditu zituzten kategorien bidegurutzeetan.

Beste modu batera esanda, kategoria bateko kideek propietate bereizgarri bat dutela atzematen dugunean, eta propietate hori xederen baterako garrantzitsua izan daitekeela uste dugunean, orduantxe sortzen dira azpi-kategoriak. Alkandorak ez dira prakak bezalakoak, «gorputz-atal»en propietateari dagokionez, eta alkandoren kategoriaren baitako azpi-kategoriak guztiek partekatzen dute propietate hori, hau da, gorputzaren goiko aldean jartzen direla. Nolanahi ere, alkandorek badituzte beste ezaugarri bereizgarri batzuk, beren azpi-kategoriaren arabera. Propietate bereizgarri horiei erreparatzen badiegu ere, gogoan izan behar dugu badirela beste ezaugarri batzuk, azpi-kategorietako kideek partekatzen dituztenak. Sarritan esaten da ezaugarri horiek kategoria zabalagotik «oinordean jaso» edo «inferitu» direla. Adibidez, alkandora guzti-guztiek «gorputzaren goiko aldean jartzen da» propietatea partekatzen duten bezala, arropa-item guzti-guztiek partekatzen dute «gorputzean jar daiteke» ezaugarria, eta «alkandorak» eta «prakak» kategorietako kide guzti-guztiek jasotzen dute ezaugarri hori oinordean.

Propietate bereizgarri bakoitzak beste maila bat sortzen du kategorien hierarkian; ondorioz, galdera ageriko bat pizten da: zenbat ezaugarri eta maila behar ditugu? Galdera horri erantzute aldera, gure armairuko alkandora-kategoriei buruz hausnartu behar dugu. Alkandoren antolaketa-sisteman, hiru ezaugarri hartzen ditugu kontuan: estiloa, mahukaren luzera eta kolorea; baliteke ezaugarri horien arabera sorturiko hierarkiako azpi-kategoria batzuetan kide bakar bat egotea, edo bat bera ere ez. Baliteke parrandarako alkandora mahuka-motz horiak eta gorriak edukitzea, baina seguru asko ez duzu kolore horietako alkandora dotore mahuka-luzerik izango; ondorioz, kategoria horiek hutsik geratuko dira. Jakina, kategoria batean kide bakar bat baldin badago, ez da propietate gehiago bilatzeko premiarik izango kategoria horretako kideak bereizte aldera, beraz, bilduma bateko baliabide bakoitzak kategoria propio bat osatzen baldin badu, kategoria-hierarkia hori osoa izango da logikaren aldetik.

Dena den, alkandorak antolatzeko gure sistemako kategoria beherenek kide bat baino gehiago izanda ere, akaso ez ditugu ezaugarri gehigarriak bilatuko eta kategoriak are gehiago zatituko, baldin eta kategoriako kideen artean dauden ezberdintasunek ez badute garrantzirik antolaketa-sistemak ahalbidetu beharreko elkarreragin-jarduerei dagokionez. Demagun mahuka luzeko bi alkandora zuri dotore dauzkagula, marka ezberdinetakoak: gisa horretako alkandora bat jantzi behar dugunean, ez diogu azken ezaugarri horri erreparatzen; aitzitik, bietako bat hautatzen dugu, bi alkandorak guztiz baliokideak edo ordezkagarriak direlakoan. Kategoria bateko kideen artean dauden ezberdintasunek ez badute garrantzirik kategoriaren erabiltzaileentzat, esan dezakegu ezen antolaketa-sistema osoa dela pragmatikaren edo praktikaren aldetik, logikaren aldetik osoa ez bada ere. Hots, osoa da «xede guztiei dagokien heinean». Hain zuzen ere, esan genezake desiragarria dela kategoria-sistema bat zatitzeari uztea oraindik ere ezberdintasun txiki batzuk daudenean kategoria bakoitzeko itemen artean: modu horretan, malgutasun edo espazio logiko apur bat geratuko da, item berriak antolatu ahal izateko. Baliteke honek guztiak gogora ekartzea gehiegi egokitzearen kontzeptua: eredu batean parametro asko baldin badaude, oso zehatzak eta egokiak izan daitezke aurretiaz emandako datuei dagokionean, baina, datu berrien kasuan, ez dituzte hain ondo orokortuko. (Ikus 5.3.2.5 atala).

Bestalde, demagun saltoki handi batean gaudela, alkandorei eskainitako atalean. Bertan, estiloaren, mahuka-luzeraren eta kolorearen arabera antolatuko dituzte alkandorak, zerorrek etxean egin bezalaxe, baina, seguru asko, marka eta neurria ere hartuko dituzte kontuan, bezeroak modua izan dezan Marc Jacobs diseinatzailearen alkandora dotore urdin mahuka-luzeko bat aurkitzeko, L neurrikoa. Saltokiko antolaketa-sisteman alkandoren arloko propietate gehiagoren eta hierarkia xeheago baten premia izango dute, askoz alkandora-kasu gehiago antolatu behar dituztelako, eta bezero askoren beharrak asetu behar dituztelako, ez soilik pertsona batenak.

«Bainu-praka» hawaiiarrak antolatzea

«Bainu-praka» hawaiiarrak antolatzea

Surflarien bainujantziei bainu-praka esaten zaie, eta bilakabide handia izan dute: lehen, jantzi guztiz funtzionalak ziren; orain, ordea, muturreko abentura-kirolen eta Hawaiiko bizimoldearen sinbolo bihurtu dira. 2012an, erakusketa bat antolatu zuten Honoluluko Arte Museoan, zeinean bainu-praken aniztasuna islatzen baitzen, hiru alderdi kontuan hartuta: materiala, luzera, eta nola tenkatzen den surflariaren zirrituaren eta gerriaren inguruan. (Argazkia: R. Glushko)

7.3.3.2 Propietate desberdinak, baliabideen azpi-multzoak antolatzeko

Antolaketa-sistema batean kategoriak sortu nahi badira baliabide-ezaugarri ugari erabiliz, badago beste modu bat hori egiteko: propietate desberdinak erabil daitezke antolatu nahi den baliabidearen azpi-sorten arabera. Ikuspegi hori ez da hainbat mailako ikuspegia bezalakoa, ez baitu baliabide bakoitza ebaluatzen propietate guztien arabera. Aitzitik, aipagai dugun printzipio berri horrek zera egiten du: kontzeptualki edo fisikoki elkarren alboan dauden hainbat eremu antolatu, eta eremu horietako bakoitzak kategoria-sorta bereizi bat dauka, arlo horretako baliabideen propietateak aintzat hartzen dituena. Printzipio hori, batez ere, ordenagailuetako fitxategi-sistemei dagokien karpeta-egituretan erabiltzen dira, bai eta mezu elektronikoen aplikazioetan ere: nahi adina karpeta-kategoria sor ditzakezu, baina baliabide bakoitza karpeta bakar batean koka dezakezu.

Antolaketa-kategoriak sortzeko metodo hori azaltzeko orduan, lagungarria suertatzen da propietate intrintsekoen eta estrintsekoen arteko aldea, bai eta propietate estatikoen eta dinamikoen artean dagoena ere. Adibidez, zure arropa antolatzeko garaian, ezaugarri intrintseko estatikoen arabera egin dezakezu, alkandorak, galtzerdiak eta jertseak nor bere tiraderan gordeaz eta gero kolorearen arabera moldatuz; bestalde, ezaugarri estrintseko estatikoak ere har ditzakezu aintzat, armairua beste norbaitekin partekatzen baduzu: kasu horretan, armairuaren alde bakar bat erabili ahal izango duzu jantziak gordetzeko; horretaz parte, propietate intrintseko dinamikoei erreparatuz gero, urtaroen arabera antolatuko dituzu arropak, eta, azkenik, gehien erabiltzen duzun jaka etxeko atarian gordetzen baduzu, kako batetik zintzilik, propietate estrintseko dinamikoak erabiliko dituzu.

Baliabideen azpi-sorta bakoitza antolaketa-ezaugarri ezberdinen arabera antolatzeari uzten badiogu eta edozein ezaugarri erabiltzen badugu edozein baliabide deskribatzeko, antolaketa-printzipio lauso bat baliatuko dugu, sarritan etiketatzea deitzen zaiona. Baliabide baten edozein propietate erabiltzen badugu baliabide horren deskribapen bat sortzeko, kontrolik gabe, eta sarritan printzipiorik gabe, sortuko ditugu kategoriak; alabaina, molde hori gero eta maizago erabiltzen da argazkiak, webguneak, mezu elektronikoak eta webean oinarrituriko bestelako baliabideak antolatzeko. Etiketatzeari buruz xeheago hitz egin dugu 5.2.2.3 atalean: Sarean oinarrituriko baliabideak antolatzea.

Supermerkatu baten mapa

Baliabideen formatua x fokua

Supermerkatuetan sailkapen-sistema harrigarriki konplexuak gauzatzen dira. Dendako atal bakoitzak bere propietate-sortaren arabera antolatzen ditu baliabideak, eta ezaugarri batzuk, hala nola produktuen iraungitze-data eta tokian bertan prestatzen al diren, garrantzitsuak dira atal batean baino gehiagotan. (Argazkia: R. Glushko)

7.3.3.3 Ezaugarri beharrezkoak eta nahikoak

Baliabide-bilduma handi bat antolatzeko ez dira nahitaez erabili behar ezaugarri eta kategoria ugari. Kategoria-mota batzuk zehatz-mehatz ezarri daitezke, propietate funtsezko banaka batzuk erabiliz. Adibidez, zenbaki lehenak zenbaki oso eta positiboak dira, bat zenbakiarekin eta beren buruarekin baizik zatitu ez daitezkeenak, eta kategoria-definizio horrek ederki bereizten du zer zenbaki diren lehenak eta zeintzuk ez, zenbat zenbaki kategorizatu behar diren aintzat hartu gabe. «Osoa eta positiboa» eta «bat zenbakiarekin eta beren buruarekin baizik zatitu ez daitezkeenak» kategoriak beharrezkoak dira zenbaki lehenen kategoriari dagokionez: zenbaki lehen guztiek bete behar dituzte ezaugarri horiek. Era berean, ezaugarri horiek nahikoa dira zenbaki lehenen kategoriako kidetza ezartzeko: ezaugarri beharrezkoak betetzen dituen zenbaki oro izango da zenbaki lehena. Ezaugarri beharrezkoen eta ezaugarri nahikoen bidez zehazten diren kategoriei kategoria monotetikoak esaten zaie. Halaber, kategoria klasikoakdirela esaten da, bat egiten dutelako Aristotelesen teoriarekin, zeinaren bidez ezartzen baita nola erabiltzen diren kategoriak, silogismo bitartez, dedukzio logikoetan. (Ikus koadro gehigarria: Kategorien ikuspegi klasikoa).

Platonek eta Aristotelesek duela 2.000 urte proposatu zituzten kategorizazio-teoriak, eta orduz geroztik asko garatu dira; dena den, hainbat zentzutan, kategorien ikuspegi klasikoei atxikitzen gatzaizkio, oraindik ere, antolaketa-sistemak sortzen ditugunean, modu horretan errazagoa suerta daitekeelako sistemak inplementatzea eta mantentzea.

Kategoria beharrezkoei eta nahikoei dagokienez, badute ondorio garrantzitsu bat: kategoriako kide guztiak dira kategoriaren adibide egokiak neurri berean; hau da, zenbaki lehen guztiak dira lehenak neurri berean. Kategoria-sistema instituzionalek, sarritan, ezaugarri beharrezkoak eta nahikoak erabiltzen dituzte erabaki zuhaitzetan, datu-baseetako eskemetan eta programazio-hizkuntzen klaseetan; halako ezaugarriak sinpleak direlako kontzeptualki, eta argi-argiak, berriz, inplementazioari dagokionez.

Kategoriei buruzko ikuspegi klasikoa

Ikuspegi klasikoaren arabera, ezaugarri beharrezkoen eta nahikoen arabera ezartzen dira kategoriak. Teoria horrek berebiziko eragina izan du Mendebaldeko pentsaeran, eta antolaketa-sistema askotan gauzatzen da, bereziki informazio-baliabideei loturikoetan. Nolanahi ere, azalduko dugun eran, hainbat arlotan eta testuingurutan ezin dugu printzipio hori erabili kategoriak sortzeko, ez dagoelako ezaugarri beharrezkorik ez nahikorik. Ondorioz, teoria klasikoa kritikatu dute kategorizazioa lantzen duten psikologo, zientzialari kognitibo eta informatikari askok.

Gure iritziz, hori ez da bidezkoa Aristotelesi dagokionez; hark, izan ere, arrazoiketa deduktiboaren logika kategorietan oinarritzen dela azaltzeko sortu baitzuen gaur egun ikuspegi klasikoa deitzen dugun hori: gizon guztiak dira hilkorrak; Sokrates gizon bat da; horrenbestez, Sokrates hilkorra da. Jendeak ez luke Aristotelesen pentsamoldea alderantzikatu behar, eta arrazoiketa induktiboaren arazoari heltzeko baliatu –arrazoiketa induktiboa: nola sortzen diren kategoriak, hasteko eta behin–. Hori ez da Aristotelesen errua, haren helburua ez baitzen kategoria kulturalak nola azaleratzen diren esplikatzea.

Helbide bat zer den zehazteko, kale, hiri, eskualde administratibo eta posta-kode banak osatzen dutela esan dezakegu. Informazio-osagai horiek denak dituen edozer gauza, beraz, helbide baliozkotzat joko da, eta horietako bat falta duena, berriz, ez. Helbideen ezaugarriak fintzen baditugu, eta esaten badugu eskualde administratiboak nahitaez izan behar duela estatu bat, eta, posta-kodeak, berriz, AEBko Posta Zerbitzuko estatu- eta lurralde-kodeen zerrenda ofizialeko kodeetako bat, azpi-kategoria bat sortuko dugu, AEBko helbideei dagokiena, zeinak enumerazio-kategoria bat baliatzen baitu bere definizioan. Era berean, Kanadako helbideei dagokien azpi-kategoria bat sor genezake, estatu hitzaren ordez «probintzia» hitza erabiliko bagenu, bai eta Kanadako probintzia- eta lurralde-kodeen zerrenda bat ere.

7.3.4 Ezaugarrietan oinarrituriko kategorizazioaren mugak

Ezaugarrietan oinarrituriko kategorizazioa egokia da, tautologikoki, «zenbaki lehen»entzat eta horren moduko kategorientzat, zeinak ezaugarri beharrezkoen eta nahikoen bidez zehazten baitira. Era berean, ezaugarrietan oinarrituriko kategorizazioa aproposa da ezaugarriak bereizgarriak direnean kontzeptualki eta ezaugarrien balioak erraz hauteman eta aztertu daitezkeenean, adibidez, gizakiak egindako baliabide fisikoen kasuan –alkandorak eta beste–.

Informazio-baliabideak antolatu behar dituzten sistemekin izandako esperientziak erakutsi du ezen, kategoriak sortzeko orduan, eraginkorra dela erraz hautemateko moduko ezaugarriak hartzea oinarritzat. Baliteke zantzu batzuk egotea «azaleran», adierazten dutenak zer «juntura» edo muga dauden informazio-baliabideen moten artean, baina, sarritan, aurkezpenari edo paketatzeari dagozkion kontuak baizik ez dira. Alegia: ez liburuaren tamainak ez azalaren koloreak emango digute arrasto fidagarririk liburuaren edukiaz. Informazio-baliabideek badituzte ezaugarri deskribatzaile ugari, hala nola izenburua, autorea eta argitaratzailea, zeinak eraginkorragoak izan baitaitezke kategoriak sortzeko, eta ezin uka kategoria horietako batzuk erabilgarriak gerta daitezkeela zenbait elkarreragin-jarduera ahalbidetzeko: adibidez, autore jakin batek idatzitako liburu guztiak edo argitaratzaile batek kaleratutako liburu guztiak topatu nahi baditugu. Edonola ere, helburu praktikoei helduta, informazio-baliabide baten propietate erabilgarriena zera da: zeri buruzkoa den; baliteke ezaugarri zehatz hori zuzenean hauteman ezin izatea, eta zaila da, oso, hura ezaugarritzea. Liburutegiko edo dokumentuen artxibatze-sistema bateko informazio-baliabideen bilduma orok, seguru asko, gai bat baino gehiago izango ditu aipagai, beraz, baliabide bat kategorizatzen badugu bere edukiaren ezaugarri batzuen arabera, aldi berean kanpoan utziko dugu beste ezaugarri batzuen arabera kategorizatzeko aukera.

Weba martxan jarri zenean, ahalegin ugari egin ziren kategoriak sortzeko web orrientzat, eta Yahoo! bereziki nabarmendu zen horretan. Weba hazi arau, agerian geratu zen bilatzaileak askoz erabilgarriagoak izango zirela, zeren testu-indexak sortzen baitzituzten ia denbora errealean, eta, ondorioz, ez baitzuten behar web orriak aldez aurretik sailkatzea kategoriatan. Aitzitik, webeko bilatzaileek web orri eta dokumentu bakoitza aurkezten dute halako moduan non bertako hitzak eta terminoak ezaugarri bereizitzat hartzen baitira.

Orain arte aipatu ditugun ezaugarri-motei dagokienez, jendeak modu esplizituan erabiltzen zituen, erabakiak hartzeko kategorien kidetzaz eta baliabideen antolaketaz; ordea, dokumentu bateko hitz bakoitza bereiz hartzen baldin bada, ezaugarriei buruz geneukan nozio hori aldatu egingo da. Ezinezkoa da, nahi izanda ere, jendeak ezaugarri banaka batzuei baino gehiagori erreparatzea aldi berean, halakoxea baita giza hautematearen makinaria eta funtzionamendu kognitiboa. Ordenagailuek, ostera, ez dute halako mugarik, eta informazioa berreskuratzeko algoritmoek zein ikaskuntza automatikoko algoritmoek ezaugarrien kopuru erraldoi bat erabil dezakete, kapitulu honetan, 8. kapituluan eta 10. kapituluan ikusiko dugunez.

Weba sailkatzea: Yahoo! 1996an

Weba sailkatzea: Yahoo! 1996an

Beren helburua zen web orri bakoitza kategoria batean sailkatzea. (Pantailaren irudia: R. Glushko. Iturria: Internet Archive wayback machine)

7.3.5 Probabilitate-kategoriak eta «Familia antzekotasuna»

Ikusi dugun eran, kategoria batzuk zehatz-mehatz zehaztu daitezke ezaugarri beharrezkoak eta nahikoak erabiliz, batez ere erraza baldin bada kategoriako kidetza ezartzeko behar diren propietateak behatzea eta ebaluatzea. Zenbaki bat zenbaki lehena da, edo ez da. Ezinezkoa da pertsona bat ikasle gisa izena emanda egotea eta ikasle gisa izena emanda ez egotea aldi berean.

Dena den, ezaugarrien azterketa esplizitu eta logikoan oinarrituriko kategorizazioa ez da hain eraginkorra inondik ere, eta zenbait arlotan ezin da halako kategorizaziorik egin, ezaugarriak ezin baldin badira bereizi edo hauteman, edo ez badira beharrezkoak. Horrenbestez, kategoriak sortu nahi baditugu halako eremuetan, ezaugarriak, nolabait ere, probabilitatearen edo estatistikaren arabera aztertu behar ditugu, kategorizatu nahi dugun baliabidearen eta kategoriako beste baliabideen artean egon litezkeen antzekotasunak neurtu nahi baldin baditugu.

Har dezagun, esaterako, kategoria ezagun bat, hala nola «txoria». Txori guztiek dituzte lumak, hegoak, mokoak eta bina hanka. Haatik, milaka txori-mota daude, eta, horiek bereizteko, txori batzuek badauzkaten baina beste txori batzuek ez dauzkaten propietateak baliatzen dira: esaterako, txori gehienak gai dira hegan egiteko eta egunez jarduten dira; txori batzuk gai dira igeri egiteko eta beste batzuk ur azpian igeri egiteko; zenbait txorik oin palmatuak dituzte. Propietate horiek multzokaturik daude; hautapen naturalaren ondorio dira, zeinak abantailak ematen baitizkie ezaugarrien konfigurazio jakin batzuei, eta halako multzo asko daude: zuhaitzetan bizi diren txoriek bestelako hegoak eta oinak dituzte, igerian ibiltzen diren txoriekin alderatuz gero, eta basamortuko txoriek bestelako koloreak eta metabolismo-sistemak dauzkate, uretik hurbil bizi direnekin erkatuta. Hortaz, txorien kategoria ez da propietate-multzo beharrezko eta nahiko bakar baten bidez definitzen, ezpada probabilitateen bidez: hots, kategoriako kidetzari buruzko erabakiak hartzeko, kategoriaren propietate gutxi-asko bereizgarrienen zantzuak biltzen dira.

Informazio-baliabideen kategoriek, sarri, probabilitate-izaera hori izaten dute. Adibidez, mezu bat spam dela zehazteko orduan, hitz jakin batzuen agerpenari erreparatzen zaio, hala nola «onuradun» edo «farmazeutiko» hitzei, baina hitz horiek orobat agertzen dira spam ez diren mezuetan. Zabor-mezuen sailkatzaileak, beraz, mezu bat spam izateko probabilitate orokorra kalkulatzen du; horretarako, mezuko hitz bakoitza aztertzen du, zabor mezuen testuinguruan eta mezu onen testuinguruan agertzeko duen probabilitateari erreparatuz.

Kategoria baten ezaugarri bereizgarriek probabilitate-banaketa bat dutenean, hiru ondorio ekar ditzake horrek:

7.3.5 Probabilitate-kategoriak eta «Familia antzekotasuna»

Ikusi dugun eran, kategoria batzuk zehatz-mehatz zehaztu daitezke ezaugarri beharrezkoak eta nahikoak erabiliz, batez ere erraza baldin bada kategoriako kidetza ezartzeko behar diren propietateak behatzea eta ebaluatzea. Zenbaki bat zenbaki lehena da, edo ez da. Ezinezkoa da pertsona bat ikasle gisa izena emanda egotea eta ikasle gisa izena emanda ez egotea aldi berean.

Dena den, ezaugarrien azterketa esplizitu eta logikoan oinarrituriko kategorizazioa ez da hain eraginkorra inondik ere, eta zenbait arlotan ezin da halako kategorizaziorik egin, ezaugarriak ezin baldin badira bereizi edo hauteman, edo ez badira beharrezkoak. Horrenbestez, kategoriak sortu nahi baditugu halako eremuetan, ezaugarriak, nolabait ere, probabilitatearen edo estatistikaren arabera aztertu behar ditugu, kategorizatu nahi dugun baliabidearen eta kategoriako beste baliabideen artean egon litezkeen antzekotasunak neurtu nahi baldin baditugu.

Har dezagun, esaterako, kategoria ezagun bat, hala nola «txoria». Txori guztiek dituzte lumak, hegoak, mokoak eta bina hanka. Haatik, milaka txori-mota daude, eta, horiek bereizteko, txori batzuek badauzkaten baina beste txori batzuek ez dauzkaten propietateak baliatzen dira: esaterako, txori gehienak gai dira hegan egiteko eta egunez jarduten dira; txori batzuk gai dira igeri egiteko eta beste batzuk ur azpian igeri egiteko; zenbait txorik oin palmatuak dituzte. Propietate horiek multzokaturik daude; hautapen naturalaren ondorio dira, zeinak abantailak ematen baitizkie ezaugarrien konfigurazio jakin batzuei, eta halako multzo asko daude: zuhaitzetan bizi diren txoriek bestelako hegoak eta oinak dituzte, igerian ibiltzen diren txoriekin alderatuz gero, eta basamortuko txoriek bestelako koloreak eta metabolismo-sistemak dauzkate, uretik hurbil bizi direnekin erkatuta. Hortaz, txorien kategoria ez da propietate-multzo beharrezko eta nahiko bakar baten bidez definitzen, ezpada probabilitateen bidez: hots, kategoriako kidetzari buruzko erabakiak hartzeko, kategoriaren propietate gutxi-asko bereizgarrienen zantzuak biltzen dira.

Informazio-baliabideen kategoriek, sarri, probabilitate-izaera hori izaten dute. Adibidez, mezu bat spam dela zehazteko orduan, hitz jakin batzuen agerpenari erreparatzen zaio, hala nola «onuradun» edo «farmazeutiko» hitzei, baina hitz horiek orobat agertzen dira spam ez diren mezuetan. Zabor-mezuen sailkatzaileak, beraz, mezu bat spam izateko probabilitate orokorra kalkulatzen du; horretarako, mezuko hitz bakoitza aztertzen du, zabor mezuen testuinguruan eta mezu onen testuinguruan agertzeko duen probabilitateari erreparatuz.

Kategoria baten ezaugarri bereizgarriek probabilitate-banaketa bat dutenean, hiru ondorio ekar ditzake horrek:

  • Lehenik, tipikotasuna edo zentraltasuna: horren ondorioz, kategoriako kide batzuk adibide aproposagoak izango dira beste batzuk baino. Probabilitate-kategorietako kidetzari dagokienez, ez dira izango kide guztiak ala bat ere ez; horrenbestez, nahiz eta kasuek hainbat ezaugarri komun izan ditzaketen, kasu batek ezaugarri bereizgarri gehiago baldin baditu beste kasu batek baino, hobea edo tipikoagoa dela uste izango da. Saia zaitez, esate baterako, «txori» bat zer den adierazten, eta, gero, galdetu zure buruari ea txori gisa aipatu ditugun kasu guztiak txorien kategoriaren adibide egokiak diren neurri berean (ikus Familia-antzekotasuna eta tipikotasuna koadroko sei txoriak). Efektu horri, halaber, kategoria-kidetzaren gradientzia deitzen zaio, eta azaltzen du zer neurritan diren komunak ezaugarri bereizgarriak.
  • Bigarrenik, ezaugarri komun batzuk dituztenez, baina ez guztiak, familia-antzekotasuna deritzona sortzen da kategoriako kideen artean: familia biologikoetan gertatzen den bezalaxe, den-denek ez dituzte ezaugarri fisiko berdinak, baina sendi berdineko kideak direla nabaritzen da hala ere. Ideia hori Ludwig Wittgenstein-ek, XX. mendeko filosofo batek, proposatu zuen estreinako aldiz: adibide bezala, «jolas»en kategoria aipatu zuen, zeinetako kideek elkarren antza baitute, ezaugarrien azpi-sorta aldakorren arabera.
  • Hirugarrenik, kategoria bateko kide izateko ez denean ezaugarri beharrezkorik eduki behar, kategoriaren mugak ez dira finkoak izaten: kategoria zabaldu daiteke, eta kide berriak txertatu bertan, betiere kategoriako beste kideen antza baldin badute. Wittgentseinen sasoian ez zegoen bideo-jokorik edo hainbat jokalaritako online jolasik –World of Warcraft, adibidez–; hala ere, ez daukagu inongo arazorik horiek ere jolasak direla ohartzeko, eta Wittgensteinek berak aise onartuko luke, baldin eta bizirik balego. 1. kapituluan adierazi dugun moduan, «liburutegi» kategoria behin baino gehiagotan zabaldu da, ezaugarri berriak hartuz: adibidez, Flickr webguneari buruz esaten da argazkiak partekatzeko liburutegi webean oinarritu bat dela. Familia-antzekotasunen eta ezaugarri-sorta ugari e do aldakorren bidez zehazten diren kategoriei kategoria politetikoak esaten zaie.

Zer da jolas bat?

Ludwig Wittgenstein filosofoak (1889-1951) sakonki aztertu zituen matematikak, gogoa eta hizkuntza. 1999an, inkesta bat egin zuten hainbat filosoforen artean, eta Wittgensteinen Ikerketa filosofikoak liburua XX. mendeko filosofia-liburu garrantzitsuena zela ebatzi zuten. Liburu horretan, Wittgensteinek, «jolasa» oinarritzat hartuz, argudiatzen du kontzeptu askok ez dutela ezaugarri bereizgarririk, eta, aitzitik, «antzekotasunen sare konplikatu bat» dagoela horien oinarrian, «elkarri gainjartzen zaizkionak eta elkar gurutzatzen direnak: batzuetan antzekotasun orokorrak dira; beste batzuetan, xeheak». Hainbat jolas-mota alderatu zituen: mahai-jokoak, karta-jokoak, baloi-jokoak, trebezia-jokoak, zori-jokoak, lehia-jokoak, bakarkako jokoak eta dibertitzeko jolasak. Wittgensteinek dioenez, joko guztiak ez dira neurri berean aproposak kategoriaren adibide gisa, eta, txantxa modura, haurrei apustu-joko bat irakasteko aukera aipatzen du, izan ere, gurasoek eskatu ziotenean beren alabari jolas bat erakusteko, ez baitziren gisa horretako joko batean pentsatzen ari.

Ondorio gisa, esango dugu ezen, aldian-aldian ezaugarri bakar bat erabili ordez kategorietako kidetza ezartzeko, modu konposatuan edo integratuan erabil ditzakegula ezaugarriak, baldin eta bat datozen ezaugarri-multzoek adierazten badute antzekotasun kalkulu bat egin daitekeela. Baliabide bat A kategoriakoa dela esango dugu, eta ez B kategoriakoa, baldin eta A kategoriako kide onenaren edo tipikoenaren antz gehiago badu B kategoriako kide onenaren eta tipikoenarena baino.

Familia-antzekotasuna eta tipikotasuna

Sei animalia hauek ezaugarri fisiko komun batzuk dituzte, baina ez guztiak; hala ere, badute elkarren antza, txori gisa aise identifikatzeko adina. Nolanahi ere, jende gehienak uste du usoak txori tipikoagoak direla pinguinoak baino.

Baliabideen formatua x fokua

Pinguino bat, uso bat, beltxarga bat, zikoina bat, flamenko bat eta fregata txoria. (Goitik ezkerretik hasita, erlojuaren norabidean). (Argazkia: R. Glushko)

7.3.6 Antzekotasuna

Antzekotasunaren bidez neurtzen da zenbateko antza duten bi gauzak, zenbait ezaugarri komunean izan arren berdin-berdinak ez direnak. Nozio malgua da oso, erabiltzen dugun testuinguruaren araberakoa. Batzuen iritziz, antzekotasunaren kontzeptuak ez du esanahirik bere horretan: bi gauza antzekoak ote diren zehazteko, oinarriren bat behar da, ezaugarri-sorta ez-esplizitu bat. Non eta gai bagina ezaugarri horiek eta beren erabilera-moldea identifikatzeko, ez genuke antzekotasun-mekanismoaren premiarik izango ezertarako.

Antzekotasuna erabilgarria suerta dadin kategoriak ezartzeko garaian, antzekotasuna nola neurtuko den zehaztu behar dugu. Antzekotasuna kalkulatzeari dagokionez, badira lau ikuspegi, psikologiak sustatuak, funtzio bana proposatzen dutenak: ezaugarri edo propietateetan oinarrituriko ikuspegia, geometrian oinarrituriko ikuspegia, eraldaketari dagokion ikuspegia eta lerrokatzean edo analogian oinarrituriko ikuspegia.

7.3.6.1 Ezaugarrietan oinarrituriko antzekotasun-ereduak

Badago ezaugarrietan oinarrituriko sistema famatu bat, antzekotasuna kalkulatzeko balio duena: Amos Tversky-ren konparazio-eredua. Bi gauzen ezaugarriak edo propietateak lotzen ditu, eta antzekotasun-neurri bat kalkulatzen du hiru ezaugarri-sortaren arabera:

  • zer ezaugarri dituzten komunean
  • zer ezaugarri dituen lehenak, bigarrenak ez dituenak
  • zer ezaugarri dituen bigarrenak, lehenak ez dituenak

Lehen faktoreari dagokion antzekotasuna murrizten dute bigarren eta hirugarren faktoreek. Faktore bakoitzari esleitutako garrantzia egokitu daiteke, kategoria-kidetzari buruzko ebazpenak azaltzeko. Halaber, ezaugarrietan oinarritzen da Jaccard koefizientea, eta maiz erabiltzen da antzekotasuna neurtzeko; zera kalkulatzen du: ezaugarri komunen ratioa, ezaugarri guztien kopuruarekiko. Kalkulu sinple horrek zero emango du, baldin eta ez badago bat datorren ezaugarririk edo ezaugarri guzti-guztiak bat baldin badatoz. Jaccarden neurketa sarritan erabiltzen da dokumentuen arteko antzekotasuna kalkulatzeko, hitz bakoitza ezaugarri bereiz gisa hartuz.

Kategoria-sistema hierarkikoak edo hainbat mailakoak sortzen ditugunean, ezaugarrietan oinarrituriko antzekotasun-kalkuluaren bertsio heuristiko bat baliatzen dugu, ziurtatze aldera ezen maila bakoitzeko kategoria guztiak abstrakzio- edo zabalera-maila berdinari dagozkiola. Adibidez, musika-tresnen bilduma bat antolatuko bagenu, ez litzateke egokia izango hiru azpikategoria hauek sortzea maila berean: «haizezko tresna egurrezkoak», «biolinak» eta «celloak»; izan ere, hiru kategoria horiek bikoteka alderatuz gero, kategoria guztien artean ez baitago antzekotasun-maila berdina ezaugarriei dagokienez: kontuan harturik haizezko tresna egurrezkoek kategoria bat osatzen dutela, biolinak eta celloak ezin dira kategoria bereiziak izan, elkarren antz handiegia dutelako.

7.3.6.2 Antzekotasun-eredu geometrikoak

Antzekotasun-eredu geometrikoetan, ezaugarri-balio metrikoak dituzten itemak puntu gisa aurkezten dira, hainbat dimentsioko ezaugarri-espazioetan. Ezaugarri-balioak, hortaz, koordenatuak izango dira, eta itemen arteko distantzia neurtuz kalkulatuko da beren arteko antzekotasuna.

Normalean, bilatzaileetan erabiltzen dira antzekotasun-funtzio geometrikoak: bilaketa-terminoen bektore-bana izango dira bilaketa eta dokumentua; hala, dokumentuaren garrantzia zehazteko, bektoreen artean dagoen distantzia neurtuko da, «terminoen espazio»ari dagokionez. Dokumentuen antzekotasuna deritzon koadro gehigarrian, diagrama sinplifikatu bat agertzen da: diagrama horretan lau dokumentu daude, eta hiru termino; bada, dokumentuen kokapena honako kalkulu honen araberakoa da: dokumentu bakoitzean zenbat aldiz agertzen den hiru terminoetako bakoitza. Dokumentuen bektoreak normalizatuta daude, 1 luzera izan dezaten, horrela, bi dokumenturen arteko angeluaren kosinua erabil daiteke antzekotasuna neurtzeko; bi dokumentuak edozein izanda ere. D1 eta D2 dokumentuek elkarren antza handiagoa dute D3 eta D4 dokumentuek baino, lehenengo parearen arteko angelua txikiagoa delako bigarrenari dagokiona baino. Horren funtzionamendua xeheago aztertuko dugu 10. kapituluan –Elkarreraginak baliabideekin–.

Baldin eta, hainbat dimentsiotako ezaugarrien espaziotan, itemen adierazle diren bektoreek luzera ezberdina badute, ezin dugu antzekotasuna kalkulatu kosinuen bidez; aitzitik, modu esplizituagoan aztertu behar ditugu dimentsio bakoitzeko ezberdintasunak.

Dokumentuen antzekotasuna

Dokumentuen antzekotasuna

Lau dokumentu, bektore gisa errepresentatuta, terminoen espazioan: bektoreen arteko angeluen bitartez neur daiteke antzekotasuna.

Distantzia-funtzio geometrikoak deritzon koadro gehigarrian diagrama bat ikus dezakezue, zeinean bi modu ezberdinetan kalkulatzen baita zer distantzia dagoen 1. eta 2. puntuen artean, A eta B diferentziak erabiliz. Batetik, euklidear distantzia-funtzioak dimentsio bakoitza ber bi egin, biak batu, eta horren erro karratua kalkulatzen du: hiruki zuzenen hipotenusa kalkulatzeko Pitagorasen Teorema ezaguna da, bi dimentsiotan baliatuta, eta diferentziei ezartzen zaien berretzailea 2 da. Bestetik, hiri-blokeen distantzia-funtzioak zera egiten du –hala deitzen zaio, hain zuzen ere, «lauki-sare» estiloko hirietan distantziak neurtzeko manera naturalena delako–: dimentsio bakoitzeko diferentziak batu, 1 berretzailearekin.

Esan genezake berretzaileak zera baldintzatzen duela: ezaugarri bakoitzak distantzia edo antzekotasun orokorraren kalkuluei egiten dion ekarpen erlatiboa. Berretzailea aukeratzeko, aintzat hartu behar dira eremu bakoitzeko ezaugarri-mota bereizgarriak, edo kontuan hartu behar da, orobat, jendeak nola ezar ditzakeen kategoriak alor horretan. Hiriko Blokeak deritzon funtzioan, 1 berretzailea erabili da, ezaugarri bakoitzak bere kopuru osoa ekartzen duela ziurtatuz. Berretzailea handitu ahala, diferentzia handienak dituzten propietateen eragina areagotzen da.

Distantzia-funtzio geometriko

Distantzia-funtzio geometriko

1 eta 2 puntuen arteko distantzia honen araberakoa izango da: nola uztartzen dituen distantzia-funtzioak dimentsio bakoitzeko balioen arteko diferentziak (A

7.3.6.3 Antzekotasun-eredu transformazionalak

Eredu transformazionalen arabera, bi gauzen arteko antzekotasuna alderantziz proportzionala izango da beste faktore honekiko: zer neurrian den konplexua bi gauzetako bat bestea bihur dadin egin behar den eraldaketa. Antzekotasun-eredu transformazional sinpleenak zera zenbatzen du: zenbat ezaugarriren balioa aldatu beharko litzatekeen gauza bat bestea bilakatzeko. Maila orokorragoan, bi karaktere-kate ezberdinek pertsona, objektu edo entitate izendun berdina seinalatzen dutenean, eta hori zehaztu beharra dagoenean, bi kateen arteko «edizio distantzia» neur daiteke: zenbat aldaketa egin behar dira kateetako bat bestea bihur dadin.

7.3.6.4 Lerrokatzearen edo analogiaren antzekotasun-ereduak

Orain arte aipatu ditugun antzekotasun-ereduak ez dira oso baliagarriak baldin eta barne-egitura edo erlazio-egitura asko dauzkaten gauzak konparatu nahi baditugu. Halako kasuetan, ez da aski kalkuluak egitea bat datozen ezaugarrien artean; aitzitik, lerrokatzen diren ezaugarriak konparatu behar dira, betekizun berdina dutelako egituretan edo harremanetan. Adibidez, demagun auto batek gurpil berde bat daukala, eta kamioi batek, berriz, kolore berdineko kapota duela; bada, ezaugarria bat etorri arren, bi ibilgailuen arteko antzekotasuna ez da asko handituko, autoaren gurpila eta kamioiaren kapota ez direlako lerrokatzen. Bestalde, analogiari esker zera esan dezakegu: atomoak eguzki-sistemaren modukoak direla. Ez daukate ezaugarri komunik, baina bai harreman-mota bat, izan ere, bi-bietan baitaude objektu txikiagoak objektu handiago baten inguruan jira-biraka.

Halako konparazioak bereziki garrantzitsuak izaten dira arazoak konpontzeko garaian. Pentsatzekoa da adituak ederki moldatzen direla arazoak konpontzen nor beren arloan, beren jakintza eta esperientzia antolatu baitute halako moduan non efizientziaz bila baititzakete balizko konponbideak, bai eta ebaluatu ere. Adibidez, gauza jakina da xake-jokalari adituek beren memorian gordetzen dituztela aurreko partidetako posizio irabazleak eta horiei loturiko mugimenduak, eta hala erabakitzen dute zer jokaldi egin. Alabaina, xake-jokalari adituek, beren jakintza antolatzeko eta mugimenduak hautatzeko, oinarritzat hartzen dituzte zenbait antzekotasun abstraktu ezin direnak azaldu xake-piezen posizio zehatzen terminotan. Hortaz, adituek maila sakonagoan adierazten eta konpontzen dituzte arazoak, printzipio eta egitura abstraktuagoak erabiliz; bada, ideia hori hainbat arlotan errepikatu da. Hasiberriak, normalean, azaleko ezaugarrietan zentratzen dira, eta antzekotasun literalagoetan oinarritu.

7.3.7 Xedeetatik eratorritako kategoriak

Kategoriak sortzeko garaian, badago beste printzipio psikologiko bat: xede bat betetzeko bat datozen baliabideak antolatzea. Errepara diezaiogun, adibidez, «Sutan dagoen etxe batetik atera beharreko gauzak» kategoriari: Lawrence Barsalou zientziari kognitiboaren esanetan, kategoria ad hoc eta xedetik-eratorri baten adibidea da.

Su hartzeko arriskuan balego, zer gauza aterako zenituzke zeure etxetik? Bada, seguru asko, katua, diru-zorroa, agiri garrantzitsuak –hala nola jaiotza-egiaztagiriak eta pasaporteak–, amonaren argazki-album zaharra, eta inportantea, baliotsua edo ordezkaezina dela uste duzun beste edozein gauza, betiere eramangarria baldin bada. Item horiek ez dute ezaugarri komun hautemangarririk beren artean, zure jabetza baliozkoenak izatea salbu. Kategoria, beraz, testuinguru jakin batean sortzen da, xede jakin batetik eratorrita.

Gimnasioan erabiltzeko gau

Gimnasioan erabiltzeko gau

Toalla txiki batek, musika erreproduzitzeko gailuak eta entzungailuek, eta ur-botila batek ez dute ezaugarri komunik, baina batera doaz, hain zuzen ere, «gimnasioan ariketa fisikoa egin bitartean erabiltzen ditudan gauzak» kategoriako kideak direlako. (Argazkia: R. Glushko)

7.3.8 Teorian oinarrituriko kategoriak

Azkenik, kategoriak sortzeko beste printzipio psikologiko bat da baliabideak antolatzea halako moduan non teoria edo kontakizun batekin bat egiten baitute; teoria edo kontakizun horrek eragiten du kategorizazio jakin batek zentzua izan dezala. Batzuetan, probabilitate-kategorizazioak –zeinak oinarritzat hartzen baitu ezaugarri ikusgaien familia-antzekotasuna edo antzekotasuna–, bestelako kategorizazio bat iradokitzen du; hala ere, gerta daiteke teorian oinarrituriko kategoria gailentzea. Adibidez, fase-aldaketari buruzko teoriak azaltzen du zergatik duten urak, izotzak eta lurrunak konposizio-kimiko berdina, ezaugarri hautemangarriei dagokienez guztiz bestelakoak izan arren.

Jatorrian edo kausan oinarrituriko kategoriak bereziki garrantzitsuak dira baliabide adimentsuen eta konputazionalen kasuan, zeren, baliabide fisikoen mota naturalen kontrakarrean, beren propietateei zein portaerari buruzko kontuak apenas atzeman baitaitezke azaleko mailan (Ikus 3.4.1 atala: Potentzialtasuna eta Gaitasuna). Begira, bestela, zenbat tankera edo itxura ezberdin dituzten «ordenagailu» gisa kategorizatzen ditugun baliabideek: konputazioa egiten dute guzti-guztiek, baina printzipio hori ikusezina edo teorikoa da, eta ez da baliabideen ezaugarri fisikoen mendekoa.