7. Kategorizazioa: Baliabide-klaseak eta -motak deskribatzea
Robert J. Glushko, Rachelle Annechino, Jess Hemerly, Robyn Perry, Longhao Wang
7.6 Zazpigarren kapituluko gakoak
Kategoriak baliokidetasun-klaseak dira, hau da, berdin tratatzen ditugun gauzen edo entitate abstraktuen sortak edo multzoak.
(Ikus 7.2 atala: Kategoriak: zer eta zergatik)
Hautatzen ditugun propietateen edo ezaugarrien araberakoa izango da baliokidetasun-klasearen neurria.
(Ikus 7.2 atala: Kategoriak: zer eta zergatik)
Kategorizazio kulturalean, indibidualean eta instituzionalean badira oinarrizko ideia batzuk, baina kategoria-modu horietako bakoitzak prozesu eta xede ezberdinak nabarmentzen ditu kategorien sorrerari dagokionean.
(Ikus 7.2 atala: Kategoriak: zer eta zergatik)
Kategoria indibidualak berariazko jardueretatik sortzen dira, egoera jakin bati erantzuteko helburua dutenak normalean.
(Ikus 7.2.2 atala: Kategoria indibidualak)
Kategoria instituzionalak, gehien-gehienetan, eremu abstraktuetan sortzen dira, informazioa barra-barra erabiltzen den arloetan, zeinean premiazkoak baitira kategoria zehatzak eta ez-anbiguoak.
(Ikus 7.2.3 atala: Kategoria instituzionalak)
Kategoria instituzionalen zehaztapen zorrotzak sailkapena ahalbidetzen du: baliabideak modu sistematikoan esleitzea antolaketa-sistema bateko kategoriei.
(Ikus 7.2.3 atala: Kategoria instituzionalak)
Baliabideen kopurua edo baliabideekin loturiko deskribapen- edo iruzkin-kopurua hain denean handia non jendeak ezin baitu eraginkortasunez aztertu, kategoria konputazionalak eratzen dira, ordenagailu-programen bitartez.
(Ikus 7.2.5 atala: Kategoria konputazionalak)
Ikaskuntza ikuskatuan, ikaskuntza automatikoko programa bati itemen edo dokumentuen adibideak ematen zaizkio, kategorien arabera sailkatuak, eta, horrela, programak ikasten du item berriak kategoria egokian sailkatzen. Ikaskuntza ez-ikuskatuan, programak item berdinak jasotzen ditu, baina bere kabuz sortu behar ditu kategoriak.
(Ikus koadro gehigarria: Ikaskuntza ikuskatua eta ez-ikuskatua)
Baliabideen bilduma batek identifikatzaile alfabetikoak edo numerikoak baditu, ordenaren printzipioaren arabera antola daitezke baliabide horiek.
(Ikus 7.3.2 atala: Propietate bakunak)
Propietate bakar bat erabiltzen bada sorta bateko baliabideak bereizteko edo antolaketa-sistema bateko kategoriak eratzeko, propietatearen hautaketak berebiziko garrantzia du, izan ere, propietate bakoitzak bere kategoriak sortuko baititu.
(Ikus 7.3.2 atala: Propietate bakunak)
Antolaketa-erabakien sekuentzia bat erabiltzen bada, ordena finko batean, baliabide-ezaugarriei dagokionez, hierarkia bat sortzen da, hots, hainbat mailatako kategoria-sistema bat.
(Ikus 7.3.3.1 atala: Hainbat mailako kategoriak edo kategoria hierarkikoak)
Kategoria beharrezkoei eta nahikoei dagokienez, badute ondorio garrantzitsu bat: kategoriako kide guztiak dira kategoriaren adibide egokiak neurri berean.
(Ikus 7.3.3.3 atala: Ezaugarri beharrezkoak eta nahikoak)
Helburu praktikoei helduta, informazio-baliabide baten propietate erabilgarriena zera da: zeri buruzkoa den; baliteke ezaugarri zehatz hori zuzenean hauteman ezin izatea, eta zaila da, oso, hura ezaugarritzea.
(Ikus 7.3.4 atala: Ezaugarrietan oinarrituriko kategorizazioaren mugak)
Zenbait arlotan, ezaugarriak ezin badira bereizi edo hauteman, edo ez direnean beharrezkoak, probabilitatearen edo estatistikaren arabera aztertu behar dira propietateak, baldin eta kategoriak sortu nahi badira.
(Ikus 7.3.5 atala: Probabilitate-kategoriak eta «Familia antzekotasuna»)
Kategoria bateko kideek ezaugarri batzuk badituzte komunean, baina ez guztiak, familia-antzekotasuna deritzona sortzen da haien artean.
(Ikus 7.3.5 atala: Probabilitate-kategoriak eta «Familia antzekotasuna»)
Antzekotasuna kalkulatzeari dagokionez, badira lau ikuspegi, psikologiak sustatuak, funtzio bana proposatzen dutenak: ezaugarri edo propietateetan oinarrituriko ikuspegia, geometrian oinarrituriko ikuspegia, eraldaketari dagokion ikuspegia eta lerrokatzean edo analogian oinarrituriko ikuspegia
(Ikus 7.3.6 atala: Antzekotasuna)
Kategoria klasikoak zehatz-mehatz definitu daitezke propietate nahiko eta beharrezko banaka batzuekin.
(Ikus 7.4.2 atala: Kategoria oinarrizkoak edo naturalak)
Kategoria zabalagoek edo xehetasun gutxiago dutenek estaldura handiagotzen dute, eta doitasuna gutxiagotzen.
(Ikus 7.4.3 atala: Estalduraren / Doitasunaren konpentsazioa)
Erabaki-zuhaitz sinpleak algoritmoak dira, zeinek erabaki bat zehazten baitute, ezaugarri-proba edo proba logikoen sekuentzia bat eginez.
(Ikus 7.5.2 atala: Ezaugarri bidez zehazturiko kategoriak inplementatzea)
Ezaugarri bidez zehazturiko kategorien inplementazio kontzeptualki sinpleenak eta zuzenenak kategorien ikuspegi klasikoari heltzen dio, ezaugarri beharrezkoetan eta nahikoetan oinarritzen denari, alegia.
(Ikus 7.5.2 atala: Ezaugarri bidez zehazturiko kategoriak inplementatzea)
Hizkuntza artifizialek zehatz-mehatz adierazten dituzte ideiak: ideia konplexuak adierazteko, termino edo sinbolo berriak txertatzen dituzte, eta, horrez gainera, mekanismo sintaktikoak ere baliatzen dituzte, termino horiek uztartzeko eta erabiltzeko.
(Ikus 7.5.2 atala: Ezaugarri bidez zehazturiko kategoriak inplementatzea)
Naif Bayes sailkatzaileek klasearen eta propietateen oinarri-ratioak ikusten dituzte prestakuntza-datuetan, eta orobat ikusten dute zer probabilitate dagoen klaseko kide batek ezaugarri bat izan dezan; gero, ikasteko, propietate bakoitzaren probabilitate baldintzazkoa berrikusten dute.
(Ikus 7.5.3.2 atala: Naif Bayes sailkatzaileak)
Taldekatze-teknikek –ez baititu inork ikuskatzen– baliabideen arteko antzekotasunak kalkulatzen dituzte, eta hala sortzen dituzte kategoriak; beraz, kategoria baten barruan dauden baliabideen
antzekotasuna maximizatzen dute, eta kategoria batetik bestera dagoen antzekotasuna minimizatu.
(Ikus 7.5.3.3 atala: Taldekatze bidez sorturiko kategoriak)