7. Kategorizazioa: Baliabide-klaseak eta -motak deskribatzea

Robert J. Glushko, Rachelle Annechino, Jess Hemerly, Robyn Perry, Longhao Wang

7.6 Zazpigarren kapituluko gakoak

  • Kategoriak baliokidetasun-klaseak dira, hau da, berdin tratatzen ditugun gauzen edo entitate abstraktuen sortak edo multzoak. (Ikus 7.2 atala: Kategoriak: zer eta zergatik)
  • Hautatzen ditugun propietateen edo ezaugarrien araberakoa izango da baliokidetasun-klasearen neurria. (Ikus 7.2 atala: Kategoriak: zer eta zergatik)
  • Kategorizazio kulturalean, indibidualean eta instituzionalean badira oinarrizko ideia batzuk, baina kategoria-modu horietako bakoitzak prozesu eta xede ezberdinak nabarmentzen ditu kategorien sorrerari dagokionean. (Ikus 7.2 atala: Kategoriak: zer eta zergatik)
  • Kategoria indibidualak berariazko jardueretatik sortzen dira, egoera jakin bati erantzuteko helburua dutenak normalean. (Ikus 7.2.2 atala: Kategoria indibidualak)
  • Kategoria instituzionalak, gehien-gehienetan, eremu abstraktuetan sortzen dira, informazioa barra-barra erabiltzen den arloetan, zeinean premiazkoak baitira kategoria zehatzak eta ez-anbiguoak. (Ikus 7.2.3 atala: Kategoria instituzionalak)
  • Kategoria instituzionalen zehaztapen zorrotzak sailkapena ahalbidetzen du: baliabideak modu sistematikoan esleitzea antolaketa-sistema bateko kategoriei. (Ikus 7.2.3 atala: Kategoria instituzionalak)
  • Baliabideen kopurua edo baliabideekin loturiko deskribapen- edo iruzkin-kopurua hain denean handia non jendeak ezin baitu eraginkortasunez aztertu, kategoria konputazionalak eratzen dira, ordenagailu-programen bitartez. (Ikus 7.2.5 atala: Kategoria konputazionalak)
  • Ikaskuntza ikuskatuan, ikaskuntza automatikoko programa bati itemen edo dokumentuen adibideak ematen zaizkio, kategorien arabera sailkatuak, eta, horrela, programak ikasten du item berriak kategoria egokian sailkatzen. Ikaskuntza ez-ikuskatuan, programak item berdinak jasotzen ditu, baina bere kabuz sortu behar ditu kategoriak. (Ikus koadro gehigarria: Ikaskuntza ikuskatua eta ez-ikuskatua)
  • Baliabideen bilduma batek identifikatzaile alfabetikoak edo numerikoak baditu, ordenaren printzipioaren arabera antola daitezke baliabide horiek. (Ikus 7.3.2 atala: Propietate bakunak)
  • Propietate bakar bat erabiltzen bada sorta bateko baliabideak bereizteko edo antolaketa-sistema bateko kategoriak eratzeko, propietatearen hautaketak berebiziko garrantzia du, izan ere, propietate bakoitzak bere kategoriak sortuko baititu. (Ikus 7.3.2 atala: Propietate bakunak)
  • Antolaketa-erabakien sekuentzia bat erabiltzen bada, ordena finko batean, baliabide-ezaugarriei dagokionez, hierarkia bat sortzen da, hots, hainbat mailatako kategoria-sistema bat. (Ikus 7.3.3.1 atala: Hainbat mailako kategoriak edo kategoria hierarkikoak)
  • Kategoria beharrezkoei eta nahikoei dagokienez, badute ondorio garrantzitsu bat: kategoriako kide guztiak dira kategoriaren adibide egokiak neurri berean. (Ikus 7.3.3.3 atala: Ezaugarri beharrezkoak eta nahikoak)
  • Helburu praktikoei helduta, informazio-baliabide baten propietate erabilgarriena zera da: zeri buruzkoa den; baliteke ezaugarri zehatz hori zuzenean hauteman ezin izatea, eta zaila da, oso, hura ezaugarritzea. (Ikus 7.3.4 atala: Ezaugarrietan oinarrituriko kategorizazioaren mugak)
  • Zenbait arlotan, ezaugarriak ezin badira bereizi edo hauteman, edo ez direnean beharrezkoak, probabilitatearen edo estatistikaren arabera aztertu behar dira propietateak, baldin eta kategoriak sortu nahi badira. (Ikus 7.3.5 atala: Probabilitate-kategoriak eta «Familia antzekotasuna»)
  • Kategoria bateko kideek ezaugarri batzuk badituzte komunean, baina ez guztiak, familia-antzekotasuna deritzona sortzen da haien artean. (Ikus 7.3.5 atala: Probabilitate-kategoriak eta «Familia antzekotasuna»)
  • Antzekotasuna kalkulatzeari dagokionez, badira lau ikuspegi, psikologiak sustatuak, funtzio bana proposatzen dutenak: ezaugarri edo propietateetan oinarrituriko ikuspegia, geometrian oinarrituriko ikuspegia, eraldaketari dagokion ikuspegia eta lerrokatzean edo analogian oinarrituriko ikuspegia (Ikus 7.3.6 atala: Antzekotasuna)
  • Kategoria klasikoak zehatz-mehatz definitu daitezke propietate nahiko eta beharrezko banaka batzuekin. (Ikus 7.4.2 atala: Kategoria oinarrizkoak edo naturalak)
  • Kategoria zabalagoek edo xehetasun gutxiago dutenek estaldura handiagotzen dute, eta doitasuna gutxiagotzen. (Ikus 7.4.3 atala: Estalduraren / Doitasunaren konpentsazioa)
  • Erabaki-zuhaitz sinpleak algoritmoak dira, zeinek erabaki bat zehazten baitute, ezaugarri-proba edo proba logikoen sekuentzia bat eginez. (Ikus 7.5.2 atala: Ezaugarri bidez zehazturiko kategoriak inplementatzea)
  • Ezaugarri bidez zehazturiko kategorien inplementazio kontzeptualki sinpleenak eta zuzenenak kategorien ikuspegi klasikoari heltzen dio, ezaugarri beharrezkoetan eta nahikoetan oinarritzen denari, alegia. (Ikus 7.5.2 atala: Ezaugarri bidez zehazturiko kategoriak inplementatzea)
  • Hizkuntza artifizialek zehatz-mehatz adierazten dituzte ideiak: ideia konplexuak adierazteko, termino edo sinbolo berriak txertatzen dituzte, eta, horrez gainera, mekanismo sintaktikoak ere baliatzen dituzte, termino horiek uztartzeko eta erabiltzeko. (Ikus 7.5.2 atala: Ezaugarri bidez zehazturiko kategoriak inplementatzea)
  • Naif Bayes sailkatzaileek klasearen eta propietateen oinarri-ratioak ikusten dituzte prestakuntza-datuetan, eta orobat ikusten dute zer probabilitate dagoen klaseko kide batek ezaugarri bat izan dezan; gero, ikasteko, propietate bakoitzaren probabilitate baldintzazkoa berrikusten dute. (Ikus 7.5.3.2 atala: Naif Bayes sailkatzaileak)
  • Taldekatze-teknikek –ez baititu inork ikuskatzen– baliabideen arteko antzekotasunak kalkulatzen dituzte, eta hala sortzen dituzte kategoriak; beraz, kategoria baten barruan dauden baliabideen antzekotasuna maximizatzen dute, eta kategoria batetik bestera dagoen antzekotasuna minimizatu. (Ikus 7.5.3.3 atala: Taldekatze bidez sorturiko kategoriak)