6. Harremanak eta egiturak deskribatzea

Robert J. Glushko, Matthew Mayernik, Alberto Pepe, Murray Maloney

6.4 Ikuspegi lexikoa

Ikuspegi semantikoa dugu harremanak aztertzeko ikuspegi oinarrizkoa, baina loturik dago, modu intrintsekoan gainera, ikuspegi lexikoarekin, harremanak beti adierazten baitira hizkuntza zehatz bateko hitzak baliatuz. Adibidez, «janaria», «haragia» eta «behikia» kontzeptuen edo klaseen arteko harremanak ulertze aldera, «janaria», «haragia» eta «behikia» hitzak erabiltzen ditugu, gauza jangarrien klase gero eta txikiagoak identifikatzeko klase-hierarkia batean.

Kontzeptuaren eta hitzaren arteko lotura, ordea, ez da hain sinplea. Simpson familiaren adibidean, zeina kapitulu honen hasieran aipatu baikenuen, ohartu ginen hizkuntza bakoitzean hitz desberdinak erabiltzen direla ahaidetasun-harremanak adierazteko: ingelesez, aita esateko, «father» hitza erabiltzen da, eta, gaztelaniaz, berriz, «padre». Are gehiago, azpimarratu genuen ezen, hizkuntzen arabera, ahaidetasun-harremanen kontzeptuak berak aldatzen direla: esate baterako, txineraz, anaia-arreben adina aintzat hartzen da haiek izendatzeko garaian; ingelesez, ordea, ez dago halako ñabardurarik.

Horrek ez du esan nahi ingeles hiztunak ez direnik gai ahizpa zaharraren eta gaztearen artean bereizteko, baizik eta bereizkuntza hori ez dagoela lexikalizatua –ez du hitz bat bereizi bat osatzen–; txineraz, aldiz, hala da. Txineraren ikuspegitik, ingelesak hitz baten «hutsunea» du, eta, horri hutsune lexikoa esaten zaio. Zaila izaten da zehaztea noiz dagoen hutsune lexiko bat eta noiz ez, «hitz» kontzeptuaren esanahiaren araberakoa baita: hartz polarra eta itsas zaldia ez daude lexikalizaturik, baina esanahi-unitate bakar bat osatzen dute, ez baititugu desegiten eta harreman berri bat sortzen bi hitz bereizien esanahia uztartuz. Hizkuntza bakoitzak baditu bere «hutsune lexikoak»; «hutsune kontzeptual»ak, ordea, sortzetikoak eta unibertsalak izan daitezke –hutsune kontzeptual esaten zaie pentsatu edo zuzenean bizi ezin ditzakegun gauzei, hala nola grabitatearen indarrari–. Auzi horri helduko diogu 7. kapituluan, non «erlatibitate linguistikoa» deituko baitiogu.

Aurreko atal batean, baliabideak izendatzeari buruz hitz egin dugu (4.4.2 atala, Izendatzearen arazoak), bai eta baliabide-deskribapenetarako hiztegiak diseinatzeaz ere (5.3.1.3 atala, Helmena, eskala eta baliabideen deskribapena), azalduz ezen, antolaketa-sistemaren helmena eta eskala handitzen badira, funtsezkoa dela modu sistematiko eta zehatzagoan esleitzea izenak eta deskribapenak baliabideei. Zera ziurtatu behar dugu: baliabideak antolatzeko erabiltzen ditugun terminoek aski modu egokian islatzen dituztela baliabideen arteko antzekotasunak eta aldeak, hartara, posible izan dadin baliabideekiko elkarreragin-jarduerak gauzatzea. Kapitulu honetan, harreman semantikoak landu ditugu; horrenbestez, argiago ikus dezakegu zer behar den antzeko gauzak elkartzeko, gauza desberdinak bereizteko eta antolaketa-sistemaren beste edozein xede asetzeko.

Adibidez, autoak, autobusak, bizikletak eta lerak antolatu nahi baditugu, ibilgailuak dira denak, baina badago alde nabarmen bat: batzuk motorizatuak dira; besteak, aldiz, giza ahaleginarekin jartzen dira martxan. Era berean, erabilgarria suerta daiteke gurpildun ibilgailuak eta gurpilik gabeak bereiztea. Ez baditugu alde horiek aintzat hartzen, antolaketa-sistema desorekatu eta irregular bat baliatuko dugu ibilgailuen arloko semantika deskribatzeko. Ingelesez, «motorizatua» kontzeptua lexikalizatua dago, baina bigarren kasuan beste termino bat asmatu beharra dago, «gurpildun ibilgailua» deritzona.

Modu sinplean esanda, hitzak eraginkortasunez erabili behar ditugu antolaketa-sistemetan. Hori egiteko, tentuz mintzatu behar gara hitzen arteko harremanez eta hitzen eta kontzeptuen arteko loturez. Halako harremanei dagokionez, bi testuingururi erreparatu behar diogu:

6.4.1 Hitzen esanahien arteko harremanak

Hitzen esanahien artean, badira harreman-mota ugari; kasu askotan, eta ez da harritzekoa, kontzeptuen arteko harremanen antzekoak dira –6.3 atalean deskribatu genituen: Ikuspegi semantikoa–.

6.4.1.1 Hiponimia eta hiperonimia

Hitzek klase-inklusioaren bidez adierazitako bereizkuntza semantikoak kodetzen dituztenean, harreman horretako klase espezifikoenari hiponimoa esaten zaio, eta hura biltzen duen klase orokorragoari, berriz, hiperonimoa. George Miller-ek formula eredugarri bat iradoki zuen, hiponimoa zer den zehazteko; bere proposamenaren arabera, hiponimoa zera da: bere hiperonimoa, aurretik adjektibo bat edo atzetik perpaus erlatibo bat dakarrela, bere beste ko-hiponimoetatik bereizteko moduan. Ko-hiponimo esaten zaie hiperonimo beraren hiponimoen sailari, zeinak elkarrekiko baztertzaileak baitira.

hiponimoa = {adjektiboa +} hiperonimoa {bereizteko balio duen perpausa +}

Adibidez, txoriaren hiponimoa da txantxangorria, eta honela definitu genezake: «txori migratzaile bat, doinu melodiko bereizgarri bat kantatzen duena; papar gorria du, eta goialdean, berriz, luma grisak edo beltzak». Definizio horretan ez dira txantxangorrien ezaugarri guzti-guztiak biltzen, baina aski da txantxangorriak bereizteko usoetatik zein arranoetatik.

6.4.1.2 Metonimia

Zatia-osoa harreman semantikoek edo harreman meronimikoek badute baliokide lexikorik: metonimia; halako harremanetan, entitate batek biltzen duen zerbait edo haren parte den zerbait baliatzen da entitatea zer den adierazteko. Adibidez, herrialdeetako hiriburuak edo agintari nagusien bizilekuak sarritan erabiltzen dira gobernu osoaren metonimo gisa: «Etxe Zuriak gaur iragarri duenez…». Era berean, negozio-jardueren bilgune garrantzitsuak maiz erabiltzen dira industria osoaren metonimo bezala «Wall Street-i erreskatea eman diote berriro…».

6.4.1.3 Sinonimia

Sinonimia deritzo kontzeptu semantiko berdina adierazten duten hitzen arteko harremanari. Definizio zorrotzenaren arabera, sinonimoak dira «testuinguru jakin batzuetan elkar ordezko izan daitezkeen hitzak, testu osoaren esanahian aldaketa nabarmenik eragin gabe». Proba hori gainditzea, edonola ere, oso zaila da, salbu eta akronimoen edo termino konposatuen kasuan: «AEB», «Estatu Batuak» eta «Amerikako Estatu Batuak», adibidez, elkarren artean ordezkatzeko modukoak dira, zeharo.

Sinonimo gehienak, ordea, ez dira sinonimo absolutuak, baizik eta sinonimo proposizionalak. Sinonimo proposizionalak ez dira berdin-berdinak esanahiaren aldetik, baina aski baliokideak dira elkar ordezkatzeko, esaldiaren egiazko balioa aldatu gabe. Proba ahulago horren bidez, sinonimotzat har ditzakegu zenbait hitz, nahiz eta beren esanahien artean alde sotilak egon. Adibidez, Marge Simpsonen ilea urdina da, eta «urdina» eta «azula» sinonimo proposizionalak direnez, Marge Simpsonek ilea azula duela esanez gero, inor ez litzateke horren kontra agertuko.

Sinonimoen multzo ordenarik gabeko bati synset esaten zaio maiz (sinonimo-sortaren laburdura, ingelesez); termino hori, lehen aldiz, WordNet proiektuan erabili zen: George Millerrek abiatu zuen egitasmoa, 1985ean, Princeton unibertsitatean, «hiztegi semantiko» bat sortzeko asmoz. Proiektu horretan, ez zen ortografia erabiltzen hitzak antolatzeko printzipio nagusi gisa; aitzitik, hitzen ezaugarri eta harreman semantikoak erabiltzen ziren sare bat osatzeko, zeinak islatzen baitu hitzak eta kontzeptuak sistema banaezin bat direlako ideia. Synset delakoak elkarri loturik daude bai harreman semantikoen bai lexikoen bidez, beraz, bi espazioetan ibil daitezke.

6.4.1.4 Polisemia

Izendatzearen arazoez jardutean (4.4.2.2 atala: Homonimia, polisemia eta lagun aizunak), polisemia deritzon harreman lexikoa aipatu genuen, hitz batek hainbat esanahi izateari dagokiona. Adibidez, «bankua» izan daiteke hondar-bankua, dirua gordetzen den bankua zein egurrezko bankua.

6.4.1.5 Antonimia

Antonimia deritzo kontrako esanahia duten bi hitzen arteko harreman lexikoari. Antonimia harreman lexiko oso nabarmena da, eta, adjektiboei dagokionean, sinonimoak baino are indar handiagoa du. Hitzak lotzeko probetan, emandako hitza adjektibo arrunt bat denean, jende gehienak antonimo batekin lotzen du: «ona» hitza emanda, jendeak «txarra» esaten du, eta alderantziz. Sinonimiarekin gertatzen den moduan, antonimia guztiz zehatza bat batzuetan, eta graduak ditu beste batzuetan.

Kontrako antonimoak edo antonimo bitarrak zenbait testuingurutan erabiltzen dira, zeinetan hitz bat ala bestea erabil baitaiteke, baina biak, ordea, inoiz ez. Adibidez, «bizirik» eta «hilik» ezin dira sekula aldi berean erabili entitate baten egoera deskribatzeko, izan ere, bataren esanahiak bestearen esanahia baztertzen baitu, edo hari kontrajarria baitago.

Hitz-bikoteen arteko beste antonimia-harreman batzuk ez dira hain zorrotzak semantikoki, zeren, batzuetan, testuinguru berdinean ager baitaitezke, hitzetako baten helmen semantikoa zabalagoa delako. «Luze» eta «labur» hitzek tamaina jakin batzuk iradokitzen dituzte; halere, «zenbateko luzera du?» galdetu daiteke, objektiboki laburrak diren baliabideen harira.

6.4.2 Thesaurusak

Jendeak, baliabideak deskribatzen dituenean, zenbait hitz erabiltzen ditu berez, eta hitz horietan islatzen dira pertsonen esperientziak eta ikuspegiak; horrenbestez, jendeak hitz ezberdinak erabiltzen ditu baliabide berdinaz jarduteko, eta hitz berdinak, berriz, baliabide ezberdinentzat. Hiztegiaren arazoari aurre egiteko (4.4.2.1 atala: Hiztegiaren arazoa), konponbide partzial bat izan daiteke jendeari laguntzea hiztegi kontrolatu bateko deskribapen-hitzak hautatzen, eta hori gero eta funtsezkoagoa bihurtzen da antolaketa-sistemaren helmena eta eskala hazi ahala. Thesaurusak erreferentzia-lanak dira, zeinetan hitzak antolatzen baitira beren harreman semantikoen zein lexikoen arabera. Profesionalek, baliabideak deskribatzean, sarritan erabiltzen dituzte thesaurusak.

Eremu eta gai-arlo ugaritarako sortu dira thesaurusak. Thesaurus batzuk zabalak dira oso, eta hainbat diziplinatako hitzak biltzen dituzte: horra hor, adibidez, Kongresuko Liburutegiko Gai Sarrerak (LOC-SH), argitaraturiko eduki oro sailkatzeko erabiltzen direnak. Badira beste thesaurus batzuk, barra-barra erabiltzen direnak, hala nola Artearen eta Arkitekturaren Thesaurusa (AAT), Getty Trust deritzon elkarte filantropikoak garatua, eta Indexatze Legegilearen Hiztegia, Kongresuko Liburutegiak garatua.

Janariaren harira egin dugun taxonomia sinplera itzul gaitezke, thesaurusaren funtzionamendua ikusteko, hau da, nola eransten dizkien harreman lexikoak zein semantikoak hiztegi terminoei. Hiperonimia eta hiponimia harremanak adierazteko, kode hauek erabiltzen dira, TZ («termino zabalagoa») eta TH («termino hertsiagoa»):

Janaria TZ Haragia
Behikia TH haragia

Thesaurusetako TZ eta TH harremanek hitz-sistema hierarkiko bat osatzen dute; nolanahi ere, thesaurusa ez da eremu bati dagokion taxonomia lexiko hutsa, harreman lexiko gehigarriak ere kodetzen baititu, hitz garrantzitsuenen harira. Thesaurus askotan hitz gakoen harreman-multzoa nabarmentzen da, eta garrantzia kentzen zaio, ostera, hierarkia lexiko orokorrari.

6.4.3 Hitzen formen arteko harremanak

Hitzen formen arteko harremanek berebiziko garrantzia dute. Baliabide-deskribapenak sortzen, uztartzen edo alderatzen ditugun aldiro, arretaz erreparatu behar diegu hitz-formen arteko harremanei. Harreman horien abiapuntuan, honako ideia hau dago: hizkuntza natural guztiek osatzen dituzte hitzak eta hitz-formak, unitate txikiagoetan oinarrituz. Hitzen eraikuntza-bloke oinarrizkoei morfema esaten zaie: kontzeptu semantikoak adieraz ditzakete (erroak izendatzen ditugu), bai eta kontzeptu abstraktuak ere (hala nola «ahalera» edo «plurala»). Morfologia deritzo hizkuntzek morfemak uztartzeko dituzten moduen analisiari.

Hona hemen adibide sinple batzuk:

«etxeak» = «etxe» (erroa) + «ak» (plurala)
«ezberdina» = «des» (antonimia adierazten duen aurrizkia) + «berdina» (erroa)
«egingarri» = «egin» (erroa) + «garri» (ahalera adierazten duen atzizkia)

Hizkuntzaren analisi morfologikoa barra-barra erabiltzen da testuen prozesamenduan, informazioaren berreskurapenerako indexak sortzeko xedez. Adibidez, eratorpena prozesu morfologiko bat da, zeinak aurrizkiak eta atzizkiak kentzen baititu, hitzaren erroa agerian uzteko (10. kapituluan aztertuko dugu xeheago). Era berean, testuak prozesatzeko aplikazio sinpleek, hala nola puntuazioa eta ortografia zuzentzen dutenek, erroen eta arauen arabera ebazten dituzte hitz-formei dagozkien arazoak, neurriari dagokionez egingarriagoa eta koherenteagoa baita hala egitea, hitzen zerrendak erabiltzea baino. Sarritan, hitz arruntak (adibidez, «haurra») gutxiago erabiltzen diren hitzekin nahasten ditugu (adibidez, «ahurra»), baina, bi hitzak existitzen direnez, nor bere esanahiarekin, ez da komeni «ahurra» sartzea gaizki idatzitako hitzen zerrenda batean. Gainera, hizkuntza naturalak sortzaileak direnez berez, hitz berriak eratzen dituzte etengabe; hori dela-eta, hitzen zerrendak ezin dira inoiz guztiz osoak izan: ingelesaren kasuan, testu batean «flikcr» hitza agertzen bada, bi gauza izan liteke: baliteke erabiltzaileak «flicker» aditza gaizki idatzi izana (kliskatu edo dir-dir egin esan nahi du aditz horrek), edo, ostera, argazkiak partekatzeko webgune famatu bati erreferentzia egitea, egoki.

6.4.3.1 Eratorpen-morfologia*

Eratorpen-morfologiak zera aztertzen du: nola sortzen diren hitzak, morfemak uztartuz. Hitz-elkarketa, hau da, bi «morfema aske» elkartzea, mekanismo indartsua da oso; hona bi adibide: «suhiltzaile» eta «trenbide». Hitz elkartu batzuen esanahia aise asko ulertzen da baldin eta lehen morfemak bigarrenaren esanahia mugatzen edo taxutzen badu, adibidez «mendikate». Nolanahi ere, hitz elkartu asko ez dira modu literalean eratortzen bere osagaien esanahiari erreparatuta: «bidegorriak» bizikletentzako bideak dira, baina ez dira beti kolore horretakoak.

Badira, orobat, beste eratorpen-mota batzuk, «lokailu» gisako morfemak erabiltzen dituztenak, eta arau zehatz batzuen arabera uztartzen direnak «oinarri» morfemekin. Aurrizkiak eta atzikiak «lokailu» morfema ohikoenak dira: beste hitz bati eransten zaizkionean, beste kategoria gramatikal bateko hitzak sortzen baitituzte normalki.

6.4.3.2 Flexio-morfologia

Flexio-mekanismoen bidez (deklinabidea eta konjugazioa), hitzen forma aldatzen da aditzaren jokaera, aspektua edo bestelako informazio gramatikala adierazteko. Eratorpenak ez bezala, flexioak ez du aldatzen morfema-oinarriaren kategoria gramatikala. Flexio-morfologia barra-barra erabiltzen da euskaraz, beste hizkuntza batzuetan baino gehiago.


* Itzultzailearen oharra: Euskaraz, aurrizki gutxi daude: horietako bi, «ez» eta «ber/bir». Atzizkiei dagokionez, hona adibide batzuk: «gile», «tegi», «lari» «tar» eta «tasun». Hitz-elkarketa eta atzizkiak zein aurrizkiak gehitzea mekanismo sinple-sinpleak dira, nolanahi ere, hitz oso konplexuak sortu nahi badira, hala nola «irudikaezintasuna», mekanismo bat baino gehiago uztar daiteke horretarako.