5. Baliabideen deskribapena eta metadatuak
Robert J. Glushko, Kimra McPherson, Ryan Greenberg, Robyn Perry, Matthew Mayernik, Graham Freeman, Carl Lagoze
5.4 Baliabide ez-testualak deskribatzea
Baliabideen deskribapenerako metodo eta printzipio asko formatu fisikoetako testu-baliabideak deskribatzeko eratu ziren. Printzipio horiek, denborarekin, garatu egin dira, jendeak deskribatu eta antolatu nahi dituen baliabide-mota askotarikoekin bat egiteko (margolan eta estatuetatik hasi eta MP3, JPEG eta MPRG artxiboetaraino).
Baliabide ez-testualen deskribapen batzuk testuan oinarritzen dira, eta, gehienetan, jendeak esleitzen ditu. Beste deskribapen batzuk formatu ez-testualetan daude eta algoritmo bidez erauzten diren baliabide ez-testualaren edukitik. Azken horien kasuan, ezaugarri intrintseko teknikoak atzitzen dituzte, eta, eremu batzuetan, gai dira baliabidea zeri buruzkoa den azaltzeko zehaztasun-maila batekin, ikasketa automatikoan egindako aurrerakuntzei esker.
5.4.1 Museoetako baliabideak eta baliabide artistikoak deskribatzea
Multimedia baliabideak deskribatzeari dagozkion arazoak ez dira, inondik ere, berriak. Museotako kuradoreak halako arazoekin borrokan ibili dira duela hainbat mendetatik, hain zuzen artefaktuak biltzen, gordetzen eta deskribatzen hasi zirenetik. Baliteke baliabide batzuk lan beraren parte izatea (esaterako, zeramika-puska batzuk, noizbait, pitxer beraren parte izango ziren). Materialek eta formek ez dakarte berezko semantikarik. Ikerketa eta deskribapen gehiago egiten ez badugu, ez dugu ezer jakingo pitxerrari buruz, ez baitakar azalik edo etiketarik, IX. mendeko maia kokagune batekin lortzen duenik. Museoek, kolpe bakarrean, artefaktuen sorta handiak eskura ditzakete; horregatik, erabaki beharra dute zer baliabide deskribatzeko modua duten, eta zenbat deskriba ditzaketen.
Erwin Panofsky arte-historialari alemanak kodetu zuen estreinako aldiz halako deskribapen-arazoei heltzeko hurbilketa bat. Studies in Iconology izeneko lan klasikoan, deskribapenaren hiru maila zehaztu zituen, artelan bati edo museo bateko artefaktuei aplikatu ahal zaizkionak.5.6 marrazkian –Artelan baten deskribapen ezberdinak– hiru maila horiek alderatzen dira, marmolezko eskultura bat adibidetzat hartuta. Halaber, agerian uzten du zeharo ezberdinak direla estatuaren argazki digitalaren EXIF deskribapena eta jendeak egindako deskribapenak.
5.6 Artelan baten deskribapen ezberdinak
Artelanen deskribapenak oso ezberdinak izan daitezke elkarren artean; ezberdintasun horiek bereziki nabarmenak izango dira gailuek egindako deskribapenak –kamera digitalek egindakoak, adib.– eta jendeak egindako deskribapenak alderatzen baditugu. Bestalde, jendeak egindako deskribapenen artean ere badira aldeak, sortzailearen trebeziaren arabera, eta kontuan hartuta, orobat, zer neurritan baliatu duen interpretazio subjektiboa deskribapena egiteko orduan. (Argazkia: R. Glushko. Estatua «Venus» deitzen da; Lucio Carusik egin zuen, zeina Carrara-koa baitzen (Italia). Gaur egun, bilduma pribatu batean dago).
5.4.2 Irudiak deskribatzea
Kamera digitalek –mugikorretakoek barne– milioika argazki egiten dituzte egunean, baina argazki horiei buruz ez da deskribapen asko egiten –museo eta galerietako irudien kasuan ez bezala–, gailuak berak egindakoaz aparte. Dena den, argazkietako batzuek deskribapen mugatuak jasotzen dituzte Facebook, Instagram, Flickr, Picasa, DeviantArt edo antzekoetan, non jendeak bere argazkiak partekatzen baititu; irudietarako aplikazio profesionaletan ere jasotzen dute deskribapenen bat –Light Room aplikazioan, kasu–. Webgune horiek guztiek erraztasun batzuk eskaintzen dizkiete erabiltzaileei hartara irudiei etiketak eslei diezazkieten edo taldetan antola ditzaketen izenburuekin.
Era askotako hurbilketa konputazionalak erabili dira irudiak deskribatzeko edo sailkatzeko. Hurbilketa batek, esaterako, irudiaren sinadura bisuala erauzten du behe-mailako ezaugarriak kontuan hartuz –kolorea, forma, testua eta argitasuna–; ondoren, horien bitartez identifikatzen dira eremu eta objektu esanguratsuak. Irudien arteko antzekotasunak konputatzen dira, eta, horien bidez, antzeko kolore-, objektu- eta inguru-motak dituzten irudien kategoriak sortzen; horrela, errazagoa suertatzen da argazkien kopiak edo aldatutako argazkiak aurkitzea.
Ordenagailuek objektu edo pertsona zehatzak identifika ditzaten argazkietan, beharrezkoa da, noski, ordenagailuak horretarako prestatzea jada identifikatuta dauden argazkiekin. 2005ean, Luis van Ahn-ek modu adimentsu bat diseinatu zuen etiketatutako irudien kopuru handiak biltzeko: Interneten oinarritutako jolas bat sortu zuen, ESP izenekoa, zeinak bi pertsona elkartzen baitzituen ausaz, etiketak proposatu zitzaten irudi batentzat. Ageriko hautuak kendu egin ziren: irudi batean txori bat agertzen bazen zeru urdinean hegan, hitz onargarrien artetik aurrez ezabatuko zituzten «txori» eta «zeru» hitzak; hala, erabiltzaileek «hegan» edo «oskarbi» gisako hitzak proposatzen zituzten. Van Ahnek asmatu zuen, halaber, reCAPTCHA deritzon teknika: digitalizatzeko bidean dauden liburu zaharren argazkiak erakusten ditu; horrela, digitalizazioaren zehaztasuna hobetzen da, eta, aldi berean, egiaztatzen da webgunea erabiltzen ari dena pertsona bat dela eta ez programa robot bat.
Nolanahi ere, baldin eta testu-deskribapen laburrak eta argazkien behe-mailako ezaugarriak badira irudi bat bereizten erakusteko dauzkagun ezaugarri bakarrak, oso zaila izango da antzekoak diruditen objektuak bereiztea, adibidez, otso zuriak eta samoiedo txakurrak bereiztea –otsoaren tankera duten txakur zuriak–, izan ere, eragin handia izango baitu objektuen posizioak, orientazioak edo argiztapenak, nahiz eta, osterantzean, aldagai horiek munta txikikoak izan. Arazo hori konpontzeko, sare neural sakonak erabil daitezke: horien arabera, irudien behe-mailako ezaugarriak uztartu egin daitezke goi-mailako ezaugarrien geruza askorekin: ertzek, adibidez, motiboak eta patroiak osatzen dituzte; patroiek, berriz, zatiak edo objektu ezagunak, eta zatiek, azkenik, objektuen osotasuna osatzen dute. Konposizio hierarkiko horren bidez, behe-mailako aldaerek ez dute eraginik maila goreneko errepresentazioetan, beste ikuspegi batzuetan ez bezala.
2012an, milioika irudi biltzen zituen datu-sorta bat hartu zuten, zeinean milaka objektu-kategoria ezberdin baitzeuden, eta ikaskuntza sakoneko teknikak aplikatu zituzten horien gainean: akats-ratioa erdira murriztu zen. Aurrerakuntza miresgarri horren ondorioz, eta kontuan hartuz input-datuetatik ezaugarri-geruzak eratortzen dituzten ikaskuntza sakoneko teknikak guztiz orokorrak direla, ikaskuntza sakona berehala aplikatu zitzaion beste eremu askori non dimentsio handiko datuak biltzen baitira. Facebookek ikaskuntza sakona erabiltzen du argazkietan jendea identifikatzeko; Googlek, berriz, hizkera ezagutzeko eta hizkuntza itzultzeko; gainera, irudien eta bideoen goiburuak azkar sortzeko lanean ari da. Soinean eraman daitezkeen ordenagailuen kasuan, ikaskuntza sakona erabil dezakete informazio erabilgarria gehitzeko jendeak munduari buruz duen ikuspegiari, errealitate areagotua sortuz denbora errealean.
5.4.3 Musika deskribatzea
Kantu bat deskribatzeari dagokionez, testu bat deskribatzearen paretsua izan daiteke alderdi batzuetan: aipatuko dituzu kantariaren edo kantuaren idazlearen izena, kantuaren iraupena edo agertu zen diskoaren izena. Baina zer esan zenezake baldin eta kantuaren edukia bera deskribatu nahi bazenu? Letra idatz zenezake, noski, baina musika bera deskribatzeko beste ikuspegi bat behar da.
Musikaren deskribapenak berekin dakartza zenbait erronka, testuak edo irudiak deskribatzean sortzen direnak ez bezalakoak. Poemak eta margolanak gauza ukigaiak dira, aztertu eta behatu ditzakegunak; musika, berriz, aura baten modukoa da, fenomeno iheskor bat, zeina gauzatzen den unean bakarrik esperimentatu baitaiteke. Pieza eta grabaketa musikalak ukigaiak dira, noski, margolanak eta poemak bezainbeste; hala ere, edukiontziak dira egiaz: esperientzia musikalaren potentziala gordetzen dute, ez musika bera. Musika pop garaikideari dagokionez, gehiena kantu forman emana da: testuak melodia batean kantatzen dira, harmonia instrumentalek lagunduta. Halako musika kategorizatu edo deskribatu nahi badugu haren eduki lirikoa deskribatuz, testuak deskribatzeko metodoetara jo dezakegu oraindik ere. Ostera, musika bera deskribatu nahi badugu, bestelako ikuspegi bati heldu behar diogu.
DJ batek honela deskribatu eta antolatu du bere musika
Musikazaleek, beharbada, kantuen edo kantarien izenak erabiliko dituzte musika deskribatzeko; antolatzeko, berriz, genero musikalak erabiliko dituzte, hala nola «pop», «rock» eta «klasikoa». Nolanahi ere, DJ profesional batek, beste ezaugarri batzuk nabarmenduko ditu, bereziki, minutu bakoitzeko aldi-kopurua.
Argazki honetan oharretan ikusgai duzue «Kid Kameleon» DJ sonatuaren musika-bildumaren zati bat (http://kidkameleon.com/ ).(Argazkia eta oharrak: Matt Earp. Baimenarekin erabilia).
Multimedia arloan dabiltzan pertsona eta enpresa ugarik kantuak deskribatzeko hainbat prozesu aztertu dituzte. Tresna teknologikoei erreparatuta, zenbait aplikaziok, hala nola Shazam-ek edo Midomi-k, musika-pusketatxo batetik abiatuta, audio hatz-marka bat era dezakete edukian oinarriturik. Audio hatz-markak musika-pieza baten deskribapen digitala ematen du: ordenagailu batek hori hartu eta interpretatu dezake, edo liburutegi bateko beste deskribapen digital batzuekin alderatu.
Musikaren streaming-zerbitzuek, itxuraz behintzat, musika-sailkapenaren eta -deskribapenaren gailurra islatzen dute. Pandora aplikazioan, esaterako, badira musikologo adituak, zeinak arduratzen baitira musika entzuteaz eta, ondoren, generoak eta material musikalak kategorizatzeaz, goi-mailako hiztegi kontrolatu musikala erabiliz. Hala, algoritmo bat sortu dute, «Music Genome» (Genoma Musikala) izenekoa: algoritmo hori gai da entzule baten zaletasunak definitzen ikasteko, hark erabilitako etiketa musikaletan oinarrituz, eta gai da, orobat, informazio hori erabiliz antzeko musika gomendatzeko.
Baina musikariak mendetan jardun dira musika deskribatzeko moduez hausnartzen, eta Genoma Musikalak konplexutasun itzela duen arren, horren jatorrian dauden metodoak, musika «paper eta boligrafoz» deskribatzeko modu zaharrak, askoz sofistikatuagoak dira. Esan liteke ezen etnomusikologiak (zabal esanda, mundu-mailako musika-praktikak aztertzen dituen arloa, beren testuinguru sozialak aintzat hartuz) aurrerakuntza handiagoak egin dituela musika-baliabideen deskribapen osoak sortzeko bidean, musikologiako beste edozein adarrek baino. XIX. mendearen amaieratik aurrera, etnomusikologoek notaziorako metodo konplexuak eta taxonomia estilistiko aberatsak eratu dituzte hala mendebaldeko nola mendebaldetik kanpoko musikak atzitzeko eta kategorizatzeko.
Ñabarduren mailara etorrita, musikariek modu berritzaileak topatzen dituzte, etengabe, musika kategorizatu, deskribatu eta aztertzeko; gainera, ez dute hori egiten soilik neurri handiko genero musikaletan, baizik eta notekin berekin ere. «Kid Kameleon» DJ profesionalaren album-bilduma erakusten zuen argazkian, ikus dezakegu albumak antolatzeko irizpide bakarra ez dela genero musikala, ezpada minutu bakoitzeko aldien (beat) kopurua (BPM, ingelesezko sigletan). Kid Kameleonentzat, album horiek baliabideak dira: musika sortzeko erabiltzen ditu, eta BPMren arabera antolatzen baditu, emanaldi batean musikaren jarioari eusteko behar duen material musikala topa dezake zehatz-mehatz. Horrenbestez, bere sailkapen-sistema taxonomia bat da, zeina generoaren pintzelada zabaletatik abiatu eta noten eta erritmoen antolaketa xehera iristen baita. Argazki hori ez da album-bilduma baten irudi hutsa: artista baten sormen-prozesua islatzen du modu bisualean.
5.4.4. Bideoa deskribatzea
Bideoen eremuan ere, lan eskerga egiten ari dira baliabide-deskribapen eraginkorragoak sortzeko. Bideoa analizatzeko tekniken bitartez, bideo bat zati daiteke klip laburragoetan: horiek deskribatzeko, kolorea, mugimenduaren norabidea, objektuen neurria eta halako ezaugarriak erabiltzen dira. Bideotan gertakari ezohikoak edo jendearen aurpegiak identifikatzeak ageriko erabilerak ditu segurtasunean eta zaintzan. Gaur egun bideo baten edukiari buruzko xehetasun zehatzak identifikatu nahi badira, gizakien jarduna oso premiazkoa da horretarako; hala ere, gerta liteke irudietako sinaduraren pareko algoritmoak gailentzea etorkizunean, zeinek bideoetan eta telebistan iragarkiak modu automatikoan kokatzea ahalbidetuko bailukete.
