1 Sistemak antolatzeko oinarriak
1.1 Antolatzearen diziplina
Antolatzea zera da: gaitasunak sortzea, berariaz inposatuz ordena eta egitura.
Antolatzea jarduera ohikoa da guztiz, horregatik, sarritan, hartaz gehiegi pentsatu gabe egiten dugu. Antolatzen ditugu zapatak armairuan, liburuak apalategietan, espeziak sukaldean, ordainagiriak eta fakturak errenta-aitorpenerako karpetetan eta baita jendea ere negozio-proiektu eta kirol-taldeetan. Gutako askok, geure lanetan, antolaketa-ataza jakin batzuk egin behar izaten ditugu. Baliteke, are gehiago, horiek egiteko apropos prestatu izana, diziplina-praktika berezituak betez. Ataza horiek ezin hobeki egiten ikasi arren, maiz ez gara ohartzen antzekoak direla guk egiten ditugun antolaketa-atazak eta besteek egiten dituztenak, eta oso antzekoak direla, halaber, lanean egiten ditugunak eta etxean egiten ditugunak. Gehien erabiltzen dugun Antolaketa Sistemei dagokienez, emantzat jo ohi ditugu haien kontzeptuak eta metodoak.
Liburu honen helburua da irakurleek kontzientzia handiagoa izan dezatela edozein eratako baliabideak antolatzearen esanahiaz, baita baliabideak antolatzeko erabiltzen diren printzipioez ere. Liburu honek, zehazki, Antolaketa Sistema deritzon kontzeptua aurkeztu nahi du: berariaz antolatu den baliabideen bilduma bat, eta horien bidez gauzatu daitezkeen elkarreragin-jarduerak. Liburu honetan aztertuko dugu zer-nolako diseinu-erabakiak hartzen diren baliabideen antolaketa sistematikoak egiteko, eta, bestalde, zer diseinu-patroiren bidez eratzen diren baliabideen arteko elkarreraginak.
Gauza fisikoak antolatzen ditugu. Gutako bakoitzak era askotako gauzak antolatzen ditu bere bizitzan: liburuak apalategietan; errenta-aitorpenaren agiriak karpetatan; arropa tiradera eta armairutan; sukaldeko tresnak tiraderatan. Liburutegi publikoek, adibidez, liburuak, aldizkariak, mapak, CD-ak eta DVD-ak antolatzen dituzte, baita binilo zahar batzuk ere. Ikerketa-liburutegiek, aurreko gauza horiez gainera, eskuizkribu bereziak, panfletoak eta partiturak antolatzen dituzte, bai eta inprimatutako bestelako informazio ugari ere. Museoek, beren aldetik, margoak, eskulturak eta bestelako artefaktuak antolatzen dituzte, balio kulturala, historikoa eta zientifikoa dutenak. Dendek eta hornitzaileek beren salgaiak antolatzen dituzte kontsumitzaileentzat, eta baita bata bestearentzat ere. Kirol-ligetan, jokalariak taldetan antolatzen dira; taldeek, berriz, beren posizio edo betekizunaren arabera antolatzen dituzte jokalariak.
Gauza fisikoei buruzko informazioa antolatzen dugu. Gutako bakoitzak gauzei buruzko informazioa antolatzen du, adibidez, gure etxe barruan dauden gauzen inbentarioa egiten dugunean seguruaren kontuetarako, edo nahi ez ditugun gauzak saltzen ditugunean eBay-n, edo jatetxe bati nota jartzen diogunean Yelp-en. Liburutegietako txartelen katalogoek, eta horien online baliokideek, azaltzen digute zer liburu biltzen diren liburutegi batean, eta non topatuko ditugun. Sentsoreek eta RFID etiketek, berriz, salgaien mugimenduari jarraitzen diote –baita liburutegiko liburuei ere–, horniketa-kateetan barna, eta orobat jarraitzen diote autoen mugimenduari (edo mugimendu ezari) autobideetan.
Gauza digitalak antolatzen ditugu. Gutako bakoitzak bere informazio digitala antolatzen du –mezu elektronikoak, dokumentuak, liburu elektronikoak, MP3 eta bideo dokumentuak, hitzorduak, kontaktuak– bere ordenagailuan, mugikorrean, irakurgailuan edo «hodeian»; horretarako, Interneteko protokoloak darabiltzaten informazio-zerbitzuak baliatzen ditugu. Ikerketa-liburutegi handiek, berriz, aldizkari eta liburu digitalak, programa informatikoak, gobernuaren datu-sortak edo datu-sorta zientifikoak, datu-baseak eta beste era askotako informazio digitala antolatzen dute. Enpresek beren negozio-agiriak eta bezeroei buruzko informazioa antolatzen dute enpresaren beraren aplikazioetan, eduki-biltegietan eta datu-baseetan. Erietxeek eta klinikek gorde eta elkarren artean trukatzen dituzte bezeroen historialak, X-izpien probak eta eskanerren emaitzak.
Gauza digitalei buruzko informazioa antolatzen dugu. Liburutegi digitalen katalogoek, webguneek eta bilketa-webguneek beste baliabide digital batzuetara iristeko estekak antolatzen dituzte. Bilatzaileek, webguneen edukia eta estekak aztertzeaz gainera, garrantziaren arabera sailkatzen dituzte, eta, horrela, gure arreta erakarri nahi duten milaka milioika webguneak antolatzen dituzte. Interneten oinarritutako zerbitzuak, datuak elikatzeko sistemak eta bestelako informazio baliabideak elkarri lotu ahal zaizkio, informazio ugariko negozio-prozedurak egin ditzaten, edo elkarri gehitu eta aztertu daitezke, informazio-zerbitzuen aurreikuspena eta pertsonalizazioa ahalbidetzeko.
Errepara diezaiogun hurbilagotik antolaketaren lau modu edo testuinguru horiei. «Gauzak antolatzea» eta «informazioa antolatzea» bereizi ditugu. Lehen begi-kolpean, eman dezake kontu zeharo ezberdinak direla, batetik, gauza fisikoak antolatzea –hala nola liburuak, CDak, makina baten zatiak edo sukaldeko tresnak– eta, bestetik, gauza digital ez-ukigaiak antolatzea. Gauza fisikoak antolatzeko, sarritan, beren forma, neurri, material edo fabrikazioa hartzen dugu aintzat, edo, bestela, beren ezaugarri berezko eta agerikoen arabera antolatzen ditugu: adibidez, jantzien armairuan, alkandorak antola ditzakegu estiloaren edo kolorearen arabera, eta gure musika-bilduma antolatzeko, berriz, binilo zaharrak eta CDak bereizi ditzakegu. Liburuak beren neurriaren arabera sailka ditzakegu apalategian, esaterako, liburu ilustratu handi eta astunak beheko apalean jarriz. Jantziak eta informazio-artefaktu ukigaiak beren ageriko ezaugarrien araberako antolatzeko modu horrek, itxuraz behintzat, ez du zerikusirik Kindle irakurgailuan liburu digitalak gorde eta antolatzeko moduarekin, ez eta musika digitala musika-irakurgailuan antolatzeko dugun moduarekin ere. Badirudi X-izpiak sailkatu, gorde eta horietara jotzearen jarduerak ezberdinak izango direla baldin eta X-izpiak filmean inprimatuta badaude edo, ostera, formatu digitalean badaude.
Batzuetan, informazioa formatu ukigaian baldin badago, gauzak antolatzearen eta informazioa antolatzearen prozesua antzeko samarra da, eta ez da harritzekoa. Izan ere, aurreko bi hamarkadetan informazio digital nonahikoa zabaldu bada ere, epe laburra da hori, kontuan hartuta gizakiek hamar mila urtetik gora igaro dituztela informazioa harrian zizelkatzen, buztinean lantzen, edo tintaz idazten papiroetan, pergaminoan edo paperan. Informazio-artefaktu ukigai horien ondorioz, informazioa gauza fisiko gisa hartzen duen ikuspegia sakon txertatu da gure kulturan, hizkuntzan eta informazioa diseinatzeko eta antolatzeko ditugun metodoetan. Informazio ukigaiari buruzko ikuspegi hori bereziki nabarmena da liburu bitxien bildumetan, non liburuen izaera fisikoa gurtzen baita, eta arreta berezia eskaintzen baitzaio horien azal, kaligrafia eta konposizio tipografiko bereizgarriei.
Nolanahi ere, beste kasu batzuetan alde nabarmenak daude gauzak eta informazioa antolatzeko moduetan, baita informazioa modu fisikoan emanda badago ere. Gure «informazio gauzak» antolatze ditugunean, gehienetan, zer diren hartzen dugu aintzat, eta ez, ordea, haien ageriko ezaugarriak. Etxean, artistaren edo genero musikalaren arabera sailkatzen ditugu gure CDak; sukaldeko liburuak, ostera, bidaia-liburuetatik aparte jartzen ditugu, eta orobat bereizten ditugu fikziozko liburuak eta kontsulta-liburuak. Liburutegiek gaiaren araberako sailkapen-eskemak erabiltzen dituzte, eta horietan badaude ehunka milaka kategoria ezberdin.
Era berean, batzuetan, gauza fisikoak antolatzean, ez ditugu kontuan hartzen horien ageriko ezaugarriak, eta, horren ordez, beren funtzioaren eta betetzen dituzten atazen arabera banatzen ditugu. Adibidez, erreminta-kutxetan edo lan-mahaian gordetzen ditugu bihurkinak, aliketak, mailua, zerra, zulatzeko makina eta maila, nahiz eta ez duten antzeko ezaugarririk. Horiek denak antolatzeko orduan, ez dugu kontuan hartzen zer itxura duten, ezpada horiekin zer egin daitekeen. Erremintak nor bere funtzioaren arabera antolatzeak badu zerikusirik, neurri batean, liburutegian dokumentuak beren gaiaren arabera antolatzearekin.
Bestalde, «gauzak antolatzea» eta «gauzei buruzko informazio antolatzea» bereizi ditugu. Bien arteko ezberdintasuna argi geratzen da baldin eta gogora ekartzen badugu liburutegietako txartelen katalogo tradizionala: txartel horietan deskribatzen dira liburutegiko apalategietan dauden liburuak. Gauza bat eta hari buruzko informazioa, bi-biak formatu fisikoan badaude, erraz ikus daiteke lehenengoa baliabide primarioa dela, eta bigarrena, berriz, hori deskribatzen edo horri buruzko informazioa ematen duen baliabide ordezko edo erantsia.
Zer da informazioa?
Informazioari buruz badira ehunka definizio; gehienek, ideia bat dela esaten dute, eta lotura duela beste termino batzuekin, hala nola «datuak», «jakintza» eta «komunikazioa» –definitzeko zail-zailak horiek ere–. Gainera, informazioari buruzko ikuspegi intelektual eta ideologiko horiekin batera, terminoak baditu beste erabilera mundutarrago batzuk; adibidez, zera galdetzen diogu geltokiko langileari: «Emango zenidake trenaren ordutegiari buruzko informazioa?».
Informazioa gauza ez-ukigai gisa ulertzen duen ikuspegi abstraktuak oinarri intelektuala eskaintzen dio bai informazioaren zientzia modernoari bai informazioaren ekonomia eta gizarteari. Hala eta guztiz ere, informazioaren gaineko ikuspuntu abstraktuak, maiz, talka egiten du beste ideia askoz zaharrago batekin, zeinaren arabera informazioa gauza ukigai bat baita, eta modu naturalean azaleratu baitzen, informazioa formatu materialetan kodetu zenean era askaezinean. Askotan nahasten ditugu bi zentzu horiek –«informazio eduki gisa» eta «informazioa edukiontzi gisa»–, eta errazegi hartzen dugu ordenagailuan edo «hodeian» gordetako bit-kopurua informazio-edukiaren edo horren balioaren neurritzat.
«Gauza digitalei buruzko informazioa antolatzea»ri dagokionean, bereizketa askoz lausoagoa da. Bilatzaile batean liburu bat bilatzen duzunean, lehenik, liburuari buruzko deskribapena jasotzen duzu, eta, sarritan, liburua bera klik batean eskura dezakezu. Gauza bat eta hari buruzko informazioa, bi-biak digitalak direnean, aipatu dugun bereizketa ez da hain nabarmena, bietako bat edo bi gauzak formatu fisikoan dauden egoerarekin alderatuz gero. Lehen, antola daitezkeen gauzei buruz ari ginela, X-izpiak aipatu ditugu adibide gisa –filmean inprimatutakoak zein formatu digitalean daudenak–; ostera, mediku batek X-izpiak aztertzen dituenean, X-izpi horiek ez al dute pazienteari buruzko informazioa ematen? Eta enpresariek erabakiak hartzen dituztenean marketingari eta prezioei buruz, horretarako informazio digitala aztertuz –jendeak zer edo noiz erosiko duen erakusten duena–, pentsa dezakegu, horrelakoetan bezeroak antolatzen dituztela hainbat kategoriatan, edo bezeroei buruzko informazioa antolatzen dutela.
«Gauza fisiko»en eta «gauza digital»en arteko ezberdintasunez eta loturez luzaroan eztabaidatu dute filosofoek, hizkuntzalariek, psikologoek eta beste hainbat adituk (Ikus taula gehigarri hauek: Zer da informazioa? eta Datuen eta informazioaren arteko aldea).
Zaila da azaltzea zer ezberdintasun dagoen gauza fisikoak antolatzearen, gauza digitalak antolatzearen eta gauza fisiko eta digitalei buruzko informazio antolatzearen artean, izan ere, erabiliko ditugun hitz askok hainbat esanahi dituztelako, «informazioa»k berak bezalaxe. Esate baterako, bibliotekonomiaren ikuspegitik, «dokumentu» bat zer den definitzerakoan, horren aurkezpenari edo inplementazioari lotutako balioak aipatzen dira, hortaz, formatu fisiko tradizionalak bakarrik biltzen dira termino horretan. Kontrara, informatikariek ikusmolde abstraktu batetik heltzen diote «dokumentu»ari: horrela deitzen diote informazioa bere baitan biltzen duen unitate orori, eta bereizi egiten dituzte dokumentuaren edukia eta horren aurkezpena edo edukiontzia.
Datuen eta informazioaren arteko aldea
Beharbada, irakurle zorrotzak konturatuko ziren ezberdindu egin ditugula datu-sentsoreak –«gauza fisikoei buruzko informazioa»– eta datuak elikatzeko sistemak –«gauza digitalei buruzko informazioa»–. Informazio-zientzien eta jakintzaren kudeaketaren arloko testuliburu askok era zehatzagoan bereizten dituzte datuak eta informazioa. Horien ustez, datuak behe-behean daude Informazioaren Hierarkian, Jakintzaren Piramidean edo DIKW hierarkian (hierarkia horretan, datuak informazio bihurtzen dira, informazioa ezagutza eta ezagutza jakinduria).
Marko horretan, datuak zera dira: objektuen, gertaeren eta horien testuinguruaren ezaugarriei buruzko iruzkin gordin edo oinarrizkoak. Datuak informazio bihurtzeko, datuak gehitu, prozesatu, aztertu, formateatu eta antolatu beharra dago, esanahia eta testuingurua emanez, eta balio behar dute galderei erantzuteko. Prozesu horren baitan egon daitezke datuen gaineko kalkulu-, inferentzia- edo fintze-ariketak. Adibidez, datuak dira tenperatura, prezipitazio eta haizearen abiadurari dagozkion neurketak. Horiek elkartu eta laburbiltzean, datu-multzo hori informazio estatistiko bihurtzen da, egun jakin batean izandako eguraldiari buruzkoa. Halako datuak hainbat hilabete edo urtez biltzen badira, datu-multzoak informazio bihurtuko dira: datuak bildu diren tokiko klimari buruzko informazioa, alegia.
Antolatzearen Diziplinak ez du halako ezberdintasun zorrotzik ezartzen datuen eta informazioaren artean Hierarkia/Piramidean. Liburu honen irakurleek, seguru asko, informazio ugari erabiltzen den eremuetan lan egiten dute, edo halakoetan lan egin nahi dute, eta eremu horietan informazioa eta datuak baliokidetzat jo ohi dira: biek adierazten dute datu-baseen edo datuak kudeatzeko aplikazioen edukia. Baliteke, teoriaren arloan behintzat, erabilgarria suertatzea datuen eta informazioaren arteko ezberdintasun hori ezartzea, baina aplikazioan ez da hala.
Gainera, datuen eta informazioaren arteko bereizketa lausotzen ari da, zeren eta datuen definizioa asko zabaltzen ari baita datuen zientzia izeneko alorrean. Are, gaia lantzen duen atariko testu batek, bere izenburuaren bidez, Hierarkia/Piramidetik ezabatzen du informazioa: Discovering knowledge in data: an introduction to data mining [Datuen baitako ezagutza deskubritzen: datuen meatzaritzaren sarrera bat].
Antzeko aldaerak izaten dira beste kontzeptu batzuen definizioan, adibidez, «autore» eta «sortzaile» kontzeptuen kasuan. Demagun honako esaldi hau esaten dugula: «Herman Melville da Moby Dick-en autorea »; bada, kasu horretan, «autorea»ren kontzeptuak ez du zerikusirik obraren formatuarekin, hau da, berdin da guri zer etorri zaigun burura, liburu fisikoa ala elektronikoa. Halere, autoretza gauza oso ezberdina da diziplina akademiko batean edo bestean. Are gehiago, badira hainbat eredu estandar baliabideak deskribatzeko, baina zehaztu behar dutenean zer pertsona edo erakunde d(ir)en baliabidearen eduki intelektualaren sortzaile nagusia(k), ez dira bat etortzen. Esaterako, musikaren deskribapena serioski hartzen duten pertsonek kritikatu egiten dute, eta arrazoiz gainera, streaming zerbitzu eta online denda batzuen jarrera, izan ere, «artista» bakar bat aipatzen dute: hala, ez dituzte bereizten konpositorea, zuzendaria, orkestra eta musikaren sorkuntzan bestelako betekizunak dituzten pertsonak.
Baldin eta informazioaren kontzeptuan sartzen badugu ikas dezakegun edozer –«informatzen duen edozer»–, kontzeptua mugagabe bilakatzen da. Gure xedea, liburu honen bidez, zubi bat eraikitzea da, golko intelektual batek banatzen baititu gauzak antolatzeko xedea duten baina gauza ezberdinak antolatzen dituzten diziplinak. Horretarako, egoera jakin batzuei erreparatu behar diegu: egoera horietan, informazioa existitzen da sormen- edo antolaketa-jarduera berariazkoen ondorioz (Ikus taula gehigarria: Antolatzearen Diziplina).
Antolatzearen diziplinaren oinarrietako asko, tradizioan, liburutegien sektorearen ikusmoldetik aurkeztu dira, eta «bibliotekonomian eta informazio-zientzien» arloan irakatsi. Horietako batzuk dira deskribapen bibliografikoa, sailkapena, izendatzea, autoritate-kontrola, kurazioa eta informazio estandarrak. Azken hamarkadetan, ordea, oinarriotan sakondu da, eta, informatikaren, zientzia kognitiboaren eta bestelako eremu berrien bidez, oinarriok zabaldu egin dira, horien barruan txertatuz sektore pribatu eta bibliografiaz kanpoko testuinguruak, multimedia eta sare sozialak eta informazio ugari erabiltzen duten aplikazio berriak eta zerbitzu-sistemak –informatika mugikor, nonahiko eta zientifikoak ahalbidetzen ditu horiek–. Antolatzearen diziplinan egin diren azken gehikuntzak datuen zientziatik eta ikasketa automatikotik datoz, eta abiadurari eta eskalari lotutako gogoetak ekarri dituzte, zeinak azaleratzen baitira indar konputazional masiboa eta estatistika-teknika berriak uztartzen direnean informazioa antolatzeko eta horretan ekiteko.
Datuen zientziaren eta ikasketa automatikoaren metodo eta tresna berriei esker, gai gara informazio gehiago antolatzeko, azkarrago, eta aurreikuspenak egiteko, kontuan hartuz jendeak zer klikatu, erosi edo esan duen. Hau ez da, ordea, halako zerbait gertatzen den estreinako aldia: aurretik ere, ideia eta teknologia berriek auzitan jarri dute jendeak nola antolatzen zituen baliabideak eta nola jarduten zen elkarreraginean horiekin. Orain berrogeita hamar urte, online bilatzeko katalogoak sortu ziren, eta, horren eraginez, jendea hasi zen liburutegia modu guztiz bestelako batean erabiltzen. Weba orain dela hogeita hamar urte eskas sortu zen, zientzialariek modua izan zezaten beren txosten teknikoak elkar trukatzeko; bada, orain, giza jarduera askoren oinarrizko parte bat da. Ez da komeni pentsatzea gauza berrienak dena aldatuko duela, zeren eta gauza berriak sortuko baitira aurrerantzean ere, eta aurrerapen teknologikoak, oraindik ere, pertsonek egindako antolaketa-lanaren mendekoak eta osagarriak dira. Datuen zientziak ez ditu giza antolatzaileak ordezkatuko, ez behintzat beste ezein zientziak gizakiak ordezkatu dituena baino neurri handiagoan (Ikus taula osagarria: Datuen zientzia eta Antolatzearen diziplina).
Antolatzearen Diziplina
Diziplina bat da ikasketa-eremu integratu bat, zeinean adostasun-maila bat baitago honako kontu hauei buruz: ikertu behar diren auzi eta arazoak, horien arteko loturak, horiek ikasteko modua eta auziei eta arazoei erantzuten dieten aurkikuntzak edo teoriak ebaluatzeko manera. Marko bat, berriz, kontzeptuen sorta bat da: oinarrizko egitura bat eskaintzen dute eremu bat ulertzeko, eta hiztegi komun bat osatzen dute azalpen-teoria ezberdinetan erabiltzeko.
Antolatzea munta handiko auzia da hainbat diziplinatan, batez ere bibliotekonomian eta informazio-zientzietan, informatikan, sistemen analisian, zuzenbidean, ekonomian eta negozioetan. Dena dela, diziplina horiek adostasun mugatua dute antolaketaren arazoei heltzeko orduan eta horretarako konponbideak bilatzen dituztenean. Adibidez, bibliotekonomiak eta informazio-zientziak antolaketa aztertu izan dutenean, sektore publikoaren ikusmolde bibliografikoa lehenetsi dute: oso aintzat hartu dituzte erabiltzaileen helmenari eta gordetzeari zegozkionak, eta metodo eta konponbide preskriptiboak eskaini dituzte. Horren kontrakarrean, informatikan, antolaketa aztertzean, informazio ugari erabiltzen den negozioetako erabilerei erreparatu zaio, bereziki prozesuaren efizientziari, sistemaren arkitekturari eta horren gauzatzeari. Kudeaketa eta antolaketa industrialean, giza baliabideak, baliabide materialak eta informazioa antolatzen dituzte, komertzioaren, lehiakortasunaren eta araudien indarrek taxutzen dituzten testuinguruetan.
Liburu honek, bere aldetik, ikusmolde abstraktuago bat dakar, antolatzearen auzi eta arazoei dagokienez: horiek ikertzen dituzten diziplinetako kontzeptu eta xede komunak azpimarratzen ditu. Gure markoak proposatzen duenez, antolaketa-sistema orok dauka baliabideen bilduma bat, eta baliabidetzat jo ditzakegu gauza fisikoak, gauza digitalak eta horiei buruzko informazioa. Antolaketa-sistema orok ezaugarri edo printzipioen sail baten bidez deskribatzen eta sailkatzen ditu baliabideak, eta horren bidez gauzatzen ditu elkarreraginak baliabideekin. Baldin eta aztertzen eta alderatzen badugu nola gertatzen diren jarduera horiek hainbat testuinguru eta alorretan, antolaketa-diseinuak identifika ditzakegu, eta ikusiko dugu Antolaketa Sistemek, sarritan, antzeko bizi-zikloa izaten dutela. Antolatzearen diziplina bat eratu dezakegu, diziplinaz.
Hori dela-eta, diziplinarteko ikuspegi bat hartu behar dugu; horri esker, diziplinen puntu komunak azpimarratu ditzakegu, eta erakutsi dezakegu zertan egiten duten bat, ezen ez zertan ezberdintzen diren. Diziplina guztietan irakasten dira, adibidez, baliabideen hautaketa, antolaketa, elkarreraginen diseinua eta mantenua, baina kontzeptu horiek hainbat modutan izendatzen dira. Hiztegi komun bat osatzen baldin badugu, eta horren bidez eztabaidatzen baditugu antolaketak dakartzan erronka eta arazo komunak –diziplina bakoitzaren ikusmolde estuari helduz gero, lotura horiek ilundu egingo lirateke–, hobeto uler ditzakegu izan badiren antolaketa-sistemak, eta, aldi berean, ikus dezakegu ea nola asmatu daitezkeen sistema berriak, bestelako hautuak eginez diseinuan.
Datuen zientzia eta Antolatzearen Diziplina
Ordenagailuaren gaitasunetan eta teknika estatistikokoetan egiten ari diren aurrerakuntzei esker, gaur egun posible da datuetan patroiak identifikatzea eta horietatik informazio esanguratsua ondorioztatzea aurrez inoiz ezagutu gabeko maila batean. Datuen zientziari, ikasketa automatikoari eta analisi prediktiboari buruzko liburu eta artikulu askok aurreikuspen ausartak egiten dituzte, esanez ezen sortzen ari diren eremu horiek errotik aldatuko dutela mundua. Halako aldarrikapenek badute probokaziotik eta promesetik, baina datuen zientzia, muin-muinean, baliabideak hautatu, deskribatu eta antolatzeari dagokio, eta kontzeptu horiek denek tradizio luze bat dute informazio-zientzian eta bibliotekonomian. Liburutegi bateko liburuak edo biltegi bateko salgaiak antolatu eta deskribatu ordez, datuen zientzialari batek liburuei edo salgaiei buruzko informazioa antolatuko du datu-taula erraldoietan: baliabide bakoitza lerro bat izango da, eta haren ezaugarri deskriptiboak, berriz, zutabetan agertuko dira. Demagun jendeak kategoriatan sailkatu dituela liburuak eta salgaiak; horren ostean, ikasketa automatikoko teknikek liburu edo salgai berriak antola ditzakete kategoria horiexek erabiliz, edo, beharbada, kategoria berriak deskubritu ditzakete, helmen- edo erosketa- joerak aintzat hartuta. Beraz, datuen zientziaren teknikak berriak izan arren, zientzia horrek parean dituen erronketako asko ez dira berriak: datuen zientzialariek zuhurtziaz hautatu behar dituzte baliabideak, eta horien deskribapen egokiena eman; ulertu beharra dute aurreiritziek eragina izan dezaketela baliabideen deskribapen eta kategorizazioetan; ulertu behar dute nolako konpentsazioak eta osagaiak dauden jendearen eta ordenagailuen artean, eta, azkenik, algoritmo bidez egindako deskubrimenduak frogatu behar dituzte esperimentu kontrolatuak eginez.
Datuen zientziaren inguruan dabilen eztabaida atzemateko, zera ulertu beharra dago: motaren eta mailaren arteko ezberdintasuna. Duela ehun urte, autoak 40 milia/orduko abiaduran joaten ziren autobidean. Gaur egun, berriz, bi aldiz bizkorrago doaz, baina horrek maila aldatu du, ez besterik. Ostera, abiadura handiagotzen baldin badugu 17.500 milia/orduko neurrira iritsi arte, «abiadura orbitala» erdietsiko dugu, eta horri esker joan gaitezke espaziora, Lurraren orbitara; bidaia hori beste mota batekoa da.
Zertan datza, bada, datuen zientzia? Datuen zientziako eremu batzuetan datu «altuak» biltzen dira, alegia, milioika edo mila milioika erregistro, bakoitzak aldaera-kopuru erlatiboki txiki bat duela. Datu «altuak» inoiz baino lasterrago aztertzeko gai izanik, analisiaren maila aldatu da batez ere, datu-baseen teknika tradizionalekin alderatuz gero. Hala eta guztiz ere, datu «zabal»en bilketari dagokionean –erregistro bakoitzak ehunka edo milaka aldaera dituenean–, datuen zientziako teknikek modua eskain dezakete lehen inolaz ere ikus ez zitezkeen patroiak identifikatzeko, edo lehen garestiegiak zirenak edo kopuru urrian besterik ikusi ezin zirenak aztertzeko. Horretan, baliteke datuen zientziak aldaketak eragitea motan.
