9. Baliabide-deskribapenen formak

Ryan Shaw, Murray Maloney

9.3 Deskribapenak idaztea

Demagun liburuak antolatzen ari naizela, eta garrantzitsua dela, antolaketa horren xedeetarako, liburu bakoitzaren izenburua eta orrialde-kopurua zein den jakitea. Liburu bat daukat parez pare; aztertu dut, eta zera zehaztu: Die Ringe des Saturn du izenburua, eta 371 orrialde ditu. 9.5 adibidean –Liburu-deskribapen baten zati bat idazteko modu oinarrizkoak–, deskribapen hori idazteko beste modu banaka batzuk agertzen dira. Azter ditzagun idazketa-molde horiek, beren arteko antzekotasunak eta aldeak ikuste aldera.

9.5 adibidea: Liburu-deskribapen baten zati bat idazteko modu oinarrizkoak

Die Ringe des Saturn du izenburua, eta 371 orrialde ditu .

{ book: {"title":"Die Ringe des Saturn","pages":371} }

<book pages="371"> <title>Die Ringe des Saturn</title> </book>

<div class="book">The title is <span class="title">Die Ringe des Saturn</span> and it has <span class="pages">371 pages.</span> </div>

<http://lccn.loc.gov/96103072> <http://rdvocab.info/Elements/title> "Die Ringe des Saturn"@de ; <http://rdvocab.info/Elements/extentOfText> "371 p."

Deskribapen-molde horien notazioa, idazketa-sistema eta sintaxia aztertuko ditugu, besteak beste, hurrengo ataletan.

9.3.1 Notazioak

Lehenik, errepara diezaiogun orrialdean agertzen diren markei berei. Idazteko, markak egin behar dituzu, edo –probableagoa dena– marka batzuk hautatu beharko dituzu menu batetik, teklatu bat baliatuz. Kasu batean zein bestean, notazio bat erabiltzen ari zara: forma bereiziak dituzten karaktereen sorta bat. Alfabeto latinoa, esaterako, notazio bat da, eta arabiar zenbakera ere bai. Badira notazio-sistema exotikoagoak ere: argitaletxeetako markaketan erabiltzen diren sinboloak edo alkimiaren sinboloak. Notazioetako karaktereek ordena bat izaten dute normalean. Arabiar zenbakeraren ordena hauxe da: 1 2 3 eta abar. Haur ingeles-hiztunek, kantu baten bidez ikasi ohi dute alfabeto latinoaren ordena.

Karaktereak notazio batean baino gehiagotan egon daitezke. 9.5 adibidean, adibidez, notazio bakan batzuetako karaktereak erabiltzen dira: alfabeto latinoko letrak, arabiar zenbakera eta marka osagarri zenbait: { } “ : < > / . Karaktere horiek denek –alfabeto, zenbakiak, marka osagarriak–, batera hartuta, beste notazio bat osatzen dute: Informazioa Trukatzeko Kode Estandar Amerikarra (ASCII, ingelesezko sigletan).

Ingurune digitalean erabiltzeko kodifikatu eta estandarizatu den notazio bat dugu ASCII. Alfabeto latinoaren gisako notazio tradizionalek, hein batean behintzat, marka jakin baten aldakortasuna onartu dezakete: baliteke bi pertsonak A letra modu zertxobait desberdinean idaztea, baina, bataren zein bestearen markak «A» letra direla jabetzen diren bitartean, notazio berdina erabil dezakete arazorik gabe. Ordenagailuek, ordea, ez dute aise onartzen halako aldakortasunik. Karaktere bakoitzak zehatz-mehatz zedarriturik egon behar du. ASCIIren kasuan, karaktere bakoitzak zenbaki bat du, 0tik 127ra bitarte; hortaz, 128 dira ASCII karaktereak. Ordenagailu bat erabiliz ASCII karaktereak idazten dituzunean, sakatzen duzun tekla bakoitzak karaktere bat hautatzen du 128 karaktereko «menu» horretatik. Notazio batean, karaktere bakoitzari zenbaki bat esleitzen bazaio, karaktere kodetzea esaten zaio horri.

9.1 taula. ASCII

	0	1	2	3	4	5	6	7
0	NUL	DLE	space	0	@	P	`	p
1	SOH	DC1	!	1	A	Q	a	q
2	STX	DC2	“	2	B	R	b	r
3	ETX	DC3	#	3	C	S	c	s
4	EOT	DC4	$	4	D	T	d	t
5	ENQ	NAK	%	5	E	U	e	u
6	ACK	SYN	&	6	F	V	f	v
7	BEL	ETB	‘	7	G	W	g	w
8	BS	CAN	(	8	H	X	h	x
9	HT	EM	)	9	I	Y	i	y
A	LF	SUB	*	:	J	Z	j	z
B	VT	ESC	+	;	K	[	k	{
C	FF	FS	,	<	L	\	l	\|
D	CR	GS	–	=	M	]	m	}
E	SO	RS	.	>	N	^	n	~
F	SI	US	/	?	O	_	o	DEL

Unicode da, existitzen diren karaktere-kodetze guztien artean, anbizio handikoena: haren 6.0 bertsioak 109.449 karaktere biltzen ditu. Unicodek, hain zuzen ere, karaktereak eta glifoak bereizten ditu, eta alde garrantzitsua da. Karakterea zera da: idatzizko hizkuntza batean esanahia duen unitate txikiena. Alfabetoan oinarrituriko hizkuntzetan, hala nola ingelesez, letrak dira karaktereak; txineraz, ordea, ideogramak. Unicoden, karaktere horiek denak ideia abstraktu gisa erabiltzen dira (Latinezko A larria), eta ez marka zehatzen gisan (A A A A). Karaktere bat adierazteko erabil daitekeen marka zehatzari glifo esaten zaio. Letra-tipoa, berriz, karaktereen sorta bat errepresentatzeko erabiltzen den glifoen bilduma da. Unicode letra-tipoari dagokionez, Unicode karaktere-kodetzeko zenbaki batekin lotzen da glifo bakoitza. Ordenagailuek ez dute ahalmenik testuinguruari buruzko ezagutza baliatzeko eta glifoen eta karaktere abstraktuen arteko muga gainditzeko, eta gabezia horrek ondorio garrantzitsuak eragiten ditu antolaketa-sistemetan.

Baliteke marka oso antzekoak erabiltzea notazio desberdinetan. Adibidez, notazio musikal modernoan, zenbait marka erabiltzen dira, notaren tonua adierazteko, eta akzidentalak esaten zaie: besteak beste, ♯ markak «diese» adierazten du. Diesearen marka, bestalde, traolaren oso antzekoa da; ingelesez, esaterako, zenbakiekin batera erabiltzen da traola: «We’re #1!» esaldiak, adibidez, «Lehenengoak gara!» esan nahi du (irabazle izatearen zentzuan). Diesearen zeinua eta traola eskuz egingo bazenitu, seguru asko berdin-berdinak aterako lirateke. Testuinguru ez digitaletan, testuinguruaren arabera ebatziko genuke ea idatzitako marka notazio musikal baten parte den, notazio matematikoaren parte, edo ingelesezko laburdura bat ote den.

Ordenagailuek, baina, ez dute testuingurua ulertzeko ahalmenik. Unicodek, horrenbestez, bereizi egiten ditu traola eta diesearen zeinua. Unicode darabilen ordenagailu bati dagokion bezainbatean, ♯ eta # zeharo ezberdinak dira, eta beren glifoak antzekoak izan arren, horrek ez du inongo muntarik. Horrek, ordea, arazoak sor ditzake, kasu honetan adibidez: demagun katalogatzaile batek xehe-xehe deskribatu duela musika-pieza bat, diesearen zeinua egoki erabiliz; pieza horren bila dabilen pertsona batek, ordea, traola erabili du (izan ere, diesearen zeinuaren antz handiena duen tekla sakatzen duzunean, traola agertzen baita), eta ezin izan du pieza topatu.

9.3.2 Idazketa-sistemak

Idazketa-sistemetan notazio bat edo gehiago erabiltzen da; gainera, arau batzuk ezartzen dira, notazioen erabilera zehazteko. Idazketa-sistema gehienek emantzat jotzen dute giza hizkuntza zehatz baten ezagutza. Halako idazketa-sistemei sistema glotikoak esaten zaie. Baina badira, halaber, beste idazketa-sistema ugari, hala nola matematikari eta musikari dagozkionak, zeinak ez baitaude giza hizkuntzekin lotuta modu horretan. Horrelakoak dira, hain justu ere, baliabideen deskribapenerako erabiltzen diren idazketa-sistema asko, eta horrek berekin dakar erabiltzeko errazak direla (printzipioz bederen) edozein hizkuntzako hiztunentzat, neurri berean.

Idazketa-sistema batzuk zuzenean lotuta daude metaeredu jakinekin. Adibidez, XML eta JSON, biak dira 1) informazioa egituratzeko metaereduak eta 2) idazketa-sistemak, informazioa testualki adierazteko balio dutenak. Beste modu batera esanda, XML eta JSON ereduek bi-biak zehazten dituzte: bai deskribapenaren egitura abstraktua, bai eta hori nola idatzi ere. Beste modu batzuk sor litezke metaeredu horien egitura testualki errepresentatzeko; edonola ere, metaeredu bakoitzarentzat idazketa-sistema bakarra estandarizatu da.

Bestalde, RDF metaeredu bat da soilik; ez da idazketa-sistema bat. RDFk, beraz, egitura abstraktu bat zehazten du, eta ez, ordea, egitura hori nola idatzi. Beraz, nola idatz dezakegu RDF gisa egituratutako informazioa? Bada, aukera ugari dauzkagu eskura. XML eta JSON metaereduen kasuan ez bezala, RDF metaereduari dagokionez hainbat idazketa-sistema estrandarizatu dira, besteak beste: N-Triples, Turtle, RDFa, eta RDF/XML. Idazketa-sistema horietako bakoitza modu abstraktuan deskribatuta dago RDF metaereduaren bitartez.

Idazketa-sistemek zenbait arau eskaintzen dituzte, notazio bateko karaktereak egitura esanahidunetan antolatzeko. Notazioetako karaktereek ez dute berezko esanahirik. Notazioetako karaktereek esanahia daukate, soilik, notazioa erabiltzen duen idazketa-sistemaren testuinguruan. Adibidez: zer esan nahi du alfabeto latinoko I letrak? Horri erantzuteko, nahitaez erreparatu behar zaio letra hori idazketa-sistema jakin batean erabiltzen den moduari. Idazketa-sistema ingeles estatubatuarra baldin bada, I letraren esanahia faktore honen araberakoa izango da: ea letra hori beste batzuekin batera agertzen den, edo bakarrik. Azken kasu horretan, esanahi bat esleitu ahal izango zaio [ni/nik esan nahi du]; bestela, ez. Alabaina, antzinako Erromako idazketa-sistema aritmetikoan, zeinak orobat erabiltzen baititu alfabeto latinoko letrak notazio gisa, I letrak bestelako esanahi bat du: bat esan nahi du, hain justu ere.

Halaber, adibide horrek erakusten digu notazio baten ordenak ez duela zertan bat etorri notazioa darabilen idazketa-sistemaren ordenarekin. Alfabeto latinoaren ordenaren arabera, hamabigarren letra, L, lehenago dago hogeita bigarrenaren letra baino, V. Zenbaki erromatarren idazketa-sisteman, ordea, V (5 zenbakia) lehenago dago L baino (50 zenbakia). Zer ordena erabiltzen ari garen jakin ezean, ezin ditugu L eta V letrak «ordenatu».

9.2 taula: Erromatar zenbakera

Erromatar zenbakera	Arabiar zenbakera
I	1
V	5
X	10
L	50
C	100
D	500
M	1000

Badira, halaber, ordenari dagozkion desberdintasun sotilago batzuk. Izenak alfabetoaren arabera ordenatzen ditugunean, hasteko eta behin, izen bakoitzaren lehen karaktereari erreparatzen diogu, eta idazketa-sistemaren ordenaren arabera ordenatzen ditugu. Dakigunaren arabera, ordena alfabetikoa Alexandriako liburutegian erabili zen estreinako aldiz, duela 2.000 urte inguru: Zenodotok, hain zuzen ere, liburutegiko bilduma antolatu zuen, baliabideen izenen lehen letra aintzat hartuta. Bi izenen lehen karaktereak berdinak baldin badira, bigarren karakterea konparatzen dugu, eta abar. Ordenamendu-mota horixe erabil dezakegu zenbakerari dagokionean ere. Hala egiten badugu, 334 zenbakia lehenago egongo da 67 zenbakia baino, izan ere 3 zenbakia (lehen sekuentziako lehen zifra) 6 zenbakia baino lehenago baitago (bigarren sekuentziako lehen zifra), gure notazioaren ordenaren arabera (arabiar zenbakera). Nolanahi ere, zenbakera ordenatzen dihardugunean, ohikoagoa da zenbaki dezimalei erreparatzea, eta, horrenbestez, sistema dezimalaren ordenari men egitea. Idazketa-sistema dezimalean, 67 zenbakia lehenago dago 334 zenbakia baino, azken hori handiagoa delako.

Desberdintasun horri garrantzitsua da antolaketa-sistemei dagokionez. Zenbaki-sekuentziekin dihardutenean, ordenagailuek desberdin antolatuko dituzte, faktore honen arabera: zenbakiak diren edo sekuentziak diren. Antolaketa-sistema batzuetan, karaktere berak antolatzeko hainbat era uztartzen dira. Adibidez, Kongresuko Liburutegiko kodeek lau zati dituzte, eta hirutan ager daitezke arabiar zenbakerako sekuentziak. Bigarren zatian –ezagutza-arlo zehatza– eta laugarren zatian –argitalpen-data–, zenbakien sekuentziak zenbakitzat hartzen dira, eta sistema dezimalaren arabera antolatzen. Hirugarren zatian, ordea, sekuentziatzat hartzen dira, eta «notazioaren eran» ordenatzen, aurreko adibidean bezalaxe (334 lehenago dago 67 baino).

Idazketa-sistema ugarik notazio berdina erabil dezakete nork bere erara, eta hori egiteko moduetako bat erakusten dute ordenamendu-modu desberdinek. Nolanahi ere, badira adibide gehiago; adibidez, AEBko ingelesak eta britainiar ingelesak alfabeto latinoa erabiltzen dute bi-biek, baina arau zertxobait ezberdinak dituzte ortografiari dagokionez. Idazketa-sistema japoniarrak zenbait notazio erabiltzen ditu, besteak beste, txinatar karaktere tradizionalak (kanji) eta alfabeto latinoa (rōmanji). Idazketa-sistemek, maiz, ez dute notazio berbera erabiltzen, gehiengoan bat datozen notazioak baizik. Europar hizkuntza askotan, esate baterako, alfabeto latinoa zabaltzen dute, karaktere oinarrizkoei marka gehigarri batzuk erantsiz, diakritikoak deritzenak: hala, Å edo Ü karaktereak sortzen dituzte, besteak beste.

Antolaketa-sistemetan, premiazkoa suertatu ohi da idazketa-sistema bateko balioak beste idazketa-sistema batean adieraztea, beste notazio bat darabilen sistema batean alegia: prozesu horri transliterazioa esaten zaio. Adibidez, hastapenetako ordenagailu-sistemek ASCII notazioa bakarrik onartzen zuten; hori dela-eta, ASCIIra bihurtu behar izaten ziren alfabeto latino hedatua zerabilten idazketa-sistemetako testuak; horretarako, normalean, diakritikoak kentzen ziren (edo, batzuetan, transliterazioaren bidez egokitzen ziren). Horren ondorioz, ASCII ez ziren testuak erabil zitezkeen ASCIIn oinarrituriko antolaketa-sistema informatizatuetan, informazioaren puska bat galtzearen truke.

Alabaina, nahiz eta sistema informatiko modernoek Unicode erabili, transliterazioa egin behar izaten da sarritan, sistema originalean idatzitako testuak irakurri ezin ditzaketen erabiltzaileen antolaketa-jarduera ahalbidetzeko. Kongresuko Liburutegiak eta AEBko Liburutegien Elkarteak zenbait transliterazio-prozedura estandar eskaintzen dituzte; horien bitartez, alfabeto latino hedatura ekar daitezke hirurogeitik gora idazketa-sistematako testuak.

9.3.3 Sintaxia

9.5 adibideko etsenpluek –Liburu-deskribapen baten zati bat idazteko modu oinarrizkoak–, informazio berdina azaltzen dute, idazketa-sistema desberdinak erabiliz. Etsenplu guztietan erabiltzen da notazio berdina (ASCII); ez, ordea, sintaxi berdina: sintaxiaren arauek zehazten dute, hain zuzen ere, zer karaktere uztartu daitezkeen hitzak osatzeko, eta zer hitz uztartu daitezkeen maila gorenagoko egiturak osatzeko.

Errepara diezaiogun lehen kasuari: «Die Ringe des Saturn du izenburua, eta 371 orrialde ditu». Kontuan hartuta ezen, karaktereen sekuentzia honetan, lehen hitza letra larriz dagoela eta puntu bat dakarrela amaieran, esaldi bat dela ondoriozta dezakegu. Euskarazko idazketa-sistema darabilgunean, deskribatzen ari garen liburuari buruzko bi adierazpen egiteko moduetako bat izango da esaldi hori. Adierazpenak, hain zuzen, egitate edo informazio-pusketa bereiziak dira. Idazketa-sistema glotikoetan, eta euskara halakoa da, esaldi bat baino gehiago idatz genitzake, normalean, adierazpen bera adierazteko. Adibidez, «371 orrialde ditu» idatzi beharrean, zera idatz genezakeen: «orrialde-kopurua 371 da». Bestalde, euskarazko idazkerak modua ematen digu esaldi konplexuak idazteko, adierazpen bat baino gehiago adierazten dituztenak.

Alabaina, baliabide-deskribapenak sortzen ditugunean antolaketa-sistemetan, idazketa-sistema ez-glotikoak erabiltzen ditugu orokorrean, eta, horien bidez, esaldi bakoitzak adierazpen bakar bat helarazten du, eta modu bakarra dago adierazpen jakin bat esaldi bidez emateko. Halako mugen ondorioz, idazketa-sistema horiek ez dira horren adierazkorrak, baina erabilera sinpleagoa dute. Zehazki, esaldiak eta adierazpenak bat datozenez, alde batera utz dezakegu bereizkuntza hori, eta deskribapeneko adierazpenez mintzatu gaitezke.

Dagokigun kasura itzuliko gara orain, eta adierazpenaren egiturari erreparatuko diogu: «Die Ringe des Saturn du izenburua, eta 371 orrialde ditu». Espazioen bidez, testua hitzetan banatzen da, eta euskararen sintaxiak zehazten du zeintzuk diren hitz horien funtzioak. Du aditzak, adierazpen honetan, izenburua hitza eta Die Ringe des Saturn esapidea lotzen ditu. Ohikoa da gisa horretako adierazpenak aurkitzea baliabideen deskribapenean. Adibide honetan, adierazpenak Die Ringe des Saturn balioa esleitzen dio izenburua propietateari.

Deskribapenen egituraz jardutean ikusi genuen moduan, deskribapenak aztertzeko garaian, baliabide-propietateak dituztela pentsa dezakegu, eta haiei dagozkien balioak ere bai, jakina. Euskarazko idazketa-sistema bezalako sistemetan, zer hitz diren propietateak eta zer hitz diren balioak zehaztea ez da lantegi erraza eta argi suertatzen beti. (Horrexegatik, blob delakoak ez dira apropos-aproposak deskribapen-egiturak sortzeko). Aitzitik, baliabide-deskribapenak adierazteko xedez sortu diren idazketa-sistemetan, normalean, errazagoa izaten da halako kontuak zehaztea, sintaxia helburu horretarako diseinatzen baita. Goiko hiztegi-adibideetan, esate baterako, geziaren sinboloa erabili dugu (→) propietateen eta balioen arteko harremana adierazteko.

Nolanahi ere, propietateak eta balioak aise bereizteko ahalmen horrek badu bere ifrentzua. Euskararen sintaxia malgua da: sintaxi nahasi samarra izanagatik, liburuak ditu 371 orrialde esaldia irakur dezakegu eta zer esan nahi duen ulertu. Ez da hala gertatzen, ordea, baliabide-deskribapenak adierazteko xedea duten idazketa-sistemekin. Halako sistemetan zorrotz bai zorrotz zehazten dira arauak, karaktereak maila gorenagoko egituretan nola uztartu xedatzen dutenak. Arauei jarraitzen dieten egiturak ondo osatuak egongo dira sistemaren arabera.

Errepara diezaiogun, esate baterako, 9.5 adibideko bigarren adierazpenari. Hala dio:

{ liburua: {“izenburua” : “Die Ringe des Saturn”, “orrialdeak” : 371 } }

Pusketa hori JSONen idatzita dago. Lehen azaldu dugun eran, JSON metaeredu bat da, eta informazioa egituratzen du zerrendak eta hiztegiak erabiliz. Bestalde, JSON orobat da idazketa-sistema bat, JavaScripten sintaxia erabiltzen duena. JSON sintaxian, bada, kortxeteak erabiltzen dira zerrendak testualki adierazteko [1,2,3], eta giltzak, berriz, hiztegiak testualki adierazteko: {“izenburua” : “Die Ringe des Saturn”, “orrialdeak” : 371 }. Bi puntuen zeinua, bestalde, propietateak eta balioak lotzeko erabiltzen da, aurreko adibidean ikusi dugun eran. Hortaz, “orrialdeak” : 371 adierazpenak 371 balioa esleitzen dio orrialdeak propietateari.

Hirugarren kasua XMLn idatzita dago.

<liburuaren orrialdeak= “371”> <izenburua>Die Ringe des Saturn</izenburua> </liburua>

JSON bezala, metaeredu bat eta idazketa-sistema bat da XML ere. Hemen, XML elementuak eta atributuak dauzkagu. XML elementuak, hain justu ere, etiketa gisara aurkezten zaizkigu, < > eta / karaktere berezien bidez. Hortaz, XML pasarte horretan, liburu elementua daukagu, zeinak haur-elementu bat baitauka, izenburua, eta orrialdeak atributu bat ere bai, horietako bakoitzak testu-edukia biltzen du. Kasu honetan, orrialdeak= “371” adierazpen bat da, zeinak 371 balioa esleitzen baitio orrialdeak propietateari. Sintaxiari dagokionez, desberdintasun sotila da; komatxoek inguratzen dute balioa, eta = sinboloa erabiltzen da propietateari bere balioa esleitzeko.

Laugarren kasua HMTLn idatzita dago:

<div klasea="liburua">Izenburua du
<span klasea="izenburua">Die Ringe des Saturn</span>
eta ditu <span klasea="orrialdeak">371 orrialdeak.</span>
</div>

HTMLren idazketa-sistema hain dago hurbil XMLren sistematik ezen ez baitago sintaxiaren desberdintasunei erreparatzeko premiarik. Kasu honetan, KLASEA atributuak biltzen du propietatearen izena, eta elementuaren edukiak, berriz, propietatearen balioa adierazten du.

Bosgarren kasua, berriz, Turtle idazketa-sistemarekin idatzia dago; RDFrako idazketa-sistemetako bat da Turtle.

<http://lccn.loc.gov/96103072>
<http://rdvocab.info/Elements/title> "Die Ringe des Saturn"@de ;
<http://rdvocab.info/Elements/extentOfText> "371 p." .

Turtle sistemak, hain zuzen ere, RDF hirukoteak idazteko sintaxi bat eskaintzen du. Hirukote bakoitzean, subjektu bat, predikatu bat eta objektu bat dauzkagu, lerrotan banaturik. Gogoan izan ezen RDFn URIak erabiltzen direla subjektuak, predikatuak eta objektu batzuk identifikatzeko; URIak, bestalde, Turtle sisteman idazten dira, < > zeinuekin bilduz. Hirukoteak elkarren artean bereizteko, puntua erabiltzen da (.); halere, hirukoteek subjektu bera baldin badute, modu trinkoagoan idatz daitezke adierazpenak, subjektua behin bakarrik aipatuz, eta, ondoren, hirukote bakoitzaren predikatua eta objektua idatziz, puntu eta komaren bidez (;) bereizirik. Horixe ikusi dugu 9.2 adibidean –Autorearen deskribapena habiaratzea liburuaren deskribapenaren barruan: subjektu berdina partekatzen zuten bi hirukote.

9.6 adibideko bi pasarteek –Liburu-deskribapen zati bat idaztea XML semantikoan–, izenespazioak, Dublin Coreko terminoak eta DocBokk izenespazioak erakusten dituzte, eta orobat frogatzen dute XMLren bidez aise asko gauza daitekeela baliabide-deskribapenen kodetze semantikoa.

9.6 adibidea: Liburu-deskribapen bat zati bat idaztea XML semantikoan

<book xmlns:dc="http://purl.org/dc/terms/" dc:extent="371 p."> <dc:title>Die Ringe des Saturn</title>
...
</book>

<book xmlns:db="http://www.docbook.org/xml/4.5/docbookx.dtd"> <bookinfo> <title>Die Ringe des Saturn</title> <pagenums>371 p.</pagenums>...</bookinfo>
...
</book>

Lehen adibideak 9.5 adibideko hirugarren pasartea zabaltzen du. xmlns:dc="..." segmentua, hain zuzen, izenespazio adierazpen bat da, dc eta aipaturiko URIa lotzen dituena, Uri hori, hain justu ere, Dublin Core Metadatu Egitasmoa da (DCMI); haur-elementuak <dc:izenburua> eta horri atxikiriko elementuak dc:hedatura=“371” adierazten digute ezen horiekin loturiko balioak izenburuaren eta hedaduraren propietateei dagozkiela hurrenez hurren, Dublin Core izenespazioan.
Bigarren pasartean, aldiz, DocBook DTD izenespazioa baliatzen da; bertan, <orrialdekop> elementu bat daukagu, zeinaren esanahia agerikoa baita testuinguruari erreparatuz gero; izenburua, berriz, izenburua da; eta notazioaren geruza gehigarri batek honelakoak adieraz ditzake: edizio-prozesuan dagoen liburu baten jatorri-fitxategiko metadatuak izan daitezkeela, ekoizteko bidean dagoela edo zure tablet kutunean dagoela.

9.7 adibideari erreparatuz gero –Liburu-deskribapen baten zati bat idaztea RDFan edo mikrodatuetan–, bertako bi pasarteek erakusten dute zertan diren RDFa eta mikrodatuen formatuak. Horietako bakoitzak atributu espezifikoetara jotzen du, HTML elementuetan bildutako propietate-balioen mota zehazteko. Adibide bietan, liburuaren izenburua elementu baten barnean biltzen da. RDFa formatuan, propietate atributua baliatzen da; mikrodatuen adibidean, berriz, itemprop atributua baliatzen da elementuaren edukiak zein diren zehazteko: hain zuzen ere, «izenburua» da, <dc:izenburua> elementuaren edukia ere «izenburua» dela dakigun bezalaxe.

9.7 adibidea: Liburu-deskribapen baten zati bat idaztea RDFan edo mikrodatuetan

<div class="book">The title is <span property="http://purl.org/dc/terms/title">Die Ringe des Saturn</span> and it has <span property="http://purl.org/dc/terms/extent">371 p.</span></div>

<div itemscope itemtype="book">The title is <span itemprop="http://purl.org/dc/terms/title">Die Ringe des Saturn</span> and it has <span itemprop="http://purl.org/dc/terms/extent">371 p.</span></div>