Podes prosjektblogg

Berikelse av RDF-data etter import

Postet den 23. December 2010 | Skrevet av Asgeir | Ingen kommentarer

Etter import av konverterte RDF-data for Hamsuns og Pettersons FRBRiserte forfatterskap er det gjort noe arbeid med å forbedre og berike data:

Mer brukervennlige IDer for verk

I konverteringen gjenbrukte vi de unike IDene som ble generert av FRBRiserings-verktøyet. Disse var lange, kompliserte og lite brukervennlige. Vi erstattet derfor disse med mer uttrykksfulle verks-IDer basert på tittel og opphavsperson.

Lenking til eksterne datasett

Person- og verksinstanser er relatert til ressurser i DBpedia med egenskapen owl:sameAs. Denne egenskapen uttrykker at to URIer beskriver samme ting, og at det som finnes om informasjon om en ting i ett datasett, også vil gjelde for samme ting i det andre. I de tilfellene hvor uttrykk i vårt datasett har en korresponderende digital fulltekstutgave hos Project Gutenberg, er denne sammenhengen uttrykt med frbr:embodiment.

Årstall for førsteutgivelse

Vi ønsket å presentere verksliste kronologisk etter førsteutgivelse. Dette er informasjon som ofte legges inn i MARC-felt 503. Dette er imidlertid et notefelt hvor årstallet vil ligge i løpende tekst, og det er derfor vanskelig tilgjengelig. Feltet brukes dessuten også for andre typer oppslysninger om utgavehistorikk. Denne informasjonen er derfor senere lagt til som pode:firstEdition ved help av SPARQL.

Deler av verk

Hamsuns novellesamlinger «Kratskog», «Siesta» og «Stridende Liv» er oppført med biinnførsler for de enkelte novellene i MARC-postene, men dette er ikke tilfelle for diktsamlingen «Det vilde Kor». Her la vi inn egne verksinstanser for de enkelte dikt og relaterte dem til verket som representerer samlingen. Dette omfatter også deler av dikt.

Oppfølgere

Core FRBR-vokabularet inneholder egenskaper for å uttrykke at et verk har en oppfølger, eller at det er en oppfølger av et annet verk. Dette er informasjon som er vanskelig tilgjengelig fra MARC-postene, fordi den ligger som løpende tekst i notefelt. Vi la derfor på relasjoner av typene frbr:successor og frbr:successorOf ved hjelp av SPARQL.

Filmatiseringer og tonesettinger

Opplysninger om at en film er basert på et litterært verk vil i bibliotekkatalogen ofte finnes i notefelt i katalogposter for filmen, mens det ikke finnes noe motsvarende informasjon på katalogposter for bøker, som sier at denne boka er filmatisert. Tilsvarende gjelder for musikkstykker som er tonesettinger av dikt eller andre litterære tekster. I vårt datasett har vi brukt SPARQL for å uttrykke slike relasjoner begge veier. Til dette har vi brukt relasjoner fra Core FRBR (frbr:adaptation, frbr:adaptationOf), Linked Movie database (movie:relatedBook) og eget vokabular (pode:musicalSetting, pode:musicalSettingOf).

Kommentarer

Legg igjen en kommentar





  • RSS Linked data

  • RSS Semantic web

  • RSS FRBR

  • RSS Eksempler på mashups

  • RSS Tilgjengelig innhold

  • RSS Eksempler på katalogsøk (både trad og sosiale SOPAC

  • RSS Eksempler på systemer/produkter i bruk

  • RSS Fakta om/dokumentasjon av systemer/produkter

  • RSS Eksempler på biblioteksider