Podes prosjektblogg

FRBRisering del I

Postet den 10. February 2010 | Skrevet av Anne-Lena | Ingen kommentarer

Vi har vært så heldige å få med oss Trond Aalberg på laget i vårt forsøk på å FRBRisere deler av Deichmans katalog. Aalberg har utviklet et verktøy for å FRBRisere eksporter av bibliotekkataloger. Særlig kjent er FRBRiseringen av BIBSYS’ katalog.

Vi har valgt ut fire forfatterskap vi ønsker å FRBRisere. Dette er materiale om og av J.R.R Tolkien, William Shakespeare, Per Petterson og Knut Hamsun. Dette anser vi for å være et representativt utvalg av den skjønnlitterære delen av en folkebibliotekkatalog. Vi har særlig lagt vekt på å få med forfatterskap med utgaver på flere språk (her også bokmål og nynorsk), forfatterskap med mange utgaver av verk og flere ulike uttrykk (lydbøker, filmatiseringer, filmmusikk, tidsskrift, musikknoter).

Først eksporterte vi fire filer fra bibliotekkatalogen via vårt fine eksportscript levert av BibliotekSystemer. En fil per forfatter, i MARCXML-format. Filene ble sendt til Trondheim og i retur fikk vi første versjon. Her får vi ut rå XML-filer med lenkede FRBR poster. Første utkast inneholder lenker mellom verk, uttrykk, manifestasjon og person.

I samarbeidet med Aalberg har vi brukt et svn repository. Det gjør at vi slipper å sende filer på e-post og enkelt kan samarbeide mot oppdaterte versjoner av alle filer. Det første vi måtte gjøre var å installerte en svn-klientprogramvare. Siden maskinene våre stort sett har Windows som operativsystem måtte vi finne en Windowsklient. Valget falt på Tortoise – et program for enkel behandling av egne og synkronisering mot eksterne repositories via Windows utforsker. Vi satte så opp synkronisering mot Aalbergs repository på NTNU.

Oppsettet for FRBRisering består av fem kataloger (dokumentasjon, jar, rules, testdata og xslt) og en run.bat fil. I katalogen rules ligger databasen som inneholder reglene for hvordan postene skal tolkes. Databasen som benyttes er en MS Access database. Reglene i databasen eksporteres til en XML-fil som brukes for å generere et konverteringsprogram (ei XSLT-fil). Når vi kjører run.bat blir filene i katalogen testdata/input FRBRisert ved hjelp av konverteringsfila og resultatet havner i katalogen testdata/output. De FRBRiserte resultatene ligger i en rå XML-fil som kan leses i en XML-editor eller direkte i en nettleser.

Reglene og resultatet kommer vi tilbake til i senere bloggposter.

Kommentarer

Legg igjen en kommentar





  • RSS Linked data

  • RSS Semantic web

  • RSS FRBR

  • RSS Eksempler på mashups

  • RSS Tilgjengelig innhold

  • RSS Eksempler på katalogsøk (både trad og sosiale SOPAC

  • RSS Eksempler på systemer/produkter i bruk

  • RSS Fakta om/dokumentasjon av systemer/produkter

  • RSS Eksempler på biblioteksider