La de tusen blomster blomstre

bibsys logoLa de tusen blomster blomstre, eller «La hundre blomster blomstre og hundre tankeretninger strides», som Mao Zedong egentlig uttrykte det, er et uttrykk for å oppfordre til å få ideer fra mange ulike kilder. Når Fornyings- og administrasjonsminister i en artikkel 15/6 – 2012 på Regjeringen.no skriver at vi må «godta at de beste ideene kommer utenfra», så er dette et uttrykk for det samme.

 

bibsys logoLa de tusen blomster blomstre, eller «La hundre blomster blomstre og hundre tankeretninger strides», som Mao Zedong egentlig uttrykte det, er et uttrykk for å oppfordre til å få ideer fra mange ulike kilder. Når Fornyings- og administrasjonsminister i en artikkel 15/6 – 2012 på Regjeringen.no skriver at vi må «godta at de beste ideene kommer utenfra», så er dette et uttrykk for det samme.

Av Asbjørn Risan, produkteier BIBSYS

De beste ideene og de smarteste menneskene befinner seg som regel utenfor din egen bedrift/institusjon. Med dette utgangspunktet har staten satt søkelyset mot tilgjengeliggjøring av offentlige data. Ved å gjøre data tilgjengelig vil samfunnet som helhet tjene på at andre aktører kan bidra til verdiskapning gjennom tjenester som dataeieren enten ikke har tid, anledning, økonomi eller mandat til å utvikle.

     Bakgrunnen for regjeringens holdning er rapporten «Fra Altinn til alt ut?» fra Teknologirådet i 2010. Her er den klare anbefalingen at det offentlige bør tilgjengeliggjøre mer data.

     Ministeren slår også fast i sin artikkel at det ligger et enormt potensial i -offentlige data for verdiskapning og -etablering av nye produkter, tjenester og virksomheter:

     «Markedsverdien av offentlige data i Europa er av EU beregnet til over 200 milliarder kroner. Åpne data bidrar også til mer åpenhet, og gjør det offentlige mer transparent og lettere å se i kortene.»

Millionpotensial

I “NOU 2013:2 Hindre for digital -verdiskaping» anslås verdien av norske offentlige data til mellom 734,7 og 3184 millioner kroner. Selv om det er vanskelig å anslå verdi på tilgjengelige data -mener utvalget bak rapporten at «det er et stort ubenyttet potensial for verdiskaping gjennom økt tilgjengeliggjøring av offentlige data.»

     Staten ønsker å få realisert noe av dette verdipotensialet og har derfor gjennom fellesføringen til offentlige etater satt krav om at offentlige datasett som er finansiert gjennom offentlige midler skal gjøres offentlig tilgjengelig. I november 2012 publiserte Fornyings-, administrasjons- og kirkedepartementet Retningslinjer ved tilgjengeliggjøring av offentlige data hvor de slår fast prinsipper for datadeling i offentlig sektor.

Hva så med biblioteksektoren?

Også innen biblioteksektoren har det vært et økende fokus på tilgang på data. I artikkelen “Hvad fanden nøler I Efter» i Bok og Bibliotek nr. 3 2010, etterspør Unni Knutsen, Kim Tallerås og David Massey at aktører kommer på banen med offentlige bibliografiske data. Dette har igjen blitt aktualisert gjennom seminarrekken “Slipp dataene fri, det er vår», som Høgskolen i Oslo og Akershus gjennomførte i fjor.

     BIBSYS nøler ikke! Vi har i lengre tid tilbudt ulike grensesnitt for at maskiner kan hente ut data fra Bibliotekbasen. Når data.norge.no ble lansert av DIFI var BIBSYS tidlig ute med å registrere våre datasett. I forkant av lanseringen var også BIBSYS involvert i betatesting av tjenesten. Data.norge.no er Statens etablerte datakildekatalog over tilgjengelige datasett i Norge. Her kan alle som tilbyr data registrere sine data og målet er at utviklere på sikt vil «finne alle -norske datasett som er tilgjengelige for viderebruk.»

     I tillegg til data fra Bibliotekbasen har vi registrert BIBSYS Autoritetsregister som et tilgjengelig datasett. Gjennom et prosjekt mellom NTNU OG BIBSYS, finansiert av ABM-utvikling, ble BIBSYS Autoritetsregister over personnavn konvertert til linked data/rdf. Autoritetsregister inneholder også koblinger til Wikipedia og flere andre datakilder, noe som bidrar til at datasettet kan kobles til mange ulike andre datasett. Prosjektet fikk førstepremien for beste bibliotekprosjekt innen fagbiblioteksektoren i Bok og -Biblioteks kåring over prosjekter i 2011.

Lisensen viktig for bruk

Det at det er mulig å hente ut data, er ikke nok. Det er også nødvendig med retningslinjer på hvordan dataene kan brukes, hva man kan bruke dem til og under hvilke eventuelle forutsetninger dataene kan benyttes. Med andre ord hvilken lisens dataeieren har knyttet til dataene.

     Det at det står en skål med Twist på et bord betyr ikke nødvendigvis at det er fritt frem. Det er først med en eksplisitt tillatelse at man kan nyte sjokoladen med god samvittighet. Det er lisensen som er knyttet til dataene som er den eksplisitte tillatelsen som forteller hvordan dataene kan benyttes.

     Frem til nå har det ikke vært noen vedtatt lisens på data fra BIBSYS, med unntak av autoritetsregisteret som har vært lisensiert under PDDL. En lisens er en forutsetning for at allmennheten skal kunne vite hvilke vilkår dataene kan benyttes under. Styret for BIBSYS har derfor fattet følgende vedtak:

–   Styret vedtar å lisensiere bibliografiske data fra BIBSYS Bibliotekbase og andre relevante registre i BIBSYS.

–   Styret gir direktøren myndighet til å tilgjengeliggjøre dataene i den form og på den/de måten(e) direktøren til enhver tid finner hensiktsmessig.

–   Styret forutsetter at offentlige føringer blir fulgt.

På bakgrunn av dette har BIBSYS besluttet at:

–   BIBSYS benytter Norsk Lisens for Offentlige Data (NLOD), som anbefalt av Fornyingsdepartementet, på bibliografiske data.

–   Det vil være mulighet for andre lisenser ved spesielle behov.

–   BIBSYS vil legge inn mekanismer som gjør det mulig å utelukke deler av databasen ved behov.

Dette innebærer at data fra BIBSYS er lisensiert gjennom NLOD som er statens anbefalte lisens for offentlige data. Lisensen stiller ingen andre krav enn at de som bruker dataene sier hvor dataene kommer fra. Det betyr at data fra Bibliotekbasen fritt kan benyttes i alle mulige sammenhenger. Vedtaket åpner også for at dataene i spesielle tilfeller kan lisensieres med en lisens som er åpnere (stiller færre krav) enn NLOD.

Hvordan få tak i dataene?

BIBSYS tilbyr i hovedsak data fra Bibliotekbasen gjennom to anerkjente datautvekslingsprotokoller; Search/Retrieval via URL (SRU) og Open Access Initiativ-Protocol for Metadata Harvesting (OAI-PMH). Dataene er tilgjengelig på formatene Dublin Core og marc21 (MARCExhange). Autoritetsregisteret er tilgjengelig som linked data via et Sparql søkegrensesnitt og som nedlastbar fil, i tillegg til gjennom SRU og OAI-PMH.

     SRU er en søkeprotokoll som gir resultater i sanntid basert på et søkeutrykk. SRU erstatter søkeprotokollen Z39.50. Resultatet er i form av XML og de bibliografiske postene er tilgjengelig som MARC eller Dublin Core. Det er også mulig å søke i autoritetsregisteret ved hjelp av SRU. Du kan lese mer om SRU på BIBSYS’ nettsider: http://www.bibsys.no/norsk/produkter/
biblioteksystemet/sru.php.

     OAI-PMH er en høstingsprotokoll hvor man laster ned hele eller deler av databasen basert på definerte subsett av databasen. Ved hjelp av dato- avgrensning kan man foreta inkrementelle høstinger av de postene som er endret siden forrige innhøsting. Når dataene er høstet ned kan de bearbeides lokalt og brukes i ulike sammenhenger. Du kan lese mer om OAI-PMH på BIBSYS’ nettsider: http://www.bibsys.no/norsk/tjenester/innhosting_av_metadata.php.

     Nasjonalbiblioteket benytter blant annet OAI-PMH i forbindelse med digitaliseringsprosjektet og for innhenting av data til Biblioteksøk. Ved hjelp av SRU kan de også i sanntid hente inn -dokumentstatusen til et gitt dokument. Det nye gjenfinningssystemet for BIBSYS Biblioteksystemkonsortium, oria.no, benytter OAI-PMH for høsting av data fra Bibliotekbasen.

     På nettsiden http://www.bibsys.no/betadata har vi samlet små og store eksempler på “ny» bruk av metadata og alternative tilganger til metadata enn mer tradisjonelle søk i Bibliotekbasen. Her finner du litt informasjon om tilgjengelige tjenester og datakilder.

     Merk at lisensieringen av dataene gir fri bruk av dataene, men at dette ikke nødvendigvis gjelder tilgangen. Alle kan fritt benytte SRU-tjenesten slik den foreligger og det er denne inngangsportalen som vil være den primære og den vi i størst mulig grad vil oppfordre til å -benytte.

     Ved behov for tilleggstjenester, spesialtilpasninger, krav til tilgjengelighet og lignende vil det kunne være aktuelt med en driftsavtale for å få tilgang til dataene. Dette gjelder i all hovedsak OAI-PMH som er en systemtung protokoll. Det vil være en fordel å ta kontakt med oss for en avklaring i forkant.

     Per i dag benyttes OAI-PMH-tjenesten i tillegg til Nasjonalbiblioteket også av Universitetet for miljø- og biovitenskap (UMB) som høster data på vegne av FAO AGRIS og av NORA (Norwegian Open Research Archives) som henter data til sin søketjeneste.

     Styrevedtaket gir vide fullmakter til å tilpasse hvordan dataene gjøres tilgjengelig og hvordan dataene skal se ut. Det innebærer at BIBSYS kan være fleksible hvis det dukker opp noen spesielle behov. Vi oppfordrer alle til å ta i bruk data fra BIBSYS Bibliotekbase og skape nye spennende tjenester.

     Vi har sluppet dataene fri og gleder oss til å se de tusen ideer blomstre.

Kilder:

http://www.regjeringen.no/nb/dep/fad/dok/lover-og-regler/retningslinjer/2012/retningslinjer-ved-tilgjengeliggjoring-a.html?id=708912

http://www.regjeringen.no/nb/dep/fad/dok/nouer/2013/nou-2013-2.html?id=711002

http://www.teknologiradet.no/Offentlige_data_for_web_vmjSK.pdf.file

http://www.regjeringen.no/nb/dep/fad/aktuelt/taler_og_artikler/minister/taler-og-artikler-av-fornyings--og-kirke/2012/evig-eies-kun-det-delte.html?id=685848

- - - -

Artikkelen står på trykk i Bok og Bibliotek nr 4/2013.