NBF legger årets kinderegg?

kinderegg-hvitt.jpgEtter å ha søkt boka fram i Google Boksøk vil man muligens foretrekke å låne boka på et bibliotek. Denne tjenesten framstår som lettere bisarr for norske bøker.

- Av Unni Knutsen og Ragnar Nordlie, Høgskolen i Oslo, JBI

kinderegg_gul.jpg Etter å ha søkt boka fram i Google Boksøk vil man muligens foretrekke å låne boka på et bibliotek. Denne tjenesten framstår som lettere bisarr for norske bøker.

I midten av desember i fjor kom Google Books til Norge i form av en betaversjon kalt Google Boksøk. Den som går inn på http://books.google.no/ kan søke i norsk grensesnitt på norske bøker i mer eller mindre fulltekst, avhengig om bøkene har ”falt i det fri” eller er opphavsrettslig beskyttet. I følge presseoppslag og informasjon på nettstedet kommer bøkene som digitaliseres fra to kilder: det såkalt partnerprogrammet og bibliotekprosjektet.

    I partnerprogrammet deltar enkeltforfattere og utgivere. Google frister utgivere med at bøkene gjennom digitalisering får økt oppmerksomhet. Dermed øker salget. Samtidig beskytter man opphavsrettslig materiale fra visning og nedlasting i fulltekst. Her på berget har det vært berammet møter mellom Bokhandlerforeningen og Google. I følge flere norske aviser er Gyldendal interessert. Foreløpig er det langt mellom norske bøker i fulltekst. Visning av utdrag av innholdet eller ingen visning i det hele tatt er snarere regelen enn unntaket.

    Blant bibliotekene som har stilt sine samlinger til disposisjon for skanning er Bayerischen Staatsbibliothek, New York Public Library og Bodleian Library ved University of Oxford. I følge New York Public Library oppnår biblioteket følgende ved å gå inn i ordningen:

    “This collaboration will greatly expand the accessibility of the Library's collections and support its mission of providing the public with free and unlimited access to information and knowledge resources. In this pilot program, NYPL is working with Google to offer a collection of its public domain books, which will be scanned in their entirety and made available for free to the public online. Users will be able to search and browse the full text of these works. When the scanning process is complete, the books may be accessed from both The New York Public Library's website and from Google.”

 

NBFs supersøk

Etter å ha søkt boka fram i Google Boksøk vil man muligens foretrekke å låne boka på et bibliotek. Denne tjenesten framstår som lettere bisarr for norske bøker fordi man har koblet seg opp mot WorldCat og våre nabolands felleskataloger. Dersom noen ønsker å låne Lars Saabye Christensens Beatles henvises man til Bibliotek.dk, mens Arne Kildals Bibliotek og folkeopplysning kan fås på Kungliga biblioteket og Högskolan i Borås.

    For øvrig inneholder Google Boksøk en del meget interessante fasiliteter som innholdsfortegnelse, populære avsnitt, mulighet til å søke på ord og fraser i boken, lenker til anmeldelser, sortering på utgaver, henvisninger fra bøker og vitenskapelige arbeider m.v., samt kuriositeter som kartvisning av alle geografiske navn nevnt i bokteksten.

    En annen webtjeneste som utnytter fritekst på en meget besnærende måte er Amazon.com. Deres ”Search Innside” – tjeneste, deres koblinger mot salgsdata m.v. gir brukerne et unikt utgangspunkt for å navigere i bøkene, henvises videre til bøker med liknende emne, samt selv bidra med anmeldelser og lignende.

    kinderegg-hvitt.jpgTydelig inspirert av disse tjenestene og kanskje skremt av konkurransen (?) lanserte Norsk Bibliotekforening et forslag i Aftenposten 19. desember om et norsk ”supersøk”. På nettstredet til foreningen sammenfattes dette slik: ”Muligheten til å søke i både katalogdataene og i den fulle teksten i bøkene vil øke utnytelsen av de fysiske samlingene og samtidig gjøre bibliotekas webtjenester til et must for alle kunnskapssøkende.” Et skikkelig kinderegg med andre ord!

    Som NBF ganske riktig påpeker, tilbyr mange norske bibliotekkataloger i dag omtaler, omslagsbilder og i enkelte tilfeller også innholdsfortegnelser av bøker. Samtidig savner vi mange av de fasilitetene som Google Boksøk og Amazon gir, fordi vi presenterer brukerne for surrogatpresentasjoner av dokumenter og ikke søking i selve dokumentene i fulltekst. At vi heller ikke utnytter søkehistorikk til å lage koblinger som ”andre som har lånt, lånte også…” eller har så mange ”2.0-effekter” som disse tjenestene, lar vi ligge i denne omgang.

 

Krydder

Likevel hevder NBF at bibliotekene kan ta opp konkurransen med disse gigantene. For det første har Nasjonalbiblioteket startet et digitaliseringsprosjekt av norske bøker. Til nå er det for det meste digitalisert eldre litteratur der det ikke lenger er rettighetsproblematikk knyttet til offentliggjøring. Dersom Nasjonalbiblioteket kunne forhandle med rettighetshaverorganisasjonene, kunne man i følge NBF utvide skanningen til i større grad å dreie seg om nyere litteratur.

    Det andre konkurransefortrinnet vi har i følge Anders Ericsons innlegg på NBFs hjemmeside er at vi ved å knytte fulltekstdokumenter til katalogen kan tilby både strukturerte metadata og søking i fulltekst. Her ligger det definitivt et stort gjenfinningsmessig potensial, men å få dette potensialet realisert er trolig en langt større utfordring enn å krydre katalogen med bilder, kart og kommentarer.

    Både bibliotekkataloger og fulltekstsøkesystemer har, ved siden av evnen til å lokalisere et kjent dokument, som formål å sette dokumenter inn i sammenhenger som antas å være så nyttig som mulig for brukere. I bibliotekkatalogen er disse sammenhengene veldefinerte, velstrukturerte og forutsigbare. Hvis katalogen har ivaretatt sine muligheter, kan dokumentet knyttes presist og entydig sammen med andre med samme opphavsmann, emne, nivå osv., og brukeren kan vises tydelig vei gjennom disse sammenhengene. Ulempen er at katalogen bare viser et lite utvalg av mulige sammenhenger (og at mange kataloger utnytter sine muligheter på en dårlig måte).

    I fulltekstsøkesystemet settes dokumentet inn i assosiative, upresist definerte sammenhenger som åpner for en mengde uventede funn, og en mengde frustrerende tolkningsarbeid. Skal vi konstruere systemer som har som ambisjon å gi brukere tilgang til begge disse typene sammenhenger, er forklaringsutfordringene når grensesnitt og søkefunksjonalitet skal utformes formidable.

 

NB Digital

Noen raske prøvesøk i Google Boksøk (som rett nok er en betaversjon til utprøving, ikke noe endelig produkt) illustrerer problemene. Søker vi i det vanlige ”Google-søkevinduet”, vil et søk på ”Trondheim” presentere en årgang av Norsk Bokfortegnelse på prominent plass i svarsettet, med visning av utklipp fra 36 sider inneholdende referanser til dokumenter som har Trondheim som utgivelsessted. Et søk på ”Svalbard isbjørn” gir omtrent halvt om halvt treff på pattedyret og på polarskuta ”Isbjørn”.

    Søking på denne måten kan være nyttig hvis det brukeren ønsker er referanse til en tekst med kjent innhold, for eksempel et sitat eller et dikt der bare deler av teksten huskes. Den er lite brukbar hvis brukers behov er stoff om et emne.

    Nå tilbyr Google Boksøk også forskjellige søkeavgrensinger, blant annet mulighet til å søke på emne. Her bruker Google tilgjengelige metadata til å gjøre søkbare alle ord som kan antas å ha emnemessig innhold. Problemet blir imidlertid det samme: Et søk på ”Oslo” gir dokumenter med alle avskygninger av tilknytning til Oslo, fra ”Kartbok over Oslo og omegn” til ”Italienske kunstskatter i Nasjonalgalleriet”. Treffmengden er forvirrende stor allerede i det lille antallet dokumenter boksøket har tilgang til i dag. Søkemuligheter kan lett komme til å forveksles med søkeønsker, vi kan tro at brukere ønsker fullstendighet selv når tekstmassen fullstendigheten hentes fra blir uoverskuelig stor. Sannsynligvis er brukerne bedre hjulpet med fortolkede treff gjennom både tradisjonelle og nye søkeinnganger.

    En rekke biblioteksystem har valgt å gjøre sine katalogposter tilgjengelige for Google eller andre søkemotorer. Google Boksøk viser som nevnt over treff i Libris og Bibliotek.dk. Dette gir nyttig lokaliseringshjelp, men en slik strategi for å spre tilgang til samlingene på nettet kutter forbindelsen til den sammenhengen med andre dokumenter som katalogposten har som formål å skape. Postene risikerer å ende opp med å bidra til å øke forvirringen i trefflistene.

    Nasjonalbibliotekets digitaliseringssatsning gir en storartet mulighet til å bruke katalogdata og autoritetsregistre til å strukturere kaoset som fulltekstsøk i så store og forskjelligartede tekstmasser lett skaper. Det finnes imidlertid lite kunnskap om konsekvensene av fulltekstsøk i store samlinger boktekster, og struktureringsmulighetene som katalogdataene tilbyr, utnyttes ikke engang i dagens katalogsystem i særlig stor grad. Et stort forsknings-, forsøks- og utviklingsarbeid venter. Belønningen for fremtidige brukere kan imidlertid bli stor!

 

- Av Unni Knutsen og Ragnar Nordlie, Høgskolen i Oslo, JBI