Google – det beste alternativet for digitalisering?

Odd Letnes

Publisert 13.05.2009 - 07:41 Sist oppdatert 13.05.2009 - 07:41

Hvilken rolle kan norske biblioteker
spille i forhold til digitalisering og tilgjengeliggjøring av den norske
kulturarven?

Er det
Nasjonalbibliotekets digitaliseringsprosjekter som vil lede an, eller er det mer
sannsynlig at Google kommer og tar over – og er det i så fall positivt eller
negativt at Google kommer?

Thomas Gramstad, leder for EFN, har snakket med Pål Lykkja, som er universitetsbibliotekar og fagreferent i samfunnsøkonomi
ved Universitetet i Oslo.

Hvilken rolle kan norske biblioteker
spille i forhold til digitalisering og tilgjengeliggjøring av den norske
kulturarven?

Er det
Nasjonalbibliotekets digitaliseringsprosjekter som vil lede an, eller er det mer
sannsynlig at Google kommer og tar over – og er det i så fall positivt eller
negativt at Google kommer?

Thomas Gramstad, leder for EFN, har snakket med Pål Lykkja, som er universitetsbibliotekar og fagreferent i samfunnsøkonomi
ved Universitetet i Oslo.

Pål Lykkja: Det som er viktig er å
kunne litt historie. Cisco konstruerte den fyrste routeren som gjorde at PCar
kunne kommunisere med kvarandre, for så å lage innlåsingar seinare. Ein må vere
merksam på at Google kan gjere liknande ting, så ei heilheitleg analyse er viktig.
Biblioteka får eigen kopi av bøkene, og ein kan skanne dei sidan også på eiga
hand.
Kva slags rolle spelar eigarstrukturen sidan Yahoo består hovudsakleg av
institusjonelle investorar som pensjonsfond og "investment banking" –
der grunder og toppleiaren har lite å seie? Google består av mange insiderar
med teknologikompetanse og lang historie i selskapet og med sterk lojalitet til
Google sin langsiktige forretningside.

Kva slags rolle spelar Google sin forretningsmodell for
norske biblioteker, korleis samhandlar Google med andre økosystemer i cyberspace
(Microsoft, MySpace, fri/åpen programvare osb.) og kva slags konklusjonar kan
ein trekkje ut av dette?

Noreg er ein alt for liten marknadsplass til at ein kan få
tak i relevant kompetanse på veldig mange områder. Ein må satse på fri/åpen programvare
som har hovudbasa si i cyberspace i utgangspunktet, eller ein må satse på eit
selskap som har så nære bindingar som mogleg til fri/åpen programvare. Google
peikar seg naturleg ut.

Gramstad: Da burde vel Open Content
Alliance (OCA) være et godt utgangspunkt?

Lykkja: Open
Content Alliance (OCA)[1] har dårlegare målsetjingar sidan dei ikkje tek sikte
på å gjere "orphaned works" søkbare. OCA har heller ikkje som
målsetjing å vidareutvikle "fair use" og brukerrettigheter for det 21
århundrets behov, og OCA er avhengig av økonomisk innsprøytning og
vidareutvikling frå Microsoft og Yahoo. Microsoft og Yahoo har vorte med i OCA
som ein defensiv reaksjon til Google Books, dvs. for desse to selskapa så
fungerar OCA kun som ein begrensa oppdemmingsfunksjon. OCA er ikkje, og vil ikkje
vere eit hovudsatsingsområde for Microsoft og Yahoo slik det er for Google.

Gramstad: Men dagens opphavsrett er
problematisk?

Lykkja: Når det
gjeld definisjonen av opphavsrett spelar Google ei viktig rolle. For eit par
hundre år sidan så var slavar definert som "eigedom" i USA. Ein må ha
i mente at etter den amerikanske loven og den opprinnelege engelske patentlovgivninga,
så er opphavsrett fullt ut definert etter samfunnskontraktmodellen til Rosseau,
akkurat som demokratiet. Demokratiet er forskjellig definert frå land til land,
og antal representantar og utjamningsmandater endrast etter skiftande
geografiske og andre behov heile tida.

Slik må også opphavsretten endre seg i takt med tida, og med
internett så har føresetnadane endra seg så dramatisk at ein treng ein
grunnleggjande revisjon av denne samfunnskontrakta mellom samfunnet og
innhaldsprodusentar. Fast eigedom er definert utifrå menneskerettane, akkurat
som at det er ein menneskerett å eige det ein treng for å overleve (mat).
Skulle ein definere opphavsrett utifrå menneskerettane så måtte ein skattleggje
dette på linje med annan eigedom, det kunne vore artig.

Gramstad: Hva kan
Nasjonalbiblioteket gjøre i denne sammenhengen?

Lykkja: Nasjonalbiblioteket har
ikkje sjanse aleine, men i samarbeid med Google, kan dei greie å gjere langt
meir norsk innhald tilgjengeleg. Samstundes vil dette skape forretningsmulegheiter
for norske innhaldsprodusentar.

Google er bortimot teknologinøytrale i motsetjing til
Microsoft, og sidan Yahoo kanskje vert ein del av Microsoft, så vil også dette
vere relevant for Yahoo. Så sjølv om OCA seier at skanna kopiar skal vere tilgjengelege
for alle, så kan innhaldet byggjast på i andre konstellasjonar som ikkje er
teknologinøytrale, og Microsoft kan då bruke dette innhaldet som ei brekkstang
for å få folk til å kjøpe produkta deira.

Her er skilnaden mellom Google og Microsoft fundamental
sidan Google gir full tilgang mot at ein stillar seg open for reklame, medan
Microsoft kan nekte tilgang til innhaldet viss ein ikkje kjøpar produkta deira.
Microsoft har på eit vis overført fysiske produkters ibuande EKSKLUSIVITET og
KNAPPHEIT inn i programvareverda i form av binær kjeldekode og utnytting av
innlåsningsmekanismer.

Google baserar forretningsmodellen sin på INKLUSIVITET og
RIKELEGHEIT noko som er to hovudeigenskapar ved nettet. Det kostar like lite å
sende ein spam som ein million, så Google brukar spamprinsippet på motsatt
måte, slik som fri/åpen programvare.

Gramstad: Du er skeptisk til
Microsofts evne til å overleve?

Lykkja: Framtida for programvare er
nettet: Gartner har no spådd at Microsoft vil dø på grunn av sine monolittiske
problemer og at dei tviheld på ein forretningsmodell frå ei tid der produkter
var i fysisk form. Sidan Yahoo sannsynlegvis vert eit verkty for Microsoft for
å forlenge denne fasa så er desse to utelukka. Fast (søkemotorfirma) er ein del
av Microsoft også, så då er det berre Google igjen som baserar seg på nettet
sine prinsipper med inklusivitet og rikelegheit. Nasjonalbiblioteket må basere
sin strategi på føresetnadar som er relevante i det 21 århundrets datanettverk,
ikkje industrisamfunnets føresetnadar og mekanismer.

Det er fullt mogleg å utvikle proprietære løysingar og
samstundes gi positive bidrag til Cyberspace; Google er eit godt døme på dette.
Microsoft si rolle som positiv samlande faktor på maskinvareprodusentar er
uttømd for lenge sidan. Nasjonalbiblioteket og det offentlege har tradisjonelt
vore "offisielt" teknologinøytrale, akkurat som næringsnøytralitet
har vore eit viktig prinsipp i samfunnsøkonomien i mange tiår. Ein har handtert
Microsoft, Yahoo og Google som om dei var meir eller mindre like.

Gramstad: Hvorfor
det?

Lykkja: Ein er
redd for å verte stempla som fanatikar, svart-kvit tenkjande og
kjepphestryttar, samt at mange ikkje orkar eller ser relevansen i å nyansere.
Multinasjonale selskaper er liksom "same ulla" så det er ingen vits i
å bryte det heilage næringsnøytralitetsprinsippet. Då slepp ein å forklare
kvifor, og ein slepp å tirre på seg den store mengda med kontorprogramvareleverandørar
som har basert framtida si på Microsoft. Denne inndelinga er feil. Det er meir
riktig å samanlikne med graviditet, det går som alle veit ikkje an å vere "litt"
gravid. Anten så fylgjer ein det 21. århundrets premissar for informasjons- og
nettverksøkonomi, elles så fylgjer ein det 20. århundrets premissar for
industriøkonomi. Google vart "født" i det 20. århundret, men er
likevel eit barn av det 21. århundrets premissar. Microsoft vart født i 1975 og
har for djupe røter i det 20. århundrets premissar til at dei greier å leve opp
til det 21. århundrets krav. Ein må sjå på drivkreftane i dei ulike selskapa.

Gramstad: Ja, etter at Microsoft ble
med i OCA har de fått OCA til å legge inn restriksjoner på bøker skannet inn av
OCA slik at andre søkemaskiner (f.eks. Google) ikke får anledning til å finne
og vise verk digitalisert av OCA. Dette er samme type produktinnlåsing som vi
kjenner fra Microsofts programvare og filformater fra før. Tilsvarende
restriksjoner legger OCA på akademisk bruk av verk skannet inn av Microsoft.
Dette til forskjell fra Google Book Search, der målet for digitaliseringen er
at alle verk skal kunne finnes av alle.

Men: Når Google skanner inn bøker i "public
domain", så legger de en restriktiv "kun til ikke-kommersiell
bruk"-lisens på PDF-dokumentene[2]. "Public domain" betyr jo at
opphavsretten er utløpt og at bøkene er fritt tilgjengelige, så her innfører
Google sine egne restriksjoner på de digitale utgavene, tydeligvis ut fra ønske
om å kontrollere og tjene penger på kommersiell bruk. Kan det tenkes at Googles
store digitaliseringsprosjekt er en trussel mot "public domain" og frie
digitale allmenninger?

Lykkja: Eg trur Google kan leggje
restriksjonar på sin kopi, men viss originalen er i "public domain"
kan kven som helst andre skanne boka og leggje den fritt ut. Eg ser problemet,
men synes ikkje det er noko stort problem.

Gramstad: Et annet problem er at
Google virker lite interessert i og unnlater eller slurver med metadata om de
innskannede verkene[2]. Dette kan medføre store problemer for fremtidens
oversikt over og katalogisering av digitale verk. Det har blitt sagt at livsvilkårene
til og verdien av fremtidens digitale allmenninger vil være avhengig av at det
også finnes tilsvarende felles allmenninger for metadata – at alle biblioteker
bør dele sine metadata med alle andre biblioteker og med resten av verden. Hva tror
du om dette problemet, kan bibliotekene gjøre en felles innsats som monner her?

Lykkja: Grunn til at ein slurvar er
at ein får jobba mykje raskare, og då er det verd slurvet. Dei gjer heile boka
søkbar, ikkje berre metadataene, og det ligg gode metadata i trykte biblioteker
som kan brukast til kontroll. Men også i trykte biblioteker er det mykje slurv
og attståande arbeid. Det viktigaste er å få alt digitalisert, så kan ein rydde
etterpå. Viss ein skal gjere alt perfekt så vil det koste enorme summar og ta enormt
lang tid. Måtte kanskje dobla norske bibliotekstilsette for å få full orden på
alt me har av trykt materiale, så når me har problemer med dette sjølve etter
så mange år, så seier det seg sjølv at eit digitaliseringsprosjekt med skalaen
til Google Books, ikkje ville vorte ein realitet. Dessutan så er det mogleg å
klage på og feilmelde kvar einaste side av skanna bøker, eller heile verket
dersom ein finn feil. Det er enkelt og kjapt både for brukarane og
sannsynlegvis også Google å rette på metadata og skanneresultat på denne
Wikipedia-aktige måten.

Google sankar mesteparten av kompetansen sin frå fri programvaremiljøer, og
skulle Google leggje seg ut med miljøa for fri/åpen programvare så underminerar
dei si eiga base for kompetanse og konkurransekraft. Fri programvare har det
til felles med Google sine algoritmer at dei er fundert på det vitskaplege prinsippet
om å byggje systematisk på andres kunnskap. Søkealgoritmen til Google liknar på
Web of Science sitt prinsipp, rekrutteringspolitikken er veldig fokusert på
akademisk sterke kanditatar framføre gode selgjarar. Hadde eg vore Nasjonalbiblioteket
så ville eg heller ha samarbeida med ein vitskapleg orientert organisasjon enn
ein salgsorganisasjon. ISO-sertifiseringa av OOXML er eit godt døme
på korleis det går når salg går føre alle andre omsyn.

For kontraktsdetaljer for massedigitaliseringsprosjektar vil eg vise til
University of California sin gode modell[3]. Det er sikkert ein god del
variasjonar i desse kontraktene avhengig av materiale og geografisk
juridiksjon.

Gramstad: Et tredje problem med
Google er all informasjonen som Google sitter med om brukerne. Man kan tenke
seg en fremtidig situasjon der Google sitter med informasjon om alle verk en
bruker har søkt etter eller lest, og omfattende lister over hvem som har lest
et gitt verk, og at dette er informasjon som både myndigheter, overvåkere og
kommersielle aktører vil være interessert i å få tilgang til. Cory Doctorow
beskriver i en novelle[4] et fremtidig overvåkningssamfunn der disse aktørene
har tilgang til all denne informasjonen. Hva tror du om denne
problemstillingen?

Lykkja: Når det gjeld handsaming av
private personlege data så er Google best i klassen. Dei er dei einaste som har
stritta knallhardt imot amerikanske styresmakter, og dei har ei god historie i
Kina samanlikna med Microsoft og Yahoo. Reportere utan grenser brukar sjølv
Google Custom search for sine sider, og eg har fylgd med opp gjennom åra med
omsyn til søkemotorar og diktaturer, og det er ikkje tvil om at Google har best
"track record" her. Du kan få ein 8-10 lenker når du vil for å vise
kva eg meinar.

Gramstad: Ja takk!

Lykkja: OK, se her her:

Chinese bloggers posting their
thoughts via Microsoft’s netservice face restrictions on what they can write.
http://news.bbc.co.uk/2/hi/technology/4088702.stm

Reporters without borders utropar Yahoo til den desidert mestsensurerande, og som til og med fekk to bloggarar i fengsel.
Yahoo helped jail China writer
(2005)
http://news.bbc.co.uk/2/hi/asia-pacific/4221538.stm

Yahoo clearly worst offender in censorship tests on search engines
http://www.rsf.org/article.php3?id_article=18015

Analysis: Yahoo’s China problemAhead of a Congressional hearing, the Chinese Web portal has been blamed for the jailing of a second Chinese dissident. (2006)
"How many Chinese citizens are now in jail because of information Yahoo provided to the Chinese government? That is the question the not-for-profit Reporters Without Borders is asking."
http://money.cnn.com/2006/02/08/technology/yahoo_china_b20/

China blocking Google (2002)
"Analysts say this is the first time Beijing
has blocked access to an internet search engine."
http://news.bbc.co.uk/2/hi/technology/2231101.stm

China blocks Google news site (2004)
http://news.bbc.co.uk/2/hi/technology/4056255.stm

Google censors itself for China "Its e-mail, chat room and blogging
services will not be available because of concerns the government could demand
users’ personal information. (Og dermed mista marknadsmakt, medan Yahoo
fekk to bloggarar i fengsel i årevis, og Microsoft fjerna på eiga initiativ dei
som var "ulydige".)
"Google said it planned
to notify users when access had been restricted on certain search terms." (Og
når dei gjorde dette så vart kinesiske styresmakter skikkeleg forbanna!)
http://news.bbc.co.uk/2/hi/technology/4645596.stm

Microsoft takes down Chinese blogger (2006). "Note, his blog was TAKEN
DOWN by MSN people. Not blocked by the Chinese government."
http://rconversation.blogs.com/rconversation/2006/01/microsoft_takes.html

Lykkja: Desse lenkane er
dokumentasjon på at Google ikkje kan samanliknast med Microsoft og Yahoo
overhovudet når det gjeld Kina. Yahoo er informant for kinesiske styresmakter
og sørgar for å få folk i fengsel i tiår for å få marknadsmakt i Kina. Og medan
Google på eiga initiativ har droppa å tilby pratekanalar og bloggar, så har Microsoft
teke sjansa og sensurert dei skikkeleg. Google har vore nede og strippa vekk
personverntruande funksjonar mange gonger, medan Microsoft og Yahoo har jobba i
ro og mak med mesteparten av tenestene sine.

Det som er så rart er at "Trusted computing"-initiativet til Microsoft[5] er eit langt større trugsmål enn Googles hav med informasjon. Med "Trusted
computing" så kan kineserane til dømes bestemme seg for at ingen ord som
til dømes fridom eller demokrati vert mogleg å skrive, lagre eller dele med
nokon andre kinesiske computerar, og dersom nokon bryt med dette så kan dei
øydelegge PC’en din automatisk.

Einaste reelle måten å forsvare personvern på er å bruke fri programvare, men
me er avhengige av kommersielle aktørar også, så ein må nok nøye seg med ein
mellomting inntil vidare. Ein må også vere kontinuerleg på vakt mot idiotiske
forslag frå Økokrim til dømes (jfr. Datalagringsdirektivet), men mest av alt storebror-teknologiar
som "Trusted computing". Det er også naudsynt å byggje opp eit
kraftfullt tilsynsorgan med store ressursar og reell vedtaksmakt, dvs. ikkje
slik Datatilsynet fungerar i dag.

Gramstad: Har du noen spesielle
anbefalinger til slutt?

Lykkja: Eg vil seie at den korte
boka "In The Beginning Was the Command Line"[6] er obligatorisk
bakgrunnsmateriale for alle dei som er med på å forme digitaliseringspolitikken
i Noreg. Jeg vil også anbefale
ein artikkel frå First Monday, som kjem innpå ein hovudgrunn til at eg likar
Google:

"The strongest case for open access and freedom in information and communications
is grounded in a liberalism that takes maximizing individual freedom as its
objective and relies on creative complementarities between property and commons
regimes as means to that end."[7]

– – – – – –
– –

Kildehenvisninger

[1] Open Content Alliance er et konsortium for å bygge arkiver av
digitaliserte verk der bl.a. Internet Archive, Yahoo og Microsoft
er med, se http://en.wikipedia.org/wiki/Open_Content_Alliance .

[2] Se f.eks. Robert B.
Townsend: Google Books: Is It Good for
History?
http://www.historians.org/Perspectives/issues/2007/0709/0709vie1.cfm

[3] UC Libraries Mass Digitization Projects
http://www.cdlib.org/inside/projects/massdig/faq.html [4] Om novellen: Scroogled: CC-licensed story about the day Google
turned evil
http://www.boingboing.net/2007/09/17/scroogled-cclicensed.html
Selve novellen: Scroogled
http://www.radaronline.com/from-the-magazine/2007/09/google_fiction_evil_dan
gerous_surveillance_control_1.php ).
Sammenlign også med:
Net danger: Online searches are new, and problematic, tools for
border guards,
http://www.montrealmirror.com/2007/070507/news1.html [5] Se f.eks. http://efn.no/tcpa-faq-no.html , og dessuten
Richard Stallman: Can You Trust Your Computer?
http://www.gnu.org/philosophy/can-you-trust.html og
Bruce Schneier: Who Owns Your Computer?
http://www.schneier.com/blog/archives/2006/05/who_owns_your_c.html [6] Lenke til en forkortet nettversjon:
Neal Stephenson: In the Beginning was the Command Line
http://www.cryptonomicon.com/beginning.html [7] Milton Mueller: Info-Communism? Ownership and freedom in the
digital economy,
http://www.uic.edu/htbin/cgiwrap/bin/ojs/index.php/fm/article/view/2058/1956

Ønsker du å sende mail til Pål Lykkja: p.m.lykkja@ub.uio.no

Forrige artikkel

Det kulturelle lånekortet

Neste artikkel

Studenter ser framover -1.plass

aktuelt

Google – det beste alternativet for digitalisering?

Det kulturelle lånekortet

Studenter ser framover -1.plass

Svar om J.K. Rowling og mobbing

Skolebibliotek trenger drahjelp, ikke bare penger

Kommuneøkonomi: Biblioteka får det verst

Bok & bibliotek sin omtale av J.K. Rowling er mobbing

Tinnesand motstraums om skulebibliotekmillionar

12 millioner til bøker fjernet fra revidert nasjonalbudsjett! Hvorfor?

Skulle gje 12 mill til skulebibliotek, gav 0,–

Fem år i Deichman Bjørvika

Avfortryllingen av J.K. Rowling

Slik gjekk det då Stortinget diskuterte bibliotek

Bibliotekprosjekt ble grafisk kollektivroman

Nye vegar til trygg kunnskap

Fagbibliotek, folkebibliotek og dumme idiotar

Undergrunnsfeminister skapte kvinnebibliotek

Eg vil ha KI i biblioteka, ikkje på Kulturfond