Oppdag ny kunnskap med Wolfram|Alpha!

Publisert Sist oppdatert

Det er grunn
til å tro at Wolfram|Alpha kan komme til å ta en del av de rene faktasøkene
både fra Google og Wikipedia. For oss nordmenn og ikke minst bibliotekarer blir
det selvsagt spennende å se hvordan Wolfram|Alpha er tilpasset norsk språk og
norske fakta.

 

Av Tore Brattli, førstelektor i
dokumentasjonsvitenskap, Universitetet i Tromsø (UiT)




Det er grunn
til å tro at Wolfram|Alpha kan komme til å ta en del av de rene faktasøkene
både fra Google og Wikipedia. For oss nordmenn og ikke minst bibliotekarer blir
det selvsagt spennende å se hvordan Wolfram|Alpha er tilpasset norsk språk og
norske fakta.

 

Av Tore Brattli, førstelektor i
dokumentasjonsvitenskap, Universitetet i Tromsø (UiT)

 

I datamaskinens barndom var det stor tro på at den nye
oppfinnelsen snart skulle kunne svare oss på avanserte spørsmål om alt fra
kjernefysikk til meningen med livet. I dag vet vi bedre. Selv Google kan best
sammenlignes med en hund som er trent opp til å hente inn avisen hver morgen.
Et enkelt gjøremål der den ikke trenger å forstå seg på innholdet i avisen.

      Men nå
lanseres det en kunnskapsmaskin som selv regner ut svaret, i stedet for å
returnere dokumenter som tilfeldigvis ligner på spørsmålet ditt. En maskin som
skal kunne gi gode svar på spørsmål som ingen tidligere har stilt og som etter
sigende skal inneholde nesten like mye fakta som i alle fagbibliotek til
sammen.

 

Superavansert
kalkulator

Wolfram|Alpha (http://www.wolframalpha.com/)
er en helt ny type søkemotor spesielt beregnet for søk etter faktainformasjon. Egentlig
er det ikke en søkemotor i klassisk forstand, men mer en slags superavansert
kalkulator som kan regne ut det aller meste med utgangspunkt i data, formler og
oppskrifter. Wolfram|Alpha (WA) kan gi deg svar på spørsmål som aldri før,
verken har blitt stilt eller besvart. Dette i motsetning til søketjenester som
f.eks. BIBSYS eller Google, som utelukkende returnerer dokumenter med nedtegnet
kunnskap som forhåpentligvis kan besvare brukerens spørsmål eller hjelpe dem på
veien.

      Noen typer
informasjon hentes opplagt best ut fra tradisjonelle dokumenter som bøker,
artikler, oppslagsverk eller nettsider. For andre typer informasjon er slike
kilder mindre egnet. Et banalt eksempel er multiplikasjon. Det er bedre å kunne
multiplisere enn å slå opp i en tabell med svar på alle mulige slags
multiplikasjonsstykker. Et mer avansert eksempel kan være tidspunkt for alle totale
solformørkelser i det 22 århundre sett fra Lindesnes. Et spørsmål som det er
usannsynlig å finne svar på i Google og som det er vanskelig å regne ut selv
for folk flest, men som vil være enkelt for WA.

      For spørsmål
om meningen med livet eller tips om ny sofa som kan matche den brune
rokokkostolen er det nok bedre å bruke BIBSYS/Google. WA er først og fremst for
faktasøk og målet har ifølge sjefsutvikler Stephen Wolfram vært å gjøre all vår
sivilisasjons systematiske kunnskap beregnbar (!).

 

VG og New York
Times

WA har utrolig nok vært en godt bevart hemmelighet
frem til første artikkel ble publisert på Wolframs egen blogg (http://blog.wolfram.com/) 5. mars 2009. I den
første tiden fikk WA mest oppmerksomhet i blogger, men også enkelte aviser som VG
og The New York Times var tidlig ute med artikler.

      Etter
Wolframs demonstrasjon og webcast på Harvard universitetet 28. april, har
oppmerksomheten økt betraktelig i alle medier. De fleste av dem som har fått demonstrert
WA virker svært så entusiastiske for å si det mildt.

 

Bakgrunnen for
WA

Og det er grunn til å ha store forhåpninger til Wolfram
Alpha. Tjenesten er utviklet av firmaet Wolfram Research, mest kjent for den
matematiske programvaren Mathematica og sin genierklærte grunnlegger Stephen
Wolfram. For tiden jobber 250 ansatte bare med WA. Wolfram skrev høyt siterte
(441 i ISI-WoK) artikler innen partikkelfysikk allerede som 17-åring og fikk
Ph.D. da han var 20. På 90-tallet forsket Wolfram mye på celleautomater (en
slags primitive datamaskiner), noe som i 2002 resulterte i den relativt
kontroversielle boka "A new kind of science" (NKS). Ideen her er at selv de
mest komplekse ting kan beskrives ved hjelp av enkle regler. Som han selv sier om
forutsetningene for WA:

      I had two
crucial ingredients: Mathematica and NKS. With Mathematica, I had a symbolic language to represent anything-as
well as the algorithmic power to do any kind of computation. And with NKS, I
had a paradigm for understanding how all sorts of complexity could arise from
simple rules.

      Som en kuriositet kan nevnes at
Wolfram Research også er matematiske konsulenter for TV-serien Numb3rs.

 

Mer om hva WA
er for noe og hvordan den fungerer

For brukeren består WA av et lekkert brukergrensesnitt
med et enkelt søkefelt i kjent Google-stil. Søkespråket kan for mange formål
også være likt. Et enkelt søk kan bestå av kun å hente fram data (f.eks. høyden
på Mt. Everest), mens et mer avansert søk (f.eks. solnedgang 15. sept. samme
sted) kan kreve både data og bruk av formler. Det eneste brukeren trenger å
gjøre er å skrive inn spørsmålet, mens WA tar seg av data, formler, utregninger
og selvsagt svaret. Mange enkle spørsmål har enkle svar selv om de er atskilt
av kompliserte utregninger.

      Det er også
grunn til å tro at WA også kan brukes som en avansert symbolsk kalkulator som
kan løse ligninger, forenkle matematiske uttrykk, plotte grafer, osv. WA består
av 4 deler:

 

– Dataforvaring: Innsamling, vasking og organisering
av data fra "statistiske sentralbyråer", oppslagsverk, håndbøker o.l. Foreløpig
antydes det mer enn 20.000.000.000.000 "fakta".
WA legger mye prestisje i å ha høy datakvalitet. Dette har vist seg å være ei stor
utfordring siden kontroller har avslørt varierende kvalitet også fra anerkjente
kilder.
Brukere kan bidra med egne data, men det vil ikke være fritt fram som i
Wikipedia. WA ønsker å sjekke alt som legges inn og kilder vil refereres i den
grad det er mulig.

– Beregningsdelen: Består av formler, algoritmer (oppskrifter),
modeller o.l. Selv om det selvsagt finnes et enormt antall slike formler, ser
det heldigvis ut til å være et endelig håndterbart antall. I tilfeller der det
eksisterer ulike oppfatninger (f.eks. ulike universmodeller) skal WA gi uttrykk
for dette og gi brukeren mulighet til å velge ønsket modell.

– Lingvistisk analyse av spørringer: Det har vist seg enklere
enn først antatt å tolke spørringer i naturlig språk. Tolkingen består i
hovedsak av å knytte spørringen til et endelig antall entitetstyper, formler o.l.
i WA, noe som er mye enklere enn å forstå tekst generelt.

– Presentasjon: For mange spørsmål finnes det finnes
nesten ubegrenset med mer eller mindre relevant informasjon som kan beregnes.
Utfordringen har vært og automatisk kunne trekke ut det viktigste og presentere
det på en forståelig måte. Mange svar vil inkludere menyer for alternative
presentasjoner og lenker til videresøk, bl.a. Wikipedia.

 

Allerede ved oppstarten dekker WA rundt 90 prosent av
innholdet i et typisk reference library innen viktige disipliner som realfag,
medisin, samfunnsfag og teknologi. I tillegg kan også brukerne bidra med sine
egne data og formler, både som en del av spørringen eller ved å få dem inkludert
i WA.

      Noen vil
kanskje få assosiasjoner til HAL 9000 og kunstig intelligens, men WA er ikke
noen av delene. En bedre sammenligning er kanskje data fra Statistisk sentralbyrå,
Meteorologisk institutt, Statens kartverk og en mengde andre institusjoner, sammen
med alle mulige formler, oppskrifter og modeller. Til sammenligning er SSB er
godt i gang med å kunne tilby mer fleksible presentasjonsmuligheter, men det er
i hovedsak utdrag av ferdig utregnet statistikk og ingen verktøy for selv å
kunne regne ut svar på egne spørsmål. Det WA ser ut til å ha klart er nettopp
det å få alle slags data knyttet mot relevante formler og oppskrifter på en
måte som gjør det enkelt å regne ut "alt" som ønskes.

 

Eksempler på
WA-søk

Med forbehold om dekning innen norske forhold spesielt
og bruk av norsk språk, kan dette være eksempler på søk i WA:

 

– Oslo = gir faktainformasjon om byen

– weather Oslo 1990 = gir værstatistikk for Oslo for
året 1990

– weather in Oslo when Jens Stoltenberg was born = 0,2°C
i snitt, litt sol men for det meste overskyet

– 5 mol H2SO4 = bl.a. hva du trenger for å lage denne
mengden svovelsyre

– jernbanelengde versus BNP = liste over land der
Norge ser ut til å ligge på 42. plass

– rød + Gul = Oransje, i tillegg til bølgelengde,
HTML-kode o.l.

– president i Brasil i 1922 = Epitâcio da Silva Pessoa
og Artur da Silva Bernardes

– distance earth moon 21.07.2009 = 357464 km (varierer
tross alt med 42592 km)

– 343g gull = verdi, volum, varmekapasitet, osv.

– Internet users in Europe = antall, fordelt på land,
økning per år, osv.

– LDL 7,5 male age 40 = nivå av kolesterol satt i
sammenheng

– lån 2.500.000 kr 3,25 % 20 år = renter og avdrag på
lån

– D sharp minor = bl.a. ei lydfil som kan avspilles

– height
Mt Everest / length Golden Gate bridge = 3,23273657

– forventet lengde på ekteskap i forhold til alder ved
inngåelse = ???

– vitenskapelige ansatte per avlagte PhD ved norske
universiteter = ???

– 2 glass appelsinjuice ei skive cheddarost = bl.a.
næringsinnhold sammenlignet

– Forventet levetid for 50-årige kvinner fra Troms som
røyker 20 sigaretter daglig og har BMI 35 = ???

 

Tilgang og
abonnement

WA er i utgangspunktet gratis, men det vil komme
tilbud om betalingstjenester der det f.eks. blir mulig å laste inn egne data,
formler o.l. til mer spesialiserte formål. Litt reklame må man også regne med,
men ikke mer enn det som i dag er vanlig i f.eks. Google.

Det vil være fleksible muligheter til å kommunisere
med WA på ulike nivåer fra andre nettsider eller dataprogrammer ved bruk av
API-er og svarene vil være tilgjengelig i flere formater inkl. PDF og Mathematica
notebook (for mer avanserte beregninger).

 

Konnkurrent til
Google?

Flere har allerede spekulert i om WA kan bli en
konkurrent til Google, men tjenestene har nok relativt ulike bruksområder.
Likevel er det grunn til å tro at WA kan komme til å ta en del av de rene faktasøkene
både fra Google og Wikipedia. For oss nordmenn og ikke minst bibliotekarer blir
det selvsagt spennende å se hvordan WA er tilpasset norsk språk og norske
fakta. Uansett ser det ut til å være en utrolig interessant søketjeneste som
åpner 29. mai 2009. (Bok og Biblioteks deadline var før denne datoen.)

 

 

 

Powered by Labrador CMS