Watson-tietokone vei koko potin

IBM:n kehittämä supertietokone Watson voitti helmikuussa 2011 Jeopardy-visassa kaksi maineikasta suurmestaria. Voitto oli iso askel tekoälyn kehittämisessä ja antoi viitteitä siitä, millaisia tietokoneita tulevaisuudessa on luvassa.

Jeopardy-mestarit Ken Jennings ja  Brad Rutter hävisivät helmikuussa kisan tietokoneelle.
s. wenig/AP/polfoto
Jeopardy-mestarit Ken Jennings ja Brad Rutter hävisivät helmikuussa kisan tietokoneelle.

Mestarivisailijoilla Brad Rutterilla ja Ken Jenningsillä olivat helmikuussa vas­tauk­set hukassa. He kilpailivat tuolloin Jeopardy-televisio­visassa IBM:n Watson-tietokonetta vastaan. Yhdysvalloissa käydyn visan voiton vei ylivoimaisesti Watson 77 147 pisteellään. Rutterin pisteet olivat 24 000 ja Jennettin puolestaan 21 600.

Tietokoneen voitto ihmisvisailijoista oli tärkeä merkkipaalu tekoälyn kehittämisessä. Tietokilpailuun osallistuminen ei ole nimittäin tietokoneelle lainkaan helppoa, sillä vihjeet ovat kielellisiä. Ne sisältävät usein sanaleikkejä ja kahtalaisia merkityksiä. Lisäksi vastaus on puettava ymmärrettävään sääntöjen mukaiseen muotoon. Esimerkiksi Jeopardyssä se on määrämuotoinen kysymys, joka alkaa ”Kuka on...” tai ”Mikä on...”.

Watsonille ja ihmisille samat säännöt

Watson noudatti kilpailun sääntöjä täysin. Se muun muassa sai sanalliset vihjeet täsmälleen samalla hetkellä kun ihmiskilpailijat näkivät ne edessään näytöllä. Sillä ei myöskään ollut käytössään internet-yhteyttä eikä siten ulkopuolisia apuvoimia.

Watsonia suunniteltaessa harkittiin useita eri toimintamalleja. Nopeasti tajuttiin, että oli mahdotonta perustaa tietokoneen toimintaa ainakaan sellaiseen tietokantaan, joka sisältäisi kaikki mahdolliset vihjeet ja niiden vastausvaihtoehdot.

Tietomäärä olisi ollut rajaton. Vihjeiden ja vastausten sijaan Watsoniin ladattiin aimo annos tekstejä: siihen tallennettiin esimerkiksi koko verkkotietosanakirja Wikipedian sisältö, useita tietosanakirjoja ja sanakirjoja sekä miljoonia uutisartikkeleita, romaaneja ja elokuvakäsikirjoituksia. Suurin osa informaatiosta oli pelkkää ihmisten luettavaksi tarkoitettua tekstiä.

Watson ei ollut erehtymätön

Watsonille annettiin tietysti myös keinot käyttää siihen tallennettua tietomäärää hyväksi. IBM:ssä kehitettiin DeepQA-ohjelma, joka kykeni analysoimaan vihjeet kielellisesti hyvin nopeasti ja pilkkomaan ne pienempiin merkityksellisiin osiin. Sen jälkeen se tutki, löytyisikö niihin liittyvää tietoa tietokannasta, joka visan ajaksi oli ladattu valmiiksi tietokoneen 15 teratavun työmuistiin.

Vaikka säännöt olivat ihmisille ja tietokoneelle samat, ihmisten ja tietokoneen lähtökohdat olivat monin tavoin erilaiset. Watson ei esimerkiksi käsitellyt vihjeitä samalla tavalla kuin ihmisvisailijat, koska se ei tunne sanojen merkityksiä eikä aidosti ymmärrä vihjeitä.

Käytännössä se vain vertaili tiettyjen merkkijonojen esiintymistä teksteissä. Siksi Watson saattoi myös vastata täysin väärin ihmisille helppoihin kysymyksiin.

Kun juontaja esimerkiksi antoi vihjeen, jonka vastaukseksi ihmiset hoksasivat heti haettavan taidesuuntaa, tietokoneen vastaus oli silti henkilö (”Kuka on Picasso?”). Vielä pahemmin Watson epäonnistui yhdysvaltalaisia kaupunkeja käsittelevässä kysymyksessä. Siinä etsittiin kaupunkia, jonka suurin lentokenttä oli nimetty toisen maailmansodan sankarin mukaan ja toiseksi suurin kenttä saman sodan taistelun mukaan.

Watson ehdotti vastaukseksi kanadalaista Torontoa, kun oikea vastaus olisi ollut ”Mikä on Chicago?”. Analyysi oli selvästi mennyt pieleen, sillä jo maa oli väärin. Näin karkeaan virheeseen ihmisen olisi ollut vaikea haksahtaa.

3 sukupolvea

Tulevaisuudessa tietokoneet löytävät tarvittavan tiedon täsmällisemmin

Tiedonhaku on nykyiselläänkin jo varsin helppoa internetin ja haku­palvelimien ansiosta, mutta siitä halutaan tehdä vielä täsmällisempää. Se voidaan periaatteessa toteuttaa kahdella tavalla: joko ihmisten on opittava antamaan tarkempia hakuehtoja, mikä auttaa tietokoneita hakemaan kulloinkin tarvittavat tiedot, tai tietokoneet on opetettava luokittelemaan ja analysoimaan tietoja samalla tavalla ja samoilla kielellisillä periaatteilla kuin ihmiset.

Web 1.0 Yksisuuntainen viestintä.
Verkkosivut olivat staattisia. Ne oli yhdistetty toisiinsa linkeillä. Niiden ulkoasua ja sisältöä hallitsi vain niiden perustaja. Sivujen käyttäjä oli passiivinen tiedon vastaanottaja.

Web 2.0 Nykyisin vallitseva kaksisuuntainen viestintä. Verkko­sivut pyrkivät houkuttelemaan lisää aktiivisia kävijöitä. Uusia ilmiöitä ovat sosiaalinen media, blogit, verkko­sovellukset ja video- ja kuvapalvelut.

Web 3.0 S Tulevaisuuden älykäs viestintä.
Tieto­koneet ja haku­sovellukset ”ymmärtävät” tavallista kieltä ja verkossa olevaa informaatiota ja seulovat ymmärryksensä avulla verkosta käyttäjän etsimän tiedon. Älykkäät sovellukset yleistyvät.

Uusi ase viruksia vastaan

Uusi lehti: Lue muun muassa uudesta viruslääkkeestä ja kreikkalaisten demokratiasta, joka perustui orjuuteen.

Ilmainen näytelehti

Lataa itsellesi ilmaiseksi Tieteen Kuvalehti. Digitaalisen näytelehden lataus onnistuu, kun olet rekisteröitynyt tieku.fi-sivuston käyttäjäksi.

Tilaa uutiskirje

Tilaa Tieteen Kuvalehden uutiskirje

Gallup

ONGELMA: Mitä haluat kertoa?

Geenitesti paljastaa, millä todennäköisyydellä sairastut vakavaan tautiin.

National Geographic

Uusia taustakuvia!

Tästä voi ladata itsellesi loistavia otoksia tietokoneen taustakuvaksi.

Etsitkö sopivaa syntymäpäivälahjaa?

Anna lahjaksi Tieteen Kuvalehti. Kuuden numeron lahjatilaus maksaa 39 euroa.

Seuraa Avaruusblogia

Lue Tieteen Kuvalehteen kirjoittavien Helle ja Henrik Stubin mietteitä maailmankaikkeudesta.