Jeopardy with computer contestant

Watson-tietokone vei koko potin

IBM:n kehittämä supertietokone Watson voitti helmikuussa 2011 Jeopardy-visassa kaksi maineikasta suurmestaria. Voitto oli iso askel tekoälyn kehittämisessä ja antoi viitteitä siitä, millaisia tietokoneita tulevaisuudessa on luvassa.

perjantai 23. syyskuuta 2011 teksti Henrik Bendix

Mestarivisailijoilla Brad Rutterilla ja Ken Jenningsillä olivat helmikuussa vastaukset hukassa. He kilpailivat tuolloin Jeopardy-televisiovisassa IBM:n Watson-tietokonetta vastaan. Yhdysvalloissa käydyn visan voiton vei ylivoimaisesti Watson 77?147 pisteellään. Rutterin pisteet olivat 24?000 ja Jennettin puolestaan 21?600.

Tietokoneen voitto ihmisvisailijoista oli tärkeä merkkipaalu tekoälyn kehittämisessä. Tietokilpailuun osallistuminen ei ole nimittäin tietokoneelle lainkaan helppoa, sillä vihjeet ovat kielellisiä. Ne sisältävät usein sanaleikkejä ja kahtalaisia merkityksiä. Lisäksi vastaus on puettava ymmärrettävään sääntöjen mukaiseen muotoon. Esimerkiksi Jeopardyssä se on määrämuotoinen kysymys, joka alkaa ”Kuka on...” tai ”Mikä on...”.

Watsonille ja ihmisille samat säännöt

Watson noudatti kilpailun sääntöjä täysin. Se muun muassa sai sanalliset vihjeet täsmälleen samalla hetkellä kun ihmiskilpailijat näkivät ne edessään näytöllä. Sillä ei myöskään ollut käytössään internet-yhteyttä eikä siten ulkopuolisia apuvoimia.

Watsonia suunniteltaessa harkittiin useita eri toimintamalleja. Nopeasti tajuttiin, että oli mahdotonta perustaa tietokoneen toimintaa ainakaan sellaiseen tietokantaan, joka sisältäisi kaikki mahdolliset vihjeet ja niiden vastausvaihtoehdot.

Tietomäärä olisi ollut rajaton. Vihjeiden ja vastausten sijaan Watsoniin ladattiin aimo annos tekstejä: siihen tallennettiin esimerkiksi koko verkkotietosanakirja Wikipedian sisältö, useita tietosanakirjoja ja sanakirjoja sekä miljoonia uutisartikkeleita, romaaneja ja elokuvakäsikirjoituksia. Suurin osa informaatiosta oli pelkkää ihmisten luettavaksi tarkoitettua tekstiä.

Watson ei ollut erehtymätön

Watsonille annettiin tietysti myös keinot käyttää siihen tallennettua tietomäärää hyväksi. IBM:ssä kehitettiin DeepQA-ohjelma, joka kykeni analysoimaan vihjeet kielellisesti hyvin nopeasti ja pilkkomaan ne pienempiin merkityksellisiin osiin. Sen jälkeen se tutki, löytyisikö niihin liittyvää tietoa tietokannasta, joka visan ajaksi oli ladattu valmiiksi tietokoneen 15 teratavun työmuistiin.

Vaikka säännöt olivat ihmisille ja tietokoneelle samat, ihmisten ja tietokoneen lähtökohdat olivat monin tavoin erilaiset. Watson ei esimerkiksi käsitellyt vihjeitä samalla tavalla kuin ihmisvisailijat, koska se ei tunne sanojen merkityksiä eikä aidosti ymmärrä vihjeitä.

Käytännössä se vain vertaili tiettyjen merkkijonojen esiintymistä teksteissä. Siksi Watson saattoi myös vastata täysin väärin ihmisille helppoihin kysymyksiin.

Kun juontaja esimerkiksi antoi vihjeen, jonka vastaukseksi ihmiset hoksasivat heti haettavan taidesuuntaa, tietokoneen vastaus oli silti henkilö (”Kuka on Picasso?”). Vielä pahemmin Watson epäonnistui yhdysvaltalaisia kaupunkeja käsittelevässä kysymyksessä. Siinä etsittiin kaupunkia, jonka suurin lentokenttä oli nimetty toisen maailmansodan sankarin mukaan ja toiseksi suurin kenttä saman sodan taistelun mukaan.

Watson ehdotti vastaukseksi kanadalaista Torontoa, kun oikea vastaus olisi ollut ”Mikä on Chicago?”. Analyysi oli selvästi mennyt pieleen, sillä jo maa oli väärin. Näin karkeaan virheeseen ihmisen olisi ollut vaikea haksahtaa.

3 sukupolvea

Tulevaisuudessa tietokoneet löytävät tarvittavan tiedon täsmällisemmin

Tiedonhaku on nykyiselläänkin jo varsin helppoa internetin ja haku­palvelimien ansiosta, mutta siitä halutaan tehdä vielä täsmällisempää. Se voidaan periaatteessa toteuttaa kahdella tavalla: joko ihmisten on opittava antamaan tarkempia hakuehtoja, mikä auttaa tietokoneita hakemaan kulloinkin tarvittavat tiedot, tai tietokoneet on opetettava luokittelemaan ja analysoimaan tietoja samalla tavalla ja samoilla kielellisillä periaatteilla kuin ihmiset.

Web 1.0 Yksisuuntainen viestintä. Verkkosivut olivat staattisia. Ne oli yhdistetty toisiinsa linkeillä. Niiden ulkoasua ja sisältöä hallitsi vain niiden perustaja. Sivujen käyttäjä oli passiivinen tiedon vastaanottaja.

**Web 2.0 Nykyisin

Teema

Lue tästä

Ehkä sinua kiinnostaa...

TILAA TIETEEN KUVALEHDEN UUTISKIRJE

Voit ladata ilmaisen erikoisnumeron, Uskomattomat aivot, heti, kun olet tilannut uutiskirjeen.

Etkö löytänyt, mitä etsit? Tee haku tästä: