Mestarivisailijoilla Brad Rutterilla ja Ken Jenningsillä olivat helmikuussa vastaukset hukassa. He kilpailivat tuolloin Jeopardy-televisiovisassa IBM:n Watson-tietokonetta vastaan. Yhdysvalloissa käydyn visan voiton vei ylivoimaisesti Watson 77 147 pisteellään. Rutterin pisteet olivat 24 000 ja Jennettin puolestaan 21 600.
Tietokoneen voitto ihmisvisailijoista oli tärkeä merkkipaalu tekoälyn kehittämisessä. Tietokilpailuun osallistuminen ei ole nimittäin tietokoneelle lainkaan helppoa, sillä vihjeet ovat kielellisiä. Ne sisältävät usein sanaleikkejä ja kahtalaisia merkityksiä. Lisäksi vastaus on puettava ymmärrettävään sääntöjen mukaiseen muotoon. Esimerkiksi Jeopardyssä se on määrämuotoinen kysymys, joka alkaa ”Kuka on...” tai ”Mikä on...”.
Watson noudatti kilpailun sääntöjä täysin. Se muun muassa sai sanalliset vihjeet täsmälleen samalla hetkellä kun ihmiskilpailijat näkivät ne edessään näytöllä. Sillä ei myöskään ollut käytössään internet-yhteyttä eikä siten ulkopuolisia apuvoimia.
Watsonia suunniteltaessa harkittiin useita eri toimintamalleja. Nopeasti tajuttiin, että oli mahdotonta perustaa tietokoneen toimintaa ainakaan sellaiseen tietokantaan, joka sisältäisi kaikki mahdolliset vihjeet ja niiden vastausvaihtoehdot.
Tietomäärä olisi ollut rajaton. Vihjeiden ja vastausten sijaan Watsoniin ladattiin aimo annos tekstejä: siihen tallennettiin esimerkiksi koko verkkotietosanakirja Wikipedian sisältö, useita tietosanakirjoja ja sanakirjoja sekä miljoonia uutisartikkeleita, romaaneja ja elokuvakäsikirjoituksia. Suurin osa informaatiosta oli pelkkää ihmisten luettavaksi tarkoitettua tekstiä.
Watsonille annettiin tietysti myös keinot käyttää siihen tallennettua tietomäärää hyväksi. IBM:ssä kehitettiin DeepQA-ohjelma, joka kykeni analysoimaan vihjeet kielellisesti hyvin nopeasti ja pilkkomaan ne pienempiin merkityksellisiin osiin. Sen jälkeen se tutki, löytyisikö niihin liittyvää tietoa tietokannasta, joka visan ajaksi oli ladattu valmiiksi tietokoneen 15 teratavun työmuistiin.
Vaikka säännöt olivat ihmisille ja tietokoneelle samat, ihmisten ja tietokoneen lähtökohdat olivat monin tavoin erilaiset. Watson ei esimerkiksi käsitellyt vihjeitä samalla tavalla kuin ihmisvisailijat, koska se ei tunne sanojen merkityksiä eikä aidosti ymmärrä vihjeitä.
Käytännössä se vain vertaili tiettyjen merkkijonojen esiintymistä teksteissä. Siksi Watson saattoi myös vastata täysin väärin ihmisille helppoihin kysymyksiin.
Kun juontaja esimerkiksi antoi vihjeen, jonka vastaukseksi ihmiset hoksasivat heti haettavan taidesuuntaa, tietokoneen vastaus oli silti henkilö (”Kuka on Picasso?”). Vielä pahemmin Watson epäonnistui yhdysvaltalaisia kaupunkeja käsittelevässä kysymyksessä. Siinä etsittiin kaupunkia, jonka suurin lentokenttä oli nimetty toisen maailmansodan sankarin mukaan ja toiseksi suurin kenttä saman sodan taistelun mukaan.
Watson ehdotti vastaukseksi kanadalaista Torontoa, kun oikea vastaus olisi ollut ”Mikä on Chicago?”. Analyysi oli selvästi mennyt pieleen, sillä jo maa oli väärin. Näin karkeaan virheeseen ihmisen olisi ollut vaikea haksahtaa.
Tulevaisuudessa tietokoneet löytävät tarvittavan tiedon täsmällisemmin
Tiedonhaku on nykyiselläänkin jo varsin helppoa internetin ja hakupalvelimien ansiosta, mutta siitä halutaan tehdä vielä täsmällisempää. Se voidaan periaatteessa toteuttaa kahdella tavalla: joko ihmisten on opittava antamaan tarkempia hakuehtoja, mikä auttaa tietokoneita hakemaan kulloinkin tarvittavat tiedot, tai tietokoneet on opetettava luokittelemaan ja analysoimaan tietoja samalla tavalla ja samoilla kielellisillä periaatteilla kuin ihmiset.
Web 1.0 Yksisuuntainen viestintä.
Verkkosivut olivat staattisia. Ne oli yhdistetty toisiinsa linkeillä. Niiden ulkoasua ja sisältöä hallitsi vain niiden perustaja. Sivujen käyttäjä oli passiivinen tiedon vastaanottaja.
Web 2.0 Nykyisin vallitseva kaksisuuntainen viestintä. Verkkosivut pyrkivät houkuttelemaan lisää aktiivisia kävijöitä. Uusia ilmiöitä ovat sosiaalinen media, blogit, verkkosovellukset ja video- ja kuvapalvelut.
Web 3.0 S Tulevaisuuden älykäs viestintä.
Tietokoneet ja hakusovellukset ”ymmärtävät” tavallista kieltä ja verkossa olevaa informaatiota ja seulovat ymmärryksensä avulla verkosta käyttäjän etsimän tiedon. Älykkäät sovellukset yleistyvät.
Uusi lehti: Lue muun muassa uudesta viruslääkkeestä ja kreikkalaisten demokratiasta, joka perustui orjuuteen.
Lataa itsellesi ilmaiseksi Tieteen Kuvalehti. Digitaalisen näytelehden lataus onnistuu, kun olet rekisteröitynyt tieku.fi-sivuston käyttäjäksi.
Geenitesti paljastaa, millä todennäköisyydellä sairastut vakavaan tautiin.
Tästä voi ladata itsellesi loistavia otoksia tietokoneen taustakuvaksi.
Anna lahjaksi Tieteen Kuvalehti. Kuuden numeron lahjatilaus maksaa 39 euroa.
Lue Tieteen Kuvalehteen kirjoittavien Helle ja Henrik Stubin mietteitä maailmankaikkeudesta.