”Se muuttaa lääketieteen. Se muuttaa tutkimuksen. Se muttaaa biotekniikan. Se muuttaa kaiken.”
Näin toteaa saksalainen molekyylibiologi Andrei Lupas. Hän on vain yksi monista tutkijoista, joiden on vaikea peitellä riemuaan AlphaFold-tietokoneohjelmasta.
Ohjelma, jonka toiminta perustuu tekoälyyn, on muutamassa vuodessa kartoittanut satojentuhansien proteiinien muodon, ja joukossa on yksi, jonka parissa Lupas oli kollegoineen puurtanut tuloksetta jo yli vuosikymmenen.
Proteiinien muodon tiedetään olevan ratkaisevan tärkeä lääkeaineiden kehittämisessä niin koronavirusta kuin syöpiäkin vastaan.
98,5 prosenttia ihmisen proteiineista on jo kartoitettu AlphaFoldilla.
Moni pitää AlphaFoldia yhtenä vuosisadan suurimmista tieteellisistä saavutuksista – ja tekniikan kehittänyt DeepMind-yritys, joka on nykyisin Googlen omistama, aikoo mullistaa sillä muutakin kuin vain lääketieteen.
Algoritmi voi myös auttaa luomaan tarkempia sääennusteita, kehittämään uusia tietokoneohjelmia ja ratkaisemaan ilmastokriisin.
AlphaFold murtaa koodin
Proteiinit ovat sekä rakennuspalikoita että työläisiä. Ne pitävät solut koossa ja elimistön kemialliset prosessit käynnissä. Ne osallistuvat kaikkeen, mikä elimistössä tapahtuu – niin hyvässä kuin pahassakin.
Melkeinpä mitä tahansa sairautta voidaan hoitaa proteiineilla, ja kun tunnetaan sairauden aiheuttavien tai siihen vaikuttavien proteiinien muoto, voidaan räätälöidä tehokkaita lääkeaineita, jotka sitoutuvat proteiineihin ja saavat ne toiminaan tarkoituksenmukaisesti.
Proteiinin muodon kartoittaminen ei kuitenkaan ole helppoa. Proteiinit koostuvat pitkistä aminohappoketjuista, ja aminohappojen tyypin ja järjestyksen selvittäminen on sinänsä yksinkertaista. Ketju kuitenkin laskostuu myöhemmin möykyksi, ja tässä vaiheessa tutkijoilla menee sormi suuhun.

Lapsuuden ystävät Demis Hassabis (vas.) ja Mustafa Suleyman (oik.) perustivat vuonna 2010 DeepMindin yhdessä opiskelutoverinsa Shane Leggin kanssa.
Proteiini voi laskostua lähes lukemattomilla eri tavoilla. Silti se laskostuu solussa aina juuri yhdellä tietyllä tavalla. Muotoa ei erota mikroskoopilla, koska proteiinit ovat niin pieniä. Ihmiset eivät kykenekään ennustamaan, minkä muodon proteiini ottaa, mutta AlphaFold pystyy.
Ohjelman salaisuutena on ketterä tekoäly, joka oppii kokemuksistaan. Ennen kuin se pystyi tekemään itsensä korvaamattomaksi tieteessä, se harjoitteli yksinkertaisemmilla haasteilla eli vanhoilla tietokonepeleillä.
Ohjelma treenasi pelaamalla
DeepMind, jonka kehittämä AlphaFold on, aloitti vuonna 2013 algoritmin kehittämisen pelauttamalla ohjelmalla vanhoja tietokonepelejä, kuten Space Invadersia. Tekoälystä kehittyi pian mestaripelaaja, ja se tapahtui vain harjoittelemalla, sillä siihen ei syötetty pelin sääntöjä.
Vuonna 2014 Google osti DeepMindin, ja muutamaa vuotta myöhemmin yritys nousi taas otsikoihin, kun sen teknologialla lyötiin yksi maailman parhaista Go-pelaajista, Lee Sedo. Go on lautapeli, jossa menestyminen ei vaadi vain loogista päättelyä, analyyttisyyttä ja strategiaa vaan myös inhimillistä intuitiota ja luovuutta.

DeepMind löi suurmestarin
Go on yksi maailman vanhimmista lautapeleistä, ja vaikka se pinnallisesti muistuttaa sakkia mustine ja valkoisine nappuloineen ja neliöihin jaettuine pelilautoineen, se on paljon mutkikkaampi. Siinä ei voikaan voittaa pelkällä laskentateholla, mutta se onnistui DeepMindin tekoälyllä. Oppivainen algoritmi omaksui itse tehokkaan strategian ja voitti vuonna 2016 yhden maailman parhaista Go-pelaajista, Lee Sedolin, neljässä pelissä viidestä.
Tietokoneohjelmat ovat ennenkin lyöneet ihmispelaajia lautapeleissä. Esimerkiksi IBM:n Deep Blue -ohjelma voitti vuonna 1997 sakin maailmanmestarin Garri Kasparovin, mutta DeepMindiin ei syötetä ihmisohjelmoijien tekemiä todennäköisyyslaskelmia, kuten on tehty aiemmin. Samoin kuin tietokonepelit, se oppi myös Go-pelin pelaamisen itse.
Algoritmin ainutlaatuinen kyky oppia itse ja hahmottaa yhteyksiä, joka vaatii enemmän kuin vain yksinkertaista logiikkaa, voi auttaa ratkaisemaan myös lukuisia keskeisiä yhteiskunnallisia ongelmia.
DeepMindin algoritmi on jo oppinut koodaamaan tietokoneohjelmia itsenäisesti yhtä tehokkaasti kuin siihen koulutettu ihminen. Sen laatimat ennusteet äkillisistä sään vaihteluista ovat tarkempia kuin muilla keinoin tuotetut. Se on osoittanut voivansa tehdä tuulienergian tuotannosta aiempaa vähintään 20 prosenttia tuottoisampaa. Ja se osaa myös diagnosoida rintasyövän varmemmin kuin lääkäri.
Suurimman läpimurron se on kuitenkin tähän mennessä tehnyt proteiinien muodon kartoittamisessa.
Algoritmi sokeerasi
Joka toinen vuosi vuodesta 1994 alkaen on järjestetty kilpailuja, joissa algoritmit mittelevät voimiaan proteiinien muodon ennustamisessa. Niiden tuloksia on verrattu niihin muutamiin proteiineihin, joiden muotoon on pystytty perehtymään pitkällisissä laboratoriotutkimuksissa.
AlphaFold osallistui kisaan ensimmäistä kertaa vuonna 2018 ja voitti sen 70 prosentin tarkkuudella. Kaksi vuotta myöhemmin se sokeerasi jo yli 90 prosentin tarkkuudella. Moisen kuviteltiin olevan mahdotonta nykytekniikoilla.
Algoritmi selvitti peruskoodin
Proteiinit koostuvat yleensä satojen aminohappojen ketjuista. Yli 50 vuotta tutkijat ovat yrittäneet ymmärtää tapaa, jolla ketjut laskostuvat proteiinimolekyyleiksi. Nyt AlphaFold on päässyt siitä jyvälle.

1. Tyypin ratkaiseminen
AlphaFold vertaa proteiinin aminohappoketjua (ylin rivi) eri eläinten vastaaviin proteiineihin (kolme alinta riviä). Osa aminohapoista (numerot 1, 3 ja 6) ovat kaikilla lajeilla samanlaisia, kun taas toiset ovat mutatoituneet evoluution kuluessa.

2. Mutaatiot paljastavat naapurit
Algoritmi etsii yhtä aikaa mutatoituneet aminohapot: esimerkiksi kun aminohappo nro 2 on mutatoitunut, yleensä mutaatio on myös aminohapossa numero 5. Tämä johtuu todennäköisesti siitä, että aminohapot ovat proteiinissa lähekkäin.

3. Rakenne testataan ja sitä muutetaan
Algoritmi luo proteiinista mallin, jossa ketju laskostuu niin, että löydetyt aminohapot (numero 2 ja 5) tulevat lähekkäin. Se parantelee mallia niin, että koko proteiinissa mahdollisimman moni aminohappo löytää itselleen sopivan naapurin.

4. Algoritmi viimeistelee mallin
Algoritmi viimeistelee ehdotuksensa proteiinin muodosta. Rakennetta voidaan ehkä verrata jo olemassa olevaan tietoon proteiinista, jolloin algoritmi voi oppia mahdollisista virheistä ja tuottaa jatkossa parempia ennusteita.
AlphaFold-algoritmissa on yhä paranneltavaa, mutta jo tälläkin hetkellä sitä voidaan käyttää tutkimuksissa. DeepMind on laskenut jo noin miljoonan proteiinin muodon julkisista tietokannoista, ja ensimmäiset tutkimushankkeet ovat jo käyttäneet hyväksi sen kartoitustaitoja.
Kiinalainen lääkealan yritys Insilico Medicine on esimerkiksi kehittänyt uuden lääkeaineen, jota mahdollisesti voidaan käyttää maksasyövän hoitamiseen. Aiemmin lääkeaineiden kehittäminen on voinut viedä vuosia, mutta tällä kertaa se onnistui vain 30 päivässä AlphaFoldin ja muiden tekoälytyyppien ansiosta.
Yrityksen tutkijat etsivät ensin yhden tekoälyn avulla proteiinin, jolla näytti olevan keskeinen merkitys taudin syntymisessä. Sen jälkeen proteiinin muoto kartoitettiin AlphaFoldilla – ja lopuksi kolmannella ohjelmalla luotiin lääkeaine, joka sopi proteiiniin kuin nyrkki silmään.
Lääkeainetta ei ole vielä testattu käytännössä, mutta hanke on silti todiste uuden aikakauden alkamisesta lääketieteessä, mikä enteilee uusien lääkkeiden vyörymistä markkinoille.