Shutterstock
Robot

Facebookin tekoäly tekee videoita käyttäjien teksteistä

Luovan tekoälyn uusin edistysaskel on Facebookin robotti, joka tekee videoita käyttäjien kirjoittamista sanoista ja teksteistä.

Vasta vähän aikaa sitten saatiin ihmeteltäväksi Craiyon- ja Dall-E-2-tekoälyohjelmistot, jotka muuttavat tekstejä kuviksi. Nyt luova tekoäly on tehnyt uuden aluevaltauksen.

Facebookin emoyhtiö Meta on julkistanut Make-a-Video-palvelun, joka tuottaa lyhyitä videoita käyttäjien kirjoittamista sanoista ja teksteistä. Palvelun verkkosivuilla on tekstin perusteella luotuja esimerkkivideoita muun muassa nallekarhusta, joka maalaa
muotokuvaa itsestään.

Vastaavanlaisia ohjelmistoja on tulossa muiltakin tietotekniikkayrityksiltä. Muutaman vuoden kuluttua media-alan ammattilaisilla ja myös tavallisilla ihmisillä on tekoäly luomisen työkaluna.

Jopa 30 kuvaa sekunnissa

Facebookin tekoälyvideotuottaja tuottaa sanojen pohjalta videoita saman periaatteen mukaan kuin liikkumattomia kuvia. Sen apuna on kaksi digitaalista neuroverkkoa.

Toinen neuroverkko luo sanojen perusteella kuvia. Toinen neuroverkko puolestaan vertaa näitä kuvia ison kuva-arkiston sisältöön ja ottaa niistä mallia. Vertaamalla ja matkimalla tekoäly oppii vähitellen yhä taitavammaksi kuvantekijäksi.

Internetissä levitetyissä videoissa on yleensä 24-30 kuvaa sekunnissa. Tekoälyn täytyy siis myös hahmottaa hyvin monen yksittäisen kuvan liikkeet pikselin tarkkuudella.

”Make-A-Video ratkaisee ongelman lisäämällä järjestelmään koneoppimiskerroksen, joka auttaa ymmärtämään fyysisen maailman liikkeitä ja käyttämään tätä ymmärrystä kuvien luomiseen tekstistä,” Metan johtaja Mark Zuckerberg kertoo Facebook-julkaisussaan.

Kone tuntee fysiikan lait

Jotta videoita tekevä tekoäly ymmärtäisi videokuvien hahmojen liikkeet, sille on opetettu fysiikan lakeja, kuten painovoimaa. Sen opin pohjalta tekoäly yrittää ohjata hahmojen ja esineiden vuorovaikutusta videoissa.

Tekoälyä opetetaan myös tekemään liikkeistä realistisia niin, että videoiden esineet ja hahmot vaikuttavat toisiinsa ja synnyttävät muun muassa varjoja.

Meta on esimerkiksi videossa, jossa taidemaalari maalaa taulua opettanut tekoälyä ymmärtämään, että kun sivellin koskee kangasta, se luo kankaalla uusia viivoja ja värejä.

Palvelu on vielä kehitysvaiheessa. Meta on vasta julkaissut viiden sekunnin pituisia esimerkkivideoita, joilla se esittelee tekniikkaa. Halukkaat voivat kuitenkin ilmoittautua mukaan testaajiksi, jotka pääsevät myöhemmin kokeilemaan palvelua.

Google samoilla jäljillä

Jo nyt monilla muillakin videopalveluilla on apunaan tekoälyohjelmstoja. Niissä sisältövaihtoehdot ovat kuitenkin rajoitetumpia ja yksinkertaisempia kuin Metan tulevassa Make-a-Video-palvelussa.

Synthesia-palvelun verkkosivulla käyttäjä voi syöttää tekstiä, jonka ohjelmiston luoma avatar sitten lausuu ääneen kuin uutistenlukija.

InVideo-palvelussa voi luoda taiteellista sisältöä valmiiden mallien pohjalta. Malleja on kuitenkin toistaiseksi tarjolla vähänlaisesti.

Myös Googlella on oma tekstistä videoksi -palvelunsa Phenaki. Nimi tulee vanhasta animaatiolelusta fenakistoskoopista. Se oli pahvikiekko, jolle piirrettynyt kuvat näyttivät liikkuvan, kun kiekkoa pyöritettiin.

Googlenkaan animaatiotekoäly ei ole vielä yleisesti käytettävissä.

Google kehittelee myös välineitä, joilla voidaan estää paikkansapitämättömien uutisten levittäminen. Nykytekniikkahan mahdollistaa hyvin aidontuntuisten väärien uutisvideon valmistamisen. Niissä voidaan esittää vaikka Hitler kivana päiväkodin setänä.