Jopa 30 kuvaa sekunnissa
Facebookin tekoälyvideotuottaja tuottaa sanojen pohjalta videoita saman periaatteen mukaan kuin liikkumattomia kuvia. Sen apuna on kaksi digitaalista neuroverkkoa.
Toinen neuroverkko luo sanojen perusteella kuvia. Toinen neuroverkko puolestaan vertaa näitä kuvia ison kuva-arkiston sisältöön ja ottaa niistä mallia. Vertaamalla ja matkimalla tekoäly oppii vähitellen yhä taitavammaksi kuvantekijäksi.
Internetissä levitetyissä videoissa on yleensä 24-30 kuvaa sekunnissa. Tekoälyn täytyy siis myös hahmottaa hyvin monen yksittäisen kuvan liikkeet pikselin tarkkuudella.
”Make-A-Video ratkaisee ongelman lisäämällä järjestelmään koneoppimiskerroksen, joka auttaa ymmärtämään fyysisen maailman liikkeitä ja käyttämään tätä ymmärrystä kuvien luomiseen tekstistä,” Metan johtaja Mark Zuckerberg kertoo Facebook-julkaisussaan.
Kone tuntee fysiikan lait
Jotta videoita tekevä tekoäly ymmärtäisi videokuvien hahmojen liikkeet, sille on opetettu fysiikan lakeja, kuten painovoimaa. Sen opin pohjalta tekoäly yrittää ohjata hahmojen ja esineiden vuorovaikutusta videoissa.
Tekoälyä opetetaan myös tekemään liikkeistä realistisia niin, että videoiden esineet ja hahmot vaikuttavat toisiinsa ja synnyttävät muun muassa varjoja.
Meta on esimerkiksi videossa, jossa taidemaalari maalaa taulua opettanut tekoälyä ymmärtämään, että kun sivellin koskee kangasta, se luo kankaalla uusia viivoja ja värejä.
Palvelu on vielä kehitysvaiheessa. Meta on vasta julkaissut viiden sekunnin pituisia esimerkkivideoita, joilla se esittelee tekniikkaa. Halukkaat voivat kuitenkin ilmoittautua mukaan testaajiksi, jotka pääsevät myöhemmin kokeilemaan palvelua.
Google samoilla jäljillä
Jo nyt monilla muillakin videopalveluilla on apunaan tekoälyohjelmstoja. Niissä sisältövaihtoehdot ovat kuitenkin rajoitetumpia ja yksinkertaisempia kuin Metan tulevassa Make-a-Video-palvelussa.
Synthesia-palvelun verkkosivulla käyttäjä voi syöttää tekstiä, jonka ohjelmiston luoma avatar sitten lausuu ääneen kuin uutistenlukija.
InVideo-palvelussa voi luoda taiteellista sisältöä valmiiden mallien pohjalta. Malleja on kuitenkin toistaiseksi tarjolla vähänlaisesti.
Myös Googlella on oma tekstistä videoksi -palvelunsa Phenaki. Nimi tulee vanhasta animaatiolelusta fenakistoskoopista. Se oli pahvikiekko, jolle piirrettynyt kuvat näyttivät liikkuvan, kun kiekkoa pyöritettiin.
Googlenkaan animaatiotekoäly ei ole vielä yleisesti käytettävissä.
Google kehittelee myös välineitä, joilla voidaan estää paikkansapitämättömien uutisten levittäminen. Nykytekniikkahan mahdollistaa hyvin aidontuntuisten väärien uutisvideon valmistamisen. Niissä voidaan esittää vaikka Hitler kivana päiväkodin setänä.