Tietovarastot täyttyvät

Tietotulva on lähes ehtymätön. Digitaalisille tietomassoille ei aina löydy riittävän isoja tallennusvälineitä eikä seuraavilla sukupolvilla enää ole sopivia lukulaitteita. Monet tärkeät tiedot ovatkin jo kadonneet tai ne on pelastettu viime hetkellä.

Nykytekniikan ansiosta digitaalista tietoa voidaan tuottaa ja varastoida yhä enemmän. Tänä vuonna maailmassa syntyy arvioiden mukaan noin 1 750 eksatavua uutta informaatiota.
Mikkel Juul Jensen
Nykytekniikan ansiosta digitaalista tietoa voidaan tuottaa ja varastoida yhä enemmän. Tänä vuonna maailmassa syntyy arvioiden mukaan noin 1 750 eksatavua uutta informaatiota.

Tiede tuottaa digitaalista tietoa. Sitä syntyy aivotutkimuksesta, tähtitieteestä ja varsinkin ydinfysiikan tutkimuksesta. Ja sitä syntyy todella paljon.

Kun Euroopan hiukkasfysiikan tutkimuskeskuksen Cernin suuri hiukkaskiihdytin käynnistetään, vuodessa syntyy 15 petatavua tietoa. Yksi petatavu vastaa miljardia megatavua, eli siihen mahtuu enemmän tietoa kuin suureen kirjastoon. Satelliitit ja luotaimet tuottavat kirjaimellisesti tähtitieteellisiä määriä dataa. Euroopan avaruusjärjestön Esan arkistoissa on viisi petatavua tietoa, ja
se arvioi määrän kymmenkertaistuvan jo lähitulevaisuudessa.

Suuret tietomäärät eivät sinänsä ole ongelma. Sen sijaan niiden varastoiminen voi aiheuttaa monenlaisia pulmia: toisaalta tietomassoille ei välttämättä löydy riittävän isoja tallennusvälineitä, toisaalta tietoa ei ehkä tulevaisuudessa enää pystytä lukemaan.

Ongelmaa pahentaa se, että usein kyse on hyvin monimutkaisista tieto­kokonaisuuksista, jotka olisi järkevää tallentaa täydellisessä muodossaan. Esimerkiksi tieteellisen tutkimuksen tuottamalle tiedolle asetetut vaatimukset ovat hyvin tiukat. Jotta vaikkapa uusi lääkeaine voidaan hyväksyä, kaikki sen kehittämiseen ja testaamiseen liittyvät vaiheet on dokumentoitava ja säilytettävä. Ja jos esimerkiksi ilmastontutkimuksen tuloksista syntyy epäilyksiä – kuten jokin vuosi sitten kävi – on tärkeää, että pystytään jälkikäteen tarkastamaan ne tiedot ja koetulokset, joihin tutkijat ovat perustaneet päätelmänsä.

Tutkimustuloksia ei enää paineta paperille

Suurin osa tiedosta on nykyisin olemassa vain digitaalisessa muodossa. Paperille painettavan informaation osuudeksi on arvioitu 0,1 prosenttia. Tähän suuntaan kulkee kehitys myös tieteellisen tutkimuksen osalta. Kymmenen vuoden kuluttua arviolta kolme neljäsosaa maailman 20 000 tieteellisestä julkaisusta ilmestyy vain digitaalisessa muodossa.

Nykyisin ihmiskunnan tietovarastot kaksinkertaistuvat aina muutaman vuoden välein. Laskelmien mukaan vuonna 2020 digitaalista informaatiota on 40 kertaa niin paljon kuin nyt. Jos kaikki nykyisin tuotettava tieto painettaisiin paperille, paperipino kasvaisi nopeammin kuin raketti lentää. Muutaman vuoden kuluttua pinon korkeus vastaisi 11 kertaa Maan ja Auringon välistä matkaa.

Enin osa tietotulvasta on uutta, suurelta osin tutkimuksen tuottamaa informaatiota, mutta mukaan mahtuu myös vanhaa aineistoa, tekstejä, kuvia ja elokuvia, jotka siirretään digitaaliseen muotoon. Esimerkiksi Google on ilmoittanut tavoitteekseen digitalisoida 130 miljoonaa kirjaa – eli kaikki kirjat, jotka sen laskujen mukaan on koskaan julkaistu.

Tietotulva asettaa kovat vaatimukset tiedontallennusvälineille ja -tekniikalle. Osa ratkaisua on tiedon pakkaaminen entistä tiiviimpään. Siitä lähtien, kun tieto­kone keksittiin, tiedon pakkaussuhde on monimiljoonakertaistunut ja kehitys jatkuu yhä. Blu-ray-levylle mahtuu viisi kertaa niin paljon tietoa kuin dvd:lle. Nyt kehitteillä on levy, jolle voidaan tallentaa dataa 20 kerrokseen. Näin saavutetaan 500 gigatavun tallennus­kapasiteetti. Lupaavia tuloksia on saatu myös holografisilla muisteilla.

Pakattu tieto katoaa helposti

Pakkaamisessakin on riskinsä, varoittaa muun muassa Britannian korkeakoulujen tietotekniikkavalmiuksia kehittävän Joint Information Systems Committeen asiantuntija Neil Grindley.
”Tiedon katoamisen riski on erityisen suuri silloin, kun tietoja säilytetään pakatussa muodossa”, Grindley toteaa.

Siksi monet tutkijat tallentavat tärkeät tietonsa suurille kiintolevyille, joilta data on myös helpompi hakea käyttöön. Kiintolevyt tarvitsevat jatkuvasti käynnissä olevia palvelinkoneita, jotka kuluttavat energiaa ja tuottavat lämpöä. Jääkaapin kokoiseen palvelimeen mahtuu 200 teratavua dataa, mutta käydessään se läm­piää niin paljon, että tarvitaan erillinen jäähdytin pitämään se viileänä.

Muun muassa Cern onkin etsimässä tietovarastoilleen paikkoja seuduilta, joilla on saatavilla sekä energiaa että jäähdytysvettä. Ratkaisuksi on esitetty varastojen rakentamista vuoristoseuduille, mihin olisi mahdollista rakentaa vesivoimaloita. Samanlaisia suunnitelmia on väläytelty myös joissakin suurissa eurooppalaisissa kirjastoissa.

Uusi ase viruksia vastaan

Uusi lehti: Lue muun muassa uudesta viruslääkkeestä ja kreikkalaisten demokratiasta, joka perustui orjuuteen.

Ilmainen näytelehti

Lataa itsellesi ilmaiseksi Tieteen Kuvalehti. Digitaalisen näytelehden lataus onnistuu, kun olet rekisteröitynyt tieku.fi-sivuston käyttäjäksi.

Tilaa uutiskirje

Tilaa Tieteen Kuvalehden uutiskirje

Gallup

ONGELMA: Mitä haluat kertoa?

Geenitesti paljastaa, millä todennäköisyydellä sairastut vakavaan tautiin.

National Geographic

Uusia taustakuvia!

Tästä voi ladata itsellesi loistavia otoksia tietokoneen taustakuvaksi.

Etsitkö sopivaa syntymäpäivälahjaa?

Anna lahjaksi Tieteen Kuvalehti. Kuuden numeron lahjatilaus maksaa 39 euroa.

Seuraa Avaruusblogia

Lue Tieteen Kuvalehteen kirjoittavien Helle ja Henrik Stubin mietteitä maailmankaikkeudesta.