Digital storage

Tietovarastot täyttyvät

Tietotulva on lähes ehtymätön. Digitaalisille tietomassoille ei aina löydy riittävän isoja tallennusvälineitä eikä seuraavilla sukupolvilla enää ole sopivia lukulaitteita. Monet tärkeät tiedot ovatkin jo kadonneet tai ne on pelastettu viime hetkellä.

torstai 21. heinäkuuta 2011 teksti Ib Salomon

Tiede tuottaa digitaalista tietoa. Sitä syntyy aivotutkimuksesta, tähtitieteestä ja varsinkin ydinfysiikan tutkimuksesta. Ja sitä syntyy todella paljon.

Kun Euroopan hiukkasfysiikan tutkimuskeskuksen Cernin suuri hiukkaskiihdytin käynnistetään, vuodessa syntyy 15 petatavua tietoa. Yksi petatavu vastaa miljardia megatavua, eli siihen mahtuu enemmän tietoa kuin suureen kirjastoon. Satelliitit ja luotaimet tuottavat kirjaimellisesti tähtitieteellisiä määriä dataa. Euroopan avaruusjärjestön Esan arkistoissa on viisi petatavua tietoa, ja se arvioi määrän kymmenkertaistuvan jo lähitulevaisuudessa.

Suuret tietomäärät eivät sinänsä ole ongelma. Sen sijaan niiden varastoiminen voi aiheuttaa monenlaisia pulmia: toisaalta tietomassoille ei välttämättä löydy riittävän isoja tallennusvälineitä, toisaalta tietoa ei ehkä tulevaisuudessa enää pystytä lukemaan.

Ongelmaa pahentaa se, että usein kyse on hyvin monimutkaisista tietokokonaisuuksista, jotka olisi järkevää tallentaa täydellisessä muodossaan. Esimerkiksi tieteellisen tutkimuksen tuottamalle tiedolle asetetut vaatimukset ovat hyvin tiukat. Jotta vaikkapa uusi lääkeaine voidaan hyväksyä, kaikki sen kehittämiseen ja testaamiseen liittyvät vaiheet on dokumentoitava ja säilytettävä. Ja jos esimerkiksi ilmastontutkimuksen tuloksista syntyy epäilyksiä – kuten jokin vuosi sitten kävi – on tärkeää, että pystytään jälkikäteen tarkastamaan ne tiedot ja koetulokset, joihin tutkijat ovat perustaneet päätelmänsä.

Tutkimustuloksia ei enää paineta paperille

Suurin osa tiedosta on nykyisin olemassa vain digitaalisessa muodossa. Paperille painettavan informaation osuudeksi on arvioitu 0,1 prosenttia. Tähän suuntaan kulkee kehitys myös tieteellisen tutkimuksen osalta. Kymmenen vuoden kuluttua arviolta kolme neljäsosaa maailman 20?000 tieteellisestä julkaisusta ilmestyy vain digitaalisessa muodossa.

Nykyisin ihmiskunnan tietovarastot kaksinkertaistuvat aina muutaman vuoden välein. Laskelmien mukaan vuonna 2020 digitaalista informaatiota on 40 kertaa niin paljon kuin nyt. Jos kaikki nykyisin tuotettava tieto painettaisiin paperille, paperipino kasvaisi nopeammin kuin raketti lentää. Muutaman vuoden kuluttua pinon korkeus vastaisi 11 kertaa Maan ja Auringon välistä matkaa.

Enin osa tietotulvasta on uutta, suurelta osin tutkimuksen tuottamaa informaatiota, mutta mukaan mahtuu myös vanhaa aineistoa, tekstejä, kuvia ja elokuvia, jotka siirretään digitaaliseen muotoon. Esimerkiksi Google on ilmoittanut tavoitteekseen digitalisoida 130 miljoonaa kirjaa – eli kaikki kirjat, jotka sen laskujen mukaan on koskaan julkaistu.

Tietotulva asettaa kovat vaatimukset tiedontallennusvälineille ja -tekniikalle. Osa ratkaisua on tiedon pakkaaminen entistä tiiviimpään. Siitä lähtien, kun tietokone keksittiin, tiedon pakkaussuhde on monimiljoonakertaistunut ja kehitys jatkuu yhä. Blu-ray-levylle mahtuu viisi kertaa niin paljon tietoa kuin dvd:lle. Nyt kehitteillä on levy, jolle voidaan tallentaa dataa 20 kerrokseen. Näin saavutetaan 500 gigatavun tallennuskapasiteetti. Lupaavia tuloksia on saatu myös holografisilla muisteilla.

Pakattu tieto katoaa helposti

Pakkaamisessakin on riskinsä, varoittaa muun muassa Britannian korkeakoulujen tietotekniikkavalmiuksia kehittävän Joint Information Systems Committeen asiantuntija Neil Grindley. ”Tiedon katoamisen riski on erityisen suuri silloin, kun tietoja säilytetään pakatussa muodossa”, Grindley toteaa.

Siksi monet tutkijat tallentavat tärkeät tietonsa suurille kiintolevyille, joilta data on myös helpompi hakea käyttöön. Kiintolevyt tarvitsevat jatkuvasti käynnissä olevia palvelinkoneita, jotka kuluttavat energiaa ja tuottavat lämpöä. Jääkaapin kokoiseen palvelimeen mahtuu 200 teratavua dataa, mutta käydessään se lämpiää niin paljon, että tarvitaan erillinen jäähdytin pitämään se viileänä.

Muun muassa Cern onkin etsimässä tietovarastoilleen paikkoja seuduilta, joilla on saatavilla sekä energiaa että jäähdytysvettä. Ratkaisuksi on esitetty varastojen rakentamista vuoristoseuduille, mihin olisi mahdollista rakentaa vesivoimaloita. Samanlaisia suunnitelmia on väläytelty myös joissakin suurissa eurooppalaisissa kirjastoissa.

Teema

Lue tästä

Ehkä sinua kiinnostaa...

TILAA TIETEEN KUVALEHDEN UUTISKIRJE

Voit ladata ilmaisen erikoisnumeron, Uskomattomat aivot, heti, kun olet tilannut uutiskirjeen.

Etkö löytänyt, mitä etsit? Tee haku tästä: