Data tallentuu dna-molekyyliin

Dna
Teksti
Marko Hamilo
Julkaistu yli kolme vuotta sitten
Nick Goldman tutkii syntetisoitua dna:ta. Kuva European Molecular Biology Laboratory.

Euroopan bioinformatiikkainstituutin (EMBL-EBI) tutkijat ovat kehittäneet menetelmän, jonka avulla informaatiota voidaan tallentaa dna-molekyyliin. Nature-lehdessä julkaistu menetelmä mahdollistaa järjettömän suurien tietomäärien tallentamisen hyvinkin pieneen tilaan. Yhteen kahvikupilliseen dna:ta voisi tallentaa ainakin sata miljoonaa tuntia korkealaatuista videota.

Tallennuskapasiteetille on tarvetta, sillä maailmassa on jo nykyään kolmen zettatavun verran dataa, biologisen vaihtoehdon kehittäneet tutkijat sanovat. Kyse on 3 000 miljardista miljardista tavusta.

Tietojen pitkäaikainen tallentaminen on kallista. Jotkin tallennusmediat vaativat sähköä. Parhaat sähköriippumattomat tekniikat, kuten magneettinauhat, eivät kestä välttämättä kymmentäkään vuotta.

Dna:n tiedetään säilövän informaatiota hyvin pitkiäkin aikoja luotettavasti. Onhan jopa neandertalinihmisten kymmeniä tuhansia vuosia vanhoista luista saatu kelvollisia näytteitä. Dna tallentaa informaatiota myös hyvin pieneen tilaan.

Dna:n lukeminen on ollut jo toista vuosikymmentä suhteellisen yksinkertaista. Tallennusmediana dna:n ongelma liittyykin datan kirjoittamiseen dna-molekyylille. Tähän asti dna:ta on ollut mahdollista tuottaa vain lyhyitä pätkiä. Lisäksi sekä lukeminen että kirjoittaminen ovat virheille alttiita prosesseja. Erityisen hankalia ovat jaksot, joissa sama ”kirjain” eli emäs toistuu monta kertaa peräkkäin.

EMBL-EBI:n tutkija Nick Goldman kollegoineen kehitti koodin kiertääkseen nämä kaksi ongelmaa. Ideana on, että tallentava dna koostuu lukuisista lyhyistä pätkistä, joissa on niin vähän saman kirjaimen toistoa kuin mahdollista. Lisäksi jaksot koostuvat monista toistensa kanssa päällekkäisistä segmenteistä. Jos johonkin kohtaan tulee luku- tai kirjotusvirhe, oikea data on tallella toisissa pätkissä. Vasta jos sama virhe tulisi neljään dna-pätkään, jotta tallenne vaurioituisi.

Menetelmässä syntetisoitiin kokonaan uutta dna:ta. Kalifornialaiset Agilent Technologies -yrityksen työntekijät koodasivat biologiseen tallennusmediaan Martin Luther Kingin ”I have a dream” -puheen mp3-muodossa, Shakespearen sonetteja teksteinä sekä dna:n rakenteen löytäneiden nobelistien James Watsonin ja Francis Crickin artikkelin ”Molecular structure of nucleic acids” jpg-kuvana.

Näyte lähetettiin Eurooppaan, jossa EMBL-EBI:n tutkijat lukivat koodin ilman ainuttakaan virhettä.

Koe osoitti, että dna-tallennus on periaatteessa mahdollista. Monia käytännöllisiä kysymyksiä on kuitenkin ratkaistava, ennen kuin dna tulee kaupalliseen käyttöön.