Do jedné spermie se vejde 0,8 GB dat. Do jedné dávky se pak vměstná celý Netflix, a to hned několikrát

Molekuly DNA se dnes vážně zvažují jako možné úložiště dat budoucnosti. Zní to jako sci-fi, ale když si uděláme jednoduchý výpočet, dává to překvapivě smysl. Haploidní lidský genom – tedy sada genetické informace, kterou nese jedna jediná spermie – obsahuje přibližně 3,1 miliardy párů bází. Každý pár tvoří dvě báze, ale ty nejsou libovolné: v přírodě se pojí pouze dvě možné dvojice, adenin s thyminem (A–T) a cytosin s guaninem (C–G). Protože se tyto dvojice nedají kombinovat jinak, celý pár bází vlastně nese jen jednu informaci: jestli je to A–T, nebo C–G. To odpovídá dvěma bitům, protože dvě možnosti lze zakódovat právě dvěma bity. Když tedy vezmeme 3,1 miliardy párů bází a vynásobíme je 2 bity, dostáváme se k číslu kolem 6,2 miliardy bitů. A když to převedeme na gigabajty (podle stejného principu, jako když kupujeme flashku), vyjde to přibližně 0,8 GB. Tolik by teoreticky „pojala“ genetická informace jedné spermie, kdybychom ji používali jako úložné médium.

Při jednom orgasmu z těla vyloučíme okolo 2000 až 5000 Kongresových knihoven. Desítky milionů filmů v HD rozlišení, prakticky celý katalog Neflixu asi tak 150krát. Desítky miliard písniček, dost na to, aby je Spotify přehrávalo stovky let pořád dokola. Data z milionů mobilních telefonů. To všechno v objemu tekutiny, který se vejde na kávovou lžičku.

K podobnému číslu dochází i dokument Úvod do datové kapacity DNA, který publikovala DNA Data Storage Alliance – sdružení firem jako Microsoft, IBM nebo Dell, které se technologiím ukládání dat do DNA aktivně věnují. Autoři vycházejí z toho, že jedna báze (A, C, G nebo T) může nést 2 bity informace, protože existují čtyři možné stavy. Jenže ve skutečných úložných systémech se nepracuje jen se „čistými daty“. Velkou roli hraje tzv. technická režie – tedy informace, které je nutné přidat, aby bylo možné DNA bezpečně zapsat a znovu přečíst. Patří sem například kontrolní a orientační sekvence, korekční kódy pro opravu chyb, metadata, která umožňují správně seřadit úseky DNA zpět do pořadí. Tyto pomocné informace ukrojí zhruba polovinu kapacity. Proto autoři uvádějí, že jedna báze ve výsledku unese jen 1 bit užitečné informace. Pokud tedy vezmeme znovu 3,1 miliardy bází (v jednom haploidním genomu), dostáváme se k hodnotě okolo 6 miliard bitů, což při převodu opět vychází přibližně 0,8 GB.

Trocha fantazie nikoho nezabije

V běžném ejakulátu všechny spermie nesou identickou genetickou informaci, takže celková „dávka“ má přesně stejný objem dat jako jedna spermie čili 0,8 GB. Představme si ovšem, že existuje možnost, jak uměle syntetizovat DNA uvnitř spermií a každé spermii přiřadit jinou DNA sekvenci. Každá spermie by pak byla samostatným datovým nosičem a obsahovala by unikátní data o objemu 0,8 GB. A jelikož průměrný počet spermií v ejakulátu se odhaduje někde mezi 200 a 500 miliony, vychází to někde mezi 150 až 375 petabyty (miliony gigabytů). To je obrovské množství informací. Pro srovnání: celá americká Kongresová knihovna včetně všech dokumentů, záznamů, knih a všeho obsahuje okolo 74 terabytů dat. To znamená, že při jednom orgasmu z těla vyloučíme okolo 2000 až 5000 Kongresových knihoven. Desítky milionů filmů v HD rozlišení, prakticky celý katalog Neflixu asi tak 150krát. Desítky miliard písniček, dost na to, aby je Spotify přehrávalo stovky let pořád dokola. Data z milionů mobilních telefonů. To všechno v objemu tekutiny, který se vejde na kávovou lžičku. To není jen ohromující, z toho jde cítit úžas a pokora. Fascinuje nás, jak se úžasně rychle zvyšuje kapacita našich počítačů, přitom efektivita ukládání dat v přírodě je od posledního iPhonu vzdálená asi tak jako iPhone od pěstního klínu. DNA dokáže uchovávat informace v hustotě 215 petabytů na gram hmoty a děje se tak už miliardy let.

Každá spermie nese dostatek informací k tomu, aby se zrodila nová lidská bytost. Ejakulace není jen biologie, je to datová exploze. Příroda je IT génius supertřídy a každá spermie je miniaturní superpočítač.