DNA als langlebiger und effizienter biologischer Speicher für digitale Daten [169]

Das Konzept der personalisierten Medizin verspricht, Empfehlungen für die Prävention und die Behandlung von Erkrankungen maximal auf den einzelnen Patienten zuzuschneiden (1). Damit dies gelingen kann, müssen vorab große Mengen an Daten erhoben, ausgewertet und vor allem auch gespeichert werden.

Herkömmliche Datenspeicher, wie etwa Festplatten sind relativ kurzlebig. Um diese Datensammlungen zu erhalten, müssen sie regelmäßig umkopiert werden. Zwei Wissenschaftler von der Columbia University und dem New York Genome Center (NYGC) nutzten jetzt das Potential von DNA-Material als biologischer Speicher für digitale Informationen (2). Ihnen gelang es, mit Hilfe eines Algorithmus, der für das Streaming von Video auf einem Mobiltelefon entworfen wurde, ein komplettes Computer-Betriebssystem, einen Film und andere Dateien in DNA-Oligonukleotiden komprimiert abzulegen und unversehrt wieder abzurufen.

Wissenschaftliche Details

Erbgutträger sind ein nahezu perfektes Speichermedium. Die DNA erhält Informationen äußerst komprimiert über Jahrtausende von Jahren hinweg und veraltet dabei technisch nicht.

Der Informatikprofessor, Yaniv Erlich vom Columbia’s Data Science Institute, und seine Kollegin Dina Zielinski bewiesen jetzt in Kooperation mit dem New York Genome Center, dass die DNA geeignet ist, auch digitale Daten unversehrt zu bewahren. Sie wählten sechs repräsentative Dateien aus, um diese in die DNA zu codieren; ein komplettes Computer-Betriebssystem, den 1895 gedrehten französischen Kurzfilm Ankunft eines Zuges bei La Ciotat, eine Amazon-Geschenk Karte im Werte von 50 $, einen Computervirus, eine Pionier-Plakette und eine Publikation vom Informationstheoretiker Claude Shannon aus dem Jahre 1948.

Zusammengefasst in einer Master-Datei sind die sechs Medien in kurze Strings von Binärcode aus Einsen und Nullen übersetzt worden. Der Korrekturalgorithmus Fountain Code half, diese Strings den vier Nukleotidbasen in der DNA: A, G, C und T zufällig zuzuordnen und Fehlerkombinationen zu löschen. Die daraus hervorgegangenen Informations-Tröpfchen erhielten Barcodes für die Dechiffrierung.

Das DNA-Synthese-Startup, Twist Bioscience aus San Francisco verwandelte die so beschriebenen 72.000 DNA-Stränge in DNA-Moleküle. Zu guter Letzt konnten von diesen Biomolekülen die digitalen Informationen ohne Fehler abgerufen werden. Auch gelang es den Wissenschaftlern mit ihrer Codierungstechnik, die DNA-Stränge zu duplizieren und so fehlerfreie Kopien der Ausgangsdateien herzustellen.

Bemerkenswert fiel auch die Komprimierleistung aus. Durchschnittlich 1,6 Bits wurden in jedes Basen-Nukleotid verpackt, mindestens 60 % mehr Daten als mit herkömmlichen Techniken. Es braucht nur ein einziges Gramm DNA-Material, um 215 Petabytes (= 1.000.000.000.000 Bytes) Daten zu speichern. Die Biomoleküle gelten daher als der dichteste Datenspeicher, der bislang genutzt wurde. Noch ist die Archivierung von digitalen Daten im biologischen Speicher zu teuer, um sie massenhaft anzuwenden. 7.000 $ waren nötig, um die DNA-Stränge herzustellen, weitere 2.000 $, um sie zu entschlüsseln.

Zum Weiterlesen

(1) J.L. Jameson, D.L. Longo (2015): Precision Medicine — Personalized, Problematic, and Promising. In: The New England Journal of Medicine, Vol. 372, Nr. 23, 2229-2234. Online unter https://www.nejm.org/doi/full/10.1056/NEJMsb1503104

(2) Y. Erlich, D. Zielinski (2017): DNA Fountain enables a robust and efficient storage architecture. In: Science, Vol. 355, Nr. 6328, S. 950-954. Online unter http://science.sciencemag.org/content/355/6328/950

Neues aus der Wissenschaft