DNA'da Dijital Veri Depolamada Gelecek Trendleri

Üretilen bilgi kapasitesindeki büyüme ve verilerin uzun süre saklanması için ortaya çıkan ihtiyaç ile birlikte, yüksek kapasiteli, yüksek depolama yoğunluğuna ve aşırı çevresel koşullara dayanma olasılığı olan bir depolama ortamına ihtiyaç duyulmaktadır. DNA, çarpıcı özellikleri ile olası veri depolama ortamı olarak karşımıza çıkmaktadır. Yakın geçmişte DNA'ya veri okumak ve yazmak için çeşitli kodlama modelleri, hata oluşturma sorunlarını ele alan verileri şifrelemek için kodlar ve kodonlar ve depolama stilleri geliştirmeye yönelik yaklaşımlar geliştirilmiştir. DNA, DNA kriptografisi ve stenografiye giden yolu açan gizli yazı için potansiyel bir ortam olarak tanımlandı. DNA'da büyük veri depolama ve analitik ile birlikte organik bir bellek cihazı olarak kullanılan DNA, hesaplama problemlerini çözmek için DNA hesaplamaya giden yolu açtı. Bu makalede sizler için verileri DNA'ya kodlamak ve şifrelemek için kullanılan çeşitli yöntemleri eleştirel bir şekilde analiz ederken, daha önce tanımlanan dezavantajların üstesinden gelmek için her şemanın avantajlarını ve kapasitesini inceledik. Kriptografi ve stenografi teknikleri, her yöntemin sınırlamaları belirlenirken eleştirel bir yaklaşımla analiz edilmiştir.

Veri depolama yolculuğu kemikler, taşlar ve kağıttan başladı. Sonra bu yolculuk delikli kartlara, manyetik bantlara, gramofon plaklarına, disketlere ve benzerlerine saptı. Daha sonra teknolojinin gelişmesiyle birlikte CD, DVD, Blu-ray disk, flash bellek gibi optik diskler devreye girmiştir. Bunların hepsi çürümeye tabidir. Biyobozunur olmayan malzemeler olarak bunlar çevreyi kirletir ve ayrıca işletme için enerji kullanırken yüksek miktarda ısı enerjisi açığa çıkarır.

Bilginin üretilmesi, iletilmesi ve saklanması amacıyla dijital sistemlerin kullanılmasıyla birlikte, dijital ortamın aktif ve sürekli bakımına olan ihtiyaç artmaktadır. Gelecekte kullanılmak üzere saklanması gereken çok büyük miktardaki dijital verilerle, karşı konulamaz miktarda verinin depolanmasında bir sorun ortaya çıkıyor. Veri depolamaya olan talep her geçen gün hızla artmaktadır. 2012'de tüm dünyanın toplam bilgi depolaması 2,7 ZB civarındaydı. Depolama ihtiyacı her yıl %50 artıyor. Şu anda neredeyse tüm dijital veriler, yalnızca sınırlı bir süre dayanacak bir teknoloji ile saklanmaktadır. Hafıza kartları ve çipler, ilk kullanımlarından itibaren 5 yıl boyunca sürdürülebilir. Standart sabit diskler, yüksek sıcaklıklar, nem ve manyetik alanlara maruz kalma ve mekanik arızalar nedeniyle hasar görme eğilimindedir. Katı hal sürücüleri, sabit sürücülerden daha iyi çalışsa da, birkaç aydan uzun süre güçle çalıştırılmazlarsa bilgilerini kaybetme eğilimi gösterirler.


Bu nedenle, araştırmacıların bağlılığı, yukarıda bahsedilen dezavantajları başarılı bir şekilde ortadan kaldıran bir depolama mekanizmasının geliştirilmesine yönelmiştir. Fosil kemiklerin genetik materyali çağlar boyunca muhafaza etme biçimini dikkate alan araştırmacılar, depolama ortamı olarak deoksiribonükleik asidin (DNA) kullanılmasına dikkat ettiler. DNA inanılmaz bir depolama kapasitesine sahiptir. İnternet'teki tüm bilgiler birim küp inçten daha küçük bir cihazda bulunabilir. Temel olarak, bilgisayar tarafından veri depolamak için 1 s ve 0 s kullanmak yerine, adenin, guanin, sitozin ve timden (A, G, C ve T) oluşan DNA zaten eşleştirilmiş olduğundan, bu konuda en uygun ortam olarak DNA'ya tanık olunur. A-T ve G-C nükleotit baz çiftlerine dönüştürülerek ikili kod biçiminde bilgi depolamak için kullanılabilir .Yüksek kapasiteli depolama ortamına acil ihtiyaç arttıkça, tek nükleotid 2 bit bilgiyi temsil edebildiği için DNA bu açıdan ideal kabul edilir. Buna göre 1 gram tek sarmallı DNA (ssDNA) içinde 455 EB veri kodlanabilmektedir . Dünya tarafından bir yılda üretilen tüm bilgi sadece 4 gram DNA'da saklanabilir. Yapısı gereği 3 boyutlu (3D) olduğu için DNA tarafından yüksek bellek alanı sunulur. DNA, oksijen ve sudan kurutularak ve korunarak neredeyse sonsuza kadar uzatılabilen binlerce yıl boyunca okunabilir ve güvenilir bilgiler sunar.


Yöntemler:


Depolama Aygıtı Olarak DNA


İki uzun nükleotid dizisi birlikte bir DNA molekülü oluşturur. Her nükleotit, bir deoksiriboz şekeri ve bir fosfat grubu ile birlikte dört bazdan birini (A: adenin, G: guanin, C: sitozin ve T: timin) içerir. DNA molekülü, A=T ikili hidrojen bağı veya C≡G üçlü hidrojen bağı ile bağlanmış iki tekli sarmallı nükleotit setinden oluşan çift sarmallı bir yapı içerir. Hidrojen bağları ile birbirine bağlanan bu iki tek sarmal, tamamlayıcı sarmallar olarak adlandırılır. Tek sarmallı bir DNA iki uç arasında konumlanmıştır: 5-(5-asal) ve 3-(3-asal) . Uzun DNA sarmallarının birikmesi sorunlu olduğundan, bilgi "oligonükleotidler" adı verilen nükleotit yığınları halinde paketlenir. Bir DNA sentezleyici kullanarak sentezleme işlemi, yapay olarak yaklaşık 50-100 oligonükleotitten oluşan tek sarmallı DNA zincirleri elde eder. Hibridizasyon, belirli koşullar altında tamamlayıcı ssDNA ile birleşerek çift sarmallı DNA (dsDNA) oluşturan bireysel tek sarmallı DNA (ssDNA) işlemidir. Ribonükleik asit (RNA), timinin (T) Urasil (U) ile değiştirildiği ribonükleotitleri içeren bir ssDNA'dır . DNA çift sarmallı olduğu için bilgi genellikle baz çiftlerinde okunur. Şu anda yeni DNA sentezleme tekniklerinin yardımıyla, baz nükleotit çiftlerinin üretilme şekli yeniden düzenleniyor çünkü G-C çiftini ardışık olarak okumak zor. Geleneksel baz çiftleri A-T ve G-C idi. Yenilikçi baz çiftleri A-C ve G-T, daha yeni teknolojiler tarafından kullanılıyor. 0'ı kodlamak için A-C, 1'i kodlamak için G-T kullanılır.


DNA Gizli Yazma


Gizli yazı, yetkisiz kişilerin bilgilere yasa dışı erişimini önlemek için kullanılır. Kriptografi ve steganografi, gizli yazma için kullanılan iki yöntemdir. Kriptografi yanlış anlama için bilgiyi manipüle ederken, steganografi bilginin varlığını gizler. Geleneksel kriptografi ve stenografi teknikleri, hem teoride hem de uygulamada olgunlaşmış zor matematiksel problemlere dayandığından güç kaybetmekte ve kırılabilir hale gelmektedir. Bu nedenle araştırmacılar, DNA metodolojilerini kriptografi ve stenografiye dahil eden hibrit kriptosistemler geliştirmeyi araştırıyorlar. Verilerin DNA dizisi cinsinden saklanmasına DNA kriptografisi denir. Veri gömme, stenografi veya DNA filigranı olarak da adlandırılır.. DNA verilerinin gömülmesi, (i) DNA yöntemleriyle mümkün olur: ekleme ve oluşturma kullanılarak DNA'ya yazma;
(ii) DNA dizileme: DNA okuma. Kriptografinin amaçları temel olarak aşağıdaki gibidir. (i) Kimlik Doğrulama: Kimlik doğrulama, bilgi aldığımız varlıkla ilgili ayrıntıların doğrulanmasıdır. Kimlik doğrulamasını sağlamak için dijital imzalar, parolalar ve ticari markalar kullanılır. (ii) Veri gizliliği: Bu, gizli verilerin yetkisiz personelden korunması sürecidir. Kriptografide bu amaca şifreleme yoluyla ulaşılır. (iii) Veri bütünlüğü: Bu, bilgilerin tam olarak resmi tarafça gönderildiği biçimde alınmasını garanti etmek içindir. Bu, kriptografi işlemi sırasında herhangi bir modifikasyon veya değişiklik yapılmadığı gerçeğini içerir.
DNA veri gömme için pratik yöntemler iki yönlüdür: (i) DNA tabanlı stenografik yöntemler, bilgiyi almak için PCR ve gizli anahtarın gerekli olması için canlı bir organizmada fiziksel olarak bilgi saklar. (ii) Bilginin canlı organizmanın biyolojik özelliklerini etkilemeden hücre replikasyonu ile birlikte organizma tarafından taşınması için canlı varlıklara bilgi yerleştirilmesi önerilmiştir. Bu iki şekilde yapılabilir: (a) DNA'nın kodlanmayan bölümlerde değiştirilmesi asla proteinlere aktarılmaz: dezavantajı, bu eklemenin biyolojik işlevleri etkilememesini sağlamak için aşırı özen gösterilmesi gerektiğidir. (b) Proteinlere aktarılan kodlayıcı DNA (cDNA) bölümlerinin değiştirilmesi: bu yaklaşım daha sistematik ve daha güvenlidir.

Organik Veri Belleği Olarak DNA


Riskli ekolojik koşullara dayanma yeteneğine sahip, hızlı büyüme yeteneğine sahip ve yapay gen dizilerinin eklenmesini tolere edebilen canlı bir konakçıya DNA dahil etmek, güvenilir bir depolama ortamı oluşturmak için önerilen çözümdü. DNA dizilerini bir organizmaya aşılamak zorlu bir iş çünkü birçok genomdan oluşan bütün bir organizmadan bir mesaj almak zordur. Diğer bir engel, genomik mutasyonun öngörülemeyen doğasıdır. DNA hafıza prototipi 4 ana adımdan oluşur: (i) Bilginin yapay DNA dizileri olarak kodlanması. (ii) Dizilerin canlı organizmalara enjekte edilmesi. (iii) Organizmaların beslenmesine izin vermek. (iv) Organizmalardan bilgi almak.

DNA'da Büyük Veri Depolama ve DNA Hesaplama


DNA hesaplama çağı, elektronik bilgisayarlardaki sınırlamaların tanımlanmasıyla başlar. Elektronik bir bilgisayarda depolanabilecek veri hacmi ve bilgisayarların fiziksel özelliklerine bağlı olarak erişilebilen hız eşikleri, büyük olarak tanımlanan ana sınırlamalardır. DNA bilgisayarı, DNA'da büyük veri depolamaya ve büyük veri analitiğine yol açan doğal hesaplama modellerini keşfederken, molekül manipülasyonlarını içeren hesaplama problemlerini çözerek yukarıda belirtilen sınırlamaları giderir. DNA hesaplamanın sunduğu avantajlar, elektronik bilgisayarlardan çok daha az enerji tüketmeyi içerir. DNA bilgisayarları tarafından tüketilen enerji, diğer elektronik bilgisayarlara kıyasla milyar kat daha azdır. Bilgi depolamak için gereken depolama alanı, elektronik bilgisayarlara göre trilyon kat daha azdır. Ayrıca DNA bilgisayarları yüksek düzeyde paralellik sunar. Milyonlarca ve trilyonlarca molekül paralel olarak kimyasal reaksiyonlar gerçekleştirir.

DNA, geniş depolama kapasitesi, yüksek veri yoğunluğu, aşırı çevre koşullarına dayanması vb. nedeniyle veri depolama için potansiyel ortam olarak tanımlanmıştır.  DNA'da bir görüntü depolamak, DNA üzerinde abiyotik bilgi depolamak temel fikri ile DNA tabanlı depolama sisteminin temelini oluşturur. Genesis projesi, Microvenus projesinin yerini almıştır. Microvenus, benzersiz bir şekilde kodu çözülemediği için hatalıydı, Genesis de hatalıydı ve kodu çözdükten sonra orijinal metni döndürmediği için verimsizdi. DNA'nın uzun vadeli veri depolama için potansiyel ortam olarak tanımlanmasına rağmen, bu sorunlar ele alınması gereken aksaklıklar olarak tanımlandı: DNA sentezinin yüksek maliyeti, verilerin daha yavaş geri okunması, DNA'nın yeniden yazma yeteneklerine sahip olmaması ve DNA'nın buna izin vermemesi.


Maliyet ve veri alma hızı, DNA tabanlı depolama sistemlerinde önemli problemlerdir. Şu anda veri, doğal depolamadan çok daha yüksek bir hız olan depolama cihazları tarafından saniyede yaklaşık 100 MB hızla okunabilmektedir. Sentez ve dizileme süreçleri zaman alıcıdır ve bu yöntemi genel halk için erişilemez kılan uzmanlık bilgisi gerektirir. DNA ölçeklenebilir, sağlam ve kararlı olmasına rağmen, yukarıda belirtilen dezavantajlar büyük bir endişe kaynağıdır.

Özel bir DNA molekülü yapmak pahalıdır ve bu, DNA tabanlı depolama sistemlerinin önündeki en büyük engel olarak tanımlanmıştır. Son zamanlarda paralel otomasyon ve yeni nesil dizileme teknikleri kullanılarak sentez maliyetinin düşürülmesi faaliyettedir. Bu nedenle, basitleştirilmiş saflaştırma teknikleri odaklanılması gereken önemli bir alandır. Şu anda araştırmacılar, bir moleküler veri depolama sistemi geliştirmeye yönelik ilk adım olarak okuma ve yazma odalarından oluşan DNA depolama sistemi geliştirmeye odaklandılar. Güvenliği sağlamak için araştırmacılar, bilgileri park yerleri olarak bilinen güvenli bölgelere aktardılar. DNA'yı okumak için elektrik alan gradyanları, elektronik motorlar vb. kullanılarak kodlama istasyonlarına aktarılmıştır. Moleküler depolama cihazını ticari bir uygulama haline getirmek için araştırmacıların doğal depolama kapasitesini ölçeklendirmeye odaklanması gerekiyor. Genel genel kodlama, yükseltme, sıralama, yeniden yapılandırma ve kod çözme işlemleriyle ilişkili yüksek zaman tüketimi de önemli bir zorluktur. Homopolimerler, dizileme hataları, düşük erişim hızı hataları gibi birçok hata mevcuttur. Doğal DNA'da otomatik düzeltme mekanizması mevcut olmasına rağmen, sentetik DNA'da böyle bir mekanizma yoktur. Gelecekteki çalışmalar, deneylerin yürütüldüğü çevresel koşulların analizini ve DNA'nın uzun süreli depolama için korunmasını içerir.