เทคโนโลยีการเก็บข้อมูลด้วย DNA Storage

หลายๆ คนคงรู้จัก Storage ที่เราใช้ในการเก็บข้อมูลในรูปแบบต่างๆ ซึ่งมีวิวัฒนาการมาเรื่อยๆ ในแต่ละยุคสมัย ไม่ว่าจะเป็น แผ่นซีดี แฟลชไดรฟ์ ฮาร์ดดิสก์จนกระทั่งปัจจุบันที่นิยมการเก็บข้อมูลต่างๆ ไว้บน Cloud Storage

ปัจจุบันเมื่อเราใช้งานอินเทอร์เน็ตกันอย่างแพร่หลาย  จำนวนข้อมูลบนอินเทอร์เน็ตก็มีแนวโน้มเพิ่มสูงขึ้นตลอดเวลา ทั้งรูปภาพ วีดีโอ และคอนเทนต์ต่างๆ  ซึ่งจากการเก็บข้อมูลเมื่อสิ้นปี 2020 นั้น พบว่าทั่วโลกมีข้อมูลบนอินเทอร์เน็ตอยู่ราว 44 เซตตะไบต์* หรือราวๆ 4,400 ล้านเทราไบต์ (*Zettabyte: ใช้ตัวย่อว่า ZB โดย 1 ZB = 1×10 ยกกำลัง 21 หรือ หนึ่งพันล้านล้านล้านไบต์)

และมีการคาดการณ์ว่าภายในปี ค.ศ. 2025 ข้อมูลบนอินเทอร์เน็ตทั้งหมดที่มนุษย์สร้างขึ้นจะมีขนาดราวๆ 175 เซตตะไบต์

จากตัวเลขเหล่านี้ บางคนอาจจะสงสัยว่าข้อมูลจำนวนมากเช่นนี้ถูกเก็บไว้ที่ไหน และสถานที่เก็บข้อมูลต้องใหญ่โตเท่าไหร่กันนะ ถึงจะพอเก็บข้อมูลเหล่านั้นได้  เพื่อให้เห็นภาพและคลายความสงสัย เรามาลองดูภาพด้านล่างนี้ซึ่งเป็นสถานที่เก็บข้อมูลหนึ่งในหลายๆ แห่งของผู้ให้บริการ Google ว่าใหญ่โตขนาดไหน

การเก็บข้อมูลแบบใหม่ที่น่าสนใจคือการเก็บข้อมูลลงใน DNA หรือที่เรียกว่า DNA Storage ที่ใช้เทคโนโลยีในการสังเคราะห์ DNA ขึ้นมา จุดเริ่มต้นของ DNA Storage คือปี 1959 Richard Feynman หนึ่งในนักฟิสิกส์ที่ทรงอิทธิพลมากที่สุดคนหนึ่งของศตวรรษที่ 20 ได้เริ่มเปิดประเด็นการใช้ประโยชน์จากการย่อวัตถุต่างๆ ให้มีขนาดเล็กลงซึ่งสามารถตั้งข้อสังเกตได้ว่าเมื่อวัตถุที่ทำหน้าที่ได้เหมือนกันมีขนาดเล็กลง เราจะสามารถใช้ประโยชน์จากพื้นที่ขนาดเท่าเดิมได้มากยิ่งขึ้น (ซึ่งต่อมาแนวคิดนี้ถูกเรียกว่า Nanotechnology) รวมถึงได้แสดงข้อคิดเห็นว่าเราอาจสามารถใช้ประโยชน์จากสสารทางชีววิทยาที่มีขนาดเล็กอย่างเซลล์ของสิ่งมีชีวิตได้            

ต่อมามีคนนำแนวคิดนี้มาทดลองและปฏิบัติจนสามารถเก็บข้อมูลในรูปแบบของ DNA Storage ได้สำเร็จ ซึ่งเมื่อลองเปรียบเทียบความจุต่อน้ำหนักของ DNA กับฮาร์ดไดรฟ์ จากภาพจะเห็นว่าความจุต่างกันถึง 2 ล้านเท่า เมื่อเทียบกรัมต่อกรัม 

เนื่องจาก DNA มีขนาดเล็กมากๆ นั่นเองและโครงสร้างหลักของ DNA ที่ประกอบด้วยเกลียวคู่ของสาย Polynucleotide เรียงต่อกันเป็นเส้นยาว โดยในแต่ละสาย Nucleotide จะประกอบไปด้วยหน่วยเก็บข้อมูลขนาดเล็กที่เรียกว่า ” Nitrogenous Base ” และเจ้า base นี้เองคือจุดสำคัญเพราะมันคือตัวกลางที่รักษาสถานะข้อมูลแบบเดียวกับบิตคอมพิวเตอร์ เนื่องจากมันสามารถจับคู่ได้กับคู่เบสที่จำเพาะกันเท่านั้น (คล้ายๆ กับ State ของ 0 และ 1) แต่ด้วยขนาดของ base ที่เล็กในระดับนาโนเมตรมันจึงสามารถบรรจุสถานะของข้อมูลได้อย่างมหาศาลนั่นเอง

หลักการของเทคโนโลยีการบันทึกข้อมูลบนดีเอ็นเอนี้มีอยู่สามขั้นตอนคือ

ขั้นตอนที่ 1: การเข้ารหัส (Encode)

คือการแปลงข้อมูลอะไรก็ตามที่ต้องการบันทึกให้อยู่ในรูปบิตคอมพิวเตอร์ที่มีสถานะแค่ 0 และ 1 เป็นรูปแบบข้อมูลดิจิทัลที่คอมพิวเตอร์อ่านค่าได้

ขั้นตอนที่ 2: การสังเคราะห์ดีเอ็นเอ (Synthesis)

เมื่อได้ไฟล์ดิจิทัลของข้อมูลที่ต้องการบันทึกแล้ว เราจะใช้อัลกอริทึมหรือโปรแกรมพิเศษเพื่อแปลงข้อมูลเหล่านี้ให้อยู่ในรูปลำดับเบสภายในสายดีเอ็นเอในรูปแบบที่จำเพาะ

ขั้นตอนที่ 3: การถอดรหัส (Decode)

เมื่อเราบันทึกข้อมูลลงในสายดีเอ็นเอที่ถูกสังเคราะห์ขึ้นแล้ว หากต้องการอ่านข้อมูลที่อยู่ข้างใน เราสามารถนำสายดีเอ็นเอเหล่านั้นมาหาลำดับเบส (DNA sequencing process) เพื่ออ่านค่ากลับให้เป็นบิตคอมพิวเตอร์แล้วประมวลผลออกมาเป็นข้อมูลภาพ เสียง หรือ วิดีโอ แบบที่เราบันทึกไว้

การวิจัยและพัฒนาเทคโนโลยี DNA Storage นั้นมีความก้าวหน้าอย่างต่อเนื่อง เช่นในปี 2016 Microsoft และ University of Washington ได้ร่วมกันพัฒนาระบบที่ใช้ DNA เพื่อเก็บข้อมูลดิจิทัลอย่างสมบูรณ์เป็นครั้งแรก ซึ่งทาง Microsoft ได้เผยว่าทีมนักวิจัยปฏิบัติการเก็บและดึงข้อมูลได้แบบอัตโนมัติทั้งหมดแล้ว และมีโครงการที่จะนำ DNA Storage มาใช้งาน โดยอาจเริ่มต้นจากการ Archive ข้อมูลขนาดใหญ่ภายในบริการ Cloud

ลองคิดกันเล่นๆ หากในอนาคตที่ DNA Storage สามารถนำมาใช้งานได้จริง ขนาดของ Data Center ที่เราเห็นว่ามีขนาดใหญ่โตมโหฬาร อาจจะลดลงมาเหลือเท่าเหรียญบาทก็เป็นไปได้