本篇来自Stanfordcompression workshop2019论坛系列讲座,演讲者是来自斯坦福的Hanlee Ji。
几十年来,数据在人类社会呈爆发式增长,并且增长势头长期迅猛。在海量的数据面前,我们的数据存储方案却没有很大的提高,当前最常用的机械硬盘与固态硬盘的寿命都在数十年,而且转移和拷贝数据十分不便,随着数据的持续增长,我们需要新的存储介质来保存人类文明。
所幸,自然界中的生命给我们提供了很多种类的解决方案。在生物中主要有DNA->RNA->蛋白质的数据流动方向,考虑这三种物质:
1.蛋白质很难用20多种氨基酸精确描述,以及蛋白质难以保存,不能被反复存取,所以蛋白质在分子数据储存上不是一种好的形式。
2.RNA可以很容易被高效写入,但是RNA的问题在于因为化学组成中的微妙碱基对发生了变化,RNA对十分敏感,容易快速降解,因此RNA也不是一个好的形式
3.DNA的双链结构很稳定,它可以保存信息数十年,如同在电路中操作电子一样,我们发展了很多手段操作DNA。因此,将DNA视作一种新的数据存储介质逐渐成为一个很自然的观点。
DNA作为数据存储介质有很多优势:
1.数据存储密度高多个数量级
2.低温下可以保存数百数千年稳定
3.长期储存不需要电力供应,功耗低
4.数据的快速复制
当前DNA作为数据存储介质的问题主要在于读取较慢,但与此同时,几十年来读取技术在快速发展,可以预见不久的将来,读取速度将快速提高。
斯坦福的一个跨学科团队已经在着手建立DNA存储系统,在最近发表的论文中已经实现了DNA的随机读取和数据定位。相信在不久的将来,DNA作为分子数据存储技术将不断发展成熟。