前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >超越云存储,用一勺蛋白质保存整个图书馆

超越云存储,用一勺蛋白质保存整个图书馆

作者头像
大数据文摘
发布2019-05-16 11:12:40
6680
发布2019-05-16 11:12:40
举报
文章被收录于专栏:大数据文摘大数据文摘

大数据文摘出品

编译:宋欣仪

我们怎样存储信息?

写下来的纸张会被焚毁,电脑可能会被黑,DVD可能会无法读取。威胁无处不在,从简单的一盆水到复杂的网络攻击,都有可能让我们的记录化为乌有。

信息爆炸,数据井喷,可能未来连云存储也无法承载,而且它无法阻挡住所有黑客,还会持续消耗能量。据估计,到2020年,全球数字化档案估计将达到44万亿Gb,数字化海啸马上就要席卷而来,浪潮之下,我们应该如何面对海量信息?

哈佛信息服务中心的计算机存储架与笨拙的数据线

现在,有一种存储信息的新方法可以稳定地存储数百万年的数据,并且不受到黑客的威胁。

它的占用空间非常小,想象一下用一勺蛋白质就可以保存整个纽约市公共图书馆的资料,一锅蛋白质就可以容纳所有地球往事。并且一旦编写,就不会再消耗能量。所需要的只有一个化学家,一些易得的分子和需要存储的信息。

这是哈佛大学与西北大学合作开发的一个项目,研究结果已经在国际学术期刊ACS Central Science发表。该项目提出并实现了利用易获得、低能耗、稳定且能超长时间保存的寡肽分子存储数据(以二进制形式),数据检索准确率超过99%。

从生物学到有机化学:数据存储的灵感

利用生物存储能力来存储数据的想法早已有之,并且已经有了一定的进展。比如,目前我们已经可以通过合成DNA链来记录信息,记录的信息可以从美食照片,烹饪教程一直到撸猫视频。

但是虽然DNA与计算机芯片相比较小,但还是属于大分子。并且,DNA的合成需要大量重复的劳动。如果每条消息都需要从头开始设计编译,那么大分子存储可能会因为过于昂贵耗时而无法实现。

Brian Cafferty

Brian Cafferty,该研发团队的成员之一,也是论文的第一作者介绍说,于是他们的研究团队从生物学转向有机和分析化学寻求灵感,开发使用一种更小、更低分子量的分子来编码信息的方法。

这种存储方式只需一次合成就可以生成足够的小分子,用以编码多个视频,使这种方法无疑比基于DNA的方法更省力也更便宜。

用分子实现听说读写画

该团队选择的低分子量分子是寡肽(两个或多个结合在一起的肽),这些肽常见而稳定,并且比DNA,RNA或蛋白质分子量都要小。

而且由于组成寡肽的氨基酸数量和类型不同,它们的分子质量是有差异的。当不同的寡肽分子混合在一起时,这种差异可以实现相互区分,不同质量的分子就像字母表中的不同字母一样。

将这些“字母”组成单词会有点复杂,该团队将不同质量的寡肽存储在384个不同的“微孔”中,然后将寡肽混合物放置在金属板的表面上,就像将墨水印在书页上一样。如果想要读取“写下”的内容,可以通过质谱仪按质量对微孔中的分子进行分类,查看这个孔中存在哪些寡肽、不存在哪些寡肽,由此读取内容。

图片来源:Michael J. Fink

然后团队使用二进制编码将混乱的分子翻译成字母和单词。例如,字母“K”在ASCII(美国信息交换标准代码)中被写作01001011,就可以通过使用八种不同质量的寡肽存储“K”。将微孔中存在的四种寡肽读取为“1”,而缺失的四种读取为“0”(如下表)。这些分子二进制代码指向相应的字母;如果存储的信息是图像,则指向相应的像素。使用这种方法,八种寡肽的混合物可以存储一个字节的信息; 32种寡肽的混合物可以存储四个字节,以此类推。

更快,更便捷,更安全

到目前为止,Cafferty和他的团队已经用这种方法记录、存储并“阅读”了物理学家Richard Feynman的著名演讲、Claude Shannon(他被称为“信息理论之父”)的相片和葛饰北斋的画作《神奈川冲浪里》。

名画《神奈川冲浪里》

经检验,这种存储方式的检索准确率为99.9%平均“写入”速度为每秒8bits,“读取”速度每秒20 bits。虽然目前还比大多数数据存储设备要慢,但随着技术的继续发展,速度肯定还会提升。例如,如果喷墨打印机可以以每秒1,000次的速率产生液滴,就能将更多信息塞入更小的区域,或者再加以改进质谱仪使之可以同时获取更多信息。

未来,还可以通过引入不同类别的分子,提高存储的稳定性和容量,并降低成本。实验中使用寡肽是定制的,因此价格较贵。但未来还可以考虑可以购买更便宜的分子(如烷硫醇),实现花1美分就可以记录1亿比特的信息。

“目前,这种方法还不会取代现有的数据存储方法,”Cafferty说,“我们认为它是对现有技术的补充,非常适合长期存档数据存储。”Cafferty团队提出的分子存储方法是一种稳定的、零能耗、抗腐蚀的存储可选方案。

寡肽等分子具备复原能力,可以在数百年甚至数千年的时间内保持稳定性。在高温和干旱的情况下,这些分子可以在没有光或氧的情况下存活下来。而且,黑客无法像攻破云存储那样窃取分子存储的内容,分子存储只能通过人工访问。即使被发现藏匿的数据,小偷也需要拥有足够的化学知识才能实现代码检索。

所以未来,即使所有的书都付之一炬,所有的计算机都被黑了,所有DVD都被毁坏,这些分子可能还会继续存在,提醒未来的人类,我们曾经是多么喜欢那些萌萌的猫咪视频。

相关报道:

https://chemistry.harvard.edu/news/storage-beyond-cloud

论文地址:

https://pubs.acs.org.ccindex.cn/doi/pdf/10.1021/acscentsci.9b00210

本文参与 腾讯云自媒体分享计划,分享自微信公众号。
原始发表:2019-05-13,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 大数据文摘 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 图片来源:Michael J. Fink
相关产品与服务
对象存储
对象存储(Cloud Object Storage,COS)是由腾讯云推出的无目录层次结构、无数据格式限制,可容纳海量数据且支持 HTTP/HTTPS 协议访问的分布式存储服务。腾讯云 COS 的存储桶空间无容量上限,无需分区管理,适用于 CDN 数据分发、数据万象处理或大数据计算与分析的数据湖等多种场景。
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档