一条DNA单链放下整部维基百科这家美国公司做到了

综艺节目 浏览(1527)
盈丰娱乐网站

cabbcb94a2784a8e8676a9c92aaabf20

借助这项技术,不再需要用于跨国数据传输的卡车。

文字|光谱

我们的祖先用纸和笔写下家谱并保护它。由于纸张作为媒介,大火足以支付它;我们的父母开始使用磁带,软盘和CD来保存重要信息。如今,找到读取它们的设备变得越来越难。今天,这一代的所有记录都可以在我们的手机,电脑,钱包中的USB闪存驱动器和远处的“云”中找到。

反复的技术进步为我们带来了更小,更高效,更耐用和抗破坏的数据存储方法。

但是很多人并没有意识到大自然也有一种“自然”和非常“保险”的存储媒介。它非常小,由每个人拥有。在遗传学家的眼中,这种媒介将人类的所有数据记录作为物种,从猿类到智人(Homo sapiens)。

这种媒介是DNA。

最近,美国波士顿的医疗技术公司目录宣布了人工DNA作为数据存储介质研究的重要里程碑。

整个维基百科(英文版)保存在单链人工DNA中。

“人类的许多功绩来自于我们对其他物种的模仿。我们看到飞鸟和发明了允许人类飞行的飞机,“目录科学家Milena Lazova在视频中说。 DNA也是如此。我们看到人体存储信息。为什么不用DNA来存储数据?“

DNA(脱氧核糖核酸)是一种生物大分子,构成基因的主要形式。通常,DNA以双螺旋结构存在(双链配对并紧密结合在一起。

e23f0b385f6d449eacaedf47be5412ba

许多人可能已经学习了生物学中DNA工作的基础知识。通常,DNA通常含有四个碱基(A,T,C,G),并且不同碱基的排列最终决定了我们的外观,智力和不同疾病的风险。

对于包括人类在内的大多数物种而言,由于DNA中包含的信息可以确定遗传结果。

在过去的几年里,医学基因编辑技术取得了很大进展。人们现在可以在非常小的,可接受的误差范围内“Ctrl-x,c和v”现有的基因序列。这种技术使人类有机会克服曾经被认为已被根除的一些最终疾病,但它也导致了一些道德争议[1]。

从近70年来第一次发现DNA结构来看,遗传学家仍然无法完全理解DNA序列的全部含义并使用它;然而,在数据存储的背景下,一切都不是那么复杂:毕竟,部分数据信息最终返回到1和0。

科学家将A,T,C和G定义为一串DNA二进制数,并结合四个碱基。

1b81d38ab15a462e89420748827c0c16

关于目录的好处在于,他们已经找到了一种方法,可以根据需要更快,更便宜地对基础进行分类,将数据编码到DNA分子中:简单地说,预先生成的基本碎片的大规模排列然后执行合成。

例如,单词bagel:

ASCII: b a g e l

二进制: 01100010 01100001 01100111 01100101 01101100

基准对齐: ATGT ATGA ATAC ATAA ATCG

脱氧核糖核酸;以同样的方式,总之,书中的所有单词,甚至是JPEG照片,都可以转换成二进制代码并编码成DNA。

目录独立开发了“DNA Writer”(细节不足,可视化测量冰箱的大小)。该机器每天可以写入大约1TB的数据,从而可以大规模手动编写DNA信息。

在市场上购买DNA测序仪并不困难,因此任何人(只要他们有钱)都可以重新读取DNA信息并将其转换为原始文本或图像格式。

c78e413d726543edb32cfaf7059294a8

该目录由两位科学家创建,拥有一支不到10人的团队。 CEO Hyunjun Park完成了他的博士学位。他在威斯康星大学麦迪逊分校获得微生物学博士学位,并在开始创业之前曾在麻省理工学院担任博士后研究员。首席技术创新官Nathaniel Roquet拥有博士学位。哈佛大学生物物理学专业。

Park Hyun Joon和Roquet于2016年参加了IndieBio Biotech Accelerator。当时,他们还没有发明前面提到的机器。 Roquet不得不使用滴管完成操作。他花了四个小时让他的手肿了。

幸运的是,他们完成了概念验证,并首次成功地将一片DNA注入美国着名诗人罗伯特弗罗斯特《未选择的路》,这是一条约1KB的信息[2]。

在创始团队自己的资金支持两年后,目录最终在2018年从Ener Investment(NEA)和DataCollective获得了约800万美元的注资。从《未选择的路》到《银河系漫游指南》,到今天的维基百科英文版本因为随着DNA编写者的成功发展,目录的数据录入效率越来越高。

f34f4899580041aebd99c2da68f7cb37

对于大多数人来说,目录开发的技术属于“杀鸡”,毕竟基于硬盘或闪存芯片的本地或云存储非常便宜。

使用DNA存储信息的最佳位置是那些需要长时间存储大量数据,或者经常需要大量数据的全球传输的数据中心和云计算公司。

硬盘驱动器本身非常便宜,但它在数据中心运行很多机柜,这是非常昂贵的,对于某些存储解决方案,停电可能导致数据丢失,因此应考虑进一步的灾难恢复成本。

相比之下,DNA的信息存储密度大约是闪存的一百万倍。

根据目录,大型数据中心的存储容量约为1 EB(1000 PB或100万TB)。如果将1EB数据写入DNA,那么糖的大小只有一个。

ca29b893c8fc4b51981e38ddb5d49f78

由于存储密度高,DNA也非常适合运输大量数据。

示例:贵公司最近将10PB数据迁移到Amazon AWS,知道AWS会做什么?答:AWS将发送卡车将您的数据保存到硬盘驱动器,将其放入容器中,然后将其上传到数据中心进行上传。费用约为500,000美元。当然,您也可以选择将硬盘发送到亚马逊。原因:数据量太大,带宽不够,效率太低。集装箱实际上是最有效的运输方式。

如果您使用DNA存储怎么办?这些数据不仅仅是立方糖的大小。因此,在纸上滴一滴DNA并将其发送给另一方。

此外,使用DNA存储作为灾难恢复解决方案也是合适的,因为DNA分子链是稳定的并且不会丢失数千年甚至数万年。当然,未来仍在使用DNA测序仪。

此外,如果未来的人类真正走向濒临灭绝,所有历史,知识和数据都需要提前数字化保存.如果你使用DNA进行储存,那么全人类的文明都可以安装。一台冰箱[3]。

“我喜欢发明前辈们没有想到的东西。但令我们兴奋的是,我们的发明可以为未来世界带来巨大价值,“罗凯说。

[1]“基因编辑宝贝”闹剧结束:三个部门呼吁停止科学研究,调查违反法律法规的行为

[2]如何使DNA数据存储成为商品可行的解决方案 - 并恢复物理数据所有权

[3]基于DNA的数据存储和CATALOG简介

bb01dce446324bc18edf135baed2bb92

喜欢这篇文章?

1)点击右下角的“Good Look”让更多人看到这篇文章

2)将其分享给您的朋友和小组圈

3)关注硅星!

硅星:(ID:guixingren123)

从技术到文化,从深度到细分,硅星告诉您有关硅谷的一切。