在计算领域,数据是以便于移动和处理的形式呈现的信息。目前的数据处理方式是将信息转化为二进制数字。数据可以是单一主题或多个主题的集合,原始数据是指用于描述信息最基本的数字格式。
计算机使用二进制模式(0和1)将包括视频、图像、声音和文本在内的数据表示为数字。数据的基本单位是位,代表一个值,而字节则由八个二进制数字组成。存储和内存的计量单位通常是兆字节和千兆字节。
数据可以以多种文件格式进行存储,类似于大型机系统中使用的ISAM和VSAM。而其他文件格式,如逗号分隔值,也在数据存储、转换和处理方面发挥着作用。这些格式在各种机器中依旧有应用,尽管更为结构化的数据处理方式已在企业计算中占据一席之地。
数据的增长速度之快,令现有技术难以应对。因此,微软正在探索新的存储技术,计划利用DNA和全息图来存储大量数据。这些新技术可能会彻底改变全球的数据中心,微软声称已经取得了显著的进展。
微软Azure的首席技术官Mark Russinovich表示:“数据生成的速度已经超出了我们的掌控,某些类型的数据无法通过现有技术有效存储。因此,我们在寻找新的方法来高效且大规模地存储数据,以缩小这一差距。数字基础设施的意义重大。当前,存储一个EB的数据需要两个Azure数据中心,每个中心的规模相当于沃尔玛,而DNA存储技术则可以在1立方厘米的空间中存储同样的数据量。”
关于DNA存储的探索,Russinovich补充道:“这种方法是可持续的、有机的且持久的,能够保存数十万到数百万年。在地球上,我们发现了700万年前的生物DNA,只要在适当条件下存放,它便可以几乎永久保存。”
微软的DNA存储系统使用的是Twist Bioscience等公司开发的合成DNA,而非人类或动物的DNA。华盛顿大学的研究人员与微软合作,开发了一种系统,可以用合成DNA编码数据,并将其存储在液体溶液中,随后可用于数据处理。
该自动化DNA数据存储计划所使用的软件将数字数据的1和0转换为DNA的基本组成部分,以AS、TS、CS和GS的形式表示。系统接着利用实验室设备将必要的液体和化学物质引入合成器,生成的人造DNA片段被推送到存储容器中。
当需要检索信息时,系统会添加其他化学药品处理DNA,并使用微流体泵将液体推入系统,以读取DNA序列并将其转化为计算机可理解的信息。

