2020年是一个极为特殊的年份,我们经历了COVID-19疫情的冲击,同时也见证了科技在抗击疫情中的重要作用。科技不仅帮助我们应对疫情,还改变了我们疫情后的生活和工作方式,其中数据的存储和管理展现出新的趋势,值得我们关注并及时响应。
随着超大规模软件生态系统的不断演进,企业和网站即使在基础设施不足的情况下,也能依靠小型“原子单元”进行应用的开发与部署。越来越多的云原生应用在全球联网点或托管设施上运行,因此企业必须在每一个环节中确保数据的安全,妥善保护用户的静态和动态数据。
对于企业领导者的建议是:在许多行业中,静态数据加密已逐渐成为防范内外部威胁的必要措施。尽管在您所在的行业中,静态数据加密可能尚未成为强制要求,但未来必定会如此。因此,建议您提前采取措施,尽快使用加密硬盘,以避免业务中断。
随着数据量的急速增长,对象存储已成为大容量存储的标准。与传统文件存储相比,对象存储在规范性元数据、可扩展性和无层级数据结构等方面具有明显优势。对象存储能够提供更高的智能,帮助系统充分利用数据集的潜力。存储类型包括块存储、文件存储和对象存储,对于性能要求高的关键任务应用来说,块存储至关重要;而文件存储则长期支持传统应用,提供可靠的架构;对象存储则更侧重于新应用的开发,并可以与块存储协同提升系统的规模和性能。许多传统文件应用也在向对象存储基础设施迁移,以充分利用其规模效益。
对于企业领导者的建议是:对象存储因其经济高效和可扩展性,正在迅速成为大容量存储的事实标准,逐渐取代文件存储。此外,新一代程序员越来越多地基于对象存储接口构建工作流程,企业应积极吸纳这样的技术人才。如果您尚未将对象存储引入数据中心,现在是采取行动的时机。
将系统划分为独立单元,并使其能够互相组合并不新鲜,但基于开源的可组合系统的广泛应用才刚刚开始。Kubernetes是一个开源系统,用于自动部署、扩展和管理容器化应用,处于这一趋势的核心。开源技术将是应用开发的未来,它能够让更广泛的社区共同解决行业面临的挑战,并通过开放架构部署特定领域的解决方案。将硬件进行组合,以更好地满足软件或业务需求,是必然的发展方向。
对于企业领导者的建议是:如今的数据中心正在向可组合的方向发展,这种方式使得资源的部署和重新部署变得更加灵活,消除了先验配置以及计算、内存和存储之间的静态配置比率。容器和Kubernetes是可组合系统的关键机制,所有数据中心都应考虑采用这些技术,如果尚未实施的话。
英伟达的GPU设计将内存划分为不同层级,包括寄存器、共享内存和全局内存,每一层各具特性。寄存器具有较低的延迟和较小的存储容量,而全局内存则提供更大的存储但延迟较高。英伟达提供的软件界面使用户能够充分利用这些分级内存,并根据该架构优化各种解决方案。同样,SSD和HDD也可以具有不同的层级。目前创造了大量有价值的数据,采用同构存储策略往往无法提升效率。
那么,分级存储为何重要呢?全部由高性能存储设备组成的存储系统成本往往超出预期,而仅由大容量存储设备构成的系统则可能无法满足性能要求。因此,分级存储应运而生,它在成本与性能之间寻求最佳平衡。随着其他存储技术(如存储级内存)的不断出现,我们迫切需要一种架构,以最大化各级存储的价值。
对于企业领导者的建议是:如果预算无限,数据中心可以全盘采用高成本的存储介质。然而,成本的限制迫使我们实施分级存储:热数据保存在高成本、高性能的媒介上,而低频访问的数据则放在经济实用的大容量存储介质上。值得庆幸的是,数据中心的软件越来越擅长识别热数据和冷数据,并进行相应的迁移。如果您的数据中心尚未采用异构存储介质,可能会面临存储性能的损失或高昂的存储成本。
不仅数据创建呈现爆炸式增长,有用数据的量也在快速上升;得益于人工智能/机器学习(AI/ML)的进步,用户能够从已归档的数据中提取更多信息,已归档的数据也开始被重新激活。企业领导者必须为存储比以往任何时候都要多的数据做好准备,以用于训练各种模型,挖掘重要信息。同时,由于数据的使用寿命可能会延长,也需准备好归档更多数据。形成性人工智能是一种提升数据洞察能力的手段。Gartner将形成性人工智能定义为“能够动态响应具体情况的人工智能”;而IDC则将其视为“各种新兴人工智能及相关技术的总称,能够根据情况变化而动态变化”。由于依赖于灵活架构的智能响应能力,形成性人工智能与分级存储趋势密切相关。在监控人工智能模型时,您可能会收到信号提示其偏离,这时可以使用另一模型在硬盘层中搜索合适的训练数据,并将其自动移动到闪存层,加速训练过程。硬盘层也可能是对象存储,因此与对象存储的发展趋势相关。这种方式的优势在于速度(数据会自动迁移到快速存储层)和成本(数据可以以高性价比的形式存储在易于访问的硬盘上,随时调用)。
对于企业领导者的建议是:机器学习的最新创新释放了人工智能的潜力,而这些技术需要更大的数据集来提取更精准的洞察。由于机器学习未来的发展难以预测,企业应从现在开始尽可能多地保存数据,以确保在未来能够获取最佳的训练数据进行各类分析。
