互联网技术 / 互联网资讯 · 2023年10月28日 0

云弹性测试方法:系统与混乱

以系统性和混乱性的方法进行持续的云测试,将帮助企业避免由于停机而导致的连接中断,从而防止云故障的发生。在COVID-19大流行期间,能够在家中灵活工作的专业人员,正是得益于云技术的无缝转移能力。

云弹性测试方法:系统与混乱

设想一下没有云的封锁状态。食品杂货订购系统的可用性和正常运行时间将完全依赖于公司的本地数据中心。在高峰时段,例如晚餐时间,流媒体服务可能会出现停滞。关键的个人和专业互动将局限于语音通话,而无法利用丰富的协作工具、视频会议或社交媒体。许多企业可能会面临关门大吉的局面,难以应对市场变化和消费者需求。

现在,考虑一下COVID-19导致的在家工作情境,若云系统出现停机,远程团队将面临崩溃,交付将变得混乱且丢失。更为重要的是,应急服务将使用更少的工具进行管理,从而可能造成更大的冲击。全球医学研究团队在共享冠状病毒研究和数据时,将失去彼此的联系,从而延迟治疗和治愈COVID-19病毒的努力。

云的建立似乎为我们解决当前困境提供了及时的支持。然而,云计算的概念和基础架构可以追溯到50年前。过去20年间,流行的云应用程序迅速发展,从salesfoRce.coM的早期版本到如今的Web基础企业应用程序,例如Google的G Suite和Microsoft的Office 365。这些新兴工具因其简单性而受到广泛采用,但其表面下却隐藏着复杂的底层知识,这些知识必须被充分理解并经过测试,以便于维护。

目前云环境面临压力。IBM在6月9日经历了约两个小时的云中断。网络监控公司ThousandsEyes向技术新闻网站Fierce Telecom表示,此次中断的全球性特征源于控制平面问题,而不是诸如光纤切断或路由器故障等物理问题。随着公司转向远程工作并使用其通信和协作平台(包括Teams Balloon),Microsoft在其位于欧洲的Azure云数据中心的能力开始显现出压力。为缓解这种压力,Microsoft限制了对免费和试用帐户的访问。6月29日,美国东海岸部分地区的Google Cloud的Kubernetes平台和网络服务暂停了几个小时。

为了防止云故障引发的停机,企业必须通过持续且混乱的测试来增强其云架构的弹性。

常规测试确保关键应用程序在云中迁移或设置并正常运行。这是一种有效的方法,旨在确保云系统满足设计要求,并且不会因应用程序性能的变化而受到影响。然而,常规测试无法发现意外情况。为此,先进的操作开始采用Netflix率先实施的混沌测试技术,该技术自2011年开始云迁移以来便被广泛应用。混沌测试制造出不稳定的局面,这些局面可能导致故障并影响设计。现代云系统以复杂而高效的方式将硬件与软件结合,使得传统测试无法完全满足需求。通过进行系统性和混乱的测试,企业可以提高云及整个技术系统的弹性。

为了实现弹性,IT部门必须识别出常规“快乐路径”测试中未能发现的漏洞。通过执行一系列精心设计的故障测试,可以评估系统的可靠性和恢复能力。这些故障序列可能包括:

断开网络连接10秒钟。
      使服务或服务器离线。
      阻塞中间件并观察异常情况。
      刚开始向云迁移的企业应优先研究并选择最适合的服务模型。希望将全部工作负载迁移到云的公司应选择“基础架构即服务”(IaaS)选项,这样团队可以快速配置其云中的测试环境,并迅速建立用于存储、备份和恢复的系统。

已经在云中运行或部分迁移的组织必须花时间了解其云服务模型。这可能引发问题:这种模式是否适合我的组织在未来几年的使用?

在云中运行的公司可以开始规划测试方案,以评估其系统的弹性。因此,这些公司应设定测试的目标和时间窗口。测试结果将有助于指导其云设置的需求设计阶段。

随着所有系统和应用程序都在虚拟云环境中,未来的数字转型将变得更加顺畅。经过恰当测试的云能够更轻松地应对需求激增,并能够适应病毒式应用的采用、快速位置调整或人员扩展。

为了具备弹性,企业必须构建弹性的IT系统,这些系统将部分或全部依赖云基础架构。通过持续、系统性和混乱的测试,云基础架构将变得更加弹性。一致且富有创意的测试本身具有价值,使得企业能够变得更加灵活和具备弹性。