互联网技术 / 互联网资讯 · 2023年11月10日 0

云计算扩展解决延迟问题

数据的存在与时间和地点息息相关。随着物联网(IoT)设备的普及,依赖时间戳和位置标记的数据变得愈加突出。用户在登录仪表板控制台时,能够查看由偶尔连接的风力涡轮机或其他工业设施记录的数据,创建特定数据的时间变得至关重要。当我们的数据仓库横跨广阔的地理区域,涉及众多涡轮机、桥梁传感器、交通监控器或便携式安全设备时,位置感知的数据显得尤为重要。

接下来,我们要讨论的是云计算。

云计算在全球范围内的发展使得我们将云功能的“实例”分布在不同的数据中心,从而增加了与时间和位置相关的数据分离问题。这种分隔会导致延迟,即在我们请求数据(或更常见的,我们的应用程序和数据库发出请求)与我们实际收到数据之间的时间差。

那么,现代的云原生软件应用和数据科学专业人员如何应对这一挑战呢?问题在于,这些软件工程师在试图解决应用程序扩展到新区域时,常常采取手动的方法,导致性能问题。

云计算数据架构师处理现代数据访问与管理挑战的一项关键技术是数据分区。按位置划分数据的核心理念,能够帮助全球组织解决由分布式数据引发的延迟问题。

蟑螂实验室的产品营销副总裁吉姆·沃克(Jim Walker)指出,IT延迟直接影响用户对产品或服务的体验。他强调,如今企业必须能够实时接收、分析和处理数据,以提供最佳的用户体验。

沃克提到的“100毫秒规则”源自Gmail的创建者保罗·布赫特(Paul Buchheit),该规则强调了人类对延迟的敏感性。一旦延迟超过100毫秒,用户便会感受到时间延迟。信息在世界两端传递时,通常会增加约250毫秒的延迟,尤其是在信息并非沿最直接路径移动的情况下。因此,服务器与网络用户之间的距离显得尤为关键。

然而,距离并不是唯一的挑战。尽管光速可以在14毫秒内从纽约传输到旧金山,但数据的传输必须经过多个网络设备,这些“跳跃”也会增加延迟。传输100英里但经过五次跳跃的信息,其延迟将长于经过两次跳跃的2500英里请求。这意味着位置在优化数据传输时同样不可忽视。

沃克坚持认为,位置应该成为现代应用程序和开发人员数据库设计的新驱动力。在迈向更数字化、即时的时代时,我们需要从逻辑数据模型转向考虑物理组件的影响,尤其是在数据隐私的挑战下,数据需要更靠近用户,以便快速传递并满足100毫秒规则。

为应对全球分散环境中的延迟要求,Google开发了将行级分布式数据与地理位置相结合的功能,称之为地理分区。这种方法提供了一定程度的自动化,使数据团队能够决定数据在物理上的存储位置,同时为管理员提供修改这些要求的选项。

通过最小化发出查询的位置与数据存储位置之间的距离,可以有效地减少延迟。我们只需更改配置,数据库便会将数据物理地移动到需求位置。这意味着在组织扩展到新地理位置时,不一定会导致停机。

数据需要自动适应流量模式以减少延迟,并保持高可用性,因此即使某个数据中心脱机,存储在附近的其他数据中心的数据也能快速响应,避免服务滞后。通常,全球部署所涉及的距离使得开发人员必须在可用性和延迟之间做出权衡。然而,通过对数据库中数据进行位置分区,开发人员能够构建高可用性和低延迟的应用程序。尽管这在现在看来可能是一种奢侈,但在未来期望应用程序能够以光速运行时,这将成为一项必要。

最后,值得注意的是,提供快速体验并不仅仅是关于自动化的速度,还涉及管理和控制自动化的能力。

随着5G速度的提升,我们对于实时计算的理解可能会转变为更轻量级的系统性能版本。在这种情况下,数据访问应用程序层的速度,以及应用程序对数据的访问速度,将变得更加紧迫。

尽管位置仍然是酒店、住房及住宅等领域的重要因素,但在新一代精心设计的数据体系结构满足全球分散部署需求的背景下,位置和分区问题将愈发重要。

[[[IMG_1]]]
[[[IMG_2]]]
[[[IMG_3]]]
[[[IMG_4]]]
[[[IMG_5]]]