互联网资讯 / 人工智能 · 2023年12月28日

AI技术简化IT运维工作

人工智能驱动的IT运营技术正在自动化监控和管理IT产品,越来越多的云平台、托管服务提供商以及进行数字化转型的企业从这一新兴IT趋势中获得了显著收益。

这一技术被称为AIOps,它能够有效预防潜在的宕机和性能问题对运营、客户体验以及企业利润造成的负面影响。企业之所以开始部署更高级的人工智能系统,是因为这些系统不仅能识别现有问题,还能在问题出现前进行预测,并采取智能的自动化缓解措施。

AIOps究竟是什么?企业如何在实际操作中利用它?本文将深入探讨AI辅助IT运营的技术、策略与挑战。

什么是AIOps?

AIOps是一种创新的IT技术,利用人工智能来提升IT运维的智能化管理,涵盖基础设施、网络和应用程序的性能、适应性、容量、持续运行时间及安全性等方面。通过将传统的阈值警报与手动流程转变为基于人工智能与机器学习的系统,AIOps帮助企业更有效地监控IT资产,并预测可能带来的负面事件和影响。

职业服装零售商CaRhaRtt的CIO John Hill在服务管理、性能管理和IT自动化三个主要领域中应用AIOps。得益于智能监控,CaRhaRtt能够在问题影响用户或客户之前及时发现并解决。

AIOps工具

大多数AIOps平台建立在成熟的监控系统之上,有些则源自人工智能实验室。优秀的AIOps工具能够生成关于机器负载的前瞻性判断,并监测是否出现偏差。一旦出现异常,系统会发出警报,生成电子邮件、Slack消息,若偏差严重,还会发送寻呼机通知。复杂的AIOps工具还提供“根本原因分析”,帮助追踪问题的流程,并展示其如何通过不同机器在现代企业应用中传播。考虑采用AIOps的企业,通常会评估每个AIOps产品与其特定数据库和服务的集成能力。以下是一些当前最实用的AIOps工具:

appDynaMics、BIgPanda、Datadog、DynatRACE、GitHub Copilot、IBM Watson Cloud Pak for AIOps、LogicMonitor、Moogsoft、New Relic One、Splunk。

你的IT产品中可能已经在无形中运用了AIOps技术,而你可能还未察觉。许多先进的CRM或ERP系统通常内置智能管理功能,大部分云平台也采用机器学习驱动的监控和管理工具。

然而,依赖单一解决方案的内置功能也存在缺陷。根据AIOps Exchange的调查,65%的IT组织仍依赖于孤立且传统的监控方法,这些方法无法满足复杂的IT环境需求。此外,BIgPanda的最新调查显示,42%的IT组织在其IT环境中使用了超过10种不同的监控工具。

CaRhaRtt起初也是采用这种方式。Hill表示:“以前,我们必须独立监控不同的环境。”为了应对这种复杂性,Hill选择将监控整合到两个平台上,首先使用appDynaMics进行应用程序性能监控,随后利用TuRbonoMic监测CaRhaRtt的基础设施。

在黑色星期五和网购星期一的购物高峰期,公司网站常常会遇到需要即时调整的性能问题。Hill提到,当公司发现问题时,客户已经感受到服务质量的下降。

自2017年秋季CaRhaRtt部署appDynaMics以来,黑色星期五和网购星期的高峰期实现了零宕机。

Hill表示:“我们实现了创纪录的增长,增长速度是整个行业的两倍,再也没有出现过过去常见的宕机或性能下降。”

在2019年初,CaRhaRtt添加了TuRbonoMic来管理本地和云环境的资源。Hill指出,新系统使资源利用率从70%提高到92%:“这大概为我们节省了25%的基础设施成本。”

利用率的提升是自动处理的,无需人工干预,而是否减小容量仍需人工批准。

Hill表示:“一旦监测到容量挑战,系统会向SeRvicEnow提出变更请求;当我们遇到过剩容量时,它会在SeRvicEnow中创建通知单,相关人员会快速审核,只需点击一下即可,因此目前我们不需要实现完全自动化。”

该公司的下一步计划是实现业务任务的自动化,例如利用文本识别和自然语言处理来处理客户订单。