为何大多数机器学习项目会失败？

机器学习领域蕴藏着巨大的发展潜力，但我们对其了解仍显不足。根据GaRneR的预测，“到2020年，80%的人工智能项目仍将处于神秘状态”，而TRansfoRM 2019 of VentuRe Beat则预测87%的AI项目将无法投入生产。

那么，究竟是什么原因导致如此多的项目失败呢？

缺乏专业知识

首先，大多数人对这一技术仍感到陌生，许多组织在软件工具和所需硬件方面缺乏了解。

如今，似乎只要有过数据分析或软件开发经验，并完成一些示例数据科学项目后，便自称为数据科学家。然而，许多机器学习和人工智能项目，尤其是在确立成功标准、最终部署以及模型的持续监控方面，需要更为经验丰富的数据科学家来引导。

数据科学与传统软件开发的脱节

数据科学与传统软件开发之间的脱节也是一个主要原因。传统软件开发的预测和测量相对容易。

数据科学依然是科研与工程的结合

数据科学的研究通常通过多次迭代和试验不断推进。有时，由于选择的度量标准未能驱动用户行为，整个项目不得不从部署阶段回到计划阶段。

数据的质量与规模

人们普遍意识到，人工智能系统所依赖的数据基础越广泛，预测的准确性就越高。然而，随着数据量的增加，也会带来许多新的挑战。

数据标注

根据《麻省理工学院斯隆管理评论》，数据标注的缺乏是导致许多机器学习项目停滞的原因之一。

76%的人通过对训练数据进行标注和注释来解决这一问题，而63%的人甚至尝试构建自己的数据标注和自动化注释技术。这使得许多数据科学家在数据标记过程中无法发挥专业知识，成为执行人工智能项目的一大障碍。

封闭化组织

数据是机器学习项目的核心。在许多组织中，这些数据存在不同的安全性限制，并以结构化、非结构化、视频、音频、文本和图像等多种形式存储在不同位置。

缺乏合作交流

另一个主要挑战是不同团队之间的协作缺失，包括数据科学家、数据工程师、数据管理员、商务智能专家以及开发运营(DevOps)等。这对于从事数据科学工程的团队尤其重要，因为他们的工作方式和使用的技术之间存在很大差异。

技术上不可行的项目

由于机器学习项目通常成本高昂，许多企业倾向于以宏伟的“登月计划”为目标，试图彻底改变公司或产品以获取超额回报。这样的项目使得数据科学团队难以突破局限，最终可能导致项目无法完成，企业领导者对项目失去信心并停止投资。

技术和业务团队之间的协调问题

在机器学习项目启动时，业务团队与数据科学团队之间的期望、目标和成功标准往往不明确。这使得项目可能停留在研究阶段，团队对目标的模糊认识使得他们难以判断进展。

缺乏数据策略

根据麻省理工学院斯隆管理评论，只有50%员工人数超过10万的大型企业最有可能制定数据策略。因此，在开始机器学习项目之前，制定可靠的数据策略显得尤为重要。

缺乏领导支持

有一种常见误解是，只要投入资金和技术，问题就能迎刃而解。领导者可能没有提供适当的支持，以确保实现成功所需的条件。有时，业务主管对数据科学家开发的模型并不抱有信心。

这可能源于业务负责人对人工智能的理解不足，以及数据科学家未能有效传达模型的商业价值。领导者需要认识到机器学习的工作原理及其对企业的重要意义。

互联网技术 / 互联网资讯 · 2023年11月3日 0