机器学习领域蕴藏着巨大的发展潜力,但我们对其了解仍显不足。根据GaRneR的预测,“到2020年,80%的人工智能项目仍将处于神秘状态”,而TRansfoRM 2019 of VentuRe Beat则预测87%的AI项目将无法投入生产。
那么,究竟是什么原因导致如此多的项目失败呢?
缺乏专业知识
首先,大多数人对这一技术仍感到陌生,许多组织在软件工具和所需硬件方面缺乏了解。
如今,似乎只要有过数据分析或软件开发经验,并完成一些示例数据科学项目后,便自称为数据科学家。然而,许多机器学习和人工智能项目,尤其是在确立成功标准、最终部署以及模型的持续监控方面,需要更为经验丰富的数据科学家来引导。
数据科学与传统软件开发的脱节
数据科学与传统软件开发之间的脱节也是一个主要原因。传统软件开发的预测和测量相对容易。
数据科学依然是科研与工程的结合
数据科学的研究通常通过多次迭代和试验不断推进。有时,由于选择的度量标准未能驱动用户行为,整个项目不得不从部署阶段回到计划阶段。
数据的质量与规模
人们普遍意识到,人工智能系统所依赖的数据基础越广泛,预测的准确性就越高。然而,随着数据量的增加,也会带来许多新的挑战。
数据标注
根据《麻省理工学院斯隆管理评论》,数据标注的缺乏是导致许多机器学习项目停滞的原因之一。
76%的人通过对训练数据进行标注和注释来解决这一问题,而63%的人甚至尝试构建自己的数据标注和自动化注释技术。这使得许多数据科学家在数据标记过程中无法发挥专业知识,成为执行人工智能项目的一大障碍。
封闭化组织
数据是机器学习项目的核心。在许多组织中,这些数据存在不同的安全性限制,并以结构化、非结构化、视频、音频、文本和图像等多种形式存储在不同位置。
缺乏合作交流
另一个主要挑战是不同团队之间的协作缺失,包括数据科学家、数据工程师、数据管理员、商务智能专家以及开发运营(DevOps)等。这对于从事数据科学工程的团队尤其重要,因为他们的工作方式和使用的技术之间存在很大差异。
技术上不可行的项目
由于机器学习项目通常成本高昂,许多企业倾向于以宏伟的“登月计划”为目标,试图彻底改变公司或产品以获取超额回报。这样的项目使得数据科学团队难以突破局限,最终可能导致项目无法完成,企业领导者对项目失去信心并停止投资。
技术和业务团队之间的协调问题
在机器学习项目启动时,业务团队与数据科学团队之间的期望、目标和成功标准往往不明确。这使得项目可能停留在研究阶段,团队对目标的模糊认识使得他们难以判断进展。
缺乏数据策略
根据麻省理工学院斯隆管理评论,只有50%员工人数超过10万的大型企业最有可能制定数据策略。因此,在开始机器学习项目之前,制定可靠的数据策略显得尤为重要。
缺乏领导支持
有一种常见误解是,只要投入资金和技术,问题就能迎刃而解。领导者可能没有提供适当的支持,以确保实现成功所需的条件。有时,业务主管对数据科学家开发的模型并不抱有信心。
这可能源于业务负责人对人工智能的理解不足,以及数据科学家未能有效传达模型的商业价值。领导者需要认识到机器学习的工作原理及其对企业的重要意义。
