互联网技术 / 互联网资讯 · 2023年12月18日 0

如何成为善于讲故事的数据科学家

作为数据科学家,我们应具备讲故事的能力。我们经常需要把工作成果展示给背景各异的利益相关者,因此需要因对象而调整语气,但始终由你来讲述故事。

有多种方法能帮助你讲好故事,下面一起来梳理。

尽量多沟通

沟通是把事情落地的关键。作为数据科学家,与不同相关者的交流尤为重要。通常我们会将相关者分为四类:

用户——他们关注看到可落地的解决方案与体验;领域专家——他们愿意以专业知识提供帮助;行政领导——他们更关注业务与收入;技术人员——他们对技术细节最感兴趣。

为了实现有效沟通,需要用他们能理解的语言表达。用户更关心最终解决方案及解决问题的方法;行政领导和管理者更关注收入等相关事项;领域专家乐于在专业领域提供帮助。你需要借助他们的知识,为具体问题构建更好的解决方案。

以已知事实开场

讲故事应从人们熟知的事实出发。可以是用户每天面对的问题、尚未优化但具备智能化潜力的事物,或是能为公司创造收入的机会。以熟知的事实开场,可以让听众更易理解,因为他们亲身经历过相关情境。

通常,对不直接接触技术的受众来说,技术概念往往显得抽象、模糊且复杂。讲故事包含两部分:

支撑论据、便于观众理解后续情节的各类事实;以及为说服观众采取行动、将故事中的呈现与思考内容和思考方式联系起来的叙述。

因此,有必要以面向相关者的方式呈现事实,以描绘可行的解决方案。

利用可视化吸引观众

一图胜千言。确实如此,一张图就能传达大量信息。不同的图表、数据和可视化工具可帮助观众更好地理解数据的进展、趋势以及总体行为。

在分析数据或应用不同统计方法时,可能会遗漏有用信息,此时图示和图表就会发挥作用。它们帮助你发现之前未注意的部分,从而增强对数据的理解。

可视化本质上也是一次机会,用观众能理解的事物来讲述故事。比如当一个图表包含过多变量时,观众可能难以理解,这时应尽量打造简单、直观的视觉表达来支撑叙述。

使用统计学理解数据

统计学对理解和解释数据非常有益。你可以从中推断出大量事实,并据此更好地理解数据。

统计学主要分为描述统计和推论统计。描述统计描述现有数据,推论统计揭示数据中不同特征和变量之间的总体关系。通常,描述统计可帮助我们理解当前或可用数据的一面,而推论统计则可基于样本对总体进行推断。

根据故事的不同层面选择合适的统计类型,这点很重要。它可以帮助你对现有数据进行解释,并向不了解相关特征的受众讲清结论。你也可以据此告诉观众你在数据中看到的不同理解,并据此提出不同的假设。

解释模型的运作原理

机器学习模型常被称为“黑盒”。如果你使用过一些高级模型,就需要在性能与可解释性之间做权衡。线性模型、逻辑回归和基于树的模型较易解释,而非线性模型往往较难解释。

在现实世界中,没有人愿意使用自己不理解的工具。尤其在银行、保险和制药等领域,更需要透明的过程与监管要求。可解释性还关系到对不同利益相关者的最终信任。众所周知,若我们清楚了解运作原理,就会更加自信地使用并信任它。

同样,机器学习模型亦然。如果理解了这些技术,人们对相关问题的兴趣也会增加。实现可解释性的技术多样化,一些方法与统计推断相关,能帮助我们识别关键特征,并从数据中提取有意义的表示。

讲故事涵盖多方面,它是一门艺术。通过实践与学习可以提升讲故事的能力,它能够从原始数据中挖掘宝藏,帮助你和你的用户发现此前可能被忽视的理解与信息。

希望这些技巧能帮助你成长为一个善于讲故事的数据科学家。