数据分析师常常面临的任务之一就是“分析今天的波动”,这不仅是一个常见的请求,也是令人头疼且复杂的工作。
我们常常会问:下降1%算不算波动大?下降5%呢?下降10%?甚至50%呢?
有时,业务在下降50%时却没有明显反应,而下降1%时却引发了剧烈反应,这究竟是为何?
今天我们来系统地探讨这个话题。
1. 指标波动的本质
举个简单的例子,体温37.4度与36度之间的差异仅为3.9%,然而如果在测温时被发现体温为37.4度,估计会立刻被保安请出去。原因在于,人们真正害怕的并非5.5%的波动,而是潜在的健康风险。体温37.4度可能表明存在病毒,这才是人们真正关心的。
因此,指标的波动并不可怕,重要的是它所代表的业务含义。脱离业务含义的指标波动讨论是无意义的。理解这一点后,我们才能继续深入探讨。
2. 指标波动的三类业务含义
第一类:硬指标波动。
一些指标是对业务部门进行刚性考核的,例如:
考核销售:业绩、回款
考核商品:库存、毛利
考核客服:接听、投诉
这些硬指标必须达到指定数量,否则即使只差1%也会被视为未达标,尤其在销售领域,目标未达成就意味着没有奖金。
负责刚性指标的部门对波动反应最为敏感,因为未达到硬指标可能直接导致处罚或奖金扣减,因此这类波动受到高度关注。
第二类:软指标波动。
例如注册用户数、用户点击率和转化率等。这些指标通常是通向业务结果的过程,先有注册用户,才能有后续的浏览和消费。软指标的波动不一定意味着问题,可能只是新的业务变化或偶然现象。因此,软指标的变化不会直接引起业务反应,人们更关心这些变化对硬指标的潜在影响,这种困惑使得分析变得更加复杂。

需要注意的是,硬指标与软指标的界限并不是绝对的。例如,很多互联网公司会把“用户增长”视为硬指标,从而迫使推广部门达成目标。因此,区分硬指标和软指标要根据具体的部门KPI要求来判断。
第三类:边缘指标波动。
例如满意度和知名度等指标。这类指标具有共同特点:
1. 通常是通过抽样调查获得的,非全量统计,意味着抽样方法、问卷设计和调查时间等因素也可能影响结果,不能直接反映业务问题。
2. 与硬指标和过程指标的关系较弱,难以直接验证结果。例如,高满意度并不一定意味着100%购买,低满意度也不必然意味着不买。
3. 人为操作的影响很大。例如,改变抽样方式可能导致结果迅速变化,进行广告或促销活动也会导致数值立即上升。
这种不准确且易于操控的指标也会出现波动,引起关注。但一旦理解其逻辑,便会发现控制这些波动其实非常简单,只需进行一些数字游戏即可。
掌握了这三类指标后,在应对波动时我们便有了明确的方向:硬指标 > 软指标 > 边缘指标。按此顺序抓重点,避免在面对一屏幕的指标时感到困惑。
明确主次后,我们可以进一步考虑如何判断波动的大小。
3. 判断波动大小的标准
第一步:剔除伪波动。
许多波动是自然现象,例如周末、节假日和工作日之间的交易额差异,产品上市、热销或退市导致的用户数变化,以及公众号发文后7天内阅读量的衰减等。这类指标天生就会产生变化。通过总结经验,识别规律后,只要符合规律的波动都可以视为伪波动。即使伪波动的数值很大,也不必惊慌,因为这属于正常现象。而逆规律的波动,则可能暗示重大变化,无论其大小,都需小心观察。
第二步:量化主动行为。
许多波动是由业务主动引发的,例如促销活动带来的销量增长、培训加强工作能力、清仓处理库存等。这些指标变化是业务行为的直接结果。
在这种情况下,首先要清楚业务部门在进行什么操作,否则分析过程中可能出现“我早就知道了”这样的情况,这会让人感到尴尬。
其次,要明确每个业务动作的目标和结果,以便评估“指标波动是否达成业务预期”。这是一个重要的评价标准,务必记住。在主动行为且指标波动达成预期的情况下,业务通常不会纠结。若未达成预期,他们会想知道“到底差在哪里?”这时,找到业务期望值与实际结果的差距非常关键。

对于达成业务预期的波动,无论其范围多大,都是可以接受的。既然是主动引起的增长或下降,指标变化越大越好。对于未达成预期的情况,需关注期望值差距,差距部分才是需要分析的波动。
第三步:量化外部影响。
许多波动源于可收集的外部行为,例如政策限制、天气变化、竞争对手的影响等。需要注意的是,某些外部因素的数据难以收集,且即使知道了影响,也往往无能为力。举例来说,虽然降雨可能影响业绩,但我们不能仅仅通过祈求天气好转来解决问题。
因此,对外部影响的评估应关注其波动大小,而不是仅看一天的绝对数值,而是要估算影响的持续时间,并推算在此期间可能产生的总影响值,这个数值才是波动的衡量标准。

第四步:其他意外波动。
是否存在既不符合规律,又没有业务主动动作,也没有外部因素影响的数据波动?
有的!这时应首先定位波动发生的点:
是全局性波动还是局部波动?是持续性波动还是突发性波动?波动数值是大还是小?
判断问题大小的标准为:全局性 > 局部问题,持续性 > 短期问题,波动数值越大,问题也越大。
明确问题后,可结合指标属性思考对策。

对于硬指标波动:只要硬指标未达标,就是重大问题,需考虑采取措施以保住指标。针对软指标波动:只要相关硬指标没有崩溃,就不算重大问题,因此可不必纠结短期波动,集中精力寻找深层原因。对于边缘指标波动:不必担心!想要扭转局面非常简单。
这样区分后,处理方向变得清晰。应果断采取必要措施,慢慢观察的情况也可放宽处理。若不分轻重缓急,只是重复“拆解数据”,可能会被批评为“小题大做”,或是业务部门早已解决问题,而我们还在等待数据分析报告的完成。
4. 为什么人们总是纠结波动
总结来说,想要冷静应对指标波动,需关注以下两点:
业务部门需要清楚自己要做什么:
1. 明确哪些是硬指标、软指标,以及哪些是边缘指标
2. 清楚自身行为对指标的影响程度
3. 理解短期、中期、长期能采取的行动
4. 明确短期行动是否达成预期效果
数据部门则需了解发生了什么:
1. 哪些是业务主动行为,目标是什么
2. 哪些是规律性变化,范围如何
3. 哪些是可量化的外部因素,带来多大变化
4. 存在的异常变化及其位置
然而,现实情况往往是:
业务部门只专注于工作,未对目标进行量化,看到指标波动便如惊弓之鸟。
[[[IMG_6]]
数据部门则往往对指标的业务含义不够了解,对业务进展缺乏认知,对规律的量化方法不清晰。只是简单地将指标与性别、年龄、地域、渠道等进行交叉分析,得出的结论往往不够准确,甚至可能误导新人。
这种盲目的状态就像“盲人骑瞎马”。指望高水平的数据科学家来解决问题的想法更是无稽之谈。
1. 量化业务目标与行为
2. 梳理业务逻辑并归纳
