互联网技术 / 互联网资讯 · 2023年11月20日 0

数据分析中的归因方法探讨

数据分析中的归因方法探讨

在数据分析的领域中,有几个经典而复杂的难题,其中多影响因素的归因问题无疑是最具挑战性的。尤其是在年末,品牌、售后、客服、供应链、运营、产品和商品管理等部门常常会提出疑问:今年的业绩表现良好,但是这10个亿的额外收益究竟有多少是归功于品牌,多少又是来自于供应链等因素?那么,如何进行有效的分析呢?今天我们将对此进行深入探讨。

1. 多影响因素归因的表面

为什么这个问题会被视为终极难题?只需进行一个简单的实验,便可得出答案。大家可以试试看:第一步,闭上眼睛;第二步,回忆最近在淘宝上购买的一件商品;第三步,想象该商品的名称、包装、价格、品牌、客服的声音等;最后,睁开眼睛,告诉自己:我为这个商品支付的XXX元,其中有X%是因为名称,X%是因为包装,X%是因为广告,X%是因为快递服务……你能准确回答吗?不仅很难,许多人可能连最近买的是什么都记不清。消费者的消费行为并不总是理性的,不同商品的重视程度也各不相同。商家提供的品牌、服务和产品本身是一个整体,因此从消费者的角度来看,这个问题的提出本身就存在不合理之处。特别对于啤酒、瓜子、矿泉水等快消品,因其价格低、消费频率高,冲动消费频繁,消费者的情绪波动会直接影响购买决定,因此很难明确各因素的贡献。对于耐用消费品,如房屋和汽车,虽然可能会进行更多思考,但仍然难以量化每个因素的具体影响。

那么,既然大家都明白很难分清楚,为什么各个部门还是不断要求进行详细划分呢?这就触及到了问题的本质:各部门的利益所在。

2. 多影响因素归因的本质

表面看,多影响因素归因的难点在于数据的拆解,而从本质上来看,这只是各部门利益分配不均的结果。每个部门都急于证明自身的价值,努力与业绩指标挂钩。尤其是年底,部门为了争取奖金和明年的预算,要求分家的愿望愈发强烈。因此,多影响因素归因的核心难点在于衡量各部门的价值。许多人可能忽视了这一核心问题,使用一些简单的数据方法进行处理。例如,将各部门的费用设为x,将业绩设为y,然后运用线性回归模型来估算参数的贡献大小。这种做法不仅误解了回归模型的意义,而且忽略了分类变量与连续变量之间的差异。就算得出结果,依然可能遭到质疑……

例如,如果销售的系数是2,而供应链的系数是1,那么明年如果仅增加两倍的销售,却只提供一次的商品,能否实现这样的销售业绩?显然不可能,这就如同有枪却没有子弹!部门之间的合作并不是简单的1+1=2的关系,这是一个常识。因此,强行割裂部门之间的联系,将不同类型的部门放在一起进行评价,注定会失败。因此,解决方案在于从一开始就拒绝这种“用公式解决一切”的想法。应从部门的工作性质出发,建立科学的衡量机制,有效缓解这种功劳焦虑。

3. 破局思路

要找到解决方案,首先需要明确各个部门的工作类型与贡献方式。随后,可以进行分类分析。对于软支持类部门:应放弃直接与销售业绩的关联,按需分配;对于硬支持类部门:进行考核;而对于硬拉动类部门:引入AB测试机制,提前设定目标。核心流程是建立分级机制,深入分析各因素的影响。

4. 现实永远很骨感

以上仅是理想状态下的建议,实际操作中,往往会有人想争取更多资源,口号高喊:“品效合一!”“心智资源!”总有人认为客服和售后不需要再承担费用,甚至会引发服务部门的反击:“我们也有贡献!”同时,也会有人夸大自身的贡献,促销活动的效果被描述得极其乐观,甚至超出自然销量。还有人害怕被追究责任,拼命推卸给没有促销、没有支持、产品不给力等外部因素。因此,“每个部门究竟贡献多少,能否具体到每一块钱里几毛几分是谁的贡献”这一议题,始终不会停止。此外,总有一些新入行的数据分析师认为,只需将数据输入线性回归或因子分析模型,就能得到让各部门满意的参数。这种反复扯皮的情况,恐怕还会持续很多年。

5. 小结

类似的数据分析难题还有很多。每一个问题背后,往往是看似数据分析的表象,实际上是人心的贪婪和推卸责任。业绩好的时候,大家会认为是自己的功劳,而业绩不佳时,往往将责任推给外部因素及内部无法量化的因素,以期自保。即便如此,也会有人指责数据分析能力不足,为什么不早些预测出来呢!从事数据分析的同仁们,需对这些问题保持清醒的认识,避免轻易上当。例如,如何计算自然增长率,才能让业务部门信服呢?

[[[IMG_1]]]

[[[IMG_2]]]

[[[IMG_3]]]