Location
咨询电话

151 0105 1188

做数据分析的正确方法!

2023-07-08 08:39:14

浏览量

要想分析有价值,需要注意这几点

1、提前做假设会遇到陷阱 

     某餐饮店会议室。面对堆满数字的工作表,数名职员胳膊抱在胸前面露难色。“近三个月来,咱们店夜间的销售业绩总是上不去。大家有什么解决的对策?” “还是广告的影响比较大吧。我觉得,不断在电视或杂志上做广告应该会取得不错的效果。通过广告提高店的知名度,客人应该会增加吧。” “也许吧。不过,广告真的有效吗?” “刚巧最近进行的顾客调查问卷结果出来了。这个问卷就咱们的广告形象以 及光顾的频率也进行了调查。” “是吗?那就研究一下广告形象与光顾的频率是否有关联性吧。” ……

image.png

      做出假设并对此进行验证。你所在的公司,是否也是如此呢? 

      公司里甚至可能还会有这样一种人,他们所做出的假设频频中的,被人看作 极有分析感觉。众多统计学教科书中也写道:“做出假设,验证假设。”因此,应该有很多人相信那就是正确的做法。 

      如果回到十年前,这些或许是对的。在没有可用于分析的数据,调查成本也极大的情况下,不分主次胡乱收集数据并非良策。首先做出假设,在此基础上收集必要数据进行分析是比较合理的。 

      然而,由于科学技术的进步,“依靠感觉做出假设,再予以验证”的做法已经无法适用于现代商业。通过互联网,我们甚至能够以数百、数千人为单位进行迅速、廉价的市场调查,而且,现在几乎所有的企业都使用电脑记录库存及销售情况。即便是廉价的电脑,也可以使用 Excel 处理数以万计的数据。 

      我们手中掌握着庞大的数据。只是不知道该如何使用罢了。在之前的时代,做出假设进而予以分析也可以说是“只看到了大数据的冰山一角”。

2、做开放式提问(open question) 

      做出假设进而验证的方式会让我们漏掉意想不到的重要发现。比如,你的部下这段期间的业绩很差。你先入为主地认为“他业绩差是因为没有干劲”,要对此进行验证。“你业绩差是因为没有干劲吗?” 如果你这样去询问部下,是不可能获得有用信息的:若对方做出肯定的回答,你会觉得“果不其然”;即便是对方否认,你也会觉得他在说谎吧。

image.png

能够用“是”或“不是”来回答的问题称为“封闭式问题”,这经常会让提问者不由自主地将自己的想法强加给对方。

那么,怎样才能在不把自己的想法强加于人的前提下,从对方身上得到想要的信息呢? 

只要做开放式提问即可。要让对方主动思 考 5W1H,即“何时”(When)、“何地”(Where)、“何人”(Who)、“何事”(What)、“为何”(Why) 和“如何”(How)。 

在上述事例中,提出的问题—“你觉得业绩差是什么原因”就是一个开放式 问题。或许可以借此发现能够解决的某些原因,而非干劲、能力等谁都可以想到的抽象原因。 

数据分析也几乎如此。 

“对广告有深刻印象的人光顾频率高 ?”这 是个能够以“是”或“不是”回答的封闭式问题,不过,我们可以将它改为开放式问题。留下后半部分的“光顾频率高”,将 前半部分转换为 5W1H,就得出了下面的开放式问题。

光顾频率变高是哪个时期?(When)

光顾频率高的店铺位于哪里?(Where) 

光顾频率高的顾客是什么类型的客人?(Who)

提高光顾频率的因素是什么?(What)

为什么光顾频率会高?(Why)

怎样才能提高客人的光顾频率?(How)

实际上,在上述问题中,最困难的是找出“为何”的答案,这需要将“何 人”“何处”“何事”的分析结果综合起来考虑。 

我们为什么要进行数据分析呢?其实就是为了从数据中得到“事前根本想象 不到的商业上的启发”。因此,我们应该做开放式提问,将数据中能够得到的所有信息作为答案的候选。这样一来,就很有可能获得有价值的发现。 

反言之,真正有价值的发现,多是那些结果出来前谁也料想不到或者是跟直觉相悖的内容。而如果在会议室里提出跟大家直觉相悖的假设,则恐怕很难被认为是“有分析感觉”。

3、关联性并非答案 

随着电脑的迅速升级换代,进行数据分析所耗费的精力及演算时间基本上不 再成为问题。 

只要利用恰当的工具,就算要从 10 万份包含 100 个项目的顾客数据中调查 得出“光顾频率高的顾客是什么类型的客人”的结果,也不过是一瞬间的事。不过,并不是说不顾章法地总体评估数据就够了。这种做法并不一定能够 找出我们真正想要知道的东西(本书分享多更索搜@雅书)。 

20 世纪 90 年代,数据挖掘(data mining)这一名词盛行,有人提出了“考 虑假设的并非人类,计算机自会为人类发现一切”的主张。这无疑是主张事无巨细对各项目进行调查的方法论。数据挖掘将有悖于人类直觉的各种关联性明确表现了出来。例如,通过数据挖掘,我们也许会发现“周末超市的纸尿裤购买率与啤酒的购买率有很高的关联性”。 

那么,这一分析结果是否有价值呢? 

当然,纸尿裤与啤酒,这两样商品的销售量 增加,多少会带来一些收益。不过,所得收益是否 与用于分析的工具或人员成本投入相称,就是另一 个问题了。数学层面上的关联性高,并不能保证其在商业层面上有价值,或者分析结果为人所乐见。

image.png

确定分析方针的三要点 

有人也许觉得纠结:不能事先做出假设,而总体评估数据也得不出有意义的 结果,那到底该怎么做才好呢? 

没有必要为此烦恼。若计算机没办法思考分析结果的价值,那么我们可以从这个角度整理数据及确定分析方针:“何事如何变化会是我们所期望的?”

其中的要点即下述三个: 

输出结果; 

分析单位;

解释变量。 

确定好这三个要点,接下来只要遵循常规操作就能够做有价值的数据分析了。虽然这里突然出现了大家不甚熟悉的用词,但是理解它们并不需要具备专业知识。

      “输出结果”,是指通过数据分析得到的最让人高兴的变量。何事如何变化是 众望所归的—也可以看作是成果指标。 

image.png

      “分析单位”是构成上述输出结果的单位。如“合乎期望”的顾客、商品、 员工等,分析单位是进行数据比较的基础单位。 

      “解释变量”可以让分析单位出现不同的特征。假设分析单位是“顾客”,那 么左右年龄、性别、之前是否来过等“期望值”的要素是什么?这个“什么”就 是解释变量。 

按照顺序逐一考虑这三点,谁都可以提出分析方针。如果用一句话来概括这一过程,那就是在分析数据前要明确定义“何事如何变化会皆大欢喜”和“这到底被何种要素所左右”。