想跟大家唠唠我最近琢磨的一个事儿——就是这个“离散程度”。可能听起来有点玄乎,但挺有意思的,而且在咱们平常琢磨事儿的时候还真能派上用场。
起因是这样的
我前阵子不是在对比两个不同的方案嘛具体啥方案就不细说了,反正是那种需要看效果的。我就收集了两拨数据,比如说方案A搞了一段时间,每天都有个产出数据;方案B也一样,也有一堆数据。
我这人也图省事,就想着算个平均数呗。你猜怎么着?算出来俩方案的平均数差不离,几乎可以说是一模一样!我当时就想,那这两个方案效果不就一样了嘛随便挑一个得了。
发现问题
但后来我把这两拨数据摊开来仔细瞅了瞅,就觉得有点不对劲了。虽然平均数差不多,但是里头的数,那可真是形态各异!
- 方案A的数据,大部分都挤在那个平均数周围,上下波动不大,比较稳当。
- 方案B的数据,好家伙,有的数特别高,有的又特别低,跟过山车似的,虽然平均下来跟A差不多,但这里头“贫富差距”可就大了去了。
这时候我就想起来了,这不就是咱们常说的那个“离散程度”不一样嘛方案A的数据就比较集中,离散程度低;方案B的数据就比较分散,离散程度高。
我的实践过程
为了更直观地感受这个“离散程度”,我干了这么几件事:
第一步,把数据都列出来。 这是最基础的,不把原始数据摆出来,光看个平均数,那真是容易被忽悠。我就拿了个本子,老老实实把两组数据都抄了下来,一行一行对着看。
第二步,找最大值和最小值。 这个简单,一眼就能看出来。我就发现,方案B的最大值比方案A的最大值高不少,但最小值又比方案A的最小值低不少。这一来一回,就感觉B不太稳定。
第三步,凭感觉画了个简图。 我没用啥专业工具,就在纸上大概画了个数轴,然后把每个数据点标上去。这么一来,视觉上就特别明显了。方案A的点都挤在一块儿,方案B的点就拉得很开,东一个西一个的。
第四步,琢磨背后的意义。 我就想,如果这个数据代表的是收入,那方案A的团队大家收入都差不多,比较平均。方案B的团队可能就是有几个赚大钱的,也有几个日子紧巴巴的。如果这是产品质量评分,那我肯定选方案A,质量稳定,虽然不出彩但也不会太差。方案B可能偶尔给你个惊喜,但搞不好哪天就给你个惊吓。
我记得以前学统计的时候,老师好像还讲过什么方差、标准差之类的,说是能更精确地衡量这个离散程度。我没去细算那个,因为对我当时那个场景来说,光是把数据摊开看,再看看最大最小值的差距,就已经足够让我明白哪个方案更“靠谱”了。
的体会
我这回实践下来,最大的感受就是,看数据不能只看平均数,那玩意儿有时候真挺会骗人的。 一定要看看数据它自己是怎么分布的,是挤在一起还是散得到处都是。这个“离散程度”高低,直接关系到你对这事儿稳定性的判断。
比如说,你要是想投资,两个项目平均回报率一样,一个波动小(离散程度低),一个波动大(离散程度高),你选哪个?稳健的人肯定选波动小的嘛要是喜欢刺激,追求高风险高回报,那可能就另说了。
通过这回琢磨,我对这个“离散程度”算是有了更具体的认识。以后再分析啥东西,我肯定会多留个心眼,不光看它“平均咋样”,还得看它“内部团结不团结”,哈哈!
还没有评论,来说两句吧...