雀恰营销
专注中国网络营销推广

对比分析法,数据分析基础思维之:对比思维

对比分析法,数据分析基础思维之:对比思维

对比是最基本的数据分析方法。谈数据分析思维,这个最基本的方法是绕不开的。但是现在很多文章都提到了比较思维,而且很多都是肤浅的,很少看到有人把比较思维讲的比较深,导致很多数据初学者对比较思维的理解非常片面。分析。通过对穆勒五法的详细阐述,本文作者带你对比较思维有更深的理解,一起来看看吧!

说到比较思维,基本上是以下状态:

这个月的目标是100万,目前的业务情况是80万。通过两者的比较,得出的结论是目标没有达到,目标还是20万,完成率80%。

最好加上一些同比数据,一个所谓的对比分析就完成了。

如果比较思维这么简单,还需要数据分析师的工作吗?估计现在数据分析师都失业了吧?

业务人员只需要5秒就学会了这个方法,而数据分析师呢。

上述情况只能算是比较法中最简单的一种方法——比率大小。所做的工作是将数据转化为结论,即从80万的数据到“没有达到目标”的结论。

虽然结论比数据更容易记住和理解,但很难得出比大小更深层次的信息。

除了“比大小”,比较思维还有哪些更高级的方法?

今天我就带大家探讨一下对比思维到底是怎么回事。

在模块 1 中关于低层次思维的文章中,我介绍了逻辑思维。最基本的逻辑思维是归纳法。上一篇文章只是简单介绍了归纳法,今天我们介绍一种比较系统的归纳法——穆勒五法。

密尔五法是英国哲学家密尔用来确定现象因果关系的五种归纳法,即求同法、求异法、同用法、协变法、余数法。

如果你能深入理解穆勒的五种方法,你基本上就能掌握比较思维。

一、求同方法,比同方法

1960 年,英国农场的 10 万只火鸡和小鸭吃了发霉的花生,并在几个月内死于癌症。

后来,用这种花生喂羊、猫、鸽子等动物,同样的结果又发生了。1963年,有人用发霉的花生喂老鼠、鱼和雪貂,结果都死于癌症。上述动物患癌的先决条件中,对象、时间、环境各不相同,惟一相同。只吃发霉的花生。

因此,推断食用发霉的花生可能是这些动物死于癌症的原因。

后来化验证明,发霉的花生中含有致癌物质黄曲霉毒素。

上述分析方法是“求同存异”。

求共性方法的思想是,如果在不同的场合,除了一个条件外,所有条件都不同,那么这个相同的条件就是所研究现象的原因。

可以用以下公式表示:

场合1,相关情况A、B、C、主题、a;

场合2,相关情况A、D、E、主题、a;

场合 3,相关情况 A、F、G,研究主题,a;

在上述三种情况下,都出现了现象a。但是,在不同的场合都有条件A,因此可以认为条件A是现象a的原因。

这种方法常用于广告内容分析。投放了这么多广告,自然想知道那些效果更好的广告的特点。

我们可以从投放时间、广告内容、活动形式等不同角度深入分析这些广告,例如分析如下:

上午广告1关键词:降价活动形式:裂变群

下午广告2关键词:自由活动形式:裂变群

晚上广告3关键词:限时活动形式:裂变群

广告4下午关键词:限时活动形式:裂变群

价格转化率好的广告简单拆分三个条件,发现这些广告的共同点是活动形式都是裂变组。因此,裂变和裂变的方式对于提高广告的转化率有更好的效果,所以后续的营销活动可以更多的考虑裂变、分组的方式。

不同的方法,不同的

在做化学实验时,发现加热氯酸钾会产生氧气,但速度很慢。而且一旦加入少量的二氧化锰,就会迅速产生大量的氧气。

这两组测试的唯一区别是是否添加了少量的二氧化锰。因此得出结论,二氧化锰是造成氧气快速释放的原因。

这种寻找差异的方法称为差异法。

求异的思想就是比较某种现象发生的场合和不发生的场合。如果两个场合除了一个不同之外是相同的,那么差异就是现象的原因。

差分法可用下式表示:

场合1、相关情况A、B、C、主题a的出现

场合2,相关情况B,C对比分析法,数据分析基础思维之:对比思维,没有主体a存在

因此,情况A与现象a之间存在因果关系。

上述两种情况中对比分析法,数据分析基础思维之:对比思维,情况1出现了现象a,而情况2没有出现。观察各自的情况,发现情况1有ABC的三个条件,而情况2只有BC,所以可以认为条件 A 导致了现象 a。

对比分析法,数据分析基础思维之:对比思维

在真实环境中,几乎不可能找到只有一个条件不同而其他条件完全相同的业务场景。

因此,差分法的应用一般依赖于AB检验。

AB测试可以控制对照组和实验组的条件。例如,放了两组广告,除了广告文案不同外,其余均相同。如果一个使用“限时折扣”,另一个使用“独家优惠”,如果最终转化率存在显着差异,那么广告文案就是差异的原因。

常用方法,先比较相同,再比较不同

一名联合国官员被派往越南执行一项改善越南儿童营养健康的任务。

下飞机后,他发现自己没有办公室,也没有钱,连当地的语言都听不懂,没有任何资源。

官方经过深思熟虑,想出了一个解决办法。

因为身高是衡量营养水平的重要指标,除特殊情况外,一般高个子的营养水平会好于矮个子。

于是,他首先通过测量身高从越南各行各业中挑选出一群高个子的孩子对比分析法,然后排除家庭条件优越的孩子,只留下家庭条件一般但比同龄孩子高的孩子。这些孩子作为阳性样本。

他们的家人在类似的家庭环境中是如何做到的?为了找出原因,这位官员让孩子们带他去观察各自家庭的饮食习惯。

经过多次走访,官方发现这些孩子有一个共同点:一天吃四顿饭,家人经常抓一些小虾做饭,把紫薯叶汁加到米饭里。这些是可以在当地使用的自然资源,不会增加家庭的日常开支,并且易于复制。矮个子没有这些特征。

这位官员得出的结论是,这种饮食方式可以提高营养水平,因此他将这种饮食方式扩展到整个越南。就这样,他在没有任何资源的情况下,20年来提高了越南儿童的营养水平。

这里使用的方法是常用方法,也称为常用方法。

使用常用方法分为三个步骤:

第一步是比较被调查现象发生的积极情况,发现只有一个共同情况,从而按照求共性的方法确定A和a有因果关系;

第二步,比较所研究的现象没有出现的负面情况,发现A的缺席是唯一常见的情况,从而确定A的缺席与相应的A的缺席有因果关系。寻求共性的方法;

第三步,比较两组的正负情况。发现有A就有a,没有A就没有a。由此,根据差分法,得出A与a有因果关系的结论。

上述案例的逻辑过程是:

首先使用相同的方法寻找较高儿童饮食的共同点。然后发现在矮个子儿童中不存在相同的饮食特征。

最后采用差异法对两组进行比较。终于得出结论了。

常用方法的目的是找出因果关系,但在现实环境中很难找到因果关系,或者业务人员可以找到容易找到的因果关系。

因此,我们在深入结论的分析中,一般使用相关性来代替因果关系。

如果只分析相关关系,将适当简化常用方法的步骤。

不追求“有A有a,无A无a”的结果,只追求“有A,a更明显,无A,a不明显”。

比如上面提到的广告分析案例,因为广告中因素太多,太复杂,很难找到因果关系。一般来说,找到一个与转化率密切相关的因素就足够了。

与求同法和求异法相比,常用法的应用范围更广,很多数据分析都会用到常用法。但是,普通法只能说是建立在求同法则和求异法则的基础上,进一步提高了结论的可靠性。普通法的结论可能并不完全正确。

使用时要注意:正例组和负例组组合的场合越多,结论的信度越高;对于阴性病例组的每一个场合,都应该选择与阳性病例组比较相似的一个进行比较(尽量做AB测试)。

另外需要说明的是,常用方法的步骤包括两个共识和一个不同。在求异过程的最后一步,大部分人都会思考,但表达的时候并没有说清楚。建议大家完整表达。

协变,而不是变异

同一块地,其他条件相同,只是增加了肥料的用量,结果水稻的产量也在增加。由此我们可以得出结论,更多的施肥是水稻产量增加的原因。

这种分析方法称为协变。

协变法的思想是:在其他条件不变的情况下,如果一种现象发生变化,另一种现象也随之变化,那么前一种现象就是后一种现象的原因。

协变方法可以表示如下:

场合1、相关情况A1、B、C、研究对象a1的发生

场合2,相关情况A2,B,C,无主题a2

场合3,相关情况A3,B,C,无科目a3

所以 A 是 a 的原因

与协变法最相似的数据分析方法是相关分析。

相关性分析,简单来说就是衡量两个数值变量之间的相关性,计算出相关性的大小。

如果是施肥量与水稻产量的关系,通过相关性分析,可以得出两者之间有很强的相关性,以及相关系数,来估计投入肥料所能达到的水稻产量。带来。

相关分析应用在真实的业务场景中,即广告量与销售额的相关性,核心功能的使用率与留存率的相关性等。

这需要一些相关分析的知识,比如回归、相关系数、偏相关等概念,这里不再展开。

但是,在实际业务场景中,很难做到只有一个因素发生不同程度的变化。如果你想增加结论的可靠性,要么增加样本量,要么诚实地做 AB 测试。

残差法,而不是残差法

居里夫人和她的丈夫曾经测量过沥青铀矿样品中的铀含量,看它是否含有值得提炼的铀。

令他们惊讶的是,有几个样品的放射性甚至比纯铀还要高。这意味着这些沥青闪石中肯定还有其他放射性元素。同时,这些未知的放射性元素只能以极少的数量被发现,因为它们无法通过普通的化学分析来检测。

少量的放射性如此之强,说明这种元素的放射性远高于铀。1898 年 7 月,他们终于分离出了放射性比铀高 400 倍的钋。

该元素的发现是应用的残差法。

残差法的思想是:知道复合对象是由复合原因引起的,如果现象的一部分是复合原因的一部分的结果,那么复合现象的余数就是复合现象的余数。复合原因。结果。

残差法的公式表示如下:

由a、b、c、d组成的复合现象是复合因(A、B、C、D)作用的结果,

现象 a 是原因 A 作用的结果,

现象 b 是原因 B 作用的结果,

现象c是原因C作用的结果;

因此,现象 d 是原因 D 作用的结果。

残差法的要求非常严格,必须明确现象与原因的对应关系。这在极其复杂的真实业务场景中是很难实现的,而且应用范围有限,这里就不做介绍了。

对比思维总结

数据分析方法值得重新审视。

结合以上方法,我们发现除了最基本的“比例大小”外,还有“比例相同”、“比例不同”、“比例变化”等不同的方法。

这些比较思维方法只是框架,在实际的数据分析过程中还有一些衍生的方法。

一阶导数方法是趋势分析

趋势分析的整个分析过程基本都是基于比较思维。趋势分析实际上是将一个业务指标与您过去的情况进行比较。

在趋势分析过程中也会用到一些比较方法,例如:

如果指标随着时间的发展稳步上升,那么它基本上是一种协变法。该指标随时间上升,未来还会上升。

如果趋势分析中有几个异常点,特别是高点或低点,那么找出这些异常点与其他点之间的差异就是差异法。

如果你找到了几个异常点的共同点,那就是求同点的方法。

二阶导数法是竞争分析

竞品分析也是一种几乎完全基于比较思维的分析方法。竞品分析其实就是多维度比较自己的产品和竞争对手的产品。

竞品分析在分析过程中会使用一些比较方法,如:

如果要找出竞争产品最近快速增长的原因,则使用协变法。做某事一段时间,然后迅速成长。

如果你想找到成功应用程序的共同点,那就是寻求共同点,等等。

还有相关性分析、AB检验等其他衍生方法,前面已经提到过,这里不再赘述。

最后,以上方法都是不完全归纳,也就是说即使论证过程是正确的,结果也可能是错误的。而且,很容易找到的因果关系,被大家挖出来了。我们可以直接利用这些因果关系,不需要我们自己重新发明轮子。

所以如果分析是在初步探索阶段,我们可以通过这些比较的方法来找到一些初步的结论。

如果在寻找解决方案的阶段,我们可以直接将那些已经被验证的因果关系作为演绎法的大前提,以演绎法作为论据对比分析法,结果更加可靠和高效。

比较分析是数据分析的基本方法,几乎​​所有的分析都需要比较分析。

但是,很多人认为比较思维是“规模的比较”,太小了,不能低估数据分析师的技能水平。

很多人认为数据分析很简单,很多数据分析技巧看起来很平凡。

其实不说那些复杂的算法,连基本的分析思路都是很多知识。

我认为数据分析方法值得重新审视。

#专栏作家#

三元房茶,公众号:三元房茶,大家都是产品经理专栏作家。专注于用数据驱动业务增长,擅长数据分析和用户增长。喜欢阅读、思考和创造。

本文最初发表于每个人都是产品经理。禁止任何未经许可的复制。

题图来自Unsplash,基于CC0协议

奖励作者,鼓励TA抓紧创作!

欣赏

赞(0) 打赏
未经允许不得转载:雀恰营销 » 对比分析法,数据分析基础思维之:对比思维
分享到: 更多 (0)

评论 抢沙发

评论前必须登录!

 

文章对你有帮助就赞助我一下吧

支付宝扫一扫打赏

微信扫一扫打赏