# 1. 卡方检验、t检验和方差分析的区别
# 1.1. 核心区别
其核心的区别在于:数据类型不一样。如果是定类和定类,此时应该使用卡方分析;如果是定类和定量,此时应该使用方差或者T检验。
方差和T检验的区别在于,对于T检验的X来讲,其只能为2个类别比如男和女。如果X为3个类别比如本科以下,本科,本科以上;此时只能使用方差分析。
- 方差分析,用于分析定类数据与定量数据之间的关系情况
- T检验,用于分析定类数据与定量数据之间的关系情况.
- 卡方分析,用于分析定类数据与定类数据之间的关系情况.例如研究人员想知道两组学生对于手机品牌的偏好差异情况。
# 1.2. 进一步细分
1)方差分析
根据X的不同,方差分析又可以进行细分。X的个数为一个时,我们称之为单因素方差;X为2个时则为双因素方差;X为3个时则称作三因素方差,依次下去。当X超过1个时,统称为多因素方差。
单因素方差分析,用于分析定类数据与定量数据之间的关系情况。在使用单因素方差分析时,需要每个选项的样本量大于30,比如男性和女性样本量分别是100和120,如果出现某个选项样本量过少时应该首先进行组别合并处理,比如研究不同年龄组样本对于研究变量的差异性态度时,年龄小于20岁的样本量仅为20个,那么需要将小于20岁的选项与另外一组(比如20~25岁)的组别合并为一组,然后再进行单因素方差分析。
如果选项无法进行合并处理,比如研究不同专业样本对于变量的态度差异,研究样本的专业共分为市场营销、心理学、教育学和管理学四个专业,这四个专业之间为彼此独立无法进行合并组别,但是市场营销专业样本量仅为20并没有代表意义,因此可以考虑首先筛选出市场营销专业,即仅比较心理学,教育学和管理学这三个专业对某变量的差异性态度,当对比的组别超过三个,并且呈现出显著性差异时,可以考虑使用事后检验进一步对比具体两两组别间的差异情况。
双因素方差分析,用于分析定类数据(2个)与定量数据之间的关系情况,例如研究人员性别,学历对于网购满意度的差异性;以及男性或者女性时,不同学历是否有着网购满意度差异性;或者同一学历时,不同性别是否有着网购满意度差异性。
多因素方差分析,通常用于类实验式问卷研究。比如研究者测试某新药对于胆固醇水平是否有疗效;研究者共招募72名被试,男女分别为36名,以及男女分别再细分使用新药和普通药物;同时高血压患者对于新药可能有干扰,因而研究者将被试是否患高血压也纳入考虑范畴中。因而最终,X共分为三个,分别是药物(旧药和新药)、性别,是否患高血压;Y为胆固醇水平。因而需要进行三因素方差分析即多因素方差分析。
在方法选择上,问卷研究通常会使用方差分析,但某些专业,比如心理学、教育学或者师范类专业等涉及到实验研究时,更多会使用T检验进行分析,另外方差分析与T检验还有较多差异,在某些分析中只能使用其中一种。
2)T检验
T检验共分为三种方法,分别是独立样本T检验,配对样本T检验和单样本T检验。
独立样本T检验和单因素方差分析功能上基本一致,但是独立样本T检验只能比较两组选项的差异,比如男性和女性。相对来讲,独立样本T检验在实验比较时使用频率更高,尤其是生物、医学相关领域。针对问卷研究,如果比较的类别为两组,独立样本T检验和单因素方差分析均可实现,研究者自行选择使用即可。
3)卡方分析
卡方检验用于分析定类数据与定类数据之间的关系情况。例如研究人员想知道两组学生对于手机品牌的偏好差异情况,则应该使用卡方分析。卡方是通过分析不同类别数据的相对选择频数和占比情况,进而进行差异判断,单选题或多选题均可以使用卡方分析进行对比差异分析。
# 1.3. 其他不同
# 1.3.1. 一、what
1、卡方检验 Chi-Square Test
卡方检验就是检验两个变量之间有没有关系。
以运营为例:
- 卡方检验可以检验男性或者女性对线上买生鲜食品有没有区别;
- 不同城市级别的消费者对买SUV车有没有什么区别;
如果有显著区别的话,我们会考虑把这些变量放到模型或者分析里去。
2、t检验
亦称student t检验(Student's t test),主要用于样本含量较小(例如n < 30),总体标准差σ未知的正态分布。
T检验是用于两个样本(或样本与群体)平均值差异程度的检验方法。它是用T分布理论来推断差异发生的概率,从而判定两个平均数的差异是否显著。
3、方差分析
Analysis of Variance,简称ANOVA,又称“变异数分析”
从方差分析的目的来看,是要检验各个水平(因素中的内容)的均值μ1、μ2、…、μm是否相等(m为水平个数),而实现这个目的的手段是通过方差的比较(即考察各观察数据的差异)。通俗说,就是有没有变异。
# 1.3.2. 二、卡方检验和方差分析的区别:
1、二者的基本思想不同
方差分析基本思想:变异分解,总变异=随机变异+处理因素导致的变异,又可以分解为总变异=组内变异+组间变异,F=组间变异/组内变异,F的值越大,处理因素的影响越大。
卡方检验基本思想:以卡方分布为基础,计算观察值和期望值之间的偏离程度。
2、适用的前提条件不同
方差分析:数据具有独立性、正态性、方差齐性。
卡方检验:最小期望频数均大于1;至少4/5的单元格期望频数大于5;计算时如果单元格期望频数小于5要和其他种类合并;样本观察值量超过50。
3、适用的场景不同
方差分析:均数间的多重比较(全部两两比较)、各组均数的精细比较(可以指定要比较的两个组,通过设定系数)、组间均数的趋势检验(为了利用分组变量中体现出的次序信息,目的不是为了拟合线性或非线性的模型,而是希望知道因素的水平改变时均数的变化趋势)。
卡方检验:单样本卡方检验、两样本卡方检验、两分类变量间关联程度的度量、Kappa一致性检验、Mcnemar 配对卡方检验、分层卡方检验。
# 1.3.3. 三、卡方检验和t检验的区别:
卡方检验和T检验的前提条件(原假设)是对立的:
- 卡方检验:假设没有相关性
- T检验:假设没有差异(相等)