Content #
一种常用的非参数统计方法,主要用于分析分类变量(categorical variables)之间的关联性或拟合优度。它通过比较观察频数与期望频数的差异,判断数据是否符合某种理论分布或变量之间是否独立。
核心思想 #
卡方检验基于以下假设:
原假设(H₀):观察数据与理论分布无显著差异,或变量间相互独立。备择假设(H₁):观察数据与理论分布存在显著差异,或变量间存在关联。通过计算卡方统计量(Chi-square statistic, χ²),判断实际观测值与理论期望值的偏离程度是否由随机误差导致。
卡方拟合优度检验(Goodness-of-Fit Test) #
用途:检验单个分类变量是否符合某个理论分布(如均匀分布、正态分布等)。示例:检验骰子是否公平(各点数出现概率是否均为1/6)。
卡方独立性检验(Test of Independence) #
用途:检验两个分类变量是否独立(无关联)。示例:分析性别(男/女)与吸烟习惯(吸烟/不吸烟)是否相关。
卡方同质性检验(Test of Homogeneity) #
用途:检验不同组别在某一分类变量上的分布是否相同。示例:比较不同地区人群的血型分布是否一致。