类别变量的拟合优度检验和列联表与x²独立性检验

2025-11-16 08:42:39

1、一、拟合优度检验

单个类别变量

Excel中函数chidist可以计算出卡方统计量的p值,P<a时候拒绝原假设,一般原假设是观测值和期望值无显著差异,

期望频数相等和不相等都可以用拟合优度检验

2、独立性检验

两个类别变量,r(行)*c(列)列联表,

原假设是连个类别变量独立(无关)

自由度是(r-1)(c-1)

任意单元格的期望频数(rt/n)(ct/n)*n

rt所在行的合计频数,ct所在列的合计频数,n样本总量

3、卡方检验时期望值不能太小,原因是分布是期望值,如果期望值小会导致卡方值增大拒绝原假设,一般要求2各单元格时期望频数不能小于5,多个单元格时频数小于5的个数不超过总各数的20%,如果超过可以采取合并类别的办法

一般显著水平默认0.05,在spss想调卡方的显著水平,点击交叉表bootstrap修改置信区间

spss卡方主要看p值(渐进sig双侧与pearson卡方交叉单元值)是否小于0.05,小于拒绝原假设,大于没有理由拒绝原假设(认为独立或无关)

4、φ系数主要用于2*2列列联表相关性度量(当行数和列数大于2时,φ系数会随着行列的增加而变大,这是候系数的大小就不容易解释)

φ系数取值0-1,越接近于0关系越弱,越接近于1关系越强。

gramer's v系数 两个类别量可以多行多列,自由度取最小自由度 ,区间0-1

列联系数c主要用于大于2*2的列联表,最大系数接近1,但小于1,因为计算公式中分母是x²+1

             0.8-1.0 极强相关


              0.6-0.8 强相关
              0.4-0.6 中等程度相关
              0.2-0.4 弱相关
              0.0-0.2 极弱相关或无相关

声明:本网站引用、摘录或转载内容仅供网站访问者交流或参考,不代表本站立场,如存在版权或非法内容,请联系站长删除,联系邮箱:site.kefu@qq.com。
猜你喜欢