数学知识点:独立性检验的基本思想及其初步应分类变量与列联表: 变量的不同“值”表示个体所属的不同类别,像这类变量称为分类变量; 列出的两个分类变量的频数表,称为列联表,学习规律。 独立性检验: 为了使不同样本容量的数据有统一的评判标准,构造一个随机变量,其中n=a+b+c+d为样本容量。利用随机变量K2来确定在多大程度上可以认为“两个分类变量有关系”的方法,称为两个分类变量的独立性检验。 利用独立性检验来考察两个分类变量是否有关系,并且能较精确地给出这种判断的可靠程度,具体做法是: (1)根据实际问题需要的可信程度确定临界值k0; (2)利用公式(1),由观测数据计算得到随机变量K2的观测值; (3)如果k>k0,就以(1-P(K2≥k0))×100%的把握认为“X与Y有关系”;否则就说样本观测数据没有提供“X与Y有关系”的充分证据。 独立性检验的性质: 独立性检验没有直观性,必须依靠K2 的观测值k作判断。 独立性检验的一般步骤: (1)根据样本数据制成2×2列联表; (2)根据公式,计算K2的值; (3)查表比较K2与临界值的大小关系,作统计判断。 |