先看自由度(degree of freedom, df)定义:
自由度指,以样本的统计量来估计总体的参数时,样本中独立或能自由变化数据的个数,称为该统计量的自由度。
做统计分析时,几乎所有的指标,方法都会用到自由度,它和例数(样本数)相关,是统计方法中的重要因素。
自由度的意思是,计算样本统计量时能够自由取值的数值的个数。
有两个变量x和y,x y=10,那么自由度为1;因为只有x才能自由的变化,y会被x的选值而被限制;
估计总体的平均数μ时,由于样本中的n个数都是相互独立的,任一个尚未抽出的数都不受到已抽出的数值的影响,所以自由度为n;
估计总体的方差σ2,所用的统计量是样本的标准差s,我们知道s必须用到样本平均值 计算。抽完样后,大小为n-1的样本确定后,第n个数也已经确定了,才能符合平均值 的要求,平均值 就是一个限制条件,故样本方差的自由度为n-1.
统计模型的自由度等于可自由取值的的自变量个数。在回归方程中,如共有p个参数需要估计,包括了p-1个自变量和一个常量,则自由度为p-1.
故在计算(注意不是估计)总体的方差时,是除于n而不是n-1。
看到这里,对自由度应该有个较为全面的了解啦。