人工智能 2024-04-28 01:38

学生t 检验(英语:Student's t-test)是指零假设成立时的任一检验统计有学生t分布的统计假设检验,属于参数统计。学生t检验常作为检验一群来自正态分配总体的独立样本之期望值是否为某一实数,或是二(两)群来自正态分配总体的独立样本之期望值的差是否为某一实数。举个简单的例子,在某个学校中我们可以从某个年级中随机抽样一群男生,以检验该年级男生与全校男生之身高差异程度是否如我们所假设的某个值。

由来

学生t检验是威廉·戈塞为了观测酿酒品质于1908年所提出的,“学生 (student)”则是他的笔名。 基于克劳德·健力士(Claude Guinness)聘用从牛津大学和剑桥大学出来的最好的毕业生,以将生物化学及统计学应用到健力士工业流程的创新政策,戈塞受雇于都柏林的健力士酿酒厂担任统计学家。戈塞提出了t检验以降低啤酒重量监控的成本。戈塞于1908年在《Biometrika》期刊上公布t检验,但因其老板认为其为商业机密而被迫使用笔名,统计学论文内容也跟酿酒无关。实际上,其他统计学家是知道戈塞真实身份的。

应用

常见的应用有:

  • 单样本检验:检验一个正态分布的总体的均值是否在满足零假设的值之内,例如检验一群军校男生的身高的平均是否符合全国标准的170公分界线。
  • 独立样本t检验(双样本):其零假设为两个正态分布的总体的均值之差为某实数,例如检验二群人之平均身高是否相等。若两总体的方差是相等的情况下(同质方差),自由度为两样本数相加再减二;若为异方差(总体方差不相等),自由度则为Welch自由度,此情况下有时被称为Welch检验。
  • 配对样本t检验(成对样本t检验):检验自同一总体抽出的成对样本间差异是否为零。例如,检测一位病人接受治疗前和治疗后的肿瘤尺寸大小。若治疗是有效的,我们可以推定多数病人接受治疗后,肿瘤尺寸将缩小。
  • 检验一回归模型的偏回归系数是否显著不为零,即检验解释变量X是否存在对被解释变量Y的解释能力,其检验统计量称之为t-比例(t-ratio)。

前提假设

大多数的t检验之统计量具有t = Z/s的形式,其中Zs是已知资料的函数。Z通常被设计成对于备择假设有关的形式,而s是一个比例参数使t服从于t分布。以单样本t检验为例, criptlevel="0"> Z = X ¯ / ( σ / n ) {\displaystyle Z={\bar {X}}/(\sigma /{\sqrt {n}})} ,其中 criptlevel="0"> X ¯ {\displaystyle {\bar {X}}} 为样本平均数, criptlevel="0"> n {\displaystyle n} 为样本数, criptlevel="0"> σ {\displaystyle \sigma } 为总体标准差。至于s在单样本t检验中为 criptlevel="0"> σ ^ / σ {\displaystyle {\hat {\sigma }}/\sigma } ,其中 criptlevel="0"> σ ^ {\displaystyle {\hat {\sigma }}} 为样本的标准差。在符合零假说的条件下,t检验有以下前提:

  • Z 服从标准正态分布
  • (n - 1)s2 服从自由度(n - 1)的卡方分布
  • Zs互相独立

计算

单样本t检验

检验零假设为一群来自正态分配独立样本xi之总体期望值μμ0可利用以下统计量

criptlevel="0"> t = x ¯ μ 0 s / n {\displaystyle t={\frac {{\overline {x}}-\mu _{0}}{s/{\sqrt {n}}}}}

其中 criptlevel="0"> i = 1 n {\displaystyle i=1\ldots n} criptlevel="0"> x ¯ = i = 1 n x i n {\displaystyle {\overline {x}}={\frac {\sum _{i=1}^{n}x_{i}}{n}}} 为样本平均数, criptlevel="0"> s = i = 1 n ( x i x ¯ ) 2 n 1 {\displaystyle s={\sqrt {\frac {\sum _{i=1}^{n}(x_{i}-{\overline {x}})^{2}}{n-1}}}} 为样本标准差,n为样本数。该统计量t在零假设:μ = μ0为真的条件下服从自由度为n − 1的t分布。

配对样本t检验

配对样本t检验可视为单样本t检验的扩展,不过检验的对象由一群来自正态分配独立样本更改为两配对样本之观测值之差。

若两配对样本x1ix2i之差为di = x1ix2i独立且来自正态分配,则di之总体期望值μ是否为μ0可利用以下统计量

criptlevel="0"> t = d ¯ μ 0 s d / n {\displaystyle t={\frac {{\overline {d}}-\mu _{0}}{s_{d}/{\sqrt {n}}}}}

其中 criptlevel="0"> i = 1 n {\displaystyle i=1\ldots n} criptlevel="0"> d ¯ = i = 1 n d i n {\displaystyle {\overline {d}}={\frac {\sum _{i=1}^{n}d_{i}}{n}}} 为配对样本差值之平均数, criptlevel="0"> s d = i = 1 n ( d i d ¯ ) 2 n 1 {\displaystyle s_{d}={\sqrt {\frac {\sum _{i=1}^{n}(d_{i}-{\overline {d}})^{2}}{n-1}}}} 为配对样本差值之标准差,n为配对样本数。该统计量t在零假设:μ = μ0为真的条件下服从自由度为n − 1的t分布。

独立双样本t检验

同质方差假设 (Homoscedasticity)、样本数相等

若两独立样本x1ix2i具有相同之样本数n,且来自两个总体方差相同(同质方差假设)的正态分配,则两总体之期望值差μ1 - μ2是否为μ0可利用以下统计量

criptlevel="0"> t = x ¯ 1 x ¯ 2 μ 0 2 s p 2 / n {\displaystyle t={\frac {{\overline {x}}_{1}-{\overline {x}}_{2}-\mu _{0}}{\sqrt {2s_{p}^{2}/n}}}}

其中 criptlevel="0"> i = 1 n {\displaystyle i=1\ldots n} criptlevel="0"> x ¯ 1 = ( i = 1 n x 1 i ) / n {\displaystyle {\overline {x}}_{1}=(\sum _{i=1}^{n}x_{1i})/n} criptlevel="0"> x ¯ 2 = ( i = 1 n x 2 i ) / n {\displaystyle {\overline {x}}_{2}=(\sum _{i=1}^{n}x_{2i})/n} 为两样本各自的平均数, criptlevel="0"> s p 2 = ( i = 1 n ( x 1 i x ¯ 1 ) 2 + i = 1 n ( x 2 i x ¯ 2 ) 2 ) / ( 2 n 2 ) {\displaystyle s_{p}^{2}=(\sum _{i=1}^{n}(x_{1i}-{\overline {x}}_{1})^{2}+\sum _{i=1}^{n}(x_{2i}-{\overline {x}}_{2})^{2})/(2n-2)} 为样本之共同方差。该统计量t在零假设:μ1 - μ2 = μ0为真的条件下服从自由度为2n − 2的t分布。

同质方差假设 (Homoscedasticity)、样本数不相等

若两独立样本x1ix2j具有不相同之样本数n1n2,且来自两个总体方差相同(同质方差假设)的正态分配,则两总体之期望值之差μ1 - μ2是否为μ0可利用以下统计量

criptlevel="0"> t = x ¯ 1 x ¯ 2 μ 0 s p 2 / n 1 + s p 2 / n 2 {\displaystyle t={\frac {{\overline {x}}_{1}-{\overline {x}}_{2}-\mu _{0}}{\sqrt {s_{p}^{2}/n_{1}+s_{p}^{2}/n_{2}}}}}

其中 criptlevel="0"> i = 1 n 1 {\displaystyle i=1\ldots n_{1}} ,其中 criptlevel="0"> j = 1 n 2 {\displaystyle j=1\ldots n_{2}} criptlevel="0"> x ¯ 1 = ( i = 1 n x 1 i ) / n {\displaystyle {\overline {x}}_{1}=(\sum _{i=1}^{n}x_{1i})/n} criptlevel="0"> x ¯ 2 = ( i = 1 n x 2 i ) / n {\displaystyle {\overline {x}}_{2}=(\sum _{i=1}^{n}x_{2i})/n} 为两样本各自的平均数, criptlevel="0"> s p 2 = ( i = 1 n ( x 1 i x ¯ 1 ) 2 + j = 1 n ( x 2 j x ¯ 2 ) 2 ) / ( n 1 + n 2 2 ) {\displaystyle s_{p}^{2}=(\sum _{i=1}^{n}(x_{1i}-{\overline {x}}_{1})^{2}+\sum _{j=1}^{n}(x_{2j}-{\overline {x}}_{2})^{2})/(n_{1}+n_{2}-2)} 为两样本共同之方差。该统计量t在零假设:μ1 - μ2 = μ0为真的条件下服从自由度为n1 + n2 − 2的t分布。

异方差假设 (Heteroscedasticity)

若两独立样本x1ix2j具有相同或不相同之样本数n1n2,且两者总体方差不相等(异方差假设)的正态分配,则两总体之期望值之差μ1 - μ2是否为μ0可利用以下统计量

criptlevel="0"> t = x ¯ 1 x ¯ 2 μ 0 s 1 2 / n 1 + s 2 2 / n 2 {\displaystyle t={\frac {{\overline {x}}_{1}-{\overline {x}}_{2}-\mu _{0}}{\sqrt {s_{1}^{2}/n_{1}+s_{2}^{2}/n_{2}}}}}

其中 criptlevel="0"> i = 1 n 1 {\displaystyle i=1\ldots n_{1}} ,其中 criptlevel="0"> j = 1 n 2 {\displaystyle j=1\ldots n_{2}} criptlevel="0"> x ¯ 1 = ( i = 1 n 1 x 1 i ) / n 1 {\displaystyle {\overline {x}}_{1}=(\sum _{i=1}^{n_{1}}x_{1i})/n_{1}} criptlevel="0"> x ¯ 2 = ( j = 1 n 2 x 2 j ) / n {\displaystyle {\overline {x}}_{2}=(\sum _{j=1}^{n_{2}}x_{2j})/n} 为两样本各自的平均数, criptlevel="0"> s 1 2 = ( i = 1 n ( x 1 i x ¯ 1 ) 2 ) / ( n 1 1 ) {\displaystyle s_{1}^{2}=(\sum _{i=1}^{n}(x_{1i}-{\overline {x}}_{1})^{2})/(n_{1}-1)} criptlevel="0"> s 2 2 = ( j = 1 n ( x 2 j x ¯ 2 ) 2 ) / ( n 2 1 ) {\displaystyle s_{2}^{2}=(\sum _{j=1}^{n}(x_{2j}-{\overline {x}}_{2})^{2})/(n_{2}-1)} 分别为两样本之方差。该统计量t在零假设:μ1 - μ2 = μ0为真的条件下服从自由度为

criptlevel="0"> d f = ( s 1 2 / n 1 + s 2 2 / n 2 ) 2 ( s 1 2 / n 1 ) 2 / ( n 1 1 ) + ( s 2 2 / n 2 ) 2 / ( n 2 1 ) {\displaystyle df={\frac {(s_{1}^{2}/n_{1}+s_{2}^{2}/n_{2})^{2}}{(s_{1}^{2}/n_{1})^{2}/(n_{1}-1)+(s_{2}^{2}/n_{2})^{2}/(n_{2}-1)}}}

之t分布。这种方法又常称为Welch检验。

其它相关检验

偏回归系数是否为零之检验

以简单线性回归为例

模型假设:

criptlevel="0"> y i = α + β x i + ε i , {\displaystyle y_{i}=\alpha +\beta x_{i}+\varepsilon _{i},}

其中xii = 1, ..., n为已知,αβ为未知系数,εi为残差独立且服从期望值0且方差σ2未知的正态分布,yii = 1, ..., n为观测值。我们可以检验回归系数β是否相等于特定的β0,通常使β0 = 0以检验xiyi是否存在解释能力,在此例(简单线性回归模型)即为检验回归式之斜率是否为零。

criptlevel="0"> α ^ {\displaystyle {\widehat {\alpha }}} criptlevel="0"> β ^ {\displaystyle {\widehat {\beta }}} 为最小二乘法之估计值, criptlevel="0"> S E α ^ {\displaystyle SE_{\widehat {\alpha }}} criptlevel="0"> S E β ^ {\displaystyle SE_{\widehat {\beta }}} 为最小二乘法估计值之标准误差,则

criptlevel="0"> t = β ^ β 0 S E β ^ T n 2 {\displaystyle t={\frac {{\widehat {\beta }}-\beta _{0}}{SE_{\widehat {\beta }}}}\sim {\mathcal {T}}_{n-2}}

在零假设为β = β0的情况下服从自由度为n − 2之t分布,此检验统计量被称作“t比率 (t-ratio)”,其中

criptlevel="0"> S E β ^ = 1 n 2 i = 1 n ( y i y ^ i ) 2 i = 1 n ( x i x ¯ ) 2 {\displaystyle SE_{\widehat {\beta }}={\frac {\sqrt {{\frac {1}{n-2}}\sum _{i=1}^{n}(y_{i}-{\widehat {y}}_{i})^{2}}}{\sqrt {\sum _{i=1}^{n}(x_{i}-{\overline {x}})^{2}}}}}

由于 criptlevel="0"> ε ^ i = y i y ^ i = y i ( α ^ + β ^ x i ) {\displaystyle {\widehat {\varepsilon }}_{i}=y_{i}-{\widehat {y}}_{i}=y_{i}-({\widehat {\alpha }}+{\widehat {\beta }}x_{i})} 为残差(即估计误差),而 criptlevel="0"> SSR = i = 1 n ε ^ i 2 {\displaystyle {\text{SSR}}=\sum _{i=1}^{n}{\widehat {\varepsilon }}_{i}^{\;2}} 为残差之离均平方和,我们可改写t

criptlevel="0"> t = ( β ^ β 0 ) n 2 SSR / i = 1 n ( x i x ¯ ) 2 {\displaystyle t={\frac {({\widehat {\beta }}-\beta _{0}){\sqrt {n-2}}}{\sqrt {{\text{SSR}}/\sum _{i=1}^{n}\left(x_{i}-{\overline {x}}\right)^{2}}}}}

另请参阅:F检验

电脑软件

大多数的试算表软件及统计软件,诸如QtiPlot、OpenOffice.org Calc、LibreOffice Calc、Microsoft Excel、SAS、SPSS、Stata、DAP、gretl、R、Python ([1](页面存档备份,存于互联网档案馆))、PSPP、Minitab等,都可以进行t检验运算。

编程语言/软件程序 函数 注释
Microsoft Excel 2010 之前的版本 TTEST(array1, array2, tails, type) 参见 [2]
Microsoft Excel 2010 及更高版本 T.TEST(array1, array2, tails, type) 参见 [3](页面存档备份,存于互联网档案馆)
LibreOffice TTEST(Data1; Data2; Mode; Type) 参见 [4](页面存档备份,存于互联网档案馆)
Google Sheets TTEST(range1, range2, tails, type) 参见 [5](页面存档备份,存于互联网档案馆)
Python scipy.stats.ttest_ind(a, b, axis=0, equal_var=True) 参见 [6](页面存档备份,存于互联网档案馆)
Matlab ttest(data1, data2) 参见 [7](页面存档备份,存于互联网档案馆)
Mathematica TTest[{data1,data2}] 参见 [8](页面存档备份,存于互联网档案馆)
R t.test(data1, data2)
SAS PROC TTEST 参见 [9]
Java tTest(sample1, sample2) 参见 [10](页面存档备份,存于互联网档案馆)
Julia EqualVarianceTTest(sample1, sample2) 参见 [11]
Stata ttest data1 == data2 See [12](页面存档备份,存于互联网档案馆)

参见

  • 学生t分布
  • F检验
  • 概率分布