六、假设检验

2016/9/6 posted in  Statistics  

概念、一个正态总体均值的检验、两个正态总体均值差的检验、成对比较、二样本方差比的检验、拟合优度检验

问题的提出及几个概念

100件产品,6件次品

  1. 次品率是多少?(点估计)
  2. 次品率的范围?(区间估计)
  3. 次品率不会超过多少?(置信上限)
    次品率不会低于多少?(置信下限)
  4. 次品率是不是5%?
    次品率是不是不超过6%?
    次品率是不是不低于5%?

假设\(H_0\)(零假设、原假设):

  1. 原先就有的假设
  2. 经过长期实践,被认为是正确的假设。

假设检验就是通过样本来回答\(H_0\)是否正确。

对正态总体\(N(\mu,\sigma^2)\)而言,一个\(H_0: \mu=\mu_0\),其中\(\mu\)是一个未知常数,\(\mu_0\)是已知的常数。

检验分为参数检验(总体已知,参数未知)和非参数检验(总体未知,参数未知)。

  • 参数检验:
    • 用\(N(0,1)\)检验均值:\(u\)-检验、\(t\)-检验
    • 方差:\(\chi^2\)检验、\(F\)检验
  • 非参数检验:拟合优度检验:取有限值的离散分布

若否定原假设,则接受的假设要事先规定好,这一假设称为对立假设(备择假设),记为\(H_1\)。

  • 若\(H_1:P \neq 0.05\),称为双侧检验
  • 若\(H_1:P >0.05\),称为单侧检验

一个完整的假设检验形如:

\[H_0:... \leftrightarrow H_1:...\]
\(H_0\)和\(H_1\)的地位不平等,检验时,以站在保护原假设的立场上。因此在没有充分的证据下,总是认为\(H_0\)是正确的。

接受\(H_0\),不能说明\(H_0\)一定正确,只能说明到目前为止,没有足够的证据说明\(H_0\)不对,所以接受原假设。

否定(拒绝)\(H_0\),意味着有充分的证据说明\(H_0\)不对。

一个正态总体均值的检验

(待补充)

两个正态总体均值差的检验

\(X\backsim N(\_mu_1,\sigma_1^2),Y\backsim N(\mu_2,\sigma_2^2)\)

  1. \(H_0:\mu_1-\mu_2=\sigma \leftrightarrow H_1:\mu_1-\mu_2 \neq \sigma\)
  2. \(H_0:\mu_1-\mu_2=\sigma \leftrightarrow H_1:\mu_1-\mu_2 > \sigma\)
  3. \(H_0:\mu_1-\mu_2=\sigma \leftrightarrow H_1:\mu_1-\mu_2 < \sigma\)

\(\mu_1,\mu_2\)都是未知常数。

检验规则:
\(\widehat {\mu_1-\mu_2}=\bar X-\bar Y\)

  1. 双侧检验:
    \(\left| \bar Y-\bar Y-\sigma \right| \leqslant d\),接受\(H_0\)
    \(\left| \bar Y-\bar Y-\sigma \right| > d\),拒绝\(H_0\)
  2. 从\(H_1\)验证:
    \(\bar X -\bar Y-\sigma>d\),拒绝\(H_0\)
    \(\bar X -\bar Y-\sigma\leqslant d\),接受\(H_0\)
  3. 从\(H_1\)验证:
    \(\bar Y -\bar X-\sigma>d\),拒绝\(H_0\)
    \(\bar Y -\bar X -\sigma\leqslant d\),接受\(H_0\)

\(\bar X \backsim N(\mu_1,\frac{\sigma_1^2}{n_1}),\bar Y \backsim N(\mu_2,\frac{\sigma_2^2}{n_2}),\bar X-\bar Y\backsim N(\mu_1-\mu_2,\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2})\)

标准化:
\[\frac{\bar X-\bar Y-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}\backsim N(0,1)\]

  1. 方差已知: \(d=\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}U_{\frac{\alpha}{2}}\)
    单侧时:\(U_{\frac{\alpha}{2}}\)
    双侧时:\(U_\alpha\)
  2. \(\sigma_1^2=\sigma_2^2=\sigma^2\)未知:
    \(d=\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}S_Tt_{\frac{\alpha}{2}}(n_1+n_2-2)\)
  3. \(n_1>30,n_2>30\):
    \(d=\sqrt{\frac{S_1^2}{n_1}+\frac{S_2^2}{n_2}}U_{\frac{\alpha}{2}}\)

成对比较

\(Z_1,...,Z_n\)来自一份新的总体,\(Z=X-Y\),\(X_1,X_2\),\(Y_1,Y_2\)可能不同分布,但关心的是\(X-Y\)。

检验:

\(H_0:\mu_z=\sigma \leftrightarrow H_1:\mu_z \neq \sigma\)

\(H_0:\mu_z=\sigma \leftrightarrow H_1:\mu_z > \sigma\)

\(H_0:\mu_z=\sigma \leftrightarrow H_1:\mu_z < \sigma\)

  • 成组比较:\(X_1,...,X_n\)比较\(Y_1,...,Y_n\)
  • 成对比较:\(X_1,Y_2\)比较\(X_2,Y_2\)

二样本方差比的检验

\(H_0:\frac{\sigma_1^2}{\sigma_2^2}=\sigma \leftrightarrow H_1: \frac{\sigma_1^2}{\sigma_2^2} \neq \sigma\)

\(\hat{(\frac{\sigma_1^2}{\sigma_2^2})}=\frac{S_1}{S_2}\)

\(\frac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2}\backsim F_{n_1-1,n_2-1}\)

\(\frac{1}{B}<\frac{S_1^2}{S_2^2}<\frac{1}{A},0<A<1<B\)

拟合优度的检验

\(\chi^2\)统计量:\[\sum_{i=1}^k \frac{(O_i-E_i)^2}{E_i}\]
\(O_i\):观察值,\(E_i\):理论值、期望值。

当\(n \to \infty\)时,\(\chi^2\)的分布趋向于自由度为\(n-1(P_1+P_2+...+P_n=1)\)的\(\chi^2\)分布。

当\(\chi^2> \chi_{k-1}^2(\alpha)\)时,拒绝\(H_0\)。

\[P(\chi_{k-1}^2 > \chi^2)=p\]
\(p\)值即\(p-value\),即拟合优度,\(p\)值越小越,拟合优度越差,越要拒绝原假设