概念、一个正态总体均值的检验、两个正态总体均值差的检验、成对比较、二样本方差比的检验、拟合优度检验
问题的提出及几个概念
100件产品,6件次品
- 次品率是多少?(点估计)
- 次品率的范围?(区间估计)
- 次品率不会超过多少?(置信上限)
次品率不会低于多少?(置信下限) - 次品率是不是5%?
次品率是不是不超过6%?
次品率是不是不低于5%?
假设\(H_0\)(零假设、原假设):
- 原先就有的假设
- 经过长期实践,被认为是正确的假设。
假设检验就是通过样本来回答\(H_0\)是否正确。
对正态总体\(N(\mu,\sigma^2)\)而言,一个\(H_0: \mu=\mu_0\),其中\(\mu\)是一个未知常数,\(\mu_0\)是已知的常数。
检验分为参数检验(总体已知,参数未知)和非参数检验(总体未知,参数未知)。
- 参数检验:
- 用\(N(0,1)\)检验均值:\(u\)-检验、\(t\)-检验
- 方差:\(\chi^2\)检验、\(F\)检验
- 非参数检验:拟合优度检验:取有限值的离散分布
若否定原假设,则接受的假设要事先规定好,这一假设称为对立假设(备择假设),记为\(H_1\)。
- 若\(H_1:P \neq 0.05\),称为双侧检验
- 若\(H_1:P >0.05\),称为单侧检验
一个完整的假设检验形如:
\[H_0:... \leftrightarrow H_1:...\]
\(H_0\)和\(H_1\)的地位不平等,检验时,以站在保护原假设的立场上。因此在没有充分的证据下,总是认为\(H_0\)是正确的。
接受\(H_0\),不能说明\(H_0\)一定正确,只能说明到目前为止,没有足够的证据说明\(H_0\)不对,所以接受原假设。
否定(拒绝)\(H_0\),意味着有充分的证据说明\(H_0\)不对。
一个正态总体均值的检验
(待补充)
两个正态总体均值差的检验
\(X\backsim N(\_mu_1,\sigma_1^2),Y\backsim N(\mu_2,\sigma_2^2)\)
- \(H_0:\mu_1-\mu_2=\sigma \leftrightarrow H_1:\mu_1-\mu_2 \neq \sigma\)
- \(H_0:\mu_1-\mu_2=\sigma \leftrightarrow H_1:\mu_1-\mu_2 > \sigma\)
- \(H_0:\mu_1-\mu_2=\sigma \leftrightarrow H_1:\mu_1-\mu_2 < \sigma\)
\(\mu_1,\mu_2\)都是未知常数。
检验规则:
\(\widehat {\mu_1-\mu_2}=\bar X-\bar Y\)
- 双侧检验:
\(\left| \bar Y-\bar Y-\sigma \right| \leqslant d\),接受\(H_0\)
\(\left| \bar Y-\bar Y-\sigma \right| > d\),拒绝\(H_0\) - 从\(H_1\)验证:
\(\bar X -\bar Y-\sigma>d\),拒绝\(H_0\)
\(\bar X -\bar Y-\sigma\leqslant d\),接受\(H_0\) - 从\(H_1\)验证:
\(\bar Y -\bar X-\sigma>d\),拒绝\(H_0\)
\(\bar Y -\bar X -\sigma\leqslant d\),接受\(H_0\)
\(\bar X \backsim N(\mu_1,\frac{\sigma_1^2}{n_1}),\bar Y \backsim N(\mu_2,\frac{\sigma_2^2}{n_2}),\bar X-\bar Y\backsim N(\mu_1-\mu_2,\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2})\)
标准化:
\[\frac{\bar X-\bar Y-(\mu_1-\mu_2)}{\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}}\backsim N(0,1)\]
- 方差已知:
\(d=\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}U_{\frac{\alpha}{2}}\)
单侧时:\(U_{\frac{\alpha}{2}}\)
双侧时:\(U_\alpha\) - \(\sigma_1^2=\sigma_2^2=\sigma^2\)未知:
\(d=\sqrt{\frac{\sigma_1^2}{n_1}+\frac{\sigma_2^2}{n_2}}S_Tt_{\frac{\alpha}{2}}(n_1+n_2-2)\) - \(n_1>30,n_2>30\):
\(d=\sqrt{\frac{S_1^2}{n_1}+\frac{S_2^2}{n_2}}U_{\frac{\alpha}{2}}\)
成对比较
\(Z_1,...,Z_n\)来自一份新的总体,\(Z=X-Y\),\(X_1,X_2\),\(Y_1,Y_2\)可能不同分布,但关心的是\(X-Y\)。
检验:
\(H_0:\mu_z=\sigma \leftrightarrow H_1:\mu_z \neq \sigma\)
\(H_0:\mu_z=\sigma \leftrightarrow H_1:\mu_z > \sigma\)
\(H_0:\mu_z=\sigma \leftrightarrow H_1:\mu_z < \sigma\)
- 成组比较:\(X_1,...,X_n\)比较\(Y_1,...,Y_n\)
- 成对比较:\(X_1,Y_2\)比较\(X_2,Y_2\)
二样本方差比的检验
\(H_0:\frac{\sigma_1^2}{\sigma_2^2}=\sigma \leftrightarrow H_1: \frac{\sigma_1^2}{\sigma_2^2} \neq \sigma\)
\(\hat{(\frac{\sigma_1^2}{\sigma_2^2})}=\frac{S_1}{S_2}\)
\(\frac{S_1^2/\sigma_1^2}{S_2^2/\sigma_2^2}\backsim F_{n_1-1,n_2-1}\)
\(\frac{1}{B}<\frac{S_1^2}{S_2^2}<\frac{1}{A},0<A<1<B\)
拟合优度的检验
\(\chi^2\)统计量:\[\sum_{i=1}^k \frac{(O_i-E_i)^2}{E_i}\]
\(O_i\):观察值,\(E_i\):理论值、期望值。
当\(n \to \infty\)时,\(\chi^2\)的分布趋向于自由度为\(n-1(P_1+P_2+...+P_n=1)\)的\(\chi^2\)分布。
当\(\chi^2> \chi_{k-1}^2(\alpha)\)时,拒绝\(H_0\)。
\[P(\chi_{k-1}^2 > \chi^2)=p\]
\(p\)值即\(p-value\),即拟合优度,\(p\)值越小越,拟合优度越差,越要拒绝原假设