统计量及其分布
本文内容由简易程序从latex批量转义而来, 排版并不友好, 相对精美版请见课程整理
统计量及其分布
统计量与抽样分布
定义
- 设 \(x_1,x_2,\cdots,x_n\) 为一个样本, 若样本函数 \(T=T(x_1,x_2,\cdots,x_n)\) 中不含有任何未知参数 (即可以由样本算出的量), 则称 \(T\) 为统计量. 统计量的分布称为抽样分布.
注
-
(1) 统计量是样本的函数, 故其也有二重性.
(2) 尽管统计量不依赖于未知参数, 但是它的.
(3) 掌握: 总体分布 \(\Rightarrow\) 样本的联合概率函数 \(\Rightarrow\) 统计量的概率函数.
样本均值及其抽样分布
定义
- 设 \(x_1,x_2,\ldots,x_n\) 为一个样本, 其算数平均值称为样本均值, 反映的是样本的中心位置. 一般用 \(\overline{x}\) 表示, 有时也用 \(\overline{X}\) 表示, 即
$$
\overline{x} = \dfrac{x_1+x_2+\cdots+x_n}{n} = \dfrac{1}{n}\sum\limits_{i=1}^n x_i.
$$
在分组样本场合, 样本均值的近似公式为
定理
- 设总体 \(X\) 的均值 \(E(X)=\mu\), 方差 \(\var(X)=\sigma^2 < +\infty\), 令 \(X_1,\ldots,X_n\) 是来自总体 \(X\) 的随机样本, 样本均值为 $$ \overline{X}n=\dfrac{1}{n}\sum\limits. $$ }^n X_i, $$ 则 $$ E(\overline{X}_n)=\mu,\quad \var(\overline{X_n})=\dfrac{\sigma^2}{n
证明
-
\[ \begin{aligned} E(\overline{X}_n) &= E(\dfrac{1}{n}\sum\limits_{i=1}^n x_i)\\ &= \dfrac{1}{n}E(\sum\limits_{i=1}^n X_i)\\ &=\dfrac{1}{n}\sum\limits_{i=1}^n E(X_i)\\ &=\dfrac{1}{n}\sum\limits_{i=1}^n E(X)\\ &=E(x)=\mu. \end{aligned}\quad \begin{aligned} \var(\overline{X}_n) &= \var(\dfrac{1}{n}\sum\limits_{i=1}^n x_i)\\ &= \dfrac{1}{n^2}\var(\sum\limits_{i=1}^n X_i)\\ &=\dfrac{1}{n^2}\sum\limits_{i=1}^n \var(X_i)\\ &=\dfrac{1}{n^2}\sum\limits_{i=1}^n \var(X)\\ &=\dfrac{\var(X)}{n}=\dfrac{\sigma^2}{n}. \end{aligned} \]
利用切比雪夫不等式 $$ P(|X-\mu|<\varepsilon)\geqslant 1-\dfrac{\var(X)}{\varepsilon^2} $$ 估计满足精度要求的样本数量.
例
-
假设某一分布的均值未知, 方差 \(\sigma^2=1\), 用样本均值估计总体期望, 要求有 \(0.95\) 的概率误差在 \(0.5\) 以内.
即要求 \(P(|\overline{X}_n-\mu|<0.5)\geqslant 0.95\).利用切比雪夫不等式 \(P(|\overline{X}_n-\mu|<0.5)\geqslant 1-\dfrac{\var(\overline{X}_n)}{\varepsilon^2}=1-\dfrac{\sigma^2}{\varepsilon n}\geqslant0.95\)
即 \(1-\dfrac{1}{n\times \frac{1}{4}}\geqslant 0.95\Rightarrow n\geqslant 80\).
在确定总体分布下的样本均值分布
即求 \(X_1,\ldots,X_n\) 是来自下列确定分布的随机样本, 求 \(\overline{X}_n\) 的精确分布.
(1) 伯努利分布 \(X\sim B(n,p)\).
(2) Poisson 分布 \(P(\lambda)\), 其中 \(\lambda>0\).
\(P\left(\overline{X}_n=\dfrac{k}{n}\right)= e^{-\lambda n}\dfrac{(n \lambda)^k}{k!}\).
(3) 指数分布 \(\text{Exp}(\theta)\).
(4) 柯西分布 \(X\sim \text{Cauchy}(a,b):f(x)=\dfrac{1}{\pi b\{1+[(x-a)/p]^2\}}\). \(X\) 的特征函数为 $$ E(e^{\text{i} tX})=e^{\text{i} ta-b|t|}, $$ 可推出 $$ E(e^{\text{i} t\overline{X}_n})=[E(e^{\text{i} \frac t n} X)]^n=e^{\text{i} ta-b|t|}, $$ 从而 \(\overline{X}_n\sim\text{Cauchy}(a,b)\).
(5) 正态分布 \(N(\mu,\sigma^2)\).
(6) 渐进分布
性质
-
样本均值 \(\overline{X}_n\) 的特征函数与总体的特征函数满足:
$$ E(e^{\text{i} t\overline{X}_n})=[E(e^{\text{i} \frac t n} X)]^n. $$
评论