统计量及其分布2
本文内容由简易程序从latex批量转义而来, 排版并不友好, 相对精美版请见课程整理
样本方差与标准差
定义
- 设 \(X_1,X_2,\cdots,X_n\) 为取自某个总体的样, 则它关于样本均值 \(\overline{x}_n\) 的平均偏差平方和
$$
s_n^2=\dfrac 1 n\sum\limits_{i=1}^n(x_i-\overline{x}_n)^2
$$
称为**样本方差**. 其算数根 $s_n=\sqrt{s_n^2}$ 为**样本标准差**.
在 $n$ 不大时, 常用
$$
s^2=\dfrac{1}{n-1}\sum\limits_{i=1}^n(x_i-\overline{x}_n)^2
$$
作为样本方差, 也称**无偏方差**. 实际中 $s^2$ 也更常用, 以后讲样本方差通常是指 $s^2(s_n^2)$.
定理
-
设 \(E(x)=\mu,\var(X)=\sigma^2<\infty\), 则样本方差 \(s_n^2\) 满足.
$$ E(s_n^2)=\sigma^2,\quad\var(s_n^2)=. $$
样本矩及其函数
定义
- 设 \(X_1,X_2,\cdots,X_n\) 是样本, \(r\) 为正整数. 统计量
$$
M_r'=\dfrac 1 n\sum\limits_{i=1}^n X_i^r
$$
称为样本 $r$ 阶**原点矩**.
$$
M_r=\dfrac 1 n\sum\limits_{i=1}^n (X_i^r-\overline{x}_n)
$$
称为样本 $r$ 阶**中心矩**.
定理
- \(E(M_r')=\mu_r',\quad,\var(M_r')=\dfrac 1 n\left[\mu_{2r}'-(\mu_r')^2\right]\)
定义 样本变异系数
- 设 \(X_1,X_2,\cdots,X_n\) 是来自总体 \(X\) 的随机样本, \(\overline{X}_n\) 是样本均值且不为 \(0\), \(S_n\) 是样本标准差, 则称统计量 $$ \hat{v}=\dfrac{S_n}{\overline{X}_n} $$ 为样本变异系数.
定义
- 称统计量 \(\hat{\gamma}=\dfrac{M_3}{M_2^{\frac 3 2}}=\dfrac{\sqrt{n}\sum\limits_{i=1}^n(X_i-\overline{X}_n)^3}{\left(\sum\limits_{i=1}^n(X_i-\overline{X}_n)^2\right)^{\frac 3 2}},\) 为样本偏度.
(a) \(\hat{\gamma}=0\), 完全对称.
(b) \(\hat{\gamma}>0\), 右偏.
(c) \(\hat{\gamma}<0\), 左偏.
\[\begin{figure}[H]
\centering
\includegraphics[width=0.8\textwidth]{figures/数理统计/样本偏度.png}
\end{figure}\]
定义
- 称统计量 \(\hat{\nu}=\dfrac{M_4}{(M_2)^2}-3\), 为样本峰度.
次序统计量及其分布
令 \(Y_1\leqslant Y_2\leqslant\cdots\leqslant Y_n\) 表示来自总体 \(\text{pdf}\) \(f(\cdot)\) 的随机变量 \(X_1,X_2,\cdots,X_n\) 的次序统计量.
样本极差: \(Y_n-Y_1\).
中列数/中矩: \(\dfrac{Y_1+Y_n}{2}\).
评论