设X1,X2,...,Xn是来自总体X(随机变量)的一个样本,它们相互独立,g(X1,X2,...,Xn)是X1,X2,...,Xn的函数,若g中不含未知参数,则称g(X1,X2,...,Xn)是一统计量。
因为X1,X2,...,Xn都是随机变量,而统计量是随机变量的函数,因此统计量是一个随机变量。设x1,x2,...,xn是相应于样本X1,X2,...,Xn的样本值,则称g(x1,x2,...,x3)是g(X1,X2,...,Xn)的观察值。
样本均值:
X=n1i=1∑nXi 样本方差(无偏估计):
S2=n−11i=1∑n(Xi−X)2=n−11(i=1∑nXi2−nX2) 样本标准差:
S=S2=n−11i=1∑n(Xi−X)2 样本k阶(原点)距:
Ak=n1i=1∑nXik 样本k阶中心距:
Ak=n1i=1∑n(Xi−X)k 样本的协方差:
Cov(X,Y)=n−11i=1∑n(Xi−X)(Yi−Y) 其中X1,X2,...,Xn是来自总体X的一个样本,Y1,Y2,...,Yn是来自总体Y的一个样本。
样本协方差矩阵:
假定X1,X2,...,Xn是多维随机变量
cij=Cov(Xi,Xj)=n−11k=1∑n(Xik−Xi)(Xjk−Xj) C=c11c21⋮cn1c12c22⋮cn2.........c1nc2n⋮cnn 为什么样本方差是除以n−1,而不是n?
“均值已经用了n个数的平均来做估计,在求方差时,只有n−1个数和均值信息是不相关的。而第n个数已经可以由前n−1个数和均值来唯一确定,实际上没有信息量,所以在计算方差时,只除以n−1“
(详细请参考 https://www.zhihu.com/question/20099757)