参数估计（一）（点估计）

admin • 2023-11-21 21:27 • 研发管理

文章目录

点估计和估计量的求法
参考文献

参数估计是数理统计中重要的基本问题之一。通常，称参数的可容许值的全体为参数空间，并记为

Θ

Theta

$Θ$ 。所谓参数估计就是由样本对总体分布所含的未知参数做出估计。另外，在有些实际问题中，由于事先并不知道总体

X

X

$X$ 的分布类型，而要对其某些数字特征，如均值、方差等做出估计，习惯上也把这些数字特征称为参数，对它们进行估计也属于参数估计范畴。

点估计和估计量的求法

点估计概念

设总体

$X$ 的分布函数是

(

;

)

F(x;theta_1,...,theta_l)

$F (x; θ_{1}, ..., θ_{l})$ ，其中

theta_1,...,theta_l

$θ_{1}, ..., θ_{l}$ 是未知参数，

X_1,...,X_n

$X_{1}, ..., X_{n}$ 是来自总体

$X$ 的样本，

x_1,...,x_n

$x_{1}, ..., x_{n}$ 是相应的样本值，参数点估计就是研究如何构造适当的统计量

θ

^

i

(

X

1

,

.

.

.

,

X

n

)

hat{theta}_i(X_1,...,X_n)

$θ^_{i} (X_{1}, ..., X_{n})$ ，并分别用观察值

θ

^

i

(

x

1

,

.

.

.

,

x

n

)

hat{theta}_i(x_1,...,x_n)

$θ^_{i} (x_{1}, ..., x_{n})$ 作为未知参数

θ

i

theta_i

$θ_{i}$ 的估计。

通常，称用作估计的统计量

(

)

hat{theta}_i(X_1,...,X_n)

$θ^_{i} (X_{1}, ..., X_{n})$ 为估计量，称其观察值

(

)

hat{theta}_i(x_1,...,x_n)

$θ^_{i} (x_{1}, ..., x_{n})$ 为估计值。

由于对不同的样本值，得到的参数估计值往往不同，因此，点估计问题的关键在于构造估计量的方法。下面介绍求估计量的一些常用方法。

矩估计法

设总体

$X$ 的分布中含有

$l$ 个未知参数

theta_1,...,theta_l

$θ_{1}, ..., θ_{l}$ ，又设总体

$X$ 的前

$l$ 阶原点矩

(

)

(

)

alpha_k=E(X^k)(k=1,...,l)

$α_{k} = E (X^{k}) (k = 1, ..., l)$ 存在，且是

theta_1,...,theta_l

$θ_{1}, ..., θ_{l}$ 的函数，即

(

)

alpha_k=alpha_k(theta_1,...,theta_l)

$α_{k} = α_{k} (θ_{1}, ..., θ_{l})$ ，令

(

)

alpha_k(hat{theta}_1,...,hat{theta}_l)=A_k,quad k=1,...,l

$α_{k} (θ^_{1}, ..., θ^_{l}) = A_{k}, k = 1, ..., l$
解此方程组可得

hat{theta}_1,...,hat{theta}_l

$θ^_{1}, ..., θ^_{l}$ ，并将它们分别作为

theta_1,...,theta_l

$θ_{1}, ..., θ_{l}$ 的估计量。这种求估计量的方法称为矩估计法，用矩估计法求得的估计量称为矩估计量。

例：设总体

$X$ 的二阶矩存在，

X_1,...,X_n

$X_{1}, ..., X_{n}$ 为总体

$X$ 的样本，求总体均值

$μ$ 与总体方差

sigma^2

$σ^{2}$ 的矩估计。

解：因

alpha_1=mu, alpha_2=sigma^2+mu^2

$α_{1} = μ, α_{2} = σ^{2} + μ^{2}$ ，令

{

∑

begin{cases} hat{mu}=A_1=bar{X} \ hat{sigma}^2+hat{mu}^2=A_2=frac{1}{n}sum_{i=1}^n X_i^2 end{cases}

${μ^=A1=Xˉσ^2+μ^2=A2=n1∑i=1nXi2$
解得

$μ$ 与

sigma^2

$σ^{2}$ 的矩估计分别为

hat{mu}=bar{X}

$μ^= X ˉ$

−

hat{sigma}^2=A_2-bar{X}^2=S^2

$σ^^{2} = A_{2} - X ˉ^{2} = S^{2}$

极大似然估计法

以下用

(

)

boldsymbol{X}=(X_1,...,X_n)^T

$X = (X_{1}, ..., X_{n})^{T}$ 表示样本，

(

)

boldsymbol{x}=(x_1,...,x_n)^T

$x = (x_{1}, ..., x_{n})^{T}$ 表示样本点，

(

;

)

f(boldsymbol{x};theta)

$f (x; θ)$ 表示样本分布。

极大似然法的提出是基于如下的想法：

当给定

theta

$θ$ 时，

(

;

)

f(boldsymbol{x};theta)

$f (x; θ)$ 度量样本

boldsymbol{X}

$X$ 在

boldsymbol{x}

$x$ 点发生的可能性。对于样本空间中的两个不同样本点

∈

boldsymbol{x}_1, boldsymbol{x}_2 in mathcal{X}

$x_{1}, x_{2} \in X$ ，如果有

(

;

)

(

;

)

f(boldsymbol{x}_1;theta) > f(boldsymbol{x}_2;theta)

$f (x_{1}; θ) > f (x_{2}; θ)$ ，自然会认为样本

boldsymbol{X}

$X$ 更可能在

boldsymbol{x}_1

$x_{1}$ 点发生。

现在换个角度来看待

(

;

)

f(boldsymbol{x};theta)

$f (x; θ)$ 。当给定样本点

boldsymbol{x}

$x$ 时，对参数空间中的两个不同参数

∈

theta_1,theta_2 in Theta

$θ_{1}, θ_{2} \in Θ$ ，如果有

(

;

)

(

;

)

f(boldsymbol{x};theta_1) > f(boldsymbol{x};theta_2)

$f (x; θ_{1}) > f (x; θ_{2})$ ，那么会认为样本点

boldsymbol{x}

$x$ 更像是来自总体

(

;

)

f(boldsymbol{X};theta_1)

$f (X; θ_{1})$ ，所以，数

(

;

)

f(boldsymbol{x};theta)

$f (x; θ)$ 的大小可作为参数

theta

$θ$ 对产生样本观察值

boldsymbol{x}

$x$ 有多大似然性的一种度量。

当给定样本点

boldsymbol{x}

$x$ 时，称

(

;

)

f(boldsymbol{x};theta)

$f (x; θ)$ 为

theta

$θ$ 的似然函数，记为

(

;

)

L(theta;boldsymbol{x})

$L (θ; x)$ ，即

(

;

)

(

;

)

{

∏

(

;

)

总体

为离散型随机变量

∏

(

;

)

总体

为连续型随机变量

L(theta;boldsymbol{x})=f(boldsymbol{x};theta)=begin{cases} prod_{i=1}^np(x_i;theta), & 总体 X 为离散型随机变量 \ prod_{i=1}^nf(x_i;theta), & 总体 X 为连续型随机变量 end{cases}

$L (θ; x) = f (x; θ) = {\prod_{i = 1 n} p (x_{i}; θ), \prod_{i = 1 n} f (x_{i}; θ), 总体 X 为离散型随机变量总体 X 为连续型随机变量$
而称

⁡

(

;

)

ln f(boldsymbol{x};theta)

$ln f (x; θ)$ 为对数似然函数，记为

⁡

(

;

)

ln L(theta;boldsymbol{x})

$ln L (θ; x)$ 。

若有统计量

≏

(

)

hat{theta}bumpeq hat{theta}(boldsymbol{X})

$θ^≏ θ^(X)$ ，使得

(

)

;

)

sup

⁡

∈

{

(

;

)

}

L(hat{theta}(boldsymbol{x});boldsymbol{x})=sup_{theta in Theta}{L(theta;boldsymbol{x})}

$L(θ^(x);x)=θ∈Θsup{L(θ;x)}$
或等价的，使得

⁡

(

)

;

)

sup

⁡

∈

{

⁡

(

;

)

}

ln L(hat{theta}(boldsymbol{x});boldsymbol{x})=sup_{theta in Theta}{ln L(theta;boldsymbol{x})}

$lnL(θ^(x);x)=θ∈Θsup{lnL(θ;x)}$
则称

(

)

hat{theta}(boldsymbol{X})

$θ^(X)$ 为参数

theta

$θ$ 的极大似然估计量（Maximum Likelihood Estimators, MLE）。

例：设总体

∼

(

)

X sim P(lambda),lambda>0

$X \sim P (λ), λ > 0$ ，试求参数

lambda

$λ$ 的极大似然估计量。

解：

$X$ 的概率函数为

{

}

−

P{X=x}=frac{lambda^x}{x!}e^{-lambda},quad x=0,1,2,...

$P {X = x} = \frac{λ ^{x}}{x !} e^{- λ}, x = 0, 1, 2, ...$
故

lambda

$λ$ 的似然函数为

(

)

∏

(

−

)

−

∑

∏

(

)

L(lambda)=prod_{i=1}^n (frac{lambda^{x_i}}{x_i!}e^{-lambda})=e^{-nlambda}frac{lambda^{sum_{i=1}^nx_i}}{prod_{i=1}^n(x_i!)}

$L (λ) = i = 1 \prod n (\frac{λ ^{x_{i}}}{x _{i} !} e^{- λ}) = e^{- nλ} \frac{λ ^{\sum_{i = 1 n} x_{i}}}{\prod _{i = 1 n} ( x _{i} !)}$
对数似然函数为

⁡

(

)

−

⁡

∑

−

∑

⁡

(

)

ln L(lambda)=-nlambda+ln lambda sum_{i=1}^nx_i-sum_{i=1}^n ln(x_i!)

$ln L (λ) = - nλ + ln λ i = 1 \sum n x_{i} - i = 1 \sum n ln (x_{i}!)$
令

∂

⁡

(

)

∂

−

∑

frac{partial ln L(lambda)}{partial lambda}=-n+frac{1}{lambda}sum_{i=1}^nx_i=0

$\frac{\partial ln L ( λ )}{\partial λ} = - n + \frac{1}{λ} i = 1 \sum n x_{i} = 0$
该似然方程有唯一解

∑

hat{lambda}=frac{1}{n}sum_{i=1}^nx_i=bar{x}

$λ^= \frac{1}{n} \sum_{i = 1 n} x_{i} = x ˉ$ ，又因

∂

⁡

(

)

∂

∣

frac{partial^2 ln L(lambda)}{partial lambda^2}|_{lambda=bar{x}}<0

$\frac{\partial ^{2} ln L ( λ )}{\partial λ ^{2}} ∣_{λ = x ˉ} < 0$
故

lambda

$λ$ 的极大似然估计量为

hat{lambda}=bar{X}

$λ^= X ˉ$ 。

参考文献

[1] 《应用数理统计》，施雨，西安交通大学出版社。

本图文内容来源于网友网络收集整理提供，作为学习参考使用，版权属于原作者。

THE END

数理统计概率论

二维码

.NET8.0 AOT 经验分享 – 专项测试各大 ORM 是否支持

< <上一篇

键鼠自动化2.0树形结构讲解

下一篇>>

搜索内容

参数估计（一）（点估计）

文章目录

点估计和估计量的求法

点估计概念

矩估计法

极大似然估计法

参考文献

最新文章

分类

标签云