一道有关极大似然估计和贝叶斯估计的题目

2020 年 02 月 29 日

14914 次浏览

4 条评论

3582字数

数学

一道有关极大似然估计和贝叶斯估计的题目

本文地址：blog.lucien.ink/archives/500

0. 题目

数据 $x_1, \dots, x_n$ 来自正态分布 $N(\mu, \sigma ^ 2)$，其中 $\sigma ^ 2$ 已知。

根据样本 $x_1, \dots, x_n$ 写出 $\mu$ 的极大似然估计。
假设 $\mu$ 的先验分布是正态分布 $N(0, \tau ^ 2)$，根据样本 $x_1, \dots, x_n$ 写出 $\mu$ 的贝叶斯估计。

1. 极大似然估计

正态分布概率密度函数为 ${ f(x) = { \frac { 1 }{ \sigma { \sqrt { 2 \pi } } } } e ^{ - { \frac {( x - \mu )^{ 2 } }{ 2 \sigma^{ 2 } } } } }$，则

$$L(\mu) = \prod \limits_{ i = 1 }^{ n } f(x_i) = (\frac { 1 }{ \sigma \sqrt { 2 \pi } }) ^ n \cdot e ^ { - \frac { 1 }{ 2 \sigma ^ 2 }\sum \limits_{ i = 1 }^{ n } (x_i - \mu) ^ 2 } \propto - \frac { 1 }{ 2 \sigma ^ 2 }\sum \limits_{ i = 1 }^{ n } (x_i - \mu) ^ 2$$

则有 $$\frac{ \partial [- \frac { 1 }{ 2 \sigma ^ 2 }\sum \limits_{ i = 1 }^{ n } (x_i - \mu) ^ 2] }{ \partial \mu } = \frac { 1 }{ 2 \sigma ^ 2 }\sum \limits_{ i = 1 }^{ n } 2 \cdot (x_i - \mu) = \frac { 1 }{ \sigma ^ 2 } \sum \limits_{ i = 1 }^{ n } (x_i - \mu)$$

令 $$\frac { 1 }{ \sigma ^ 2 } \sum \limits_{ i = 1 }^{ n } (x_i - \mu) = 0$$

得 $$\widehat \mu = \frac { \sum \limits_{ i = 1 }^{ n } x_i }{ n } = \bar x$$

2. 贝叶斯估计

大佬说这一问严格来讲是求最大后验概率估计

$$P(\mu) = { \frac { 1 }{ \tau { \sqrt { 2 \pi } } } } e^{ - { \frac { \mu ^ 2 }{ 2 \tau ^ 2 } } }$$

$$P(\mu | x_1, \dots, x_n) = \frac{ P(\mu) \cdot P( x_1, \dots, x_n | \mu) }{ P(x_1, \dots, x_n) } = \frac{ P(\mu) \cdot \prod \limits_{ i = 1 }^{ n } P(x_i | \mu) }{ \int P(\mu, x_1, \dots, x_n) \mathrm{ d } \mu }$$$$\propto P(\mu) \cdot \prod \limits_{ i = 1 }^{ n } P(x_i | \mu) = { \frac { 1 }{ \tau { \sqrt { 2 \pi } } } } \cdot e ^{ - { \frac { \mu ^ 2 }{ 2 \tau ^ 2 } } } \cdot (\frac { 1 }{ \sigma \sqrt { 2 \pi } }) ^ n \cdot e ^ { - \frac { 1 }{ 2 \sigma ^ 2 }\sum \limits_{ i = 1 }^{ n } (x_i - \mu) ^ 2 }$$

取对数得 $$\ln({ \frac { 1 }{ \tau { \sqrt { 2 \pi } } } } \cdot e ^{ - { \frac { \mu ^ 2 }{ 2 \tau ^ 2 } } } \cdot (\frac { 1 }{ \sigma \sqrt { 2 \pi } }) ^ n \cdot e ^ { - \frac { 1 }{ 2 \sigma ^ 2 }\sum \limits_{ i = 1 }^{ n } (x_i - \mu) ^ 2 })$$$$ = \ln{ \frac { 1 }{ \tau { \sqrt { 2 \pi } } } } - { \frac { \mu ^ 2 }{ 2 \tau ^ 2 } } + n \cdot \ln \frac { 1 }{ \sigma \sqrt { 2 \pi } } - \frac { 1 }{ 2 \sigma ^ 2 }\sum \limits_{ i = 1 }^{ n } (x_i - \mu) ^ 2$$$$\propto - { \frac { \mu ^ 2 }{ 2 \tau ^ 2 } } - \frac { 1 }{ 2 \sigma ^ 2 }\sum \limits_{ i = 1 }^{ n } (x_i - \mu) ^ 2$$

则有 $$\frac { \partial [- { \frac { \mu ^ 2 }{ 2 \tau ^ 2 } } - \frac { 1 }{ 2 \sigma ^ 2 }\sum \limits_{ i = 1 }^{ n } (x_i - \mu) ^ 2 ] }{ \partial \mu } = - { \frac { \mu }{ \tau ^ 2 } } + \frac { 1 }{ \sigma ^ 2 }\sum \limits_{ i = 1 }^{ n } (x_i - \mu)$$

令 $$- { \frac { \mu }{ \tau ^ 2 } } + \frac { 1 }{ \sigma ^ 2 }\sum \limits_{ i = 1 }^{ n } (x_i - \mu) = 0$$

则有 $$\frac { 1 }{ \sigma ^ 2 }\sum \limits_{ i = 1 }^{ n } x_i - \frac { n }{ \sigma ^ 2 } \mu = \frac { \mu }{ \tau ^ 2}$$$$\Rightarrow \frac { 1 }{ \sigma ^ 2 }\sum \limits_{ i = 1 }^{ n } x_i = (\frac { 1 }{ \tau ^ 2} + \frac { n }{ \sigma ^ 2 }) \cdot \mu = \frac { \sigma ^ 2 + n \tau ^ 2 }{ \tau ^ 2 \sigma ^ 2 } \mu$$

得 $$\widehat \mu = \frac{ \tau ^ 2 \sum \limits_{ i = 1 }^{ n } x_i }{ \sigma ^ 2 + n \tau ^ 2 } = \frac{ \sum \limits_{ i = 1 }^{ n } x_i }{ \frac{ \sigma ^ 2 }{ \tau ^ 2 } + n }$$

3. 疑问与解答

3.1 $\mu$ 是个参数，为什么会有分布函数

考虑这样一种情况，总共有 $1000$ 个随机数字，每次有放回从中抽出 $10$ 个数字，抽 $100$ 次，就有 $100$ 个 $\mu$，这些 $\mu$ 服从同一种且拥有相同参数的分布。

3.2 如何理解 $P(x_1, \cdots, x_n | \mu)$ 和 $P(\mu | x_1, \cdots, x_n)$ 里 $\mu$ 所表达的含义

$\mu$ 取某个值发生的概率。

一道有关极大似然估计和贝叶斯估计的题目

Lucien • 2020 年 02 月 29 日

发表评论取消回复

评论 *

私密评论

名称 *

🎲

邮箱 *

地址

毛哥哥
April 20th, 2020 at 05:08 pm

水哥哥屌啊。

回复
小同学新新
March 7th, 2020 at 01:51 am

水，你的题目里面提到 $\sigma^{2}$ 是已知的，但是 $\mu$ 不是啊。极大似然估计本质是点估计的一种，你是去构造一个统计量 $\widehat{\mu}$ ，来作为参数 $\mu$ 真值的估计。然后按照高等数学中的条件极值（Lagrange 乘数法）来构造的分布函数 $L$ ，个人认为，这里的 $L$ 并不是参数 $\mu$ 的分布。

回复
小同学新新
March 7th, 2020 at 01:49 am

水，你的题目里面提到 $$\sigma^{2}$$ 是已知的，但是 $$\mu$$ 不是啊。极大似然估计本质是点估计的一种，你是去构造一个统计量 $$\widehat{\mu}$$ ，来作为参数 $$\mu$$ 真值的估计。然后按照高等数学中的条件极值（Lagrange 乘数法）来构造的分布函数 $$L$$ ，个人认为，这里的 $$L$$ 并不是参数 $$\mu$$ 的分布。

回复
小同学新新
March 7th, 2020 at 01:46 am

水，你的题目里面提到 \sigma^{2} 是已知的，但是 \mu 不是啊。极大似然估计本质是点估计的一种，你是去构造一个统计量 \widehat{\mu} ，来作为参数 \mu 真值的估计。然后按照高等数学中的条件极值（Lagrange 乘数法）来构造的分布函数L，个人认为，这里的 L 并不是参数 \mu 的分布。

回复

Red
感谢，搞好了！
flipped895
忘了从哪个友链点进来的,看到你也喜欢南京市民还是acm大佬果断...
jiyouzhan
这篇文章写得深入浅出，让我这个小白也看懂了！
潜心学习的匿名人士
该评论仅登录用户及评论双方可见
煎饼来一套
可以改一下吗？比如连续几次不健康才重启，避免随机干扰

一道有关极大似然估计和贝叶斯估计的题目

一道有关极大似然估计和贝叶斯估计的题目

0. 题目

1. 极大似然估计

2. 贝叶斯估计

3. 疑问与解答

3.1 $\mu$ 是个参数，为什么会有分布函数

3.2 如何理解 $P(x_1, \cdots, x_n | \mu)$ 和 $P(\mu | x_1, \cdots, x_n)$ 里 $\mu$ 所表达的含义

发表评论取消回复

4 条评论

Codeforces-989C - A Mist of Florescence - 思维

让网站永久拥有HTTPS - 申请免费SSL证书并自动续期

Linux下SSR客户端的配置与开机自启

使用 vlmcsd 搭建微软 KMS 激活服务器

OpenWrt 安装 OpenClash

Codeforces 1082E - Increasing Frequency - 动态规划

关于本校的OJ

WSL2 安装、配置 Cuda、pytorch 记录

UPC-4979 - Amsterdam Distance - 思维

Python3 flags

一道有关极大似然估计和贝叶斯估计的题目

一道有关极大似然估计和贝叶斯估计的题目

0. 题目

1. 极大似然估计

2. 贝叶斯估计

3. 疑问与解答

3.1 $\mu$ 是个参数，为什么会有分布函数

3.2 如何理解 $P(x_1, \cdots, x_n | \mu)$ 和 $P(\mu | x_1, \cdots, x_n)$ 里 $\mu$ 所表达的含义

发表评论 取消回复

4 条评论

一道有关极大似然估计和贝叶斯估计的题目

发表评论取消回复