Skip to content
Mo's Blog
Go back

《统计学习方法》学习笔记4:朴素贝叶斯法

机器学习
  1. 朴素贝叶斯方法是基于贝叶斯定律的方法。它做出了条件独立这个强条件假设,在损失一定分类准确性的情况下使算法可行。

  2. 推导过程使用贝叶斯定理,最终的结果为:

    y=argmaxckP(Y=ck)jP(X(j)=x(j)Y=ck)y = \arg\max_{c_k} P(Y = c_k) \prod_{j} P(X^{(j)} = x^{(j)} \mid Y = c_k)
  3. 朴素贝叶斯实际上是让后验概率最大化。这等价于期望风险最小化。

  4. 计算朴素贝叶斯参数的方法是极大似然估计。

  5. 考虑出现概率 0 的情况,这会影响极大似然估计的结果。解决这一问题的方法是采用贝叶斯估计。条件概率的贝叶斯估计是:

    Pλ(X(j)=ajlY=ck)=i=1NI(xi(j)=ajl,yi=ck)+λi=1NI(yi=ck)+SjλP_\lambda(X^{(j)} = a_{jl} \mid Y = c_k) = \frac{\sum_{i=1}^{N} I(x_i^{(j)} = a_{jl}, y_i = c_k) + \lambda}{\sum_{i=1}^{N} I(y_i = c_k) + S_j \lambda}

    式中 λ0\lambda \geq 0。当 λ=0\lambda = 0 时就是极大似然估计。常取 λ=1\lambda = 1,这时称为拉普拉斯平滑(Laplace smoothing)。

  6. 先验概率的贝叶斯估计是:

    Pλ(Y=ck)=i=1NI(yi=ck)+λN+KλP_\lambda(Y = c_k) = \frac{\sum_{i=1}^{N} I(y_i = c_k) + \lambda}{N + K\lambda}

Share this post on:

Previous Post
《统计学习方法》读书笔记5:决策树
Next Post
《统计学习方法》学习笔记3:k近邻法