Skip to content
Mo's Blog
Go back

《统计学习方法》读书笔记2:感知机

机器学习
  1. 感知机(perceptron)的输入空间是 XRn\mathcal{X} \subseteq \mathbb{R}^n,输出空间是 Y={+1,1}\mathcal{Y} = \{+1, -1\},输入空间到输出空间的函数是:

    f(x)=sign(wx+b)f(x) = \mathrm{sign}(w \cdot x + b)

    其中,sign\mathrm{sign} 是符号函数:

    sign(x)={+1,x01,x<0\mathrm{sign}(x) = \begin{cases} +1, & x \geq 0 \\ -1, & x < 0 \end{cases}
  2. 如果存在一个超平面可以将数据的正类负类分开,那么数据被称为线性可分的。

  3. 感知机只能处理线性可分的数据。

  4. 感知机的损失函数,是所有错误分类的点到超平面的距离之和:

    1wxiMyi(wxi+b)-\frac{1}{\|w\|} \sum_{x_i \in M} y_i (w \cdot x_i + b)

    因为 1w\frac{1}{\|w\|} 是常数,所以可以忽略掉它得到最终的损失函数:

    L(w,b)=xiMyi(wxi+b)L(w, b) = -\sum_{x_i \in M} y_i (w \cdot x_i + b)

    使用此函数而不是误分类数作为代价函数的好处是,这个函数可导,便于计算。

  5. 感知机学习算法的原始形式:

    1. 选取初值 w0,b0w_0, b_0

    2. 在训练集中选取数据 (xi,yi)(x_i, y_i)

    3. 如果 yi(wxi+b)0y_i (w \cdot x_i + b) \leq 0

      ww+ηyixiw \leftarrow w + \eta y_i x_i bb+ηyib \leftarrow b + \eta y_i
    4. 转至 2,直至训练集中没有误分类点。

  6. 可以证明,算法是收敛的,也就是经过有限次迭代,一定能将线性可分的数据完全正确分类。但是解唯一。证明方法留待以后看。

  7. 感知机存在一个对偶解法,使用对偶解法的原因可以查看这个知乎帖子

  8. 感知机模型的对偶解法还需要仔细理解,以后补充。


Share this post on:

Previous Post
《统计学习方法》学习笔记3:k近邻法
Next Post
《统计学习方法》读书笔记1:概论