活动地址:CSDN21天学习挑战赛
1 简介
支持向量机也是一种二分类模型,它是通过在特征空间中建立间隔最大的分类器,这是有别于感知机模型的一点。
支持向量机可分为线性可分支持向量机、线性支持向量机、非线性支持向量机。
2 函数间隔、几何间隔
2.1 函数间隔
若超平面方程为
,样本点为
,此时函数间隔为![\large \hat{\gamma _i}=y_i(w\cdot x+b)](https://latex.csdn.net/eq?%5Clarge%20%5Chat%7B%5Cgamma%20_i%7D%3Dy_i%28w%5Ccdot%20x+b%29)
二分类问题,y取值1,-1,即![\large w\cdot x+b> 0,y=1,w\cdot x+b<0,y=-1;](https://latex.csdn.net/eq?%5Clarge%20w%5Ccdot%20x+b%3E%200%2Cy%3D1%2Cw%5Ccdot%20x+b%3C0%2Cy%3D-1%3B)
![](https://img-blog.csdnimg.cn/cf4d14c879934ae19cc616942016e272.png)
函数间隔表示该样本点分类的确信度,因为当y=1,
越大,距离超平面越远,越不会分错,当y=-1是亦然。
2.2几何间隔
几何间隔为
,很类似于二维空间点到直线的距离公式的形式,不过乘了
,
同号时分类正确。
3 线性可分支持向量机
目的是找到一个能正确划分数据集、几何间隔最大的超平面。仅仅满足能将数据分类正确地超平面可能有很多,但是不一定最优的,因为其他数据继续划分时,这个超平面很可有失效。所以核心思想是先找到最小的几何间隔
,并将其最大化。(我的理解是木桶效应,当短板补上了,其他地方肯定慢问题,所以最初要先找几何间隔最小的超平面)
现在要处理的优化问题为:
![\large \max_{w,b} \gamma](https://latex.csdn.net/eq?%5Clarge%20%5Cmax_%7Bw%2Cb%7D%20%5Cgamma)
![\large s.t. \qquad \qquad y_i(\frac{w^T}{||w||}x_i+\frac{b}{||w||})\geq \gamma \qquad i=1,2,...,N](https://latex.csdn.net/eq?%5Clarge%20s.t.%20%5Cqquad%20%5Cqquad%20y_i%28%5Cfrac%7Bw%5ET%7D%7B%7C%7Cw%7C%7C%7Dx_i+%5Cfrac%7Bb%7D%7B%7C%7Cw%7C%7C%7D%29%5Cgeq%20%5Cgamma%20%5Cqquad%20i%3D1%2C2%2C...%2CN)
先用函数间隔表示上边的优化问题:
![\small \large \max_{w,b}\frac{\hat{\gamma}}{||w||}](https://latex.csdn.net/eq?%5Csmall%20%5Clarge%20%5Cmax_%7Bw%2Cb%7D%5Cfrac%7B%5Chat%7B%5Cgamma%7D%7D%7B%7C%7Cw%7C%7C%7D)
![\large s.t. \qquad \qquad y_i(w^Tx_i+bw) \geq \hat{\gamma} \qquad i=1,2,...,N](https://latex.csdn.net/eq?%5Clarge%20s.t.%20%5Cqquad%20%5Cqquad%20y_i%28w%5ETx_i+bw%29%20%5Cgeq%20%5Chat%7B%5Cgamma%7D%20%5Cqquad%20i%3D1%2C2%2C...%2CN)
以下有助于简化问题的求解;
到此就得出了线性可分支持向量机算法——最大间隔算法
线性可分支持向量机算法——最大间隔算法
输入:数据集
,
;
输出:最大间隔分离超平面、分类决策函数。
最优化问题:
![\min_{w,b} \quad \frac{1}{2}||w||^2 \\ s.t.\quad y_i(w \cdot x_i+b)-1 \geq 0,i=1,2...,N](https://latex.csdn.net/eq?%5Cmin_%7Bw%2Cb%7D%20%5Cquad%20%5Cfrac%7B1%7D%7B2%7D%7C%7Cw%7C%7C%5E2%20%5C%5C%20s.t.%5Cquad%20y_i%28w%20%5Ccdot%20x_i+b%29-1%20%5Cgeq%200%2Ci%3D1%2C2...%2CN)
求出最优解
,则分离超平面为
,分类决策函数为![f(x)=sign(w^* \cdot x+b^*)](https://latex.csdn.net/eq?f%28x%29%3Dsign%28w%5E*%20%5Ccdot%20x+b%5E*%29)
支持向量是与分离超平面最近的样本点,是使约束条件中不等式取等号的向量,支持向量决定着分类超平面,所以该模型叫做支持向量机。
参考
【十分钟 机器学习 系列课程】讲义(41):SVM支持向量机-逻辑回归与支持向量机