首页 百问百答 帖子详情
svm支持向量机原理
收藏
快速回复
百问百答 问答学习资料 237 0
svm支持向量机原理
收藏
快速回复
百问百答 问答学习资料 237 0

本文将从直觉上理解SVM支持向量机模型

1、决策边界
首先我们看下面的数据,如果我们要画一条直线来区分这两类数据,并且当有新数据加入时,我们根据这条线也能判别它属于哪一类,那么我们要选择红绿蓝中的哪一条线?虽然三条线,将已有的数据都可以区分开,但是对于蓝色线和绿色线,是一种非常冒险的划分方法。例如在接近紫色点的区域有一个也属于紫色类的数据时,这条蓝色边界就很可能出现问题。对于三维空间,我们就是选择一个平面来对数据进行区分。

如果我们有n个特征向量维度为m的样本,那么svm就是选择m-1个超平面来对数据进行类别区分。在上述例子中,从直觉上我们应该选择红色线作为我们的分类边界,因为它与两类数据点之间距离是最大的,也就是分隔的最开的。下图中两条红色虚线之间的距离就是两类数据的间隔,这个间隔越大,我们就越容易进行区分,我们的分界线就选择在这两条虚线之间的中间。

2、升维转换
有些数据,在低维空间中无法用一条直线对其区分。那么我们可以新增一个维度,这样我们就可以在三维超平面中将其区分开来。如下,我们将其升维转换之后就可以用红色平面对其区分。

3、核函数
另一种更常用的方法是使用核函数,例如对于上述例子中,我们可以使用核函数将其转为角度与到原点的距离,那么到原点距离大的就是紫色点,小的就是橙色点。我们就可以使用一条直线将其区分开来,如下右图所示。

0
收藏
回复
在@后输入用户全名并按空格结束,可艾特全站任一用户