码迷,mamicode.com
首页 > 其他好文 > 详细

斯坦福《机器学习》Lesson7感想———1、最优间隔分类器

时间:2015-07-24 20:58:31      阅读:165      评论:0      收藏:0      [点我收藏+]

标签:

    从上一课可知,对于给定的线性可分的数据集,离分隔超平面最近的点是支持向量。而支持向量与分隔超平面间的距离越远,则说明最后算法的预测结果越可信。这课的核心就在于如何确定最佳的分隔超平面,即最优间隔分类器。

首先我们要介绍其中的数学推理,然后介绍最优间隔分类器。

1、凸优化问题

    选取一个函数里的两个点,连接两个点成一条直线,两点间的函数点都在这条直线下即为凸函数,凸函数的例子有指数函数。当一个问题被转化为凸优化问题,说明这个问题可以很好被解决。对于凸优化问题来说,局部最优解就是全局最优解。

给定一个线性可分的数据集,我们将最优化间隔问题表示为:

技术分享

||w||=1代表几何间隔等于函数间隔。这也意味着几何间隔的不小于技术分享。然后解决此问题,即可得到最优间隔。但是这是个非凸优化问题,没法用标准的优化软件来解决。

    根据几何间隔和函数间隔的关系可以将问题优化表达为:

技术分享

然后添加一个w和b的缩放条件技术分享。所以最大化技术分享就相当于最小化技术分享。所以问题最终可以优化表达为凸优化问题。

技术分享

解决这个问题即可得到最优间隔分类器。

 

2、拉格朗日对偶性

2.1拉格朗日算子

解决条件限制的优化问题可以用拉格朗日对偶性。假设一个问题如下表示:

技术分享

所以其拉格朗日算子表示为:

技术分享

分别求导归零可得:

技术分享

由此即可求解出技术分享技术分享

此外我们还可以添加不等式限制条件,这种最优化问题的求解可如下。原问题可表达为:

技术分享

则它的拉格朗日算子为

 技术分享

   假设技术分享,技术分享代表原问题,技术分享已知。

如果技术分享不满足条件即(技术分享或者技术分享),则可以推出

技术分享

如果技术分享满足条件,则技术分享

   所以归纳可得:

技术分享

所以最小化原问题技术分享就是在最小化技术分享。因此可以得到原问题的解技术分享

2.2对偶性和KKT条件

对偶问题的定义可以如下解释。假设原问题的对偶问题为

技术分享

对偶优化问题表示为:

技术分享

这就是和我们的原问题技术分享类似的只是max和min对调了。我们定义对偶优化问题的解为技术分享

因为max min总是不大于min max,所以当min max = max min时,即可知道min max得到了最优解。而什么时候可以让原问题(min max)的解技术分享和其对偶问题(max min)的解技术分享相等呢?

技术分享

只需要满足KKT条件就可以了。

   假定f和所有的g、h都是仿射函数,并且存在一些技术分享使得技术分享,则KKT(Karush-Kuhn-Tucker)条件可按如下表示:

  技术分享

其中是原问题的参数解技术分享,是对偶问题的参数解技术分享。从(5)式中可以看出如果技术分享不等于0,则技术分享等于0。


3、最优间隔分类器

最优间隔分类器可定义为

技术分享

因此设置其限制条件为

技术分享

因此其拉格朗日算子为

技术分享

对其因子技术分享求导得到:

技术分享

求得

技术分享

对其因子b求导可得:

技术分享

 

将(9)式代入(8)式可得

技术分享

再经由(10)式代入得

技术分享

所以对偶优化问题可以表示为:

 技术分享

由对偶优化问题可以求出技术分享,从而可以通过(9)求出技术分享,b的解为

 技术分享

   对于一个新的数据点x,可以通过如下进行预测

技术分享

这样就实现了最优间隔分类器。

 

 

 

版权声明:本文为博主原创文章,未经博主允许不得转载。

斯坦福《机器学习》Lesson7感想———1、最优间隔分类器

标签:

原文地址:http://blog.csdn.net/adeleamily/article/details/47045029

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!