资源预览内容
第1页 / 共38页
第2页 / 共38页
第3页 / 共38页
第4页 / 共38页
第5页 / 共38页
第6页 / 共38页
第7页 / 共38页
第8页 / 共38页
第9页 / 共38页
第10页 / 共38页
亲,该文档总共38页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述
支持向量机( support vector machine,SVM) Wang Jimin Nov 18, 2005 信息科学技术学院信息科学技术学院 网络研究所网络研究所OutlineoSVM的理论基础o线性判别函数和判别面o最优分类面o支持向量机oSVM的研究与应用信息科学技术学院信息科学技术学院 网络研究所网络研究所SVM的理论基础o传统的统计模式识别方法只有在样本趋向无穷大 时,其性能才有理论的保证。统计学习理论(STL )研究有限样本情况下的机器学习问题。SVM的 理论基础就是统计学习理论。o传统的统计模式识别方法在进行机器学习时,强 调经验风险最小化。而单纯的经验风险最小化会 产生“过学习问题”,其推广能力较差。o推广能力是指: 将学习机器(即预测函数,或称学 习函数、学习模型)对未来输出进行正确预测的能 力。信息科学技术学院信息科学技术学院 网络研究所网络研究所过学习问题o“过学习问题”:某些情况下,当训练误差 过小反而会导致推广能力的下降。o例如:对一组训练样本(x,y),x分布在实数 范围内,y取值在0,1之间。无论这些样 本是由什么模型产生的,我们总可以用 y=sin(w*x)去拟合,使得训练误差为0.信息科学技术学院信息科学技术学院 网络研究所网络研究所SVMo根据统计学习理论,学习机器的实际风险由经验风 险值和置信范围值两部分组成。而基于经验风险最 小化准则的学习方法只强调了训练样本的经验风险 最小误差,没有最小化置信范围值,因此其推广能 力较差。oVapnik 提出的支持向量机(Support Vector Machine, SVM)以训练误差作为优化问题的约束条 件,以置信范围值最小化作为优化目标,即SVM是 一种基于结构风险最小化准则的学习方法,其推广 能力明显优于一些传统的学习方法。o形成时期在19921995年。 信息科学技术学院信息科学技术学院 网络研究所网络研究所SVMo由于SVM 的求解最后转化成二次规划问题的求 解,因此SVM 的解是全局唯一的最优解oSVM在解决小样本、非线性及高维模式识别问题 中表现出许多特有的优势,并能够推广应用到函 数拟合等其他机器学习问题中oJoachims 最近采用SVM在Reuters-21578来进行 文本分类,并声称它比当前发表的其他方法都好信息科学技术学院信息科学技术学院 网络研究所网络研究所OutlineoSVM的理论基础o线性判别函数和判别面o最优分类面o支持向量机oSVM的研究与应用信息科学技术学院信息科学技术学院 网络研究所网络研究所线性判别函数和判别面o一个线性判别函数(discriminant function)是 指由x的各个分量的线性组合而成的函数 o两类情况:对于两类问题的决策规则为o如果g(x)0,则判定x属于C1,o如果g(x)0;当x 点在超平面的负侧时,g(x)0,则判定x属于C1,如果 g(x)0,则判定x属于C2,如果g(x)=0,则可以将x任 意分到某一类或者拒绝判定。 信息科学技术学院信息科学技术学院 网络研究所网络研究所广义线性判别函数信息科学技术学院信息科学技术学院 网络研究所网络研究所广义线性判别函数信息科学技术学院信息科学技术学院 网络研究所网络研究所设计线性分类器 信息科学技术学院信息科学技术学院 网络研究所网络研究所Fisher线性判别方法o如:Fisher线性判别方法,主 要解决把d维空间的样本投影 到一条直线上,形成一维空间 ,即把维数压缩到一维。o然而在d维空间分得很好的样 本投影到一维空间后,可能混 到一起而无法分割。o但一般情况下总可以找到某个 方向,使得在该方向的直线上 ,样本的投影能分开的最好。o目的是降维,在低维空间中分割信息科学技术学院信息科学技术学院 网络研究所网络研究所OutlineoSVM的理论基础o线性判别函数和判别面o最优分类面o支持向量机oSVM的研究与应用信息科学技术学院信息科学技术学院 网络研究所网络研究所最优分类面 oSVM 是从线性可分情况下的最优分类面发展而来 的, 基本思想可用图2的两维情况说明. 图中, 方形点和圆形点代表两类样 本, H 为分类线,H1, H2分别为过 各类中离分类线最近的样本且平行 于分类线的直线, 它们之间的距离 叫做分类间隔(margin)。所谓最优分类线就是要求分类线不 但能将两类正确分开(训练错误率 为0),而且使分类间隔最大.推广到高维空间,最优分类线就变 为最优分类面。 信息科学技术学院信息科学技术学院 网络研究所网络研究所最优分类面信息科学技术学院信息科学技术学院 网络研究所网络研究所如何求最优分类面 信息科学技术学院信息科学技术学院 网络研究所网络研究所最优分类面信息科学技术学院信息科学技术学院 网络研究所网络研究所OutlineoSVM的理论基础o线性判别函数和判别面o最优分类面o支持向量机oSVM的研究与应用信息科学技术学院信息科学技术学院 网络研究所网络研究所支持向量机 上节所得到的最优分类函数为:o该式只包含待分类样本与训练样本中的支持向量的内 积 运算,可见,要解决一个特征空间中的最优线性分 类问题,我们只需要知道这个空间中的内积运算即可。o 对非线性问题, 可以通过非线性变换转化为某个高 维空间中的线性问题, 在变换空间求最优分类面. 这 种变换可能比较复杂, 因此这种思路在一般情况下不 易实现.信息科学技术学院信息科学技术学院 网络研究所网络研究所支持向量机信息科学技术学院信息科学技术学院 网络研究所网络研究所核函数的选择信息科学技术学院信息科学技术学院 网络研究所网络研究所SVM方法的特点o 非线性映射是SVM方法的理论基础,SVM利用内积 核函数代替向高维空间的非线性映射;o 对特征空间划分的最优超平面是SVM的目标,最大 化分类边际的思想是SVM方法的核心;o 支持向量是SVM的训练结果,在SVM分类决策中起 决定作用的是支持向量。o SVM 是一种有坚实理论基础的新颖的小样本学习方法。它 基本上不涉及概率测度及大数定律等,因此不同于现有的统 计方法。从本质上看,它避开了从归纳到演绎的传统过程,实 现了高效的从训练样本到预报样本的“转导推理 ”(transductive inference) ,大大简化了通常的分类和回 归等问题。信息科学技术学院信息科学技术学院 网络研究所网络研究所SVM方法的特点oSVM 的最终决策函数只由少数的支持向量所确定,计 算的复杂性取决于支持向量的数目,而不是样本空间 的维数,这在某种意义上避免了“维数灾难”。o 少数支持向量决定了最终结果,这不但可以帮助我 们抓住关键样本、“剔除”大量冗余样本,而且注定 了该方法不但算法简单,而且具有较好的“鲁棒”性 。这种“鲁棒”性主要体现在:n 增、删非支持向量样本对模型没有影响; n 支持向量样本集具有一定的鲁棒性; n 有些成功的应用中,SVM 方法对核的选取不敏感。信息科学技术学院信息科学技术学院 网络研究所网络研究所OutlineoSVM的理论基础o线性判别函数和判别面o最优分类面o支持向量机oSVM的研究与应用信息科学技术学院信息科学技术学院 网络研究所网络研究所SVM 应用o近年来SVM 方法已经在图像识别、信号处 理和基因图谱识别等方面得到了成功的应 用,显示了它的优势。oSVM 通过核函数实现到高维空间的非线性 映射,所以适合于解决本质上非线性的分 类、回归和密度函数估计等问题。o支持向量方法也为样本分析、因子筛选、 信息压缩、知识挖掘和数据修复等提供了 新工具。 信息科学技术学院信息科学技术学院 网络研究所网络研究所支持向量机的研究o对支持向量机的研究主要集中在对SVM本身性质的 研究以及加大支持向量机应用研究的深度和广度两 方面。oSVM训练算法 n 传统 的利用标准二次型优化技术解决对偶问题 的方法,是SVM训练 算法慢及受到训练样 本集规模制约的主要原因。 n 目前已提出了许多解决方法和改进算法,主要是从如何处理大规模 样本集的训练问题 、提高训练 算法收敛速度等方面改进。 n 主要有:分解方法、修改优化问题 法、增量学习法、几何方法等 分别讨论 。 信息科学技术学院信息科学技术学院 网络研究所网络研究所SVM分类算法oSVM分类算法o训练好SVM分类器后,得到的支持向量被用来构 成决策分类面。对于大规模样本集问题,SVM训 练得到的支持向量数目很大,则进行分类决策时 的计算代价就是一个值得考虑的问题。o解决方法如:缩减集(Reduced Set) SVM方法, 采用缩减集代替支持向量集,缩减集中的向量不 是支持向量,数目比支持向量少,但它们在分类 决策函数中的形式与支持向量相同。 信息科学技术学院信息科学技术学院 网络研究所网络研究所多类SVM算法oSVM本质上是两类分类器.o常用的SVM多值分类器构造方法有: 信息科学技术学院信息科学技术学院 网络研究所网络研究所SVM package 信息科学技术学院信息科学技术学院 网络研究所网络研究所OutlineoSVM的理论基础o线性判别函数和判别面o最优分类面o支持向量机oSVM的研究与应用信息科学技术学院信息科学技术学院 网络研究所网络研究所Thank you!
收藏 下载该资源
网站客服QQ:2055934822
金锄头文库版权所有
经营许可证:蜀ICP备13022795号 | 川公网安备 51140202000112号