WJX的杂货铺
体胖还需勤锻炼,人丑就要多读书
点进来喝茶聊天,退出去吐槽自便
前言:
如何从海量数据中快速挖掘出有用知识,已成为信息时代一个十分紧迫而富有挑战的研究课题。用数据管理系统存储数据,用机器学习的方法分析数据、挖掘海量数据背后的知识,便促成了数据挖掘的产生,即如何从大量数据中提取或挖掘知识。
聚类是数据挖掘中发现数据分布和隐含模式的重要技术。聚类的目的是把数据集合分成若干类(或簇),使得每个类中的数据之间最大限度地相似,而不同类中的数据最大程度地不同。随着高速发展的计算机技术,数据类型变得越来越复杂,聚类在数据挖掘中成为一项非常重要的工作。在众多的聚类技术中,利用支持向量机来聚类是一种在支持向量数据描述的基础上发展起来的聚类方法,它可以产生任意形状的簇边界,可以通过调整惩罚因子来处理异常点,可以分离相互交叠的簇,因此被广泛应用于实际问题当中。
由于支持向量机的潜在应用价值,国内外学者在理论上对其进行深入研究,取得了很多突破性进展,许多改进的和新型的支持向量机算法以及关于支持向量机中核方法的研究都相继产生。对于给定的训练集,SVM 的性能主要受模型参数的影响。 Chapelle 和 Vapnik指出:学习算法决定于参数,参数控制着假设空间的规模以及假设空间的搜索方式。Cherkassky认为:支持向量机模型的性能依赖于参数的设置,如何选择参数是应用支持向量机的主要问题。
本文是作者大三时的大创课题综述,通过考虑不同性质参数对支持向量机聚类性能的影响,分别建立以核参数和惩罚参数为变量的优化问题,用合适的算法求解优化问题以确定支持向量机参数的最优值或较优值。
喜欢哒可以点个啊赞啊~\(≧▽≦)/~
好东西要记得分享啊
首页可查看以往推送哦!
领取专属 10元无门槛券
私享最新 技术干货