前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >谱聚类

谱聚类

作者头像
AIHGF
发布2019-02-18 11:00:03
6100
发布2019-02-18 11:00:03
举报
文章被收录于专栏:AIUAI

对于一组模式{x1x2, …, xn},谱聚类:

基于无向加权图G=(V,E),其中每个顶点vi对应一个xi,顶点vivj间的边有权值wij≥0

聚类问题就是要求G的连通子图

顶点vi的度为 di=wij求和

相应的,定义邻接矩阵W和度矩阵D(对角阵)

邻接矩阵W可根据模式间的相似度s(xi, xj)获得

无向图G=(V,E)的拉普拉斯矩阵(Laplacianmatrix) L=D-W

拉普拉斯矩阵有以下特性

–对任意n维向量f,有 f(T)Lf=1/2*[对其求和:wij*(fi-fj)平方]

L为半正定矩阵

L存在0特征值,且对应的特征向量所有元素均为1

理想情况下,若G能被分为若干个互不联通的连通子图,则可获得“完美”的聚类结果。

在上述情况下,L的0特征值个数即为类别数,且对于第k个0特征值,对应的特征向量e满足

1) ei=1,if xi属于Cluster i

2) ei=0,otherwise

尽管完美的聚类往往难以实现,我们仍可认为:

若L的某些特征向量对应的特征值较小,则该特征

向量给出了对聚类有用的信息

算法流程:

定义相似性度量s并计算相似性矩阵,设定聚类的类别数k

根据相似性矩阵S计算邻接矩阵W

计算拉普拉斯矩阵L

计算L的k个最小特征值对应的特征向量e1,…, ek

基于所求得的特征向量,定义一个k维空间,模式xi在该空间中表示为[e1i,…, eki]

利用任意现有的聚类算法,如k-means,在新空间中进行聚类。

谱聚类的本质实际就是先将模式隐射到一个新的空间,再以传统方式聚类

使用谱聚类须首先回答的一些问题:

给定相似度矩阵S,怎样获得邻接矩阵W?

s(xi, xj)小于某一阈值,令wij= s(xi, xj),否则为0

当xi, xj互为对方的k近邻时,令wij= s(xi, xj)

直接令wij= s(xi, xj),这时G成为一个全连通图

如何确定类别数目?

将所有特征值由小到大排序,若第k个特征值与第k+1个特征值差别较大,则取k为类别数

对于L,要计算对应k个最小特征值的特征向量,并不需要做完全的特征值分解,可以用一些经典的迭代法,比如Krylovsubspace方法

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2014年03月11日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档