前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >算法岗机器学习相关问题整理(无监督算法部分)

算法岗机器学习相关问题整理(无监督算法部分)

作者头像
曲奇
发布2021-12-15 08:22:29
2580
发布2021-12-15 08:22:29
举报
文章被收录于专栏:曲奇的博客曲奇的博客

无监督算法

k means是怎么确定k值的

From https://blog.csdn.net/gxq1221/article/details/81113346 腾讯18年数据挖掘

有三种方法

  1. 数据的先验知识,可视化分析
  2. 基于结构的算法:即比较类内距离、类间距离以确定K。这个也是最常用的办法,如使用平均轮廓系数,越趋近1聚类效果越好
  3. 对训练样本训练分类器,用于预测测试样本类别,并与聚类的类别比较。

参考:

https://www.zhihu.com/question/29208148 知乎问答k值怎么确定

KNN和k-means的区别

KNN是一种memory-based learning,需要带label的数据,实际上是基于统计的。在附近找K个最近的点进行投票。

k-means:选定k值与,根据与初始点的距离不断迭代,重新划定初始点

(a)刚开始时是原始数据,杂乱无章,没有label,看起来都一样,都是绿色的。(b)假设数据集可以分为两类,令K=2,随机在坐标上选两个点,作为两个类的中心点。(c-f)演示了聚类的两种迭代。先划分,把每个数据样本划分到最近的中心点那一簇;划分完后,更新每个簇的中心,即把该簇的所有数据点的坐标加起来去平均值。这样不断进行”划分—更新—划分—更新”,直到每个簇的中心不在移动为止。

参考:

https://www.cnblogs.com/nucdy/p/6349172.html

你都会什么聚类方法

  • K-Means(K 均值)聚类
  • 均值漂移聚类
  • 基于密度的聚类方法
  • 用高斯混合模型(GMM)的最大期望(EM)聚类
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 无监督算法
  • k means是怎么确定k值的
  • KNN和k-means的区别
  • 你都会什么聚类方法
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档