K-NN算法与K-Means算法的原理与区别(附带源码示例)

KNN算法

K-Means算法

目标

确定某个元素所属的分类

将已存在的一系列元素分类

算法类别

监督的分类算法

无监督的聚类算法

数据区别

训练数据中,有明确的标签。 如:一个数据集中有几万张图片,都被打上了“苹果”的标签,另外还有几万张图片,被打上了“香蕉”的标签,数据是完全正确,知道结果的数据

几十万张各种各样水果的图片放一起,杂乱无章。

训练过程

无需训练(或者没有很明显的训练过程),将数据与训练数据直接对比

需要前期训练

K的含义

K指的是相邻数据的数目。 举个例子,假设某张图片相邻的20张图片中,有18张是打着“苹果”标签的数据,有1张是“香蕉”,1张是“樱桃”,那么这张图片的标签也是“苹果”。 那么在这个例子中,K就是20,20张相邻的图片。

K指的是分类的数目,人为设定好分为K个簇。

对比结果

K值不变的情况下,每次结果都是一样的。

K值确定后每次结果可能不同。

本文参与腾讯云自媒体分享计划,欢迎正在阅读的你也加入,一起分享。

发表于

我来说两句

0 条评论
登录 后参与评论

相关文章

来自专栏新智元

【让调参全部自动化】自动机器学习,神经网络自主编程(代码与诀窍)

【新智元导读】自动机器学习(AutoML)是近来很活跃的研究方向。KDnuggets 的主编 Matthew Mayo 写了一篇文章介绍了 AutoML 的概念...

4034
来自专栏人工智能头条

LSTM实现详解

1753
来自专栏AI研习社

使用 RNN 进行情感分析的初学者指南

情感分析可能是最常见的 自然语言处理 的应用之一。我无需去额外强调在客服工具中情感分析的重要性。本文将利用循环神经网络,训练出一个基于 IMDB 数据集的电影评...

672
来自专栏悦思悦读

【文本分析】怎样把文档转换成向量

文本分析 文本分析指从文本中抽取出的特征来量化来表示文本信息,并在此基础上对其进行基于数学模型的处理。它是文本挖掘、信息检索的一个基本问题。 在“大数据”盛行的...

35511
来自专栏企鹅号快讯

Python数据分析与实战挖掘

基础篇 书推荐:《用python做科学计算》 ? 扩展库 简介 Numpy数组支持,以及相应的高效处理函数 Scipy矩阵支持,以及相应的矩阵数值计算模块 Ma...

3245
来自专栏fangyangcoder

使用颜色空间进行图像分割

原文地址:https://realpython.com/python-opencv-color-spaces/

1063
来自专栏人工智能

OpenCV—Node.js教程系列:用Tensorflow和Caffe“做游戏”

AiTechYun 编辑:Yining 今天我们来看看OpenCV的深度神经网络模块。如果你想要释放神经网络的awesomeness来识别和分类图像中的物体,但...

28910
来自专栏灯塔大数据

每周学点大数据 | No.16平面图直径

No.16期 平面图直径 小可:好的,关于图的基本内容我听懂了。 Mr. 王:很好,图能够对很多现实问题进行数学抽象,方便通过计算机的手段进行抽象。而平面图指...

3074
来自专栏大数据风控

评分卡模型开发-定性指标筛选

定量指标是数值型的,我们还可以用回归的方法来筛选,那么定性的指标怎么办呢? R里面给我们提供了非常强大的IV值计算算法,通过引用R里面的informatio...

21810
来自专栏素质云笔记

python︱imagehash中的四种图像哈希方式(phash/ahash/dhash/小波hash)

code来源:https://github.com/JohannesBuchner/imagehash 外文原文:https://fullstackml.c...

6027

扫码关注云+社区