首页
学习
活动
专区
工具
TVP
发布
技术百科首页 >数据挖掘 >数据挖掘中的分类和聚类有什么区别?

数据挖掘中的分类和聚类有什么区别?

词条归属:数据挖掘

分类和聚类都是数据挖掘中常用的分析方法,它们之间存在以下几个区别:

目的不同

分类的目的是将数据集中的对象分为已知的预定义类别,例如识别垃圾邮件、分类客户等;而聚类的目的是将数据集中的对象归为相似的类别,不需要预定义类别。

数据标签不同

分类需要有标签的数据集进行训练,以便分类器可以学习到样本的特征和标签之间的关系;而聚类不需要标签数据,只需要计算样本之间的相似度或距离,以便将样本归为同一类别。

算法不同

分类采用的是有监督学习的方法,例如决策树、支持向量机、朴素贝叶斯等;而聚类采用的是无监督学习的方法,例如k均值、层次聚类、DBSCAN等。

结果不同

分类的结果是将数据对象分为不同的类别,每个类别具有明确的标签;而聚类的结果是将数据对象分为相似的类别,每个类别没有明确的标签,需要进行人工解释和命名。

相关文章
数据挖掘分类、聚类算法学习摘要
一、有关数据挖掘 1.1 数据挖掘相关概念与定义 数据挖掘有广义和狭义之分。广义的数据挖掘,指从大量的数据中发现隐藏的、内在的和有用的知识或信息的过程。狭义的数据挖掘,是指知识发现中的一个关键步骤,是一个抽取有用模式或建立模型的重要环节。 知识发现:知识发现是识别出存在于数据库中有效的、新颖的、具有潜在价值的乃至最终颗粒剂的模式的非平凡过程。 两者之间的关系:知识发现是从数据库中发现知识的全部过程,而数据挖掘则是此全部过程的一个特定的关键步骤。 数据发掘的对象不应只局限于数据库,在现实看来,数据仓库是其最新
小莹莹
2018-04-23
1.3K0
【数据挖掘】数据挖掘总结 ( K-Means 聚类算法 | 一维数据的 K-Means 聚类 ) ★
个聚类分组选择初始的中心点 , 这些中心点称为 Means ; 可以依据经验 , 也可以随意选择 ;
韩曙亮
2023-03-28
8340
【数据挖掘】数据挖掘总结 ( K-Means 聚类算法 | 二维数据的 K-Means 聚类 ) ★
个聚类分组选择初始的中心点 , 这些中心点称为 Means ; 可以依据经验 , 也可以随意选择 ;
韩曙亮
2023-03-28
8150
学界 | 从文本挖掘综述分类、聚类和信息提取等算法
选自arXiv 机器之心编译 参与:机器之心编辑部 文本挖掘一直是十分重要的信息处理领域,因为不论是推荐系统、搜索系统还是其它广泛性应用,我们都需要借助文本挖掘的力量。本文先简述文本挖掘包括 NLP、
机器之心
2018-05-09
2.4K0
浅谈机器学习-分类和聚类的区别
        机器学习中有两类的大问题,一个是分类,一个是聚类。在我们的生活中,我们常常没有过多的去区分这两个概念,觉得聚类就是分类,分类也差不多就是聚类,下面,我们就具体来研究下分类与聚类之间在数据挖掘中本质的区别。
Flaneur
2020-03-25
2.6K0
点击加载更多
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
领券