前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >kmeans算法初步

kmeans算法初步

作者头像
程裕强
发布2019-07-02 10:42:31
3950
发布2019-07-02 10:42:31
举报

版权声明:本文为博主原创文章,欢迎转载。 https://cloud.tencent.com/developer/article/1454242

# -*- coding: utf-8 -*-
"""
Created on Tue Mar 26 09:11:21 2019

@author: hadron
"""
from sklearn.datasets import make_blobs
import matplotlib.pyplot as plt

if __name__ == '__main__':
    N = 400
    centers = 4
    '''
    make_blobs函数是为聚类产生一个数据集和相应的标签
    n_samples:表示数据样本点个数,默认值100
    n_features:表示数据的维度,默认值是2
    centers:产生数据的中心点,默认值3
    cluster_std:数据集的标准差,浮点数或者浮点数序列,默认值1.0
    center_box:中心确定之后的数据边界,默认值(-10.0, 10.0)
    shuffle :洗乱,默认值是True
    random_state:官网解释是随机生成器的种子
    返回值说明:
    (1) X : array of shape [n_samples, n_features],The generated samples.生成的样本数据集。
    (1) y : array of shape [n_samples],The integer labels for cluster membership of each sample.样本数据集的标签。
    '''
    # 生成400个2维样本点集合,中心点4个
    data, y = make_blobs(n_samples=N, n_features=2, centers=centers)
    '''
    matplotlib.pyplot.scatter(x, y, s=None, c=None, marker=None, cmap=None, norm=None, vmin=None, vmax=None, alpha=None, linewidths=None, verts=None, edgecolors=None, *, data=None, **kwargs)
    参数说明:
    (1)x,y:表示的是大小为(n,)的数组,也就是我们即将绘制散点图的数据点
    (2)c:表示的是颜色,也是一个可选项。默认是蓝色'b',表示的是标记的颜色,或者可以是一个表示颜色的字符,或者是一个长度为n的表示颜色的序列等等
    '''
    #利用pyplot模块的scatter函数绘制散点图
    plt.scatter(data[:, 0], data[:, 1], c=y)
    plt.show()

运行结果

本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2019年03月26日,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档