版权声明:本文为博主原创文章,欢迎转载。 https://cloud.tencent.com/developer/article/1454242
# -*- coding: utf-8 -*-
"""
Created on Tue Mar 26 09:11:21 2019
@author: hadron
"""
from sklearn.datasets import make_blobs
import matplotlib.pyplot as plt
if __name__ == '__main__':
N = 400
centers = 4
'''
make_blobs函数是为聚类产生一个数据集和相应的标签
n_samples:表示数据样本点个数,默认值100
n_features:表示数据的维度,默认值是2
centers:产生数据的中心点,默认值3
cluster_std:数据集的标准差,浮点数或者浮点数序列,默认值1.0
center_box:中心确定之后的数据边界,默认值(-10.0, 10.0)
shuffle :洗乱,默认值是True
random_state:官网解释是随机生成器的种子
返回值说明:
(1) X : array of shape [n_samples, n_features],The generated samples.生成的样本数据集。
(1) y : array of shape [n_samples],The integer labels for cluster membership of each sample.样本数据集的标签。
'''
# 生成400个2维样本点集合,中心点4个
data, y = make_blobs(n_samples=N, n_features=2, centers=centers)
'''
matplotlib.pyplot.scatter(x, y, s=None, c=None, marker=None, cmap=None, norm=None, vmin=None, vmax=None, alpha=None, linewidths=None, verts=None, edgecolors=None, *, data=None, **kwargs)
参数说明:
(1)x,y:表示的是大小为(n,)的数组,也就是我们即将绘制散点图的数据点
(2)c:表示的是颜色,也是一个可选项。默认是蓝色'b',表示的是标记的颜色,或者可以是一个表示颜色的字符,或者是一个长度为n的表示颜色的序列等等
'''
#利用pyplot模块的scatter函数绘制散点图
plt.scatter(data[:, 0], data[:, 1], c=y)
plt.show()
运行结果