我建立了一个GMM模型,并使用它来进行预测。
bead = df['Ce140Di']
dna = df['DNA_1']
X = np.column_stack((dna, bead)) # create a 2D array from the two lists
#plt.scatter(X[:,0], X[:,1], s=0.5, c='black')
#plt.show()
gmm = GaussianMixture(n_components=4, covariance_type='tied')
gmm.fit(X)
我想在Matlab中执行分层聚类,并将聚类绘制在散点图上。我已经使用evalclusters函数首先研究了使用不同的标准值,例如Silhouette,CalinskiHarabasz,集群的“好”数量是多少。以下是我用于评估的代码(x是我的数据,包含200个观察值和10个变量):
E = evalclusters(x,'linkage','CalinskiHarabasz','KList',[1:10])
%store kmean optimal clusters
optk=E.OptimalK;
%save the outouts to a s
我正在进行聚类,并试图绘制结果。虚拟数据集是:
数据
import numpy as np
X = np.random.randn(10)
Y = np.random.randn(10)
Cluster = np.array([0, 1, 1, 1, 3, 2, 2, 3, 0, 2]) # Labels of cluster 0 to 3
簇中心
centers = np.random.randn(4, 2) # 4 centers, each center is a 2D point
问题
我想要制作一个散点图来显示data中的点,并根据集群标签对这些点进行着色。
然后,
我无法理解如何开始我的解决方案。我有一个569行的矩阵,每个行代表我的数据的一个样本,30列代表每个样本的特征。我的直觉是绘制每一行,并查看集群(如果有)是什么样子,但我不知道如何在单个散点图上做超过2行。 我花了几个小时浏览教程,但还不能理解如何将其应用于我的数据。我知道散点图以2个向量作为参数,那么我怎么可能绘制所有569个样本来对它们进行聚类呢?我是不是遗漏了什么基本的东西? #our_data is a 2-dimensional matrix of size 569 x 30
plt.scatter(our_data[0,:], our_data[1,:], s = 40)
我正在解决一个在日志文件中查找相似内容的问题。假设我有一个日志文件,如下所示:
show version
Operating System (OS) Software
Software
BIOS: version 1.0.10
loader: version N/A
kickstart: version 4.2(7b)
system: version 4.2(7b)
BIOS compile time: 01/08/09
kickstart image file is: bootflash:/m9500-sf2ek9-kickstart-m
我有以下数据集,其中我的日期是我的X轴.我想在Excel中绘制一个散点图,其中Y值=1对应日期,但我想为我的组使用不同的标记。不过,我不想印这个小组。
A = Circle
B = Diamond
C = Square
D = Triangle
Date Y-Value Group
01-JAN-2020 1 A
01-FEB-2020 1 A
01-MAR-2020 1 B
01-APR-2020
01-MAY-2020 1 C
01-JUN-2020
01-JUL-2020
01-
我有一个这样的数据帧。 ID X Y CLASS
A 123 456 0
A 789 121 1
A 456 333 1
B 111 123 1
B 156 123 1
C 167 189 1
C 567 789 1 我想对'id‘的相同值进行分组,并根据同一图形中的xy轴绘制不同的散点图。现在,我正在使用 groups = df.groupby('id