Python之用K-means聚类进行网站人群分析

斑点鱼最近在学《白话大数据与机器学习》,刚学完聚类一章节,整理了下KMEANS算法实例,跟大家分享哈~~

注:三维聚类的图斑点鱼还不会画,有大神看到并且会的话,记得联系斑点鱼,么么哒~~(づ ̄ 3 ̄)づ

附code:

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

from sklearn.cluster import KMeans

%读取数据

import os

os.chdir('C:\Users\E440\Desktop\PythonStudy')

os.getcwd()

X= pd.read_csv('input/userid2.csv')

X.head()

X=X.dropna()

x2=X.loc[:,['staytime','bounce','page']]

x2=X.loc[:,['staytime','bounce']]

#转换成numpy array

x2=np.array(x2)

#聚成5类

n_clusters=4

cls=KMeans(n_clusters).fit(x2)

cls.labels_#X中每项所属分类的一个列表

X['cluster']=cls.labels_

#画图

markers=['^','x','o','*']#,'+''

for i in range(n_clusters):

members=cls.labels_ == i

plt.scatter(x2[members,0],x2[members,1],s=60,marker=markers[i],c='b',alpha=0.5)

plt.title('')

plt.show()

X.to_csv('output/userid.csv')

一起学习的小伙伴如果有什么想法或者意见,欢迎沟通~

  • 发表于:
  • 原文链接http://kuaibao.qq.com/s/20180316G0ACH200?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券