今天学习了一篇关于knn的文章,现将R和Python版本实现如下
part1 :加载数据及其可视化
python版本
import numpy as np
import pandas as pd
#设置路径
import os
os.chdir('D:\\MSG\\python\\20171211')
#[1,2]*100,这种显示是[1,2,1,2,1,2...]
aa=pd.DataFrame(np.repeat([0,1],100))
#读取csv文件去除抬头,若没有此参数会把第一行数据当成header
data=pd.read_csv('mixtureSimData.csv',header=None)
df_1,df_2=data[:200],data[200:]
df_2=df_2.reset_index(drop=True)
data1=pd.concat([df_1,df_2,aa],axis=1)
data1.columns = ['X1', 'X2','Y']
data1.plot.scatter('X1', 'X2', c='Y', colormap='jet')
#R版本
#aes 前面是x,后面是Y
#aes(x = mpg, y = wt)
setwd('D:/MSG/python/20171211')
data
train
require(ggplot2)
#R版本画图就像photoshop,每画一部分就增添一个图层
g
明天见下节
领取专属 10元无门槛券
私享最新 技术干货