前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Python数据处理从零开始----第四章(可视化)①③多变量绘图目录

Python数据处理从零开始----第四章(可视化)①③多变量绘图目录

作者头像
用户1359560
发布2018-12-21 14:13:21
4830
发布2018-12-21 14:13:21
举报
文章被收录于专栏:生信小驿站生信小驿站
  • 关联矩阵点图

科研工作中我们经常需要把每两个变量之间的关系计算, 然后可以得到一个相关矩阵。 如果两个变量的变化趋势一样, 那么这个值就会大于零, 表明连个变量正相关,值越大代表相关性越强。 相反的话,如果两个变量的变化趋势相反, 这个值就会小于零。我们经常需要关注这个值,是因为在许多机器学习算法中,强相关的变量会导致算法能力下降。

  • 1.导入数据
代码语言:javascript
复制
%clear
%reset -f
# In[*]
# 加载Python库
import numpy as np
from numpy import loadtxt
import xgboost as xgb
from xgboost import XGBClassifier
from matplotlib import pyplot
import os
from sklearn.model_selection import train_test_split
import pandas as pd
import numpy as np
os.chdir("D:\\train")
# In[*]

from matplotlib import pyplot
from pandas import read_csv
filename = 'pima-indians-diabetes.csv'
names = ['preg', 'plas', 'pres', 'skin', 'test', 'mass', 'pedi', 'age', 'class']
data = read_csv(filename, names=names)
  • 绘制相关关系图
代码语言:javascript
复制
correlations = data.corr()
# plot correlation matrix
fig = pyplot.figure()
ax = fig.add_subplot(111)
cax = ax.matshow(correlations, vmin=-1, vmax=1)
fig.colorbar(cax)
ticks = np.arange(0,9,1)
ax.set_xticks(ticks)
ax.set_yticks(ticks)
ax.set_xticklabels(names)
ax.set_yticklabels(names)
pyplot.show()
    1. 密度图
代码语言:javascript
复制
data.plot(kind='density', subplots=True, layout=(3,3), sharex=False)
pyplot.show()

-4.散点图

代码语言:javascript
复制
from pandas.plotting import scatter_matrix
scatter_matrix(data)
pyplot.show()
本文参与 腾讯云自媒体分享计划,分享自作者个人站点/博客。
原始发表:2018.12.03 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体分享计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档