前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >【说站】python数据变换如何实现

【说站】python数据变换如何实现

作者头像
很酷的站长
发布2022-11-23 14:50:43
5930
发布2022-11-23 14:50:43
举报
文章被收录于专栏:站长的编程笔记

python数据变换如何实现

1、数据规范化,即归一化的方法

常见方法:最小-规范化、z-score规范化、小数定标规范化

代码语言:javascript
复制
import pandas as pd
df=pd.DataFrame(A.data[:,3:6])
df.columns=A.feature_names[3:6]
#最小-规范化,支持矢量运算
(df-df.min())/(df.max()-df.min())
 
#使用sklearn中的preprocessing模块
from sklearn import preprocessing
preprocessing.minmax_scale(df)
 
#z-score规范化:结果=(数值-均值)/标准差,处理后数据的均值为0,标准差为1
(df-df.mean())/df.std()
 
#使用sklearn中的preprocessing模块
from sklearn import preprocessing
preprocessing.scale(df)
 
#小数定标规范化:常见落在[-1,1]区间,通过移动小数点的位数实现,移动位数取决于属性绝对值的值的位数
#ceil向上取整
import numpy as np
df/10**np.ceil(np.log10(df.abs().max()))

2、连续属性离散化

常见方法:分箱法(等宽法、等频法)、聚类

代码语言:javascript
复制
import pandas as pd
#等宽法,5个箱子,标签为0-4
pd.cut(df.AGE,5,label=range(5))
#等频法
pd.qcut(df.AGE,5,label=range(5))

以上就是python数据变换的实现,希望对大家有所帮助。更多Python学习指路:python基础教程

本文教程操作环境:windows7系统、Python 3.9.1,DELL G3电脑。

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • python数据变换如何实现
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档