前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >python 处理数据归一化

python 处理数据归一化

作者头像
用户7886150
修改2020-12-28 11:35:04
1.1K0
修改2020-12-28 11:35:04
举报
文章被收录于专栏:bit哲学院

参考链接: Python | 如何以及在哪里应用特征缩放/归一化

数据规范化

为了消除指标之间的量纲和取值范围差异的影响,需要进行标准化(归一化)处理,将数据按照比例进行缩放,使之落入一个特定的区域,便于进行综合分析。

数据规范化方法主要有: 

- 最小-最大规范化 

- 零-均值规范化

数据示例

代码实现

#-*- coding: utf-8 -*-

#数据规范化

import pandas as pd

import numpy as np

datafile = '../data/normalization_data.xls' #参数初始化

data = pd.read_excel(datafile, header = None) #读取数据

(data - data.min())/(data.max() - data.min()) #最小-最大规范化

(data - data.mean())/data.std() #零-均值规范化

从命令行可以看到下面的输出:

>>> (data-data.min())/(data.max()-data.min(

          0         1         2         3

0  0.074380  0.937291  0.923520  1.000000

1  0.619835  0.000000  0.000000  0.850941

2  0.214876  0.119565  0.813322  0.000000

3  0.000000  1.000000  1.000000  0.563676

4  1.000000  0.942308  0.996711  0.804149

5  0.264463  0.838629  0.814967  0.909310

6  0.636364  0.846990  0.786184  0.929571

>>> (data-data.mean())/data.std()

          0         1         2         3

0 -0.905383  0.635863  0.464531  0.798149

1  0.604678 -1.587675 -2.193167  0.369390

2 -0.516428 -1.304030  0.147406 -2.078279

3 -1.111301  0.784628  0.684625 -0.456906

4  1.657146  0.647765  0.675159  0.234796

5 -0.379150  0.401807  0.152139  0.537286

6  0.650438  0.421642  0.069308  0.595564 

转载链接: https://blog.csdn.net/sinat_25873421/article/details/80753121

本文系转载,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文系转载前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档