前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
工具
TVP
发布
社区首页 >专栏 >Python3实现常用数据标准化方法

Python3实现常用数据标准化方法

作者头像
py3study
发布2020-01-13 12:59:34
7170
发布2020-01-13 12:59:34
举报
文章被收录于专栏:python3

数据标准化是机器学习、数据挖掘中常用的一种方法。包括我自己在做深度学习方面的研究时,数据标准化是最基本的一个步骤。数据标准化主要是应对特征向量中数据很分散的情况,防止小数据被大数据(绝对值)吞并的情况。另外,数据标准化也有加速训练,防止梯度爆炸的作用。下面是从李宏毅教授视频中截下来的两张图。

左图表示未经过数据标准化处理的loss更新函数,右图表示经过数据标准化后的loss更新图。可见经过标准化后的数据更容易迭代到最优点,而且收敛更快。

一、[0, 1] 标准化

[0, 1] 标准化是最基本的一种数据标准化方法,指的是将数据压缩到0~1之间。标准化公式如下, x=x−min(x)max(x)−mix(x) x = \dfrac{x - min(x)}{max(x) - mix(x)} x=max(x)−mix(x)x−min(x)​ 代码实现,

或者,

二、Z-score标准化

Z-score标准化是基于数据均值和方差的标准化化方法。标准化后的数据是均值为0,方差为1的正态分布。这种方法要求原始数据的分布可以近似为高斯分布,否则效果会很差。标准化公式如下, x=x−meanstd x = \dfrac{x - mean}{std} x=stdx−mean​ 下面,我们看看为什么经过这种标准化方法处理后的数据为是均值为0,方差为1,

代码实现,

或者,

【参考文献】

https://en.wikipedia.org/wiki/Feature_scaling

本文参与 腾讯云自媒体同步曝光计划,分享自作者个人站点/博客。
原始发表:2019/08/07 ,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 作者个人站点/博客 前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
目录
  • 一、[0, 1] 标准化
  • 二、Z-score标准化
  • 【参考文献】
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档