数值型数据特征处理之标准化

击上方

“蓝色字”

可关注我们!

今日分享:API介绍 标准化

在上一篇文章中介绍了如何对数值型数据进行归一化处理,详情点击

数值型数据特征处理之归一化

,可知,归一化处理容易受到数据异常点的影响,效果不是特别好,因此今天分享另一种常用的处理方法:标准化

一:标准化

(公式)

该公式也是作用于数据中的每一列数据,x为该列数据中的某一具体值,mean为该列数据的平均值,std为方差,σ为标准差(该值可以考量数据的稳定性),具体如何计算可参考上面给出的公式。

二:sklearn特征化API

三:StandardScaler语法

四:标准化流程

实例化StandardScaler()

通过fit_transform转换

五:Demo代码演示

主函数

输出结果

六:标准化评价

相较于归一化处理方法,其受异常点影响较小。经过方差标准差处理后,结果比较稳定,适合嘈杂的大数据场景。

公众号QQ群

扫QQ群二维码进交流学习群

  • 发表于:
  • 原文链接https://kuaibao.qq.com/s/20181006G16XGG00?refer=cp_1026
  • 腾讯「云+社区」是腾讯内容开放平台帐号(企鹅号)传播渠道之一,根据《腾讯内容开放平台服务协议》转载发布内容。
  • 如有侵权,请联系 yunjia_community@tencent.com 删除。

扫码关注云+社区

领取腾讯云代金券