首页
学习
活动
专区
工具
TVP
发布
精选内容/技术社群/优惠产品,尽在小程序
立即前往
您找到你想要的搜索结果了吗?
是的
没有找到

掌握pandas中的transform

以前段时间非常流行的「企鹅数据集」为例: 图2 我们在读入数据后,对bill_length_mm列进行transform变换: 「单个变换函数」 我们可以传入任意的非聚合类函数,譬如对数化: # 对数化 penguins...['bill_length_mm'].transform(np.log) 图3 或者传入「lambda」函数: # lambda函数 penguins['bill_length_mm'].transform...(lambda s: s+1) 图4 「多个变换函数」 也可以传入包含多个变换函数的「列表」来一口气计算出多列结果: penguins['bill_length_mm'].transform([np.log...传入的函数,在执行运算时接收的输入参数是对应的「整列数据」,所以我们可以利用这个特点实现诸如「数据标准化」、「归一化」等需要依赖样本整体统计特征的变换过程: # 利用transform进行数据标准化 penguins...图6 2.2 transform作用于DataFrame 当transform作用于整个DataFrame时,实际上就是将传入的所有变换函数作用到每一列中: # 分别对每列进行标准化 ( penguins

1.5K20

(数据科学学习手札97)掌握pandas中的transform

图2 我们在读入数据后,对bill_length_mm列进行transform变换: 单个变换函数   我们可以传入任意的非聚合类函数,譬如对数化: # 对数化 penguins['bill_length_mm...图3   或者传入lambda函数: # lambda函数 penguins['bill_length_mm'].transform(lambda s: s+1) ?...图6 2.2 transform作用于DataFrame   当transform作用于整个DataFrame时,实际上就是将传入的所有变换函数作用到每一列中: # 分别对每列进行标准化 ( penguins...图7   而当传入多个变换函数时,对应的返回结果格式类似agg中的机制,会生成MultiIndex格式的字段名: ( penguins .loc[:, 'bill_length_mm':...图8   而且由于作用的是DataFrame,还可以利用字典以键值对的形式,一口气为每一列配置单个或多个变换函数: # 根据字典为不同的列配置不同的变换函数 ( penguins .loc

89030
领券