朋友们大家好,不知道前几篇的内容大家学的怎么样呢?昨天咱们说了日期转换,类型转换,今天咱们就说说剩下的属性:
1.日期转换器
昨天的那篇文章咱们讲了parse_dates怎么用,它可以直接将转换为日期类型,但是有一种情况,当日期包含汉字如年月日的时候,parse_dates转换为日期是不管用的,我们来看看,首先下面是我们准备的一组数据,之后一列是包含汉字的日期。
我们通过dtypes查看它的类型是object那么我们就需要通过date_parser,具体怎么用呢?
首先需要借助parse_dates指定解析的列,再通过date_parser进行解析:
import pandas as pd
p=pd.read_excel('四大名著.xlsx',parse_dates=['日期'],
date_parser=lambda x:pd.to_datetime(x,format='%Y年%m月%d日'))
print(p.dtypes)
2.值转换函数
格式:
converters={'列名':函数}
我们在处理表格的时候通常会遇到需要批量处理数据,比如我们想要将如下如的年龄全部加10,应该怎么做呢?
import pandas as pd
p=pd.read_excel('四大名著.xlsx',converters={'年龄':lambda x:x+10})
print(p)
最终显示的结果是这样的:
领取专属 10元无门槛券
私享最新 技术干货