需要考虑数据是否需要修改、如何修改调整才能适用于之后的计算和分析等。
数据清洗也是一个迭代的过程,实际项目中可能需要不止一次地执行这些清洗操作。...# 过滤掉带缺省参数的内容 即删除
# how='all' 行或列只要存在就删除 axis=0 按行删除 axis=1 按列删除
# 将内容转为DataFrame 类型
data = pd.DataFrame...|AAPL'],value=np.nan)#用np.nan替换?或.或$原字符
print(data)
其他作用
# df.replace(r'\?|\....|\$',np.nan,regex=True)#用np.nan替换?或.或$原字符
# df.replace([r'\?',r'\$'],np.nan,regex=True)#用np.nan替换?...,r'\$'],[np.nan,'NA'],regex=True)#用np.nan替换?用 NA替换$符号
# df.replace(regex={r'\?'