我有包含200+列的pandas数据帧。所有列都是int类型。我需要将它们转换为浮点型。我找不到做这件事的方法。我试过了
for column in X_data:
X_data[column].astype('float64')
但是在for循环之后,当我打印X_data.dtypes时,所有的列都只显示为int。我也尝试过X_data = X_data.apply(pd.to_numeric),但它没有转换为float。
数据帧是从csv文件加载中构建的。
我有一个包含多个ID的pandas系列对象。我想通过检查它们的ID是否出现在我的pandas系列对象中来过滤掉其他数据帧的行:
DATA['y'] = DATA['ID'].apply(lambda x: 1 if x in IDs else 0)
我注意到数据中的ID 279779在列'y‘中有'1’,尽管该ID不存在于我的ID系列对象中。我运行了以下代码行:279779 in IDs,它返回True,但以下代码没有打印任何内容:
for id in IDs:
if id == 279779:
print('fo
在清理时间序列的Pandas Dataframe之前,我想删除顶部某些列中包含NaN的行。
我想遍历数据帧的开头,删除满足条件where column为NaN的行。我下面的数据框叫做“列车”,包含两列-“日期”和“最高温度(摄氏度)”。我将日期设置为索引。最初的20个奇数行包含‘最高温度(摄氏度)’中的NaN。
#Drop NaN values at start of dataframe
for date,row in train.iterrows():
print(date)
if train.loc[date,'Maximum temperature (Degree C)
我想从pandas dataframe中删除行,该数据帧包含长度大于所需长度的特定列中的字符串。 例如: 输入帧: X Y
0 Hi how are you.
1 An apple
2 glass of water
3 I like to watch movie 现在,假设我想从dataframe中删除包含长度大于或等于4的单词字符串的行。 所需的输出帧必须为: X Y
1 An apple
2 glass of water 当列0中的字数为4和列3中的字数分别为5时,删除列'X‘中值为0、3的行。