我正在尝试清理pandas df中的一些数据,并且我希望‘float
’列从卷变成int
。编辑:主要问题是我所查看的float
变量的数据类型实际上是一个str
。因此,首先需要将其浮动,然后才能更改。我删除了我正在考虑的另外两个解决方案,并保留了我使用的那个。上面的是有错误的,下面的是解决方案。
import pandas as pd
import numpy as np
#Call the df
t_df = pd.DataFrame(client.get_info())
#isolate only the 'symbol' column in t_df
tickers = t_df.loc[:, ['symbol']]
def tick_data(tickers):
for i in tickers:
tick_df = pd.DataFrame(client.get_ticker())
tick = tick_df.loc[:, ['symbol', 'volume']]
tick.iloc[:,['volume']].astype(int)
if tick['volume'].dtype != np.number:
print('yes')
else:
print('no')
return tick
以下是修改后的代码:
import pandas as pd
#Call the df
def ticker():
t_df = pd.DataFrame(client.get_info())
#isolate only the 'symbol' column in t_df
tickers = t_df.loc[:, ['symbol']]
for i in tickers:
#pulls out market data for each symbol
tickers = pd.DataFrame(client.get_ticker())
#isolates the symbol and volume
tickers = tickers.loc[:, ['symbol', 'volume']]
#floats volume
tickers['volume'] = tickers.loc[:, ['volume']].astype(float)
#volume to int
tickers['volume'] = tickers.loc[:, ['volume']].astype(int)
#deletes all symbols > 20,000 in volume, returns only symbol
tickers = tickers.loc[tickers['volume'] >= 20000, 'symbol']
return tickers
发布于 2018-07-20 07:13:09
您在这里有一些问题。
在第一个示例中,iloc
只接受DataFrame中的行和列的整数位置,这会生成错误。也就是说。
tick.iloc[:,['volume']].astype(int)
不起作用。如果需要基于标签的索引,请使用.loc
tick.loc[:,['volume']].astype(int)
或者,使用基于方括号的索引,它允许您直接获取整个列,而无需对行使用切片语法(:):
tick['volume'].astype(int)
接下来,astype(int)
返回一个新值,它不会就地修改。所以你想要的是
tick['volume'] = tick['volume'].astype(int)
至于你的数据类型是一个数字检查,你不想检查== np.number
,但你也不想检查is
,它只在为np.number
时返回True
,如果它是像np.int64
这样的子类则不返回。使用np.issubdtype
或pd.api.types.is_numeric_dtype
,即:
if np.issubdtype(tick['volume'].dtype, np.number):
或者:
if pd.api.types.is_numeric_dtype(tick['volume'].dtype):
https://stackoverflow.com/questions/51432720
复制相似问题