我只想将数字保存在不一定有效的字符串数组中。我的代码如下所示:
age = train['age'].to_numpy() # 200k values
set(age)
# {'1', '2', '3', '7-11', np.nan...}
age = np.array(['1', '2', '3', '7-11', np.nan])
期望输出:np.array([1, 2, 3])
。理想情况下,'7-11‘将是7,然而,这并不简单,是一个可容忍的损失。
np.isfinite(x)
给出了"ufunc 'isfinite‘不支持输入类型,并且根据“安全”规则,不能安全地将输入强制到任何支持的类型。“
x = [num for num in age if isinstance(num, (int, float))]
返回[]
发布于 2022-01-21 08:27:02
这里有一个选项,它将在'-‘first上拆分字符串,并且只接受第一个值,因此'7-11’被转换为7:
age = np.array(['1', '2', '3', '7-11', np.nan])
age_int = np.array([int(x[0]) for x in np.char.split(age, sep='-') if x[0].isdecimal()])
输出:array([1, 2, 3, 7])
如果您不关心‘7-11’这样的情况,那么有一个更有效的方法可以做到这一点:
age_int2 = age[np.char.isdecimal(age)].astype(int)
Output2:array([1, 2, 3])
发布于 2022-01-21 03:07:51
你可以做以下的事情
for pos, val in enumerate(age):
try:
new_val = int(val)
except:
new_val = np.nan
age[pos] = new_val
age = age[age!="nan"].astype(int)
print(age)
> array([1, 2, 3])
https://stackoverflow.com/questions/70795550
复制相似问题