我有一个熊猫数据框架。下面是一个样本表。
Event Text
A something/AWAIT hello
B la de la
C AWAITING SHIP
D yes NO AWAIT
我只希望在Text列中保留包含某种形式单词等待的行。下面是我想要的桌子:
Event Text
A something/AWAIT hello
C AWAITING SHIP
D yes NO AWAIT
下面是在所有可能的情况下我试图捕获包含等待的字符串的代码。
df_STH001_2 = df_STH001[df_STH001['Text'].str.contains("?AWAIT?") == True]
我得到的错误如下:
error: nothing to repeat at position 0
发布于 2018-03-12 16:30:12
默认情况下,Series.str.contains(pat,case=True,flags=0,na=nan,regex=True)将pat
视为RegEx。
问号(?
)使正则表达式中的前面标记可选,因此出现错误消息。
In [178]: d[d['Text'].str.contains('AWAIT')]
Out[178]:
Event Text
0 A something/AWAIT hello
2 C AWAITING SHIP
3 D yes NO AWAIT
发布于 2019-07-07 10:33:13
您还可以尝试使用match
方法:
df[df.column.str.match('some_string')]
https://stackoverflow.com/questions/49239875
复制相似问题