在pandas dataframe中使用正则表达式,可以通过str.contains()
方法来实现。该方法用于检查DataFrame中的每个元素是否包含指定的模式。
下面是使用正则表达式在一列中筛选不同记录的示例:
import pandas as pd
data = {'col1': ['apple', 'banana', 'cat', 'dog', 'elephant']}
df = pd.DataFrame(data)
pattern = r'^[ae].*'
filtered_df = df[df['col1'].str.contains(pattern)]
上述代码中,pattern
是一个正则表达式,^
表示以某个字符开头,[ae]
表示以字母'a'或'e'开头,.*
表示任意字符的任意次数。df['col1'].str.contains(pattern)
会返回一个布尔值的Series,表示每个元素是否匹配模式。然后,我们可以使用这个布尔值的Series来筛选DataFrame中的记录。
最后,filtered_df
将只包含以字母'a'或'e'开头的记录。
没有搜到相关的沙龙