我在Windows中使用Python3.5。我有一个dataframe,其中'titles'
字符串类型列包含标题,其中一些标题具有特殊字符,如â
、€
、˜
。
我正在尝试用一个使用pandas.replace
的空格''
来替换它们。我尝试了各种迭代,但都不起作用。我可以替换常规字符,但这些特殊字符似乎不起作用。
代码运行时没有错误,但根本不会发生替换,而是返回原始标题。下面是我已经尝试过的。任何建议都将不胜感激。
df['clean_title'] = df['titles'].replace('€','',regex=True)
df['clean_titles'] = df['titles'].replace('€','')
df['clean_titles'] = df['titles'].str.replace('€','')
def clean_text(row):
return re.sub('€','',str(row))
return str(row).replace('€','')
df['clean_title'] = df['titles'].apply(clean_text)
发布于 2018-06-14 07:01:33
我们只能假设您将非ASCI字符称为“特殊”字符。
要删除pandas数据框列中的所有非ASCI字符,请执行以下操作:
df['clean_titles'] = df['titles'].str.replace(r'[^\x00-\x7f]', '')
请注意,这是一个可伸缩的解决方案,因为它适用于任何非ASCI字符。
https://stackoverflow.com/questions/50846719
复制相似问题