首页
学习
活动
专区
工具
TVP
发布
社区首页 >问答首页 >无法替换Python pandas数据帧中的特殊字符

无法替换Python pandas数据帧中的特殊字符
EN

Stack Overflow用户
提问于 2018-06-14 05:43:47
回答 1查看 2.6K关注 0票数 2

我在Windows中使用Python3.5。我有一个dataframe,其中'titles'字符串类型列包含标题,其中一些标题具有特殊字符,如â˜

我正在尝试用一个使用pandas.replace的空格''来替换它们。我尝试了各种迭代,但都不起作用。我可以替换常规字符,但这些特殊字符似乎不起作用。

代码运行时没有错误,但根本不会发生替换,而是返回原始标题。下面是我已经尝试过的。任何建议都将不胜感激。

代码语言:javascript
复制
df['clean_title'] = df['titles'].replace('€','',regex=True)
df['clean_titles'] = df['titles'].replace('€','')
df['clean_titles'] = df['titles'].str.replace('€','')

def clean_text(row):
   return re.sub('€','',str(row))
   return str(row).replace('€','')
df['clean_title'] = df['titles'].apply(clean_text)
EN

回答 1

Stack Overflow用户

发布于 2018-06-14 07:01:33

我们只能假设您将非ASCI字符称为“特殊”字符。

要删除pandas数据框列中的所有非ASCI字符,请执行以下操作:

代码语言:javascript
复制
df['clean_titles'] = df['titles'].str.replace(r'[^\x00-\x7f]', '')

请注意,这是一个可伸缩的解决方案,因为它适用于任何非ASCI字符。

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/50846719

复制
相关文章

相似问题

领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档