社区首页 >问答首页 >从pandas dataframe单元格的乱七八糟的字符串中删除换行符?

从pandas dataframe单元格的乱七八糟的字符串中删除换行符?
EN

Stack Overflow用户
提问于 2017-05-28 13:18:12
回答 5查看 75.8K关注 0票数 29

我使用了多种方法拆分和剥离我的pandas数据帧中的字符串,以删除所有‘\n’字符,但出于某种原因,它根本不想删除附加到其他单词的字符,即使我拆分了它们。我有一个熊猫数据框架,它有一个列,可以使用Beautifulsoup从网页中捕获文本。美汤已经清理了文本,但无法删除附加到其他字符的换行符。我的字符串看起来有点像这样:

“动手\n开发游戏。我们将学习与游戏\n相关的各种软件技术,包括编程语言、\n脚本语言、操作系统、文件系统、网络、模拟引擎和多媒体设计系统。我们还将\n研究一些来自计算机科学的基本科学概念和相关领域,包括\n”

有没有一种简单的python方法来删除这些"\n“字符?

提前感谢!

EN

回答 5

Stack Overflow用户

回答已采纳

发布于 2017-05-28 13:22:26

编辑:正确的答案是:

代码语言:javascript
代码运行次数:0
复制
df = df.replace(r'\n',' ', regex=True) 

我觉得你需要replace

代码语言:javascript
代码运行次数:0
复制
df = df.replace('\n','', regex=True)

或者:

代码语言:javascript
代码运行次数:0
复制
df = df.replace('\n',' ', regex=True)

或者:

代码语言:javascript
代码运行次数:0
复制
df = df.replace(r'\\n',' ', regex=True)

示例:

代码语言:javascript
代码运行次数:0
复制
text = '''hands-on\ndev nologies\nrelevant scripting\nlang
'''
df = pd.DataFrame({'A':[text]})
print (df)
                                                   A
0  hands-on\ndev nologies\nrelevant scripting\nla...

df = df.replace('\n',' ', regex=True)
print (df)
                                                A
0  hands-on dev nologies relevant scripting lang 
票数 86
EN

Stack Overflow用户

发布于 2020-07-31 21:29:26

代码语言:javascript
代码运行次数:0
复制
df.replace(to_replace=[r"\\t|\\n|\\r", "\t|\n|\r"], value=["",""], regex=True, inplace=True)

对我很管用。

来源:

https://gist.github.com/smram/d6ded3c9028272360eb65bcab564a18a

票数 11
EN

Stack Overflow用户

发布于 2017-10-29 12:31:44

在乱七八糟的数据中,删除所有空格df.replace(r'\s', '', regex = True, inplace = True)可能是个好主意。

票数 8
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/44227748

复制
相关文章
从DataFrame中删除列
在操作数据的时候,DataFrame对象中删除一个或多个列是常见的操作,并且实现方法较多,然而这中间有很多细节值得关注。
老齐
2021/03/29
7K0
【学习】如何快速批量删除Excel单元格中的“换行符”
在Excel单元格中按Alt+Enter就会进行换行,就像在Word中按回车键一样。如果许多单元格中都包含这样的“换行符”,现在要将其全部删除掉,让这些单元格中的内容都变成一行显示,该如何操作呢? 方法一:取消自动换行 在Excel单元格中按快捷键Alt+Enter进行换行时,该单元格就被设置成了“自动换行”,如果要将这些单元格中的“自动换行”效果取消,也就是删除“换行符”,方法如下: 1.Excel 2003操作方法:选择这些需要调整的单元格,鼠标右击,在弹出的快捷菜单中
小莹莹
2018/04/18
19K0
(六)Python:Pandas中的DataFrame
        DataFrame与Series相比,除了可以每一个键对应许多值之外,还增加了列索引(columns)这一内容,具体内容如下所示:
小点点
2022/12/12
3.8K0
pandas中的 fillna使用(pandas.DataFrame.fillna)「建议收藏」
3、将“A”、“B”、“C”和“D”列中的所有 NaN 元素分别替换为 0、1、2 和 3。
全栈程序员站长
2022/09/22
3.5K0
pandas中的 fillna使用(pandas.DataFrame.fillna)「建议收藏」
pandas | DataFrame中的排序与汇总方法
大家好,我是架构君,一个会写代码吟诗的架构师。今天说一说pandas | DataFrame中的排序与汇总方法,希望能够帮助大家进步!!!
Java架构师必看
2022/01/12
3.9K0
pandas | DataFrame中的排序与汇总方法
pandas | DataFrame中的排序与汇总方法
今天是pandas数据处理专题的第六篇文章,我们来聊聊DataFrame的排序与汇总运算。
TechFlow-承志
2020/08/04
4.7K0
pandas | DataFrame中的排序与汇总方法
pandas DataFrame的创建方法
在pandas里,DataFrame是最经常用的数据结构,这里总结生成和添加数据的方法: ①、把其他格式的数据整理到DataFrame中; ②在已有的DataFrame中插入N列或者N行。
py3study
2020/01/19
2.6K0
pandas DataFrame的创建方法
Pandas DataFrame 中的自连接和交叉连接
在 SQL 中经常会使用JOIN操作来组合两个或多个表。有很多种不同种类的 JOINS操作,并且pandas 也提供了这些方式的实现来轻松组合 Series 或 DataFrame。
deephub
2022/04/14
4.3K0
Pandas DataFrame 中的自连接和交叉连接
pandas.DataFrame()中的iloc和loc用法
简单的说: iloc,即index locate 用index索引进行定位,所以参数是整型,如:df.iloc[10:20, 3:5] loc,则可以使用column名和index名进行定位,如: df.loc[‘image1’:‘image10’, ‘age’:‘score’] 实例:
全栈程序员站长
2022/11/01
2.5K0
Golang模板中删除换行符
删除换行符 在模板的双层大括号的前面或者后面使用减号,来删除循环中自动创建的换行符 import( {{- range $key, $value := .ImportList}} "{{$value}}" {{- end}} ) output: import( "fmt" "os" ) 参考 Golang模板范围换行符删除
solate
2020/05/26
2.9K0
在pandas中遍历DataFrame行
inp = [{'c1':10, 'c2':100}, {'c1':11,'c2':110}, {'c1':12,'c2':120}]
用户7886150
2020/12/26
3.2K0
pandas | 详解DataFrame中的apply与applymap方法
今天是pandas数据处理专题的第5篇文章,我们来聊聊pandas的一些高级运算。
TechFlow-承志
2020/07/24
3K0
pandas | 详解DataFrame中的apply与applymap方法
Python之Pandas中Series、DataFrame实践
Python之Pandas中Series、DataFrame实践 1. pandas的数据结构Series 1.1 Series是一种类似于一维数组的对象,它由一组数据(各种NumPy数据类型)以及一
王小雷
2018/01/02
3.9K0
pandas和spark的dataframe互转
由于pandas的方式是单机版的,即toPandas()的方式是单机版的,所以参考breeze_lsw改成分布式版本:
机器学习和大数据挖掘
2019/07/01
2.9K0
Pandas DataFrame笔记
1.属性方式,可以用于列,不能用于行 2.可以用整数切片选择行,但不能用单个整数索引(当索引不是整数时) 3.直接索引可以使用列、列集合,但不能用索引名索引行  用iloc取行,得到的series:
用户1075292
2018/01/23
9720
Pandas DataFrame笔记
python下的Pandas中DataFrame基本操作(二),DataFrame、dict、array构造简析
DataFrame简介:   DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔值等)。DataFrame既有行索引也有列索引,它可以被看做由Series组成的字典(共用同一个索引)。跟其他类似的数据结构相比(如R的data.frame),DataFrame中面向行和面向列的操作基本上是平衡的。其实,DataFrame中的数据是以一个或多个二维块存放的(而不是列表、字典或别的一维数据结构)。 导入基本python库: import numpy as np
学到老
2018/06/01
5.9K0
合并Pandas的DataFrame方法汇总
Pandas是数据分析、机器学习等常用的工具,其中的DataFrame又是最常用的数据类型,对它的操作,不得不熟练。在《跟老齐学Python:数据分析》一书中,对DataFrame对象的各种常用操作都有详细介绍。本文根据书中介绍的内容,并参考其他文献,专门汇总了合并操作的各种方法。
老齐
2021/03/11
5.7K0
点击加载更多

相似问题

从pandas dataframe单元格的乱七八糟的字符串中删除换行符?

5243

如何从Pandas DataFrame中的字符串中删除多余的换行符

10

如何删除pandas dataframe列中的换行符?

23

从dataframe pandas中删除dataframe

326

如何从python pandas dataframe中删除单元格

111
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 腾讯技术创作特训营