从具有多个非传统分隔符的文件创建pandas数据帧

可以通过以下步骤实现：

导入必要的库：import pandas as pd import re
读取文件并处理非传统分隔符：# 读取文件内容 with open('filename.txt', 'r') as file: data = file.read() # 根据非传统分隔符进行分割 split_pattern = re.compile(r'\s*;\s*|\s*,\s*|\s+\|\s+') lines = re.split(split_pattern, data) # 去除空白行 lines = [line.strip() for line in lines if line.strip()]
创建pandas数据帧：# 创建空的数据帧 df = pd.DataFrame() # 解析每一行数据并添加到数据帧中 for line in lines: row = line.split(':') df = df.append(pd.Series(row), ignore_index=True) # 设置列名 df.columns = ['Column1', 'Column2', 'Column3', ...] # 可选：将数据类型转换为适当的类型 df['Column1'] = df['Column1'].astype(int) df['Column2'] = df['Column2'].astype(float)

通过以上步骤，你可以从具有多个非传统分隔符的文件创建一个pandas数据帧。这种方法适用于处理各种非传统分隔符，如分号、逗号、竖线等。你可以根据实际情况调整分隔符的正则表达式模式。

从具有多个非传统分隔符的文件创建pandas数据帧

、、

我正在尝试从一个格式不是很好的.data文件创建一个数据帧。';'之外的分隔符。：如您所见，几乎所有的索引都被移位，创建了空行，并将'NaN‘作为实际包含我想要的数据的行的索引。(我只取了数据帧的一部分，但想法保持不变)。我尝试过其他稍有不同的正则表达式，结果也差不多。

浏览 2提问于2018-08-01得票数 0

回答已采纳

2回答

我如何告诉Pandas read_csv使用多个空格作为分隔符，而不是单个空格？

、、

我想从csv中读取一个Pandas数据帧，其中列名中只有一个空格，分隔符是多个空格。我如何告诉Pandas只使用多个连续的空格作为分隔符，而忽略单个空格？

浏览 3提问于2019-10-29得票数 5

1回答

用于多个分隔符的pandas read_csv()

我有一个包含如下数据的文件1000001 92:1.010000031000006 277:0.7815;1980:0.4825;146:0.1751000009 2:1.0 我想将该文件读到由多个分隔符\t, :, ;分隔的pandas</e

浏览 0提问于2018-01-02得票数 14

回答已采纳

1回答

Pandas不识别文档中的列

、

我正在尝试使用pandas读取多个制表符分隔的文件(.tab)，所有文件都包含250行和不同数量的列(大于1)。一些结果数据框具有预期的行数和列数。但是，在它们中的某些列中，所有列都被识别为单个列。这些数据帧具有预期的行数，但只有一列。我检查了有问题的文档是否有任何意想不到的换行符或分隔符(或

浏览 18提问于2020-07-11得票数 0

回答已采纳

1回答

将具有不同数量的特定分隔符实例的CSV文件读取到Pandas* Dataframe中*

、、

我有一个CSV文件，它使用分号(;)作为分隔符。然而，问题是分号的实例数量不同，有时只有一个;，有时有多个分号，如;;;;，;;;;;;等，考虑到数据相当大的事实，我并不是真的知道这一点。使用;分隔符读取文件的最简单方法(显然也是最常用的方法)是使用然而，问题是，尽管文

浏览 1提问于2019-03-03得票数 0

1回答

遍历csv列以创建多个python数据帧

、、、

我正在尝试使用excel csv文件的列创建多个数据框。这就是我所能做到的import pandas as pddf = pd.DataFrame(file) df[i] = df[['Date'

浏览 2提问于2016-12-20得票数 0

1回答

Pandas GroupBy查询

、、

我在pandas中有一个数据帧，如下所示：Snapshot of my pandas dataframe 现在我希望转换数据帧，如下所示，根据排序的日期值(%m/%d/%Y)，使用分隔符为每个customerid日期较早的订单具有对应的客户id，其类别列在第一位。 Desired/Transformed data frame

浏览 12提问于2019-02-24得票数 3

回答已采纳

2回答

列大小问题: read_csv

、、

我有一个有4列的数据帧。为了在本地计算机上工作，我必须将此数据帧转换为csv。当我将dataframe转换为csv时，我只有一列：print df.info() RangeIndex: 20479 entries, 0 to 20478

浏览 1提问于2017-10-06得票数 0

1回答

读取pandas中不常见的.txt文本格式

、、

我的问题非常直截了当，但是我不确定pandas或其他图书馆是否有办法解决这个问题。问题是我有一个.txt文件，格式如下(包括文本"This is The example...")。因此，当我想要读取多个具有该格式的文件，并继续将其附加到一个数据帧后。因此，我想知道是否有一种简单的方法来阅读它，尽管格式不均匀，没有逗号或小数分隔符。希望我能做到简明扼要。我真的很感谢你在这个问题上

浏览 6提问于2019-11-07得票数 0

回答已采纳

1回答

在Python中拆分pandas* DataFrame的数据*

、

我有这个DataFrame：df = [{"username": "last",}]df 我使用此代码来获

浏览 0提问于2019-07-31得票数 0

1回答

Read_csv功能

、、

我试图从配置文件中传递分隔符，我的配置文件看起来是这样的，我正在提供我的(.config格式)文件的内部内容，从这个( .config格式)文件中读取所有参数，如路径、分隔符、文件类型等。path|\t|csv我正在尝试获取数据，它是双引号的，类似于 "Bhu" "xyz"

浏览 3提问于2020-06-12得票数 1

1回答

pandas:具有保留列顺序的to_csv追加模式

我正在使用：将多个pandas数据帧逐个写入CSV文件。如何确保新的数据帧将按照以前数据的</em

浏览 21提问于2018-08-02得票数 0

3回答

pandas:将数据帧拆分为多个csvs

、

我有一个大文件，导入到Pandas中的单个数据帧中。我使用pandas根据数据帧中的行数将文件拆分成多个段。例如: 10行:文件1获取0:4文件2获取5:9 有没有一种方法可以做到这一点，而不必创建更多的数据帧？

浏览 0提问于2017-11-22得票数 2

1回答

用Pandas解析excel文件

有没有办法强制Pandas将excel文件中的每一列/每行一个单元格地读取到Dataframe中？我有一些非常时髦的电子表格，有很多奇怪的格式-合并的单元格，遗漏的行，等等。是否可以强制pandas创建n行、m列的数据帧，哪些内容将直接对应于从"A1“单元格开始具有相同维度的excel表表子集的</

浏览 2提问于2014-01-11得票数 2

1回答

Pandas:读取具有不同分隔符的CSV文件-合并错误

、、、、

我有4个单独的CSV文件，我希望读入Pandas。我想将这些CSV文件合并到一个数据帧中。每个CSV文件都包含一个“ID”列。当我合并我的数据帧时，它没有正确地完成，并且我

浏览 10提问于2017-06-28得票数 0

回答已采纳

1回答

Pandas -如何从Dataframe中删除引号

、

我正在读取CSV文件，当我读取时我得到了第一个单元格中的所有标题，数据有一列长"Header 1", "Header 2", "Header 3", etc"EEID","Location","Company","SSN",&quo

浏览 1提问于2017-04-28得票数 2

4回答

如何在CSV中使用双管道作为分隔符？

、

Spark 1.5和Scala 2.10.6 我有一个使用“π”作为分隔符的数据文件。我很难通过解析来创建一个数据帧。是否可以使用多个分隔符来创建数据框？代码可以处理单个断开的管道，但不能处理多个分隔符。我的代码： val customSchema_1 = StructType(Array( StructField(&q

浏览 93提问于2016-12-22得票数 7

回答已采纳

4回答

从图像文件列表创建pandas数据帧

、

我正在尝试从图像文件(.png文件)列表创建一个pandas数据帧img = misc.imread('a.png')samples.append(X)df = pd.DataFrame(samples

浏览 2提问于2016-07-13得票数 2

2回答

如何从字典创建csv

、、

我在这里有一个非常独特的情况。我的字典有字符串键和pandas.DataFrame值：我想创建一个单独的csv文件，适用于df1、df2、df3等等，直到df1001，文件名分别为'0'.csv，'1'.csv，'2'.csv等等，直到

浏览 2提问于2018-11-05得票数 1

2回答

使用pandas读取以^@为分隔符的TXT文件

、、

我有一个TXT和CSV文件，分隔符为“^@”(我可以在VIM编辑器中查看它，在notepad++中它显示为null )我想使用它作为Python(pandas)中数据帧的列分隔符。我应该使用什么？

浏览 2提问于2021-03-12得票数 1

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

从具有多个非传统分隔符的文件创建pandas数据帧

相关·内容

从具有多个非传统分隔符的文件创建pandas数据帧

我如何告诉Pandas read_csv使用多个空格作为分隔符，而不是单个空格？

用于多个分隔符的pandas read_csv()

Pandas不识别文档中的列

将具有不同数量的特定分隔符实例的CSV文件读取到Pandas* Dataframe中*

遍历csv列以创建多个python数据帧

Pandas GroupBy查询

列大小问题: read_csv

读取pandas中不常见的.txt文本格式

在Python中拆分pandas* DataFrame的数据*

Read_csv功能

pandas:具有保留列顺序的to_csv追加模式

pandas:将数据帧拆分为多个csvs

用Pandas解析excel文件

Pandas:读取具有不同分隔符的CSV文件-合并错误

Pandas -如何从Dataframe中删除引号

如何在CSV中使用双管道作为分隔符？

从图像文件列表创建pandas数据帧

如何从字典创建csv

使用pandas读取以^@为分隔符的TXT文件

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐