Pandas列拆分(数组)

Pandas列拆分（数组）是指使用Pandas库中的函数将一个包含多个值的列拆分为多个独立的列，每个列包含原始列中的一个值。这在处理结构化数据时非常常见，特别是当一个列中包含有用信息的数组时。

拆分一个包含数组的列有几种不同的方法，下面列举了其中两种常用的方法：

apply函数：可以使用Pandas的apply函数结合lambda函数来拆分列。首先，使用lambda函数将数组分割为多个列，然后将apply函数应用到待拆分的列上。例如，假设有一个名为"array_column"的列，其中包含了多个值的数组，可以使用以下代码将其拆分为三个独立的列："column1"、"column2"和"column3"。

df[['column1', 'column2', 'column3']] = df['array_column'].apply(lambda x: pd.Series(x))

str.split函数：如果数组中的值是由分隔符分隔的字符串，可以使用Pandas的str.split函数拆分列。首先，使用str.split函数将列中的每个字符串拆分为多个部分，然后使用apply函数将其转换为多个列。例如，假设有一个名为"string_column"的列，其中包含了由逗号分隔的字符串，可以使用以下代码将其拆分为两个独立的列："column1"和"column2"。

df[['column1', 'column2']] = df['string_column'].str.split(',', expand=True)

使用Pandas列拆分功能的优势包括：

提供了一种方便的方式来处理包含数组或分隔字符串的列。
可以将原始数据转换为更容易处理和分析的格式。
可以更容易地对拆分后的列进行进一步的数据清洗、转换和分析。

Pandas列拆分在许多应用场景中都非常有用，例如：

处理日志文件或其他记录数据，其中某些列包含了多个值。
分析和处理包含逗号分隔的标签或关键词的数据。
对包含数组的列进行聚合或筛选操作。

腾讯云提供了多个相关产品和服务，可以帮助您在云上进行数据处理和分析，例如：

云服务器CVM：提供了弹性的计算资源，可以用来运行Python脚本和处理数据。
云数据库MySQL：提供了可扩展和高可用的数据库服务，可以存储和管理处理后的数据。
云函数SCF：无服务器函数计算服务，可以在数据处理过程中执行自定义的处理逻辑。
弹性MapReduce：提供了弹性的大数据处理服务，适用于对大规模数据集进行处理和分析。

希望以上信息对您有所帮助！

页面内容是否对你有帮助？

有帮助

没帮助

Pandas列拆分(数组)

、、

我使用下面的代码将值拆分为多个列 # 1.the '\r\n' from the last column df['v41'] = df['v41'].replace(r'\s+|\\n', ' ', regex=True) 但在一些数据集中，数组的值更多100列，上面的代码太大了。我必须从V1写到V100。有什么简单的方法可以做到这一点吗？

浏览 44提问于2021-11-18得票数 0

回答已采纳

5回答

在pandas DataFrame中对列执行.str.split()操作后获取最后一个" column“

、、、

我在pandas DataFrame中有一列，我想将其拆分到一个空格中。使用DataFrame.str.split(' ')拆分非常简单，但是我不能从最后一个条目创建新的列。当我对列执行.str.split()操作时，我得到了一个数组列表，但是我不知道如何处理它来为我的DataFrame获得一个新的列。下面是一个例子。列中的每个条目都包含‘符号数据价格’，我想拆分价格(并最终删除"p&

浏览 1提问于2012-09-20得票数 103

回答已采纳

3回答

Pandas:有没有一种方法可以在不遇到AttributeError的情况下使用.str访问器来检查对象是否真的是一个字符串？

、、

我使用toPandas()将pyspark数据帧转换为pandas数据帧。但是，因为某些数据类型不对齐，所以pandas会将数据帧中的某些列强制转换为object。(作为参考，我尝试做的是，如果数据帧中的列实际上具有字符串值，则执行一个str.split()。)编辑：astype(str)

浏览 1提问于2020-06-23得票数 1

2回答

在Pandas Dataframe中将任意数量的numpy数组行拆分成列

、、、、

我有一个包含两种列的Pandas数据帧，一种是包含numpy数组的列，另一种是包含浮点数的列。 arr1 f1我需要将数组的值拆分为行。如果我只有这两列，我可以像这样轻松地拆分数组： df = pd.DataFrame([[x, j] for i, j in zip(a['arr1'], a['f1']) for x i

浏览 0提问于2020-08-15得票数 0

2回答

我使用numpy.savetxt()向csv写入了一个numpy数组，但是当我使用numpy.genfromtxt()读回它时，该数组看起来不同了。

、、、、

我做了很多格式化，并将数据集拆分成了numpy数组的train/dev/test。我使用numpy将训练集numpy数组编写为csv格式。训练集是一个维数为64x27226的数值数组。但是，当我使用numpy的genfromtxt()函数读回训练集时，我得到了一个(64，)维数组，所有元素都是NaNs。我尝试用pandas读取csv，但是pandas自动将csv的第一行设置为列的标签，并返回一个(63,27226)维DataFram

浏览 12提问于2020-06-26得票数 0

2回答

python中不同CSV列的总和

、

对于74列中的每一列，我希望将所有525599个值的总和保存在一个列表中。我找不到正确的方法来迭代每一列，并将每一列的总和保存在列表中。

浏览 0提问于2018-12-18得票数 0

3回答

在pandas数据帧中将列拆分成多个不同长度的列

、、

我想根据长度将pandas数据帧中的一列拆分为多个列。我有一个csv文件，它告诉我需要拆分多少列以及每列的长度。当我想做拆分时，我需要参考这个文件。我怎样才能有一个通用的代码，可以在一个pandas数据框架中将一列拆分为多列？如有任何帮助，我们将不胜感激。谢谢！

浏览 77提问于2021-08-15得票数 0

2回答

在scikit-learn中拟合包含列表的pandas列

、

我有一个pandas标签，其中包含一个名为'X‘的列，其中包含一个包含300个doubles的列表，以及一个在尝试运行时名为’DataFrame‘的列：cls.fit(miniset.loc

浏览 3提问于2019-08-07得票数 0

2回答

拆分pandas列

、

我有一个字符串列，我希望根据字符串将其拆分为三列。该列如下所示 full_stringd ey m nd e f x和y是前缀。

浏览 23提问于2021-04-04得票数 0

回答已采纳

2回答

如何在pandas dataframe中按另一列拆分一列

、、、、

我正在清理pandas dataframe中的数据，我想将一列拆分为另一列。我想按列'eNBID‘拆分列'id’，但不知道如何拆分 id_list = ['4600375067649','4600375077246','460037495681

浏览 2提问于2019-07-11得票数 0

2回答

Python pandas.read_csv将列拆分为多个新列，使用逗号分隔

、、

我使用pandas.read_csv加载了一个文件。附带注意:我更喜欢在我的文件中加载一个不同的库，但是熊猫提供了我需要的其他一些不同的功能。我的守则：做：print Data给了我： 0 1

浏览 4提问于2015-07-28得票数 0

回答已采纳

1回答

将艺术家姓名从一列中拆分

、、

我正在从公告牌100列表中提取数据，并被困在如何拆分艺术家姓名的问题上。这是一个csv文件，但在导出之前，我有一个pandas数据帧中的数据。我想使用python/pandas进行拆分。艺术家的名字都在同一列，分隔符(红色)我想拆分，但这是非常复杂的。最常见的分隔符是“&”、“Featuring”、“X "，所以基本上我需要帮助将所有这些名称拆分到不同的列中。我想我可以使用嵌套的for循环，这样我

浏览 2提问于2019-03-02得票数 0

1回答

优化从数据中提取列表以在Python中创建新变量

、、、、

我对Python非常陌生。我有一个巨大的数据，其中包含两个变量的列表格式。它的维数为1416631×2。下面是带有两个变量col和PMID (当前为空)的dataframe col的片段：[1, Aged, Adult, Child][22, Diagnostic Imaging, Aged]col

浏览 0提问于2018-02-21得票数 1

回答已采纳

1回答

我有多个列表，我想按最新列表进行筛选

、、

我有以下存储桶AWS架构：在我的python代码中，它返回一个存储桶列表及其日期。我需要坚持使用两个主要存储桶中的最新版本：我从Python开始，这是我的代码：for get_in_scenarioid in str_of_ints: #print(resultado) sub_pref

浏览 0提问于2021-03-25得票数 0

1回答

拆分Pandas中的列

我是Pandas的新手，正在努力将一列数据拆分为两列。当然，我想对“-”字符进行拆分。我希望结果列是'FICO.low'和'FICO.high'。

浏览 2提问于2013-10-05得票数 1

1回答

如何将Pandas数组拆分为列？

、、、、

我试图将数组值拆分为列。下面是数据(Hashtags)的屏幕截图：以下是数据的表示形式。codes2 [77085]4 [99213, 99287]我想把这个数组分成不同的列。如下所示(屏幕快照-散列标签)：这是它的一个代表。

浏览 2提问于2022-05-22得票数 1

2回答

按列数将可变列行结构读入Pandas

我需要从一个大文件中创建一个Pandas DataFrame，其中包含空格分隔值和取决于列数的行结构。]def grouper(n, iterable, fillvalue=None): "Collect data into fixed-length对于500MB+文件，这会快速地消耗内存，而Pandas在读取这么大的MultiIndexes列表时会遇到一

浏览 1提问于2013-04-09得票数 1

2回答