在对来自pandas数据帧的列表进行迭代时出现错误re.findall()

()。re.findall()是Python标准库中的re模块提供的一个函数，用于在字符串中查找所有匹配某个正则表达式的子字符串，并以列表形式返回结果。

对于pandas数据帧的列表进行迭代时，需要确保每个元素都是字符串类型才能使用re.findall()。如果列表中的元素不是字符串类型，就会出现错误。

解决这个问题的方法是可以使用apply()函数来将re.findall()应用到每个元素上。具体步骤如下：

导入所需的库：

import pandas as pd
import re

创建一个包含数据帧的列表：

df_list = [df1, df2, df3]  # 假设df1, df2, df3是数据帧

定义一个函数，该函数接收一个数据帧作为参数，并在该函数内使用re.findall()：

def findall_in_df(df):
    # 假设要查找的正则表达式是"pattern"
    pattern = r"pattern"
    # 将正则表达式应用到数据帧中的某一列上，例如列名是"column_name"
    result = re.findall(pattern, df["column_name"])
    return result

使用apply()函数将findall_in_df()函数应用到每个数据帧上：

results = [df.apply(findall_in_df) for df in df_list]

这样，results列表中的每个元素都是一个包含了re.findall()结果的列表。

关于re.findall()的更多详细用法和参数说明，可以参考Python官方文档中的相关说明：re — Regular expression operations

腾讯云相关产品推荐：

如果你在处理大规模的数据，并希望能够高效地进行数据分析和处理，可以考虑使用腾讯云的数据计算服务TencentDB for TDSQL。它提供了快速、安全和可扩展的关系型数据库服务，支持海量数据存储和复杂查询。
如果你希望在云上构建和部署应用程序，可以考虑使用腾讯云的云服务器CVM。它提供了高性能、可靠稳定的云服务器实例，支持多种操作系统和应用场景，可以满足不同规模和需求的应用部署需求。
如果你关注网络安全，并希望保护你的应用和数据免受网络攻击，可以考虑使用腾讯云的Web应用防火墙（WAF）。它能够通过智能的安全策略和实时的攻击防护，有效地识别和阻止各种网络攻击，保护你的应用和数据的安全。

希望以上信息能对你有所帮助。如果还有其他问题，请随时提问。

在对来自pandas数据帧的列表进行迭代时出现错误re.findall()

、、

我将一个列从pandas df转换为list： subsectors = df['subsectors'].tolist() 我想把这样的字符串：'BuyMeADrink‘分隔成'Buy Me因此，我使用了以下方法之一： [' '.join(re.findall('[A-Z][^A-Z]*', s)) for s in subsectors] 或 li = re.compile) for string in subsectors] 或

浏览 20提问于2020-10-09得票数 0

回答已采纳

1回答

Dict to dask数据帧

、、、

我有一份delayed的字典清单。每个delayed对象的计算值必须转换为dask.Dataframe中的一个条目。dfs.append(df) dfs = dfs.compute() 通常，pandas.DataFrame将字典的键转换为列。也许还有更有效的方法。感谢您的评论。

浏览 26提问于2020-07-28得票数 0

1回答

尽管我使用的是建议的方法，Dask还是输出了使用client.scatter的警告

、、、

在dask distributed中，我收到了以下警告，这是我意想不到的： future = client.submit(func, big_future) # good我感到惊讶的原因是，我所做的正是警告所暗示的： import das

浏览 9提问于2018-02-22得票数 6

回答已采纳

1回答

对pandas数据帧中的时间序列数据进行着色

、、、

我有两个Pandas数据帧: svt_data和asp_data。第一个是时间序列数据，第二个是该序列中的特定时间。我可以使用svt_data.plot()绘制时间序列数据。然后，我想对第二个数据帧中的特定时间进行着色。在过去，我通过迭代列表的元素并使用matplotlib的plt.axvline函数实现了这一点，不是使用pandas<

浏览 2提问于2019-07-19得票数 2

1回答

通过迭代pd数据帧来抓取多个网页

、

我试图通过迭代Pandas数据帧(“名字”)来抓取一组网页，该数据帧包含要插入到网页URL中的名字和姓氏。我已经设置了空列表("collab"，"freq")来填充从每个网页中提取的数据。当我只抓取一个网页时，我的代码成功地提取数据来填充这些列表。但是如果我遍历多个网页，我最终会得到空列表</em

浏览 19提问于2019-03-19得票数 0

1回答

有没有一种通过列表理解来迭代两个数据帧的更快方法？

、、

我有两个数据帧，一个包含屏幕名称/显示名称，另一个包含个人，我正在尝试创建第三个数据帧，每次屏幕名称/显示名称中出现姓氏时，在新行中包含来自每个数据帧的所有数据。从功能上讲，这将创建一个可能匹配的名称列表。我当前的代码运行得很好，但运行速度非常慢，如下所示： # Original Social Media Screen Nam

浏览 0提问于2016-04-11得票数 1

1回答

在使用带有正则表达式的Pandas.Series.Apply函数时发出

、、

我试图在数据帧中的特定列上应用正则表达式。import re 但出于某种原因，“k”实际上是一个包含空列表的Pandas<

浏览 3提问于2021-04-14得票数 0

3回答

“‘list”对象没有属性“head”

、

嗨，我需要这个编程代码的帮助。因此，我尝试将数据的月份排序为表示月份的数字(1月=1等等)。当我尝试应用一个方法来做这件事时，它给了我一个列表：‘TypeError’对象没有'head‘属性import operator import matplotlib.pyplot

浏览 103提问于2020-03-13得票数 0

回答已采纳

1回答

pandas系列和Dataframe中使用Spacy的词汇化问题

、、、、

我正在研究具有(14640,16)形状的，使用Pandas和Spacy进行预处理，但在获取lemmetized形式的文本时有问题。此外，如果我使用仅包含文本列的pandas系列(即只包含一列的数据帧)，也会出现不同的问题。")df[:3

浏览 12提问于2019-11-14得票数 1

回答已采纳

1回答

Python Pandas:导入列表的堆叠字典以创建多索引DataFrame

、、

我已经将一些数据导入到一个堆叠的列表字典中，它的结构如下：结构1： {product_name : {category_name : { column_title_1 :[val1,val2,val3string 1a","string 2b","string 3c"], "categories" :["category1","category1","category1"]}}} 我想把字典导

浏览 20提问于2019-09-29得票数 2

1回答

与系列、列表和唯一元素混淆

、、、、

但是，当我应用set()方法获取“标记”列表的唯一元素时，会出现以下错误：print tags.unique()AttributeError: 'list' object has no

浏览 3提问于2017-05-26得票数 0

回答已采纳

1回答

将所有行值与列表和计数匹配项进行比较

我想计算一下在pandas数据帧中出现的整数列表。应将数据帧的所有列与列表进行比较。例如，我有一份唯一号码的列表[15, 23, 30, 21, 2, 20]>>> df n1 n2 n3 n4 n5 n6 n7现在我想要

浏览 5提问于2020-06-03得票数 1

回答已采纳

1回答

当我抓取一个循环而不是直接访问它时，这个网页是如何阻止我的？

、

当我直接从一个网页上抓取时，我就能够访问html了。但是，当我迭代pd数据帧来抓取一组网页时，即使是只有一行的数据帧，我也会看到一个截断的html，并且无法提取我想要的数据。迭代通过1行的数据帧： import pandas as pdfr

浏览 8提问于2019-03-20得票数 0

回答已采纳

2回答

通过json文件输入的LSTM形状

、、

我正在进行LSTM的工作，在对数据进行预处理之后，我以列表的形式得到数据X，该列表包含3个功能列表，每个列表包含50分的列表序列。X = [list:100 [list:3 [list:50]]]由于它是一个多变量LSTM，我不知道如何将所有3个序列作为Keras的输入。我需要在Pandas<em

浏览 1提问于2020-10-06得票数 0

回答已采纳

1回答

如何在一个热编码中修复此ValueError？

、、

当尝试在Jupyter-Notebook中运行以下代码时，会导致以下错误：dataset_test.drop_duplicatesdataset_test_cat_data = pd.DataFrame(dataset_test_categorical_values_encenc.toarray(),columns=testdumcols) 错误: ValueError:传递的值的形状是(82332,151)，索引表

浏览 4提问于2021-05-25得票数 0

1回答

Python:无法比较数据帧中的字符串

、、、

我尝试在两个数据帧中查找字符串值，并且我使用的是Pandas库。第一个dataframe - df_transactions在'ErrList‘列中有一个错误代码列表第二个dataframe - df_action在“CODE”列中有一个错误列表，在“ACTION”列中有一个相应的错误列表。df_result‘’ActionLookup‘时，我没有得到与错误</

浏览 0提问于2016-11-14得票数 0

1回答

使用DataFrame将多个文件合并为一个文件

、、

现在我正在尝试将所有的CSV合并到一个唯一的主文件中，这样我就可以处理它了。但它不起作用。下面的代码是我尝试过的，我做错了什么？import globfrom pandas import read_csv for file in

浏览 24提问于2020-07-07得票数 0

1回答

预测分类网络中的单个值

、、

我正在遵循一个在线教程，其中的这些代码行是为了评估创建的模型：这对我来说非常有效，并告诉我在从X_test中选择的这10个输入上达到的精度。不幸的是，我真的不知道如何从X_test中预测一个特定

浏览 2提问于2017-11-09得票数 0

1回答

在没有内存错误的情况下将一个巨大的数据帧列表合并成一个数据帧？

我有一个巨大的数据帧(时间序列)列表(列表中超过5500个条目，每个条目的大小为750x2)。如何在不出现内存错误的情况下将其合并到单个数据帧中？我试过使用pandas.merge、pandas.concat，但什么都不起作用

浏览 0提问于2017-11-29得票数 0

1回答

迭代列表以创建数据帧输出Pandas

、、、、

亲爱的，我需要你的帮助来微调我的Python，Pandas的代码。我有一个列表: my_list = 405218,405211,309211,234589 我想迭代这个列表，使用每个元素进行细化，生成由1行25列的数据帧表示的输出。然后，我想创建一个dataframe，其中每一行代表一个输出，这样我就有了一个包含所有输出的dataframe。在

浏览 6提问于2020-09-15得票数 2

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

在对来自pandas数据帧的列表进行迭代时出现错误re.findall()

相关·内容

在对来自pandas数据帧的列表进行迭代时出现错误re.findall()

Dict to dask数据帧

尽管我使用的是建议的方法，Dask还是输出了使用client.scatter的警告

对pandas数据帧中的时间序列数据进行着色

通过迭代pd数据帧来抓取多个网页

有没有一种通过列表理解来迭代两个数据帧的更快方法？

在使用带有正则表达式的Pandas.Series.Apply函数时发出

“‘list”对象没有属性“head”

pandas系列和Dataframe中使用Spacy的词汇化问题

Python Pandas:导入列表的堆叠字典以创建多索引DataFrame

与系列、列表和唯一元素混淆

将所有行值与列表和计数匹配项进行比较

当我抓取一个循环而不是直接访问它时，这个网页是如何阻止我的？

通过json文件输入的LSTM形状

如何在一个热编码中修复此ValueError？

Python:无法比较数据帧中的字符串

使用DataFrame将多个文件合并为一个文件

预测分类网络中的单个值

在没有内存错误的情况下将一个巨大的数据帧列表合并成一个数据帧？

迭代列表以创建数据帧输出Pandas

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐