Python子字符串a dataframe列无法正常工作

问题描述：Python子字符串a dataframe列无法正常工作。

回答：

Python子字符串是指从一个字符串中提取出部分字符串，常用的方法有切片和正则表达式等。

在处理DataFrame列时，如果遇到子字符串无法正常工作的情况，可能是由于以下原因：

数据类型错误：首先要确认DataFrame列的数据类型是否为字符串类型。可以使用dtype属性检查列的数据类型，如果不是字符串类型，可以使用astype方法进行转换。

df['column'] = df['column'].astype(str)

列名错误：请确保列名输入正确，不要输入错大小写或者含有空格等字符。可以使用columns属性查看所有列名，使用head()方法查看前几行数据。

print(df.columns)
print(df.head())

子字符串提取方法错误：子字符串的提取方法有多种，包括切片、正则表达式、字符串函数等。请确认使用的方法正确，并根据需要调整参数。

例如，如果要提取列中的前几个字符，可以使用切片：

df['column'] = df['column'].str[:n]

如果要根据特定的模式提取子字符串，可以使用正则表达式：

import re
df['column'] = df['column'].str.extract(r'(\d+)')

缺失值处理：如果列中存在缺失值（NaN），可能会导致子字符串无法正常工作。可以使用fillna方法填充缺失值或者使用dropna方法删除含有缺失值的行。

df['column'] = df['column'].fillna('')
df = df.dropna(subset=['column'])

其他问题：如果以上方法仍然无法解决问题，可能涉及更复杂的数据清洗或处理步骤。可以考虑使用其他数据处理库或函数来解决。

腾讯云相关产品推荐：

腾讯云云服务器（CVM）：提供稳定、安全的云服务器实例，满足各类业务需求。产品介绍：https://cloud.tencent.com/product/cvm
腾讯云弹性MapReduce（EMR）：基于Hadoop和Spark的大数据处理和分析平台，可快速搭建和管理大数据集群。产品介绍：https://cloud.tencent.com/product/emr
腾讯云容器服务（TKE）：提供可弹性扩展的容器化应用管理平台，简化容器集群的部署和管理。产品介绍：https://cloud.tencent.com/product/tke

请注意，以上推荐的腾讯云产品仅为示例，不代表其他品牌商产品的替代品或推广行为。

Python子字符串a dataframe列无法正常工作

、

我正在使用一段代码，如下所示 output_df['test'] = str(output_df['givencolumn'].str[0:2]) 我不明白为什么.str0:2会在Output_df的测试列中返回下面这样的内容我希望我的测试列看起来像这样 Index test1 013 01 4 01 所以，我现在找到了问题所在：这是有效的 output_df

浏览 11提问于2019-06-07得票数 0

回答已采纳

1回答

根据Keras中的图像和子文件夹名称设置用于训练CNN的X和Y

、

下面的代码片段给了我属于三个类的150张图片(有三个子文件夹，每个子文件夹中有50张图片-这些文件夹以我正在尝试编写CNN进行分类的Iris的类命名)。我的问题是，如何将图像的np数组设置为我的X和子文件夹名称作为我的y，以便训练我的CNN？

浏览 26提问于2020-06-20得票数 0

回答已采纳

1回答

pandas:一列是另一列的子字符串

、、

我正在尝试测试一列(surname)是否是dataframe (el)中另一列(name)的子字符串。我尝试过以下方法，但python不喜欢它 el.name.str.contains(el.surname) 我可以看到许多关于如何搜索文字子字符串的示例，但在子字符串是列的情况下却看不到。

浏览 20提问于2020-07-24得票数 1

回答已采纳

1回答

使用Python向子字符串添加值的建议

、、

我正在寻找关于如何让python将子字符串中的空空间转换为破折号(-)的建议。在下面的dataframe列中，A有原始数据，需要向其中有空格的子字符串中添加一个破折号，以获得列B。

浏览 0提问于2019-04-25得票数 1

回答已采纳

2回答

删除dataframe中包含字符串的所有列

、

有些列有时包含字符串，我想删除数据帧中包含字符串的所有列。我的代码现在没有引发任何错误，但无法正常工作。def StringNoMore(dataframe): print(i) for cellin dataframe.iloc[i]: dataframe=dat

浏览 9提问于2017-02-20得票数 0

回答已采纳

1回答

Azure ML & Pandas:如何将字符串转换为DateTime

、、、

我手头有一个数据集，其中有一列字符串格式的DateTime，例如。a = 'Tue Sep 22 1998 00:00:00 GMT+0000 (Coordinated Universal Time)' A只是该列中的一个值。如果我在Azure Machine Learning Studio中使用元数据编辑器，它将无法工作，并会抱怨它无法进行转换(从String到DateTime)。我猜这与格式有关。但是，当我可视化Python脚本的输出时，我发现<

浏览 1提问于2015-03-21得票数 3

4回答

获取具有给定分隔符的列daframe中所有项目的子字符串

、

我有一个列中有字符串的dataframe。df=pd.DataFrame({'Col1':['asa asas s','qw wewe de','ewew ewe ww']}) 我需要将这个字符串从第一个空格字符拆分为2。因此，生成的数据框应该有两个额外的列。子字符串，如下所示： df['ColIdx']=df.Col1.str.find('

浏览 36提问于2020-11-21得票数 1

1回答

Pandas找不到包含括号的子字符串

、

我想在特定的Pandas中查找一个子字符串 列。子字符串和搜索字符串包含括号。当我使用内置的方法时，Pandas不会找到子字符串，即使它很明显就在那里。pd substr1 = "Alice (Bob) Charlie" df = pd.DataFrame({&

浏览 224提问于2021-03-01得票数 1

回答已采纳

1回答

从URL创建名称

、

我正在DataFrame中创建一个NAME列，并根据另一列中包含的子字符串设置它的值。df = pd.DataFrame([['www.pandas.org','low'], ['www.python.org','high']], columnsdf.loc[df['Name'].str.

浏览 0提问于2020-06-25得票数 3

回答已采纳

2回答

使用松弛字典映射列中的值

、、、、

我想知道是否有人能帮我把一列字符串与python中一种轻松的字典相匹配。因此，我有以下python数据框架：8392apple830938banananflks9fruitsearch(string):它可以取子串的键，如子搜索

浏览 4提问于2018-10-11得票数 3

回答已采纳

1回答

熊猫drop_duplicates在朱庇特笔记本和巨蟒脚本之间没有一致的工作

、、、

我正在将条目添加到现有的dataframe中，在那里它们可以是新的，也可以是现有的dataframe中的更新。通过使用Pandas drop_duplicates，旧的和过时的条目将被删除。Pandas drop_duplicates在木星笔记本上正常工作： df.drop_duplicates(keep = 'last', inplace = True, subset = ['col_a但是，当我将代码转移到python脚本并通过CLI运行它时，复制的/过时的条目

浏览 3提问于2019-12-11得票数 1

1回答

将字符串替换为DataFrame列中的子字符串

、

我正在尝试将DataFrame中的列与子字符串列表中的一个匹配。例如，取具有下列值的列(strings)： text1C1text2text4B text4A3 并创建一个将它们与以下子字符串相匹配的新列： vals = ['text1', 'text2', 'text3', 'text4', 'text4B'] 我目前拥有的代码可以

浏览 15提问于2019-05-10得票数 1

回答已采纳

1回答

如果不使用rtrim，right()函数将无法工作。只像这样工作:对(rtrim(Column_name)，value)为什么？

、

我不明白为什么没有rtrim，right()函数就不能工作。我尝试使用right()函数从右侧获取一个子字符串计数。结果只显示空白列。当我尝试使用left()函数从左侧获取子字符串时，它可以正常工作，但是如果不使用RTRIM

浏览 2提问于2019-09-10得票数 0

1回答

检查字符串以在中创建新列。

、、、、

我有一个带有交易对的Spark dataframe列，我需要使用它来创建一个新列，其中包含硬币的名称。第一列" bot“包含"Polkadot/USD"，我需要一个名为”硬币“的新列，它只包含bot列的子字符串"Polkadot”。其他行也一样。基本上，新列需要删除子字符串"/USD“。注意:笔记本是Python

浏览 2提问于2021-07-26得票数 1

回答已采纳

1回答

熊猫使用单独的dataframe的值来搜索子字符串。

、、、

基本上，我有一个带有多个工作表的excel电子表格，对于这个python程序，我只关心其中的两个，更具体地说，每个表中有一列。我想从一个dataframe/column ( A )中获取所有值，并查看第二个dataframe/column ( B )是否包含来自A列的该值的子字符串。最终，我想要一个csv输出，其中包含A列的行，其中A列的值在B列中没有子

浏览 2提问于2022-05-24得票数 0

回答已采纳

1回答

在包含字符串列表的dataframe列中搜索字符串并返回完整的dataframe

、、

我有一个dataframe df，它有4列'A','B','C','D' 我必须在每个列中搜索一个子字符串，并按照搜索顺序返回完整的dataframe，例如，如果我在列B行3,4,5中获得子字符串，那么我的最后一个为此，我使用的是df[df['A'].str.contains('string_to _search')

浏览 1提问于2020-05-08得票数 1

回答已采纳

2回答

在熊猫df中用包含空格的子字符串在+后提取行

、、、、

我希望获得df中的所有行，其path列包含一个子字符串new+ folder。这个问题和cs95的答案对于new+或fol这样的子字符串非常有用，但是当我搜索时结果是不正确的。>>>dft = pandas.DataFrame([[ '/new+folder/'], ['/new+ folder/']], columns=['a'])0&#

浏览 1提问于2019-07-28得票数 4

回答已采纳

2回答

Python Pandas循环通过Dataframe无法正常工作

、、、

尝试编写pandas/python程序来执行api调用并提取主机的状态，然后迭代数据框列之一并将状态列添加到输出我正在尝试的是： import requestsimportpandas as pd df = pd.read_table('c:\csv\input1.csv', engine='python', sep="\s*,\s*", skipinitialspace

浏览 13提问于2020-06-09得票数 0

1回答

在一棵有熊猫的树上找到所有叶子节的祖先

、、、、

我有一个有两列的表，“父”和“子”。这是从SAP (ERP)下载的SETNODE表。需要在python中创建一个dataframe，其中包含与其父级和以前所有级别相关的每个级别，这是它自己的列。在python 3+中。对于整个关系，有一个未知的(或总是不断变化的)级别数，这样就不能总是定义最大级别。我想要创建一个完整的dataframe表，它显示了所有级别的所有父/子关系。现在它大约是15个级别，但是对于我工作过的其他数据

浏览 0提问于2018-12-26得票数 3

回答已采纳

1回答

子字符串无法正常工作

、

我正在尝试让c#从txt文件中的每一行读取文本，然后根据该行设置一个变量，这就是我尝试使用的代码 string line;StreamReader stRead = file.OpenText();{ { Version.TryParse(line.Substring(8)

浏览 2提问于2014-02-16得票数 0

点击加载更多

扫码

添加站长进交流群

领取专属 10元无门槛券

手把手带您无忧上云

Python子字符串a dataframe列无法正常工作

相关·内容

Python子字符串a dataframe列无法正常工作

根据Keras中的图像和子文件夹名称设置用于训练CNN的X和Y

pandas:一列是另一列的子字符串

使用Python向子字符串添加值的建议

删除dataframe中包含字符串的所有列

Azure ML & Pandas:如何将字符串转换为DateTime

获取具有给定分隔符的列daframe中所有项目的子字符串

Pandas找不到包含括号的子字符串

从URL创建名称

使用松弛字典映射列中的值

熊猫drop_duplicates在朱庇特笔记本和巨蟒脚本之间没有一致的工作

将字符串替换为DataFrame列中的子字符串

如果不使用rtrim，right()函数将无法工作。只像这样工作:对(rtrim(Column_name)，value)为什么？

检查字符串以在中创建新列。

熊猫使用单独的dataframe的值来搜索子字符串。

在包含字符串列表的dataframe列中搜索字符串并返回完整的dataframe

在熊猫df中用包含空格的子字符串在+后提取行

Python Pandas循环通过Dataframe无法正常工作

在一棵有熊猫的树上找到所有叶子节的祖先

子字符串无法正常工作

扫码

相关资讯

热门标签

活动推荐

运营活动

社区

活动

资源

关于

腾讯云开发者

热门产品

热门推荐

更多推荐