Pandas -在NaN中添加新的字符串列结果_在NaN中向pandas DataFrame添加新列的结果_在pandas中组合字符串列和NaN值时的意外行为 - 腾讯云开发者社区

python、regex、pandas、series

我目前正在做一些数据清理，我正在处理一个包含数字和字符串列的Pandas DataFrame。一些行的值类似于012345，另一些行的值与文本的Excel格式类似(例如="012345")。因此，请考虑下面的示例系列： raw_series = pd.Series([114254, 958554, '="142142"', '="987654"', 112233]) 运行以下代码段之后： re_numbers = re.compile(r"([0-9]*)") num_series = raw_s

浏览 2提问于2020-01-17得票数 0

回答已采纳

2回答

Pandas，将unicodes列转换为字符串列表列

python、string、unicode、pandas、type-conversion

我的一个pandas dataframe列包含这种u'asd,abc,tre,der34,whatever'的unicode。最终结果应该是一列字符串列：['asd','abc','tre','der34','whatever']。一份unicodes列表也可以：[u'asd',u'abc',u'tre',u'der34',u'whatever']。顺便说一句，在unicodes列中可能会出现nan或u‘。有什么建议

浏览 0提问于2014-08-07得票数 2

2回答

在pandas中如何根据字符串列中的NaN进行过滤？

python、pandas

我使用的是pandas 0.18。我已经使用pd.read_csv()从CSV加载了一个数据帧，看起来CSV中的空单元已经加载为数据帧中的NaN。现在，我想找出特定列中具有空值的行数，但我正在努力。这是我的数据框架： ods id provider 0 A86016 NaN emis 1 L81042 463061 NaN 2 C84013 NaN tpp 3 G82228 462941 emis 4 C81083 NaN tpp 这是我从df.de

浏览 3提问于2016-05-11得票数 9

回答已采纳

1回答

熊猫:如何使用包含np.nan的字符串列保存到hdf数据

python、pandas、hdf5

当熊猫包含字符串列时，我想知道是否有一种将熊猫数据保存到hdf的好方法。考虑到数据： In [6]: df.head() Out[6]:

浏览 13提问于2017-09-01得票数 3

回答已采纳

2回答

如何更新基于多个str值的列

python、pandas、numpy、dataframe

我正在创建一个小型财务管理程序，它将我的事务从CSV导入到Python中。我希望根据在‘details’列中找到的字符串为一个新列‘类别’赋值。我可以做一个，但我的问题是，如果我有一个庞大的可能的字符串列表，如何做到这一点？例如，str.contains('RALPHS')将该列值替换为‘杂货’，等等。例如，下面有一个字符串列表： dining = ['CARLS', 'SUBWAY', 'DOMINOS'] 如果在我的系列中找到这些字符串中的任何一个，那么它将更新相应的类别系列，使之成为“就餐”。下面是一个可运行的小例子。

浏览 0提问于2019-06-30得票数 0

回答已采纳

3回答

在Python中，有条件地将变量名连接到新变量中

python-3.x、pandas、string、if-statement、concatenation

我有一个数据集，包含3列和偶尔的NAs。我正在尝试创建一个名为'check‘的新字符串列，它将连接在每行下划线('_')之间没有安娜的变量的名称。我粘贴了下面的代码以及我拥有的数据，我需要的数据和我实际获得的数据(参见代码后面的超链接)。由于某些原因，我所拥有的条件似乎被完全忽略了，无论有没有条件代码块，都会在每个循环中执行example_set‘’check‘=example_set’‘check’+列。我假设有一个Python/Pandas怪癖，我还没有完全理解……你能帮帮忙吗？ example_set = pd.DataFrame({

浏览 32提问于2020-06-05得票数 0

回答已采纳

2回答

将字符串列的最后一个值展开为groupby Pandas Dataframe

python-3.x、string、pandas、dataframe、group-by

我有以下Pandas数据帧： +--------+----+ |id |name| +--------+----+ | 1| | | 1| | | 1| | | 1|Carl| | 2| | | 2| | | 2|John| +--------+----+ 我想要实现的是将每个组的最后一个值扩展到组的其余部分： +--------+----+ |id |name| +--------+----+ | 1|Carl| | 1|Carl| |

浏览 23提问于2019-11-25得票数 0

1回答

在Pandas Dataframe中使用NaN作为空字符串合法吗？

python、pandas

我正在从S3读取一个包含空值的字符串列的csv.gz文件。一旦我使用pandas.read_csv()方法读取了该文件， pandas.read_csv(io.BytesIO(csv_data['Body'].read()), sep='|',compression='gzip', engine='python', error_bad_lines=False, warn_bad_lines=True,

浏览 2提问于2020-03-26得票数 0

1回答

Python --老熊猫合并的结果比新的熊猫多。

python、pandas

我有两个环境：环境#1: Python3.7.5Pandas 0.23.4 环境#2: 3.8.10Pandas 1.3.4 Python 我在两个版本中都有相同的代码，没有对其进行任何修改。但是，我有这一行特定的代码，这些代码似乎导致了问题/产生了不同的输出： df_result = pd.merge(df_l, df_r, left_on=left_on, right_on=right_on, how='inner', suffixes=suffixes) df_l和df_r只是读取Excel文件。我在两个版本的调试器中检查了它们，它们是完全相同的，所以应该没问题。另外

浏览 1提问于2021-12-14得票数 0

回答已采纳

2回答

为什么dropna在本专栏中似乎不起作用？

python、pandas、na

我尝试删除一个列Filmname中的所有NA值，但是这些值没有被删除。为什么？(我的结果截图) 下面是我的代码： import pandas as pd df = read.csv.... df.dropna(subset=['Filmname'], inplace=True) df.head()

浏览 9提问于2018-06-15得票数 1

4回答

Python -计算一个列表和多个列表之间的精确匹配数。

python、pandas、dataframe

首先，我有一个excel文件(或csv文件)，并将其转换为dataframe (df)。接下来，第一列中有一个字符串主列表，其中包含字母数字字符。然后，在后续列中有字符串列表，它们可以是相同的长度(list1)、更短的(list2)或更长的(list3)。我想用count (或sum)表示master_list和其他列表之间的精确匹配数。 # Assign spreadsheet filename to `file` file = "list_match.xlsx" # Load spreadsheet import pandas as pd df = pd.read

浏览 0提问于2018-12-01得票数 1

回答已采纳

1回答

DataFrame列为多列

pandas、string、dataframe

列 ? 如何拆分包含如下字符串列表的数据框列 [{'1','1','1','1'},{'1','1','1','1'},{'1','1','1','1'},{'1','1','1','1'}] 在每个单元格中，放入多列数据帧？考虑到列的每个单元格中的列表长度不同！在上面的图像中，左边我们有第一列，右边我们正在观察我想要的结果。

浏览 17提问于2020-09-24得票数 0

4回答

如何将Pandas字符串列强制转换为新的可空Int64类型？

python、python-3.x、pandas、dataframe、types

我正在尝试将Pandas DataFrame中的字符串列转换为数字列。我使用以下DataFrame： import pandas as pd import numpy as np d = {'col1': ['1', '2'], 'col2': ['5', str(np.nan)], 'col3': [99, str(pd.NA)]} df = pd.DataFrame(d) print(df) col1 col2 col3 0 1 5 99 1 2 nan 现在，当我将col1从int转换

浏览 26提问于2020-03-04得票数 2

回答已采纳

1回答

如何将JSON字符串中的值‘null’替换为‘How’或‘How’？

python、pandas

import pandas as pd inp= [{'c1null':10,'cols':{'c2':20,'c3time':null}, 'c4':'41'}, {'c1null':11,'cols':{'c2':null,'c3time':'2014-05-24 19:20'},'c4':'42'}, {'c1null':12,'cols':{'

浏览 0提问于2019-03-22得票数 0

回答已采纳

2回答

Pandas HDFStore警告

python、pandas

我想知道为什么HDFStore会在pandas中的字符串列上给出警告。我认为它可能是我的实际数据库中的NaNs，但在这里尝试它会给我两个列的警告，即使其中一列不是混合的，只是字符串。使用.13.1 pandas和3.1.1表 In [75]: d1 = {1:{'Mix': 'Hello', 'Good': 'Hello'}} In [76]: d2 = {2:{'Good':'Goodbye'}} In [77]: d2_df = pd.DataFrame.from_dict(d2,orie

浏览 3提问于2014-06-06得票数 4

2回答

当拆分模式前的第一部分丢失时，拆分字符串列

pandas

我正在尝试将字符串列拆分为不同的列，并尝试使用How to split a column into two columns? 字符串的模式如下所示： import pandas as pd import numpy as np >>> data = {'ab': ['a - b', 'a - b', 'b', 'c', 'whatever']} >>> df = pd.DataFrame(data=data) ab 0 a -

浏览 27提问于2019-10-03得票数 1

回答已采纳

1回答

如何将字符串数据转换为int数据以准备线性回归？

python、pandas、dataframe

我正在准备我的数据进行回归。因此，我试图用以下代码将字符串列转换为整数： train["comment"] = train["comment"].astype(int) 但是我发现了一个错误：运行文件(‘C:/Users/hayyi/..spyder py3/tem.py’，wdir=‘C:/Users/hayyi/..spyder py3’)回溯(最近一次调用)：文件“C：\Users\hayyi.spyder-py3\tem.py”，第57行“注释”=.astype(Int) 文件"D:\SpyderUI\MiniConda\envs\spyde

浏览 16提问于2021-12-22得票数 0

回答已采纳

3回答

检查字符串列表中的NAN

python

有没有一种快速的方法来检查字符串列表中的NANs？我尝试了np.isnan(x)，但得到了TypeError消息Not implemented for this type，因为在大多数情况下，x是一个str类型。任何帮助都是非常感谢的。

浏览 0提问于2014-12-03得票数 0

2回答

从pandas列和行数据创建字符串

python、pandas

我感兴趣的是生成一个由pandas行和列数据组成的字符串。给定以下pandas数据帧，我只对从具有正值的列生成字符串感兴趣 index A B C 1 0 1 2 2 0 0 3 3 0 0 0 4 1 0 0 我想创建一个新列，该列追加一个字符串，该字符串列出一行中哪些列是正数。然后，我将删除数据来自的所有行： index Positives 1 B-1, C-2 2 C-3 4 A-1

浏览 1提问于2018-06-19得票数 1

1回答

避免FOR循环将多个字符串追加到列表中

python、dataframe、for-loop、append、list-comprehension

我需要用选定行上的一些字符串来更新DataFrame列，我为这些行建立了索引。到目前为止，我已经通过列表理解实现了我所需要的东西： [data.particleIDs.values[idx[i]].append(particlenames[i]) for i in range(len(idx))] 其中data.particleIDs是需要更新的DataFrame列，particlenames是一个包含字符串的列表，idx是一个数组，对于每个字符串，该数组包含需要写入的DataFrame行。几个字符串对应于同一行，我需要将它们都写在DataFrame列中。假设我有一个DataFrame和我用

浏览 10提问于2020-02-11得票数 3

1回答

熊猫/Numpy NaN无比较

python、python-3.x、pandas、nan、nonetype

在Pandas和Numpy中，为什么比较结果是不同的？ from pandas import Series from numpy import NaN NaN不等于NaN >>> NaN == NaN False 但是列表或元组中的NaN是 >>> [NaN] == [NaN], (NaN,) == (NaN,) (True, True) 当Series与NaN又不相等时： >>> Series([NaN]) == Series([NaN]) 0 False dtype: bool 和None >>> None ==

浏览 1提问于2018-09-21得票数 8

回答已采纳

2回答

Python将变量中经过编辑的NaN写入.csv

python、python-2.7、csv、nan

我正在尝试将.csv中的NULL值转换为NaN，然后使用这些编辑保存一个文件。下面代码中的f在数据中的正确位置具有NaN值。但是，我无法将其另存为.csv。错误显示在代码下方。 #take .csv with NULL and replaces with NaN - write numerical and NaN values to .csv import csv import numpy as np import pandas f = pandas.read_csv('C:\Users\mmso2\Google Drive\MABL Wind\_Semester 2 2016\W

浏览 29提问于2016-08-23得票数 1

回答已采纳

2回答

为包含DataFrame元素的熊猫NaN按列查找miminum值

python、pandas、numpy、dataframe、nan

我试图得到两个pandas Series之间的最小值。碰巧，本系列中的一些元素是NaN，当将其与数字进行比较时，我希望得到结果NaN。为什么我使用np.min函数我使用了np.min函数。这是因为我理解使用min函数会导致错误，因为当列表中存在NaN元素时，输出取决于列表中的顺序。就像我跑步时一样： import numpy as np print min([1,np.nan]) print min([np.nan,1]) 我得到的结果： >>> 1 nan 当我跑的时候： import numpy as np print np.min([np.nan,1]) pri

浏览 0提问于2018-08-13得票数 2

回答已采纳

1回答

串联成数据帧时创建的NaN列

python-3.x、pandas、dataframe

我已经创建了一个输出变量'a = pd.Series()'，然后使用一个for循环运行多个模拟，该循环使用以下代码将临时存储在'x‘中的模拟结果附加到连续列中的'a’，每个列都重命名为与模拟编号一致，从第0个位置开始： a = pandas.concat([a, x.rename(sim_count)], axis=1) 由于某种原因，结果数据帧在我的第一列模拟结果的左侧包含了一列"NaN“值，我无法删除它，如下所示(示例显示了三次模拟的结果)： 0 0 1 2 0 NaN 0.136799

浏览 33提问于2019-04-02得票数 0

回答已采纳

2回答

如何替换python中的平均值而不是缺失的值？

python、pandas、nan

在下面的代码中，我试图替换mean而不是缺失的值，但是我的尝试无法得到结果，因为这些数据包含特殊的字符"?“。当数据中没有问号时，此代码工作data.fillna(data.mean())。当我试图归罪方法时，我得到了以下错误： ValueError:无法对非数字数据使用均值策略:无法将字符串转换为浮动：此外，该数据还包括含有缺失值的字符串列，如何修复字符串列(例如rbc列)中缺少的值？这是我的数据： path = ("C:\\Users\\bbb\\Desktop\\ccc\\group5data.txt") names = ["age",&#

浏览 2提问于2021-05-16得票数 1

回答已采纳

2回答

如何合并/合并两个不同长度的pandas数据帧？

python、python-2.7、pandas、dataframe、merge

浏览 0提问于2018-04-21得票数 2

1回答

pandas.NaT的字符串表示有时是"nan“而不是"NaT”。

python、pandas

当我将pandas.NaT转换为字符串时，结果有时是"nan"而不是"NaT"。我很抱歉，但我无法在一个MWE与示例数据再现这一点。也许这取决于DataFrame的大小？我正在使用pandas==1.3.0。我创建了一个包含日期时间对象的列的字符串表示形式，其中一些对象是NaT，如下所示： df['X'] = df.ZEIT_VON.apply(str) 让我们看看结果 >>> df_roh.loc[60:63, ['ZEIT_VON', 'X']] ZEIT_VON X 60

浏览 4提问于2022-02-16得票数 0

回答已采纳

1回答

不能用panas.append函数追加数据

python、pandas

下面的代码没有运行，我不知道为什么。 import pandas as pd import numpy as np df = pd.DataFrame(columns=['Interval', 'Weight']) intersection = np.array([1,2,3,4,5]) weight = 0.85 df.append({'Intersection':intersection,'Weight':weight}, ignore_index=True) print(df) 我得到的结果如下：空DataFrame

浏览 1提问于2020-06-26得票数 0

回答已采纳

1回答

获取空白结果pandas

python、pandas、dataframe

Python 3.9和Pandas 1.3.4 下面是我正在使用的数据框架： First name Last Name Freddie Mercury John Lennon David Bowie Joseph Jovi 我希望df["Full name"] = df["First name"] + df["Last name"]的结果能够产生一个结果，即使它没有同时填充名字和姓氏列。所以df["Full name"]= Full name Freddie Merc

浏览 19提问于2021-11-22得票数 0

回答已采纳

2回答

如何根据列表的值从pandas中选择行

python、pandas

我有一个pandas数据帧，其中一列(假设是col_1)是一个字符串列表。我只想从col_1 (列表)包含特定关键字的数据框中选择行，例如'late‘。下面是一个例子 col_1 col_2 0 [no issue] fff 1 [late.., no issue] fff 2 [late...] 所以我想选择第2行和第3行。

浏览 44提问于2018-08-03得票数 -3

1回答

为什么应用于pandas字符串列的np.mean不会产生错误？

python、pandas、numpy

在字符串列上计算平均值的逻辑是如何工作的(结果是246.8)？它有什么具体的用例吗？ import pandas as pd import numpy as np s = np.array(["0", "1", "2", "3", "4"]) pd.DataFrame(s).mean() Out[1]: 0 246.8 dtype: float64 为了清楚起见，我意识到要计算数字的平均值，我应该做一些沿着这些线的事情。 pd.DataFrame(s.astype(int)).mean() Out[

浏览 25提问于2021-07-01得票数 2

回答已采纳

2回答

Python :连接包含空的熊猫字符串

python、string、pandas

我正在尝试连接包含空值的多个字符串列。但是结果并不显示串连字符串，而只是显示第一列。如何忽略包含null的值？我试图通过替换nan值来处理这个问题，但这并没有帮助。 import pandas as pd import numpy as np df = pd.DataFrame({'Addr1':['a','b','c'], 'Addr2':['', 'x', np.nan], 'Addr3':['202', '201', '2

浏览 2提问于2020-03-25得票数 1

回答已采纳

2回答

将单个Pandas DataFrame行追加到列表并转换为矩阵

python、pandas、csv、matrix

我有一个由数百行组成的csv，每行都包含需要保持在一起的唯一值。它们的格式如下： WordTeams (column name) 1 cat, dog, frisbee, person, rat 2 mouse, cheese, saw, mat, moose 我正在尝试使用pandas将它们转换成一个列表，如下所示： [cat, dog, frisbee, person, rat] [mouse, cheese, saw, mat, moose] 我是pandas的新手，不知道如何在列表中添加单独的行。最后，我希望将这些列表转换为比较它们自身的矩阵，如下所示。我打算通过将每个单元格值

浏览 2提问于2017-10-26得票数 0

2回答

当存在混合类型列时，如何只选择字符串(非数字)列？

python、pandas、numpy

假设我有一个具有dtype (object、int和float)的三列的数据框架： df = pd.DataFrame({ 'col1': [1, 2, np.nan, 5], 'col2': [3, 4, 5, 4], 'col3': ['This is a text column'] * 4 }) 我需要将np.nan替换为None，它是一个对象(因为None在导入到PostgresSQL时变为NULL )。 df.replace({np.nan: None}, inplace=True) 我认为(如果

浏览 7提问于2021-12-18得票数 1

回答已采纳

1回答

我是否可以在Python列中使用正则表达式搜索或匹配，其中每个单元格都是列表列表？

python、regex、pandas、flatten、dummy-variable

我有一个有点大的CSV文件(>2000行)，我已经读到了Pandas，并且希望根据某个数据列中是否出现一个特定的单词来创建一个新的指示器列。我一直在尝试使用regex搜索，这可能过于致命，因为单词总是会被空格分隔，但是DataFrame的单元格是字符串列表的列表。我尝试过使用双列表理解进行迭代，但也存在错误，而且作为Python新手，我也很好奇，是否有一个通用的解决方案来处理未指定数量的嵌套列表。下面是一个示例，其中我的最终目标是一个新列，其中的行中有1，其中单词'saddle'在选定列的任何位置出现在单元格中，如果没有，则为0。我的DataFrame看起来像这样 im

浏览 2提问于2020-05-23得票数 0

回答已采纳

2回答

我想从包含不同字符串的列中分离整数和浮点数

python、pandas

我尝试从我尝试过data['new'] = data['text'].str.extract(r'^\d+\.\d+$')的字符串列中仅提取整数和浮点数

浏览 24提问于2019-09-20得票数 1

回答已采纳

1回答

将整个字典存储在Pandas DataFrame的一个元素/单元中？

python-3.x、pandas、dataframe、dictionary

可以在一个熊猫DataFrame的一个元素中存储一个复杂的字典吗？然后用类似的结构化字典填满整个专栏，好吗？我的迷你示例 import pandas as pd import numpy as np #create an example dict dict={} dict['key1']=np.array([[1, 2, 3], [4, 5, 6]]) dict['key2']=np.array([2]) dict['key3']='Mexico' #create the pd D

浏览 42提问于2021-07-03得票数 0

回答已采纳

1回答

在.csv中不提取"NaN“

python、python-2.7、pandas、nan

我的目标是传递.xlsx文件并将其转换为.csv，然后进行解析以删除.csv中的特殊字符，并在空单元格中显示"NaN“。为了做到这一点，我使用下面的代码。如果我在控制台上运行下面的命令，后跟#df，它会在输出中显示NaN。另一方面，如果我运行代码，不能捕获.csv中的"NaN“吗？ df = pd.read_excel('C:\\Users\\1480587\\Documents\\Chander\\Elastic\\Data\\Dec_Inc_Data.xlsx') 使用以下版本的Python和Pandas。 INSTALLED VERSIONS -----

浏览 3提问于2018-03-19得票数 0

2回答

巨蟒熊猫扔parseError

python、pandas

我需要使用蟒蛇熊猫的帮助。我有一个A.txt，它有这些数据(这是一个例子) 0003343 01901310 8193910 91931 9183131 89102010 7373819 83003 3692429 92920202 和B.txt 424u20u 092u9j 902u39 9293u2 9u193jj 901u39 jdo910 903u98 ue9un88 因此，对于A.txt，我执行了以下操作，并打印了顶部列数的数据 import pandas as pd fileRead = pd.read_csv("A.txt", delim_whitespace

浏览 8提问于2017-07-19得票数 2

回答已采纳

2回答

如何在Streamlit中用<NA>()或st.table()隐藏“st.dataframe”(NaN)值？

python、pandas、dataframe、nan、streamlit

当我在Streamlit中显示Pandas DataFrame时，使用st.dataframe()或st.table()，NaN值显示为文本<NA>。我想把它们藏起来。代码： # table.py import pandas as pd import streamlit as st df = pd.read_csv("nlp_metrics_v2.csv", header=0) st.dataframe(df) # nlp_metrics_v2.csv Model,NLP Model,NLP Prime,YOLO-NLP Average Rouge 1,,,

浏览 8提问于2022-08-12得票数 2

1回答

熊猫栏浮成一串巨蟒

python、pandas、types

例如，我创建了一个名为“order_num”的新列 import pandas import numpy as np import os df=pandas.read_excel(os.getcwd() + r"/excel.xlsx", sheet=0, skiprows=0,) df['order_num']=np.nan 我想把一些价值放在新创建的列上 df.set_value(index, 'order_num', 'somestr') 出现了错误信息 ValueError:无法将字符串转换为浮动：“somestr”

浏览 1提问于2017-11-07得票数 1

回答已采纳

1回答

Python删除Pandas数据帧奇怪输出中的单引号

python、pandas

在我的dataframe中有一个字符串列，如下所示 acctno '12345 12345 12345-5678 我正在尝试删除列中的单引号(‘)。我运行了下面的代码 df['acctno'] = df['acctno'].str.replace("[']", "") 输出结果和我预期的不一样输出“ acctno 12345 nan 12345-5678 试图理解为什么不带单引号的12345值被删除，而不是保持原样。感谢任何人的帮助！

浏览 101提问于2021-05-26得票数 0

回答已采纳

1回答

使用.concat创建pandas数据帧时包含空序列

python、pandas、concatenation、multi-index

更新:至少从pandas 0.18.1版本开始，这不再是一个问题。连接空序列不再丢弃它们，所以这个问题已经过时了。我想使用.concat从系列列表中创建一个pandas数据帧。问题是，当其中一个序列为空时，它不会包含在结果数据帧中，但是当我随后尝试用多索引重命名它的列时，这会使数据帧成为错误的维度。更新:这里有一个例子... import pandas as pd sers1 = pd.Series() sers2 = pd.Series(['a', 'b', 'c']) df1 = pd.concat([sers1, sers2], axi

浏览 2提问于2015-05-29得票数 6

回答已采纳

2回答

列表的搜索列

python、pandas、list

我有一个df，它包含一个字符串列表。我想要创建精确匹配的col_I_want。 lookfor=["apple", "nectarine"] col col_I_want 0 ["apple", "banana", "nectarine"] ["apple", "nectarine"] 1 ["pear", "banana"] np.NaN

浏览 3提问于2022-10-18得票数 0

回答已采纳

1回答

pandas有效空值

pandas、fillna

我正在寻找pandas fillna()方法将替换的有效空值的列表，例如'NaT‘，'NA'，'NULL'，’NaT‘。我在中找不到它

浏览 10提问于2018-01-11得票数 0

回答已采纳

1回答

AttributeError：“str”对象没有属性“rint”-如何替换或忽略数字列中的文本

python、string、pandas、attributeerror

我正在尝试将计算出的列数添加到csv文件中。但是，这些列包含一些字符串形式的文本(它不应该在那里)，所以当我尝试运行代码时，我会收到一个AttributeError。如果有人知道如何删除numbers列中的所有字符串(即将字符串列转换为浮点型)。否则，我试着忽略这个错误，但是except函数没有帮助。 import pandas as pd try: df = pd.read_csv('test.csv') df['new_numbers_column'] = (df['numbers_column']+2)

浏览 1提问于2018-09-11得票数 0

1回答

基于条件的熊猫DataFrame重复值

python、pandas

我试图根据列中的条件在DataFrame中重复行值。如果列中的值更改为1，那么我想重复A、B和C列中的值，直到下一个更改= 1为止。 index = pandas.date_range('20000131', periods=5) columns = ['A', 'B', 'C', 'Change'] data = {'A': pandas.Series([False, True, False, True, False], index=index) , 'B': panda

浏览 1提问于2014-06-14得票数 3

回答已采纳

3回答

从数组中的字符串集提取ID和值

python、pandas

我在解决以下问题时遇到了困难。我有一个pandas df['subjects']，它有一个字符串列表。 df['subjects'].head(3) = 0['B:1187', 'B:1188', 'P:123456', 'B:62'] 1['G:1', 'G:1C', 'G:21', 'G:3', 'G:30'] 2['B:71', 'E:D', 'G:6J', &

浏览 0提问于2020-02-07得票数 1

1回答

从dataframe列值中分离的最佳方法

python、pandas、performance

我有一个带有字符串列的pandas.DataFrame，我想使用在我的程序中分割的他的值。我有两种方法可以做到这一点，但我需要知道理论上哪一种更快，以及为什么： s1 = [x.split() for x in df[_COLUMN_]] s2= df[_COLUMN_].apply(lambda x: x.split()) 我用%%time在笔记本上跑步，但在我的睾丸里我看不出有什么不同。我知道结果对象对于每一种方式都是不同的，但我也可以使用这两种方法。

浏览 1提问于2021-07-29得票数 1

回答已采纳

3回答

用潘达斯管理“南”(大写字母)的方法？

python、python-3.x、pandas、nan

您知道是否有一种方法来管理"NAN“所有的大写字母显示在一个数据文件中与Pandas？我有一些数据文件具有这种格式： "2020-08-14 14:00:00",10,154.9554,153.6879,154.3988,158.5282,"NAN","NAN",158.43,"NAN",155.2103 .isnull()和.isna()函数在"nan“大写时不处理，而是在以"NAN”或"NaN“的方式编写时处理。事先谢谢你，我寻找其他的话题，但没有关于这个具体的主题。

浏览 17提问于2022-03-05得票数 1

回答已采纳