Pandas使用数组分配列值_Pandas Dataframe :根据列值分配整数值_使用pandas，如何根据来自另一列的值分配列中的值？ - 腾讯云开发者社区

python、pandas

我有一个Pandas DataFrame，包含i、行和j列。我希望将这个DataFrame中的值替换为第二个DataFrame中的所有值，后者具有相同的i行，但有k列，其中k是j的子集。有效的办法是： for col in df2.columns: df1[col] = df2[col] 有没有一种更快、更无头绪的方法？

浏览 2提问于2019-01-24得票数 1

回答已采纳

1回答

使用多列将包含多个elif分支的IF语句传递给Pandas数据with

python、pandas、if-statement

以下是我的dataframe (Mrp)快照：我试图将以下逻辑应用于每一行，并将结果保存到一个新列中： def planning_period(x): if x <= 30: return mrp['p01'] + mrp['p02'] elif x <= 60: return mrp['p01'] + mrp['p02'] + mrp['p03'] elif x <= 90: return mrp['p01'

浏览 3提问于2022-07-23得票数 -1

2回答

pandas.DataFrame.assign:如何引用新创建的列？

python、python-3.x、pandas、dataframe

我试图在Pandas 1.5.2中使用pandas.DataFrame.assign。让我们考虑一下下面的代码，例如： df = pd.DataFrame({"col1":[1,2,3], "col2": [4,5,6]}) df.assign( test1="hello", test2=df.test1 + " world" ) 我正面临这个错误： AttributeError: DataFrame对象没有属性“test1” 但是，它明确指出：可以在同一个assign中分配多个列。**kwargs中的

浏览 1提问于2022-11-28得票数 1

回答已采纳

1回答

追加dataframe列的模式仅在dataframe的第一行创建值

python、pandas、dataframe

在过去遇到一些损坏的csv文件后，我正在编写一个some python代码，它允许过滤掉这些错误行，这样我就可以手动检查它们的模式，如果可能的话，还可以修复它们。然而，当我想要添加适当数量的列时，我希望文件有，我只得到“模式”，最频繁的分隔符观察在第一行，而不是所有行。这种损坏的csvs文件通常出现在一行的分隔符比它实际包含的列多的时候(例如，如果客户的名称也有一个；，然后excel也拆分它，因此将所有列向右移动一到一)我想要加载到的每个块查看第一列中的分隔符的数量，将其与块的“正确”分隔符数量进行比较(我使用模式作为共识)，然后简单地将这个错误的行发送给一个列表。我相信这个错误来自于

浏览 23提问于2019-05-27得票数 1

回答已采纳

1回答

为什么pandas.where()返回'None‘

python-3.x、pandas

我试图使用pandas.where()从数据帧中的列中删除负值。删除负值的最明显方法是在列上运行pandas.abs()。所以： import pandas as pd frame = pd.DataFrame([-1,-1,-3,-4,-5],columns=["amount"]) frame.amount = frame.amount.abs() 但是我想使用pandas.where()来尝试同样的方法。因此，我尝试了以下几点： frame.amount = frame["amount"].where(frame["amount"] &

浏览 0提问于2019-05-27得票数 2

回答已采纳

2回答

如何正确地修改数据格式中的单元格？

python、pandas、dataframe

我有一个代码，我正在修改这样的单元格：IBM["PNL"][2]=3。它有效，但它显示了一个警告： A value is trying to be set on a copy of a slice from a DataFrame See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy 根据我在本文中所能读到的，修改该值的一种适当方法是IBM.loc[2,"PNL"]=3。但

浏览 5提问于2017-05-14得票数 2

回答已采纳

2回答

我无法在PyCharm上使用Pandas读取CSV文件，尽管我已经安装了熊猫。

python、pandas、pycharm

import pandas as pd import numpy as np data = pd.read_csv('dataset.csv') print(data.head()) 文件“C:/ /Shantanu Shubham/PycharmProjects/dash/dashboard.py"，第6行，在data = pd.read_csv('gapminder.csv') File "C:\Users\Shantanu 第685行，在parser_f返回_read(filepath_or_buffer，文件"C:\Users\

浏览 3提问于2019-10-25得票数 0

1回答

loc和iloc方法在赋值时的行为是否不同？

python、pandas、pandas-loc

我需要根据另一列中的ID向dataframe添加一个新列。我创建了一个关于我想要做的事情的小片段： import pandas as pd import numpy as np a = pd.DataFrame([['ass-123-43', ['123', '456']],['ass-123-44', ['123', '457']]], columns=['customer_id', 'order_id']) b = pd.DataFrame([['a

浏览 4提问于2022-03-20得票数 0

回答已采纳

1回答

根据某些条件手动创建假人，出了什么问题？

python-2.7、csv、pandas

我有一个包含数字和NaNs列的数据集。我想要创建一个新的虚拟变量列，以便进一步计算。显然有些地方不对劲，因为不管我做什么，假人都是1。 import pandas as pd import numpy as np all_air = pd.read_csv('small.csv') all_air['D(0/1)']=np.nan #all_air['C'].fillna(-1) #pandas will take NaN as 0 in calculation, right? print all_air['C'] for

浏览 3提问于2014-04-22得票数 2

回答已采纳

1回答

只对20列数据帧中的2列进行排序

python、python-3.x、pandas

我在一个5行的组(dataframe)中有20列。我只想强制排序2列，并保持其他列不变。我试过使用 group2['Col1','Col2'] = group2['Col1','Col2'].sort_values(by=['Col2']) 它会产生错误 return self._engine.get_loc(self._maybe_cast_indexer(key)) File "pandas/_libs/index.pyx", line 108, in pandas._libs.in

浏览 9提问于2019-09-06得票数 1

回答已采纳

1回答

Get_loc中的自我回溯(最近一次调用) ~\anaconda3\lib\site-packages\pandas\core\indexes\base.py (自身、关键字、方法、容差) KeyError Traceback (最近一次调用上次调用)get_loc中的自身

python、python-3.x、pandas

我在尝试kaggle的房价数据集。我试图从名为‘NaN’的列中清除Alle值 for column in missing_data.columns.values.tolist(): print(column) print(missing_data[column].value_counts()) print("") Id False 1460 Name: Id, dtype: int64 MSSubClass False 1460 Name: MSSubClass, dtype: int64 MSZoning False 1460

浏览 169提问于2020-10-05得票数 0

5回答

ValueError:不能设置没有定义索引的帧，也不能设置不能转换为级数的值

python

我在python 3.X中使用了Pandas 0.20.3，我想从另一个熊猫数据框架中添加一列到熊猫数据框架中。这两个数据帧都包含51行。因此，我使用了以下代码： class_df['phone']=group['phone'].values 我收到以下错误消息： ValueError: Cannot set a frame with no defined index and a value that cannot be converted to a Series class_df.dtypes给了我： Group_ID object YEAR

浏览 1提问于2018-01-17得票数 45

回答已采纳

1回答

在for循环中附加了pandas的新列中获取不需要的值

python、pandas

我正在尝试编写一个脚本，该脚本遍历dataframe中的行，并根据列C中的条件从列A或列B追加值来创建一个新列。然而，在列中追加行似乎有问题，因为我的新列包含几个值。 import pandas as pd import numpy as np #Loading in the csv file filename = '35180_TRA_data.csv' df1 = pd.read_csv(filename, sep=',', nrows=1300, skiprows=25, index_col=False, header=0) #Calculating

浏览 0提问于2019-06-13得票数 1

2回答

如何在大熊猫中进行分裂

python、pandas、dataframe

考虑下面是我的数据框架，我希望填充百分比列，将单个标记除以Total，以获得百分比。 Name Marks 0 Total 100 1 Name1 45 2 Name2 65 3 name3 93 4 name4 89 我写了这样的代码 for i in range(0,5): pcnt=(df['Marks'][i])/(df['Marks'][0]) df['Percentage']=pcnt*100 但是百分比列只为所有行生成0。上面的代码只是一个例子

浏览 0提问于2018-03-10得票数 1

回答已采纳

2回答

创建一个新列作为Pandas DataFrame的计数

python、pandas、dataframe、datetime

我有一个熊猫DataFrame。我如何创建一个类似于Pandas计数的新列，因为我已经将我的索引设置为DataFrame。例如，以下代码可在您的本地PC上重现： import datetime import numpy dates = [ datetime.date(2019, 1, 13), datetime.date(2020, 5, 11), datetime.date(2018, 7, 24), datetime.date(2019, 3, 23), datetime.date(2020, 2, 16) ] data = {

浏览 16提问于2020-03-05得票数 2

2回答

对从Pandas value_counts()提取的值进行计数

python、pandas

这看起来很简单，但我在其他答案中并没有完全找到它。如何将pandas中某些条件的计数赋值给某个变量，示例如下：命令(计算pandas dataframe中某列的类别)： print(data.isBald.value_counts()) 输出： Bald 2345 notBald 5432 Name: isBald, dtype: int64 问题是： isBaldCount = ? #2345 结果是打印，但是如何将其赋值给变量呢？

浏览 3提问于2018-01-10得票数 3

回答已采纳

1回答

如何在包含分类变量的Pandas数据帧中仅降低数值列的值？

python、pandas

我有一个Pandas数据框架，并希望降低每个数字列的级别，保持分类变量列条目不变。通过"demean"，我只是希望从每个列条目中减去相应列中所有条目的平均值。数据框来自Wisconsin Breast Cancer目录中的569名患者，为每个患者列出了10种不同的数字测量，以及M(恶性)或B(良性)的诊断。 import pandas as pd df = pd.read_csv('data/UWbcd.csv') %load_ext google.colab.data_table. #just for purposes of browsing the d

浏览 35提问于2020-10-22得票数 0

回答已采纳

1回答

尝试在Pandas中绑定数据，但总是在某些行之后停止

python、pandas

我有一个浮点变量的数据集，我想将它们绑定到组中，最终为这些组生成二进制列。现在我有一个函数 def getBins(column) 这将返回一个浮动边界列表(这似乎工作得很好) 大体上，我叫 bounds = getBins(dataframeMini[col]) 从那里，我想用入库的版本覆盖该列。我尝试了两种不同的方法，每次都遇到几乎相同的问题。首先，我尝试使用Pandas.cut thing = pd.cut(pd.Series(dataframeMini[col].astype(float)),bins=bounds,include_lowest=True) dataframeMini[

浏览 1提问于2016-01-08得票数 0

2回答

大熊猫数据结构中的尺寸不变性

python、pandas

在阅读0.24.1版的熊猫文档时，我看到了这样的说法。“所有熊猫数据结构都是值可变的(它们包含的值可以更改)，但并不总是大小可变的。级数的长度不能更改，但是，例如，列可以插入到DataFrame中。” import pandas as pd test_s = pd.Series([1,2,3]) id(test_s) # output: 140485359734400 (will vary) len(test_s) # output: 3 test_s[3] = 37 id(test_s) # output: 140485359734400 len(test_s) # output: 4 根据

浏览 0提问于2019-02-08得票数 1

回答已采纳

1回答

如何将两种不同类型的数据string和int添加到numpy ndarray中？

python、numpy、types

我用pandas.read_csv来读取excel文件，我的文件中有两个列，一个是字符串类型，另一个是整数。 data = pandas.read_csv('data.csv') 然后，我打印出这些numpy ndarray的数据类型。 print(type(data.get_values()[0, 0])) print(type(data.get_values()[0, 1])) 结果： <class 'str'> <class 'int'> 它向我展示了一种在相同的numpy ndarray中添加两种不同数据类型的方法

浏览 3提问于2017-09-28得票数 0

回答已采纳

1回答

通过有条件地检查两个单独的数据格式创建新的DataFrame

python、pandas

我对Python和Pandas也相当陌生。我想通过有条件地检查两个现有的/单独的数据框架来创建一个新的数据框架。dataframes和我打算创建的新的dataframes都具有相同的大小和索引。现有的数据文件相当于以下内容： df1 = pd.DataFrame(np.random.randn(5, 4), columns=['1', '2', '3', '4']) df2 = pd.DataFrame(np.random.randn(5, 4), columns=['1', '2', '

浏览 4提问于2015-08-27得票数 0

1回答

熊猫:用布尔值代替给出不一致的结果

python、pandas、boolean

我有一个dataframe，它由像x和v这样的检查点组成，用下面的行替换为booleans： df.replace({'v': True, 'x': False}, inplace=True) 在运行df.replace()之前，根据df.dtypes，所有列的类型都是object。在replace()之后，除了一个类型为bool的列之外，其他所有列都仍然是object，并且其中的值都是numpy.bool_类型。Pycharm为True值显示这个红色背景的特定列，如下所示。为什么会发生这种事？object不适合存储布尔人吗？为什么pandas要为这

浏览 0提问于2018-06-10得票数 3

回答已采纳

2回答

为什么当pandas的DataFrame值有变化时，任何变量的值也会改变？

python、pandas、numpy、dataframe

我正在处理pandas dataframe，我有一个变量，它包含其中一列的值。当我直接在数据框中更改值时，存储在变量中的值也会被替换，这是一个bug还是背后有什么逻辑？这个想法是为了改变df['b]的值，并保持values的完整性，以供其他使用。 import numpy as np import pandas as pd df = pd.DataFrame(np.random.random(size=(100, 2)), columns=['a', 'b']) values = df['b'].values peaks = [0

浏览 81提问于2020-06-26得票数 1

1回答

如何在数据帧的开头插入列向量？

python、pandas、numpy

我有以下两个变量： print('Column vector type %s and shape %s' % (type(target), target[0:X_train.shape[0]].shape)) print('Data frame type %s and shape %s' % (type(X_train), X_train.shape)) 这一产出是： Column vector type <class 'numpy.ndarray'> and shape (87145,) Data frame type <cl

浏览 1提问于2019-02-04得票数 0

回答已采纳

2回答

在蟒蛇大熊猫中创建新列时的KeyError

python、pandas、keyerror

我正试图在蟒蛇熊猫中创建一个新的专栏，我一直得到一个(不稳定的)重新出现的KeyError。脚本的部分非常简单，所以我不确定是什么导致了错误，因为dataset中没有一个列具有相同的名称。我的目标是创建一个新列，并将其附加到包含ticket_contents列内容的新翻译的dataframe中。这是一个样本的数据； 25483 0 outstanding 0 Los-Angeles e-payment delayed Ticket 1/7/19 7:54 39363 0 outstanding 0 Los-Angeles e-payment delayed

浏览 0提问于2019-02-26得票数 0

回答已采纳

1回答

获取pandas系列的专栏

python、python-3.x、pandas、dataframe、series

我有一个这样的pandas.core.series： 140228202800 25 130422174258 5 131213194708 3 130726171426 1 我想分开买第一列和第二列第1列： 140228202800 130422174258 131213194708 130726171426 第2列： 25 5 3 1 我尝试了以下方法，但没有成功。 my_series.iloc[:,0] my_series.loc[:,0] my_series[:,0]

浏览 16提问于2020-12-02得票数 0

回答已采纳

1回答

Pandas dataframe中的Pandas列

python、pandas、function

我试图在Pandas的数据栏中对一个绝对的“收入”列进行二值化。对于本专栏，有四个记录值：‘'>50k'，’'>50k.'，<=50k.‘，'<=50k’ 目前我的职责是..。 def income_to_numeric(x): for val in x: if val == '>50k.' or val == '>50k': val = 1 else: val = 0 return x t

浏览 1提问于2020-11-15得票数 0

回答已采纳

1回答

为熊猫的数据分配非唯一的ID

python、pandas、dataframe

我有一个数据文件df import pandas as pd df = pd.DataFrame( { "name": [ "Hello Kitty", "Hello Puppy", "It is an Helloexample", "for stackoverflow", "Hello World", ], } ) 我想添加一个列my

浏览 0提问于2020-12-16得票数 1

回答已采纳

1回答

如何根据每组另一列的最大值将一列的标签分配给新的一列？熊猫变形

python、python-3.x、pandas、machine-learning

我在pandas中有以下示例数据框架。如何获取每个“Id”的“label_weight”值的最大值，并将相应的“label”列分配给新列“assgined_label”中该“Id”的所有raws。 df = pd.DataFrame(columns=['Id', 'label_weight', 'label']) df['Id'] = ['A','A','A','A','B','B','B','B',&

浏览 16提问于2019-08-02得票数 3

回答已采纳

2回答

使用基于索引列表的序列中的值填充数据帧

python、pandas

我需要将值从pandas Series (val)传递到索引( index )处的dataframe列('column_a')。我该怎么做呢？ import pandas as pd import numpy as np df_test = pd.DataFrame(index=np.arange(4000), columns=np.arange(1)) df_test.columns = ['column_a'] val = pd.Series([0.267, 0.331, 0.486, 0.224, 0.334]) indices = pd.Series

浏览 11提问于2021-11-18得票数 1

回答已采纳

1回答

当我将(NLTK)停止词应用于数据帧时，它会显示错误吗？

python、python-3.x、jupyter-notebook、nltk、nltk-trainer

Reviews Label 0 Bromwell High is a cartoon comedy. It ran at t... Positive 1 Homelessness (or Houselessness as George Carli... Positive 2 Brilliant over-acting by Lesley Ann Warren. Be... Positive 当我超出下面的代码时，上面的一个是我的数据框架，包含列:评论和标签。 nltk.dow

浏览 2提问于2018-11-26得票数 0

回答已采纳

2回答

选择一个列的值，该列对应于熊猫中另一个具有groupby的列的最高值

python、pandas

我有下面的熊猫资料 import pandas as pd foo = pd.DataFrame({'id': [1,1,2,2], 'perc':[0.1,0.2,0.3,0.4], 'category':['a','b','b','a']}) 我想要创建一个额外的列，它将是category，它对应于最高的 perc by id。生成的dataframe如下所示： foo = pd.DataFrame({'id': [1,1,2,2], 'perc'

浏览 2提问于2022-03-02得票数 0

回答已采纳

1回答

关于OneHotEncoding - Python的问题

python、scikit-learn、one-hot-encoding

我正在进行一个项目，将One热编码技术应用到.binetflow文件的分类列中。代码： import pandas as pd from sklearn.preprocessing import LabelEncoder,OneHotEncoder mydataset = pd.read_csv('originalfiletest.binetflow') le = LabelEncoder() dfle = mydataset dfle.State = le.fit_transform(dfle.State) X = dfle[['State']].val

浏览 1提问于2019-02-27得票数 0

回答已采纳

2回答

如何使用pandas更改列项目的值？

python、pandas、dataframe

这是我关于stackoverflow的第一个问题。我正在实现一种机器学习分类算法，我想将其推广到最后一列中具有目标类的任何输入数据集。为此，我希望使用python中的pandas修改该列的所有值，而不需要知道每列或每行的名称。例如，假设我加载了一个数据集： dataset = pd.read_csv('random_dataset.csv') 假设最后一列包含以下数据： 0 dog 1 dog 2 cat 3 dog 4 cat 我希望将每个“狗”的外观更改为1，将每个猫的外观更改为0，这样该列将如下所示： 0 1 1 1 2 0 3 1

浏览 9提问于2021-06-10得票数 0

回答已采纳

1回答

Pandas -向DF href添加列

python、python-3.x、pandas、web-scraping、beautifulsoup

我正在做一个网络抓取脚本。生成的pandas数据框非常棒，但是我需要添加一个包含在HTML中的href URL值的unique_id列。 <td><a href="/admin/tasks/edit/82689"> ADDRESS </a> CLIENT </td> 目前Pandas数据框有一个包含'ADDRESS CLIENT‘的列，但是我如何添加一个包含href URL的单独列呢？我目前可以使用以下内容获取逗号分隔的unique_id值列表： unique_id = [a['href'] for a

浏览 1提问于2018-08-06得票数 0

回答已采纳

2回答

Pandas:需要删除包含字符串的行。但我的身体状况不好

python、pandas、dataframe

from chainer import datasets from chainer.datasets import tuple_dataset import numpy as np import matplotlib.pyplot as plt import chainer import pandas as pd import math 我有一个文件CSV包含40300个数据。 df =pd.read_csv("Myfile.csv", header = None) 在这个区域中，我删除了被忽略的行和列 columns = [0,1] rows = [0,1,2] df.d

浏览 38提问于2019-10-10得票数 0

3回答

Numpy获取每列的数据类型

python、pandas、numpy、types、data-science

我需要获取每个列的类型，以便对其进行适当的预处理。目前，我通过以下方法做到这一点： import pandas as pd # input is of type List[List[any]] # but has one type (int, float, str, bool) per column df = pd.DataFrame(input, columns=key_labels) column_types = dict(df.dtypes) matrix = df.values 由于我只使用pandas获取数据类型(每列)，而使用numpy获取其他所有内容，因此我希望将panda

浏览 2提问于2018-11-30得票数 4

1回答

NumPy函数对熊猫数据的修正

python、numpy、pandas

假设我有一个名为"table“的dataframe，其中有两个名为"a”和“b”的列： >>> import numpy as np >>> import numpy.random as rd >>> import pandas as pd >>> x = rd.normal(0,1,(2,5)) >>> table = pd.DataFrame({'a':x[0], 'b':x[1]}) >>> table[['a',&

浏览 2提问于2015-11-20得票数 2

回答已采纳

2回答

如何快速规范化pandas数据帧中的数据？

pandas

我有一个熊猫数据框架，如下所示。 import pandas as pd df = pd.DataFrame({ 'A':[1,2,3], 'B':[100,300,500], 'C':list('abc') }) print(df) A B C 0 1 100 a 1 2 300 b 2 3 500 c 我想要使整个数据帧标准化。由于列C不是编号列，我所做的如下所示(即首先删除C，

浏览 19提问于2020-06-22得票数 1

回答已采纳

4回答

如何获取一列中每个元素的长度

python、pandas

在csv文件中，有一个名为"no_pun“的列。里面有一些标记词。我想得到这个列中每个元素的长度。这在python中很容易实现。但我有个错误。我的代码： for i in range(0,len(data['no_pun'])): data["len_desc"][i] = len(data["no_pun"][i]) KeyError： KeyError Traceback (most recent call last) /anaconda3/lib/python3.6/site-packages/pandas/core

浏览 0提问于2019-04-07得票数 2

3回答

熊猫多分类栏转换为两类

python-3.x、pandas、dataframe

我有一个数据，如下所示。 df： ID tag 1 pandas 2 numpy 3 matplotlib 4 pandas 5 pandas 6 sns 7 sklearn 8 sklearn 9 pandas 10 pandas 在上面的df中，我想添加一个名为tag_binary的列。不管是熊猫还是非熊猫。预期产出： ID tag tag_binary 1 pandas

浏览 6提问于2021-09-13得票数 2

回答已采纳

2回答

为什么从具有不同索引的系列中在Dataframe中设置列会产生带有NaNs的列？

python、pandas

在下面的代码中，我有一个包含两行的DataFrame和一个包含两个值的系列。我想在我的DataFrame列中设置Series值。 import pandas as pd import numpy as np df = pd.DataFrame(np.random.randn(2, 1), index=["one", "two"]) print(df) s = pd.Series(np.random.randn(2), index=["four", "five"]) df.loc[:, 0] = s print(df) 但是，S

浏览 5提问于2022-10-11得票数 0

回答已采纳

2回答

按位置pandas重命名列

pandas、replace

我正在尝试在pandas数据框中按位置重命名列。我试过了： df.rename(columns={ df.columns[0]: "Line Items" }, inplace=True) #replace name 但此代码将所有与列同名的列替换为"Line Items“，而不考虑它们的位置。

浏览 11提问于2020-12-22得票数 0

回答已采纳

2回答

Pandas:通过创建索引来加速过滤？

python、pandas

我想把像SQL这样的pandas应用程序用于web应用程序(而不是将数据保存在pSQL中，而只是将其保存在pandas DataFrame中，因为数据不到1 1GB，并且不会经常变化)。如果我基于列上的多个过滤器进行查找(例如，age > x，age < y，income > p，income < q)有什么方法可以加快过滤速度吗？或者它已经在下面完成了。在SQL中，一个人会声明一个关于年龄和收入的索引来加速这样的查询，我想知道pandas做这件事的方式是什么。

浏览 0提问于2013-02-06得票数 3

回答已采纳

3回答

将Redis流输出转换为Pandas Dataframe

python、pandas、dataframe、redis、redis-streams

将输出(aioredis client/ hiredis解析器)转换为Pandas的最快的方法是什么，其中Redis的时间戳、和序列号以及值都是正确类型转换的Pandas索引列？示例Redis输出： [[b'1554900384437-0', [b'key', b'1']], [b'1554900414434-0', [b'key', b'1']]]

浏览 7提问于2019-04-02得票数 5

回答已采纳

2回答

有错匹配行数的Python和NumPy.where行为

python、numpy、pandas、where

在下面的所有示例中，我都使用了Pandas0.8.1，但我可以确认，当我使用Pandas 0.11时，相同的示例对我来说是一样的。依赖于将Pandas版本更改为较新版本的解决方案不适用于我当前的问题(尽管请随意添加评论(而不是答案)来说明是否在新的Pandas版本中修复了这个问题)。我有一个Pandas DataFrame对象示例 In [20]: dfrm Out[20]: A B C D 0 1.202034 -0.285256 0.392160 0 1 1.799628 -0.169389 -0.305984

浏览 3提问于2013-08-28得票数 1

回答已采纳

1回答

熊猫的记忆使用量给出了奇怪的估计

python、pandas、numpy、memory

熊猫给出了非常奇怪的记忆估计。不可能是一列包含2数字的列占用几乎与100 numbers列相同的内存。Numpy的nbytes更有意义(参见下面的示例)，但是deep=True的memory_usage不知道如何处理吗？ import pandas as pd import numpy as np n_rows = 100000 vecs_1x2 = np.random.random((n_rows, 2)) mats_10x10 = np.random.random((n_rows, 10, 10)) df = pd.DataFrame({&

浏览 0提问于2021-02-18得票数 1

回答已采纳

1回答

是否有更快的方法将Python输出写回excel，使用python中的xlwing？

python、pandas、xlwings

我有excel文件列A，B和C作为输入，然后在python中进行计算，然后返回excel列D和E的输出。有没有比循环更快的方法？ import xlwings as xw import pandas as pd def square(inputs): age = inputs['AGE'] weight = inputs['WEIGHT'] outputs = {} outputs['output_age_square'] = age*age outputs['output_weight_s

浏览 1提问于2022-02-16得票数 0

1回答

将DateTime转换为TimeStamp Pandas

pandas、datetime、timestamp

这篇文章的目标是能够将列“开放日期”、“关闭日期”转换为时间戳格式我尝试了这些链接的函数/例子，并取得了任何结果。非常感谢任何关于如何这样做的想法/评论/例子。列特征：开放日期 datetime64ns和pandas.core.series.Series 关闭日期 datetime64ns和pandas.core.series.Series 最后，我使用了这些库将熊猫作为pd导入将numpy导入为np 从日期时间导入日期时间，日期，时间，时间增量

浏览 5提问于2021-11-23得票数 0

1回答

代码中的“无效类型比较”

python、pandas、dataframe

我有一个有很多列的pandas dataframe。这些列可能有3个值- True、False和NaN。我使用字符串missing重新调用NaN。我的其中一列的示例值如下： ConceptTemp.ix[:,1].values 结果是： array([ True, False, False, False, True, True, True, True, False, True], dtype=bool) 请注意，此特定列没有NaN，因此没有missing字符串。现在我执行以下代码： ConceptTemp.ix[:,1][ConceptTemp.ix[:,1] != 'mi

浏览 0提问于2016-06-24得票数 1

回答已采纳