Python for-loop基于条件更改行值是否正常工作，但不会更改pandas dataframe上的值？ - 腾讯云开发者社区

python、performance、pandas

我面临Python/Pandas的性能问题。我有一个for循环，比较Pandas DataFrame中的后续行： for i in range(1, N): if df.column_A.iloc[i] == df.column_A.iloc[i-1]: if df.column_B.iloc[i] == 'START' and df.column_B.iloc[i-1] == 'STOP': df.time.iloc[i] = df.time.iloc[i] - df.time.iloc[i-1] 工作正常，但速

浏览 0提问于2018-06-27得票数 2

回答已采纳

1回答

当传递子设置的numpy.histogram2d时，pandas.DataFrame将引发异常

python、numpy、pandas

我对熊猫的数据访问和numpy histogram2d函数有一个问题。特别是当此代码正常执行时。 import numpy import pandas df = pandas.DataFrame(np.random.randn(100, 2), columns=list('AB')) hist, xe, ye = numpy.histogram2d(df["A"], df["B"]) 这段代码，其中我创建了一个包含DataFrame子集的直方图，但是失败了。 import numpy import pandas df =

浏览 0提问于2014-02-04得票数 2

回答已采纳

1回答

在fastText机器学习工作室上安装Azure Python库

python、azure、fasttext

我想在Azure ML Studio上安装Facebook C++库的Python 包装器。此库已在我的笔记本电脑上安装并正常工作。我尝试按照Azure堆栈溢出线程中的说明进行上传，但没有成功。我的“执行Python脚本”中的代码非常简单:我只是解压缩并加载我在本地机器上安装的fastText包，然后调用fastText模块的"train_supervised“属性上的帮助函数来验证包是否正确导入 # The script MUST contain a function named azureml_main # which is the entry point for this m

浏览 0提问于2019-06-11得票数 0

1回答

我的代码在pandas中运行正常，但在modin中运行不正常

python、pandas、csv、concat、modin

当我使用pandas时，代码工作得很好(但非常慢)，而当我使用modin和concat dataframe时，显示了一个错误 contador = 0 df = pd.DataFrame() data = pd.DataFrame() for file in range(len(files)): usefile = files[file] print("Valor Numero :" + str(contador) + " de un total de " + str((len(files))) + " archivos")

浏览 37提问于2019-04-16得票数 1

1回答

连接熊猫数据-所有传递的对象都是空的。

python、pandas

我正在尝试读取和过滤一个csv文件块，然后将结果放入一个dataframe。下面是我用于读取和过滤csv的内容： csv_chunks = pandas.read_csv(filepath, sep = DELIMITER,skiprows = 2, chunksize = 1000, converters = {"A": str, "B": str}) for chunk in csv_chunks: chunk = chunk[(chunk["B"] + chunk["A"]).isin(acids.tolist()

浏览 0提问于2013-07-12得票数 3

1回答

Excel，单元格值更改时不同的行突出显示颜色

excel、colors、highlighting

我有一个很大的excel文件，以及如何提高可读性，我想有一些视觉标记(颜色，边框等)。当第一列的单元格值更改时，可以使用不同的高亮显示颜色(用于该行)。这是否可以自动完成，或者是否有一个excel功能可以提高可读性。我的想法是这样的：

浏览 2提问于2017-12-16得票数 0

1回答

变量用于不同任务时的Python内存使用情况

python、memory-management

我正在与pandas在ETL管道中工作，并且我正在超出我的计算机的内存使用量。我正在阅读Python中的内存使用情况，当我创建一个pandas Dataframe时，我不明白内存使用是如何工作的，我为这个Dataframe指定了一个名称，并且我使用相同的名称进行一些转换或向其中添加更多列。例如： df = pd.DataFrame( { 'column1': [1,2] ,'column1': ['a','b']}) 如果现在我想要向此Dataframe添加另一列： df['column3'] = 1 用于第一

浏览 1提问于2020-11-23得票数 0

1回答

用单个值重新分配多个列

python、pandas、dataframe

这是一个样本数据 import pandas as pd cols = ['Country','Name','SomeNumber','SomeDate'] sourceData = [('WI','Vivian',34,'#1985-01-01#'), ('IND','Sam',56,'#1988-02-01#'), ('NZ','Richard&#

浏览 2提问于2017-08-25得票数 1

回答已采纳

1回答

为什么使用数据框属性的while循环不起作用？

python、while-loop

当我还在学习Python的时候，我只是对这个感到困惑。这个while循环得到错误："AttributeError：'list‘对象没有’empty‘属性“，我不知道为什么。非常感谢您的帮助。 import pandas as pd import numpy as np tickData = pd.DataFrame([]) print (tickData.empty) while tickData.empty: tickData tickData = [1,2,3] print (tickData) print (tickData)

浏览 22提问于2020-07-09得票数 0

回答已采纳

2回答

ValueError:仅在一行上工作时，列必须与键的长度相同

python、pandas、dataframe、expand

我试图根据一列的拆分向DataFrame添加列。对于两行，所有操作都正常，空列的值为“None”。当我只有一行而DataFrame不能展开时，我希望它也被赋值'None‘。工作实例： >>> import pandas as pd >>> df = pd.DataFrame({'auth':['dbname_user','dbname']}) >>> df auth 0 dbname_user 1 dbname >>> df[[&#

浏览 19提问于2022-08-23得票数 0

回答已采纳

1回答

向量化嵌套for循环- pandas

python、performance、for-loop、pandas、vectorization

我有一个例子，来自‘外部’for循环的多个属性与来自‘内部’for循环的多个属性进行比较。这两个循环都在pandas数据帧上，从少量的阅读来看，使用iterrows()进行这种类型的作业通常会很慢。下面是如何/为什么使用这个嵌套的for循环的说明。它非常慢。 for key1, values1 in dataframe_1.iterrows(): for key2, values2 in dataframe_2.iterrows(): if values2['a'] > values1['a'] and va

浏览 0提问于2015-08-10得票数 1

3回答

在python2和python3之间加载/保存: pickle协议问题

python、pandas

我还没有弄清楚如何使用pandas DataFrames在python2和python3之间进行酸洗加载/保存。在pickler中有一个“协议”选项，我尝试过但没有成功，但我希望有人能给我一个快速的想法让我试试。下面是获取错误的代码： python2.7 >>> import pandas; from pylab import * >>> a = pandas.DataFrame(randn(10,10)) >>> a.save('a2') >>> a = pandas.DataFrame.load(

浏览 2提问于2013-01-29得票数 7

回答已采纳

2回答

使用pandas嵌套where语句？

python、pandas、powerbi

我正在尝试使用python在PowerBI中运行一个简单的查询。遗憾的是，大多数python库在PowerBI中都不受支持，因此我仅限于pandas和numpy。数据集是一组处于流水线中或处于活动状态的项目。我希望根据一组或条件将dataset筛选为仅处于流水线中的行。所以它看起来像是 dataframe = pd.DataFrame(where project = ' pipeline ')，过滤管道启动所依据的其他条件集) 这在python中可能吗，类似于嵌套的where语句？

浏览 5提问于2020-12-07得票数 0

1回答

更改熊猫组栏抛出警告

python、pandas

在下面的代码中，我将DataFrame的点按其X值分组到回收箱中。现在我想给Y列分配一个组ID，但是熊猫总是给我一个SettingWithCopyWarning类型的警告。我做错了什么？ import numpy as np import pandas as pd d = np.random.random((10, 2)) d[:, 1] = 0 m = pd.DataFrame(d, columns=("x", "gid")) dx = 0.2 grp = m.groupby(lambda i: int(m["x"][i] / dx)) gid

浏览 2提问于2015-05-19得票数 0

回答已采纳

1回答

获取错误'sqlite3.InterfaceError:错误绑定参数0-可能不支持类型。当使用sqlite3 python将数据插入表时

python、pandas、sqlite

我试图从url链接中获取数据，并将其存储在db文件中。当我将检索到的数据转换为dataframe并将其插入到表中时，我收到了一条错误消息：'sqlite3.InterfaceError:错误绑定参数1--可能不支持类型‘。这里是我的代码： import pandas as pd import requests import sqlite3 from pandas.io import sql database_file = 'z5192421.db' def if_table_exist(cnx,table_name): c = cnx.cursor()

浏览 5提问于2020-03-29得票数 0

回答已采纳

1回答

用Numba处理熊猫DataFrame时序的有效方法

python、python-2.7、pandas、numba

我有一个1,500,000行的DataFrame。这是我从QuantQuote.com那里买来的一分钟的股市数据。(打开，高，低，关闭，音量)。我正试图对股市交易策略进行一些自制的回溯测试。直接的python代码处理事务太慢了，我想尝试使用numba来加快速度。问题是。谷歌搜索发现，有关熊猫使用numba的信息少得令人吃惊。这让我想知道我是不是在考虑这个错误。我的设置是Numba 0.13.0-1，Pandas 0.13.1。Windows 7，MS VS2013 with PTVS，Python2.7，Enthought 我现有的Python+Pandas内部循环具有以下一般结构计

浏览 1提问于2014-05-13得票数 16

1回答

intersphinx与熊猫autodoc的链接

python、pandas、python-sphinx、autodoc

我正在尝试链接到apply() autodoc文档，网址是：。我可以链接到发布页面：，通过使用. :ref:`release <pandas:release>` ..。但我似乎无法获得到autodoc页面的正确链接。我的狮身人面像被配置成..。 {'python': ('http://docs.python.org/', None), 'pandas': ('http://pandas.pydata.org/pandas-docs/dev', None)}` ..。我尝试了到apply()方法的以下链接变体： :r

浏览 2提问于2014-07-14得票数 8

回答已采纳

1回答

为什么.ix包含在索引范围的末尾？

python、pandas、numpy

Python版本: 2.7.6 Numpy版本: 1.10.2 Pandas: 0.17.1 我知道.ix现在已经不受欢迎了，但是我正在开发一个遗留系统，并且看到了.ix的这种行为，我很困惑 # Native Python List Indexing is exclusive on the end index [0, 1, 2, 3][0:1] # returns [0] indexes with [0, 1) # Native Numpy import numpy as np numpyArray = np.reshape(np.arange(4), (2, 2)) numpyArray[0

浏览 2提问于2017-06-23得票数 2

回答已采纳

2回答

Python大熊猫pyhaystack

python、python-3.x、pandas、data-science

我正在使用一个名为pyhaystack的模块从基于“tags.”的楼宇自动化系统中检索数据(rest )。Python将返回数据字典。我试着使用熊猫，并在下面的另一句话中说我有问题。堆很好用来获取数据..。这将我连接到自动化系统：(工作正常) from pyhaystack.client.niagara import NiagaraHaystackSession import pandas as pd session = NiagaraHaystackSession(uri='http://0.0.0.0', username='Z', password=&

浏览 0提问于2018-02-19得票数 0

回答已采纳

3回答

Dataframe警告: python中的SettingWithCopyWarning

python、pandas、dataframe

处理文件要获得输出，如下所示： 31012017，1,135765，12，10.8536000， 31012017，1,135762，12，10.8543000， 31012017，1,135760，12，10.6599000 31012017，1,135759，12，10.6554000， 31012017，1,135763，12，10.8536000，。。。。。。我试过使用下面的代码，但没有收到警告。代码： import pandas import numpy as np #Sample file for NAV0.txt can be downloaded from ur

浏览 10提问于2017-04-12得票数 2

回答已采纳

1回答

熊猫中的不确定性

python、pandas、uncertainty

如何在 (Python Data Analysis Library)中轻松处理Series或DataFrame上的不确定性？我最近发现了Pandas包，但我想知道是否有更简单的方法来直接在中管理不确定性。我在文档中没有找到任何关于这方面的内容。更准确地说，我不想将不确定性作为新列存储在DataFrame中，因为我认为它们是数据系列的一部分，不应该在逻辑上与其分离。例如，删除DataFrame中的列但不删除它的不确定性没有任何意义，所以我必须手动处理这种情况。我在寻找像data_frame.uncertainties这样可以像data_frame.values属性一样工作的东西。data_f

浏览 8提问于2014-02-11得票数 21

3回答

Python pandas停留在0.7.0版本

python、pandas

首先，我是个新手。我是Python、pandas和Linux的新手。我在尝试填充DataFrame时遇到一些错误(sql.read_frame()在尝试从我的MySQL DB读取时出现异常，但我能够执行和获取查询/存储过程)。我注意到pandas的版本是0.7.0，运行"sudo apt-get install python-pandas“只是说它是最新的(没有错误)："... python-pandas已经是最新的版本。0升级了...” 根据我在网上找到的其他一些帖子，我认为我的DataFrame问题可能是由于旧版本的熊猫(关于涉及元组元组的熊猫bug？)。为什么熊猫不更新

浏览 0提问于2013-07-20得票数 15

回答已采纳

1回答

将大型数据库表读入Dask数据帧

python、pandas、dask-dataframe

我有一个7 7GB的postgresql表，我想把它读入python并做一些分析。我不能为它使用Pandas，因为它比我本地机器上的内存大。因此，我想先尝试将表读入Dask Dataframe，执行一些聚合，然后切换回Pandas进行后续分析。为此，我使用了以下几行代码。 df = dd.read_sql_table('table_xyz', uri = "postgresql+psycopg2://user:pwd@remotehost/dbname", index_col = 'column_xyz', schema = 'priv

浏览 17提问于2021-07-08得票数 0

1回答

将包含R和python块的.Rmd笔记本转换为.R脚本

python、r、knitr、reticulate

我想将包含R块和python块的execution笔记本转换为在后端服务器上执行的R脚本。我们使用python管道来准备数据。R码继续分析。R标记笔记本来自其他人，并可能在未来更新。如果我们能自动将笔记本转换成R脚本，那就太好了。我们不一定需要笔记本输出，我们更感兴趣的是用R块完成的数据处理。而一个R脚本更容易用于调试。输入笔记本analysis.Rmd --- title: "The Ultimate Question" --- ```{r setup} 图书馆(网状) ```{python} 进口熊猫 df = pandas.DataFrame({'x

浏览 13提问于2022-11-08得票数 1

1回答

Python：“系列”对象在使用Windows时没有属性“AttributeError”

python、json、macos、python-2.7、pandas

当Python代码在Mac上运行时，它可以正常工作。但是，当它在Windows上运行时，它会引发以下错误，其中fruits是一个pandas.DataFrame。码 for i, row in fruits.T.iterkv(): data = json.loads(row.to_json()) 错误： AttributeError: 'Series' object has no attribute 'to_json' 是什么导致了这个错误？ Windows系统正在运行Python2.7.5，熊猫版本为0.11.0。Mac运行2.7.2，熊猫v0.12

浏览 6提问于2013-12-03得票数 0

回答已采纳

1回答

用云函数将TXT文件转换为CSV，并在Google BigQuery中填充数据

python、csv、google-bigquery、google-cloud-functions、txt

我正在尝试转换一个txt。卷进csv。并通过Google函数使用所有数据填充BigQuery表。 TXT文件看起来非常类似于CSV文件，如下所示。整个文件权重约为35 is，超过350 k行。我试着应用上面共享的python脚本，但是它没有工作.我的函数运行正常，但它没有将任何数据填充到BigQuery。我跟踪了这个。我的main.py函数： import pandas as pd from google.cloud import bigquery def txt_to_csv(event, context): fileName = "gs://Bucket_name

浏览 2提问于2021-02-23得票数 0

1回答

pandas数据帧上的滚动PCA

python、pandas、pca

我想知道是否有人知道如何在熊猫数据帧上实现滚动/移动窗口PCA。我环顾四周，发现了在R和MATLAB中的实现，但没有Python。任何帮助都将不胜感激！这不是重复窗口-移动窗口PCA与整个数据帧上的PCA不同。如果您不了解其中的区别，请参阅pandas.DataFrame.rolling()

浏览 23提问于2017-08-29得票数 3

1回答

Pandas read_excel不读取某些xlsx文件，返回空数据帧

python、excel、pandas、dataframe、binance

您好，我想做一些工作，我的binance.com贸易出口，但似乎熊猫无法阅读原始报告的原始或副本从二进制。我向Nic Scorazzos answer (Python Pandas read_excel returns empty Dataframe)确认了该文件是否确实是一个excel工作簿，而不是一个严格打开的xml电子表格，但在我看来，我的文件是一个工作簿。我检查了文件资源管理器和默认的‘另存为’，它都显示'Microsoft Excel Workbook (.xlsx)‘。将文件重新保存为工作簿会有所帮助，但我希望将它们直接导入到我的python代码中，而不是手动处理它

浏览 128提问于2021-01-20得票数 1

1回答

熊猫数据串接

python、pandas、dataframe

我有两张数据。第一列只有两列和N行。N是几百到数千。每一列都是一个分子名称，因此，它是一对分子的数据。第二个dataframe:我有一个dataframe，它是1600列和M行。每一列都有一个分子的描述符。因此，每个分子都有1600个描述符。考虑到这两个数据格式，我想要创建一个包含3200列(1600*2)和N行的第3数据帧。对于每一对分子，我想要有第一个分子的1600个描述符，然后是第二个分子的1600个描述符。因此，我将有一个新的数据，每一对分子有3200个描述符。是否有一种pandas方法来组合来自不同DataFrames的列？我的MWE只适用于我的小例子。我有一个MWE，但是

浏览 5提问于2022-06-07得票数 0

1回答

df = pd.read_csv('iris.csv')指向azure blob中的文件报告[errno 2]没有这样的文件或目录

python、pandas、azure、csv

我正在学习https://docs.microsoft.com/en-us/azure/batch/tutorial-run-python-batch-azure-data-factory#:~:text=%20Tutorial%3A%20Run%20Python%20scripts%20through%20Azure%20Data,create%20the%20Batch%20pool%20that%20your...%20More%20上发布的说明该站点提供了一些python代码。我在试着让代码正常工作。到目前为止，这是我的代码。 “”“ from azure.storage.bl

浏览 53提问于2021-02-10得票数 1

回答已采纳

1回答

AttributeError:模块“pandas”没有带rapsberry Pi的属性“Dataframe”

python、pandas、raspberry-pi3

我知道有类似的问题，但没有人能够给我提供答案。我正在raspberry pi (模型3)上运行python脚本。我使用的是python 3，pandas是通过pip安装pandas安装的。我的代码能够运行import pandas as pd行，但是test = pd.Dataframe给了我一个错误：AttributeError: module 'pandas' has no attribute 'Dataframe' 如下面的代码所示，我已经检查了我的代码是否有一个正确的pandas模块。我还直接在python中签入： `Python 3.7.3 (def

浏览 0提问于2019-08-04得票数 1

1回答

在复制后编辑原始DataFrame，但在编辑副本之前更改副本

python、numpy、pandas

我试图了解复制熊猫数据框架是如何工作的。当我在python中分配对象的副本时，我不习惯于更改影响该对象副本的原始对象。例如： x = 3 y = x x = 4 print(y) 3 虽然x后来被更改了，但是y仍然是一样的。相反，当我在将熊猫df分配给副本df1后对它进行更改时，副本也会受到原始DataFrame的更改的影响。 import pandas as pd import numpy as np def minusone(x): return int(x) - 1 df = pd.DataFrame({"A": [10,20,30,40,50], "

浏览 11提问于2014-08-08得票数 5

回答已采纳

3回答

使用pandas GroupBy.agg()对同一列进行多个聚合

python、pandas、dataframe、aggregate、pandas-groupby

pandas有没有一种内置的方法，可以在同一列df["returns"]上应用两个不同的聚合函数f1, f2，而不必多次调用agg()？示例数据帧： import pandas as pd import datetime as dt import numpy as np pd.np.random.seed(0) df = pd.DataFrame({ "date" : [dt.date(2012, x, 1) for x in range(1, 11)], "returns" : 0.05 *

浏览 0提问于2012-09-26得票数 190

回答已采纳

1回答

即使定义了依赖键，我是否也必须手动更新瞬态属性？

iphone、core-data、nsmanagedobject、transient

我开始使用瞬态属性，并认为我非常了解它们，但这一项并不是我所认为的那样。它在数据模型中被定义为具有未定义类型的瞬态属性，并被声明为属性： @property (nonatomic, readonly) NSSet * manufacturers; 此属性声明依赖于此对象上的另一个1:M关系： + (NSSet *) keyPathsForValuesAffectingManufacturers { return [NSSet setWithObject:@"lines"]; } 我为这个瞬态属性实现了一个相当标准的getter： - (NSSet *) manufact

浏览 1提问于2011-01-02得票数 4

回答已采纳

1回答

弹簧SAML一次性使用条件

single-sign-on、spring-saml

我正在尝试用security连接到一个定制的cas 4实现。Spring抛出一个异常，因为断言条件是一次性使用的。我将其注释掉，扩展了基类，并使其正常工作。我想知道为什么图书馆有这么大的限制。谢谢你的帮助。在类verifyAssertionConditions的方法WebSSOProfileConsumerImpl中，有以下代码： else if (conditionQName.equals(OneTimeUse.DEFAULT_ELEMENT_NAME)) { throw new SAMLException("System cannot honor OneTimeUse cond

浏览 3提问于2015-10-26得票数 1

回答已采纳

2回答

熊猫的整数切片不同的行和列？

python、pandas

来自R，我试着让我的头为熊猫数据切片整数。令我困惑的是，使用相同的整数/切片表达式对行和列进行不同的切片行为。 import pandas as pd x = pd.DataFrame({'a': range(0,6), 'b': range(7,13), 'c': range(14, 20)}) x.ix[0:2, 0:2] # Why 3 x 2 and not 3 x 3 or 2 x 2? a b 0 0 7 1 1 8 2 2 9 我

浏览 2提问于2015-12-28得票数 3

回答已采纳

2回答

根据条件创建新的Pandas列，但这些值不会生成

python、pandas、dataframe

我正在尝试完成一个简单的任务:根据其他列的条件在Pandas dataframe中创建一个新列。我曾咨询过其他帖子(例如，，但也有其他采用不同方法的帖子)，但都没有成功。我现在遇到的问题是，在新列中只返回函数中定义的最后一个值。例如：我有以下一栏： x 1 2 3 我想添加一个新的标签栏： x size 1 Small 2 Medium 3 Large 下面是最新的尝试代码： import pandas as pd import numpy as np df = pd.read_csv('blah.csv') def size (row

浏览 1提问于2019-03-04得票数 3

回答已采纳

2回答

对Pandas Dataframe (和Numpy)进行就地更新的Pythonic方法是什么？

python、pandas、numpy、dataframe

假设'data‘是一个Pandas DataFrame，其中’行‘都是行，而'cols’是小于或等于实际列数的一些数字。下面的代码可以很好地将该空间中的所有数据乘以“比例”。我特别避免使用列名，我需要使用列索引。 rows = len(data.index) for row in range(0,rows): for col in range (0, cols): data.iat[row,col] = data.iat[row,col] * scale 但是，如您所见，这并不是类似Python或Pandas的。Python/Pandas的方式是什么？假

浏览 0提问于2020-02-03得票数 1

回答已采纳

2回答

大熊猫独立系列与数据来源的不同行为

python、python-2.7、pandas、numpy、dataframe

这是我的代码和警告信息。如果我通过使用s将Series更改为独立的Series，就不会出现这样的错误。在Windows上使用Python 2.7。似乎从独立创建的系列和从数据帧的列创建的系列是不同的行为？谢谢。我的目的是更改Series值本身，而不是在副本上进行更改。源代码 import pandas as pd sample = pd.read_csv('123.csv', header=None, skiprows=1, dtype={0:str, 1:str, 2:str, 3:float}) sample.columns = pd.Index(da

浏览 1提问于2016-08-29得票数 0

回答已采纳

1回答

如何保持集群映射索引顺序与我的DataFrame索引顺序相同

python、dataframe、plot、heatmap

我正在尝试使用python Sea born包绘制集群图我希望热图的行顺序与DataFrame索引顺序相同但图像似乎不是这样的我的数据具有如下特征： data‘’character‘= 'A'，'B'，'B'，'C'，'C’ 我使用颜色条来显示字符如果聚类图的顺序与我的数据帧的顺序相同在我的颜色栏中有相同的字符但事实并非如此如何才能使聚类映射顺序与数据帧索引顺序相同非常感谢

浏览 2提问于2018-03-06得票数 0

2回答

运行Python API时在URL上按顺序迭代

python、api

我正在尝试从API中提取数据，用于我正在进行的一个梦幻橄榄球项目。你可以使用url：'‘来获取不同玩家的数据，其中i是一个与玩家相关的数字，范围从1到400左右。我编写了代码，为特定的播放器提取这些数据，并将其存储为数据帧，以供将来使用以下代码进行分析： import pandas as pd import json import requests from pandas.io.json import json_normalize r = requests.get('https://fantasy.premierleague.com/api/element-summary/

浏览 0提问于2020-09-21得票数 0

1回答

为什么pandas.where()返回'None‘

python-3.x、pandas

我试图使用pandas.where()从数据帧中的列中删除负值。删除负值的最明显方法是在列上运行pandas.abs()。所以： import pandas as pd frame = pd.DataFrame([-1,-1,-3,-4,-5],columns=["amount"]) frame.amount = frame.amount.abs() 但是我想使用pandas.where()来尝试同样的方法。因此，我尝试了以下几点： frame.amount = frame["amount"].where(frame["amount"] &

浏览 0提问于2019-05-27得票数 2

回答已采纳

2回答

潘达斯柱间交叉值的检测

python、pandas

假设我有以下数据： df = pd.DataFrame({'a': [10, 20, 30, 40, 50], 'b': [0, 10, 40, 45, 50]}, columns = ['a', 'b']) 我想列出以下指数： I-1< bi和ai >= bi 以检测某个值在某个时态序列中何时跨越另一个值。是否有一种Pandas惯用的方法来实现这一点而不迭代所有的元素？我尝试创建一个带有标志的新列，通过这样做来表示交叉： df['t'] = (df['a'].shift(1

浏览 5提问于2019-12-18得票数 4

回答已采纳

2回答

Pandas dataframe:带有inplace=True的set_index会返回一个NoneType，为什么？

python-3.x、pandas

如果我用"inplace=True“(跟在后面)重置我的Pandas数据帧的索引，它会返回一个类”NoneType“。如果我用"inplace=False“重置索引，它会返回包含新索引的数据帧。为什么？ print(type(testDataframe)) print(testDataframe.head()) 返回： <class 'pandas.core.frame.DataFrame'> ALandbouwBosbouwEnVisserij AantalInkomensontvangers AantalInwoners \ 0

浏览 2提问于2017-03-17得票数 13

回答已采纳

1回答

Pandas bug on pivot_table with dict aggfunc？

python、pandas

这个带有dict aggfunc的pivot_table示例没有问题： df=pandas.DataFrame([ {'JOB':'Worker','NAME':'Bob' ,'YEAR':2013,'MONTH':12,'DAYS': 3,'SALARY': 17}, {'JOB':'Employ','NAME':'Mary','YEAR':2013,'MONTH

浏览 2提问于2014-09-19得票数 0

1回答

Pandas DataFrame作为函数的参数- Python

python、pandas、function、dataframe、parameter-passing

假设一个Pandas DataFrame被作为参数传递给一个函数。那么，Python是隐式复制该DataFrame，还是实际传入的DataFrame？因此，如果我在函数内的DataFrame上执行操作，我是否会更改原始的(因为引用仍然完好无损)？我只想知道在将DataFrame传递给函数并对其进行操作之前，是否应该对其进行深度复制。

浏览 1484提问于2018-07-18得票数 7

回答已采纳

1回答

MultiIndex熊猫数据过滤后解堆时的界外误差

pandas、dataframe、multiple-columns

我有一个多索引熊猫DataFrame，我执行一些操作(包括删除带有空值的列)，然后尝试将.但是，这会导致索引错误。有办法解决这个问题吗？代码如下： ds = ds.unstack(level='Symbol') ds.columns = ds.columns.swaplevel(0, 1) ds = ds[start:end] ds = ds[equities] ds = ds.stack(level='Symbol') ds.dropna(axis=1, inplace=True) # this line breaks the code ds = ds.uns

浏览 2提问于2018-04-02得票数 3

回答已采纳

3回答

不同长度DataFrames的比较

python、pandas

我试图用另一个DataFrame的值来过滤一个DataFrame，但是无法让它工作，因为DataFrame的筛选器与要过滤的DataFrame有不同的大小。我想我需要使用set_index来对齐两个DataFrames，但这可能是错误的。 import pandas as pd df1 = pd.DataFrame({'a': [1, 1, 2, 3, 3, 4], 'b': [5, 3, 6, 2, 6, 4]}) df2 = pd.DataFrame({'a': [1, 2, 3, 4], 'b': [3, 5, 6, 3]}

浏览 7提问于2016-03-03得票数 0

1回答

Python&Pandas: TypeError: to_sql()获得了一个意想不到的关键字参数“味道”

python、pandas、dataframe、sql、json

我希望使用MySQL将JSON数据存储到数据库中。我用了dataframe of pandas。我发现to_sql()可以轻松地完成这项工作。 Python代码： jdata=json.loads(json_data) df=pandas.DataFrame(jdata) df.to_sql(con=con, name='crashTable', if_exists='replace', flavor='mysql') 输出： TypeError: to_sql() got an unexpected keyword argument '

浏览 0提问于2019-03-05得票数 5

回答已采纳

1回答

在R中复制ewm pandas函数

我正在尝试在R中复制ewm python (https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.ewm.html)函数，但没有成功。以下是python代码： import pandas as pd df = pd.DataFrame({'B': [0:100]}) df.ewm(span=100).std() 我不能在R中得到相同(或相似)的结果。

浏览 9提问于2021-01-17得票数 0