Pandas列间引用_框架间包引用_pandas在pandas中寻找两列间公用值的索引 - 腾讯云开发者社区

、、

我在用Pandas读excel文件。有一列的日期如下：20160210 我想转换为datetime对象，所以： t = pd.to_datetime(dataframe['date'], format='%Y%m%d') 出现以下错误： OverflowError: Python int too large to convert to C long 有什么想法吗？

浏览 0提问于2016-02-10得票数 2

1回答

SQL查询输出到Sybase临时表

、、

我需要查询MSSQL 2008 db中的4列数据，其中一列( ID)用于连接Sybase ASE 15数据库中的多个表，然后从Sybase中的其他5个表中输出SQL查询中的所有4列。目前，我们查询SQL并将其输出到csv，然后将数据加载到Access db。然后使用它访问表，使用来自SQL查询的ID上的联接来查询Sybase表。我需要从等式中获取访问权限，并在MSSQL或Sybase中运行所有这些操作，并由SSRS报告触发这些操作，以便在SSRS报告中显示最终的Sybase查询。我能够创建一个从SQL到Sybase的链接服务器，反之亦然，并且能够使用openquery从SQL查询Sybas

浏览 0提问于2017-06-22得票数 1

1回答

如何最好地将两个熊猫数据合并到一个列(pandas.core.series.Series和pandas.core.frame.DataFrame)上

、、、

我正在尝试基于一个公共列(df_apply )加入/合并两个数据文件(df_result和name)。听起来很简单，但其中一个数据类型具有pandas.core.series.Series列类型，另一个数据类型具有pandas.core.frame.Dataframe列类型。这将导致合并(pd.merge(df_apply, df_result, on='name')导致错误： ValueError: The column label 'name' is not unique. For a multi-index, the label must be a tup

浏览 1提问于2019-03-27得票数 0

2回答

python pandas DataFrame无法获取第一列数据

、、

我正在使用Pandas做数据处理，遇到一个问题，它不能获取第一列数据，但可以获取其他列数据，为什么？我该如何解决这个问题，有人能帮上忙吗？我刚刚导入了excel文件的数据，并希望通过以下方式获取名称数据(第一列 data['Name'] 错误如下所示 KeyError Traceback (most recent call last) /Users/test/anaconda/lib/python3.6/site-packages/pandas/core/indexes/base.py in get_loc(self, key, method,

浏览 1160提问于2018-06-27得票数 0

回答已采纳

1回答

如何去掉Pandas/Matplotlib条形图x轴上的虚线？

、、、

编辑:这一行是在Pandas ()中删除的。我正在用Pandas的plot函数绘制一个条形图。它总是在x轴上方出现一条奇怪的虚线。这不是滴答或x轴，这两个我都去掉了： plt.tick_params(axis="both", which="both", bottom="off", top="off", labelbottom="on", left="off", right="off", labelleft="on") ax.spines[&

浏览 3提问于2014-12-15得票数 3

回答已采纳

1回答

在Python中，编译器为datetimeIndex函数抛出一个键错误，即使存在键。

、、、、

因此，我试图创建一个标准普尔500指数每年的回报清单，我有一个熊猫的数据，日期和收盘价的标准普尔指数在过去多少年。“日期”列的格式为“年-月-日”，我正在尝试创建一个只包含年份的新列。每当我使用参数"Dates“(其中一个dataframe列)的datetimeIndex时，它就会抛出一个键错误。有什么建议吗？代码： import pandas as pd import yfinance as yf import pandas_datareader.data as web import datetime df = web.DataReader('^GSPC', &#

浏览 4提问于2021-12-21得票数 1

1回答

如何从数据帧的第一列提取数据并在其他列中插入数据？

、

我在数据帧方面有问题。我有一个csv文件，有10列，但是所有的数据存储在第一列中。如何从第一列中自动提取数据并将其放入其他列？你能帮帮我吗拜托。这是我的密码： import pandas as pd import numpy as np df = pd.read_csv('test_dataset.csv') df.head(3) one_column = df.iloc[:,0] one_column.head(3) 这是下载文件的链接：

浏览 1提问于2017-09-22得票数 1

回答已采纳

2回答

操作包含列表的pandas数据框列

、

我在pandas中使用了下面的代码和of ()函数来创建一个列，该列包含一个唯一值的列表： import pandas as pd from collections import OrderedDict dct = OrderedDict([ ('referencenum',['10','10','20','20','20','30','30','40']), ('Month',['Jan','Jan'

浏览 16提问于2019-02-06得票数 1

回答已采纳

1回答

inplace=False如何不给出数据文件中的密钥错误

、

所以我有点怀疑。当我呈现交互式下拉列表的最后输出时，我试图删除3列，这将过滤数据帧。请注意，此下拉列表使用这3列中的2列(年份、月份)进行过滤。因此，我编写了df_filter = df_reviews，如果在第二次使用交互时再次调用该函数，它将返回这3列(过滤所需的)。然而，当我使用inplace = True时，它给了我一个 KeyError Traceback (most recent call last) ~\anaconda3\lib\site-packages\pandas\core\indexes\base.py

浏览 2提问于2020-08-02得票数 0

1回答

用Python编辑Parquet文件会导致日期时间格式错误

、、、、

我正在尝试编辑一组用parquet编写的Spark文件。我使用Pyarrow将它们加载到Python中的Pyarrow数据格式中。其目标是用一些数据追加新行，并输出一组新的拼花文件。我遇到的问题是日期/时间列，在加载python中的parquet文件后，该列显示为dtype('<M8[ns]'。在添加了新的时间行，并输出新的拼花文件后，我使用Athena查询这些文件。此时，本专栏中的值以+50975-10-19 00:00:00.000格式显示。正确的格式应该是2019-01-05 00:00:00.000 下面是python代码的一个片段，它显示了加载、编辑和输出这些

浏览 2提问于2019-09-05得票数 1

回答已采纳

2回答

CSV和Pandas中的多个分隔符和混合引号

、、

我有一个特定的CSV文件，我认为这是一个标准的PHP工作方式，因为它来自PHP代码。我正在尝试使用pandas删除某些列(200+列)，但需要保留标题行和所有其他行中的引号。标题行短： name, "Full Name", "Suggested Name", id (因此在标题行中使用双引号对空格进行转义) 和数据： blah, "Very, Blah Line", "Not Suggested", 2 列中的逗号和空格也是如此，并用引号进行转义。如果我使用pandas read_scv，它会正确地读取数据，但随后会使用引号

浏览 0提问于2019-04-05得票数 2

1回答

优化火花放电性能以匹配Pandas / Dask？

、、、

我有每周一次的时间序列数据，并试图使用Pyspark来计算几个列的每周尾随8周的总和。我尝试过使用Pyspark窗口函数，特别是： sum(df[valueCol]).over(partitionBy(df[idCol]).orderBy(df[timeCol]).rangeBetween(-7, 0)) 但是这段代码运行得非常慢(1000个唯一ID和170个时间步骤，每列运行30-60秒)。我从其他StackOverflow问题中了解到，分区和洗牌会导致性能问题，因此为了更好地理解这些问题，我将手动计算8列中每周的8个最近的每周值，然后将这些列添加到后面的8周求和。下面是我创建的简化数据集

浏览 1提问于2018-09-04得票数 2

2回答

当列标题包含正斜杠时，如何从CSV文件读取数据？

、、

我想检查CSV文件中的列是否正在存储与给定输入相等的任何数据。我有一个csv文件，我称之为myFile.csv，我使用pandas来读取它，如下所示： import pandas as pd ... path = r'C:\Users\...\myFile.csv' df = pd.read_csv(path) 我试图从其中一个列中读取数据，标题为Country/Region。我要做的是检查Country/Region是否包含有值'someRegion'的行 region = 'someRegion' for item in df.Cou

浏览 0提问于2020-05-09得票数 0

回答已采纳

1回答

解析、删除和屏蔽IP地址的脚本

、、、

我有一个CSV文件，包含3列：列1- -总值--连接ID_IP地址51515151 99.999.999.999 第2栏-时间栏-时间209-02-25T19:04:59.999-0500 第3栏- IP地址(IPv4 & IPv6) - IP 99.999.999.999 我试图解析第一列中的ID，方法是将其拆分为带有ID和IP地址的两列，然后使用新创建的IP地址丢弃该列，因为它们已经包含在第3列中。这是我到目前为止掌握的代码： import pandas as pd from pandas import read_csv df1= pd.read_csv(&

浏览 0提问于2019-02-28得票数 0

3回答

仅根据特定的列检查一个DataFrame中的行是否存在于另一个

、、

我有两个不同列号的Pandas DataFrame。 df1是单行DataFrame： a X0 b Y0 c 0 233 100 56 shark -23 相反，df2是多行Dataframe： d X0 e f Y0 g h 0 snow 201 32 36 cat 58 336 1 rain 176 99 15 tiger 63 845 2 sun 193 81 42 dog 48 557 3 storm 10

浏览 6提问于2021-03-22得票数 3

回答已采纳

3回答

pandas数据帧插值

、

所以我看到有一种方法可以对pandas系列对象进行插值。是否有用于数据帧的等效方法？我想对每一列进行插值。

浏览 4提问于2013-11-28得票数 2

1回答

为什么我只能在python中调用这个.CSV文件中的第一列？

、

我试图从python中的这个.CSV文件中调用第二列，以便使用它进行一些数据分析，但是我只能从该文件调用第一列("Time_abs/ps")。我尝试分别调用第二列和第三列(“信号/nA”和“刷新信号/nA”)，方式与成功调用第一列时相同，但每当我试图这样做时，我都会收到下面的错误。有人知道为什么会发生这种事吗?知道如何解决这个问题吗？输入： import pandas as pd import io df = pd.read_csv(io.BytesIO(uploaded['wf air.csv'])) print(df) print(df['T

浏览 16提问于2022-07-11得票数 0

2回答

使用dataframe.apply对每列调用唯一的函数

、、、、

我一直想做以下工作，以便有一个简单的故事来在pandas.DataFrame中的每一列上执行pandas.DataFrame.someColumnName.unique()函数。 df.apply(func=unique, axis=0) # error NameError: name 'unique' is not defined 有没有什么我忽略的技巧来让它工作，或者给出一个替代的解决方案来做一些类似的事情，但是在pandas.DataFrame中的每一列上使用type()函数。 df.apply(func=lambda x: type(x[0]), axis=0) 请注

浏览 14提问于2018-01-24得票数 3

回答已采纳

3回答

MySQL:在函数中传递DateTime列

、

opLastTurn和TurnTime是mytable的DateTime列 SELECT ADDTIME(opLastTurn,TurnTime) AS result FROM mytable; 但是它返回了空，怎么了？

浏览 4提问于2017-08-17得票数 1

回答已采纳

1回答

AS3补间冻结

我开始使用AS3的Tween功能，但偶尔会注意到一些奇怪的行为。基本上，它在完成补间之前就冻结了。这个网站似乎提供了解决方案：我的程序要求每次都能精确地旋转补间。我喜欢使用adobe放在适当位置的函数，但这让我很紧张，因为它有这么大的问题。我应该使用as3的补丁，还是像greensock.com的TweenLite这样的外部补丁？哪一个更可靠？

浏览 1提问于2011-07-07得票数 2

回答已采纳

1回答

可以使用dataframe ix进行赋值，但不能进行检索

、

我循环遍历pandas df的行，循环索引i。我可以使用ix函数分配几列，其中循环索引作为第一个参数，列名作为第二个参数。但是，当我尝试使用此方法检索/打印时， print(df.ix[i,"Run"]) 我得到一个下面的Typerror: str对象不能解释为整数。在某种程度上与Keyerror有关：“Run” 我不太确定为什么会发生这种情况，因为Run确实是数据帧中的一列。有什么建议吗？ Traceback (most recent call last): File \!"C:\WPy-3670\python-3.6.7.amd64\lib\site-packa

浏览 0提问于2019-07-27得票数 2

1回答

Spark MLlib中的列变换

、、、

我已经读过 for feature transform，但我仍然对两种简单的情况感到困惑： 1.如何处理单列灵活性？例如，我有一个名为"date“的列，其格式为"YYYY-MM-DD”，我希望基于"date“生成一个名为"week”的新列。如果使用pandas.Dataframe，可以用Series.apply来完成，我的问题是如何在Spark MLlib中做到这一点？ 2.如何基于多列生成新列？例如，我想根据支出和收入来计算投资回报率，这在pandas.DataFrame中很简单： df['roi'] = (df['income'

浏览 2提问于2016-09-20得票数 0

回答已采纳

1回答

如何在一系列行的熊猫数据栏上矢量化？

、、、

所以我有一个带有y行的x列的Pandas DataFrame。DataFrame中的数据是float64值。我试图计算两列之间的斜率相关性，但是对于单个列的范围(例如，列有25000行，我只想要介于5-10之间的值，这些值恰好在2000-4000行中)。为了做到这一点，我将以下面的psuedocode演示的方式进行迭代： for i in range(i, len(df['Column 1'])) if df.loc[i, 'Column 1'] <= 10.0 & df.loc[i, 'Column 1'] >= 5

浏览 2提问于2020-06-29得票数 0

回答已采纳

2回答

将数据帧写入SQL的函数

、、

我有一个函数，它接收数据帧并将其作为表写入SQL。 def insert(df): with connection.cursor as cur: cur.execute('''create tablaexyz.xyz (ID integer, first_name varchar(100), last_name varchar(100))''') d

浏览 17提问于2021-04-07得票数 0

2回答

从csv拆下带熊猫的柱子-在轴上找不到

、

我试图从.csv中删除1列，但是我收到了一个错误。 import pandas as pd df.drop("First Invoice #", axis = 1, inplace= True) KeyError: "['First Invoice #'] not found in axis" 在这里您可以找到.csv 文件你有什么想法吗？谢谢你的帮助，安吉洛

浏览 9提问于2022-05-02得票数 1

回答已采纳

1回答

在Pandas数据文件中设置索引时的KeyError

、、、、

当我试图设置数据数据的索引时，我得到了一个关键错误。在以同样的方式设置索引时，我还没有遇到过这种情况，我想知道出了什么问题吗？数据没有列标题，因此DataFrame标头是0、1、2、4、5等。当尝试使用第一列时，我会收到KeyError：'0‘(我想将它用作唯一的索引)。用于上下文:在下面的示例中，我选择了启用宏的excel电子表格，压缩数据，读取数据并将其转换为DataFrames。然后，我希望将文件名包含在列中，设置索引和空格，以便使用索引标签提取所需的数据。并不是每个工作表都有索引标签，所以我有一个尝试，除了跳过不包含索引中那些标签的工作表。然后，我希望将每个结果连接到一个

浏览 1提问于2017-08-24得票数 2

回答已采纳

1回答

Python中x轴上的时间和日期数据

、、、

在Raspberry PI 4上，我读取了一个传感器(通过HAT)，并将数据集写入一个.csv文件。同时，我将每个值的时间和日期写入下一列。如何绘制这些数据？我想将x轴设置为时间轴，例如。在11:23:48我测量了4,3伏。 import numpy as np import matplotlib.pyplot as plt import pandas as pd from tkinter import filedialog from tkinter import * import sys import warnings if not sys.warnoptions: warnings

浏览 26提问于2020-02-17得票数 0

2回答

Python -比较整个数据框会得到与单个元素不同的结果

、、

我正在比较两个数据帧的列，我得到的结果与单独比较元素的结果不同。这适用于比较"None“。 import pandas as pd df1 = ["a", None, None, "b"] df1 = pd.DataFrame(df1) df2 = ["a", None, "c", "d"] df2 = pd.DataFrame(df2) print(df1[0] != df2[0]) #[1] is True, why ?? print(df1[0][1] != df2[0][1]) #[1] her

浏览 22提问于2021-01-15得票数 0

回答已采纳

1回答

Pandas在读取制表符分隔的文本文件时似乎会静默失败

、

我有一个制表符分隔的文本文件，有127294行(包括标题)，但是当我尝试将其读取到pandas数据帧中时，结果只有126674行(比预期少619行)。没有错误消息/异常或警告。存在正确的列数。我是这样读的： df = pandas.read_csv("temp", sep="\t")

浏览 1提问于2017-11-25得票数 0

3回答

c#中的DataTables

我正在使用oledb将excel工作表导入到窗口应用程序的DataTable中，并且只想获取excel工作表中的第一列的日期。我在此列中只输入了日期。但是DataTable增加了我不想要的时间。如何在表格中只获取日期？

浏览 0提问于2010-07-12得票数 2

回答已采纳

2回答

从列中删除NaN值时会发生什么？

、

在Pandas中，从列中删除NaN值后，在删除NaN值的索引处存储的值是什么？我能够成功地从列中删除NaN值，但是df的形状是完好无损的，但是该特定列的大小发生了变化。 1445 70.0 **1446 NaN** 1447 80.0 1448 70.0 1449 21.0 1450 60.0 1451 78.0 1452 35.0 1453 90.0 1454 62.0 1455 62.0 1456 85.0 1457 66.0 1458 68.0 1459 75.0 Name: LotFronta

浏览 16提问于2020-07-11得票数 0

回答已采纳

1回答

使用字符串匹配并基于if-else条件创建新列

、、、

我有一个数据帧，其中列“url_text”包含来自OCR的文本输出。我正在尝试创建一个新的列“阻塞”，如果满足条件，行等于1，否则等于0。 df[df['url_text'].str.contains('blocked you')] # detect all rows in 'url_text' column # that contain 'blocked you'. Code works. 我尝试在以下函数中插入上述代码。但是，当我将该函数应用于数据帧时，会出现以下错误： def f(row): if row[&#

浏览 1提问于2021-12-30得票数 0

回答已采纳

1回答

如何迭代CSV中的列，以查找哪一行包含Python (Pandas)中的日期行

、、、

我有几个CSV文件，需要在python3内部使用Pandas读取。我试图找到每个CSV的哪个列(或索引)包含一个日期列。两个注意事项：中没有一个具有相同的结构，有些日期列可以是第一列，有些可以是第二列或第三列，而的日期格式总是不同的，有时它们是“10月28日”，另一些是"7/11"，以及介于两者之间的任何东西。我已经开始像这样使用Pandas迭代它们，并且我可以非常快速地识别一个列是否使用datetime解析函数包含日期。我在逐列(通过每个标题检查“日期”之类的单词)以及通过该列中的每一行来查看是否可以将其解析为日期时遇到了困难。想法？示例CSV： Table DATE

浏览 3提问于2019-12-17得票数 2

回答已采纳

1回答

熊猫与COUNTIFS相似的功能

、

请参阅样本数据图像。我试图在Python / Pandas中复制COUNTIFS功能，但我很难找到正确的解决方案。 =COUNTIFS(B:B，"BD*"，A:A，A2，C:C，">"&C2) B是Type列，A是参考列，C是Doc条件列。因此，如果Type为'BD'，则计数仅大于零，引用与当前行的引用匹配，而Doc条件大于当前行的Doc条件。我希望这有意义？我尝试过使用GroupBy找到解决方案，但是我并没有接近我想要的解决方案，我认为我把这个问题搞得太复杂了。

浏览 6提问于2022-11-29得票数 0

回答已采纳

1回答

dataframe列上的日期偏移量

、、

我得到了一个Pandas和一个包含datetime64[ns]数据类型的称为过期的列。df.['expiration'][0]给了Timestamp('2010-12-31 00:00:00')。我想从这个专栏中减去一个日历日，但不知道怎么做。我尝试了pandas.tseries.offsets.DateOffset(days=1)，但这使错误不能在日期时间/时间增量操作[<DateOffset: kwds={'days': 1}>]中使用非绝对DateOffset。 THis显然是因为它只在时间索引上工作。所以我试着 import

浏览 2提问于2014-12-08得票数 1

回答已采纳

1回答

Python并行化关联比单进程关联慢

、、、、

我想用Python语言中的multiprocessing模块并行化df.corr()。我取一列，并用rest计算相关值，所有列都在一个进程中，第二列与另一个进程中的其他列。我继续以这种方式通过堆叠所有过程的结果行来填充相关矩阵的上一列。我采集了shape (678461, 210)的样本数据，并尝试了我的并行化方法和df.corr()，分别得到了214.40s和42.64s的运行时间。所以，我的并行化方法需要更多的时间。有没有办法改善这一点？ import multiprocessing as mp import pandas as pd import numpy as np from t

浏览 16提问于2017-02-16得票数 1

2回答

如何与熊猫和吡咯烷酮进行TDD？

、、、、

我有一个Python脚本，它通过在一系列DataFrame操作(drop、groupby、sum等)中一直使用Pandas来合并报告。假设我从一个简单的函数开始，它清除所有没有值的列，它有一个DataFrame作为输入和输出： # cei.py def clean_table_cols(source_df: pd.DataFrame) -> pd.DataFrame: # IMPLEMENTATION # eg. return source_df.dropna(axis="columns", how="all") 我想在我的测试中验证这个函数实

浏览 1提问于2020-04-18得票数 3

回答已采纳

1回答

将函数应用于极性中的2列

我想应用一个自定义函数，它接受2列，并根据这些列输出一个值(基于行) 在Pandas中，有一种语法可以根据多列中的值应用函数。 df['col_3'] = df.apply(lambda x: func(x.col_1, x.col_2), axis=1) 极地的语法是什么？

浏览 13提问于2022-11-14得票数 0

回答已采纳

1回答

如何使用to_sql方法使用postgresql和熊猫填充带有点数据类型的列？

、

我有一个包含许多列的Excel。其中的两列是纬度和经度。我需要使用Pandas将数据从excel导入到PostgreSQL中的表中。PG中的表有一个列而不是two.The，一个列有名称坐标，它的类型是POINT。例如，excel数据包含： Name Longitude Latitude MEDELLÍN -75.5760017134 6.24858636743 ABEJORRAL -75.4287403904 5.78930111433 ABRIAQUÍ -76.0642948678 6.63228195504 ALEJANDRÍA -75.

浏览 0提问于2018-01-24得票数 0

回答已采纳

1回答

.apply()将二元numpy() lambda函数传递给pandas DataFrame的.expanding()窗口

、、

考虑下面这段简单的代码( loc_fun中的numpy.sum是使用numpy的更复杂的二元函数的替身)： import pandas import numpy def loc_fun(A, B): return numpy.sum(A[:-1] > B[-1]) df = pandas.DataFrame(numpy.random.normal(0, 1, [100000, 2]), columns=['size_A', 'size_B']).cumsum(axis=0) df.expanding(2).apply(lambda x: l

浏览 3提问于2018-02-16得票数 1

回答已采纳

2回答

在蟒蛇大熊猫中创建新列时的KeyError

、、

我正试图在蟒蛇熊猫中创建一个新的专栏，我一直得到一个(不稳定的)重新出现的KeyError。脚本的部分非常简单，所以我不确定是什么导致了错误，因为dataset中没有一个列具有相同的名称。我的目标是创建一个新列，并将其附加到包含ticket_contents列内容的新翻译的dataframe中。这是一个样本的数据； 25483 0 outstanding 0 Los-Angeles e-payment delayed Ticket 1/7/19 7:54 39363 0 outstanding 0 Los-Angeles e-payment delayed

浏览 0提问于2019-02-26得票数 0

回答已采纳

1回答

在CSV数据解析上Dask性能缓慢？

、、、、

我已经在一大堆文件上进行了大量的文本处理，包括大的CSV和大量的小XML文件。有时我会做聚合计数，但很多时候我会做NLP类型的工作，以便更深入地查看这些文件中除了已标记或已结构化的内容之外还有哪些内容。我经常使用多处理库在多个CPU上执行这些计算，但我已经爱上了Dask背后的想法，它在网上和同事中都得到了强烈的推荐。我在这里问了一个关于Dask性能的类似问题： MRocklin ()告诉我，加载大量小文件可能会破坏性能。然而，当我在单个大型文件(200mb)上运行它时，我仍然不能让它运行得很好。下面是一个例子：我有一个大约900,000行的tweet CSV文件，我想快速加载它并解析

浏览 11提问于2017-01-15得票数 5

回答已采纳

1回答

大熊猫DataFrame.div和DataFrame.divide的差异

、、、

我正在尝试将一列pandas数据框的元素与另一列的相同行索引元素分开。在尝试查找实现此目的的库函数时，我遇到了两个函数和。他们的记录非常相似，我想知道他们之间的区别是什么。它们之间有什么不同吗？它们的内部实现是否有所不同？若有，原因为何？提前谢谢。

浏览 3提问于2018-02-07得票数 5

回答已采纳

3回答

在DataFrame上应用函数后更改其上的级数位置

、

我正在尝试使用pandas，以便使用简单的函数就地更改我的一个列。在阅读完整个Dataframe之后，我尝试在一个系列上应用函数： wanted_data.age.apply(lambda x: x+1) 它工作得很好。当我试图把它放回我的DataFrame中时，唯一的问题出现了： wanted_data.age = wanted_data.age.apply(lambda x: x+1) 或者： wanted_data['age'] = wanted_data.age.apply(lambda x: x+1) 抛出以下警告： > C:\Anaconda\lib\sit

浏览 0提问于2015-05-16得票数 28

回答已采纳

2回答

为什么当pandas的DataFrame值有变化时，任何变量的值也会改变？

、、、

我正在处理pandas dataframe，我有一个变量，它包含其中一列的值。当我直接在数据框中更改值时，存储在变量中的值也会被替换，这是一个bug还是背后有什么逻辑？这个想法是为了改变df['b]的值，并保持values的完整性，以供其他使用。 import numpy as np import pandas as pd df = pd.DataFrame(np.random.random(size=(100, 2)), columns=['a', 'b']) values = df['b'].values peaks = [0

浏览 81提问于2020-06-26得票数 1

1回答

删除DataFrame的列而不删除python中的原始列

、、、

我不知道如何解释这个问题，所以看一下简单的代码。 import numpy as np import pandas as pd x = pd.DataFrame({"A": [1, 2], "B": [3, 4]}) y = x del y ["A"] print(x) print(y) 输出 B 0 3 1 4 B 0 3 1 4 正如您所看到的，从y中删除一列也会从x中删除它，是否有任何方法可以删除y中的列而不删除x上的列？

浏览 4提问于2017-04-12得票数 0

回答已采纳

1回答

在数据框中选择和修改元素时的KeyError

、、、

我有两个列表要迭代，english_tweets_2和truncated_trigrams_list。 english_tweets_2包含以字符串形式存储的推文。truncated_trigrams_list包含三元组，也存储为字符串。我检查tweet中是否出现三元组。如果是这样，我使用trigram名称转到相应的列，并使用tweet转到相应的行。然后，我将该单个值递增1，并对tweet/trigram的所有其他组合重复此操作。 # Create new columns, fill with 0 initially for trigram in truncated_trigrams_l

浏览 49提问于2021-11-20得票数 0

1回答

Python KeyError:用于引用现有列的flow_from_dataframe中的x_col值

、、

我的代码如下： train_generator = aug.flow_from_dataframe(dataframe = z1, directory = None, x_col = 'id', y_col = 'label',

浏览 1提问于2020-02-27得票数 1

1回答

更改一列pandas数据框中所有行的值

、、、

我有一个数据框df，如下所示： measure model threshold 285 0.241715 a 0.0001 275 0.241480 a 0.0001 546 0.289773 b 0.0005 556 0.241715 b 0.0005 817 0.357532 a 0.001 827 0.269750 b 0.001 1088 0.489164 a 0.0025 我希望将列model中的所有值更改为'no_m

浏览 3提问于2016-09-08得票数 1

回答已采纳

1回答

为什么字符串方法在for循环中使用时停止处理对象列？

、、、、

我要在jupyter笔记本上执行这个代码。我正在试图更改数据文件中的一个对象类型，如下所示： column 1 #Green #Blue #Orange #Green #Red #Blue #Orange #Orange 对此： column 1 [Green, Blue, Orange] [Green, Red] [Blue, Orange] [Orange] 当我尝试用下面的代码对一列中的一列使用string方法时，它可以工作。 df1['column 1'] = df1['column 1'].str.replace('#', '

浏览 0提问于2020-02-05得票数 1

回答已采纳