使用loc对pandas数据帧列中的范围进行切片_对相等列值的pandas数据帧进行切片_按特定列中的索引对pandas数据帧进行切片 - 腾讯云开发者社区

、、、

在pandas数据帧中，我需要找到任意行中包含零的列，并删除整个列。例如，如果我的数据帧看起来像这样： A B C D E F G H 0 1 0 1 0 1 1 1 1 1 0 1 1 1 1 0 1 1 我需要删除列A、B、D和F。我知道如何删除这些列，但是以编程方式识别带有零的一列让我摸不着头脑。

浏览 17提问于2018-12-27得票数 2

回答已采纳

11回答

如何在pandas中获取数据帧的列切片

、、、、

我从CSV文件加载一些机器学习数据。前2列是观测值，其余列是特征。目前，我做了以下工作： data = pandas.read_csv('mydata.csv') 这给出了一些类似的东西： data = pandas.DataFrame(np.random.rand(10,5), columns = list('abcde')) 我想将这个数据帧分成两个数据帧:一个包含列a和b，另一个包含列c、d和e。不可能写出像这样的东西 observations = data[:'c'] features = data['c':] 我不确

浏览 4提问于2012-05-19得票数 304

回答已采纳

1回答

可以使用SQL操作通过Pandas创建的数据帧吗？

、、、

因此，我正在尝试创建一个python脚本，该脚本允许我在使用pandas创建的数据帧(masterfile)上执行SQL操作。数据帧从特定文件夹中找到的csv文件中提取其内容。我能够成功地创建其他所有内容，但我在SQL操作部分遇到了麻烦。我正在尝试使用数据帧作为“数据库”，在这里我将使用我的SQL查询来拉取数据，但是我得到了一个"AttributeError：' dataframe‘object has no attribute 'cursor’“错误。我没有看到很多pandas.read_sql_query()的例子，所以我很难理解我将如何在其中使用我的数据帧。

浏览 12提问于2020-06-28得票数 0

1回答

Panda:将dataframe中的多个列求和为新列

、、、

我想要将数据帧的多个列相加为一个新列。对于两个列，我使用了这个。 import pandas as pd, numpy as np df=pd.read_csv("Calculation_test.csv") #creating new colums df["Test1"] = 0 #sum of 2 columns df["Test1"]= df['col1']+df['col2'] df.to_csv('test_cal.csv',

浏览 0提问于2018-06-18得票数 2

1回答

Pandas优化

、、

我写了一个函数来处理pandas的数据。使用我的函数的%prun的分析日志张贴在底部(只有几行)。我想优化我的代码，因为我需要调用这个我写了超过4000次的函数。运行此函数一次需要37.7s。似乎最耗时的部分是numpy.ndarray的nonzero。因为我几乎所有的操作都是基于pandas的，所以我想知道pandas中的哪个函数严重依赖于这种方法？我的操作主要包括使用df.ix[]的基于datetimeindex的数据帧切片和使用pandas.merge()的数据帧合并。我知道不发布实际的脚本很难判断，但是脚本太长了，没有意义，而且大多数操作都是临时的，所以我不能把它重写成小脚本在这

浏览 2提问于2014-06-24得票数 0

1回答

从现有数据帧的某些列创建新的pandas数据帧

、、

我已经阅读了将csv文件加载到pandas数据帧中，并希望对该数据帧进行一些简单的操作。我不知道如何根据从原始数据框中选择的列来创建新的数据框。我的尝试是： names = ['A','B','C','D'] dataset = pandas.read_csv('file.csv', names=names) new_dataset = dataset['A','D'] 我想用原始数据帧中的列A和D创建一个新的数据帧。

浏览 1提问于2017-07-11得票数 24

回答已采纳

2回答

数据帧中所有列在某个范围内的最小值

、、、、

我想要找出数据帧中每一行的最小值，限制为只有几列。例如:考虑一个大小为10*100的数据帧。我想要中间5行的最小行，它的大小是10*5。我知道使用df.min(axis=0)来找到最小值，但是我不知道如何限制列数。谢谢你的帮助。我用的是pandas lib。

浏览 18提问于2020-04-10得票数 0

回答已采纳

1回答

如何从pandas向子数据框添加新列

、、

我开始与熊猫合作，所以这可能是一个很明显的问题，但我已经与它斗争了一段时间，没有找到解决方案。考虑一下这个数据帧： import pandas_datareader as pdr apple = pdr.DataReader('AAPL', data_source='yahoo', start=datetime.datetime(2013, 1, 1), end=datetime.datetime(2020, 1, 1)) 现在，我可以简单地向此数据帧添加一个新列：

浏览 3提问于2020-09-24得票数 0

回答已采纳

1回答

从dataframe中提取值作为pandas中的float/int

、、

我正在尝试从python中的数据帧中提取基于其他两列的一列的值。但这会返回一个序列对象。 df['A'].where((df['B'] == val1) & (df['C'] == val2)) 如何在int/float中提取列A的值，或者如何将sequence对象转换为int或float？

浏览 6提问于2017-07-26得票数 0

1回答

Pandas:在过滤后的数据帧上选择行范围和列

、、

假设我有这样的数据： df = pd.DataFrame({'category': ["blue","blue","blue", "blue","green"], 'val1': [5, 3, 2, 2, 5], 'val2':[1, 3, 2, 2, 5]}) print(df) category val1 val2 0 blue 5 1 1 blue 3 3 2 blue 2 2

浏览 10提问于2020-12-26得票数 1

回答已采纳

1回答

在pandas中设置切片上的值的正确方法

、、

我有一个熊猫数据帧:数据。它有列"name"，'A'，'B‘ 我想要做的(和有效的)是： d2 = data[data['name'] == 'fred'] #This gives me multiple rows d2['A'] = 0 这会将fred行上的列A设置为0。我还做了以下工作： indexes = d2.index data['A'][indexes] = 0 然而，两者都给了我相同的警告： /Users/brianp/work/cyan/venv/lib/python2.7/

浏览 1提问于2016-06-16得票数 70

回答已采纳

2回答

混合行号和列名的索引Pandas Dataframe

、、

来自R，发现pandas数据帧的索引规则不容易使用。我有一个数据帧，我想通过它们的名字来获取第i行和一些列。我可以清楚地理解使用iloc或loc，如下所示。 df = pd.DataFrame(np.random.randn(8, 4),columns=['A', 'B', 'C', 'D']) df.loc[:,['A', 'B']] df.iloc[0:,0:2] 从概念上讲，我想要的是： df.loc[0:,['A', 'B']] 表示包含这些列的第一行。当然

浏览 269提问于2020-07-06得票数 0

回答已采纳

2回答

我想要一个包含.loc []的数据帧，该数据帧来自python中的pandas，具有多列

、

我正在尝试从这个数据帧中选择一些特定的行： df Name Book 1 a1 a2 2 b1 b2 3 c1 c2 4 d1 d2 我有一个变量result，它包含从数据帧的第一行到最后一行生成的数字。现在我用df_new=df.loc[result,:]试了一下，它给了我一个错误。当我使用不带book列的df时，它可以工作，但df_new只包含第一列。我不知道如何让它在选择特定行的同时返回多个列。我想要的示例： df_new Name Book 2 b1 b2 3 c1 c2 我拥有/获得的内容： df_n

浏览 0提问于2020-04-17得票数 0

3回答

在Python中过滤数据帧

、

我有一个包含2列的数据帧，如下所示： Index Year Country 0 2015 US 1 2015 US 2 2015 UK 3 2015 Indonesia 4 2015 US 5 2016 India 6 2016 India 7 2016 UK 我想创建一个新的数据帧，其中包含每年国家的最大计数。新的数据帧将包含3列，如下所示： Index Year Countr

浏览 0提问于2017-08-12得票数 2

1回答

从pd DataFrame获取最近的日期时间索引值

、、

我已经关注了DataFrame： holdings 2021-08-28 04:10:14.130412+00:00 {'$USD': 158, 'Apple': 3} 2021-08-25 18:10:14.130412+00:00 {'$USD': 158, 'Apple': 3} 以持有量为列，日期时间为索引。我通过将下面的dict转换为DataFrame得到了这个：(数据与前面的例子不一致，但格式相同，请忽略它) { datetime.da

浏览 111提问于2021-08-28得票数 0

回答已采纳

3回答

按行的绝对值对数据帧进行排序

、、

我有以下数据帧： import pandas as pd data = {0: [-1, -14], 1: [-3, 2], 2: [7, 10], 4: [-10, 15]} df = pd.DataFrame(data) 我知道如何对特定行进行排序： df.sort_values(by=0, ascending=False, axis=1) 如何根据第一行的绝对值对数据帧进行排序？在本例中，我将拥有类似如下的内容： sorted_data = {0: [-10, 15], 1: [7, 10], 2: [-3, 2], 4: [-1, -14]}

浏览 12提问于2020-08-19得票数 2

3回答

熊猫从df中删除了一系列行。

、、

我想从数据帧的底部删除m行。它是整数索引的(带孔)。如何做到这一点？ pandas == 0.10.1 python == 2.7.3

浏览 1提问于2013-03-29得票数 24

回答已采纳

1回答

由于TypeError，无法绘制散点图

、、、

我有一个数据集，其中我将只使用一个列来应用kmeans聚类。然而，在绘制图形时，我得到了"numpy.ndarray“。我尝试转换为浮动，但仍然面临同样的问题数据帧： Brim 1234.5 345 675.7 120 110 代码： from sklearn.cluster import KMeans import numpy as np km = KMeans(n_clusters=4, init='k-means++',n_init=10) km.fit(df1) x = km.fit_predict(df1) x array([0,

浏览 23提问于2019-05-19得票数 1

2回答

过滤掉数据框列中的值

、、

我已经将一个excel表格转换成了一个数据框架，其中一列以百分比的形式说明了从第一天到第二个月的价格上涨和下跌。例如，将有'-15.4‘或像'6.32’(%)这样的正百分比。我想要做的是只包含该列中具有正值的行。这是我的导入： import pandas as pd ipo_data = pd.read_excel(r'C:\Users\ --- \OneDrive --- \ --- \IPO data.xlsx')

浏览 0提问于2019-12-06得票数 0

1回答

将另一个数据帧中的多个标量乘以MultiIndex Pandas数据帧

、

如何将MultiIndex数据帧中的列与多个标量(来自另一个数据帧)相乘？对于普通的数据帧，它是fairly straightforward，但当它到达MultiIndex数据帧时，我会感到困惑。有什么建议吗？虚拟数据： import pandas as pd import numpy as np def mklbl(prefix, n): return ["%s%s" % (prefix, i) for i in range(n)] miindex = pd.MultiIndex.from_product([mklbl('C', 4), mk

浏览 8提问于2019-02-06得票数 1

回答已采纳

3回答

从pandas.dataframe中提取特定列

、、

我正在尝试使用python读取我的csv文件，将特定的列提取到一个pandas.dataframe中，并显示该数据帧。但是，我没有看到数据框，我收到Series([]，dtype: object)作为输出。下面是我正在使用的代码:我的文档包含: product sub_product issue sub_issue consumer_complaint_narrative company\_public\_response company state zipcode tags consumer\_consent\_provided submitted\_via date

浏览 0提问于2018-02-06得票数 10

回答已采纳

3回答

获取列与特定值匹配的dataframe中的整数行索引

、、、、

给定一个Pandas数据帧，其中一列如下所示： Date 2016-04-15 2016-04-14 2016-04-13 2016-04-12 2016-04-11 2016-04-08 假设值是唯一的，我如何获得特定值的行索引？例如，"2016-04-13“将返回2

浏览 0提问于2016-05-29得票数 5

回答已采纳

2回答

熊猫的整数切片不同的行和列？

、

来自R，我试着让我的头为熊猫数据切片整数。令我困惑的是，使用相同的整数/切片表达式对行和列进行不同的切片行为。 import pandas as pd x = pd.DataFrame({'a': range(0,6), 'b': range(7,13), 'c': range(14, 20)}) x.ix[0:2, 0:2] # Why 3 x 2 and not 3 x 3 or 2 x 2? a b 0 0 7 1 1 8 2 2 9 我

浏览 2提问于2015-12-28得票数 3

回答已采纳

2回答

将新列插入到数据帧中会给出'ValueError:值的长度(4)与索引的长度(6)不匹配‘

、、、

我用pandas库创建了一个数据帧。我想向dataframe中添加一列。然而，我得到了以下error.But，我想我必须输入与lines.How数量一样多的数据，我可以在我想要的行和列中输入信息吗？如果不输入数据，如何创建列？ import pandas as pd kd = pd.DataFrame(data) insertColumns = kd.insert(0, "Age", [21, 23, 24, 21],True ) print(kd) 错误： ValueError: Length of values (4) does not match length o

浏览 302提问于2020-10-10得票数 2

回答已采纳

11回答

Python: Pandas Dataframe如何将整个列与标量相乘

、、

如何将数据帧中给定列的每个元素与标量相乘？(我已经尝试过了，但似乎找不到正确的解决方案) 做一些类似的事情： df['quantity'] *= -1 # trying to multiply each row's quantity column with -1 给我一个警告： A value is trying to be set on a copy of a slice from a DataFrame. Try using .loc[row_indexer,col_indexer] = value instead 注意:如果可能的话，我不想在数据帧上迭代，也不想做

浏览 1149提问于2015-11-18得票数 86

回答已采纳

1回答

从多索引pandas数据帧中选择索引和列的子集

、、、、

沿着索引和列对多索引pandas数据帧进行切片的通用方法是什么？文档是密集和完整的，值得一读()，并且有许多关于堆栈溢出的答案，它们回答了如何专注于“行”或“列”(，这个答案非常全面)。但是，我想要一个更直截了当的答案，同时有两个例子。创建多索引数据帧 cols_index = pd.MultiIndex.from_product([['a','b','c'], ['x','y','z']], names=['first','second']) rows_

浏览 1提问于2019-09-11得票数 1

2回答

为MultiIndex切片而苦苦挣扎(Pandas)

、、、

我正在将我的数据文件夹组织成多索引数据帧，其结构类似于以下内容： In: df Out: Sweep Time Primary Secondary 720nm 473nm PMTShutter Sweep1 0.00000 -87.429810 -4.882812 0.000610 0.000305 0.000000 0.00005 -87.445068 -4.882812 0.000610 0.001221 0.

浏览 2提问于2014-08-11得票数 0

2回答

python -使用具有相同索引的另一个dataframe替换dataframe中的值

、

我有一个dataframe，有些列缺少值： a = pd.DataFrame(data = {"name":['bob','sue','dave'],'status':[np.NaN,np.NaN,'A'],'team':['red','blue',np.NaN]},index=[100,101,105]) 数据帧a ? 我有另一个具有相同索引的dataframe，其中一些缺失的值已被替换： b = pd.DataFrame(data = {

浏览 54提问于2020-08-13得票数 1

回答已采纳

2回答

通过布尔函数过滤pandas数据帧

、、、

我只需要在字符串的一列上使用一个函数来过滤pandas数据帧。下面是一个数据帧的示例： ID Titles Values 0 1 title1 value1 1 2 title2 value2 2 3 title3 value3 ... 我有一个复杂的函数： def checkTitle(title:str) -> bool : ... 我想用这个函数在列标题上过滤第一个数据帧，只过滤函数send True所在的行。我尝试了这样的方法，但没有返回任何有用的东西： df = df.apply(checkTitle(df["Title

浏览 46提问于2021-11-01得票数 0

回答已采纳

1回答

如何在Pandas中选择一部分数据作为新的数据？

、、

这是熊猫原始数据的图片。但是，我想根据dataframe中"START“值的位置分割数据。我希望搜索整个数据框架中的“START”，然后选择开始后的所有值作为列ex。MONTH1，MONTH2，MONTH3 ....until数据扩展(我希望选择范围从“开始”+1到结束)作为新数据帧的列和630,559,994,501 .将是直到新数据帧结束的行。输出最终数据如下

浏览 9提问于2022-09-06得票数 -2

1回答

使控制台友好的字符串成为可用的pandas dataframe python

、、

我有一个简短的问题，因为我目前正在为一些项目从R改为pandas：我从sci-kit learn获得了metrics.classification_report的以下打印输出 precision recall f1-score support 0 0.67 0.67 0.67 3 1 0.50 1.00 0.67 1 2 1.00 0.80

浏览 0提问于2016-08-07得票数 0

回答已采纳

2回答

pandas数据透视表-更改非索引列的顺序

、

我使用以下命令创建了一个数据透视表： table2 = pandas.pivot_table(df, index=['Salesperson'], values=['Gross Sales', 'Gross Profit'], aggfunc=numpy.sum) table2['Profit Margin'] = table2['Gross Profit'] / table2['Gross Sales'] table2_rounded = table2.round({'Gross Prof

浏览 2提问于2016-04-01得票数 8

回答已采纳

3回答

使用切片和列表索引数据帧

是否可以使用以下内容对数据帧进行索引 df[[0:12, 14, 19], [0:4 , 6]] 其中我想得到行0- 11，14，19和列0- 4，6。使用iloc，我无法将切片与特定的行或列编号结合起来。

浏览 0提问于2018-10-09得票数 1

回答已采纳

1回答

熊猫索引与复制错误

、

我的dataframe中有Data2列。我试图通过向NewCol列应用一个筛选器来创建一个新列(‘Data2’)。下面的代码工作，新列的结果是正确的。但在运行代码时，我会得到以下错误消息。我怎么才能解决这个问题？我认为这会影响性能。 C:\Python27\lib\site-packages\IPython\kernel__main__.py:2: SettingWithCopyWarning:值试图在来自DataFrame的片的副本上设置。请参阅文档中的注意事项： # In[1]: import pandas as pd import numpy as np from pandas im

浏览 2提问于2015-08-27得票数 0

2回答

python pandas数据帧填充，例如bfill、ffill

、、

在填写一个非常大的数据帧时，我有两个问题。这张照片有一段。我要把E和F中的1000拉低到26，不要再往下拉。以同样的方式，我希望2000被拉到-1，并被拉到下一个26。我以为我可以用bfill和bfill来做这件事，但不幸的是我不知道怎么做……(Picture1) 另一个问题是，在列中，从-1到26的值不包含E和F中的任何值。我如何删除它们或用0填充它们，以避免bfill或ffill在其中生成错误的条目？(picture2) import pandas as pd import numpy as np data = '/Users/Hanna/Desktop/Coding/C

浏览 45提问于2020-05-12得票数 1

1回答

如何将数据插入到现有的dataframe中，根据条件替换

、、、、

我希望将信息插入到现有的数据帧中，这个数据帧形状是2001行×13列，但是，只有第一列有信息。我还有12列，但是这些列与主数据框的维度不同，所以我想使用条件将这些额外的列插入到主数据框中。示例数据帧：在一个示例中，我希望将var列插入到2001×13数据帧中，使用日期作为条件，如果没有日期，则跳过行或简单地添加0。一般来说，我对python和编程都是新手。

浏览 4提问于2020-06-17得票数 0

1回答

当对不存在的特定列执行.loc时，Pandas返回整个数据帧

、

我有一个数据帧，其列名为['2533,3093', '1645,2421', '1776,1645', '3133,2533', '2295,2870']，并且我正在尝试添加一个名为'2009,3093'的新列。我使用的是df.loc[:, col] = some series，但它返回了一个KeyError，这意味着该列不存在。但默认情况下，pandas会创建该列。如果我使用df.loc[:, 'test'] = value，它工作得很好。但不知何故，当我执行df.loc[:

浏览 6提问于2021-09-17得票数 0

1回答

如何根据另外两列中满足的条件对最后一列中的pandas DataFrame元素进行索引？

、、、

pandas数据帧有4列： df.columns = ['col1', 'col2', 'question', 'answer'] 如何根据满足第一列的标准对数据帧进行索引，从而为'answer'列的单个条目编制索引？即： df['col1'=='apple' and 'col2'=='guitar'].answer

浏览 10提问于2021-01-11得票数 0

3回答

使用loc方法获取DataFrame的视图

、、

我正在尝试使用loc方法获取熊猫数据帧的视图，但当我修改原始DataFrame时，它不能像预期的那样工作。我希望使用loc方法提取DataFrame的行/片，以便在对DataFrame进行修改时，片反映更改。让我们看一下这个例子： import pandas as pd import numpy as np df = pd.DataFrame({'ID':np.arange(0,5,2), 'a':np.arange(3), 'b':np.arange(3)}).set_index('ID') df a b ID

浏览 0提问于2020-05-19得票数 5

2回答

将根据给定需求选择的某些行放入另一个数据帧中

、

我已经使用Pandas将csv文件读取到数据帧中，csv格式如下。我想把“时间列信息”在6/3/2011-10/20/2011间隔之间的行放到另一个数据帧中。我怎样才能在Pandas中高效地做到这一点？

浏览 4提问于2018-08-10得票数 0

1回答

多列范围熊猫数据切片

、

我有一只熊猫的资料栏，上面有很多标有标签的栏。例如： import numpy as np import pandas as pd cols = ['lat', 'long', 'foo', 'bar', 'year', 'month', 'day', 'hour', 'min', 'sec'] df = pd.DataFrame(np.random.random((10, 10)), columns=cols) 我想把这个数据分割成

浏览 0提问于2020-07-16得票数 0

回答已采纳

1回答

Pandas Groupby没有对单个结果进行聚合

、、、

我在Pandas有一个数据帧，它显示了一个城市/州的男性所占的百分比。数据帧df如下所示(请注意，这不是我的实际使用情况/数据，但我的数据类型类似) STATE CITY PERC_MEN ALABAMA ABBEVILLE 41.3% ALABAMA ADAMSVILLE 53.5% .... WYOMING WRIGHT 46.6% 每个State/percentage of men组合将恰好返回一个值。如何显示给定州的城市/人口值？我的代码如下所示(我需要按STATE分组的第一行，因为我对数据做了其他事情) for state

浏览 4提问于2021-09-08得票数 0

3回答

布尔索引，可以产生一个大的熊猫数据帧的视图？

、、

得到一个很大的数据帧，我想对其进行切片(根据多个布尔标准)，然后修改这些切片中的条目，以便更改原始数据帧--即，我需要原始数据帧的view。问题是，奇特的索引总是返回一个copy。我想到了.ix方法，但是使用df.ix[]方法进行布尔索引也会返回一个副本。从本质上讲，如果df是我的数据框架，我想要一个C列的视图，比如C!=0, A==10, B<30,...等。有没有在pandas中做到这一点的快速方法？

浏览 2提问于2013-03-01得票数 13

回答已采纳

6回答

按位置选择pandas列

、、

我只是想通过一个整数来访问已命名的pandas列。您可以使用df.ix[3]按位置选择行。但是如何按整数选择列呢？我的数据帧： df=pandas.DataFrame({'a':np.random.rand(5), 'b':np.random.rand(5)})

浏览 2提问于2013-02-19得票数 133

回答已采纳

1回答

如何将每个组的第一个条目标记为满足某些标准？

、、、

假设我有一些数据帧，其中一列有一些值，这些值多次出现形成组(片段中的列A )。现在我想创建一个新的列，例如，每个组的第一个x (列C)条目有一个1，另一个条目是0。我设法完成了第一部分，但我没有找到一个很好的方法来在xes上包含条件，有没有一个好的方法来做到这一点？ import pandas as pd df = pd.DataFrame( { "A": ["0", "0", "1", "2", "2", "2"], # data to group by

浏览 14提问于2021-10-21得票数 0

回答已采纳

2回答

为什么dataframe对象要转换为TimeSeries对象

、、

假设我有一个数据框架。有多个列(例如：‘，'B')使用以下代码，我希望仅基于一列就生成一个新的数据格式： df2 = df1['A'] 但是，当我这样做时，数据帧突然被转换为TimeSeries。 In [5] print type (df2)<class 'pandas.core.series.Series'> 非常odd...can有人向我解释为什么会发生这种事.？

浏览 3提问于2015-12-14得票数 0

回答已采纳

2回答

具有多个日期范围的Pandas.DataFrame切片

、、、

我有一个带有100,000+行的带datetime索引的dataframe对象。我想知道是否有一种方便的方法使用pandas来获取多个日期范围内的数据帧的子集。例如，假设我们有两个日期范围： (datetime.datetime(2016,6,27,0,0,0), datetime.datetime(2016,6,27,5,0,0) 和 (datetime.datetime(2016,6,27,15,0,0), datetime.datetime(2016,6,27,23,59,59) 假设我们想要获取第一个日期范围或第二个日期范围内的dataframe对象的所有行，其中dataframe对

浏览 1提问于2016-07-08得票数 4

2回答

如何从下一行中获取与Pandas中的某个条件匹配的值？

、、

让我们假设我们有一个如下所示的表： A B 1 1.0 2 2.0 3 2.0 4 3.0 5 2.0 6 1.0 7 1.0 现在，我想从B <= 2.0的下一行的A列中获取每一行的值。结果存储在C中，然后我们得到： A B C 1 1.0 2 2 2.0 3 # Here we skip a row because next.B > 2.0 3 2.0 5 4 3.0 5 5 2.0 6 6 1.0 7 7 1.0 Na 有没有办法在Pandas (或Numpy)中有效地实现这一点？数据帧可能包含数百万行，我希望此操作最多需要几秒钟。如果没有快速的Pandas/Nump

浏览 22提问于2019-08-07得票数 1

回答已采纳

1回答

在pandas中查找指定日期-时间范围内数据列的平均值(python)

、、、、

对于这个论坛和一般的编码，我很抱歉，如果这是一个重复的问题，我将删除！我目前正在使用python处理pandas，并试图在我的一个数据框列中找到一个平均值。我已经创建了我的数据帧，并将其命名为'data'：data=pd.DataFrame()。第一列是日期-时间列，我将其设置如下，将其转换为日期-时间： data.iloc[:,0]= pd.to_datetime(data.iloc[:,0], format="%y/%m/%d %H:%M:%S") #yy/mm/dd hh:mm:ss 对于我感兴趣的数据列，我已经能够使用.mean()函数找到整个列的

浏览 2提问于2021-01-15得票数 2

2回答

根据列范围的范围值条件过滤DataFrames行

、、、

我想要显示行，其中来自列A-F的值满足一个条件，即只有单个列值介于之间(0,5>和其余的值大于5。可以这样想，我想找出这样的情况:只有一个元素离测量中心很近(例如，0-5m距离)，而其余的点(列值)是“更远的”。我已经添加了字符串列作为障碍。我在下面的代码中尝试过，但没有成功。此外，还有一个条件，即其余列的值应该大于5。 df[(df.columns[-6:]>0) & (df.columns[-6:]<=5)] 最小可重现示例： import numpy as np import pandas as pd import string rowsNumber = 1

浏览 32提问于2021-10-18得票数 0

回答已采纳