Pandas :按两个月的周期进行聚合的问题_Pandas上的Dataframe聚合问题_Pandas:使用3个周期的窗口进行计算 - 腾讯云开发者社区

python、datetime、pandas、filtering、dataframe

我有一个带有'date‘列的Pandas DataFrame。现在，我需要过滤掉DataFrame中日期在接下来的两个月之外的所有行。从本质上讲，我只需要保留下两个月内的行。实现这一目标的最佳方法是什么？

浏览 3提问于2014-04-07得票数 255

2回答

为什么我不能从下一个日期减去一个日期，然后转换成一个整数呢？

python、pandas、numpy

我试图确定两个月之间的差额是偶数月还是奇数月。我用了命令： import pandas as pd (pd.to_datetime('2019-01-01').to_period('M') - pd.to_datetime('2018-08-01').to_period('M')) % 2 这似乎适用于python 3.6.7，但在另一个python 3.7.3环境中，我得到了错误： >>> import pandas as pd >>> (pd.to_datetime('2019-0

浏览 1提问于2019-05-07得票数 3

回答已采纳

2回答

我不明白为什么我的Athena (Presto) SQL查询不能工作

sql、amazon-athena、presto

我有一个具体的问题和一个更一般性的问题..。就上下文而言，我在用雅典娜。以下是我的具体问题： 1)我正在编写一个查询，其中我连续两个月按国家计算day (我最终希望day/MAU按国家和日细分，但我认为我应该开始简单地.)。我对如何处理这个问题的思考是，我需要两个查询，每个月一次，一个组按国家使用，并应用必要的过滤器。最后，我可以加入country以获得包含国家的1列，以及下面包含DAUS两个月的列。下面是我提出的一个查询： SELECT count(distinct uuid) m1, country FROM user u1 WHERE month(date(dt)) = 12 AND

浏览 2提问于2019-02-15得票数 0

回答已采纳

1回答

是否有一个Pandas函数来突出显示时间序列中一周的10个最低值？

python、pandas、jupyter

菜鸟在这里，所以请原谅我的问题格式：我得到了一个两个月的事件时间序列数据集( "date/ time“和"# of events”列，每行代表一个小时)。我想重点介绍每周活动次数最少的10个小时。有没有特定的Pandas函数来处理这个问题？谢谢!

浏览 0提问于2020-06-07得票数 0

1回答

每天工作活跃或不活跃，持续数月。

cron、scheduling

我正试着安排一份工作，但我失败了。我甚至开始认为这不能用cron来完成。我正试着安排一份工作，在六个月内每天在特定时间运行。然后应该停两个月，再跑六个月，然后停两个月，再跑六个月等等。简单地说，我希望它每天运行六个月，停止两个月，然后在无止尽的六个月内开始运行六个月。如果一年有14个月，我可以想出一个办法来做，但遗憾的是，它只有12个月。有可能用cron做这个吗？提亚

浏览 0提问于2020-09-16得票数 1

回答已采纳

2回答

MS Access SQL语句计数使用情况

sql、ms-access

我是SQL的新手。我被安排了一个课程来报告过去两个月的使用数据。有没有人能帮我处理一下SQL语句？ SELECT COUNT(Member_ID,Non_Member_Name) AS Pool_usage_last_2_months FROM Use_of_pool WHERE DATEDIFF(‘2012-04-21’,’2012-02-21’) 我想做的是统计过去两个月的成员使用(Member_ID)和非成员使用(没有ID，只有名称)的总数，然后在同一报告中输出名称、日期和时间等。有没有什么SQL语句可以输出这种信息？欢迎更正/建议。

浏览 0提问于2012-04-21得票数 2

回答已采纳

1回答

不同频率的石斑鱼

python、pandas、datetime、pandas-groupby

我正在尝试使用pandas类Grouper按日期对数据进行分组。我的数据是每周一次的，我可以很容易地按月对其进行分组，如下所示： data.groupby(pd.Grouper(freq = 'M').sum() 我也想把它分成两个月或每学期一次，然而，这两个不是记录频率的一部分(见)。有没有办法做到这一点？

浏览 3提问于2021-05-13得票数 0

2回答

熊猫在列间操作上的分组和聚合

pandas、aggregate

我是一个R和data.table用户，试图使用更多的Python和pandas，当我想在pandas中执行以下操作时，我感到非常沮丧，因为似乎没有一种简单的方法： df = pd.DataFrame({'a': [1, 1, 2, 2], 'b': [0.2, 0.2, 0.2, 0.1], 'c': [10, 9, 10, 22], 'd': [2, 3, 3, 1]}) 在R中，如果我想对b和c的乘积进行求和，并对d之和进行除法(按a分组)，我只需这样做： df[, sum(b*c)/sum(d), by=a] ，但对我来说，

浏览 3提问于2022-05-02得票数 1

回答已采纳

2回答

在groupby子句中，错误的含义是什么不能处理非唯一的多个索引？

python、pandas、unique、pandas-groupby、multi-index

我有一个数据，它有三个级别的索引，我希望计算一个值偏离平均值有多大。但根据我的指数，对于不同的群体，我有不同的平均值。这就是我试过的： In [4]: df['count'].groupby(level=[0,1,2]).apply(lambda x: x-np.mean(x)) 但是，我得到了一个错误，我在下面插入了堆栈跟踪。我不知道为何会有这样的问题。 Exception Traceback (most recent call last) <ipython-input-4-678992689ff2>

浏览 2提问于2016-03-17得票数 8

1回答

如何使用我分组的SSRS TABLIX中的数据列计算百分比

sql-server、reporting-services、ssrs-tablix

我有一个SQL查询，它为我提供了一个包含3列的数据集： “合同法” 音量 MonthRegistered 我想显示按Contract_Code分组的数据和按MonthRegistered分组的列：然后，我想计算几个月之间的百分比差额：在这种情况下，我只会有两个月的数据-每隔一年。我试图表达每一行数据从一年到下一年的百分比变化。我做了这个表达： =(Fields!Volume.Value)/(Fields!Volume.Value) 但是很明显，这是不对的--而且它为什么是不对的--它没有独立地处理列。我确实将TABLIX文本框格式化为百分比，所

浏览 1提问于2017-11-09得票数 2

回答已采纳

1回答

如何设置一个需要2个月(双月数据)的时间变量？

datetime、time、time-series、stata

我找不到一种方法在Stata中定义一个需要两个月的时间变量。我在其他论坛上找到了定义3个月(季度)的间隔或将其定义为一个学期的方法，但这不是我想要的。我有一个这样的数据集 <code>A0</code> 我创建了变量<code>D1</code>，如下所示 <code>A2</code> 但在这里，我无法使用以下代码或<code>D3</code>命令(因为它没有定义双月数据的命令)。 <code>A4</code> 因为Stata将<code>D5</c

浏览 11提问于2019-03-28得票数 0

回答已采纳

2回答

Pandas dataframe:按一列分组，但按其他列连接和聚合

python、pandas

如何转换以下输入数据(从Excel文件输入的Pandas数据帧)： ID Category Speaker Price 334014 Real Estate Perspectives Tom Smith 100 334014 E&E Tom Smith 200 334014 Real Estate Perspectives Janet Brown 100 334014 E&E Janet Brown

浏览 0提问于2018-08-01得票数 2

2回答

应用多个条件级别组

python、pandas、pandas-groupby

问题1: 我有一个数据框架，其中包含两个月值列，如month1和month2。如果month1列中的值不是NA，则将相应的amount值与month1列相加。如果month1列中的值是NA，那么选择相应的'month2‘值并在month1列中搜索它并执行sum。 import pandas as pd df = pd.DataFrame( { 'month1': [1, 2, 'NA', 1, 4, 'NA', 'NA'], 'month2': ['NA

浏览 1提问于2019-08-16得票数 1

回答已采纳

1回答

按行分组pandas中的数据

python、pandas、dataframe

我有这样一个结构的数据： id month val 1 0 4 2 0 4 3 0 5 1 1 3 2 1 7 3 1 9 1 2 12 2 2 1 3 2 5 1 3 10 2 3 4 3 3 7 ... 我想要得到每个id的均值val，按两个月分组。预期结果： id two_months val 1 0

浏览 11提问于2020-09-17得票数 2

回答已采纳

1回答

Python熊猫按聚合语句打印分组

eclipse、python-2.7、csv、pandas、dataframe

我是新来的潘达斯，我想用组的发言。它起作用了，但我可以按功能逐组打印。我正在使用Eclipse这里是我的代码 import pandas as pd df = pd.DataFrame({'A' : ['foo', 'bar', 'foo', 'bar', 'foo', 'bar', 'foo', 'foo'], 'B' : ['one

浏览 3提问于2014-01-18得票数 0

回答已采纳

1回答

将熊猫数据按两列分组而不进行汇总

python、pandas、group-by

我在美国不同的州有一只熊猫。我想按两栏--年份和州--进行分组，以便对一些事物进行统计检验，如死因、新生儿等，并绘制图表。我只能想出groupby熊猫函数，在该函数中，我必须在最后指定一个统计摘要，例如： import pandas as pd df = pd.read_csv(path + 'csvfile.csv') grouped_df = df.groupby(['Year', 'State']).mean() 然而，我只想按年份和州分组，但是使用groupby我得到了以下内容： import pandas as pd df = pd.r

浏览 3提问于2021-12-01得票数 1

回答已采纳

1回答

与切片和聚合表相关的基本熊猫问题

python、pandas

我正在熟悉Pandas，我想通过几个简单的例子来学习逻辑。假设我有以下熊猫DataFrame对象： import pandas as pd d = {'year':pd.Series([2014,2014,2014,2014], index=['a','b','c','d']), 'dico':pd.Series(['A','A','A','B'], index=['a','b','c

浏览 1提问于2015-02-11得票数 1

回答已采纳

1回答

如何在Looker中根据当月来命名列？

looker

如何在Looker中根据当月来命名列？我有一个仪表板，显示当月和过去两个月的销售额。我希望这些列是动态命名的，例如Sales_Sept，Sales_Aug和Sales_July。根据我们查看的月份，名称应该相应地出现

浏览 20提问于2020-09-11得票数 2

2回答

熊猫无法使用聚合函数列表进行聚合。

python、pandas、aggregate

如何指定自定义聚合函数，使其在pandas.DataFrame.aggregate的列表参数中使用时行为正确在熊猫里有两列数据. import pandas as pd import numpy as np df = pd.DataFrame(index=range(10)) df['a'] = [ 3 * x for x in range(10) ] df['b'] = [ 1 -2 * x for x in range(10) ] ..。在聚合函数规范列表上进行聚合不是一个问题： def ok_mean(x): return x.mean() df.

浏览 4提问于2019-02-26得票数 4

1回答

Media_Wearout_Indicator在043 -为什么要担心？

raid、ssd

我有一个运行在RAID1中的带有两个SSD磁盘的服务器，两个驱动器都在043从smartctl报告一个Media_Wearout_Indicator。 233 Media_Wearout_Indicator 0x0032 043 043 000 Old_age Always - 0 两个月前是44岁。我不知道如何解释这个问题，我是否应该担心。它是现实的好直到它达到零，或什么时候将是一个很好的时间得到替代？

浏览 0提问于2014-11-03得票数 4

回答已采纳

1回答

在android系统中，碎片的用途是什么？

android、android-fragments、android-activity

这也许是个愚蠢的问题，但我用android编程了两个月，知道，我仍然不知道什么时候我必须使用碎片，我从来没有感觉到，因为我需要的东西，除了活动.这很好，因为它看起来很有用(很多人都在谈论它)。有人能解释他们的目的吗？在这种情况下，我应该使用它？谢谢

浏览 1提问于2014-05-23得票数 0

回答已采纳

1回答

如果前面的列都是0，那么如何添加返回TRUE或1的熊猫列？

python、pandas

短版本：如何创建返回1的数据列，如果其他两列中的任一列为零(即只有当两者都高于0时才返回1)？更长版本：我每个月都密切关注不活跃的客户--指的是那些在上个月根本没有付款的客户。为什么这个月我们有比上个月更多或更少不活跃的客户？一个月前有多少人宣布不活跃，反之亦然？我已经准备了一个数据，如上，其中包括所有付款从现有客户，从当月和过去两个月中的每一个。接下来我想做的是写一篇专栏文章，标出那些在上个月和当月都没有付款的人。然后，我可以排除所有在两个月内付款的人。仅仅将这两个月相加是不够的，因为我们每个月都会进行检查，并且：上个月没有付款的人，这个月已经付款的人，与上个月的相比，不

浏览 1提问于2022-10-23得票数 0

1回答

聚合物和npm，更新到最新版本

node.js、npm、polymer

我认为这与其说是一个聚合物问题，不如说是一个npm问题。我有一个相当大的聚合物项目，根据聚合物文件夹中的bower.json，它现在达到1.3.0版。我从这个项目中“离线”已经有两个月了，现在我意识到聚合物框架是1.6.0 如何使用npm更新到聚合物1.6.0？如何更新已安装在项目中的所有现有组件？

浏览 0提问于2016-08-01得票数 2

回答已采纳

3回答

如何按列值的计数进行分组和排序？

python、pandas、sorting、count、group-by

如何按列值的计数进行分组和排序？我是一名熊猫学习者。我有一个名为data.log的原始数据帧。现在我想对'c-ip-1‘分组的数字进行计数，并对结果进行排序。原始data.log： sc-status sc-substatus sc-win32-status time-taken c-ip-1 0 200 0 0 986 31.7.188.55 1 200 0 0 2539 31.7.18

浏览 15提问于2017-07-09得票数 2

回答已采纳

2回答

熊猫如何使用dt按月和年分组

python、pandas

我只是想知道如何使用pandas.series.dt按年和月分组。下面的代码仅按年分组，但我将如何添加一个进一步的过滤器，按月分组。 Data = {'Date':['21.10.1999','30.10.1999','02.11.1999','17.08.2000','09.10.2001','14.07.2000'],'X': [10,20,30,40,50,60],'Y': [5,10,15,20,25,30]} df = pd.DataFr

浏览 3提问于2019-10-23得票数 2

回答已采纳

1回答

一个字段的和减去另一个SSRS表达式的和

sql-server、reporting-services、sum、calculated-columns

我正在做一份SSRS报告。我想做的是从它自己的数据集中获取一个字段的值，并从一个不同的数据集中减去另一个字段的值。我可以这样做；但是，这些值是分组的，而不是给出它给我的单个值：( all completed) --( all在前一年完成的和)。这是我在专栏中使用的“与去年相比”的表达式。 =SUM(Fields!Completed.Value, "MTDSales") - SUM(Fields!Completed.Value, "MTDminus1") "MTDSales"和"MTDMinus1"是两个独立的数据集。MTD

浏览 3提问于2016-09-22得票数 1

回答已采纳

1回答

使用mysql.connector，但获取ImportError:缺少可选的依赖项“SQLAlchemy”

python、pandas、mysql-connector

我在一个项目上工作了两个月。今天，我在使用mysql.connector连接到数据库时突然出现了一个错误。有趣的是，在运行早期版本时看不到此错误。 import mysql.connector import pandas as pd mydb = mysql.connector.connect(host="localhost", user="root", password="*****", database="****") Q = f'SELECT * FROM table' df = pd.read_sq

浏览 5提问于2022-01-24得票数 6

回答已采纳

1回答

将pandas数据框保存到csv文件时的附加列

python、python-2.7、csv、pandas、dataframe

这里是处理和保存csv文件的代码，以及原始输入csv文件和输出csv文件的代码，在Python2.7上使用pandas并想知道为什么在保存文件时在开头有一个额外的列？谢谢。 c_a,c_b,c_c,c_d hello,python,pandas,0.0 hi,java,pandas,1.0 ho,c++,numpy,0.0 sample = pd.read_csv('123.csv', header=None, skiprows=1, dtype={0:str, 1:str, 2:str, 3:float}) sample.columns = pd.Index(dat

浏览 3提问于2016-08-28得票数 5

回答已采纳

1回答

报表生成器-分组列中值之间的差异

reportbuilder3.0

标题总结起来，我有价值的各种发票在两个月内。将其分组在报表生成器中的表中，其中包含公司名称和月列组的行分组。所以看起来是这样的： May April Difference Bob 100 100 0 Mary 200 250 -50 Sue 230 100 130 Totals 530 450 目前，我正在编制这样的“差异”列：=Last(Fields!Monthly_Inv_Amt.Value) - First(Fields!Monthly_Inv_Amt.Value) 我想为差额

浏览 1提问于2014-04-30得票数 0

回答已采纳

2回答

按日期分组Pandas DataFrame

datetime、python-2.7、group-by、pandas

我有一个Pandas DataFrame，其中包含一个date列。该列的元素类型为pandas.tslib.Timestamp。我想按日期对数据进行分组，但不包括更细粒度的时间戳信息(即。按日期分组，其中所有Feb 23, 2011都分组)。我知道如何用SQL来表达这一点，但是对于Pandas来说，这是非常新的。做了非常类似的事情，但是我不理解代码，它使用datetime对象。在中，我甚至不知道如何从Pandas时间戳对象中检索日期。我可以转换为datetime对象，但这似乎非常迂回。根据请求，df.head()的输出 date show network time

浏览 6提问于2013-11-21得票数 10

回答已采纳

1回答

指定未在分组熊猫中工作的数据

python、pandas、assign、chaining

在使用熊猫的复杂链式方法中，其中一个步骤是将数据按列分组，然后计算一些指标。这是我想要实现的程序的一个简化例子。我在工作流程中有更多的任务，但一开始很不幸地失败了。 import pandas as pd import numpy as np data = pd.DataFrame({'Group':['A','A','A','B','B','B'],'first':[1,12,4,5,4,3],'last':[5,3,4,5,2,7,]}) da

浏览 12提问于2022-05-30得票数 0

回答已采纳

2回答

具有不完全日期维的聚合类型“Close”

iccube

我们有一个模式，是每天显示最后两个月，每月显示最后两年。为了摆脱日期维度中的日子，我们在透视图中删除它们。遗憾的是，直接移除维度并不有效，因为我们必须给出一个具体的日期(例如，2020-10-01)，而不是“两个月前”。然后我们每个月都要手工改变它。总之，只要我们不使用高级聚合类型(例如Close)来度量，这一切都能很好地工作。一旦我们这样做，我们就会得到一个错误，如果我们希望在过去的两个月以上的基础上看到该度量(没有找到每天的值，因此显然无法找到每天的最后值)。到2020年9月，这一声明失败了：从2020年10月开始，声明成功：使用这些不完全时间维

浏览 9提问于2020-12-22得票数 1

回答已采纳

1回答

在牛市呆了好几个月？

python、altair

此代码创建按月绑定的条形图。 # Load libraries import pandas as pd import altair as alt from vega_datasets import data # Load data df = data.seattle_weather() # Create chart alt.Chart(df).mark_bar().encode( x='month(date):T', y='mean(temp_max)') 每隔一个"n“个月就可以寄存吗？例如，每个栏将是两个月的数据(Jan+Feb，

浏览 1提问于2020-01-13得票数 3

回答已采纳

1回答

MySQL -几个月每月排名

mysql、sql

我正在使用MySQL数据库。在过去的6个月里，我希望每个月都能得到客户的排名。我刚刚得到了下面的查询工作，以确定一个客户的排名在一个月的民意测验。只有在一个月的日期范围内才能正确报告等级。 select t1.*, @rownum := @rownum + 1 AS RANK from ( select date_format(EVE_DATE,'%Y-%m') as MON_DATE, CUST,

浏览 1提问于2016-04-24得票数 1

回答已采纳

1回答

pandas后如何跨列求和？

python、pandas、dataframe

我正在对一个pandas数据帧使用groupby()操作。然后，我尝试对每一行的列求和。但是，在调用sum()时，我一直收到错误消息。我附上了我的代码如下： bike_use = bike_use.groupby(['road_name', 'count_point_id'])['pedal_cycles', 'two_wheeled_motor_vehicles'].sum(axis = 1) 我得到的错误是： TypeError: sum() got an unexpected keyword argument '

浏览 12提问于2020-12-04得票数 0

1回答

预测和时间序列

prediction、supervised-learning、featuretools、churn

如何决定我的预测提前到什么程度？我正在关注featuretools churn tutorial https://github.com/Featuretools/predict-customer-churn 我不太明白的是，它是如何决定提前一个月进行预测的。在我之前尝试的流失示例中，我只是获得聚合数据(它可能是一年或几个月的历史数据)，然后我建立流失模型并进行预测，但我不知道我的预测是一个月、一年，甚至是提前多少天，这是如何决定的！是取决于聚合的时间还是取决于我没有使用的数据。我知道截止时间是我想要做出预测的时间，但我如何告诉系统我想提前2个月进行预测?我只是通过设置cut_off时间忽略

浏览 14提问于2019-02-19得票数 0

回答已采纳

1回答

如何在dask中编写unstack和reindex？

pandas、dataframe、dask、reindex

我用pandas编写脚本，但为了提高效率，我需要切换到dask，但我不确定如何在dask中实现unstack和reindex？这是我的pandas脚本的样子： df_new = df.groupby(['Cars', 'Date'])['Durations'].mean().unstack(fill_value=0).reindex(columns=list_days,index=list_cars,fill_value=0).\ round().reset_index().fillna(0).round()

浏览 11提问于2020-06-18得票数 0

回答已采纳

1回答

熊猫版本升级在使用groupby和聚合max时造成值错误

python、python-3.x、pandas、dataframe、pandas-groupby

A和B是非数字列。A和B列没有NaN Values.However，dataframe在其他列中有NaN值。我得到了一个关于github问题的相关链接：，但我不确定这是否相关，但我认为升级提醒了这个问题。 trepos = prdf.groupby(['A','B']).agg('max').reset_index()[['A', 'B']].apply(lambda x: f'{x.A}/{x.B}', axis=1).values 我想把代码从老的熊猫版本迁移到1.1.5版的熊猫。以上代码在

浏览 8提问于2022-03-11得票数 0

1回答

TabActivity生命周期回调混乱？

java、android、android-activity、lifecycle

我以为我完全理解了lifecycle of activity，直到今天我遇到了一个有趣的问题。我创建了一个从TabActivity扩展的选项卡类型的活动，作为描述问题的一个例子。我还在callback的生命周期activity中添加了日志代码。详情如下： protected void onRestart() { super.onRestart(); MJ_MiscUtils.danielPrintfDebug("MJ_TabMainActivity=>onRestart" , toString() ); } protected void onSt

浏览 2提问于2014-11-10得票数 0

回答已采纳

1回答

按月线性分摊数额

请考虑以下综合数据框架： #Learning to enable splitting contributions spanning two months start = c(as.Date("2013-01-01"), as.Date("2013-02-01"), as.Date("2013-04-01"), as.Date("2013-04-16"), as.Date("2013-05-16")) end = c(as.Date("2013-01-31"), as.Date("2013-

浏览 2提问于2013-10-11得票数 1

回答已采纳

1回答

如何统计最近两个月在oracle中的差异

sql、oracle

如何计算过去两个月的差额。假设:我有过去两年的记录输入： Date | sales 01-JAn- 2019 | 25 29-jan- 2019 | 90 30-Jan-2019 | 45 25-Feb- 2019 | 78 26_feb_2019 | 40 ------------------------------------------------------------- 输出 Date | Count | %Difference JAN

浏览 11提问于2020-02-13得票数 0

回答已采纳

2回答

柱的选择

python、pandas

我使用Pandas，我想按一列聚合数据，然后总结其他columns.You，如下所示： data = {'name': ['Company1', 'Company2', 'Company1', 'Company2', 'Company5'], 'income': [0, 180395, 4543168, 7543168, 73], 'turnover': [4, 24, 31, 2, 3]} df =

浏览 2提问于2022-01-30得票数 1

回答已采纳

2回答

按单个列对多列进行分组-- Pandas Dataframe

python、python-2.7、pandas

我试图将B、和C列的平均值按列A分组。我不知道如何使用groupby函数来完成这个任务： import pandas as pd pd.DataFrame({'B' : df.groupby(['A'])['B'].mean()}).reset_index() 因为我只能知道如何找到平均值，并将单个列按另一列分组。如果这是我现在的数据 A B C 0 70 12 0 20 14 0 46 11 1 25 9 2 86 2 2 14 6 这是我的预期结果。将A的所有类似值分组在一起，B和C中的相应值在各自的列中平均：

浏览 2提问于2017-08-11得票数 0

1回答

考拉GroupBy > Apply > Lambda >系列

pandas、pandas-groupby、databricks、pandas-apply、spark-koalas

我正在尝试将一些代码从Pandas移植到考拉，以利用星火的分布式处理。我正在获取一个dataframe，并将其分组到A和B上，然后应用一系列函数来填充新的dataframe的列。下面是我在Pandas中使用的代码： new = old.groupby(['A', 'B']) \ .apply(lambda x: pd.Series({ 'v1': x['v1'].sum(), 'v2': x['v2'].sum(), 'v3': (x['v1

浏览 8提问于2020-07-06得票数 3

1回答

同一表内的比较结果

sql

? 我有一个逐月员工详细信息的表格。我需要找出连续两个月之间的差异结果。例如，我有员工1,2,3在19年2月，员工2,3,4,5在19年3月。我希望结果是1,4,5

浏览 15提问于2019-04-10得票数 0

回答已采纳

1回答

比较查询PostgreSQL中的2个查询结果

sql、postgresql

我想知道在PostgreSQL中是否有可能将2个查询结果比较成一个查询结果。例如:我有整个3月份的数据，然后我得到了整个4月份的另一个数据。这个查询是我用来获取3月份数据的查询： SELECT availability_date, ROUND(AVG(availability_percentage),2) FROM dashboard.availability WHERE availability_date BETWEEN '2020-03-01' AND '2020-04-01' GROUP BY availability_date ORDER BY

浏览 1提问于2020-04-29得票数 0

回答已采纳

2回答

与熊猫一起阅读readme.md时遇到的问题

python、pandas、parsing、dataframe、io

编辑:忘记提到这必须在熊猫身上完成。我在将某个文件读入pandas数据帧时遇到了一点小问题。我试过了： import pandas as pd import matplotlib.pyplot as plt dataframe = pd.read_csv('/home/leon/Desktop/Uni/ML Lab/Text.txt', delim_whitespace=True, header=None) print(dataframe) 如果我尝试使用包含类似"Hello this is a test“的.txt，它可以很好地工作，但是尝试时，我得到错误信息：

浏览 0提问于2018-11-06得票数 0

2回答

查找熊猫Dataframe列的唯一行，第二列的所有值都是NaN

python、pandas、dataframe、pandas-groupby

嗨，我在努力解决以下问题：给定包含name和variable列的数据文件，我想创建两个列表： list_names_nan包含变量列中所有值都为nanlist_names_not_nan的名称，其中包含变量列中列表1中的值不是nan的名称。下面是一个例子 import pandas import numpy df = pandas.DataFrame(data=[['x',1],['y',2],['x',4],['z',numpy.nan], ['x',

浏览 6提问于2020-07-15得票数 3

回答已采纳

1回答

对Pandas数据帧中的列进行分组和排序

python、pandas

我有一个有很多列的Pandas数据框，其中之一是“电影标题”，我想找到出现在最多行的前5个电影标题，并将它们按降序排列。例如： movie title Title 1 Title 2 Title 2 Title 3 Title 3 Title 3 应该变成： movie title count Title 3 3 Title 2 2 Title 1 1 它可以在同一数据帧中，也可以在新的数据帧中。我可能错过了一个简单的解决方案，因为我对Pandas非常陌生。谢谢你的帮忙!

浏览 0提问于2016-04-02得票数 1

1回答

基于相同长度numpy.array的Groupby分组pandas.DataFrame

python、arrays、pandas、numpy、dataframe

我有一台numpy.array arr和一台pandas.DataFrame df。 arr和df具有相同的形状(x,y)。我需要按df的一列进行分组，并对具有相同形状的arr应用受影响行的转换。为了清楚起见，这里有一个玩具示例： arr = 0 1 12 3 2 5 45 47 3 19 11 111 df = A B C D 0 0 1 2 3 1 4 5 6 7 2 4 9 10 11 我想按A对df进行分组，并计算平均值，但为了代替转换df，我希望对arr进行转换。所以我得到了一些类似

浏览 4提问于2016-08-08得票数 2

回答已采纳