Python -使用Pandas为每个唯一标识符计算日期之间的时间

文章/答案/技术大牛

发布

1回答

、、

2 19/07/2020 06:11:122 20/07/2020 14:32:44 2 20/07/2020 02:11:24 我想通过使用每个ID的最小值并减去持有相同ID的行的时间来计算时间。但是，我希望格式为hh:mm:ss，如果差异超过24小时，则为37:44:22。这是我希望<em

浏览 2提问于2020-07-21得票数 1

回答已采纳

1回答

在指定的Pandas日期范围内使用Python ()

、、、

在Excel中，通过使用产品函数(基于最近更新日期的起点(在本例中为01/10/2020) )，只需将每个起点元素的产品功能总和乘以此产品功能，就可以得到当前更新日期的总和，并按元素值进行细分。(相当于Excel函数)之间按比例计算。它需要一个函数来计算，我在这里猜测，从TimeDelta (以月为单位)从StartDate到成员的第一次续约<

浏览 3提问于2020-11-14得票数 0

回答已采纳

1回答

在不唯一的Pandas DataFrame列上高效运行操作

、、

我有一个类似于下面的DataFrame：raw_data = {'Identifier':['10','10','10','11',11,'12','13']}df = pd.DataFrame(raw_data,columns=['Identifier'])正如您所看到的，'Identifi

浏览 1提问于2017-06-19得票数 0

1回答

powerBI使用python导入分组数据

、、、、

每个表单都有一个唯一的标识符。因此，表对于每个唯一标识符有多个行，对于每个更新有一个日期标记。在powerBI中使用group，我可以在每个唯一标识符的第一个或最后一个记录上对表进行筛选，在日期标记上使用min()或max()。但是，我想在每个唯一标识符<e

浏览 0提问于2020-06-25得票数 0

回答已采纳

1回答

Python -计算扩展收益的标准差

、、、、

我目前使用的是一个超大型数据文件(CRSP每日股票文件)，它包括超过16000家公司的每日回报，总共有850万行数据。在Python中运行for循环大约需要2周时间。目标是计算每个公司的收益波动(标准差)。对于每个月底，我需要从年初到那个月的回报的标准差。PERMNO“是确定的标识符，" date”是每日返回的日期，&

浏览 9提问于2022-03-04得票数 0

1回答

熊猫:与小组的第一元素不同

、、

我试图计算组中的元素和组中的第一个元素之间的日期差异。考虑下面的pandas.DataFrame，按operation#、type和date分组Duration = Sell_Date - Buy_Date .我成功做到这一点的唯一方法是使用一个非

浏览 2提问于2014-12-12得票数 1

回答已采纳

2回答

使用定制距离函数从Pandas Dataframe创建距离矩阵

、、、、

我有一个Pandas dataframe，它有两个列"id“(唯一标识符)和"date"，如下所示：0 N1 2020-01-312 N3 2020-03-10 我已经创建了一个自定义Python函数，给定两个日期字符串，它将计算这些日期之间的绝对天数(使用给定的<

浏览 0提问于2020-09-22得票数 4

回答已采纳

1回答

Pandas:使用groupby和nunique考虑时间

、、

我想测量每个A与之交互的不同标识符的数量。要做到这一点，我通常只需这样做我现在必须做一件稍有不同的事情:每个标识符都有一个分配的日期(每个标识符不同)，它将交互分为两部分:在该日期之前发生的之前所做的相同操作(计算与之交

浏览 23提问于2020-05-08得票数 0

1回答

在Python中计算列中日期间隔的一种简便方法

、、、

假设我有一个这样的Pandas DataFrame： A 1 2020-03-09 C 3 2020-06-25 C 4 2020-07-18 此数据文件包含每个“事件”每个“项”的唯一日期。这意味着一个项目有几个具有不同

浏览 1提问于2021-01-26得票数 2

回答已采纳

2回答

如何在熊猫中计数？

、、、

经过几天的研究，我被困住了。我是Python/Pandas的新手。尝试将数据分析从多个excel表转换为python解决方案。 NOs -

浏览 3提问于2014-12-24得票数 0

回答已采纳

2回答

以不规则间隔进行重采样

、、、、

我在pandas数据框中存储了一个规则间隔的时间序列： 1998-01-01 00:00:00 5.711998-01-02 00:00我还有一个不规则间隔的日期列表： 1998-01-011998-09-21 .... 我想计算日期列表中每个时间间隔之间的时间序列的平均值。<

浏览 30提问于2019-04-17得票数 1

回答已采纳

2回答

使用IMAP的唯一电子邮件标识符

、、、

我正在用Django/Python创建一个GMail电子邮件界面。我想创建一个所有电子邮件的骨架，包含主题和日期，一种概览级的索引，这样即使一封电子邮件被删除，我也有一个它存在的指示器和它的发送时间。我的问题是，考虑到IMAP UID的变化，我可以使用什么作为唯一的电子邮件标识符？即使我在数据库中使用唯一的</

浏览 2提问于2012-11-28得票数 1

2回答

如何使用Python* Pandas从时间间隔数据计算时间点值？*

、

我们有一个表(pandas.DataFrame对象)，它显示集群的CPU计数和内存使用情况。该表的每一行都包含开始和结束时间(pandas.datetime对象)以及该时间间隔内某个作业的CPU和内存使用情况(由于作业是独立的，因此时间间隔可能会重叠)：4 2013-11-08 18:30:25 2013-11-

浏览 1提问于2014-10-21得票数 0

1回答

当并非所有行都包含结束日期时，在dataframe中对开始日期和结束日期进行计算。

、、

我是一个庞大的新手，使用Python查询SQL数据库，将结果解析成一系列数据，并将结果输出到Excel表(xlsxwriter)，并在Python代码中执行一些计算，但我对一个操作有问题。我需要在具有相同标识符的行之间找到日期之间的差异，但并不是每个标识符都对应于开始日期和结束日期。例如，我有这样的数据： ID

浏览 2提问于2019-02-21得票数 1

回答已采纳

1回答

复制每一行，并在给定的开始日期和结束日期之间添加一个额外的字段，计算一天。

、、

我正在使用Microsoft，我希望创建一个查询，该查询重复从表中提取的每一行，并在计算给定开始日期和结束日期之间的某一天时添加一个额外的字段。因此，如果在开始日期和结束日期之间有4天时间，那么每个记录都会返回4个重复的行，唯一的区别是添加的日期字段计数为1

浏览 7提问于2014-01-04得票数 2

回答已采纳

1回答

如何使用python计算和绘制从调查中收到的数据

、

我需要做的基本上是计算一段时间内收到的响应。07/07/2019 | 6并将上面的内容绘制成图表。但当前数据格式如下：07/07/2019 12:00:0308/07/2019 20:06:09import pandas

浏览 12提问于2019-11-22得票数 0

2回答

具有聚合函数的小型SQL任务

、

我在试着计算C_ST和'0‘对每个Abonent，但不知道如何。试图找到解决办法，但什么都没有.数据库结构：QRY_TYPE (ID -类型的唯一标识符，С_NAME -类型名称，C_AB_REF -链接到处理这些类型的消息)。ST_ABONENTS (ID -唯一标识符，С_NAME -名称) QRY_QUEUE (ID -唯一标识符，С_IN_TIME -向表写入msg的<

浏览 0提问于2016-03-09得票数 0

回答已采纳

1回答

TypeError: dtype datetime64[ns]不能转换为timedelta64[ns]

、、

我有一篇来自的专栏文章。 sunspots_df['year'] = pd.to_timedelta

浏览 7提问于2022-08-15得票数 0

回答已采纳

1回答

如何根据日期间隔获取每个Id和月份的最新事件列表？

、、

我有一个表，为唯一标识符注册不同的事件日期-每个Id-事件-日期组合的一行。根据发生在该Id上的事件数量，每个唯一标识符可以有多个日期。对于单个Ids，在同一日期没有发生两个事件。首先，我想确定最近事件发生超过7天的唯一Ids。这是我的工作方法：(

浏览 2提问于2022-09-23得票数 1

回答已采纳

1回答

：在上一列中计算自最后一个日期起的天数和在新列中的位置

、、、

更新:错误->“无法处理非唯一的多索引！”在运行了下面的代码之后，我得到了下面的Python输出数据： df = df.sort_valuesoutput = df.groupby(['FLEET', 'SUBFLEET', 'AIRCRAFT']).DTIN.apply(l

浏览 5提问于2017-12-14得票数 0

点击加载更多