我需要根据每个人的id (name)和登录时间(login_time)来计算数据集中经过的时间。我希望看到这个df中列出的每个个体从第一个login_time到最后一个login_time之间的时间:
数据示例:
name login_time
alex 2020-12-18T10:50:35
alex 2020-12-19T11:50:11
sue 2020-10-15T10:00:35
sue 2020-10-16T09:50:22
不幸的是,实际数据集有超过80万行。如果只是样本数据,我就这样做:
df = pd.read_csv('filepathto.
我有两列,其中包括:
Night shift start: 19:00
Night end: 04:00
我有一些日期列,每天都有..
Work started: 07:30
Worked ended: 22:00
我想要得到从夜班开始到夜班结束的小数小时数。我需要计算工作时间的“夜班小时数”。
来自评论:我不想得到总的小时数。我想计算一下“夜班小时数”,即19:00-04:00之间的小时数。
我有两个DataFrames,两个国家都是1--首先是183行,2--第二行是156行--它们都有相互导入的信息,我需要第一列的一列和第二列的一列,我的目标是创建一个单一的Dataframe,包含我需要的两个列,以及两个数据名通信的包含的名称。
这就是我所做的,我得到的信息
for i in range(183) :
for j in range(156):
if df['Country'][i]==df_happy['Country or region'][j]:
df.drop(i,axis=0,inplace
我有一个包含两列时间序列数据的pandas数据帧。在我的实际数据中,这些列足够大,如果没有数据着色器,渲染就会很笨拙。我正在尝试比较这两个时间序列中的事件。但是,我需要能够分辨出哪个数据点来自哪个列。下面是一个简单的函数示例。如何让A列和B列使用不同的颜色映射? import numpy as np
import hvplot.pandas
import pandas as pd
A = np.random.randint(10, size=10000)
B = np.random.randint(30, size=10000)
d = {'A':A,'B'
我正在尝试基于一个公共列(df_apply )加入/合并两个数据文件(df_result和name)。听起来很简单,但其中一个数据类型具有pandas.core.series.Series列类型,另一个数据类型具有pandas.core.frame.Dataframe列类型。这将导致合并(pd.merge(df_apply, df_result, on='name')导致错误:
ValueError: The column label 'name' is not unique. For a multi-index, the label must be a tup