我有一个在for循环中打开的数据帧列表。对于每个数据帧,我想查询其中的一部分并找到平均值。
到目前为止,这就是我所拥有的:
k = 0
for i in open('list.txt', 'r'):
k = k+1
i_name = i.strip()
df = pd.read_csv(i_name, sep='\t')
#Create queries
A = df.query('location == 1' and '1000 >= start <= 1200000
我有一个场景,我希望在两个数据帧之间找到不匹配的行。这两个数据帧都有大约30列和一个唯一标识每条记录/行的id列。因此,我想检查df1中的行是否与df2中的行不同。df1是更新后的数据帧,df2是以前的版本。 我尝试了一种方法pd.concat([df1, df2]).drop_duplicates(keep=False),但它只是将两个数据帧结合在一起。有办法做到这一点吗。如果能帮上忙我会很感激的。 这两个dfs的示例数据如下所示。 id user_id type status 总共有39列,其中可能包含NULL值。 谢谢。 P.S. df2将始终是df1的子集。
我有一个具有两个类型的类型def和一个相同类型的列表,该列表可能是空的,也可能不是空的。
type Type1 = string
type Type2 = int
type Type3 = Sometype of Type1 * Type2 * Type3 list
我正在尝试创建一个元组中所有前两个元素的列表,递归地传递最后一个元素(其他类型3的列表),并将其附加到我正在生成的列表中。或者至少这就是我想要的。我的函数给我一个错误:
let rec extSometypeInc d =
match d with
| Sometype(n,i,[]) ->