假设我有一个包含三个变量的简化数据帧:
ID sample test_result
P1 Normal 9
P2 Normal 7
P3 Normal 2
P1 Tumor 6
P2 Tumor 5
P3 Tumor 3
我想知道正常和肿瘤test_results
之间的区别,但我不确定如何接近它。
我尝试过在sample
列上使用groupby,然后在test_result
列上使用diff()
方法,但没有成功。
以下是我尝试过的方法:
df.groupby('sample')['test_result'].diff()
我期望的输出是这样的:
ID test_result
P1 3 # the difference between P1 Normal and P1 Tumor (i.e. 9-6)
P2 2
P3 -1
你知道怎么解决这个问题吗?
https://stackoverflow.com/questions/47658578
复制相似问题