我需要合并两个数据集。在第一个数据集中,我的观察包含收集的所有数据,其中之一是诊断代码(ICD)。为了使分析变得更容易,我想添加第二个数据集,它显示了所有具有适当诊断和组名的代码。df2中的一个代码可以很容易地用于df1中的多个观测。我尝试过将这两个数据集与merge()合并,但它不起作用。没有错误消息,但是这些表最终是空的,或者它在另一个表的基础上添加了一个表,所以我有双倍的观察结果,但是没有额外的变量。
这是我正在使用的代码线和一些示例行(只是必要数据的缩写)。
head(df1)
Overall_ID ICD age .....
1862 Q85.9 70
1863 K57 63
1864 K57 48
1865 R33 24
1866 T14 50
head(df2)
ICD subgroup
K57 disease of intestines
K58 disease of intestines
Q85.9 phakomatosis
R33 urinary retention
T14 NA
df1_df2 < merge(df1, df2, by = "ICD", all = TRUE)我已经确保在两个数据集中都有一个变量--调用"ICD“来进行实际合并。
数据集中有什么东西可以阻止合并吗?是否有其他方法尝试将数据集添加到一起?
发布于 2022-01-06 16:09:21
结果是空白,用strip.white = TRUE加载数据解决了这个问题,让我合并这些数据。
https://stackoverflow.com/questions/70291171
复制相似问题