这是一个对我有特殊意义的教程,大约在一年半以前,我和朋友开始研究如何将多个数据集合并为一个数据集来分析,但是当时试了很多方法,效果不理想,再加上很多前辈告诉我很多人不认同这样合并多个数据集(因为会导致很多误差),所以尝试了几天以后我就放弃了。
然后最近因为疫情我又重新开始研究这段,终于给摸索出来一个还可以的教程并结合自己的数据集做了实例验证,效果挺满意的,所以想把这段教程写下来并总结以待后用。
因为目前合并多个测序、芯片数据集这一块并没有完全统一的标准,方法大概有五六种。公说公有理婆说婆有理,对于我这样的新手来说,最简单的是跟随顶级文章的文章思路或者分析流程和步骤。于是我选取了一篇欧洲泌尿外科的顶级文章,从这篇文章的补充材料可以看出来: