2019的文章,Liu et al. Genome Biology,标题是;《A comparison framework and guideline of clustering methods for mass cytometry data》,在6个数据集上面,测试了9种算法的表现。
9种算法工具分别是:
各个算法工具的详细介绍如下所示 :
可以看到, 不同工具的开发语言大不一样,其实这样的比较哪怕是告诉我那个MATLAB开发的工具多么的有优势,我也不想去使用,毕竟新学一门语言还是压力有点大。
6个数据集是:
主要的评价指标包括:(accuracy, F-measure, NMI, ARI),
最后的结论是:每个人工具都有各自的优缺点,如下所示:
不过;PhenoGraph and FlowSOM are the top-performing unsupervised tools
如果你是第一次接触cytof数据,可以看我在《生信技能树》发布了cytof这样的质谱流式数据处理系列文字版教程,就是基于 FlowSOM 哦 :
只需自己准备好FCS格式的数据文件,后续全部的R里面的统计可视化。再怎么强调生物信息学数据分析学习过程的计算机基础知识的打磨都不为过,我把它粗略的分成基于R语言的统计可视化,以及基于Linux的NGS数据处理:
把R的知识点路线图搞定,如下: