赛尔,你好。
过去的一周,我的心绪总在跌宕着。每一天都有新的事情发生,使我不能静静地在键盘上回复你的留言,想说的话题好像很多,多到一定程度,又不知从何说起。
就像单细胞测序,从2018年开始,已经有不少的文字,既有不断发表的新文章,也有不少经典方法的更新。2018年有人问什么是barcode,2024年依然有人这样问。数据分析的方法虽然有所改善,但是依然还在Seurat所定义的框架内。我这几年的体会是:单细胞数据分析一直很难,不管接触单细胞数据多久,都会这么觉得。
为什么会这样?
前两天在翻《人工智能在生物信息学中的应用》时,在1.3.3组学数据的类型与特点中,作者的洞察或许可以解惑一二。
不管怎么说,单细胞数据分析一直很难。
所以,有时候再给老师朋友答疑的时候,我会冒出一句:欲戴皇冠,必承其重。我们的确是要带着这些难题来讲述自己的生物学故事。
这让我想起高中的时候,有段时间很迷茫,看到别人的成绩那么好、受教育环境那么好、穿的那么好,而自己该如何是好?当时的我,告诉自己:我的确是要在这样的初始条件下,开创幸福人生!
所有的“难”终将过去,或伴随我们成长。
不把这些“难”转嫁出去,而是与之共舞,也很酷。正所谓:两岸猿声啼不住,轻舟已过万重山。
在过去的几年里,单细胞数据分析中进展最快,也讨论最多的当属细胞类型注释,既有cellmarker 这样的数据库,也有大量的算法,比如ChatGPT,然而就在最近,Nature Medicine上的一篇Multiomic analyses uncover immunological signatures in acute and chronic coronary syndromes文章Fig1,用的还是十分朴素的注释和标注的方法。
这个故事告诉我们,虽然很难,只要我们懂得抓住主要矛盾,也能讲好故事。懂得忽略什么,和懂得重视什么一样重要,有时候甚至更重要。如中值基因、线粒体含量、双细胞……