今天看到一个“生信分析人员如何面对焦虑和压力”的讨论,虽然对象是从事生信数据分析的科研人员,但岛主认为同样能安慰到其他和科研打交道的朋友。科研不易,埋头死磕的时光回首也是人生财富,和大家共勉。
很多时候数据分析是你一个人的工作,组里的其他人不见得比你更有经验,所以帮不上什么忙。你不得不独自做很多决定:该用什么工具分析?怎么分析?分析得对不对?
做生信分析有三个原则:
跑通指令、速战速决、简化过程
就和画画时先定框架一样,先把要分析的几大块步骤确定,用一小部分数据先把指令跑通,不要一上来就把几个G的大数据同时跑。尤其是电脑不给力,或者每个步骤花的时间很长的时候。先跑通,看看有没有原则性的问题,做修改重试的时间代价也比较小。
减少压力最要紧的是“速战速决”。和上一点“跑通指令”的核心观点一致。速度快不仅意味着你能准时回家吃饭追剧,更重要的是能避免你钻牛角尖。
举例说你做一个PPT,里面有个图表的颜色你纠结了3小时甚至3天,在此过程中,你肯定会注意到越来越多的细节问题。比如背景用什么颜色,放左放右有什么讲究,边框多粗看起来和谐,26号字体和28号字体哪种投影出来效果好……有些问题看似复杂,但实际上不值得花那个时间去深究。相反,如果你花3分钟就搞定了,还会挖空心思去想它么?肯定做下一页了是不是?也就是把注意力更多了放在“做完PPT”,而不是“做一张完美的表”上。
细节可以后续完善,但只有尽快往下走,才能发现最关键的问题:一张视觉上不够完美的图可以后续完善,但临到发表你的Result和Summary部分都没完成,那就是大事了。
数据处理也是一样,不要一上来就在细节参数上太较真。更何况很多工具你只知道基础用法,其中的原理可能你根本不懂。只要先一步步往下走,如果结果很不合理,自然你会回去纠正的。
找到分析中一些共性的部分,能合并就合并。不断学习一些实用的指令,减少工作量;或者总结后写个小脚本。这不仅能提高效率,还能将知识点和技能模块化。
卧薪尝胆半年数载,你的文章终于被SCI接收了。开心没多久,你又开始担心“到底我写的对不对?放到现在做我会怎么做?内行看了会挑出哪些错?会不会说我做的是垃圾?”
但很多经验告诉我们,只要你智商正常,每次操作(实验、分析)尽最大努力小心,不要节外生枝,结果交代完整,其实不用太过担心。
生信分析时要用到许多条指令,手滑打错是再正常不过的事情。比如你一不留神把:
samtools view -f 266
写成了:
samtools view -f 226
这算谁的错?光看这两句估计有人也要费会儿功夫才能找出错在哪里,何况在几百条指令里呢?出现这种情况就责怪软件作者好了。一个好的软件是不会让这种错误悄无声息地运行下去的。这两个数字看起来那么像,但运算时在二进制里226=11100010
,而266=100001010
,这差别多明显。软件作者就不能在设计时给大家行个方便换个不容易错的方式吗?
当然软件作者都很辛苦,大家都是人,不可能面面俱到。但既然他不在你眼前,出错的时候就怪他好了。每个软件都有设计得愚蠢的地方,有时候是作者太聪明了,他本人不会犯的错到了其他用户手里就有不合理的地方,这点也算是种失误。
带着这种意识,你搞数据的时候就会开心很多,不会一直患得患失。当然我们对发表的数据一定要诚实、谨慎。可万一,你在已发表的成果里发现了一个这种低级错误,就这么想:你不是唯一一个犯这种错的人。即使此刻实验室里你孤身一人,但古往今来,学会发表也好,SCI论文也好,甚至毕业论文里,犯错的人多了去了。
近两年一直有文章说博士研究生普遍心理健康状况差,发不了文章、被老板责难、延毕导致怀疑人生。也有些人就算发了文章,顺利毕业,也逃不开“骗子综合征”的自我怀疑。
骗子综合征 一个心理学概念。很多极具天赋、创意的人士都经历过类似的心理过程:尽管在客观上他们已取得了相当的成绩,然而在主观上,他们始终不相信那是基于自己的能力做到的,反而认为是运气好,觉得别人的赞美言过其实,而且这种虚假的成功总有一天会被揭穿,人们会看到自己能力不足的一面。
如果你不仅完全没有“骗子综合征”的顾虑,反而一直觉得自己是旷世奇才,怀才不遇……嗯……岛主愿你永远这么优秀