暂无搜索历史
本文介绍全转录组数据分析方法,我们将以拟南芥测序数据为例,在 UseGalaxy.cn 云平台进行数据分析实践。
当我们进行单细胞数据分析时,应该始终从质量控制步骤开始,首先清理数据,以确保数据足以回答研究的问题。在此步骤之后,通常会继续进行定位(比对)或基因组组装步骤,具...
在GATK最佳实践检测变异过程当中,当我们在调用 HaplotypeCaller 时,可以选择输出 GVCF 文件,或者 VCF 文件,这两者有什么区别呢?
Galaxy 平台(UseGalaxy.cn)也整合了awk 工具,可以方便地对表格数据进行报表生成。
Extract element identifiers of a list collection (Galaxy Version 0.0.2)
工具:Flatten collection (Galaxy Version 1.0.0)
肿瘤生信科研经常会画突变的景观图,或者叫瀑布图,用 maftools 包可以实现简单的 Landscape 图,但是当图形比较复杂时,maftools 就不能胜...
Awk 是一个强大的文本分析工具,它每次读入一条记录,并把每条记录切分成字段后进行分析。Awk 官方文档是非常好的学习材料,通过man awk查看。
我们需要将Python对象序列化为字节流,这样就可以将其保存到文件中、存储到数据库中或者通过网络连接进行传输。
这个问题可以通过 open() 函数中鲜为人知的 x 模式替代常见的 w 模式来解决。例如:
可以利用字典推导式(dictionary compehension)轻松解决。例如:
程序优化的第一准则是“不要优化”,第二准则是“不要优化那些不重要的部分”。基于这两个原则,如果你的程序运行得很慢,你得先找出影响性能的问题所在。
除了 SystemExit、KeyboardInterrupt 和 GeneratorExit 之外,上述代码能够捕获所有的异常。如果还想要捕获这三个异常,将 ...
如何在字节串(Byte String)上执行常见的文本操作(例如,拆分、搜索和替换)。
我们需要调用一个换算(reduction)函数,例如 sum()、min()、max()等,但首先得对数据做转换或筛选。
列表推导式的使用需要注意其内存占用,当原始列表比较大时,其内存占用较高,可以使用生成器表达式通过迭代的方式产生筛选结果:
可以使用 collections 模块中的 OrderedDict 类。当对字典做迭代时,它会严格按照元素添加的顺序进行。例如:
我们想要一个能将键(key)映射到多个值的字典(即所谓的一键多值字典[multidict])。