首页
学习
活动
专区
工具
TVP
发布

生信修炼手册

专栏成员
877
文章
1905160
阅读量
184
订阅数
使用pandas进行文件读写
pandas是数据分析的利器,既然是处理数据,首先要做的当然是从文件中将数据读取进来。pandas支持读取非常多类型的文件,示意如下
生信修炼手册
2020-06-24
2.1K0
python海量数据快速查询的技巧
在实际工作中,经常会遇到查询的任务,比如根据某些rs号,检索dbsnp数据库,提取这些snp位点的信息,对于这样的任务,最基本的操作方法是将数据库的内容存为字典,然后检索特定的key即可。
生信修炼手册
2020-05-28
1.3K0
python读写压缩文件
对于很大的文本文件,通常会压缩之后再进行存储和传输,比如二代测序的fastsq文件,通常都是gzip压缩之后的格式。对于压缩文件的读写,通过python的内置模块也可以快速搞定。根据压缩格式的不同,提供了以下3个模块
生信修炼手册
2020-05-14
1.5K0
python读写csv文件
文件读写的经典操作方式如下,通过内置的open函读取到每行内容,按照指定的分隔符进行分隔,然后对每一列的内容进行处理。这样的方式在处理制表符分隔的文件时,没什么问题,但是在处理csv文件时,会非常的头痛。
生信修炼手册
2020-05-13
1.8K0
SnpSift学习笔记(三)
本篇主要介绍caseControl, rmRefGen, tstv, rmInfo, gt, vcfcheck这6个命令的用法。
生信修炼手册
2020-05-11
4730
tabix操作VCF文件
tabix 可以对NGS分析中常见格式的文件建立索引,从而加快访问速度,不仅支持VCF文件,还支持BED, GFF,SAM等格式。
生信修炼手册
2020-05-11
7.2K0
使用FastQTL进行cis-eQTL分析
FastQTL是一款专门用于cis-eQTL分析的软件,在GTEx项目中就是采用该软件进行cis-eQTL的分析,对应的文章发表在Bioinformatics杂志上,链接如下
生信修炼手册
2019-12-19
3K0
没有更多了
社区活动
【纪录片】中国数据库前世今生
穿越半个世纪,探寻中国数据库50年的发展历程
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档