生物信息学、python、R、linux

微信公众号及简书同号,欢迎关注~
204 篇文章
25 人订阅

全部文章

生信编程日常

bash常用命令

alias: 为一个命令定义一个别名; unalias:删除指定的别名; bg: 将任务放到后台运行; fg:将作业放到前台运行; break: 跳出f...

500
生信编程日常

通路富集与超几何分布

超几何分布是统计学上一种离散概率分布。它描述了从有限N个物件(其中包含M个指定种类的物件)中抽出n个物件,成功抽出该指定种类的物件的次数(不放回)。 需要注意...

900
生信编程日常

linux下执行数学运算 (expr/bc/方括号/awk)

在bash中,在将一个数学运算结果赋给某个变量时,可以用美元符和方括号($[ operation ])来实现。

2000
生信编程日常

使用tibble实现简单数据框

tibble 是一种简单数据框,相对于传统的data.frame做出了一些修改。tibble 包是tidyverse 的核心 R 包,其所提供的简单数据框更易于...

1000
生信编程日常

linux按行读取 (while read line与for-loop)

在linux下一般用while read line与for循环按行读取文件。现有如下test.txt文件:

5130
生信编程日常

R批量读取、处理及写出文件

在对同一路径下多个文件做相同处理时,可以循环读取文件夹中的文件,批量读取,处理和写入文件,会大大提高工作效率,在R语言中,处理方法如下所示。

7920
生信编程日常

UMAP的初步了解及与t-SNE的比较

降维是机器学习中的可视化和理解高维数据的强大工具。t-SNE是最广泛使用的可视化技术之一,但其性能在大型数据集中会受到影响。

4920
生信编程日常

apply(), lapply(), sapply(), tapply()的区别

apply的输入为data.frame或matrix,输出为 vector, list or array。

6930
生信编程日常

sed中的正则匹配

sed很早就支持正则表达式了,这在文件处理中非常有用,以下列出一些常见用法(GNU SED版本)。

6420
生信编程日常

R中极树状图实现

5310
生信编程日常

Trimmomatic 数据过滤

Trimmomatic 是一个很常用的 Illumina 平台数据过滤工具。支持 SE 和 PE 测序数据。主要用来去除 Illumina 平台的 fastq ...

10420
生信编程日常

ggplot2点图调整顺序

但是这里有个问题是,本来应该还有一组点,因为这一组点最少,画在最下边被挡住了。我想让这一组点显示出来。一开始我打算修改分组的levels的顺序,将这一组换一下位...

6420
生信编程日常

shell按列合并文件

cat命令可以按行依次合并两个文件。但有时候我们需要按列合并多个文件,也就是将每一个文件的内容作为单独的的几列,这个时候可以用paste来按列合并多个文件。 ...

7110
生信编程日常

kallisto比对参考转录组

kallisto是2016年发表在Nature Biotechnology上的一个比对工具,可以将bulk或者single-cell RNA-Seq数据的序列直...

6220
生信编程日常

10X Genomics 建立自己的参考基因组

10X Genomics为Cell Ranger提供了可以直接使用的人和小鼠基因组。此外,研究人员可以为其他物种创建自定义参考基因组,或向参考添加感兴趣的自定义...

6420
生信编程日常

R对集合的操作

两个向量常常会用到交集并集差集等操作。 1.x、y的交集 intersect(x, y) 返回既在 x 表,又在 y 表中的值。 2.x、y的并集 u...

6920
生信编程日常

使用stringr处理字符串

str_c() 函数是向量化的,它可以自动循环短向量,使得其与最长的向 量具有相同的长度:

7410
生信编程日常

gffread - gtf/gff文件转fasta序列

今天有一个需求,就是要将gtf中的转录本转成fasta序列,一开始是想着用bedtools getfasta实现,awk取出来坐标做成bed文件输入bedtoo...

6110
生信编程日常

修改因子水平

将factor的因子水平进行修改比较方便的包为forcats 测试数据集:forcats::gss_cat 数据集,该数据集是综合社会调查数据的一份抽样。

7720
生信编程日常

python字典一个key映射多个value

有时候我们想在字典中存储更多的信息,一个key对应多个value,但是又不想做两个字典。那么,我们可以将多个值放到另外的容器中, 比如列表或者集合中。比如,可以...

8630

扫码关注云+社区

领取腾讯云代金券