你好,我有以下格式的数据报:
set.seed(42)
df = data_frame(contigs = sprintf("k141_%s",floor(runif(100, min = 20, max = 200))),
start = floor(runif(100, min = 100, max = 115)),
end = floor(runif(100, min = 800, max = 830)))
df
*对不起,我不知道如何正确地输出df。
如果我有3个或更多数据帧列表。每一个都有区间,然后我想找出这些区间之间是否有交集。如果它们相交,我们需要删除交叉点。例如
d1<-cbind(st=c(1,4,6),ed=c(7,8,10)); d2<-cbind(st=c(4,8,17),ed=c(7,12,20)); d3<-cbind(st=c(1,8,25),ed=c(3,13,30))
l<-list(d1,d2,d3); l
为了便于可视化,我绘制了它们,黑色间隔来自d1,蓝色d2和红色d3。其思想是删除相交区域,例如d1中的间隔1和d2中的1以及d3相交中的1。我希望结果是
d2; st ed
我有一个像这样的数据文件:
ID Group Start Date End Date
1 A 2018-08-08 2018-08-09
1 A 2018-08-07 2018-08-08
1 A 2018-08-05 2018-08-07
1 B 2018-08-08 2018-08-09
1 B 2018-08-07 2018-08-08
2 A 2018-08-08 2018-08-09
2 A
我有几个数据帧,其中包含单列。假设我有4个这样的数据帧,都有一列。如何通过组合所有数据帧来形成单个数据帧?
val df = xmldf.select(col("UserData.UserValue._valueRef"))
val df2 = xmldf.select(col("UserData.UserValue._title"))
val df3 = xmldf.select(col("author"))
val df4 = xmldf.select(col("price"))
为了结合起来,我尝试这样做,但它不起作用:
v
我想提取染色体的基因间坐标。我编写了大量代码,但由于我对这些包并不熟悉,所以我不确定是否遵循了这里的正确逻辑:
library(IRanges)
library(GenomicFeatures)
library(TxDb.Hsapiens.UCSC.hg19.knownGene)
txdb = transcriptsBy(TxDb.Hsapiens.UCSC.hg19.knownGene, by = "gene",use.names=TRUE)
#For example, only I am interested in intergenic coordinates in ch