我有一个描述基因相互作用的三维数据集,可以用图表表示。数据集示例如下:
a + b
b + c
c - f
b - d
a + c
f + g
g + h
f + h
'+‘表示左边的基因正向调节右边的基因。在这个数据中,我想计算一个子图,其中一个基因(比如x)正向调节另一个基因(比如y),y反过来又正向调节另一个基因(比如z)。此外,z还受到x的正调节。在上图中有两种这样的情况。我想执行这个搜索,最好使用awk,但是任何脚本语言都可以。我很抱歉我的问题太具体了,并提前感谢你的帮助。
我需要帮助才能理解R中的coxph()函数是如何工作的,从而了解如何正确解释输出。 我尝试在一个包含两个因素的“生存分析”数据集上运行cox比例风险模型:性别和基因型。性别因素有两个分类变量:"m“代表男性,"f”代表女性。基因型因子有三个分类变量:"Ctrl","nKO","CRE_Ctrl“。我想看看是否有交互,因此我做了: library(survival)
Survival = Surv(time = D$Age, event = D$outcome) #D is my dataframe, Age is time of dea
我有来自不同物种的基因
Gene A , Gene B, Gene C, ... Gene Z
有些基因彼此相似。
A & G are 96% similar
C & H are 92% similar
G & B are 89% similar
G & T are 85% similar
.
.
.
K & F are 52% similar
我想把这些基因分成几类
物种A、B、T、G是同一种C、H、N、R、L、P。。。K似乎与任何物种不相似(它本身是未知的或物种本身)F似乎与任何物种(它本身是未知的或物种本身)不相似。
我知道我可以用K均值对这些基因
我有一个Rna-seq数据集(rows=samples,columns=genes),它具有聚类功能.这些基因被分类为n个簇,其中属于0簇的基因是非聚类基因。这些聚类又回到聚类中,我们又得到了n个标记数的簇,其中0又是非聚类基因。这一过程一直进行到没有进一步的基因被分类为第0组。我需要循环进入这个过程,以便在每次迭代时返回最终的聚类结果以及属于群集0的基因的合并。我知道这可以用时间或重复来完成。我试过使用重复,但没有工作,问题是,我没有真正清楚如何正确设置这一点。
#define my dataset
dat<-my_dataset
repeat{
#run the cluster
蛋白质-蛋白质相互作用网络是已知的。它是一个无向图。网络的每一行都是这样的(蛋白质2-蛋白质6),它代表蛋白质2和蛋白质6之间的相互作用。
networks:
Protein 2 - Protein 6
Protein 4 - Protein 5
Protein 6 - Protein 5
Protein 5 - Protein 7
...
在这个网络中,一些蛋白质的功能是已知的,功能相似的蛋白质往往是相关的。
The function of some proteins:
Protein 2,Func_002
Protein 2,Func_007
Protein 2,Func_008
Prot
在背景减去和归一化之后,我有一个类"Elist“类型的文件-表示如下。
$E
A B C D E F
ILMN_1 9.678162 9.635665 9.420577 9.778417 9.521473 9.820778
ILMN_2 11.458221 11.152161 11.158666 11.410278 11.416522 11.377062
ILMN_3 9.385075 9.08
我有一份果蝇的蛋白质列表和它的家蚕的正蛋白,它们在一个2031*2的数据框架中,现在我又有了另一个列表,这是上面提到的一些蛋白质和它的基因名称,我如何在第一个数据框架中添加另一列,然后根据第二个列表将该蛋白质的基因名称放在它之后。例如
List1:
1 a
2 b
3 c
List2:
A a
C c
After opration
1 a A
2 b
3 c C