蛋白质-蛋白质相互作用网络是已知的。它是一个无向图。网络的每一行都是这样的(蛋白质2-蛋白质6),它代表蛋白质2和蛋白质6之间的相互作用。
networks:
Protein 2 - Protein 6
Protein 4 - Protein 5
Protein 6 - Protein 5
Protein 5 - Protein 7
...
在这个网络中,一些蛋白质的功能是已知的,功能相似的蛋白质往往是相关的。
The function of some proteins:
Protein 2,Func_002
Protein 2,Func_007
Protein 2,Func_008
Protein 3,Func_007
Protein 3,Func_008
Protein 3,Func_009
Protein 4,Func_011
Protein 5,Func_015
...
众所周知,蛋白质的一部分是与癌症相关的蛋白质。
The known proteins:
Protein 4,Cancer
Protein 6, Cancer
Protein 7, Cancer
Protein 10, Cancer
...
但绝大多数蛋白质是癌症相关蛋白还是非癌症相关蛋白尚不清楚。您如何使用已知的癌症相关蛋白来预测该蛋白是否为癌症相关蛋白?
我不知道如何解决这个问题。
发布于 2016-01-08 18:41:33
让我们来看看PageRank算法。
例如,用+1初始化癌症,用-1初始化nonCancer,然后执行幂迭代,直到变化小于阈值1e-10。那些体重为正的人更多地与癌症蛋白有关。
https://stackoverflow.com/questions/34672692
复制相似问题