我有一个只有一列的大型数据集。像这样
zinc finger protein 185 OS=Homosapiens OX=9606 GN=ZNF PE=1 SV=3
podocin OS=Homosapiens OX=9606 GN=NPHS2 PE=1 SV=1
我试图在GN=之后,在Jupyter notebook中使用Pandas将字符切成一列。喜欢
ZNF185
NPHS2
谢谢
发布于 2019-04-09 03:35:53
我不确定这是否是您想要的,但您可以通过执行以下操作来获得单独的数据集:
a = "OX=9606 GN=ZNF PE=1 SV=3 podocin OS=Homosapiens OX=9606 GN=NPHS2 PE=1 SV=1"
[gn_word for gn_word in a.split() if word.startswith('GN=')]
https://stackoverflow.com/questions/55580382
复制相似问题