问如何从大型数据集的单个列中切分字符串？
EN

Stack Overflow用户

提问于 2019-04-09 03:19:18

回答 1查看 50关注 0票数 0

我有一个只有一列的大型数据集。像这样

zinc finger protein 185 OS=Homosapiens OX=9606 GN=ZNF PE=1 SV=3
podocin OS=Homosapiens OX=9606 GN=NPHS2 PE=1 SV=1

我试图在GN=之后，在Jupyter notebook中使用Pandas将字符切成一列。喜欢

ZNF185
NPHS2

谢谢

发布于 2019-04-09 03:35:53

我不确定这是否是您想要的，但您可以通过执行以下操作来获得单独的数据集：

a = "OX=9606 GN=ZNF PE=1 SV=3 podocin OS=Homosapiens OX=9606 GN=NPHS2 PE=1 SV=1"
[gn_word for gn_word in a.split() if word.startswith('GN=')]

票数 0

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/55580382

复制

相似问题

问如何从大型数据集的单个列中切分字符串？EN