文章/答案/技术大牛

发布

社区首页 >问答首页 >如何根据使用熊猫的标签来分割文件？

问如何根据使用熊猫的标签来分割文件？
EN

Stack Overflow用户

提问于 2015-08-28 18:12:54

回答 1查看 2.4K关注 0票数 0

我有一个基因组测序文件，格式如下：

染色体名称(字符串)=位置(int)

所有染色体的数据都存储在一个文件中，我希望

将染色体分割成单个染色体数据文件；
将染色体名(如“chr1 1”、“x”)转换为整数。

我怎么能和潘达斯一起这么做？

import pandas as pd
df = pd.read_csv('sample.txt', delimiter='\t', header=None)

数据如下所示

0   chr1    3000573     0   
1   chr1    3000574     3   
2   chr2    3000725     1   
3   chr2    3000726     4   
4   chr3    3000900     1   
5   chr3    3000901     0

我还可以通过染色体标签chr1，chr2，.

python

pandas

genetics

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-08-28 23:26:17

将每个染色体的数据写入一个单独的文件可以很容易地完成，一旦数据被拼接成碎片。不太清楚你所说的“把染色体名转换成整数”是什么意思，但是如果你指的是给定的"chrx“，你想要x作为一个int，这很容易。假设通过"chrn“拥有染色体"chr1”，其中n是整数：

import pandas
df = pandas.read_csv("sample.txt", delimiter="\t", header=None)
df.columns = ["index", "chrid", "location", "readings"]
chrs = []
for chrid in range(1,n):
    chr = df.loc[df["chrid"] == "chr"+str(chrid)]
    chr["chrid"] = map(lambda x: return int(x[3]), chr["chrid"])
    chrs.append(chr)
# chrs is now a list of dataframes, each for individual chromosome data

票数 2

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/32277350

复制

相似问题

问如何根据使用熊猫的标签来分割文件？
EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何根据使用熊猫的标签来分割文件？EN

回答 1

Stack Overflow用户

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问如何根据使用熊猫的标签来分割文件？
EN