腾讯云

开发者社区

文档建议反馈控制台

首页

文章/答案/技术大牛

发布

社区首页 >问答首页 >基于保留页眉行的列值的拆分文本文件(基因组数据)

问基于保留页眉行的列值的拆分文本文件(基因组数据)
EN

Stack Overflow用户

提问于 2015-12-20 18:30:10

回答 1查看 941关注 0票数 0

我有一个大的基因组数据文件(.txt)，格式如下。我想分裂它的基础上，染色体列，chr1, chr2..chrX,chrY等，保持标题行在所有分裂的文件。如何使用unix/linux命令来做到这一点？

基因组数据

 variantId  chromosome   begin  end
    1            1          33223  34343
    2            2          44543  46444
    3            2          55566  59999 
    4            3          33445  55666

结果

file.chr1.txt
variantId  chromosome   begin  end
1            1          33223  34343


file.chr2.txt
variantId  chromosome   begin  end
2            2          44543  46444
3            2          55566  59999 

file.chr3.txt
variantId  chromosome   begin  end
4            3          33445  55666

linux

unix

bioinformatics

云点播特惠1元起

提供制作上传、存储、转码、媒体处理、媒体 AI、加速分发播放、版权保护等一体化的高品质媒体服务

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-12-20 18:43:04

这是人类基因组(通常是46条染色体)的数据吗？如果是这样，这是怎么回事？

for chr in $(seq 1 46)
do
    head -n1 data.txt >chr$chr.txt
done
awk 'NR != 1 { print $0 >>("chr"$2".txt") }' data.txt

(这是基于@Sasha上述评论的第二次编辑。)

请注意，("chr"$2".txt")周围的父母显然不需要GNU，但他们在我的OS版本的awk上。

票数 3

页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持

原文链接：

https://stackoverflow.com/questions/34388173

复制

java poi拆分excel文件,每个文件保留标题行

javascript 编程算法

在工作中，经常需要处理excel文件，将提供的excel文件导入数据库，有时候文件太大我们就需要做拆分了，下面实现将xlsx文件和xls文件按行数拆分，每个文件都保留标题行。这篇文件接着前面拆分csv大文件进行学习。

jiankang666

2022/05/12

8570

用过Excel，就会获取pandas数据框架中的值、行和列

python 编程算法

至此，我们已经学习了使用Python pandas来输入/输出（即读取和保存文件）数据，现在，我们转向更深入的部分。

fanjy

2021/11/29

19.3K0

【Python】基于某些列删除数据框中的重复值

python

Python按照某些列去重，可用drop_duplicates函数轻松处理。本文致力用简洁的语言介绍该函数。

阿黎逸阳

2020/09/08

20.7K0

使用pandas筛选出指定列值所对应的行

api python

该方法其实就是找出每一行中符合条件的真值(true value)，如找出列A中所有值等于foo

星星在线

2020/05/22

19.2K0

数据库的方向 - 行vs列

存储数据库 sql

前言：转载的好文不多，但此篇的确是难得一见的好文，如若不信，请仔细阅读。此篇文章没有波涛汹涌的起伏，没有繁多的代码，只有悠然自得的文笔。因此，分享此文给大家。翻译原文链接：https://ww

谙忆

2021/01/21

1.1K0

【Python】基于多列组合删除数据框中的重复值

python 编程算法

最近公司在做关联图谱的项目，想挖掘团伙犯罪。在准备关系数据时需要根据两列组合删除数据框中的重复值，两列中元素的顺序可能是相反的。

阿黎逸阳

2020/09/08

14.7K0

VBA：基于指定列删除重复行

vba https 网络安全

文章背景：在工作生活中，有时需要进行删除重复行的操作。比如样品测试时，难免存在复测数据，一般需要保留最后测试的数据。之前通过拷贝行的方式保留最后一行的数据（参见文末的延伸阅读1），但运行效率较低。目前通过借助数组和字典达到删除重复行的效果。

Exploring

2022/12/18

3.4K0

PowerQuery拆分两列，并数据相对应

javascript vba

【问题】把姓名与电话列拆分为行，姓名与电话是按顺序对应的。难点：姓名与电话的个数不定

哆哆Excel

2022/10/31

1K0

Pandas DataFrame显示行和列的数据不全

display max pandas rows set

pd.set_option('display.max_columns', None)

用户7886150

2020/12/26

6.7K0

Pandas 查找，丢弃列值唯一的列

python dataframe nan pandas

数据清洗很重要，本文演示如何使用 Python Pandas 来查找和丢弃 DataFrame 中列值唯一的列，简言之，就是某列的数值除空值外，全都是一样的，比如：全0，全1，或者全部都是一样的字符串如：已支付，已支付，已支付…

萝卜

2022/05/12

5.7K0

【说站】Python DataFrame如何根据列值选择行

python

以上就是Python DataFrame根据列值选择行的方法，希望对大家有所帮助。

很酷的站长

2022/11/24

5.3K0

pdf拆分保留书签_pdf补丁

https xml 网络安全 html

软件已经更新，请在博客首页（http://pdfpatcher.cnblogs.com）下载最新版。

全栈程序员站长

2022/11/16

1.6K0

Numpy中找出array中最大值所对应的行和列

python

Python特别灵活，肯定方法不止一种，这里介绍一种我觉得比较简单的方法。如下图，使用x == np.max(x) 获得一个掩模矩阵，然后使用where方法即可返回最大值对应的行和列。 where返回一个长度为2的元组，第一个元素保存的是行号，第二个元素保存的是列号。

卡尔曼和玻尔兹曼谁曼

2019/01/22

6.5K0

删除列中的 NULL 值

sql

今天接到一个群友的需求，有一张表的数据如图 1，他希望能通过 SQL 查询出图 2 的结果。

白日梦想家

2020/07/20

9.9K0

使用 Python 拆分文本文件的最快方法是什么？

python javascript 存储编程算法

在 Python 中拆分文本文件可以通过多种方式完成，具体取决于文件的大小和所需的输出格式。在本文中，我们将讨论使用 Python 拆分文本文件的最快方法，同时考虑代码的性能和可读性。

很酷的站长

2023/02/18

2.6K0

基于jquery拆分姓名的方法[纯JS版]

dom jquery插件表单客户端

之前已经分享过一个在dom中用户输入姓名后自动用js拆分成姓与名到表单中的jquery插件,由于项目的需要,需要一个在客户端自动拆分,但不需要将拆分结果呈现给用户的方法,所以又写了一个独立的方法,贴出来跟大家分享交流

风柏杨4711

2021/03/15

6500

Excel实战技巧109：快速整理一列数据拆分成多列

vba excel

你可以使用多种方法，包括：使用VBA，创建数组公式，编写多个公式，等等。本文将给你展示一种“最懒的”方法，也可能是最快且最容易的方法。

fanjy

2021/08/31

1.7K0

列存储、行存储

php 编程算法存储数据库数据挖掘

Sybase在2004年左右就推出了列存储的Sybase IQ数据库系统,主要用于在线分析、数据挖掘等查询密集型应用。列存储，缩写为DSM，相对于NSM(N-ary storage model)，其主要区别在于：

全栈程序员站长

2022/09/14

7.9K0

点击加载更多

相似问题

行拆分-如何保留缺少值的列？

unix中基于列值的文本文件拆分

保留基于pandas中给定列的值的行

220

将列值拆分为行，并从第二列保留值。

基于行值按行拆分数据

活动推荐

即时通信IM，低门槛快速接入

添加站长进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

问基于保留页眉行的列值的拆分文本文件(基因组数据)
EN

云点播特惠1元起

回答 1

Stack Overflow用户

行拆分-如何保留缺少值的列？

unix中基于列值的文本文件拆分

保留基于pandas中给定列的值的行

将列值拆分为行，并从第二列保留值。

基于行值按行拆分数据

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问基于保留页眉行的列值的拆分文本文件(基因组数据)EN

云点播特惠1元起

回答 1

Stack Overflow用户

行拆分-如何保留缺少值的列？

unix中基于列值的文本文件拆分

保留基于pandas中给定列的值的行

将列值拆分为行，并从第二列保留值。

基于行值按行拆分数据

社区

活动

圈层

关于

腾讯云开发者

热门产品

热门推荐

更多推荐

问基于保留页眉行的列值的拆分文本文件(基因组数据)
EN