Loading [MathJax]/jax/output/CommonHTML/config.js
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
社区首页 >问答首页 >基于保留页眉行的列值的拆分文本文件(基因组数据)

基于保留页眉行的列值的拆分文本文件(基因组数据)
EN

Stack Overflow用户
提问于 2015-12-20 18:30:10
回答 1查看 941关注 0票数 0

我有一个大的基因组数据文件(.txt),格式如下。我想分裂它的基础上,染色体列,chr1, chr2..chrX,chrY等,保持标题行在所有分裂的文件。如何使用unix/linux命令来做到这一点?

基因组数据

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
 variantId  chromosome   begin  end
    1            1          33223  34343
    2            2          44543  46444
    3            2          55566  59999 
    4            3          33445  55666

结果

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
file.chr1.txt
variantId  chromosome   begin  end
1            1          33223  34343


file.chr2.txt
variantId  chromosome   begin  end
2            2          44543  46444
3            2          55566  59999 

file.chr3.txt
variantId  chromosome   begin  end
4            3          33445  55666
EN

回答 1

Stack Overflow用户

回答已采纳

发布于 2015-12-20 18:43:04

这是人类基因组(通常是46条染色体)的数据吗?如果是这样,这是怎么回事?

代码语言:javascript
代码运行次数:0
运行
AI代码解释
复制
for chr in $(seq 1 46)
do
    head -n1 data.txt >chr$chr.txt
done
awk 'NR != 1 { print $0 >>("chr"$2".txt") }' data.txt

(这是基于@Sasha上述评论的第二次编辑。)

请注意,("chr"$2".txt")周围的父母显然不需要GNU,但他们在我的OS版本的awk上。

票数 3
EN
页面原文内容由Stack Overflow提供。腾讯云小微IT领域专用引擎提供翻译支持
原文链接:

https://stackoverflow.com/questions/34388173

复制
相关文章
java poi拆分excel文件,每个文件保留标题行
在工作中,经常需要处理excel文件,将提供的excel文件导入数据库,有时候文件太大我们就需要做拆分了,下面实现将xlsx文件和xls文件按行数拆分,每个文件都保留标题行。这篇文件接着前面拆分csv大文件进行学习。
jiankang666
2022/05/12
8570
用过Excel,就会获取pandas数据框架中的值、行和列
至此,我们已经学习了使用Python pandas来输入/输出(即读取和保存文件)数据,现在,我们转向更深入的部分。
fanjy
2021/11/29
19.3K0
用过Excel,就会获取pandas数据框架中的值、行和列
【Python】基于某些列删除数据框中的重复值
Python按照某些列去重,可用drop_duplicates函数轻松处理。本文致力用简洁的语言介绍该函数。
阿黎逸阳
2020/09/08
20.7K0
【Python】基于某些列删除数据框中的重复值
使用pandas筛选出指定列值所对应的行
该方法其实就是找出每一行中符合条件的真值(true value),如找出列A中所有值等于foo
星星在线
2020/05/22
19.2K0
数据库的方向 - 行vs列
前言: 转载的好文不多,但此篇的确是难得一见的好文,如若不信,请仔细阅读。 此篇文章没有波涛汹涌的起伏,没有繁多的代码,只有悠然自得的文笔。 因此,分享此文给大家。 翻译原文链接:https://ww
谙忆
2021/01/21
1.1K0
数据库的方向 - 行vs列
【Python】基于多列组合删除数据框中的重复值
最近公司在做关联图谱的项目,想挖掘团伙犯罪。在准备关系数据时需要根据两列组合删除数据框中的重复值,两列中元素的顺序可能是相反的。
阿黎逸阳
2020/09/08
14.7K0
VBA:基于指定列删除重复行
文章背景:在工作生活中,有时需要进行删除重复行的操作。比如样品测试时,难免存在复测数据,一般需要保留最后测试的数据。之前通过拷贝行的方式保留最后一行的数据(参见文末的延伸阅读1),但运行效率较低。目前通过借助数组和字典达到删除重复行的效果。
Exploring
2022/12/18
3.4K0
VBA:基于指定列删除重复行
PowerQuery拆分两列,并数据相对应
【问题】把姓名与电话列拆分为行,姓名与电话是按顺序对应的。难点:姓名与电话的个数不定
哆哆Excel
2022/10/31
1K0
Pandas DataFrame显示行和列的数据不全
pd.set_option('display.max_columns', None)
用户7886150
2020/12/26
6.7K0
Pandas 查找,丢弃列值唯一的列
数据清洗很重要,本文演示如何使用 Python Pandas 来查找和丢弃 DataFrame 中列值唯一的列,简言之,就是某列的数值除空值外,全都是一样的,比如:全0,全1,或者全部都是一样的字符串如:已支付,已支付,已支付…
萝 卜
2022/05/12
5.7K0
Pandas 查找,丢弃列值唯一的列
【说站】Python DataFrame如何根据列值选择行
以上就是Python DataFrame根据列值选择行的方法,希望对大家有所帮助。
很酷的站长
2022/11/24
5.3K0
【说站】Python DataFrame如何根据列值选择行
pdf拆分保留书签_pdf补丁
软件已经更新,请在博客首页(http://pdfpatcher.cnblogs.com)下载最新版。
全栈程序员站长
2022/11/16
1.6K0
pdf拆分保留书签_pdf补丁
Numpy中找出array中最大值所对应的行和列
Python特别灵活,肯定方法不止一种,这里介绍一种我觉得比较简单的方法。 如下图,使用x == np.max(x) 获得一个掩模矩阵,然后使用where方法即可返回最大值对应的行和列。 where返回一个长度为2的元组,第一个元素保存的是行号,第二个元素保存的是列号。
卡尔曼和玻尔兹曼谁曼
2019/01/22
6.5K0
Numpy中找出array中最大值所对应的行和列
删除列中的 NULL 值
今天接到一个群友的需求,有一张表的数据如图 1,他希望能通过 SQL 查询出图 2 的结果。
白日梦想家
2020/07/20
9.9K0
删除列中的 NULL 值
使用 Python 拆分文本文件的最快方法是什么?
在 Python 中拆分文本文件可以通过多种方式完成,具体取决于文件的大小和所需的输出格式。在本文中,我们将讨论使用 Python 拆分文本文件的最快方法,同时考虑代码的性能和可读性。
很酷的站长
2023/02/18
2.6K0
使用 Python 拆分文本文件的最快方法是什么?
基于jquery拆分姓名的方法[纯JS版]
之前已经分享过一个在dom中用户输入姓名后自动用js拆分成姓与名到表单中的jquery插件,由于项目的需要,需要一个在客户端自动拆分,但不需要将拆分结果呈现给用户的方法,所以又写了一个独立的方法,贴出来跟大家分享交流
风柏杨4711
2021/03/15
6500
Excel实战技巧109:快速整理一列数据拆分成多列
你可以使用多种方法,包括:使用VBA,创建数组公式,编写多个公式,等等。本文将给你展示一种“最懒的”方法,也可能是最快且最容易的方法。
fanjy
2021/08/31
1.7K0
Excel实战技巧109:快速整理一列数据拆分成多列
列存储、行存储
Sybase在2004年左右就推出了列存储的Sybase IQ数据库系统,主要用于在线分析、数据挖掘等查询密集型应用。列存储,缩写为DSM,相对于NSM(N-ary storage model),其主要区别在于:
全栈程序员站长
2022/09/14
7.9K0
列存储、行存储
点击加载更多

相似问题

行拆分-如何保留缺少值的列?

11

unix中基于列值的文本文件拆分

21

保留基于pandas中给定列的值的行

220

将列值拆分为行,并从第二列保留值。

13

基于行值按行拆分数据

20
添加站长 进交流群

领取专属 10元无门槛券

AI混元助手 在线答疑

扫码加入开发者社群
关注 腾讯云开发者公众号

洞察 腾讯核心技术

剖析业界实践案例

扫码关注腾讯云开发者公众号
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档
查看详情【社区公告】 技术创作特训营有奖征文