腾讯云
开发者社区
文档
建议反馈
控制台
登录/注册
首页
学习
活动
专区
圈层
工具
MCP广场
文章/答案/技术大牛
搜索
搜索
关闭
发布
文章
问答
(9999+)
视频
沙龙
1
回答
使用
python
更
快地
读取
大型
fastq
文件
、
、
、
我有几个平均有500.000.000行(125.000.000序列)的
fastq
文件
。有没有更快的方法来
读取
这些
fastq
文件
。import gzipfor file in files[:]: if not file.endswith(".<e
浏览 4
提问于2018-02-14
得票数 1
回答已采纳
5
回答
从4组大文本
文件
中
读取
行
、
、
、
几天后,我就面临着与
python
有关的问题。我是一个生物信息学,没有基本的编程技能,我正在处理巨大的文本
文件
(25 am左右)。我必须去处理。我必须逐行
读取
txt
文件
,每次4行,这意味着前4行必须被
读取
和处理,然后我必须
读取
第二组4行,以此类推。显然,我不能
使用
readline()操作符,因为它会使我的内存超载,而且我必须
使用
这4行中的每一行来识别字符串。我考虑在range操作符中
使用
for循环: openfile = open(pa
浏览 8
提问于2012-03-14
得票数 3
回答已采纳
2
回答
阅读
fastq
的最快方法
、
、
我正在尝试
使用
读取
fastq
格式的文本
文件
。f = 'Undetermined_S0_L001_I1_001.
fastq
' seq_dic[seq] +=1
浏览 5
提问于2016-08-25
得票数 3
回答已采纳
3
回答
在
python
循环中,打印交替
文件
中的行
、
、
、
、
我正在尝试
使用
python
在两个单独的
文件
中查找感兴趣的四行代码块,然后按受控顺序打印出其中的一些行。下面是两个输入
文件
和一个所需输出
文件
的示例。请注意,Input.fasta中的DNA序列与Input.
fastq
中的DNA序列不同,因为.fasta
文件
已被
读取
并更正。这允许将质量信息恢复到
读取
的校正后的.fasta
文件
。这是我最接近的失败尝试:
fastq
= open(Input.
fas
浏览 29
提问于2018-03-01
得票数 1
回答已采纳
3
回答
用
python
包装器并行化
python
脚本
、
、
、
、
我有一个
python
脚本heavy_lifting.py,它
使用
wrapper.sh包装器脚本wrapper.sh调用的parallelized并行化。我
使用
它来处理
fastq
格式的
文件
,请参阅下面的example.
fastq
。虽然这是可行的,但要求
使用
两个解释器和一组依赖项是不优雅的。我想
使用
python
重写bash包装器脚本,同时实现同样的并行化。 example.
fastq
--这是一个需要处理的输入
文
浏览 5
提问于2021-01-03
得票数 0
回答已采纳
2
回答
Python
等价物将zcat结果通过管道传送到Perl中的
文件
句柄
、
、
、
、
我有一个用
Python
语言编写的巨大的管道,它
使用
非常大的.gz
文件
(大约14 an压缩),但需要一种更好的方法来将某些行发送到外部软件()。我有一个很久以前有人为我写的Perl脚本,它可以非常
快地
完成这项工作,但我需要在
Python
中做同样的事情,因为管道的其余部分都是用
Python
编写的,我必须保持这种方式。Perl脚本
使用
两个
文件
句柄,一个用于保存.gz
文件
的zcat,另一个用于存储软件所需的行(每4行中有2行)并将其用作输入。
浏览 5
提问于2015-05-06
得票数 7
1
回答
如何在snakemake中传递变量值作为输入?
我想
使用
使用
Snakemake的SRR ID从SRA数据库下载
fastq
文件
。我
使用
python
代码
读取
一个
文件
以获取SRR。 SAMPLES = [line.strip() for line in/srrL
浏览 0
提问于2019-04-12
得票数 3
回答已采纳
1
回答
在
python
中找出管道
、
、
、
我目前正在用
python
编写一个程序,而且我被困住了。因此,我的问题是:我有一个程序,它
读取
文件
并打印一些行到标准输出,如下所示:import sys numArgs = len(sys.argv)谢谢你的帮忙 这样做的目的是让“文本
文件
”和程序在集群上,所以我不需要从集群中复制任何
文件
。我只想登录到集群上,
浏览 0
提问于2015-01-09
得票数 0
回答已采纳
1
回答
我已经从SRA下载了一个
fastq
文件
,并且在将它
读取
到我的工作区时遇到了问题。是否有另一种将
fastq
文件
读入R的方法?
、
,pattern = "
fastq
")错误:输入/输出没有找到dirPath: /readFastq/dirPath_data.Quickq。模式:
fastq
浏览 2
提问于2020-02-17
得票数 0
1
回答
如何从其他
文件
写入
fastq
文件
、
、
、
我被要求
读取
两个
文件
(左读和右读) Aip02.R1.
fastq
和Aip02.R2.
fastq
,并
使用
zip函数获得一个交错的fasta
文件
。左边和右边的
文件
都是
fastq
文件
,但是当我把它们压缩在一起生成一个新的
fastq
文件
时,writer函数就不再起作用了。它给出错误"SeqRecord (id=)有一个无效的序列“。 #!/usr/bin/env
浏览 10
提问于2020-02-15
得票数 1
3
回答
拆分带有前缀的
大型
.gz
文件
、
、
我的每个
fastq
文件
大约有2000万次
读取
(或2000万行)。现在,我需要将大的
fastq
文件
分成块,每个块只有100万次
读取
(或100万行),以便于进一步分析。
fastq
文件
就像.txt一样。但是输入
文件
是.gz压缩格式(
fastq
.gz),我需要先解压缩吗?zless XXX.
fastq
.gz |split -l 400
浏览 3
提问于2011-08-02
得票数 1
3
回答
Shape
文件
或geojson到数据库
、
、
、
我正在尝试
读取
大型
形状
文件
,并尝试
使用
地理工具查找经度和经度是否在坐标中 有没有可能将形状
文件
存储到数据库中?或者会存储为geojson并更
快地
返回,以检查lat和long是否在坐标中?Node或java中的哪一个
更
容易实现。
浏览 0
提问于2019-02-06
得票数 2
4
回答
有没有办法在R中读写内存中的
文件
?
、
、
、
、
我正在尝试
使用
R来分析
大型
的DNA序列
文件
(
fastq
文件
,每个
文件
有几at ),但是这些
文件
的标准R接口(ShortRead)必须一次
读取
整个
文件
。这不适合在内存中,所以它会导致错误。有没有办法一次
读取
几千行代码,将它们放入内存
文件
中,然后
使用
ShortRead从内存
文件
中
读取
数据? 我正在寻找类似Perl的IO::Scalar的东西,用于R。
浏览 0
提问于2010-11-09
得票数 7
回答已采纳
2
回答
如何创建脚本来编写.csv
文件
我将所有
fastq
文件
存储在我的pc (workDir=/media/sf_16S_analysis/Dermatite_
fastq
_concat/
FastQ
/
fastq
_Join)上的同一个目录中;但是,我
使用
虚拟机执行bash脚本。,forward
更
详细的内容:清
浏览 0
提问于2019-03-13
得票数 2
回答已采纳
3
回答
即使在删除/注释错误行时,错误也不会消失。
、
、
我正在Windows 10的虚拟机上
使用
Linux。TypeError: '<' not supported between instances of 'str' and 'int' 2 print("Downloading
FASTQ
files from the SRA...") ----&
浏览 12
提问于2022-01-25
得票数 2
回答已采纳
2
回答
将同一命令应用于多个子目录中的多个
文件
、
、
我有一个包含94个子目录的目录,每个子目录包含一个或两个
文件
*.
fastq
。我需要对每个
文件
应用相同的
python
命令,并生成一个新
文件
qc_*.
fastq
。我知道如何将bash脚本单独应用于每个
文件
,但我想知道是否有一种方法可以编写一个bash脚本,将命令同时应用于所有
文件
浏览 5
提问于2014-11-20
得票数 0
1
回答
基准通道创建NextFlow
、
input: file "${reads}.trimmed.
fastq
" into gather_fatsp_ch """ """ }gather_fatsp_ch.collectFile().vie
浏览 23
提问于2021-02-09
得票数 2
回答已采纳
1
回答
为什么这个并行进程不是将输出写入
文件
,而是打印到控制台?
、
免责声明:这是一个关于并行和写入
文件
的我在biostars.org上问过的
更
普遍的问题。当我按顺序运行一个程序(obisplit从…obitools套餐)时,它
读取
一个
文件
并根据原始
文件
中的一些标准(这里不重要)创建许多
文件
: |____ output_01.
fastq
|____ output_03.
fastq</em
浏览 0
提问于2017-05-25
得票数 1
回答已采纳
1
回答
子进程:无法将“_io.BufferedReader”对象隐式转换为str
、
、
、
我正在编写一个脚本,它是snakemake和
python
代码的组合,可以自动生成大量
文件
。
更
准确地说,我正致力于将
读取
与BWA MEM与配对尾读()对齐。在脚本的第一部分,我迭代了我的
文件
中的名称列表(即
fastq
绑定的
文件
),然后在列表中对它们进行相应的排序。现在
使用
子流程,我希望通过
使用
bunzip2对它们进行解压缩,然后通过stdin将它们传递给bwa mem。bwa mem命令将
fastq
格式
文件</
浏览 2
提问于2017-04-10
得票数 4
1
回答
从SeqIO.index生成的字典中删除项
、
、
、
、
我正在
使用
Python
2.6.6,并试图删除file2中重叠(即与file1中的
读取
相同)的
读取
。下面是我正在尝试实现的代码:spk_reads = SeqIO.index("file2.
fastq
","
fastq
") if
浏览 3
提问于2017-09-13
得票数 2
点击加载更多
热门
标签
更多标签
云服务器
ICP备案
云直播
腾讯会议
实时音视频
活动推荐
运营活动
广告
关闭
领券