腾讯云
开发者社区
文档
建议反馈
控制台
首页
学习
活动
专区
工具
TVP
最新优惠活动
文章/答案/技术大牛
搜索
搜索
关闭
发布
登录/注册
精选内容/技术社群/优惠产品,
尽在小程序
立即前往
文章
问答
(4849)
视频
沙龙
1
回答
如
何在
FASTA
文件
中找到
基因
的
第一个
碱基
的
编号
?
bioinformatics
、
dna-sequence
、
gff
为了手动修改我拥有的.gff
文件
,我需要在我
的
动物
的
FASTA
格式
的
基因
组
中找到
我
的
基因
的
起始位置(即序列中
的
#
碱基
是什么?)。我有这个
基因
的
序列。我如何尽可能容易地做到这一点(这不是一种其
基因
组在互联网上很容易获得
的
动物)? 我所拥有的:
FASTA
格式
的
基因</e
浏览 19
提问于2019-01-15
得票数 0
2
回答
如何从R中
的
序列翻译得到完整
的
氨基酸名称?
r
、
sequence
、
fasta
我想翻译一个序列
的
前15个
碱基
,然后从
中找到
最后一个氨基酸
的
名称。我有我
的
fasta
文件
fasta
文件
用于人类
基因
组
的
MTHFR序列。library("Biostrings") myseq <- readDNAStringSet("sequence (1).
fasta
", format = "
fasta
&qu
浏览 22
提问于2020-11-09
得票数 0
1
回答
Biopython中
的
index_db对象中
的
SeqIO方法慢吗?
python
、
biopython
我有这个:index = SeqIO.index_db(index_filename, files, "
fasta
") index.close() 我正在研究大
文件
(
基因
序列),但出于某些原因,我需要大约4秒钟
的
时间才能得到我想要
的
序列我用了正确
的
方法吗? 谢谢。
浏览 0
提问于2016-10-04
得票数 0
回答已采纳
1
回答
将
文件
名添加到循环内多个
fasta
文件
的
fasta
标头
bash
、
awk
、
bioinformatics
、
fasta
、
sequencing
我有10个
fasta
文件
(每个
文件
包含来自10个样本
的
20个
基因
序列)。我想创建20个
文件
,特定于10个样本中
的
每个
基因
。我按照以下步骤在标题中使用file_name提取
基因
: pyfasta extract --header --
fasta
test.
fasta
gene_name1 | awk '/^>/ {$0=$0"_file1"}1&
浏览 20
提问于2017-08-22
得票数 2
4
回答
使用嵌套for循环
的
Perl脚本性能缓慢
performance
、
perl
、
for-loop
、
nested-loops
、
bioinformatics
我有一个大
的
FASTA
文件
(一个遗传序列,一个完整
的
染色体),其中每一行包含50个字符(
碱基
a,g,t和c)。这个
文件
中大约有400万行。我想要重新组织这个
文件
,以便一个行
的
每个字符都放在它自己
的
新
文件
行中。也就是说,将原始
文件
中
的
每一行50个字符转换为50行,单字符行.这将导致将整个序列重写为单个列。最终,我希望序列是一个单一
的
列,这样我就可以放置一个相邻<em
浏览 7
提问于2013-12-31
得票数 2
回答已采纳
2
回答
如何将csv
文件
中
的
特定值解析为for循环命令?
bash
、
loops
、
shell
我试图编写一个for循环,其中有条件地将csv
文件
中
的
特定值解析到do命令中。Dir 2 contains sample2_genome.
fasta
Dir 3 contains sample3_genome.
fasta
基因
组序列具有不同
的
平均读取长度。强调这一点是很重
浏览 5
提问于2021-12-07
得票数 0
1
回答
根据
fasta
标头重命名
文件
python
、
file-rename
、
fasta
我已经从NCBI下载了240个
基因
组,当它们下载时,它们会根据它们
的
组装
编号
得到一个
文件
名。我想根据它们
的
物种名称来重命名这些
文件
,而不是它们
的
汇编
编号
,因为这将使数据
的
解释变得容易得多。我知道一些(非常少
的
) python,而且我真的不能用谷歌搜索自己来解决这个问题。
文件
名示例: GCF_000014225.1_ASM1422v1_genomic.fna
fasta
标题示例:&g
浏览 2
提问于2018-07-05
得票数 1
5
回答
fasta
:删除n长度之后
的
序列
perl
、
bash
、
fasta
我有多个
fasta
文件
,每个
文件
有1000个不同长度
的
seqs。我只想保留每个序列
的
前200 (n)个
碱基
。我如
何在
Perl中做到这一点?
浏览 0
提问于2013-05-02
得票数 1
回答已采纳
2
回答
下载多种生物
的
蛋白质序列
python
、
python-2.7
、
bioinformatics
、
biopython
、
ncbi
我试图使用生物巨蟒下载由特定机构排序
的
生物体列表中
的
所有蛋白质。我有有机体
的
名称和与每个有机体相关
的
生物项目;具体来说,我希望分析在最近
的
基因
组序列中发现
的
蛋白质。我想大量下载蛋白质
文件
,用efetch尽可能友好
的
方式下载。此外,我想要一个
FASTA
文件
,为每一个有机体,包括其所有的蛋白质。对于我感兴趣
的
所有生物体,我不能简单地在它们
的
核苷酸数据库
中找到<
浏览 3
提问于2013-09-13
得票数 4
回答已采纳
2
回答
在perl中,散列键可以有多个“子值”吗?
perl
、
hash
、
key
、
substring
我有一个
基因
列表和以下信息: 然后,我对包含脚手架
的
fasta
文件
进行了散列: open <em
浏览 3
提问于2013-06-20
得票数 2
回答已采纳
1
回答
用Biopython从蟒蛇.
fasta
基因
中提取
基因
起始位置
python
、
biopython
、
genetics
我有一个包含多个
基因
的
.
fasta
文件
。它们都有类似的描述,
如
:我正试图提取所有这些
基因
的
浏览 1
提问于2020-06-11
得票数 0
回答已采纳
11
回答
储存一个人类
基因
组需要多少存储空间?
storage
、
bioinformatics
、
dna-sequence
、
genetics
我正在查找以字节为单位
的
存储量(MB、GB、TB等)。需要用来储存单个人类
基因
组。我在维基百科上读了一些关于DNA、染色体、
碱基
对、
基因
的
文章,有一些粗略
的
猜测,但在透露任何东西之前,我想看看其他人是如何处理这个问题
的
。我知道这是一个近似值,所以我在寻找能够存储任何人
的
DNA
的
最小值。
浏览 6
提问于2012-01-22
得票数 97
回答已采纳
1
回答
循环通过字典将字典键与值列表匹配,并追加字典。
python-3.x
、
dictionary
、
merge
、
python-requests
、
biopython
我有两本字典(dict_a和dict_b),它们都是使用biopython来解析
fasta
文件
的
。如果dict_a键(即
基因
名)在dict_b键
中找到
,我希望将来自dict_b
的
匹配键(
基因
名)
的
值附加到dict_a (并不是dict_a中
的
所有键都在dict_b中)。到目前为止,我已经创建了我
的
两本字典和来自dict_a keys (list_a)
的
基因
名称列表。 --如果来自d
浏览 0
提问于2018-08-23
得票数 0
1
回答
如何使用Perl从NCBI中获取
FASTA
核苷酸格式
的
基因
特征?
database
、
perl
、
fasta
、
bioperl
、
ncbi
我可以手动下载一个
FASTA
文件
,如下所示:ATGCTTTGGACA...用这样
的
脚本:my $file = 'CR543861.
fasta
'; $factory->get_Respon
浏览 1
提问于2014-02-27
得票数 5
回答已采纳
3
回答
我不知道如何为要在python中打开
的
文件
指定路径
python
、
biopython
我是Python
的
新用户,我尝试导入genbank和
fasta
格式
的
文件
。在他们
的
文档中,他们提供了一个示例,说明如何将数据集导入到Python中。具体地说,他们在Biopython教程和Cookbook
的
第16页中提供了以下示例: print repr(seq_record.seq) print len(seq_record
浏览 0
提问于2012-02-13
得票数 1
9
回答
计算
Fasta
文件
的
每个种类
的
特定字符
bash
、
perl
、
awk
、
grep
、
fasta
我一直试图在
fasta
文件
中找到
每个物种
的
1s
的
数量,如下所示:11001010101110000001>111>102我知道如
何在
一个
文件
中获得1
的
编号
:我
的
问题是,我找不到方法来跟踪每个物种
的
1s数(而不是
文件
中
的
总数)。
浏览 23
提问于2022-06-13
得票数 1
回答已采纳
2
回答
从
基因
组数据中提取随机子串
perl
我试图使用子串函数从
基因
组中随机抽取21个
碱基
序列,以
fasta
格式。下面是序列
的
开始:>gi|385195117|emb|HE681097.1| Staphylococcus aureus subsp. aureus HO 5096 0412 completeCGATTAAAGATAGAAATACACGATGCGAGCAATCAAATTTCATAACATCACCATGAGTTTGGTCCGAAGCATGAGTGTTTACAATGTTTGAATACCTTATACAGTTCTTATACATAC 我试
浏览 3
提问于2014-10-25
得票数 0
回答已采纳
1
回答
如何修复在R中从DNAStringSet写入多个
FASTA
文件
的
循环?
r
、
loops
、
fasta
、
dna-sequence
、
writefile
我有这个
基因
组( DNAStringSet ),需要将每个
基因
组作为一个单独
的
FASTA
文件
放在一个目录中,但它们仍然是length=1
的
名称。每个
文件
的
名称被连接在一个向量( StringSets )中,因为它们太多了。,但所有
文件
的
顺序都是
第一个
。我是使用Biostrings包
的
新手,我不认为我可以使用lapply或其他任何东西,因为它
的
对象不是列表。有没有办
浏览 24
提问于2020-12-19
得票数 0
1
回答
如何统计R中给定范围内超过某一值
的
实例数?
r
、
heatmap
、
genome
我有一个相当大
的
数据集,研究整个
基因
组中
的
SNPs。我正在尝试生成一个热图,它基于在整个
基因
组中x个
碱基
对
的
滑动窗口内有多少SNP具有超过50
的
BF (贝叶斯因子)值来缩放。例如,在
第一个
1,000,000个
碱基
对中可能有5个感兴趣
的
SNP,然后在接下来
的
1,000,000个
碱基
对中有3个SNP,依此类推,直到我到达
基因
组
的
末端,这将用于生成单行
浏览 12
提问于2021-04-22
得票数 0
3
回答
使用sed提取行/
文件
名
的
中间
bash
、
sed
我有多个
文件
名为:我想用sed打印出来:species我想在这样
的
命令中使用“打印”字(prokka是
基因
组注释
的
工具): prokka $file --outdir `echo $file | sed s/\.
fasta
//` --genus `echo $file | sed s/_.*\.
fasta
//` --speci
浏览 6
提问于2022-01-29
得票数 2
回答已采纳
点击加载更多
扫码
添加站长 进交流群
领取专属
10元无门槛券
手把手带您无忧上云
相关
资讯
使用pysam操作BAM文件
annovar注释(一):注释文件的准备
使用biopython处理序列数据
JBrowse:一款常用的基因组浏览器
分子微生物学——碱基序列比对
热门
标签
更多标签
云服务器
即时通信 IM
ICP备案
对象存储
实时音视频
活动推荐
运营活动
广告
关闭
领券