首页
学习
活动
专区
工具
TVP
发布
您找到你想要的搜索结果了吗?
是的
没有找到

使用TBtools对叶绿体蛋白编码基因进行GO注释

将叶绿体的蛋白编码基因与swissprot数据库比对,获得TBtools做GO注释需要的.xml格式文件 参考文献:DIAMOND: 超快的蛋白序列比对软件 下载swissprot数据 wget ftp://ftp.uniprot.org.../pub/databases/uniprot/current_release/knowledgebase/complete/uniprot_sprot.fasta.gz bgzip uniprot_sprot.fasta.gz...diamond-linux64.tar.gz 无需安装,解压出来即可使用 构建数据库 ~/mingyan/Bioinformatics_tools/Diamond/diamond makedb --in uniprot_sprot.fasta...-db uniprot_sprot 运行完目录下多了一个uniprot_sprot.dmnd文件 比对自己的数据,我的是核苷酸序列,使用blastx ~/mingyan/Bioinformatics_tools.../Diamond/diamond blastx --db uniprot_sprot -q output.fasta -o cp_Protein_coding.xml --outfmt 5 第三步:使用

5K20

J. Chem. Inf. Model. | 用于查找和注释蛋白质结构以进行计算分析

它接受UniProt访问号作为输入,并生成一个输出文件,列出了该蛋白质的所有可用结构及其相应的详细信息。...每个实验结构序列使用成对比对与UniProt的参考序列对齐,以注释缺失残基、与UniProt序列的偏差和突变。...如果PDBminer需要利用UniProt来识别可用结构,最新发布的结构可能不会出现在输出中,因为它们在PDB上的发布时间和在UniProt上的可用性之间存在延迟。在这种情况下,会向用户发出警告。...此外,PDB文件中编码的蛋白质序列与UniProt序列的任何差异都以红色突出显示,便于检查突变的存在。...网络图将感兴趣的蛋白质通过其UniProt访问号放在中心,并分支出其他节点。每个节点进一步分支到通过其UniProt访问号识别的结合蛋白质。

13110

分子对接教程 | (2) 选择合适的蛋白受体

这里我们借助uniprot这个数据库来选择是比较方便的。这里简单介绍一下这个数据库,可能有的同学是第一次知道。翻了多年前的笔记,粘贴在下面。 UniProt 数据库有三个层次。...第一层叫 UniParc,收录了所有 UniProt 数据库子库中的蛋白质序列,量大,粗糙。 第二层是 UniRef,他归纳了 UniProt 几个主要数据库并且是将重复序列去除后的数据库。...从 UniProt 数据库查看一条蛋白质序列(http://www.uniprot.org/)。在UniProt数据库的首页上有一个关于 UniProtKB 数据库的统计表。...UniProt 数据库的首页上也有一个搜索条,选择UniprotKB 数据库,然后输入“human dutpase”,第一条就是我们要的。...我们在uniprot的搜索框中输入关键词,左侧选择相应的物种。 ? 新页面下直接选择Structure。左边就是显示结果,有一个列表给我们快速查看相关参数。

3.8K42

麦子陪你做作业(二):KEGG通路数据库的正确打开姿势

不同数据库对基因的识别码不一样,而KEGG只支持三个数据库的识别码,即KEGG、NCBI、Uniprot,所以要进行转换。现在有26个基因,那么批量转换比较便捷的方法是用Uniprot的在线工具。...在http://www.uniprot.org/ 点Retrieve/ID mapping进入如下页面,贴上自己的基因名,下方选择输入和需要输出的识别码类型,填好物种信息,就可点“Go”转换。...Entry即Uniprot编码。 下载好后,将Entry贴到我们原来的表格中。...此处注意输入的THOA基因没有检索到Uniprot ID,舍去;另又有两个FAS,得到了不一样的Entry,那是因为输入的是基因缩写,可能检索到同缩写的多个基因。

5K93

Nucleic Acids Res. | AlphaFold DB:大规模扩展蛋白质序列空间的结构覆盖范围

我们通过公共API端点提供对所有条目的访问,以UniProt登录为密钥。...UniProt、Pfam、InterPro和PDBeKB使用此API在其网页上显示AlphaFold模型。...这些页面包含感兴趣的蛋白质的所有可用信息,以其UniProt 登录名为关键字。它们允许用户分析预测并下载相应的模型文件(在PDB和mmCIF中)格式)和PAE文件(JSON格式)。...用户可以通过基因名称、蛋白质名称、UniProt登录名或生物体名称进行搜索。例如,可以过滤搜索结果以仅显示人类蛋白质。...图1 AlphaFold DB搜索 每个蛋白质都有一个专用的结构页面,显示基本信息(取自UniProt和PDBe)和AlphaFold模型的三个独立输出。

92320
领券