首页
学习
活动
专区
工具
TVP
发布

生信小驿站

专栏作者
354
文章
842443
阅读量
162
订阅数
药物和靶点相关数据库
这是一个公共收录实验测定的蛋白质-配体的结合亲 和力的数据库。 (1)实验测定的结合亲和力; (2)侧重测定候选药物靶点蛋白与小分子或 类药分子等配体的相互作用亲和力。目前含有620000 个蛋白—配体结合数据,5500 个蛋白靶点,超过 270 000 个类药小分 子。。
用户1359560
2021-04-12
2.7K0
pan-cancer泛癌单基因分析问题之合并TCGA和GTEx
(1)第一个部分是纯代码分析某个基因在TCGA33类肿瘤中的差异分析。 (2)结合TCGA和GTEx数据库,这样做的好处是:因为TCGA中肿瘤样本和正常样本是不均衡的,甚至某些肿瘤是没有癌旁正常组织的。所以结合GTEx数据库,可以大大增加正常样本的数量。
用户1359560
2021-03-08
3.2K1
R语言计算tmb值
tmb值与免疫检查点抑制剂疗效相关,而TCGA数据库中的tmb值可以通过TCGAmutations包来计算
用户1359560
2020-12-16
3.7K0
python和R语言计算蛋白质内部氨基酸相互作用
蛋白质数据库(PDB)是生物大分子3D结构的存储库,其中包含其原子的坐标,通过使用两个原子的这些坐标,可以计算它们之间的距离。使用典型的pdb文件,可以使用类似于Biopython文档中介绍的方法来计算结构中两个原子之间的距离。如下所示:
用户1359560
2020-10-10
1.2K0
使用R语言绘制string蛋白互作图
STRING(https://www.string-db.org)是已知和预测的蛋白质-蛋白质相互作用的数据库。交互包括直接(物理)关联和间接(功能)关联。数据库包含来自众多来源的信息,包括实验资料库,计算预测方法和公共文本集。每次互动都与组合的置信度相关综合各种证据的分数。目前,涵盖了来自5090的超过24百万种蛋白质生物。STRING数据库可用于在基因列表中添加含义。STRINGdb R软件包,以方便用户访问STRING中的数据库。在本指南中,以示例说明了该软件包的大多数功能。此外,iGraph包作为代表蛋白质-蛋白质相互作用网络的数据结构。
用户1359560
2020-09-01
2.3K0
寻找疾病相关基因(1)genecards数据库
genecards数据库是一个汇总了150个网络数据库的基因功能查询数据库。通过这个数据库我们不仅可以查询到一个基因各个方面的基本功能。而且还可以查询疾病相关的基因列表等等。
用户1359560
2020-08-20
8.5K0
网络药理学TCMSP数据库
在TCMSP中选择“Herb name”检索得到海藻、黄 芪、丹参、熟地黄、鱼腥草、荆芥穗的分子ADME参数信 息,由于该数据库尚未收录牡蛎相关的分子信息,故通 过查阅文献得到牡蛎相关的成分,并在TCMSP中选择 “Chemical name”得到这些成分的ADME参数信息。 然后根据每个分子的口服生物利用度(OB)和类药性 (DL)筛选出肾病Ⅲ号方中各中药可能的活性成分。
用户1359560
2020-08-11
2K0
查询基因的核苷酸序列和蛋白的氨基酸序列
(1)在pubmed gene数据库选择输入想要查询的基因,点击search即可。
用户1359560
2020-06-05
1.9K0
查询蛋白结构域
蛋白质三级结构的基本结构单位是结构域。一个蛋白质可以只包含一个结构域也可以由 几个结构域组成,故结构域是能够独立折叠为稳定的三级结构的多肽链的一部分或全部。结构域也是功能单位,通常多结构域蛋白质中不同的结构域是与不同的功能相关联的。许多已知的例子表明,某个种属的多个独立的多肽链完成的几种生物学功能可以由另一个种属的一个蛋白质中的不同结构域来完成。例如,脂肪酸的合成需要七种不同的催化反应,在植物的叶绿体中,这些反应由七种不同的酶所催化,而在哺乳动物中,这些反应则由一条多肽链的七个结构域来完成。
用户1359560
2020-06-05
1.5K0
寻找核心基因+子网络
一般做完差异基因,或者使用其他方法找到想要的biomarker时,想要知道这些基因的调控网络,或者哪些基因在调控网络中处于核心位置,比较常见的方法就是wgcna或者mcode、Cytohubba。这篇主要介绍mcode和Cytohubba。
用户1359560
2020-05-04
2.2K0
python快速下载TCGA数据库相关数据
TCGA是由National Cancer Institute ( NCI, 美国国家癌症研究所) 和 National Human Genome Research Institute (NHGRI, 国家人类基因组研究所) 合作建立的癌症研究项目,通过收集整理癌症相关的各种组学数据,提供了一个大型的,免费的癌症研究参考数据库。 下载方式多种多样,在我之前的教程介绍了有官网下载;TCGAbiolinks下载;firehose下载。这一次的学习笔记,主要是写用python快速下载TCGA数据库相关数据。我自己尝试后的优点是:快速(大概三分钟就可以下载完毕);下载的数据与官网GDC下载的相同。
用户1359560
2020-02-25
1.5K0
一文解决ArrayExpress下载(网页版和R语言)
GEO数据库类似,ArrayExpress是属于EBI旗下的公共数据库,用于存放芯片和高通量测序的相关数据。
用户1359560
2020-02-24
2.8K0
一文解决多个不同平台差异分析结果合并
原因:随着技术平台的不断发展,许多已发布的实验数据集可以被不同统计方法整合,使得可以同时使用各种方法来解决同一研究问题。但是为了从所有这些选择中获得最大的收益,我们需要以公正的方式整合它们的结果,例如不同实验的差异分析结果。优先排序的基因列表是基因组数据分析应用程序中常见的结果表示方法。因此,秩聚合方法可以成为这一类问题的有用且通用的解决方案。
用户1359560
2019-10-08
4K0
miRTarBase数据库
miRTarBase数据库是一个专门收集有实验证据支持的microRNA-mRNA靶向关系(MTI, MicroRNA-Target Interactions)的数据库。自miRTarBase数据库于2011年首次亮相以来,miRNA与靶基因相关信息的数据库不断更新。该数据库已经收录了超过8,500篇关于miRNA-靶标相互作用的实验支持文章。随着新发布的CLIP-seq数据集的增加,新miRTarBase中的MTI集合超过500,000。作者通过改进NLP(自然语言)技术,搜集到更多靶向关系对以及他们的网络功能和注释信息。数据库网址:http://mirtarbase.mbc.nctu.edu.tw/index.html
用户1359560
2019-09-20
1.8K0
零代码功能富集分析(DAVID数据库、KOBAS数据库使用教程)
DAVID (the Database for Annotation,Visualization and Integrated Discovery)的网址是http://david.abcc.ncifcrf.gov/。 DAVID是一个生物信息数据库,也是一款在线免费分析软件,其整合了生物学数据和分析工具,为大规模的基因或蛋白列表(成百上千个基因ID或者蛋白ID列表)提供系统综合的生物功能注释信息,帮助用户从中提取生物学信息。目前DAVID数据库主要用于差异基因的功能和通路富集分析,对很多科研工作者来说,是个非常好的工具。
用户1359560
2019-07-25
5.5K0
GO和KEGG富集分析(Metascape数据库)
生物信息学研究中,获取基因列表的GO和KEGG富集分析的需求非常常见。目前有许多生物信息学手段或者数据库可以实现基因富集分析,例如DAVID,但它们有些是收费的,有些不易于使用且很少维护。例如DAVID曾经有六年的时间(2010-2016)没有维护数据库,最近的更新也已经两年半了。而Metascape每月更新其相关的40多个数据库,以确保提供最准确的结果。因此Metascape数据库可以作为富集分析的比较好的手段。
用户1359560
2019-07-11
5.9K0
一文解决TCGA任意肿瘤的差异lncRNA,miRNA,mRNA
首先对TCGA的RNA表达预处理,筛选掉其中的低表达基因(count<10)进行预处理。根据GENCODE Release 29(GRCh38.p12)(https://www.gencodegenes.org/human/)注释mRNA和lncRNA。 而miRNA是基于miRbase v22数据库(http://www.mirbase.org/index.shtml#opennewwindow)进行注释。
用户1359560
2019-07-10
5.8K0
如何预测miRNA靶基因(miRWalk2.0数据库)
miRWalk2.0是miRWalk数据库的改进版本。 miRWalk2.0可以提供最全面的预测和实验验证的miRNA-mRNA相互作用,可以极大地帮助研究者对miRNA进行研究。miRWalk2.0不仅记录了基因完整序列中的miRNA结合位点,还可以将这些信息与12个现有miRNA-mRNA相互作用数据库:DIANA-microTv4.0,DIANA-microT-CDS, miRanda-rel2010,mirBridge,miRDB4.0,miRmap,miRNAMap,doRiNA即PicTar2,PITA,RNA22v2,RNAhybrid2.1和Targetscan6.2)构建基于promoter (4 prediction datasets), cds (5 prediction datasets), 5’- (5 prediction datasets) and 3’-UTR (13 prediction datasets) 。它还记录了通过自动文本挖掘搜索收集的实验验证的miRNA-mRNA相互作用信息,同时也有来自有资源(miRTarBase,PhenomiR,miR2Disease和HMDD)。
用户1359560
2019-07-04
2.1K0
重复一篇3分左右纯生信文章(第一部分)
这一次要分享的文章题目是:Five key lncRNAs considered as prognostic targets for predicting pancreatic ductal adenocarcinoma
用户1359560
2019-07-02
1.9K0
一文解决RNA测序资料的差异
本文目标: (1)使用edger包做TCGA数据库RNA-seq数据差异分析 (2)使用deseq包做TCGA数据库RNA-seq数据差异分析 (3)使用limma包做TCGA数据库RNA-seq数据差异分析 (4)如何在没有生物学重复的情况下(比如说只有两个样本,来求取差异基因)
用户1359560
2019-06-15
1.5K0
点击加载更多
社区活动
腾讯技术创作狂欢月
“码”上创作 21 天,分 10000 元奖品池!
Python精品学习库
代码在线跑,知识轻松学
博客搬家 | 分享价值百万资源包
自行/邀约他人一键搬运博客,速成社区影响力并领取好礼
技术创作特训营·精选知识专栏
往期视频·千货材料·成员作品 最新动态
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档